
Meta , la société mère de Facebook , Instagram et WhatsApp , a dévoilé mardi un nouvel outil d'intelligence artificielle (IA) capable de relier sept sources de données sensorielles : images, vidéo, audio, texte, profondeur, température et mouvement.
Cette nouvelle technologie, appelée ImageBind, sera capable d'analyser simultanément des informations provenant de différentes ressources, ce que l'entreprise décrit comme une « compréhension holistique » similaire aux capacités humaines.
Les équipes équipées de ce type d'IA pourront « joindre » des données sensorielles qui leur permettront, par exemple, de relier les objets d'une photographie avec leur son, leur forme tridimensionnelle ou leur mouvement, ou encore de créer des images basées sur bruit.
Selon Meta , cet outil pourra introduire de nouvelles modalités de données sensorielles à l'avenir, telles que le toucher, la parole, l'odorat et l'IRM.
ImageBind a été introduit en conjonction avec le projet de métaverse de l'entreprise, qui vise à créer des mondes virtuels et des expériences immersives en ligne . Meta pense qu'à mesure que d'autres technologies d'IA progresseront, elles pourront ouvrir les portes de la recherche et de l'expérimentation dans ce domaine.
«Lorsque les humains absorbent des informations du monde, nous utilisons naturellement plusieurs sens, comme voir une rue animée et entendre le bruit des moteurs de voiture. Aujourd'hui, nous présentons une approche qui rapproche les machines de la capacité des humains à apprendre simultanément, de manière holistique et directement à partir de nombreuses formes d'informations différentes », a expliqué Meta dans un communiqué.

Le PDG de Meta, Mark Zuckerberg , a évoqué ce nouvel outil sur son profil Facebook et a assuré que : « Aujourd'hui, nous ouvrons ImageBind, un nouveau modèle d'IA qui combine différents sens comme le font les gens. Il comprend les images, la vidéo, l'audio, la profondeur, le mouvement thermique et spatial. J'ai hâte de voir ce que tout le monde construit avec."
Il s'agit de la deuxième version d'un outil d'IA open source pour les chercheurs par Meta ces derniers mois. Le premier, appelé LLaMa ( Large Language Model Meta AI ), permet d'entraîner et d'améliorer les modèles de traitement du langage naturel.
Bien que Meta soit actif dans le développement de l'IA depuis des années, il a été l'une des dernières entreprises technologiques à lancer des applications à potentiel commercial, comme les chatbots de ses rivaux.
Cette nouvelle technologie introduite par Meta a suscité un grand intérêt parmi les chercheurs du monde entier, qui sont enthousiasmés par son potentiel à analyser de grandes quantités de données et à fournir des informations détaillées sur des objets et des situations.
La technologie de l'IA a connu des progrès rapides ces dernières années, conduisant à la création d'applications de pointe utilisées dans une grande variété d'industries, notamment l'automobile, la médecine, la publicité, l'éducation et le journalisme. .

La capacité des machines à traiter de grandes quantités d'informations et à les analyser pour obtenir des données détaillées sur des objets, des situations et des environnements a conduit à une plus grande efficacité dans les opérations commerciales, améliorant la productivité et réduisant les coûts.
ImageBind est un exemple de la façon dont l'intelligence artificielle peut encore améliorer l'efficacité des opérations commerciales en permettant à cette nouvelle technologie de mieux analyser et comprendre le monde qui les entoure.
Meta reste attaché à la recherche et au développement dans le domaine de l'intelligence artificielle et affirme être disposé à partager ses progrès avec la communauté des chercheurs dans son ensemble.
(Avec les informations de l'EFE)
Continuer à lire: