
Ce que tout le monde attendait, c'était l'annonce de Google DeepMind avec Gemini , un modèle d'intelligence artificielle (IA) multimodal et flexible qui promet de révolutionner la manière dont la technologie est liée à la vie quotidienne et au développement commercial.
Sundar Pichai, PDG de Google et Alphabet , a souligné que ce nouveau modèle, qui fait partie de l'initiative de l'entreprise d'être « AI-first », présente des performances de pointe dans plusieurs normes académiques et est capable de surpasser les experts humains dans les tests de compréhension multiconceptuelle du langage. .
Gemini , qui a été optimisé pour fonctionner sur des appareils de différentes capacités (Ultra, Pro et Nano), a montré des performances supérieures dans 30 des 32 tests académiques appliqués aux modèles de langage, dont un score de 90,0 % en compréhension massive du langage multiconceptuel (MMLU). , éclipsant la capacité analytique des spécialistes humains dans des domaines tels que les mathématiques, la physique, l’histoire et la médecine.
Sundar Pichai a souligné l'accélération continue des progrès de l'IA dans les entreprises et la promesse que ces avancées bénéficieront à l'échelle mondiale.
Le nouveau système, fruit d'un vaste effort de collaboration au sein de Google , a été conçu pour comprendre et analyser efficacement les informations, qu'il s'agisse de texte, de code, d'audio, d'image et de vidéo.
Contrairement aux modèles précédents qui combinaient des composants d’IA distincts, Gemini a été formé depuis sa création pour gérer plusieurs modalités de manière intégrée. Cela lui a permis d’améliorer considérablement sa compréhension et son raisonnement. De plus, la technologie de Gemini représente l'un des plus grands efforts scientifiques et techniques entrepris par l'entreprise.
Gemini 1.0 contient des fonctionnalités avancées de raisonnement multimodal complexe, aidant à discerner des informations cachées dans de grands volumes de données et renforçant le rôle de l'intelligence artificielle en tant qu'assistant intuitif pouvant aider dans des domaines aussi divers que la science, la finance et la programmation. Ses hautes performances dans les tâches de codage et sa capacité à comprendre, expliquer et générer du code de haute qualité dans les langages de programmation les plus utilisés positionnent Gemini Ultra comme l'un des modèles fondamentaux dans le monde du codage.
La version spécialisée, AlphaCode 2 , a montré des améliorations significatives par rapport à son prédécesseur, augmentant ainsi l'efficacité dans la résolution de problèmes de programmation complexes.