
Vous pouvez répondre à des demandes vocales et textuelles, répondre à des questions, écrire de la poésie, générer des images, rédiger des e-mails, analyser des photos personnelles et effectuer d'autres actions, comme régler une minuterie ou passer un appel téléphonique.
La nouvelle application est conçue pour effectuer un certain nombre de tâches, telles que servir de tuteur personnel, aider les programmeurs informatiques dans les tâches de codage et même préparer les demandeurs d'emploi aux entretiens, a déclaré Google .
"Cela peut vous aider à jouer un rôle dans différents scénarios", a déclaré Sissie Hsiao , vice-présidente de l'entreprise et chef de l'unité Google Assistant , lors d'un point de presse avec des journalistes.
Lorsque ChatGPT est arrivé d' OpenAI fin 2022, époustouflant le public avec sa façon de répondre aux questions, de rédiger des dissertations et de générer du code informatique, Google s'est empressé de rattraper son retard. Comme d'autres géants de la technologie, la société a passé des années à développer une technologie similaire, mais n'a pas lancé de produit aussi avancé que ChatGPT .

Google a lancé son propre chatbot, Bard , en mars, suite à des critiques médiocres. Au cours des semaines suivantes, la société a fusionné ses deux principaux laboratoires d'IA – Google Brain et DeepMind – et a annoncé que le laboratoire combiné développait une nouvelle technologie d'IA appelée Gemini .
Gemini est ce que les chercheurs appellent un grand modèle de langage, un système mathématique capable d'acquérir des compétences en analysant de grandes quantités de données, telles que des livres, des programmes informatiques et des conversations en ligne. En identifiant des modèles dans ce texte, un LLM peut apprendre à le générer lui-même. Cela signifie que vous pouvez écrire de la poésie, générer du code informatique et même mener une conversation.
Il est également enclin à commettre des erreurs. Vous pouvez faire des erreurs ou « halluciner », c’est-à-dire inventer des choses. Gemini est un système « multimodal », ce qui signifie qu'il peut répondre à la fois aux images et aux sons. Après avoir analysé un problème mathématique comprenant des graphiques, des formes et d’autres images, il pouvait répondre à la question de la même manière qu’un lycéen.
En décembre, Google a utilisé une version limitée de cette technologie pour améliorer Bard . Aujourd'hui, la société a retiré le nom de la marque et lance une version plus puissante de la technologie via l'application Gemini , disponible sur les téléphones Android et sur le Web. Une version pour iPhone arrivera « dans les semaines à venir », a indiqué la société.
La société a créé une version gratuite mais limitée de l'application Gemini . Une version plus puissante - appelée Gemini Advanced et basée sur une version du modèle de langage Ultra de Google - est disponible moyennant un abonnement mensuel de 19,99 $ . Google propose un essai gratuit de deux mois.
Google a publié des résultats de référence indiquant qu'Ultra surpasse la dernière technologie d' OpenAI , GPT-4 , dans plusieurs domaines clés, tels que la génération de code informatique et la synthèse d'articles de presse.

L'application Gemini peut également générer, analyser et répondre aux images. Les utilisateurs peuvent par exemple télécharger une photo de leur soirée du Super Bowl et demander à l'application de générer une légende.
Google a également annoncé qu'il proposerait une technologie similaire via les services professionnels Google Workspace et Google Cloud . Cela permettra aux clients d'utiliser la technologie avec des applications telles que Gmail et Google Docs .
Sur les téléphones Android , la nouvelle application remplacera Google Assistant si les utilisateurs téléchargent Gemini . Comme Google Assistant , il peut répondre aux commandes vocales, bien qu'il réponde également aux commandes textuelles.
Google a déclaré qu'il continuerait à proposer et à améliorer Google Assistant .
L'année dernière, OpenAI a lancé une version similaire de son chatbot ChatGPT , capable de répondre aux commandes vocales. La plupart des experts du secteur estiment que la technologie d'IA qui alimente des applications comme ChatGPT fusionnera et remplacera des assistants numériques comme Siri d' Apple et Alexa d' Amazon .
(*) Le New York Times
(*) Cade Metz écrit sur l'intelligence artificielle, les voitures sans conducteur, la robotique, la réalité virtuelle et d'autres domaines technologiques émergents