
SAN FRANCISCO - Un mardi pluvieux à San Francisco, les dirigeants d'Apple sont montés sur scène dans un auditorium bondé pour annoncer la cinquième génération de l'iPhone . Le téléphone, qui avait l'air identique à la version précédente, comportait une nouvelle fonctionnalité dont le public n'a pas tardé à parler : Siri , un assistant virtuel.
Scott Forstall , alors directeur des logiciels d'Apple, a appuyé sur un bouton de l'iPhone pour appeler Siri et a posé des questions. À sa demande, Siri a vérifié l'heure à Paris ("20h16", a répondu Siri), a défini le mot "mitose" ("Division cellulaire dans laquelle le noyau se divise en noyaux contenant le même nombre de chromosomes", a expliqué) et a dressé une liste de quatorze restaurants grecs très bien notés , dont cinq à Palo Alto, en Californie.
"Je suis dans le domaine de l'intelligence artificielle depuis longtemps et cela m'étonne toujours", a déclaré Forstall.
C'était il y a douze ans. Depuis lors, Siri et les assistants concurrents basés sur l'IA comme Alexa d'Amazon et Google Assistant n'ont laissé personne sans voix. La technologie a largement stagné et les assistants parlants sont devenus la cible de blagues , y compris une scène comique de "Saturday Night Live" de 2018 qui présentait un haut-parleur intelligent pour les personnes âgées.
Le monde de la technologie est maintenant enthousiasmé par un autre type d'assistant virtuel : les chatbots . Ces bots alimentés par l'IA, comme ChatGPT et le nouveau ChatGPT Plus de la société OpenAI basée à San Francisco, peuvent improviser des réponses aux questions écrites dans une boîte de discussion avec empressement. Les gens ont utilisé ChatGPT pour effectuer des tâches complexes comme le codage de logiciels, la rédaction de propositions commerciales et l'écriture de fiction.
Et ChatGPT, qui utilise l'IA pour deviner quel mot vient ensuite, s'améliore rapidement. Il y a quelques mois, je n'étais pas capable d'écrire un haïku ; maintenant ça le fait vite. Mardi, OpenAI a dévoilé son moteur d'intelligence artificielle de nouvelle génération, GPT-4 , qui alimente ChatGPT.
L'excitation suscitée par les chatbots illustre comment Siri, Alexa et d'autres assistants vocaux - qui ont autrefois suscité un battage médiatique similaire - ont gaspillé leur avantage dans la course à l'IA .
Au cours de la dernière décennie, les produits ont rencontré des obstacles. Siri s'est heurté à des obstacles technologiques , y compris un code brut qui a mis des semaines à se mettre à jour avec les fonctionnalités de base, a déclaré John Burkey, un ancien ingénieur d'Apple qui a travaillé sur l'assistant. Amazon et Google ont mal calculé la manière dont les assistants vocaux seraient utilisés , les amenant à investir dans des domaines où la technologie était rarement payante, ont déclaré d'anciens employés. Lorsque ces expériences ont échoué, l'enthousiasme pour la technologie a diminué dans les entreprises, ont-ils déclaré.
Les assistants vocaux sont « stupides comme un roc », a déclaré Satya Nadella , PDG de Microsoft, dans une interview ce mois-ci avec le Financial Times, déclarant que la dernière IA ouvrirait la voie. Microsoft a travaillé en étroite collaboration avec OpenAI, investissant 13 milliards de dollars dans la startup et intégrant sa technologie dans le moteur de recherche Bing ainsi que dans d'autres produits.
Apple a refusé de commenter Siri. Google a promis d'offrir un excellent assistant virtuel pour aider les gens sur leur téléphone, et à l'intérieur de leur maison et de leur voiture ; la société teste séparément un chatbot appelé Bard . Amazon a déclaré avoir constaté une augmentation de 30% de l'engagement des clients dans le monde avec Alexa au cours de l'année écoulée et était optimiste quant à sa mission de créer une IA de classe mondiale.

Les assistants et les chatbots sont basés sur différents types d'IA. Les chatbots sont basés sur ce que l'on appelle de grands modèles linguistiques , qui sont des systèmes formés pour reconnaître et générer du texte à partir d'énormes ensembles de données extraits d'Internet. Ils peuvent alors suggérer des mots pour compléter une phrase.
Au lieu de cela, Siri, Alexa et Google Assistant sont essentiellement ce que l'on appelle des systèmes de commande et de contrôle . Ils peuvent comprendre une liste finie de questions et de demandes telles que « Quel temps fait-il à New York ? ou "Allumez les lumières de la chambre." Si un utilisateur demande à l'assistant virtuel de faire quelque chose qui n'est pas dans son code, le bot dit simplement qu'il ne peut pas aider.
Siri avait également une conception encombrante qui rendait l'ajout de nouvelles fonctionnalités fastidieux , a confirmé Burkey, qui a été chargé d'améliorer Siri en 2014. La base de données de Siri contient une gigantesque liste de mots, y compris les noms d'artistes musicaux et de lieux comme les restaurants, dans près de deux douzaines de langues.
Cela en a fait "une grosse boule de neige", a-t-il déclaré. Si quelqu'un veut ajouter un mot à la base de données de Siri, a-t-il ajouté, "cela va se retrouver dans un gros tas".
Ainsi, des mises à jour apparemment simples, comme l'ajout de quelques nouvelles phrases à l'ensemble de données, nécessiteraient la reconstruction de l'intégralité de la base de données , ce qui pourrait prendre jusqu'à six semaines, a déclaré Burkey. L'ajout de fonctionnalités plus complexes, telles que de nouveaux outils de recherche, pourrait prendre près d'un an. Cela signifiait qu'il n'y avait aucun moyen pour Siri de devenir un assistant créatif comme ChatGPT, a-t-il déclaré.
Alexa et l'assistant Google étaient basés sur une technologie similaire à celle de Siri, mais les entreprises ont eu du mal à générer des revenus importants grâce aux assistants, ont déclaré d'anciens responsables d'Amazon et de Google. (Au lieu de cela, Apple a utilisé avec succès Siri pour attirer les acheteurs vers ses iPhones.)
Après qu'Amazon ait lancé l' Echo , une enceinte intelligente alimentée par Alexa, en 2014, la société espérait que le produit contribuerait à stimuler les ventes de sa boutique en ligne en permettant aux consommateurs de parler à Alexa pour passer des commandes, a déclaré un ancien dirigeant d'Amazon. Alexa. Cependant, alors que les gens se sont amusés à jouer avec la capacité d'Alexa à répondre aux invites météorologiques et à régler des alarmes, peu ont demandé à Alexa de commander des articles , a-t-il ajouté.
Amazon a peut-être trop investi dans la fabrication de nouveaux types de matériel, tels que des réveils et des micro-ondes désormais abandonnés qui fonctionnent avec Alexa, qui se vendaient au prix coûtant ou en dessous, a déclaré l'ancien dirigeant.

La société n'a pas non plus investi suffisamment dans la création d'un écosystème permettant aux utilisateurs d'étendre facilement les capacités d'Alexa , comme Apple l'avait fait avec son App Store, ce qui a contribué à alimenter l'intérêt pour l'iPhone, a déclaré la personne. Bien qu'Amazon ait proposé un magasin de "compétences" à Alexa pour contrôler des accessoires tiers tels que des interrupteurs d'éclairage, les gens ont eu du mal à trouver et à définir des compétences pour les haut-parleurs, contrairement à l'expérience sans friction du téléchargement d'applications mobiles à partir des magasins d'applications.
Les problèmes d'Amazon avec Alexa ont peut-être égaré Google, a déclaré un ancien cadre qui travaillait sur Google Assistant. Les ingénieurs de Google ont passé des années à expérimenter leur assistant pour imiter ce qu'Alexa pouvait faire, notamment en concevant des haut-parleurs intelligents à commande vocale et des écrans de tablette pour piloter des accessoires domestiques tels que des thermostats et des interrupteurs d'éclairage. L'entreprise a ensuite intégré des publicités dans ces produits ménagers, qui ne sont pas devenus une source de revenus importante .
Maintenant, de nombreuses grandes entreprises technologiques se précipitent pour donner des réponses à ChatGPT. Au siège d'Apple, la société a organisé le mois dernier son sommet annuel sur l'IA, un événement interne permettant aux employés de découvrir son excellent modèle linguistique et d'autres outils d'IA, ont déclaré deux personnes familières avec le programme. De nombreux ingénieurs, dont des membres de l'équipe Siri, testent chaque semaine des concepts de génération de langage , ont déclaré les sources.
Mardi, Google a également annoncé qu'il lancerait bientôt des outils d'IA génératifs pour aider les entreprises, les gouvernements et les développeurs de logiciels à créer des applications avec des chatbots intégrés et à intégrer la technologie sous-jacente dans leurs systèmes.
À l'avenir, les technologies de chatbot et d'assistant vocal convergeront , selon les experts en IA. Cela signifie que les gens pourront contrôler les chatbots avec la parole, et les utilisateurs des produits Apple, Amazon et Google pourront demander à des assistants virtuels de les aider dans leur travail, pas seulement pour des tâches comme vérifier la météo.
"Ces produits n'ont jamais fonctionné dans le passé car nous n'avons jamais eu de capacités de dialogue au niveau humain", a déclaré Aravind Srinivas, fondateur de Perplexity, une startup d'IA qui propose un moteur de recherche alimenté par un chatbot. "Maintenant, nous le faisons."
Brian X. Chen et Nico Grant ont rapporté de San Francisco et Karen Weise a rapporté de Seattle. Cade Metz a contribué aux reportages de San Francisco.
© Le New York Times 2023
Continuer à lire: