Programmeur.chprogrammeur.ch
  • Intelligence artificielle

ChatGPT : c'est la nouvelle façon de vous donner des instructions avec de la voix et des images

Publié le 26.09.2023
Le chatbot disposera de cinq voix humaines pour converser avec l'utilisateur. (Pexels)

Les utilisateurs de ChatGPT ont accès à une nouvelle forme de dialogue avec la plateforme, en ajoutant du contenu en images et en audio, ce qui permettra une interaction beaucoup plus profonde avec le chatbot.

Grâce à une mise à jour, OpenAI ajoutera ces fonctionnalités, rendant l'application plus conversationnelle avec des dialogues plus naturels et moins schématiques, il ne s'agit donc pas uniquement de questions et réponses rigides.

Cette avancée a été réalisée grâce à un nouveau modèle de synthèse vocale capable de générer un son similaire à celui d'un être humain. Ce modèle est basé sur des chaînes de texte soutenues par de courts extraits de voix d'acteurs professionnels.

La collaboration avec ces experts a donné naissance à cinq voix différentes parmi lesquelles les utilisateurs peuvent choisir pour pimenter leurs interactions avec ChatGPT.

Améliorations vocales dans ChatGPT

L'ajout de fonctionnalités vocales à ChatGPT permettra aux utilisateurs d'interagir de manière plus intuitive . Parmi les applications pratiques de cette fonction, il y a la possibilité de demander des histoires pour les enfants, de résoudre des débats à table ou simplement de profiter d'une conversation informelle avec un assistant virtuel.

Pour commencer à utiliser la voix, les utilisateurs peuvent accéder aux paramètres de l'application mobile et sélectionner Nouvelles fonctionnalités. Ils peuvent alors choisir de participer à des conversations vocales. Une fois cette option activée, ils doivent appuyer sur le bouton des écouteurs dans le coin supérieur droit de l'écran d'accueil et choisir leur voix préférée parmi les cinq disponibles.

Le chatbot disposera de cinq voix humaines pour converser avec l'utilisateur. (Pexels)

Comment les images seront intégrées

OpenAI a également introduit la possibilité de répondre aux requêtes incluant des images . Cela ouvre des possibilités aux utilisateurs car ils peuvent désormais fournir à ChatGPT une ou plusieurs images à titre de référence.

Par exemple, les utilisateurs peuvent prendre une photo d'un problème dans leur maison, comme un gril qui ne fonctionne pas, et demander au chatbot de les aider à le résoudre, ou prendre une photo des ingrédients dans le garde-manger et demander de l'aide pour les préparer. des recettes. . De plus, la plateforme peut analyser des graphiques complexes pour les données liées au travail.

Pour se concentrer sur des parties spécifiques des images, OpenAI a inclus un « outil de dessin » dans l'application. Là, il est possible de mettre en évidence des zones spécifiques dans les images et de diriger l'attention vers ces détails.

« Prenez une photo d'un point de repère pendant votre voyage et discutez des endroits intéressants à voir. Après le dîner, aider votre enfant à résoudre un problème de mathématiques en prenant une photo, en encerclant l'ensemble des problèmes et en lui demandant de partager des indices avec vous deux », sont d'autres exemples pratiques qu'OpenAI a partagés à propos de cette nouvelle.

Ces capacités voix et image seront disponibles dans les deux prochaines semaines pour les abonnés des services Plus et Enterprise de ChatGPT. Alors que le service Plus coûte 20 $ par mois, le service Enterprise a été conçu pour répondre aux besoins des clients professionnels.

Le chatbot disposera de cinq voix humaines pour converser avec l'utilisateur. (Pexels)

Dall-E 3 rejoint ChatGPT

OpenAI a présenté la troisième version de son intelligence artificielle pour générer des images à partir de texte, qui s'accompagne de plusieurs améliorations et nouvelles fonctionnalités. Parmi lesquels il convient de noter que DALL-E 3 est désormais intégré nativement à ChatGPT , permettant aux utilisateurs de créer de meilleures invites , demandes ou instructions données à un modèle d'IA pour générer une réponse, directement à partir du chatbot .

Selon la startup de Sam Altman , cet outil évolue considérablement par rapport à son prédécesseur lorsqu'il s'agit d'interpréter les requêtes des utilisateurs. En effet, lors de la production d'une image, vous pouvez demander au système de chat de la générer ou de créer une indication plus longue et plus détaillée, ce qui permettra à DALL-E 3 de mieux l'interpréter et d'offrir des résultats plus précis.

De plus, il permettra également aux utilisateurs d' affiner une création comme s'ils demandaient des modifications à un artiste, grâce à cette intégration avec ChatGPT, qui comprend mieux comment une scène doit être composée et quel est le lien entre les éléments qui la forment. une partie de celui-ci.

Lisez aussi

foxconn-annonce-que-lusine-pour-les-superpuces-de-nvidia-est-en-construction-au-mexique
Foxconn annonce que l'usine pour les superpuces de Nvidia est en construction au Mexique.

08.10.2024

taiwan-bat-son-record-dexportations-au-troisieme-trimestre-grace-a-lessor-de-lia
Taïwan bat son record d'exportations au troisième trimestre grâce à l'essor de l'IA.

08.10.2024

le-prix-nobel-de-physique-va-a-hopfield-et-hinton-pour-avoir-contribue-a-lapprentissage-des-machines
Le prix Nobel de physique va à Hopfield et Hinton pour avoir contribué à l'apprentissage des machines.

08.10.2024

© 2025 programmeur.ch - Mentions légales

Abonnez-vous !

Recevez les actualités sur l'intelligence artificielle en avant première.