Programmeur.chprogrammeur.ch
  • Intelligence artificielle

Crée ton podcast préféré avec seulement un texte, l'IA de Google fera tout avec des voix humaines.

Publié le 12.09.2024
La plateforme peut créer des conversations fluides, avec des interactions fluides et naturelles. (REUTERS/Dado Ruvic/Illustration/File Photo)

Ce développement, baptisé « Audio Overview », offre aux utilisateurs la possibilité de convertir tout document, présentation ou texte en un podcast synthétisé en quelques minutes. Cette fonctionnalité, qui est encore en phase expérimentale, vise à changer radicalement le paysage de la production de contenu audio, permettant aux utilisateurs de générer des résumés sous forme de conversation, en utilisant des voix artificielles étonnamment humaines.

Qu'est-ce que NotebookLM, la nouveauté de Google

NotebookLM est une évolution d'un bloc-notes traditionnel que Google a lancé à l'été 2023, initialement en anglais, dans le cadre d'une série d'expériences impulsées par l'IA. L'outil a été conçu pour aider les gens à organiser et à synthétiser l'information plus rapidement, abordant l'un des plus grands problèmes de l'ère numérique : le surplus d'information.

Selon l'entreprise, la croissance exponentielle des données a rendu de plus en plus difficile l'extraction efficace d'informations précieuses, quelque chose que NotebookLM vise à résoudre en agissant comme un assistant personnel de recherche.

La plateforme peut créer des conversations fluides, avec des interactions fluides et naturelles. (Google)

Maintenant, avec l'arrivée d'« Audio Overview », cet outil permet de résumer l'information en texte et sous forme audio. Les utilisateurs peuvent ajouter n'importe quel document à NotebookLM, et l'intelligence artificielle l'analysera, le résumera et le transformera en une conversation animée entre deux voix synthétisées.

Ces voix ne se contentent pas de lire à haute voix, mais adoptent un ton conversationnel, s'interrompant entre elles, utilisant des expressions colloquiales telles que « Oui » ou « Exact », et même utilisant des métaphores pour rendre l'explication plus compréhensible et attrayante.

Le résultat est une sorte de podcast où les voix interagissent comme si elles étaient des personnes réelles, facilitant la compréhension du contenu de manière plus plaisante et accessible.

Un aspect important est qu'en étant basé sur les documents téléchargés par l'utilisateur lui-même, le système ne « invente » pas d'informations nouvelles et ne commet pas d'erreurs d'interprétation, tant que les documents sources sont corrects. Cela contraste avec d'autres outils d'IA qui souffrent souvent de problèmes d'« hallucination », c'est-à-dire lorsque le système génère des réponses incorrectes ou basées sur des suppositions.

La plateforme peut créer des conversations fluides, avec des interactions fluides et naturelles. (Image Illustrative Infobae)

Comment accéder au créateur de podcast de Google

Pour le moment, Audio Overview est une fonction expérimentale au sein de NotebookLM et n'est disponible qu'en anglais pour un nombre limité d'utilisateurs. Google a commencé à élargir l'accès progressivement, et l'outil devrait être disponible pour un public plus large à mesure que des améliorations seront mises en œuvre.

La société recueille des retours d'utilisateurs afin de perfectionner le système et de garantir que les podcasts générés soient aussi précis et utiles que possible.

Il existe la possibilité que cette fonction s'étende à d'autres langues, y compris l'espagnol, bien qu'aucune date spécifique n'ait été annoncée par Google.

La plateforme peut créer des conversations fluides, avec des interactions fluides et naturelles. (Google)

Google modifie les recherches avec l'IA générative

Google améliore son moteur de recherche avec de l'intelligence artificielle générative, offrant une expérience plus avancée et personnalisée. Grâce à Gemini, le moteur de recherche peut maintenant gérer des tâches complexes telles que le raisonnement, la planification et l'organisation de l'information.

Une des nouveautés est le « Résumé créé avec l'IA », qui permet aux utilisateurs d'obtenir des résumés rapides et pertinents sur des sujets spécifiques, avec des liens pour approfondir l'information. Cette fonction a été reçue dans les expériences de Search Labs et est déjà disponible aux États-Unis, avec des plans d'expansion mondiale.

L'IA permet de formuler des questions complexes en une seule recherche. Par exemple, un utilisateur peut rechercher des cours de yoga dans une ville spécifique et obtenir des résultats détaillés sur leur proximité et leurs offres. De plus, Google a intégré des outils pour la création de plans personnalisés, tels que des itinéraires de voyage ou des plans alimentaires, qui peuvent être exportés vers Google Docs ou Gmail.

Une autre fonction notable est la création d'une page de résultats organisée par l'IA, qui regroupe automatiquement l'information en catégories. Initialement, elle sera disponible pour des recherches liées aux restaurants, aux recettes et d'autres requêtes similaires.

Lisez aussi

foxconn-annonce-que-lusine-pour-les-superpuces-de-nvidia-est-en-construction-au-mexique
Foxconn annonce que l'usine pour les superpuces de Nvidia est en construction au Mexique.

08.10.2024

taiwan-bat-son-record-dexportations-au-troisieme-trimestre-grace-a-lessor-de-lia
Taïwan bat son record d'exportations au troisième trimestre grâce à l'essor de l'IA.

08.10.2024

le-prix-nobel-de-physique-va-a-hopfield-et-hinton-pour-avoir-contribue-a-lapprentissage-des-machines
Le prix Nobel de physique va à Hopfield et Hinton pour avoir contribué à l'apprentissage des machines.

08.10.2024

© 2025 programmeur.ch - Mentions légales

Abonnez-vous !

Recevez les actualités sur l'intelligence artificielle en avant première.