Programmeur.chprogrammeur.ch
  • Intelligence artificielle

Comment convertir l'audio en texte avec l'intelligence artificielle de Google

Publié le 12.07.2023
Repérez Google. (Google)

" Journalist Studio " rassemble une série d'outils virtuels, tels que Pinpoint, afin que toute personne utilisant l'intelligence artificielle puisse réviser des documents et transcrire l'audio en texte.

Il est également capable d'interpréter des images , de reconnaître des lettres manuscrites, de transcrire de l'audio en texte (sa fonction la plus populaire), d'identifier les noms de personnes, d'agir comme un moteur de recherche dans des documents personnels , entre autres fonctionnalités.

Identifier (Infobae)

Pour accéder à Pinpoint, les utilisateurs doivent se connecter à partir de leur compte Google, puis se rendre sur la page Web "journaliststudio.google.com/pinpoint", où ils verront la page d'accueil et l'espace de travail vides.

Vous devez cliquer sur le bouton "Nouvelle collection privée " pour demander à Google l'autorisation d'utiliser le service.

L'application n'est rien de plus que de remplir un formulaire dans lequel certaines informations personnelles telles que le nom, l'organisation dans laquelle vous travaillez, le pays, l'e-mail (il n'a pas besoin d'être institutionnel) etc. seront demandées. Immédiatement après l'achèvement, Google autorisera un accès complet à la plate-forme et l'utilisateur sera invité à créer sa première "Collection".

Identifier (Infobae)

Les collections dans Pinpoint sont comme des dossiers dans lesquels vous pouvez télécharger un grand nombre de fichiers avec un thème commun. C'est peut-être parce qu'ils présentent différentes versions d'une histoire, contiennent des informations liées à un cas particulier, etc. Il n'y a pas de limite aux collections qui peuvent être créées et aucune limite définie aux documents qui peuvent être téléchargés ou générés.

Le programme peut stocker et traiter des fichiers dans différents formats tels que PDF, Word, Excel, PowerPoint, pages Web , texte brut, fichiers image, fichiers audio, entre autres. Ceux qui ne peuvent pas être pris en charge ne seront pas traités lors de leur téléchargement dans une collection.

Télécharger et traiter des fichiers dans Pinpoint

Pour télécharger un fichier, les utilisateurs doivent cliquer sur le bouton « Drive » ou « Ordinateur » et utiliser le navigateur pour trouver le document à traiter. Une fois sélectionné, il commencera à télécharger sur le cloud et dans la partie inférieure droite de l'écran, vous pouvez voir le processus. Tout fichier audio ou vidéo téléchargé sera transcrit, bien que cela puisse prendre de quelques secondes à plusieurs minutes, voire des heures, selon la quantité d'audio, sa durée et même la qualité de votre connexion Internet.

Identifier (Infobae)

La qualité de la transcription peut varier en fonction des paramètres de langue. Si une transcription est en espagnol et la suivante en anglais, avant de traiter le fichier, la langue doit être changée à l'aide de l'icône des paramètres située en haut à droite de l' espace de travail à côté du profil de l'utilisateur de la photo.

Pour une meilleure organisation d'une collection, chacune peut avoir des étiquettes de couleurs différentes pour les identifier par sous-thèmes, informations communes ou importance. Pour cela, il vous suffit d'aller sur l'icône « Ajouter un libellé » à l'extrême droite du fichier traité.

Toutes les étiquettes apparaîtront dans l'espace droit de l' écran à côté de la liste des noms de personnes et d'entités, bien que ces dernières ne soient affichées que lorsqu'il y a suffisamment de documents pour commencer à avoir ces relations entre les fichiers.

Identifier (Infobae)

Pour visualiser les informations qui ont été retranscrites à l'aide de Pinpoint , il vous suffit de cliquer sur le nom du fichier et en bas de l'écran le programme vous permettra de rejouer l'audio d'origine afin que vous puissiez confirmer que le la transcription était correcte.

Le plus gros inconvénient de Pinpoint est qu'en ne différenciant pas un locuteur d'un autre, il est probable que de gros paragraphes de texte mélangent toutes les voix . Cependant, cela peut être résolu en écoutant l'enregistrement et en vous assurant de voir quand les annonceurs parlent .

Lisez aussi

foxconn-annonce-que-lusine-pour-les-superpuces-de-nvidia-est-en-construction-au-mexique
Foxconn annonce que l'usine pour les superpuces de Nvidia est en construction au Mexique.

08.10.2024

taiwan-bat-son-record-dexportations-au-troisieme-trimestre-grace-a-lessor-de-lia
Taïwan bat son record d'exportations au troisième trimestre grâce à l'essor de l'IA.

08.10.2024

le-prix-nobel-de-physique-va-a-hopfield-et-hinton-pour-avoir-contribue-a-lapprentissage-des-machines
Le prix Nobel de physique va à Hopfield et Hinton pour avoir contribué à l'apprentissage des machines.

08.10.2024

© 2025 programmeur.ch - Mentions légales

Abonnez-vous !

Recevez les actualités sur l'intelligence artificielle en avant première.