Programmeur.chprogrammeur.ch
  • Intelligence artificielle

Meta lance une intelligence artificielle pour traduire la parole en texte dans plus de 100 langues

Publié le 22.08.2023
Le modèle linguistique dispose de filtres pour éviter les contenus toxiques. (But)

Meta a présenté son prochain modèle de traduction parole-texte, qui prendra en charge près de 100 langues, appelé SeamlessM4T . Cette technologie cherche à minimiser les limitations linguistiques et à permettre une compréhension simultanée.

Ce système permettra également la tradition texte-texte et parole-parole, avec la capacité de reconnaître 100 langues d'entrée et de sortie dans 35 langues de sortie supplémentaires.

La sortie de ce modèle est axée sur les développeurs, car cette licence permet aux experts de collaborer et d'améliorer le modèle, ouvrant ainsi la voie à de futures innovations. Pour l'instant, il ne s'agit donc pas d'un produit de consommation pour les utilisateurs.

Les nouveautés du modèle multilingue

Une caractéristique notable qui distingue SeamlessM4T est sa capacité à identifier la commutation de code, qui est un phénomène linguistique dans lequel les locuteurs basculent entre deux ou plusieurs langues dans une seule phrase.

Cette fonctionnalité est particulièrement complexe pour les systèmes d’intelligence artificielle , et l’inclusion de cette possibilité constitue un point différent par rapport aux systèmes actuels du marché. Pour le démontrer, Meta a indiqué qu'elle était déjà capable de faire la différence entre l'hindi, le telugu et l'anglais en une seule phrase, ce qui promet une plus grande précision de traduction dans des situations réelles.

Le modèle linguistique dispose de filtres pour éviter les contenus toxiques. (Unsplash)

Contrairement aux modèles de traduction précédents, qui divisaient le processus de traduction entre différents systèmes, SeamlessM4T effectue l'intégralité de la tâche de traduction en une seule étape, ce qui représente une avancée décisive en termes d'efficacité et de précision dans la compréhension automatique et en temps réel.

Un autre élément à souligner dans le développement de ce modèle est sa capacité à identifier les mots toxiques ou sensibles, qui selon l'entreprise sont ceux qui incitent à la haine, à la violence, aux grossièretés ou aux abus. De cette manière, ils garantissent que la traduction n’introduit pas de toxicité qui n’était pas présente dans le matériel original.

« Nous filtrons la toxicité déséquilibrée dans les données d'entraînement. Si l'entrée ou la sortie contenait des quantités différentes de toxicité, nous supprimions cette séquence d'apprentissage", a publié la société dans son communiqué.

En outre, l'équipe de recherche de Meta s'est efforcée d'atténuer les préjugés sexistes dans les traductions. SeamlessM4T est capable d'identifier et de quantifier ce biais, garantissant que les traductions sont équitables et n'introduisent pas de concepts inutiles.

Par exemple, le système est capable de détecter si la personne a dit « docteur » en espagnol et ainsi attribuer un pronom féminin dans une langue différente sans grammaire de genre équivalente si nécessaire, puisque certaines langues n'ont pas de pronom marqué. distinction de genre dans leur structure, comme dans le cas de l'anglais.

Le modèle linguistique dispose de filtres pour éviter les contenus toxiques. (But)

Le lancement de ce nouveau modèle fait partie des projets que l'entreprise a présentés dans le domaine de l'intelligence artificielle. Il y a quelque temps, l'entreprise a introduit des modèles et des ensembles de données tels que No Language Left Behind et SpeechMatrix , qui permettent également la traduction automatique.

Ces derniers outils ont également joué un rôle clé dans la modération efficace du contenu sur des plateformes comme Facebook et Instagram , où les publications sont rédigées dans un grand nombre de langues.

Un autre système d'IA que Meta a récemment présenté est AudioCraft, qui est un code qui permet la génération de texte en son et qui n'est également disponible que pour les développeurs. Plus l'accès à leur plus grand modèle de langage appelé Llama 2.

Lisez aussi

foxconn-annonce-que-lusine-pour-les-superpuces-de-nvidia-est-en-construction-au-mexique
Foxconn annonce que l'usine pour les superpuces de Nvidia est en construction au Mexique.

08.10.2024

taiwan-bat-son-record-dexportations-au-troisieme-trimestre-grace-a-lessor-de-lia
Taïwan bat son record d'exportations au troisième trimestre grâce à l'essor de l'IA.

08.10.2024

le-prix-nobel-de-physique-va-a-hopfield-et-hinton-pour-avoir-contribue-a-lapprentissage-des-machines
Le prix Nobel de physique va à Hopfield et Hinton pour avoir contribué à l'apprentissage des machines.

08.10.2024

© 2025 programmeur.ch - Mentions légales

Abonnez-vous !

Recevez les actualités sur l'intelligence artificielle en avant première.