
La voix , sans aucun doute, permet de différencier un humain d'un autre. Leur ton, leur timbre, leur cadence et leurs expressions, entre autres, ne font pas seulement les gens, mais aussi les villes. C'est pourquoi en écoutant quelqu'un parler, vous pouvez savoir, dans de nombreux cas, d'où il vient.
Un ensemble de pathologies peut entraîner la perte de la voix, en plus d'autres fonctions. Faire oublier cette identité sonore . C'est sur ce point qu'un groupe de scientifiques argentins a décidé d'intervenir.
Ils ont créé un logiciel avec IA qui non seulement récupère la voix caractéristique de chaque personne, en utilisant d'anciens fichiers, mais a également une « mélodie » argentine . Dans cette première étape, l'ancien législateur et actuel directeur national des stratégies inclusives, accessibles et du développement durable des transports du ministère des Transports, Jorge Rivas , a été le protagoniste. Le but? Qu'il « sonne » comme avant l'agression qui lui a ôté son identité sonore. Une première étape qui, d'ailleurs, était déjà partagée avec l'ancien sénateur Esteban Bullrich.

DarÃo Páez, d'Infiniem Labs du Laboratoire de Mécatronique de la Faculté d'Ingénierie de l'Armée, et Andrea Cortizo , diplômé en Analyse des Systèmes et Phonoaudiologie, et professeur d'Ingénierie des Systèmes d'Information à l'Université Technologique Nationale (UTN) Régionale de La Plata, sont les les dirigeants de ce groupe et Infobae ont parlé avec eux.
"Le projet a commencé à travailler avec Jorge Rivas en 2019, la pandémie a détourné les objectifs et en 2022 nous avons repris, en nous présentant au défi posé dans le programme ImpaCT.AR, défi 148 : 'Mon identité vocale'" , a affirmé Paez.
En ce sens, le scientifique a expliqué que son projet répondait à la demande de " développement d'un logiciel de voix de synthèse utilisant l'enregistrement vocal de l'utilisateur, pour améliorer les conditions d' accessibilité universelle et de qualité de vie , tant dans les performances de leurs fonctions sociales, ainsi que dans leur vie privée, des personnes ayant des troubles de la parole ».

« C'est tout le processus que nous traversons. D'une part, Jorge nous a appelés et a soulevé le besoin avant la pandémie et, ensuite, le défi se pose dans le programme ImpaCTAR, auquel nous avons répondu de la Faculté Régionale UTN-La Plata, Centre UTN CODAPLI, (Systèmes Appliqués aux Neurotechnologies ) », se souvient Cortizo.
Puis, selon l'expert, « nous avons formé l'équipe finale avec les Systèmes d'Information et avec le laboratoire Infiniem.labs, qui est composé d'ingénieurs du son et d'électroniciens. En ce moment, nous sommes au milieu du projet » .
Lors de la présentation de cette première étape, les scientifiques ont expliqué que le projet s'adresse à un pourcentage important de la population argentine qui souffre de différentes pathologies entraînant une perte de la voix et n'a accès à aucun développement technologique pour satisfaire ce besoin. .

Parmi les pathologies répertoriées figurent : les traumatismes crâniens (TEC), la sclérose latérale amyotrophique (SLA), les accidents vasculaires cérébraux (AVC), les tumeurs du larynx, la maladie de Parkinson, la sclérose en plaques et d'autres pathologies qui affectent le système orophonique.
"Le principal obstacle que nous avons rencontré était la difficulté de trouver une base de données variée, étendue et sous licence ouverte contenant des audios avec l'accent que nous recherchions", a expliqué Páez. C'est que, contrairement à d'autres programmes aux caractéristiques similaires, il a un accent argentin.
En ce sens, lors de la présentation, les experts ont souligné que "le logiciel existant dans le pays fonctionne actuellement avec une voix synthétique qui ne représente pas l'identité vocale de la personne qui l'utilise et qui est d'une grande importance pour qui perd ou qui perd". ont perdu leur capacité à parler, pour pouvoir le refaire avec le même timbre et les caractéristiques de leur façon particulière de parler , générant ainsi un fort impact psychosocial sur les personnes qui l'utilisent, leurs familles, les groupes de liaison et la société dans général ».

"La base de données utilisée dans l'implémentation sur laquelle nous nous sommes basés contenait des audios de centaines de personnes, tandis que la base de données que nous utilisons en compte environ 40", a expliqué Páz, notant l'un des problèmes auxquels ils étaient confrontés. Et il a complété : « Dans tous les cas, les algorithmes d'IA nous permettent de prendre un modèle préalablement formé avec d'autres données et de l'ajuster avec les données d'intérêt. C'est pourquoi nous avons pu obtenir de très bons résultats malgré le "peu" de données.
Ce logiciel permettra aux personnes sans voix de s'exprimer à l'aide d'une voix de synthèse avec une innovation technologique appliquée qui leur permettra de communiquer avec leur voix naturelle. "Il s'agit d'un développement qui offrira une qualité de vie à ceux qui ont ce besoin et comme principal intrant, l'enregistrement de la voix naturelle du bénéficiaire direct est nécessaire", ont-ils indiqué.
"Il est nécessaire de travailler avec les échantillons sonores avant qu'ils n'entrent dans le système d'IA et nous devons le faire avec diligence et minutie pour réaliser ce qu'on appelle le jeu de données argentin River Plate : lexique et prosodie . C'est la première approximation. Ensuite, par exemple, avec les échantillons de voix de Jorge, avant l'agression, un travail tout aussi méticuleux doit être fait dans le traitement », a déclaré Cortizo.

Dans cette première étape, qui a été présentée il y a quelques jours, le développement envisage la création de trois voix synthétiques avec une intonation et des idiomes dans la manière de parler et de s'exprimer d'une voix argentine.
"L' accent de Río de la Plata que nous avons obtenu dans la voix générée, plus qu'un point en faveur, est une caractéristique très importante et le premier objectif que nous voulions atteindre", a rappelé Páez. Et il a ajouté : « Justement si on parle d' identité , il est essentiel que la voix de synthèse représente nos manières de parler et de prononcer.
Pendant ce temps, Cortizo a ajouté : « Il existe des systèmes similaires dans d'autres langues, sous licence, c'est-à-dire payants. En Argentine nous n'avons pas ce Data Set, d'où l' originalité et la possibilité de personnalisation. Nous sommes au milieu du projet, il reste encore quelques mois de travail à faire . Ensuite, on verra comment le produit final est acheminé pour qu'il atteigne les Argentins qui en ont besoin ».

Dans le même temps, il a rappelé le moment où ce premier pas a été livré à l'ancien législateur et a souligné : « C'était impressionnant pour nous. passionnant †. "Nous devrons écouter Jorge comment il se sent avec cette voix réussie. Ensuite, un autre processus commencera, qui consiste à améliorer l'interface actuelle et à continuer d'améliorer ce qui a été fait pour répondre aux besoins de l'utilisateur, qui dans ce cas était Jorge ».
Comme l'a annoncé Cortizo, il reste encore la moitié du projet qui est déjà en cours de développement. Une nouvelle étape que l'on pourrait qualifier de challengeante. Ils veulent qu'il atteigne les personnes qui cherchent à récupérer leur voix, pour lesquelles ils doivent enregistrer la voix naturelle du bénéficiaire direct dans le logiciel développé.
"De la Faculté Régionale UTN-La Plata, Centre UTN CODAPLI - Systèmes Appliqués aux Neurotechnologies et en collaboration avec la Faculté d'Ingénierie de l'Armée (FIE -UNDEF), Laboratoire de Mécatronique 'Infiniem Labs', une proposition a été faite d'une solution pour ce défi », a déclaré Páez, annonçant que cette deuxième étape est déjà en cours.

Et d'ajouter : « Infiniem Labs est un laboratoire pluridisciplinaire où des étudiants des premières années d'ingénierie cohabitent avec des professionnels formés avec plusieurs années d'expérience, dans le but de réaliser des projets technologiques à impact social ». C'est pourquoi ce projet, financé par l'État et le secteur privé, vise à diffuser dans la société les vertus de l'application de technologies issues de différents domaines, tels que la fabrication numérique, l'IoT et l'IA, entre autres.
« Dans la prochaine étape, le défi va être de savoir comment l' intégration du logiciel va se faire pour que le bénéficiaire puisse l'utiliser avec la plus grande accessibilité possible . A ce stade, la possibilité de travailler ensemble entre les développeurs et l'équipe qui accompagne Jorge Rivas pour aboutir à un produit final adapté à leurs besoins est cruciale. L'apprentissage que nous pouvons tirer de cette intégration est important , car il nous fournira une base pour pouvoir rapprocher ce logiciel de tous ceux qui en ont besoin », a conclu Páez.

Il convient de noter que la présentation de cette première étape comprenait la participation du ministre de la Science, de la Technologie et de l'Innovation, Daniel Filmus, et du directeur national des stratégies de développement inclusif, accessible et durable du ministère des Transports, Jorge Rivas, qui a dirigé la présentation de l'état d'avancement du projet de développement du logiciel de voix de synthèse dans le cadre du Programme « ImpaCT.Ar Science et Technologie », au Centre Culturel des Sciences (C3).
Lors de l'événement, Filmus a annoncé avoir transmis "le projet à Esteban Bullrich, avec qui nous développons divers projets d'inclusion et de recherche via sa fondation". Nous avons convenu de continuer à travailler ensemble sur ce dossier car il y a un champ de besoins très important ». En même temps, il s'est interrogé sur l'impact de ces projets et a affirmé : « Ils sont importants parce qu'ils visent à répondre à des besoins spécifiques ».
Continuer à lire: