
Avec la croissance de l'intelligence artificielle, diverses entreprises du monde demandent à OpenIA et à Google d'intégrer un large éventail de langues, au-delà de l'anglais, dans leurs systèmes.
Selon le Financial Times, Silo AI, une startup finlandaise, lance une initiative visant à faire en sorte que des modèles linguistiques comme ChatGPT et Bard prennent en charge des langues comme le suédois, l'islandais, le norvégien et le danois.
Pour y parvenir, ils rassemblent une équipe d'experts universitaires en IA de toute l'Europe pour construire, former et exploiter ces langages sur le supercalculateur LUMI, qui est le plus puissant du continent et a été modifié pour exécuter un logiciel d'intelligence artificielle générative.
L'objectif n'est pas seulement de permettre au chatbot de soutenir et de reconnaître la langue, mais aussi de comprendre les termes de la langue, d'apprendre l'histoire culturelle et l'éthique de ces pays.
Plus de langues, plus d'utilisateurs
Bien que des plateformes telles que ChatGPT prennent en charge d'autres langues, comme l'espagnol, la société italienne Translated assure que les principaux chatbots avaient été programmés pour offrir leurs meilleurs résultats en anglais, ce qui n'est pas "juste pour le reste du monde".
Ce qu'ils considèrent comme un revers, bien qu'ils aient développé un outil de traduction en direct pour ce système afin d'améliorer les réponses.
"C'est comme un bond en arrière de cinq ans, en termes de technologie, vers le monde non anglophone, créant ainsi un monde à deux vitesses", a déclaré Marco Trombetti, directeur général de la société.

D'autres initiatives qui ont attiré l'attention sont OpenGPT-X et LEAM d'Allemagne, qui développent des modèles de langage open source, et avertissent que les restrictions qu'OpenAI a imposées à l'accès à GPT-4 menacent le "marché de la souveraineté et de l'indépendance numériques" en Europe dans l'IA. et entrave le progrès d'autres entreprises.
Enfin, l'Israel Natural Language Processing Association travaille à résoudre les problèmes de reconnaissance de la parole en hébreu dans divers environnements technologiques.
La crainte est que puisqu'il y a une faible population qui parle cette langue, les entreprises qui possèdent l'intelligence artificielle ne l'incluent pas dans leurs plateformes, ce qui pour elles "représente un obstacle à la réalisation et à l'application de services avancés" pour ces populations.

L'Islande utilise l'IA pour éviter de perdre sa langue
L'Islande se bat depuis plusieurs années pour que sa langue maternelle ne disparaisse pas, en raison de la croissance numérique et du faible nombre de personnes qui la parlent. Une solution à ce problème serait dans la mise en œuvre de l'intelligence artificielle GPT-4 , récemment annoncée par OpenAI.
L'utilisation de cette technologie leur permettrait de former des systèmes pour apprendre leur langue et ainsi développer des applications et des environnements numériques pour que les Islandais préservent leurs traditions face à l'invasion de l'anglais.
Une entreprise technologique locale appelée Miðeind ehf entraînait GPT-3 pour adapter d'autres systèmes, mais le processus ne s'est pas bien passé, donc avec la nouvelle version de l'intelligence artificielle , ils espèrent avoir de meilleurs résultats grâce à leurs avancées.
Pour y parvenir, l'entreprise a réuni une équipe de 40 personnes qui seront chargées de former le système sur deux sujets clés : la grammaire et les connaissances culturelles sur l'islandais. Ils le feront par le biais d'un processus appelé apprentissage par renforcement à partir de la rétroaction humaine, ou RLHF. Qui consiste en des humains donnant à GPT-4 une série de commandes pour générer quatre réponses possibles, qui sont ensuite éditées et la meilleure est choisie pour créer une liste.