
L'Islande se bat depuis plusieurs années pour que sa langue maternelle ne disparaisse pas, en raison de la croissance numérique et du faible nombre de personnes qui la parlent. Une solution à ce problème serait dans la mise en œuvre de l'intelligence artificielle GPT-4 , récemment annoncée par OpenAI.
L'utilisation de cette technologie leur permettrait de former des systèmes pour apprendre leur langue et ainsi développer des applications et des environnements numériques pour que les Islandais préservent leurs traditions face à l'invasion de l'anglais.
Le président du pays, Guðni Th. Jóhannesson, a déjà entamé des discussions avec l'entreprise pour utiliser l'IA comme solution. "Nous devons intégrer notre langue dans les logiciels et les applications que les gens utilisent tous les jours", a déclaré Jóhanna Vigdís Guðmundsdóttir, directrice exécutive d'Almannarómur, un centre de technologie linguistique à but non lucratif.

L'AI aiderait à éviter la fin de l'Islande
La lutte contre cette éventuelle disparition de la langue a conduit le gouvernement à créer le Département de l'aménagement linguistique, qui a pour mission d'inventer des termes globaux en islandais. Par exemple, 'ordinateur' est tölva, qui est un mélange entre tala (nombre) et völva (prophète).
Tout cela dans le but de maintenir la langue dans les nouvelles générations, compte tenu de la croissance numérique puisque officiellement cette langue n'est utilisée que par environ 340 000 personnes.
Ce qui conduit à ce que des plates-formes comme Siri et Alexa ne l'aient pas parmi leurs options, et les utilisateurs optent pour l'anglais comme option globale.
Compte tenu de ce scénario, une entreprise de technologie locale appelée Miðeind ehf formait GPT-3 pour adapter d'autres systèmes, mais le processus ne s'est pas bien passé, donc avec la nouvelle version de l'intelligence artificielle , ils espèrent avoir de meilleurs résultats en raison de leurs avancées.
Pour y parvenir, l'entreprise a réuni une équipe de 40 personnes qui seront chargées de former le système sur deux sujets clés : la grammaire et les connaissances culturelles sur l'islandais.
Ils le feront par le biais d'un processus appelé apprentissage par renforcement à partir de la rétroaction humaine, ou RLHF. Qui consiste en des humains donnant à GPT-4 une série de commandes pour générer quatre réponses possibles, qui sont ensuite éditées et la meilleure est choisie pour créer une liste.
Avec ces données, la formation est effectuée et de cette manière, de meilleures réponses sont obtenues.

Le processus doit être fait de cette façon, car pour son fonctionnement, l'intelligence artificielle prend des informations sur Internet, où la plupart du contenu est en anglais et elle n'a pas une connaissance adéquate de l'islandais, de sorte que les traductions comportent souvent de nombreuses erreurs.
L'équipe s'attend à un long travail de formation pour affiner l'interaction avec l'IA et qu'elle génère du contenu créatif et concret avec ce langage. Mais s'ils le font, ils pourront utiliser ces informations pour développer des applications, comme rendre l'assistant vocal Embla, qui appartient à la société islandaise, capable d'interagir couramment en utilisant cette langue.
Quoi de neuf dans GPT-4
Après la forte croissance de ChatGPT fin 2022 et l'apparition de cette intelligence artificielle sur de multiples plateformes, OpenAI, la société propriétaire du projet, a annoncé une nouvelle version qui promet des améliorations de ses performances.
Le point le plus remarquable de son amélioration est que l'IA permettra un langage multimodal, c'est-à-dire que les requêtes ne se feront plus uniquement par le biais de texte, mais pourront être associées à des images, des vidéos et des audios. Quelque chose qui en pratique servirait à résumer une vidéo YouTube, par exemple.
Un autre aspect important sera la fidélité des informations, puisque beaucoup de ces chatbots ont commencé à inventer des faits et des données. Mais de la part de l'entreprise, ils assurent que cette nouvelle version "est 82% moins susceptible de répondre aux demandes de contenu illégal et 40% plus susceptible de produire des réponses factuelles".