
Une liste d’études et d’articles universitaires faisant référence à Harry Potter offre un aperçu de la recherche de pointe sur l’IA et de certains des problèmes les plus épineux auxquels est confrontée la technologie.
Dans l'exemple récent le plus notable, Harry, Hermione et Ron sont les vedettes d'un article intitulé "Qui est Harry Potter ?" , qui met en lumière une nouvelle technique permettant aux principaux modèles de langage d'oublier sélectivement des informations.
Il s'agit d'une tâche à haut risque pour l'industrie : les grands modèles de langage, qui alimentent les chatbots IA, s'appuient sur de grandes quantités de données en ligne, y compris du matériel protégé par le droit d'auteur et d'autres contenus problématiques. Cela a conduit à des poursuites judiciaires et à un examen public de certaines sociétés d’IA.
Les auteurs de l'article, les chercheurs de Microsoft Mark Russinovich et Ronen Eldan, affirment avoir montré que les modèles d'IA peuvent être modifiés ou modifiés pour supprimer toute connaissance de l'existence des livres Harry Potter, y compris des personnages et des intrigues, sans sacrifier la clarté de la décision globale. -capacités de création et d'analyse du système d'IA.
Le duo affirme avoir choisi les livres pour leur familiarité universelle . "Nous avons pensé qu'il serait plus facile pour les membres de la communauté des chercheurs d'évaluer le modèle résultant de notre technique et de confirmer par eux-mêmes que le contenu a effectivement été 'désappris'", a déclaré Russinovich, CTO de Microsoft Azure.
Presque tout le monde peut poser des questions au modèle pour vérifier s'il « connaît » ou non les livres. Même les personnes qui n’ont pas lu les livres connaissent les éléments de l’intrigue et les personnages.

Dans une autre étude, des chercheurs de l'Université de Washington à Seattle, de l'Université de Californie à Berkeley et de l'Allen Institute for AI ont développé un nouveau modèle de langage appelé Silo qui peut supprimer des données pour réduire les risques juridiques. Cependant, les performances du modèle diminuaient considérablement s'il était formé uniquement sur des textes à faible risque , tels que des livres sans droits d'auteur ou des documents gouvernementaux, ont-ils noté dans un article publié plus tôt cette année.
Pour approfondir le sujet, les chercheurs ont utilisé les livres de Harry Potter pour tester si chaque fragment de texte influence les performances d'un système d'intelligence artificielle. Ils ont créé deux entrepôts de données, ou collections de sites Web et de documents.
Le premier comprenait tous les livres publiés, à l'exception du premier Harry Potter ; l'autre, tous les livres de la série sauf le deuxième, et ainsi de suite. "Lorsque les livres Harry Potter sont supprimés de l'entrepôt de données, la confusion s'aggrave", affirment les chercheurs, faisant référence à l'étendue de la précision des modèles d'IA.
Les études sur l'IA citent Harry Potter depuis au moins une décennie, mais cela est devenu plus courant à mesure que les universitaires et les technologues se sont concentrés sur les outils d'IA capables de traiter et de répondre au langage naturel avec des réponses pertinentes.
Dans le cas d'Harry Potter, "l'abondance de scènes, de dialogues et de moments émotionnels le rendent très pertinent dans le domaine spécifique du traitement du langage naturel", explique Leila Wehbe, chercheuse à Carnegie Mellon qui a mené en 2014 une série d'études. expériences dans lesquelles il a collecté des données d'IRM cérébrale auprès de personnes lisant des histoires de Harry Potter pour mieux comprendre les mécanismes du langage.
Sur arXiv, un référentiel en libre accès de recherche scientifique, les articles récents incluent : Apprentissage automatique pour le développement de potions à Poudlard , Les grands modèles de langage rencontrent Harry Potter et Détection de sorts dans la littérature fantastique avec une intelligence artificielle basée sur un transformateur .

Même lorsqu'il n'occupe pas une place centrale dans la recherche, Harry Potter est aussi l'une des références littéraires préférées des chercheurs. Une étude, par exemple, a utilisé les travaux de Rowling pour tester l'intelligence des systèmes d'IA tels que ceux générés par le chatbot ChatGPT, un sujet qui a fait beaucoup de bruit dans les débats récents.
Terrence Sejnowski, directeur du laboratoire de neurobiologie computationnelle du Salk Institute for Biological Studies, affirme dans l'article que les chatbots ne font rien d'autre que refléter l'intelligence et les préjugés de leurs utilisateurs, comme le Miroir du Riséd dans le premier livre de Harry Potter, reflétant un les désirs de la personne « Harry Potter est populaire auprès des jeunes chercheurs », déclare Wehbe.
"Ils les auront lus étant enfants ou adolescents, ils y penseront donc lorsqu'ils choisiront un corpus de textes écrits ou parlés", a-t-il déclaré.
(C) 2023, Bloomberg