Programmeur.chprogrammeur.ch
  • Intelligence artificielle

Ils dénoncent que les œuvres de Stephen King, Atwood et Murakami soient piratées pour entraîner l'IA

Publié le 23.08.2023
Plusieurs auteurs contribuent par inadvertance à former l’IA avec leurs œuvres piratées, révèle The Atlantic (Photo : Reuters)

Des écrivains comme Stephen King , Rachel Cusk , Zadie Smith , Margaret Atwood , Haruki Murakami et Elena Ferrante font partie des milliers d'auteurs dont les œuvres piratées ont été utilisées pour entraîner des outils d'intelligence artificielle, révèle un article que vient de publier le magazine américain. .

Selon la publication, plus de 170 000 titres auraient été intégrés dans des modèles gérés par des sociétés comme Meta et Bloomberg , contribuant ainsi involontairement à un formidable ensemble de données exploitées par les entreprises pour créer leurs outils d'intelligence artificielle.

La bibliothèque Books3 a été utilisée pour entraîner LLaMA, l'un des nombreux grands modèles de langage – bien que le plus connu soit ChatGPT d'OpenAI – conçu pour générer du contenu basé sur des modèles identifiés dans des exemples de textes. L'ensemble de données a également été utilisé pour former le BloombergGPT de Bloomberg , le GPT-J d'EleutherAI et est « susceptible » d'avoir été utilisé dans d'autres modèles d'IA, selon une étude de The Atlantic .

Il y a quelques semaines, des écrivains comme Margaret Atwood, entre autres, ont envoyé une lettre aux entreprises pour les avertir que de nouveaux projets d'intelligence artificielle (IA) exploitent leurs œuvres sans leur consentement et sans respecter les droits d'auteur.

Les titres contenus dans Books3 sont environ un tiers de fiction et deux tiers de non-fiction, la plupart étant publiés au cours des deux dernières décennies. Outre les écrits de Smith , King , Cusk et Ferrante , les œuvres protégées par le droit d'auteur dans l'ensemble de données comprennent 33 livres de Margaret Atwood , au moins neuf de Haruki Murakami , neuf de Bell Hooks , sept de Jonathan Franzen , cinq de Jennifer Egan et cinq de David. Mamie .

Sont également inclus des livres de George Saunders , Junot Diaz , Michael Pollan , Rebecca Solnit et Jon Krakauer , ainsi que 102 romans pulp du fondateur de la Scientologie, L Ron Hubbard, et 90 livres du pasteur John MacArthur.

Les titres proviennent de grands et petits éditeurs, dont plus de 30 000 publiés par Penguin Random House, 14 000 par HarperCollins, 7 000 par Macmillan, 1 800 par Oxford University Press et 600 par Verso.

Stephen King (PHOTO : @StephenKing)

Cela fait suite à un procès intenté le mois dernier par trois écrivains – Sarah Silverman , Richard Kadrey et Christopher Golden – alléguant que leurs œuvres protégées par le droit d'auteur « avaient été copiées et ingérées dans le cadre d'une formation » pour le LLaMA de Meta. L'analyse a révélé que les plaidoiries des trois plaignants font bel et bien partie des Livres3.

OpenAI, la société à l'origine du chatbot IA ChatGPT, a également été accusée d'avoir entraîné son modèle sur les œuvres d'écrivains connus.

Il y a quelques semaines, face à l'avancée non régulée de ces nouvelles technologies qui permettent de « cloner » son propre modèle d'écriture ou celui d'autrui, des écrivains comme la Canadienne Margaret Atwood et les Américains Jonathan Franzen et Nora Roberts ont envoyé une lettre aux entreprises qui les mettent en circulation.

L'IA a été alimentée par au moins 9 livres de Haruki Murakami (AP Photo/Eugene Hoshiko, dossier)

"Il est juste qu'ils nous rémunèrent pour l'utilisation de nos écrits, sans quoi l'IA serait banale et extrêmement limitée", ont argué les signataires du texte, qui ont expliqué que ce développement capable de générer du contenu textuel doit son existence à leurs écrits. : "Ces technologies imitent et régurgitent notre langage, nos histoires, notre style et nos idées. Des millions de livres, d'articles, d'essais et de poésie protégés par le droit d'auteur fournissent de la « nourriture » aux systèmes d'IA, des repas sans fin pour lesquels nous n'avons pas été facturés », exprimaient-ils à l'époque.

Pour sa part, Shawn Presser , le développeur indépendant d'IA qui a initialement créé Books3 , a déclaré que bien qu'il soit sensible aux préoccupations des auteurs, il a créé la base de données afin que chacun puisse développer des outils d'IA générative et ne pas craindre les risques. les grandes entreprises contrôlent la technologie.

Depuis l'apparition d'applications comme ChatGPT, la technologie a pour attribut d'écrire des articles ou des livres, de composer de la musique, de représenter des images à toute vitesse et même de recréer la voix ou l'écriture d'un artiste décédé : ce qui a si longtemps semblé être de la science-fiction et des fictions anticipées. comme Black Mirror est déjà une réalité. Et les risques pour le secteur sont grands, puisque le travail de nombreux acteurs culturels est remplacé par l’IA.

Au cours de la dernière décennie, les auteurs ont subi une baisse de revenus de 40 %. Les écrivains à temps plein ont un revenu médian de 23 000 $ en 2022, ce qui est très peu par rapport aux normes américaines.

Source : Télam SE

Continuer à lire

Lisez aussi

foxconn-annonce-que-lusine-pour-les-superpuces-de-nvidia-est-en-construction-au-mexique
Foxconn annonce que l'usine pour les superpuces de Nvidia est en construction au Mexique.

08.10.2024

taiwan-bat-son-record-dexportations-au-troisieme-trimestre-grace-a-lessor-de-lia
Taïwan bat son record d'exportations au troisième trimestre grâce à l'essor de l'IA.

08.10.2024

le-prix-nobel-de-physique-va-a-hopfield-et-hinton-pour-avoir-contribue-a-lapprentissage-des-machines
Le prix Nobel de physique va à Hopfield et Hinton pour avoir contribué à l'apprentissage des machines.

08.10.2024

© 2025 programmeur.ch - Mentions légales

Abonnez-vous !

Recevez les actualités sur l'intelligence artificielle en avant première.