OpenAI accuse le New York Times de « manipuler » ChatGPT

OpenAI accuse le New York Times de « manipuler » ChatGPT

Nœud source: 3060947

OpenAI a riposté au New York Times, affirmant que le média avait « intentionnellement manipulé » ChatGPT pour « régurgiter » des lignes entières des articles de la publication, alors que le développeur défendait ses pratiques dans une affaire de droit d'auteur.

Le 27 décembre, le Times a intenté une action en justice contre OpenAI et son principal investisseur, Microsoft, alléguant des violations de propriété intellectuelle liées à l'utilisation de millions de ses articles « uniques » pour former ChatGPT.

Selon Suite à un dépôt auprès du tribunal de district américain du district sud de New York, le journal réclame « des milliards de dollars de dommages-intérêts légaux et réels » à OpenAI et à Microsoft pour « copie et utilisation illégales des œuvres d'une valeur unique du Times ».

A lire également: OpenAI offre aux éditeurs de presse 1 million de dollars pour former ses LLM à l'aide de leur contenu

Le journal « ne raconte pas toute l’histoire »

OpenAI a déclaré que le procès était sans « fondement », selon un blog récents publié cette semaine par la société d’IA, qui ajoute que le New York Times « ne raconte pas toute l’histoire ». Le développeur a affirmé qu'il n'avait eu connaissance du procès que grâce à un article publié par le Times quelques jours après Noël.

« Nous collaborons avec des agences de presse et créons de nouvelles opportunités. La formation est un usage équitable, mais nous proposons une possibilité de non-participation parce que c'est la bonne chose à faire », a écrit OpenAI. Il a déclaré que le Times avait adopté l'option de suppression de contenu en août, mais avait néanmoins intenté une action en justice des mois plus tard.

Dans son droit d'auteur maisons, a affirmé l'agence de presse ChatGPT avait « régurgité » nombre de ses articles – la tendance des chatbots IA à recracher des passages entiers « mémorisés » de sections spécifiques de contenu ou d’articles. Le Times souhaite qu'OpenAI détruise toutes les données de formation et tous les modèles d'IA qui utilisent son matériel protégé par le droit d'auteur sans consentement.

OpenAI a expliqué dans son article de blog que la régurgitation « est un bug rare que nous nous efforçons de réduire à zéro ». Mais l'entreprise a également accusé le journal d'avoir sélectionné des invites intentionnellement conçues pour déclencher des régurgitations plutôt que pour une utilisation normale par les clients. Il a déclaré que les exemples cités par le Times dans son procès provenaient d’anciens articles publiés sur plusieurs sites tiers.

"Il semble que [le Times] ait intentionnellement manipulé les invites, comprenant souvent de longs extraits d'articles, afin de faire régurgiter notre modèle", a déclaré la société.

"Nos modèles ne se comportent généralement pas comme le laisse entendre le New York Times, ce qui suggère qu'ils ont soit demandé au modèle de régurgiter, soit sélectionné leurs exemples parmi de nombreuses tentatives."

Ian Crosby, associé du cabinet d'avocats Susman Godfrey, qui représente le journal, dit le Financial Times indique que « le blog admet qu’OpenAI a utilisé le travail du Times, ainsi que celui de nombreux autres, pour créer ChatGPT ».

Crosby a ajouté que le fait que, comme le prétend le procès, OpenAI cherchait à « exploiter gratuitement l’investissement massif du Times dans son journalisme en l’utilisant pour créer des produits de substitution sans autorisation ni paiement » n’était « en aucun cas un usage équitable ».

OpenAI accuse le New York Times de « manipuler » ChatGPT dans une affaire de droit d'auteur

OpenAI accuse le New York Times de « manipuler » ChatGPT dans une affaire de droit d'auteur

Guerres des droits d'auteur sur l'IA

ChatGPT est une IA générative gratuite qui s'entraîne sur des milliards de textes et de codes, y compris sur l'ensemble d'Internet tel qu'il existait avant 2021. Depuis son lancement en novembre 2022, le chatbot est devenu incroyablement populaire grâce à sa capacité à effectuer différentes tâches. , comme écrire de la poésie.

Cependant, les sociétés d’IA comme OpenAI sont confrontées à une pression croissante concernant leur utilisation de matériel protégé par le droit d’auteur pour former leurs grands modèles de langage. OpenAI et d’autres sociétés d’intelligence artificielle soutiennent que le traitement de grandes quantités de données, accessibles au public sur Internet, constitue une « utilisation équitable » au sens des lois américaines sur le droit d’auteur.

Cela n’a toutefois pas empêché les entreprises d’être poursuivies en justice. En septembre, près de 20 auteurs de fiction américains, dont John Grisham, George R.R. Martin et Jodi Picoult, poursuivi OpenAI pour violation présumée du droit d'auteur lors de l'utilisation de son travail pour former ChatGPT.

En juillet, deux auteurs de non-fiction ont intenté une action en justice similaire contre la société, accusant OpenAI d'utiliser leurs livres pour former son chatbot sans leur consentement. OpenAI a également été poursuivi pour 3 milliard de dollars pour vol présumé de données. En février de l'année dernière, Getty Images a intenté une action en justice contre le générateur d’images AI Stability AI pour avoir prétendument copié 12 millions d’images de Getty à des fins de formation.

Le procès du New York Times intervient alors qu'OpenAI tente de conclure des accords avec d'autres éditeurs de presse pour utiliser leur contenu sous licence. En décembre, la société a conclu un accord avec l'éditeur allemand Axel Springer, d'une valeur de plusieurs millions de dollars par an, qui pourrait servir de modèle pour des transactions de même nature à l'avenir.

« Nous considérons le procès du New York Times comme sans fondement. Néanmoins, nous espérons un partenariat constructif avec le New York Times et respectons sa longue histoire », a déclaré OpenAI sur son blog.

Horodatage:

Plus de MétaActualités