OpenAI accusa il New York Times di "manipolare" ChatGPT

OpenAI accusa il New York Times di "manipolare" ChatGPT

Nodo di origine: 3060947

OpenAI ha risposto al New York Times, affermando che il canale di notizie "ha manipolato intenzionalmente" ChatGPT per "rigurgitare" intere righe dagli articoli della pubblicazione, mentre lo sviluppatore difendeva le sue pratiche in un caso di copyright.

Il 27 dicembre, il Times ha intentato una causa contro OpenAI e il suo principale investitore, Microsoft, presunte violazioni della proprietà intellettuale legate all'uso di milioni dei suoi articoli "unici" per addestrare ChatGPT.

Secondo in base a una richiesta presentata al tribunale distrettuale degli Stati Uniti per il distretto meridionale di New York, il giornale chiede "miliardi di dollari di danni legali ed effettivi" a OpenAI e Microsoft per "copia e utilizzo illegali delle opere di valore unico del Times".

Leggi anche: OpenAI offre agli editori di notizie 1 milione di dollari per formare i suoi LLM utilizzando i loro contenuti

Il giornale “non racconta tutta la storia”

OpenAI ha affermato che la causa è priva di “merito”, secondo a post sul blog pubblicato questa settimana dalla società di intelligenza artificiale, che ha aggiunto che il New York Times “non sta raccontando la storia completa”. Lo sviluppatore ha affermato di aver appreso della causa solo da una notizia pubblicata dal Times pochi giorni dopo Natale.

“Collaboriamo con testate giornalistiche e stiamo creando nuove opportunità. La formazione rientra nel fair use, ma forniamo una possibilità di rinuncia perché è la cosa giusta da fare”, ha scritto OpenAI. Ha affermato che il Times ha adottato l'opzione di rimozione dei contenuti in agosto, ma ha comunque proceduto a fare causa mesi dopo.

Nel suo diritto d'autore Custodie, ha affermato la testata giornalistica ChatGPT aveva “rigurgitato” molti dei suoi articoli: la tendenza dei chatbot basati sull’intelligenza artificiale a sputare interi passaggi “memorizzati” di sezioni specifiche di contenuti o articoli. Il Times vuole che OpenAI distrugga tutti i dati di addestramento e i modelli di intelligenza artificiale che utilizzano il suo materiale protetto da copyright senza consenso.

OpenAI ha spiegato nel suo post sul blog che il rigurgito "è un bug raro che stiamo lavorando per ridurre a zero". Ma l’azienda ha anche accusato il giornale di fare una scelta selettiva di suggerimenti intenzionalmente progettati per innescare il rigurgito piuttosto che il normale utilizzo da parte dei clienti. Ha affermato che gli esempi citati dal Times nella sua causa provengono da vecchi articoli pubblicati su diversi siti di terze parti.

"Sembra che [il Times] abbia intenzionalmente manipolato i suggerimenti, spesso includendo lunghi estratti di articoli, al fine di far rigurgitare il nostro modello", ha affermato la società.

"I nostri modelli in genere non si comportano come insinua il New York Times, il che suggerisce che abbiano istruito il modello a rigurgitare o abbiano scelto i loro esempi da molti tentativi."

Ian Crosby, socio dello studio legale Susman Godfrey, che rappresenta il giornale, detto il Financial Times afferma che "il blog ammette che OpenAI ha utilizzato il lavoro del Times, insieme al lavoro di molti altri, per creare ChatGPT".

Crosby ha aggiunto che non è stato "fair use in alcun modo" il fatto che, come sostiene la causa, OpenAI abbia cercato di "sfruttare gratuitamente il massiccio investimento del Times nel suo giornalismo utilizzandolo per costruire prodotti sostitutivi senza permesso o pagamento".

OpenAI accusa il New York Times di "manipolare" ChatGPT in un caso di copyright

OpenAI accusa il New York Times di "manipolare" ChatGPT in un caso di copyright

Guerre sul copyright dell’IA

ChatGPT è un'intelligenza artificiale generativa gratuita addestrata su miliardi di testo e codice, inclusa l'intera Internet così come esisteva prima del 2021. Dal suo lancio nel novembre 2022, il chatbot è diventato incredibilmente popolare grazie alla sua capacità di eseguire diversi compiti , come scrivere poesie.

Tuttavia, le aziende di intelligenza artificiale come OpenAI si trovano ad affrontare una pressione crescente sull’uso di materiale protetto da copyright per addestrare i loro grandi modelli linguistici. OpenAI e altre società di intelligenza artificiale sostengono che l’elaborazione di grandi quantità di dati, disponibili al pubblico su Internet, costituisce “fair use” ai sensi delle leggi statunitensi sul copyright.

Tuttavia, ciò non ha impedito alle aziende di essere denunciate. A settembre, quasi 20 autori di narrativa statunitensi, tra cui John Grisham, George R.R. Martin e Jodi Picoult, citato in giudizio OpenAI per presunte violazioni del copyright nell'utilizzo del proprio lavoro per addestrare ChatGPT.

A luglio, due scrittori di saggistica hanno intentato una causa simile contro la società, accusando OpenAI di utilizzare i loro libri per addestrare il suo chatbot senza il loro consenso. Anche OpenAI è stata denunciata $3 miliardi per presunto furto di dati. Nel febbraio dello scorso anno, Getty Images ha intentato una causa contro il generatore di immagini AI Stability AI per aver presumibilmente copiato 12 milioni di immagini di Getty per i dati di addestramento.

La causa del New York Times arriva mentre OpenAI sta tentando di concludere accordi con altri editori di notizie per utilizzare i loro contenuti sotto licenza. A dicembre l'azienda ha raggiunto un accordo con l'editore tedesco Axel Springer, del valore di milioni di dollari all’anno, che potrebbe fungere da modello per accordi di natura simile in futuro.

“Consideriamo la causa del New York Times priva di merito. Tuttavia, speriamo in una partnership costruttiva con il New York Times e rispettiamo la sua lunga storia”, ha affermato OpenAI nel suo blog.

Timestamp:

Di più da MetaNotizie