OpenAI acusa New York Times de 'manipular' ChatGPT

OpenAI acusa New York Times de ‘manipular’ ChatGPT

Nó Fonte: 3060947

A OpenAI respondeu ao The New York Times, dizendo que o meio de comunicação “manipulou intencionalmente” o ChatGPT para “regurgitar” linhas inteiras dos artigos da publicação, enquanto o desenvolvedor defendia suas práticas em um caso de direitos autorais.

Em 27 de dezembro, o Times entrou com uma ação judicial contra a OpenAI e seu principal investidor, Microsoft, alegando violações de propriedade intelectual relacionadas ao uso de milhões de seus artigos “únicos” para treinar o ChatGPT.

Segundo de acordo com um pedido apresentado ao Tribunal Distrital dos EUA para o Distrito Sul de Nova York, o jornal está buscando “bilhões de dólares em danos estatutários e reais” da OpenAI e da Microsoft por “cópia e uso ilegal de obras exclusivamente valiosas do Times”.

Veja também: OpenAI oferece aos editores de notícias US$ 1 milhão para treinar seus LLMs usando seu conteúdo

Jornal ‘não conta a história completa’

OpenAI disse que o processo não tem “mérito”, de acordo com um no blog publicado pela empresa de IA esta semana, acrescentando que o The New York Times “não está contando a história completa”. A desenvolvedora alegou que só soube do processo por meio de uma notícia publicada pelo Times poucos dias depois do Natal.

“Colaboramos com organizações de notícias e estamos criando novas oportunidades. O treinamento é de uso justo, mas oferecemos uma opção de exclusão porque é a coisa certa a fazer”, escreveu OpenAI. Ele disse que o Times adotou a opção de remoção de conteúdo em agosto, mas ainda assim processou meses depois.

Em seus direitos autorais casas, afirmou a organização de notícias ChatGPT havia ‘regurgitado’ muitos de seus artigos – a tendência dos chatbots de IA de cuspir passagens inteiras “memorizadas” de seções específicas de conteúdo ou artigos. O Times quer que a OpenAI destrua quaisquer dados de treinamento e modelos de IA que usem seu material protegido por direitos autorais sem consentimento.

A OpenAI explicou em sua postagem no blog que a regurgitação “é um bug raro que estamos trabalhando para reduzir a zero”. Mas a empresa também acusou o jornal de escolher avisos intencionalmente projetados para desencadear regurgitação, em vez do uso normal do cliente. Afirmou que os exemplos citados pelo Times em seu processo são de artigos antigos publicados em vários sites de terceiros.

“Parece que [o Times] manipulou instruções intencionalmente, muitas vezes incluindo longos trechos de artigos, para fazer nosso modelo regurgitar”, disse a empresa.

“Nossos modelos normalmente não se comportam da maneira que o New York Times insinua, o que sugere que eles instruíram o modelo a regurgitar ou escolheram a dedo seus exemplos em muitas tentativas.”

Ian Crosby, sócio do escritório de advocacia Susman Godfrey, que representa o jornal, disse o Financial Times que “o blog admite que a OpenAI usou o trabalho do The Times, juntamente com o trabalho de muitos outros, para construir o ChatGPT”.

Crosby acrescentou que “não foi um uso justo em qualquer medida” que, como alega o processo, a OpenAI tenha procurado “aproveitar o enorme investimento do The Times em seu jornalismo, usando-o para construir produtos substitutos sem permissão ou pagamento”.

OpenAI acusa New York Times de 'manipular' ChatGPT em caso de direitos autorais

OpenAI acusa New York Times de 'manipular' ChatGPT em caso de direitos autorais

Guerras de direitos autorais de IA

ChatGPT é uma IA generativa gratuita treinada em bilhões de textos e códigos, incluindo toda a Internet como existia antes de 2021. Desde seu lançamento em novembro de 2022, o chatbot se tornou incrivelmente popular graças à sua capacidade de realizar diferentes tarefas , como escrever poesia.

No entanto, empresas de IA como a OpenAI enfrentam uma pressão crescente sobre a utilização de material protegido por direitos de autor para treinar os seus grandes modelos de linguagem. A OpenAI e outras empresas de inteligência artificial argumentam que o processamento de grandes quantidades de dados, que estão disponíveis ao público na Internet, constitui “uso justo” ao abrigo das leis de direitos de autor dos EUA.

Ainda assim, isso não impediu que as empresas fossem processadas. Em setembro, quase 20 autores de ficção norte-americanos, incluindo John Grisham, George R.R. Martin e Jodi Picoult, processou OpenAI sobre supostas violações de direitos autorais ao usar seu trabalho para treinar ChatGPT.

Em julho, dois escritores de não ficção entraram com uma ação semelhante contra a empresa, acusando a OpenAI de usar seus livros para treinar seu chatbot sem o seu consentimento. OpenAI também foi processado por US$ 3 bilhões por suposto roubo de dados. Em fevereiro do ano passado, Getty Images entrou com uma ação judicial contra o gerador de imagens de IA Stability AI por supostamente copiar 12 milhões de imagens do Getty para dados de treinamento.

O processo do New York Times ocorre no momento em que a OpenAI tenta fechar acordos com outras editoras de notícias para usar seu conteúdo sob licença. Em dezembro, a empresa chegou a acordo com a editora alemã Axel Springer, no valor de milhões de dólares por ano, o que poderá servir de modelo para negócios de natureza semelhante no futuro.

“Consideramos o processo do The New York Times sem mérito. Ainda assim, temos esperança de uma parceria construtiva com o The New York Times e respeitamos a sua longa história”, afirmou a OpenAI no seu blog.

Carimbo de hora:

Mais de MetaNotícias