Em um erro surpreendente, engenheiros da OpenAI acidentalmente apagaram evidências críticas coletadas pelo The New York Times e outros jornais importantes em seu processo judicial sobre dados de treinamento de IA, de acordo com um documento apresentado ao tribunal na quarta-feira.
As equipes jurídicas dos jornais passaram mais de 150 horas examinando os dados de treinamento da IA da OpenAI para encontrar instâncias em que seus artigos de notícias foram incluídos, afirma o documento. Mas não explica como esse erro ocorreu ou o que exatamente os dados incluíam. Embora o documento diga que a OpenAI admitiu o erro e tentou recuperar os dados, o que foi recuperado era incompleto e não confiável — portanto, o que foi recuperado não pode ajudar a rastrear adequadamente como os artigos das organizações de notícias foram usados na construção dos modelos de IA da OpenAI. Enquanto os advogados da OpenAI caracterizaram a exclusão dos dados como um “glitch”, os advogados do The New York Times observaram que não tinham “nenhuma razão para acreditar” que foi intencional.
A The New York Times Company lançou essa batalha histórica em dezembro passado, alegando que a OpenAI e seu parceiro Microsoft construíram suas ferramentas de IA “copiando e usando milhões” dos artigos da publicação e agora “competem diretamente” com seu conteúdo como resultado. A publicação está pedindo que a OpenAI seja responsabilizada por “bilhões de dólares em danos estatutários e reais” por supostamente copiar suas obras.
O Times já gastou mais de US$ 1 milhão lutando contra a OpenAI no tribunal — uma taxa significativa que poucos editores podem igualar. Enquanto isso, a OpenAI fechou acordos com grandes veículos como Axel Springer, Conde Nast e a empresa-mãe da Verge, Vox Media, sugerindo que muitos editores preferem fazer parceria a lutar.
A OpenAI se recusou a se juntar ao The New York Times para apresentar a atualização ao tribunal. Esta declaração foi apresentada por Jennifer Maisel, uma advogada que representa as organizações de notícias, para notificar formalmente o tribunal sobre o que aconteceu.
Em um e-mail para a Verge, o porta-voz da OpenAI, Jason Deutrom, disse que a empresa discorda das caracterizações feitas e apresentará sua própria resposta em breve. O The New York Times recusou o pedido da Verge para comentar.