É bem conhecido que a indústria de IA repousa sobre um terreno legal instável. Empresas como a OpenAI construíram seus negócios de bilhões de dólares sobre grandes quantidades de dados de treinamento, muitos dos quais são provenientes de conteúdos protegidos por direitos autorais. Os criadores desse conteúdo sabem que estão sendo explorados e, cada vez mais, isso está levando a processos judiciais. Recebemos mais um lembrete dessa situação esta semana, quando o Reddit processou a Anthropic pelo uso das postagens dos usuários do Reddit em seus dados de treinamento.
O processo do Reddit, que foi protocolado na quarta-feira, acusa a empresa de IA apoiada pela Amazon de violar seu contrato de usuário. “Desde dezembro de 2021… a Anthropic já estava – sem autorização e em violação direta do Acordo de Usuário do Reddit – treinando Claude com postagens dos usuários do Reddit”, afirma o processo.
A Anthropic, cujo produto principal é o chatbot de IA Claude, tentou se posicionar como o “bom moço” da indústria de IA – uma empresa que segue as regras e avança em estruturas de IA que são consideradas seguras e éticas. Mas, apesar de seu PR de “cavaleiro branco”, a empresa tem enfrentado repetidamente problemas legais que colocam em questão suas supostas práticas comerciais “éticas”. A litígio desta semana é mais um lembrete disso.
O processo acusa a Anthropic de enriquecer injustamente enquanto também viola o contrato do usuário da plataforma. A ação judicial afirma que os bots da empresa visitaram seu site mais de 100.000 vezes desde 2024.
“Este caso é sobre as duas faces da Anthropic: a face pública que tenta se ingratiar na consciência do consumidor com alegações de retidão e respeito por limites e pela lei, e a face privada que ignora quaisquer regras que interfiram em suas tentativas de encher os bolsos”, afirma a litígio. Adiciona que a Anthropic “continua a admitir publicamente que treina suas tecnologias de IA com conteúdo do Reddit”.
Quando contatada para comentar, um porta-voz da Anthropic forneceu a seguinte declaração: “Discordamos das alegações do Reddit e nos defenderemos vigorosamente.”
A guerra sobre o uso de conteúdo de IA se tornou um dos dilemas mais proeminentes da indústria. Plataformas e artistas estão cientes de que seu conteúdo está sendo pilhado em nome da IA, e estão acionando a máquina de processos para lutar de volta. Neste momento, a OpenAI foi processada por tantas pessoas e instituições que é difícil acompanhar tudo – desde Sarah Silverman, Ta-Nehisi Coates, George R. R. Martin e Jonathan Franzen, até o Centro de Jornalismo Investigativo, The Intercept, uma variedade de jornais (incluindo o Denver Post e o Chicago Tribune), e alguns YouTubers. O New York Times está atualmente processando a empresa com base em fundamentos semelhantes.
O Reddit buscou se proteger de ser explorado desenvolvendo contratos com empresas de IA que estipulam claramente uma troca de conteúdo por dinheiro. Em fevereiro passado, o Reddit fechou um acordo com o Google que permitiu ao gigante da tecnologia usar o conteúdo em sua plataforma como combustível para IA, desde que a empresa pagasse 60 milhões de dólares por ano. Não muito tempo depois, um acordo semelhante foi fechado com a OpenAI. A Anthropic parece não ter recebido o recado, mas certamente receberá agora. Cada vez mais, parece que este é o novo modelo para a indústria de IA: Para citar um dos meus programas de TV favoritos, você vai ter que pagar o pedágio do troll se não quiser ser processado. É uma situação que favorece claramente grandes empresas. Empresas de IA com recursos poderão comprar acesso a grandes quantidades de dados para alimentar seus hábitos de IA. Firmas menores, com menos recursos, ficarão sem sorte.