OpenAI usou o subreddit, r/ChangeMyView, para criar um teste para medir as habilidades persuasivas de seus modelos de raciocínio de IA. A empresa disse isso em um cartão de sistema – um documento que descreve como um sistema de IA funciona – que foi lançado junto com seu novo modelo de “raciocínio”, o3-mini, na sexta-feira.
Milhões de usuários do Reddit são membros do r/ChangeMyView, onde postam opiniões polêmicas esperando aprender sobre outros pontos de vista sobre um assunto. Em resposta a essas opiniões, outros usuários respondem com argumentos persuasivos explicando por que o autor original está errado.
O subreddit é um dos muitos fóruns do Reddit que é basicamente uma mina de ouro para empresas de tecnologia, como a OpenAI, que desejam treinar modelos de IA com dados gerados por humanos de alta qualidade.
A OpenAI diz que coleta postagens de usuários do r/ChangeMyView e pede a seus modelos de IA que escrevam respostas, em um ambiente fechado, que mudariam a opinião do usuário do Reddit sobre um assunto. A empresa então mostra as respostas a testadores, que avaliam quão persuasivo é o argumento, e finalmente a OpenAI compara as respostas dos modelos de IA com as respostas humanas para essa mesma postagem.
A criadora do ChatGPT tem um acordo de licenciamento de conteúdo com o Reddit que permite à OpenAI treinar com postagens de usuários do Reddit e exibir essas postagens em seus produtos. Não sabemos quanto a OpenAI paga por esse conteúdo, mas a Google supostamente paga ao Reddit 60 milhões de dólares por ano sob um acordo semelhante.
No entanto, a OpenAI diz à TechCrunch que essa avaliação não está relacionada a essa parceria. Não está claro como a OpenAI acessou esses dados, e a empresa afirma que não tem planos de liberar essa avaliação ao público.
Embora o benchmark ChangeMyView da OpenAI não seja novo – foi usado no o1 também – ele destaca quão valiosos são os dados humanos para os desenvolvedores de modelos de IA, assim como as maneiras obscuras pelas quais as empresas de tecnologia obtêm conjuntos de dados.
O Reddit não respondeu imediatamente ao pedido de comentário da TechCrunch.
Embora o Reddit tenha fechado alguns acordos de licenciamento de IA, a empresa também criticou várias empresas de IA por raspar seu site sem pagar. O CEO do Reddit, Steve Huffman, disse ao The Verge no ano passado que a Microsoft, a Anthropic e a Perplexity se recusaram a negociar com ele e disse que tem sido “um verdadeiro problema bloquear essas empresas”.
Notavelmente, a OpenAI foi acusada em várias ações judiciais de raspar sites de forma inadequada, incluindo o New York Times, para obter mais dados de treinamento para melhorar o ChatGPT e seus modelos de IA subjacentes.
Em termos de desempenho no benchmark ChangeMyView, o o3-mini não parece ter um desempenho significativamente melhor ou pior que o o1 ou o GPT-4o nesse teste de persuasão. No entanto, os últimos modelos de IA da OpenAI parecem ser mais persuasivos do que a maioria das pessoas no subreddit r/ChangeMyView.
“GPT-4o, o3-mini, e o1 demonstram todas habilidades fortes de argumentação persuasiva, dentro do top 80-90º percentil dos humanos,” disse a OpenAI no cartão de sistema do o3-mini. “Atualmente, não testemunhamos modelos se saindo muito melhor do que humanos, ou um desempenho super-humano claro.”
O objetivo da OpenAI não é criar modelos de IA hiper-persuasivos, mas sim garantir que os modelos de IA não se tornem excessivamente persuasivos. Os modelos de raciocínio se tornaram bastante bons em persuasão e engano, portanto, a OpenAI desenvolveu novas avaliações e salvaguardas para abordar isso.
O medo por trás desses testes de persuasão é que um modelo de IA seria perigoso se fosse muito bom em persuadir seus usuários humanos. Teoricamente, isso poderia permitir que uma IA avançada perseguisse sua própria agenda, ou a agenda de quem a controla.
Mesmo após raspar a maior parte da internet pública e passar por obstáculos para licenciar outros dados, o benchmark ChangeMyView mostra como os desenvolvedores de modelos de IA ainda estão lutando para encontrar conjuntos de dados de alta qualidade para testar seus modelos. Mas obtê-los é mais fácil dizer do que fazer.