OpenAI agora revela mais sobre o processo de pensamento de seu modelo o3-mini

Em resposta à pressão de rivais, incluindo a empresa chinesa de IA DeepSeek, a OpenAI está mudando a forma como seu mais novo modelo de IA, o o3-mini, comunica seu processo de “pensamento” passo a passo.

Na quinta-feira, a OpenAI anunciou que usuários gratuitos e pagos do ChatGPT, a plataforma de chatbot impulsionada por IA da empresa, verão uma “cadeia de pensamento” atualizada que mostra mais dos passos de “razão” do modelo e como ele chegou às respostas para as perguntas. Assinantes dos planos premium do ChatGPT que utilizam o o3-mini na configuração de “alta razão” também verão essa leitura atualizada, de acordo com a OpenAI.

“Estamos introduzindo uma [cadeia de pensamento] atualizada para o o3-mini projetada para facilitar a compreensão de como o modelo pensa,” disse um porta-voz da OpenAI ao TechCrunch por e-mail. “Com essa atualização, você poderá acompanhar o raciocínio do modelo, proporcionando mais clareza e confiança em suas respostas.”

Modelos de raciocínio como o o3-mini verificam cuidadosamente os fatos antes de fornecer resultados, o que ajuda a evitar algumas armadilhas que normalmente atrapalham os modelos. O trade-off é que os modelos de raciocínio levam um pouco mais de tempo para chegar a soluções — tipicamente segundos a minutos a mais.

O modelo R1 da DeepSeek, um modelo de “raciocínio” na linha do o3-mini, revela todo o seu processo de pensamento, o que muitos pesquisadores de IA argumentam ser a abordagem preferida. Além de tornar o modelo mais fácil de estudar, os passos de raciocínio oferecem uma melhor experiência ao usuário em certas situações, ajudando a indicar quando o modelo pode estar no caminho certo — ou errado.

A OpenAI optou por não mostrar os passos completos de raciocínio para o o3-mini e seus predecessores, o o1 e o o1-mini, em parte devido a razões competitivas. Em vez disso, os usuários viam apenas resumos dos passos de raciocínio — resumos que, às vezes, eram errôneos.

A OpenAI ainda não está mostrando os passos completos de raciocínio do o3-mini, mas a empresa disse que “encontrou um equilíbrio”: o o3-mini pode “pensar livremente” e então organizar seus “pensamentos” em resumos mais detalhados.

“Para melhorar a clareza e a segurança, adicionamos uma etapa de pós-processamento adicional onde o modelo revisa a cadeia de pensamento bruta, removendo qualquer conteúdo inseguro e, em seguida, simplificando ideias complexas,” continuou o porta-voz da OpenAI. “Além disso, essa etapa de pós-processamento permite que usuários não falantes de inglês recebam a cadeia de pensamento em seu idioma nativo, criando uma experiência mais acessível e amigável.”

Em um Reddit AMA na semana passada, Kevin Weil, diretor de produtos da OpenAI, deu a entender que a mudança estava a caminho.

“Estamos trabalhando para mostrar muito mais do que mostramos hoje — [mostrar o processo de pensamento do modelo] será muito, muito em breve,” disse ele. “TBD em tudo — mostrar toda a cadeia de pensamento leva à destilação competitiva, mas também sabemos que as pessoas (pelo menos os usuários avançados) querem isso, então encontraremos a maneira certa de equilibrar isso.”

Fonte

Compartilhe esse conteúdo: