OpenAI retorna modelos antigos ao ChatGPT enquanto Sam Altman admite lançamento ‘acidentado’ do GPT-5

O cofundador e CEO da OpenAI, Sam Altman, está reconhecendo publicamente grandes problemas no lançamento de ontem do GPT-5, o novo modelo de linguagem grande (LLM) da empresa – anunciado como o mais poderoso e capaz até agora.

Respondendo a perguntas de usuários em um thread de AMA (Pergunte-me Qualquer Coisa) no Reddit e em um post no X esta tarde, Altman admitiu uma série de problemas que interromperam o lançamento do GPT-5, incluindo troca de modelo defeituosa, desempenho ruim e confusão dos usuários – levando a OpenAI a reverter parcialmente algumas de suas mudanças na plataforma e reintegrar o acesso dos usuários a modelos anteriores como o GPT-4o.

“Foi um pouco mais acidentado do que esperávamos,” escreveu Altman em resposta a uma pergunta no Reddit sobre o grande lançamento do GPT-5.

Quanto aos gráficos de desempenho de modelo errôneos exibidos durante a transmissão ao vivo do GPT-5 da OpenAI, Altman disse: “As pessoas estavam trabalhando até tarde e estavam muito cansadas, e o erro humano atrapalhou. Muito se junta para uma transmissão ao vivo nas últimas horas.”

Embora tenha notado que o post do blog e o cartão do sistema estavam precisos, os erros tumultuaram ainda mais um lançamento que já enfrentava o escrutínio de usuários e desenvolvedores iniciais.

Atualizações do lançamento do GPT-5:

* Vamos dobrar os limites de taxa do GPT-5 para usuários do ChatGPT Plus enquanto finalizamos o lançamento.
* Permiteremos que os usuários Plus escolham continuar usando o 4o. Vamos observar o uso enquanto pensamos em por quanto tempo oferecer modelos legados.
* O GPT-5 parecerá mais inteligente começando…

Um motivo chave para os problemas, segundo Altman, decorre do novo “roteador” automático da OpenAI que atribui prompts de usuários a uma das quatro variantes do GPT-5 – regular, mini, nano e pro – com uma opção de “modo de pensamento” para tarefas de raciocínio mais pesadas.

No X, Altman revelou que uma parte chave desse sistema – o troca-modelo – estava “fora de operação por um período do dia,” fazendo com que o GPT-5 parecesse “muito mais burro” do que o pretendido.

Em resposta, a OpenAI disse que está implementando mudanças na fronteira de decisão do modelo e tornará mais transparente qual modelo está respondendo a uma determinada consulta.

Uma atualização da interface do usuário também está a caminho para ajudar os usuários a ativar manualmente o modo de pensamento.

Além disso, Altman confirmou que a OpenAI agora permitirá que usuários do ChatGPT Plus continuem usando o GPT-4o – o modelo padrão anterior – após uma onda de reclamações sobre o desempenho inconsistente do GPT-5. Ele disse no Reddit que a empresa está “tentando coletar mais dados sobre as compensações” antes de decidir por quanto tempo oferecer modelos legados.

No entanto, muitos usuários, incluindo testadores beta da OpenAI, como o professor da Wharton School of Business, Ethan Mollick, expressaram confusão e descontentamento com a atualização unilateral de suas experiências com o ChatGPT para o GPT-5 e a retirada inicial do acesso aos modelos mais antigos.

O desempenho no mundo real fica atrás da hype

Os benchmarks internos da OpenAI podem mostrar o GPT-5 liderando o grupo de LLMs, mas os usuários do mundo real estão compartilhando uma experiência diferente.

Desde o lançamento, os usuários postaram inúmeros exemplos do GPT-5 cometendo erros básicos em matemática, lógica e tarefas de codificação.

O cientista de dados Colin Fraser postou capturas de tela do GPT-5 resolvendo incorretamente se 8.888 repetido é igual a 9 (não é, obviamente), enquanto outro usuário mostrou ele errando um problema simples de álgebra: 5.9 = x + 5.11.

E ainda outros usuários relataram dificuldade em obter respostas precisas para problemas de palavras matemáticas ou usar o GPT-5 para depurar seus próprios gráficos de apresentação.

O feedback dos desenvolvedores não foi muito melhor, com usuários postando imagens do GPT se saindo pior em tarefas de programação “one-shot” – completando bem com um único prompt – em comparação com o novo modelo Claude Opus 4.1 do laboratório de IA Anthropic.

E a empresa de segurança SPLX descobriu que o GPT-5 ainda sofre de vulnerabilidades sérias a injeções de prompt e ataques de lógica ofuscada, a menos que sua camada de segurança seja reforçada.

OpenAI sob os holofotes

Com 700 milhões de usuários semanais no ChatGPT, a OpenAI continua sendo a maior empresa de IA generativa por audiência.

Mas essa escala trouxe dores de crescimento. Altman observou em seu post no X que o tráfego da API dobrou em 24 horas após o lançamento do GPT-5, contribuindo para a instabilidade da plataforma.

Em resposta, a OpenAI disse que dobrará os limites de taxa para usuários do ChatGPT Plus e continuará ajustando a infraestrutura enquanto coleta feedback.

Mas os erros iniciais – somados a mudanças confusas na experiência do usuário e erros em um lançamento de alto perfil – abriram uma janela para que os rivais possam ganhar terreno.

A pressão está sobre a OpenAI para provar que o GPT-5 não é apenas uma atualização incremental, mas um verdadeiro avanço. Com base no lançamento inicial, muitos usuários não estão convencidos – ainda.

Fonte

Compartilhe esse conteúdo: