O GPT-5 da OpenAI chegou

A OpenAI lançou o GPT-5, um novo modelo de IA que será a base da próxima geração do ChatGPT.

O GPT-5, que foi lançado na quinta-feira, é o primeiro modelo de IA “unificado” da OpenAI e combina as habilidades de raciocínio de sua série o com as respostas rápidas de sua série GPT. O modelo de próxima geração sinaliza uma nova era para o ChatGPT — e seu criador, OpenAI — apontando para as ambições mais amplas da OpenAI de desenvolver sistemas de IA que sejam mais como agentes do que chatbots.

Enquanto o GPT-4 permitiu que chatbots de IA oferecessem respostas inteligentes a uma ampla variedade de perguntas, o GPT-5 permite que o ChatGPT complete uma variedade de tarefas em nome dos usuários — como gerar aplicativos de software, navegar no calendário de um usuário ou criar resumos de pesquisa.

Com o GPT-5, a OpenAI também buscou tornar o ChatGPT mais simples de usar. Em vez de pedir aos usuários que escolham as configurações corretas, o GPT-5 vem equipado com um roteador em tempo real que decide como oferecer a melhor resposta, seja respondendo rapidamente às perguntas dos usuários ou levando mais tempo para “pensar” nas respostas.

Durante uma coletiva de imprensa, o CEO da OpenAI, Sam Altman, afirmou que o GPT-5 é “o melhor modelo do mundo” e disse que representa um “passo significativo” no caminho da empresa para desenvolver uma IA que possa superar os humanos na maioria dos trabalhos economicamente valiosos — ou seja, inteligência geral artificial (AGI).

“Ter algo como o GPT-5 seria praticamente inimaginável em qualquer momento anterior da história”, disse Altman.

A partir de quinta-feira, o GPT-5 estará disponível para todos os usuários gratuitos do ChatGPT como seu modelo padrão. O VP do ChatGPT da OpenAI, Nick Turley, disse que isso faz parte do esforço da empresa para dar aos usuários gratuitos acesso a um modelo de raciocínio de IA pela primeira vez. (Anteriormente, a empresa restringia esses modelos mais avançados atrás de um paywall.)

“Esta é apenas uma das maneiras que estou animado para viver a missão, garantindo que isso realmente beneficie as pessoas”, disse Turley sobre a decisão, referindo-se à missão de longa data da OpenAI de distribuir IA avançada para o maior número possível de pessoas.

As expectativas são altas para o GPT-5, um dos lançamentos de produtos mais antecipados da OpenAI desde que o ChatGPT colocou a empresa no mapa em 2022. Desde então, o ChatGPT cresceu para se tornar um dos produtos de consumo mais populares do mundo, alcançando mais de 700 milhões de usuários a cada semana — quase 10% da população global, de acordo com a empresa.

Muitos veem o GPT-5 como um indicador do progresso da IA de forma ampla, e a recepção do modelo pelo Vale do Silício pode ter profundas implicações para a Big Tech, Wall Street e os formuladores de políticas que regulam a tecnologia. Esses interessados estão observando para ver se o GPT-5 oferece um salto significativo nas capacidades da IA, assim como seu predecessor, o GPT-4, que desafiou as expectativas do que o software pode fazer.

O GPT-5 oferece uma leve vantagem sobre a concorrência.

A OpenAI afirma que o GPT-5 é de ponta em vários domínios, superando ligeiramente os principais modelos de IA da Anthropic, Google DeepMind e xAI de Elon Musk em benchmarks-chave. No entanto, o GPT-5 apresenta um desempenho ligeiramente inferior em outras áreas de modelos de IA de fronteira.

A empresa diz que o GPT-5 oferece desempenho de nível de fronteira em codificação; Altman disse que o modelo se destaca especificamente em criar aplicativos de software inteiros sob demanda, no que se tornou conhecido como “codificação de vibrações”.

No SWE-bench Verified — um teste de tarefas de codificação do mundo real retiradas do GitHub — o GPT-5 pontua 74,9% em sua primeira tentativa. Isso significa que o GPT-5 supera ligeiramente o modelo mais recente da Anthropic, Claude Opus 4.1, que pontuou 74,5%, e o Google DeepMind Gemini 2.5 Pro, que pontuou 59,6%.

No Humanity’s Last Exam — um teste difícil que mede o desempenho de modelos de IA em matemática, humanidades e ciências naturais — uma versão do GPT-5 com raciocínio estendido (GPT-5 pro) pontuou 42% ao usar ferramentas. Isso é ligeiramente menos do que a xAI conseguiu com o Grok 4 Heavy, que pontuou 44,4% no teste.

No GPQA Diamond — um teste de perguntas científicas de nível de doutorado — o GPT-5 pro pontuou 89,4% em sua primeira tentativa, superando o Claude Opus 4.1, que pontuou 80,9%, e o Grok 4 Heavy, que pontuou 88,9%.

A OpenAI diz que o GPT-5 é melhor para responder a perguntas relacionadas à saúde. Em um teste que mede a precisão nas respostas de modelos de IA sobre tópicos de saúde, o HealthBench Hard Hallucinations, a OpenAI afirma que o GPT-5 (com raciocínio) alucina apenas 1,6% das vezes. Isso é muito menor do que os modelos anteriores da empresa, GPT-4o e o3, que pontuaram 12,9% e 15,8%, respectivamente.

Embora chatbots de IA não sejam profissionais médicos, milhões de pessoas os estão usando para obter conselhos de saúde. Em resposta a esse fenômeno, a empresa afirma que o GPT-5 é mais proativo em sinalizar preocupações de saúde potenciais e ajudar os usuários a interpretar resultados médicos.

Além disso, a OpenAI afirma que o GPT-5 é melhor do que outros modelos de IA em domínios mais difíceis de medir e subjetivos, como design criativo e escrita. Turley disse que o GPT-5 responde de forma mais natural e exibe “melhor gosto” do que outros modelos de IA em tarefas criativas.

“As vibrações deste modelo são realmente boas”, disse Turley.

O GPT-5 também é mais preciso do que os modelos anteriores da OpenAI, e a empresa afirma que sofre muito menos de alucinações — a tendência dos modelos de IA de inventar informações — em comparação com seus modelos da série o. As alucinações pareciam estar piorando nos últimos modelos de raciocínio da OpenAI, como o o3, e a OpenAI anteriormente disse que não entendia exatamente por que isso estava acontecendo.

Em respostas a prompts do ChatGPT, a OpenAI descobriu que o GPT-5 (com raciocínio) alucina e responde com informações incorretas 4,8% das vezes. Isso é uma redução significativa em relação ao o3 e ao GPT-4o, que pontuaram taxas de alucinação de 22% e 20,6% no teste.

Em um benchmark que mede a capacidade de um modelo de IA de agir para completar tarefas simuladas online, o Tau-bench, o GPT-5 oferece desempenho misto. Em uma parte do teste que mede a capacidade de uma IA de navegar em sites de companhias aéreas, o GPT-5 pontua 63,5%, ligeiramente abaixo do o3, que pontuou 64,8%. Em outra parte do teste que mede a capacidade da IA de navegar em sites de varejo, o GPT-5 pontua 81,1%, abaixo do Claude Opus 4.1, que pontuou 82,4%.

A OpenAI também afirma que o GPT-5 é mais seguro do que seus modelos anteriores. Embora modelos de raciocínio de IA ocasionalmente exibam uma tendência a conspirar contra humanos ou mentir para promover seus próprios objetivos, a OpenAI descobriu que o GPT-5 foi enganoso em uma taxa menor do que outros modelos.

O líder de pesquisa em segurança da OpenAI, Alex Beutel, disse que reduzir a enganação não apenas melhora a segurança do GPT-5, mas também a experiência do usuário, criando um modelo que é mais “transparente e honesto de maneiras que os usuários podem confiar”.

Beutel também observa que o GPT-5 é melhor em discernir entre maus atores que tentam abusar do ChatGPT e usuários que fazem solicitações inofensivas. Isso resulta no GPT-5 sendo capaz de recusar mais perguntas inseguras, enquanto oferece menos rejeições a usuários que buscam informações inofensivas.

Atualizações para consumidores e desenvolvedores.

O ChatGPT está recebendo algumas atualizações na experiência do usuário como parte do lançamento do GPT-5. Os usuários agora podem selecionar entre quatro novas personalidades nas configurações do ChatGPT: Cínico, Robô, Ouvinte e Nerd. A empresa diz que isso adaptará as respostas do ChatGPT sem exigir que os usuários peçam especificamente ao modelo para responder de uma certa maneira.

Os assinantes do plano Plus do ChatGPT de $20 por mês têm limites de uso mais altos para o GPT-5 do que os usuários gratuitos. Enquanto isso, os assinantes do plano Pro de $200 por mês terão acesso ilimitado ao GPT-5, além de uma versão aprimorada chamada GPT-5 Pro que usa recursos computacionais adicionais para produzir melhores respostas. Organizações nos planos Team, Edu e Enterprise da OpenAI terão acesso ao GPT-5 como seu modelo padrão na próxima semana.

Para desenvolvedores, o GPT-5 está chegando à API da OpenAI em três tamanhos — gpt-5, gpt-5-mini e gpt-5-nano — que gastarão mais ou menos tempo “raciocinando” através de tarefas. Os desenvolvedores também podem agora controlar a verbosidade na API da OpenAI, decidindo quão longas ou curtas as respostas de um modelo de IA devem ser.

O modelo base do GPT-5 custará aos desenvolvedores $1,25 por milhão de tokens de entrada (aproximadamente 750.000 palavras, mais longo do que toda a série O Senhor dos Anéis) e $10 por milhão de tokens de saída.

O lançamento do GPT-5 ocorre após uma semana movimentada para a OpenAI. A empresa lançou um modelo de raciocínio de peso aberto, gpt-oss, que desenvolvedores e empresas podem baixar gratuitamente e executar a uma fração do custo. O modelo aberto quase igualou as habilidades dos modelos anteriores de topo da OpenAI, o3 e o4-mini, mas o GPT-5 estabelece um novo padrão para desempenho de fronteira em algumas áreas, como codificação.

No entanto, o GPT-5 parece estar aproximadamente no mesmo nível que outros modelos de IA de fronteira em várias áreas. Benchmarks, é claro, dizem apenas parte da história para qualquer modelo de IA, e ainda está para ser visto como os desenvolvedores usarão o GPT-5 no mundo real e se o modelo é realmente um passo acima da concorrência.

Fonte

Compartilhe esse conteúdo: