Crédito: VentureBeat, gerado com MidJourney
Apenas alguns meses após o lançamento do Gemini 2.0 e a ascensão do DeepSeek, o Google anunciou seu “modelo mais inteligente” até agora, o Gemini 2.5, capaz de raciocínio e com melhor desempenho e precisão.
O Gemini 2.5 vem três meses após o Google ter lançado sua família de modelos anteriormente mais inteligentes, o Gemini 2.0, que introduziu casos de uso de raciocínio e agentes. Este novo modelo está disponível como Gemini 2.5 Pro (experimental) no Google AI Studio e para usuários avançados do Gemini na interface de chat do Gemini. Ele estará disponível no Vertex AI em breve.
Koray Kavukcuoglu, CTO da Google DeepMind, disse em um post no blog que o Gemini 2.5 representa o próximo passo no objetivo do Google de tornar a “IA mais inteligente e mais capaz de raciocínio.”
“Agora, com o Gemini 2.5, alcançamos um novo nível de desempenho ao combinar um modelo base significativamente aprimorado com um pós-treinamento melhorado,” escreveu Kavukcuoglu. “Daqui para frente, estamos incorporando essas capacidades de pensamento diretamente em todos os nossos modelos, para que possam lidar com problemas mais complexos e apoiar agentes ainda mais capazes e cientes do contexto.”
Mais contexto e compreensão
Assim como o Gemini 2.0 e o Gemini 2.0 Flash Thinking, o Gemini 2.5 Pro “pensa” antes de responder. O novo modelo pode lidar com entradas multimodais de texto, áudio, imagens, vídeos e grandes conjuntos de dados. O Gemini 2.5 Pro também pode entender repositórios de código inteiros para projetos de codificação.
O Gemini 2.5 Pro oferece algumas das maiores janelas de contexto disponíveis para modelos experimentais no Gemini. Ele vem com uma janela de contexto de 1 milhão de tokens, mas será expandido para 2 milhões de tokens em breve. O gerente de produto do Google AI Studio, Logan Kilpatrick, postou no X que o Gemini 2.5 Pro é “o primeiro modelo experimental com limites de taxa mais altos + faturamento.”
O Google planeja divulgar os preços para os modelos Gemini 2.5 em breve.
Desempenho aprimorado em codificação e raciocínio
O Google afirmou que o modelo lidera em testes de benchmark de raciocínio avançado. A empresa disse que o Gemini 2.5 Pro “lidera em benchmarks de correspondência e ciência como GPQA e AIME 2025.” Kavukcuoglu disse que o modelo também obteve “um estado da arte de 18,8% entre modelos sem uso de ferramentas no Exame Final da Humanidade,” um conjunto de dados que visa capturar conhecimento e raciocínio humano.
O Gemini 2.5 Pro também se destaca em tarefas de codificação e obteve resultados melhores que o Gemini 2.0 em benchmarks específicos. O Google observou que o novo modelo “se destaca na criação de aplicativos web visualmente atraentes e aplicações de código agente, além de transformação e edição de código.”
Um mercado mais competitivo
O Gemini 2.5 Pro entra na disputa por modelos de raciocínio em um ambiente significativamente alterado em comparação com o Gemini 2.0 em dezembro. O lançamento do modelo de linguagem de raciocínio da DeepSeek, o DeepSeek-R1, mostrou que modelos poderosos podem ter um bom desempenho a uma fração do custo de treinamento e computação. Além disso, a DeepSeek mostrou que modelos de código aberto podem competir com LLMs mais fechados, como os modelos o1 e o3 da OpenAI.
Além das ofertas de modelos em constante expansão da DeepSeek, o Google tem que competir com os modelos de raciocínio da OpenAI. Embora o modelo mais recente da OpenAI tenha sido o GPT-4.5 —não um modelo de raciocínio— a empresa ainda deve desenvolver mais modelos de raciocínio em breve.
O Gemini 2.5 é o segundo novo modelo do Google neste mês. Em março, a empresa lançou a versão mais recente de seu pequeno modelo de linguagem, o Gemma 3, que ofereceu um modelo de contexto de 128.000 tokens e foi o melhor para uso em dispositivos móveis.