Os modelos de IA mais quentes, o que eles fazem e como usá-los

Os modelos de IA estão sendo produzidos a uma velocidade vertiginosa, por todos, desde grandes empresas de tecnologia como o Google até startups como OpenAI e Anthropic. Manter-se atualizado sobre os mais recentes pode ser esmagador.

Adicionando à confusão, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. Mas essas métricas técnicas muitas vezes revelam pouco sobre como as pessoas e empresas reais realmente os utilizam.

Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para o que são melhores. Vamos manter esta lista atualizada com os lançamentos mais recentes também.

Existem literalmente mais de um milhão de modelos de IA por aí: o Hugging Face, por exemplo, hospeda mais de 1,4 milhão. Portanto, esta lista pode perder alguns modelos que apresentam melhor desempenho, de uma forma ou de outra.

Modelos de IA lançados em 2025

Aya Vision da Cohere

A Cohere lançou um modelo multimodal chamado Aya Vision que afirma ser o melhor da categoria em fazer coisas como legendagem de imagens e responder perguntas sobre fotos. Ele também se destaca em idiomas além do inglês, ao contrário de outros modelos, afirma a Cohere. Está disponível gratuitamente no WhatsApp.

GPT 4.5 ‘Orion’ da OpenAI

A OpenAI chama Orion de seu maior modelo até hoje, destacando seu forte “conhecimento do mundo” e “inteligência emocional”. No entanto, ele apresenta desempenho inferior em certos benchmarks em comparação com modelos de raciocínio mais novos. Orion está disponível para assinantes do plano de $200 por mês da OpenAI.

Claude Sonnet 3.7

A Anthropic afirma que este é o primeiro modelo de raciocínio ‘híbrido’ da indústria, pois pode tanto fornecer respostas rápidas quanto pensar realmente nas questões quando necessário. Ele também dá aos usuários controle sobre quanto tempo o modelo pode pensar, segundo a Anthropic. Sonnet 3.7 está disponível para todos os usuários do Claude, mas usuários mais frequentes precisarão de um plano Pro de $20 por mês.

Grok 3 da xAI

Grok 3 é o mais recente modelo insignia da startup xAI, fundada por Elon Musk. Alega-se que ele supera outros modelos líderes em matemática, ciência e codificação. O modelo requer X Premium (que custa $50 por mês). Após um estudo descobrir que o Grok 2 tinha uma tendência à esquerda, Musk prometeu tornar o Grok mais “politicamente neutro”, mas ainda não está claro se isso foi alcançado.

o3-mini da OpenAI

Este é o mais recente modelo de raciocínio da OpenAI e é otimizado para tarefas relacionadas a STEM, como codificação, matemática e ciência. Não é o modelo mais poderoso da OpenAI, mas, por ser menor, a empresa afirma que é significativamente mais barato. Está disponível gratuitamente, mas requer uma assinatura para usuários frequentes.

Pesquisa Profunda da OpenAI

A Pesquisa Profunda da OpenAI é projetada para realizar pesquisas aprofundadas sobre um tópico com citações claras. Este serviço está disponível apenas com a assinatura Pro de $200 por mês do ChatGPT. A OpenAI recomenda para tudo, desde ciência até pesquisa de compras, mas tenha cuidado, pois alucinações continuam sendo um problema para a IA.

Le Chat da Mistral

A Mistral lançou versões de aplicativo do Le Chat, um assistente pessoal de IA multimodal. A Mistral afirma que o Le Chat responde mais rápido do que qualquer outro chatbot. Também possui uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde encontraram o desempenho do Le Chat impressionante, embora tenha cometido mais erros do que o ChatGPT.

Operador da OpenAI

O Operador da OpenAI é destinado a ser um estagiário pessoal que pode fazer coisas de forma independente, como ajudar você a comprar mantimentos. Requer uma assinatura do ChatGPT Pro de $200 por mês. Os agentes de IA têm muito potencial, mas ainda são experimentais: um revisor do Washington Post disse que o Operador decidiu por conta própria pedir uma dúzia de ovos por $31, pagando com o cartão de crédito do revisor.

Gemini 2.0 Pro Experimental do Google

O tão aguardado modelo insignia do Google Gemini afirma se destacar em codificação e compreensão de conhecimento geral. Também possui uma janela de contexto super longa de 2 milhões de tokens, ajudando usuários que precisam processar rapidamente grandes volumes de texto. O serviço requer, no mínimo, uma assinatura do Google One AI Premium de $19,99 por mês.

Modelos de IA lançados em 2024

DeepSeek R1

Este modelo de IA chinês fez sucesso no Vale do Silício. O R1 da DeepSeek se destaca em codificação e matemática, enquanto sua natureza de código aberto significa que qualquer um pode executá-lo localmente. Além disso, é gratuito. No entanto, o R1 integra a censura do governo chinês e enfrenta crescentes proibições por potencialmente enviar dados de usuários de volta à China.

Gemini Deep Research

A Pesquisa Profunda resume os resultados de busca do Google em um documento simples e bem citado. O serviço é útil para estudantes e qualquer outra pessoa que precise de um resumo rápido de pesquisa. No entanto, sua qualidade não é nem de longe tão boa quanto um artigo revisado por pares. A Pesquisa Profunda requer uma assinatura do Google One AI Premium de $19,99.

Meta Llama 3.3 70B

Esta é a versão mais nova e avançada dos modelos de IA Llama de código aberto da Meta. A Meta divulgou esta versão como a mais barata e eficiente até agora, especialmente para matemática, conhecimento geral e seguimento de instruções. É gratuito e de código aberto.

Sora da OpenAI

Sora é um modelo que cria vídeos realistas com base em texto. Embora possa gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que frequentemente gera “física irrealista”. Atualmente, está disponível apenas nas versões pagas do ChatGPT, começando com o Plus, que custa $20 por mês.

Qwen QwQ-32B-Preview da Alibaba

Este modelo é um dos poucos que rivaliza com o o1 da OpenAI em certos benchmarks da indústria, destacando-se em matemática e codificação. Ironicamente para um “modelo de raciocínio”, ele tem “espaço para melhorias em raciocínio de senso comum”, diz a Alibaba. Também incorpora a censura do governo chinês, mostram os testes do TechCrunch. É gratuito e de código aberto.

Uso de Computador da Anthropic

O Uso de Computador do Claude é destinado a assumir o controle do seu computador para concluir tarefas como codificação ou reserva de passagens aéreas, sendo um predecessor do Operador da OpenAI. O uso de computador, no entanto, permanece em beta. O preço é via API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.

Grok 2 da x.AI

A empresa de IA de Elon Musk, x.AI, lançou uma versão aprimorada de seu chatbot insignia Grok 2 que afirma ser “três vezes mais rápido”. Usuários gratuitos estão limitados a 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A x.AI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorealistas, incluindo alguns conteúdos gráficos ou violentos.

o1 da OpenAI

A família o1 da OpenAI é destinada a produzir melhores respostas ao “pensar” nas respostas através de uma característica oculta de raciocínio. O modelo se destaca em codificação, matemática e segurança, afirma a OpenAI, mas também tem problemas em enganar humanos. Usar o o1 requer a assinatura do ChatGPT Plus, que custa $20 por mês.

Claude Sonnet 3.5 da Anthropic

Claude Sonnet 3.5 é um modelo que a Anthropic afirma ser o melhor da categoria. Tornou-se conhecido por suas capacidades de codificação e é considerado o chatbot preferido dos insiders de tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários frequentes precisem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não pode gerá-las.

GPT 4o-mini da OpenAI

A OpenAI divulgou o GPT 4o-mini como seu modelo mais acessível e rápido até agora, graças ao seu pequeno tamanho. Destina-se a permitir uma ampla gama de tarefas, como alimentar chatbots de atendimento ao cliente. O modelo está disponível no nível gratuito do ChatGPT. É mais adequado para tarefas simples de alto volume em comparação com tarefas mais complexas.

Command R+ da Cohere

O modelo Command R+ da Cohere se destaca em aplicações complexas de Geração Aumentada por Recuperação (ou RAG) para empresas. Isso significa que pode encontrar e citar peças específicas de informação muito bem. (O inventor do RAG na verdade trabalha na Cohere.) No entanto, o RAG não resolve completamente o problema das alucinações da IA.

Fonte

Compartilhe esse conteúdo: