Estes são os modelos de IA mais quentes, o que eles fazem e como usá-los

Modelos de IA estão sendo produzidos a um ritmo alucinante, por todos, desde grandes empresas de tecnologia como o Google até startups como OpenAI e Anthropic. Acompanhar os mais recentes pode ser esmagador.

Adicionando à confusão, os modelos de IA são frequentemente promovidos com base em benchmarks da indústria. Mas essas métricas técnicas muitas vezes revelam pouco sobre como pessoas e empresas reais realmente os utilizam.

Para cortar o ruído, o TechCrunch compilou uma visão geral dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre como usá-los e para que eles são melhores. Vamos manter esta lista atualizada com os lançamentos mais recentes também.

Existem literalmente centenas de milhares de modelos de IA por aí: HuggingFace, por exemplo, hospeda mais de 900.000. Portanto, esta lista pode perder alguns modelos que apresentam melhor desempenho, de uma forma ou de outra.

Modelos de IA lançados em 2025

OpenAI o3-mini

Este é o mais recente modelo de raciocínio da OpenAI e é otimizado para tarefas relacionadas a STEM, como codificação, matemática e ciência. Não é o modelo mais poderoso da OpenAI, mas, por ser menor, a empresa afirma que é significativamente mais barato. Está disponível gratuitamente, mas requer uma assinatura para usuários frequentes.

OpenAI Deep Research

O Deep Research da OpenAI é projetado para fazer pesquisas aprofundadas sobre um tópico com citações claras. Este serviço está disponível apenas com a assinatura Pro de $200 por mês do ChatGPT. A OpenAI recomenda para tudo, desde ciência até pesquisa de compras, mas cuidado, pois alucinações continuam sendo um problema para a IA.

Mistral Le Chat

A Mistral lançou versões de aplicativo do Le Chat, um assistente pessoal de IA multimodal. A Mistral afirma que o Le Chat responde mais rápido do que qualquer outro chatbot. Também possui uma versão paga com jornalismo atualizado da AFP. Testes do Le Monde encontraram o desempenho do Le Chat impressionante, embora tenha cometido mais erros do que o ChatGPT.

OpenAI Operator

O Operator da OpenAI é destinado a ser um estagiário pessoal que pode fazer coisas de forma independente, como ajudar você a comprar mantimentos. Requer uma assinatura Pro do ChatGPT de $200 por mês. Os agentes de IA têm muito potencial, mas ainda são experimentais: um revisor do Washington Post disse que o Operator decidiu por conta própria pedir uma dúzia de ovos por $31, pago com o cartão de crédito do revisor.

Google Gemini 2.0 Pro Experimental

O tão aguardado modelo principal do Google Gemini afirma que se destaca em codificação e compreensão de conhecimento geral. Também possui uma janela de contexto super longa de 2 milhões de tokens, ajudando usuários que precisam processar rapidamente grandes quantidades de texto. O serviço requer, no mínimo, uma assinatura do Google One AI Premium de $19,99 por mês.

Modelos de IA lançados em 2024

DeepSeek R1

Este modelo de IA chinês tomou o Vale do Silício de assalto. O R1 da DeepSeek se destaca em codificação e matemática, enquanto sua natureza de código aberto significa que qualquer um pode executá-lo localmente. Além disso, é gratuito. No entanto, o R1 integra a censura do governo chinês e enfrenta crescentes proibições por potencialmente enviar dados de usuários de volta à China.

Gemini Deep Research

O Deep Research resume os resultados de pesquisa do Google em um documento simples e bem citado. O serviço é útil para estudantes e qualquer outra pessoa que precise de um resumo rápido de pesquisa. No entanto, sua qualidade não é tão boa quanto um artigo revisado por pares. O Deep Research requer uma assinatura do Google One AI Premium de $19,99.

Meta Llama 3.3 7B

Esta é a versão mais nova e avançada dos modelos de IA Llama de código aberto da Meta. A Meta divulgou esta versão como a mais barata e eficiente até agora, especialmente para matemática, conhecimento geral e seguimento de instruções. É gratuito e de código aberto.

OpenAI Sora

Sora é um modelo que cria vídeos realistas com base em texto. Embora possa gerar cenas inteiras em vez de apenas clipes, a OpenAI admite que muitas vezes gera “física irrealista”. Atualmente, está disponível apenas nas versões pagas do ChatGPT, começando com o Plus, que custa $20 por mês.

Alibaba Qwen QwQ-32B-Preview

Este modelo é um dos poucos que rivaliza com o o1 da OpenAI em certos benchmarks da indústria, destacando-se em matemática e codificação. Ironicamente para um ‘modelo de raciocínio’, ele tem “espaço para melhorias no raciocínio de senso comum”, diz a Alibaba. Também incorpora a censura do governo chinês, mostram os testes do TechCrunch. É gratuito e de código aberto.

Uso de Computador da Anthropic

O Uso de Computador do Claude é destinado a controlar seu computador para completar tarefas como codificação ou reserva de passagens aéreas, tornando-se um predecessor do Operator da OpenAI. O uso de computador, no entanto, permanece em beta. O preço é via API: $0,80 por milhão de tokens de entrada e $4 por milhão de tokens de saída.

Grok 2 da x.AI

A x.AI, a empresa de IA de propriedade de Elon Musk, lançou uma versão aprimorada de seu chatbot Grok 2, que afirma ser “três vezes mais rápido”. Usuários gratuitos estão limitados a 10 perguntas a cada duas horas no Grok, enquanto assinantes dos planos Premium e Premium+ do X desfrutam de limites de uso mais altos. A x.AI também lançou um gerador de imagens, Aurora, que produz imagens altamente fotorealistas, incluindo alguns conteúdos gráficos ou violentos.

OpenAI o1

A família o1 da OpenAI é destinada a produzir melhores respostas ao “pensar” através das respostas por meio de um recurso oculto de raciocínio. O modelo se destaca em codificação, matemática e segurança, afirma a OpenAI, mas também tem problemas em enganar humanos. O o1 requer assinatura do ChatGPT Plus, que custa $20 por mês.

Claude Sonnet 3.5 da Anthropic

O Claude Sonnet 3.5 é um modelo que a Anthropic afirma ser o melhor da categoria. Tornou-se conhecido por suas capacidades de codificação e é considerado o chatbot preferido dos insiders de tecnologia. O modelo pode ser acessado gratuitamente no Claude, embora usuários frequentes precisem de uma assinatura Pro de $20 por mês. Embora possa entender imagens, não consegue gerá-las.

OpenAI GPT 4o-mini

A OpenAI divulgou o GPT 4o-mini como seu modelo mais acessível e rápido até agora, graças ao seu pequeno tamanho. É destinado a permitir uma ampla gama de tarefas, como alimentar chatbots de atendimento ao cliente. O modelo está disponível no nível gratuito do ChatGPT. É mais adequado para tarefas simples de alto volume em comparação com tarefas mais complexas.

Cohere Command R+

O modelo Command R+ da Cohere se destaca em aplicações complexas de Geração Aumentada por Recuperação (ou RAG) para empresas. Isso significa que pode encontrar e citar peças específicas de informação muito bem. (O inventor do RAG na verdade trabalha na Cohere.) No entanto, o RAG não resolve completamente o problema das alucinações da IA. Os modelos da Cohere são para usuários empresariais.

Fonte

Compartilhe esse conteúdo: