A empresa de IA de Elon Musk, xAI, lança seu mais recente modelo principal, Grok 3

A empresa de IA de Elon Musk, xAI, lançou seu mais recente modelo principal de IA, Grok 3, na noite de segunda-feira, juntamente com novas capacidades no aplicativo Grok para iOS e web.

Grok, a resposta da xAI a modelos como o GPT-4o da OpenAI e o Gemini do Google, pode analisar imagens e responder a perguntas, e alimenta uma série de recursos na rede social de Musk, X. Grok 3, que estava em desenvolvimento há vários meses, foi otimisticamente programado para lançamento em 2024, mas perdeu esse prazo.

A xAI tem usado um enorme centro de dados em Memphis — um centro de dados contendo cerca de 200.000 GPUs — para treinar o Grok 3. Em uma postagem no X, Musk afirmou que o Grok 3 foi desenvolvido com “10x” mais computação do que o Grok 2, seu antecessor, e com um conjunto de dados de treinamento expandido que supostamente inclui documentos de processos judiciais.

“O Grok 3 é uma ordem de magnitude mais capaz do que o Grok 2”, disse Musk durante uma apresentação ao vivo na segunda-feira. “[É uma IA] que busca a verdade ao máximo, mesmo que essa verdade às vezes esteja em desacordo com o que é politicamente correto.”

O Grok 3 é uma família de modelos, para ser preciso — não apenas um. Uma versão menor do Grok 3, Grok 3 mini, responde a perguntas mais rapidamente à custa de alguma precisão. Nem todos os modelos estão disponíveis ainda, mas o lançamento começa na segunda-feira.

A xAI afirma que o Grok 3 supera o GPT-4o em benchmarks, incluindo AIME, que avalia o desempenho de um modelo em uma amostra de perguntas de matemática, e GPQA, que testa modelos com perguntas de física, biologia e química em nível de doutorado. Uma versão inicial do Grok 3 também teve um desempenho competitivo na Chatbot Arena, um teste crowdsourced que coloca diferentes modelos de IA uns contra os outros e tem usuários votando em suas respostas preferidas, de acordo com a xAI.

Duas variações do Grok 3, Grok 3 Reasoning e Grok 3 mini Reasoning, podem “pensar cuidadosamente” sobre problemas, semelhante a modelos de “raciocínio” como o o3-mini da OpenAI e o R1 da empresa chinesa DeepSeek. Os modelos de raciocínio verificam cuidadosamente os fatos antes de fornecer resultados, o que os ajuda a evitar algumas das armadilhas que normalmente atrapalham os modelos.

A xAI afirma que o Grok 3 Reasoning supera a melhor versão do o3-mini — o o3-mini high — em vários benchmarks populares, incluindo um novo benchmark de matemática chamado AIME 2025.

Os modelos de raciocínio podem ser acessados através do aplicativo Grok. Os usuários podem pedir ao Grok 3 para “pensar” ou — para perguntas mais difíceis — aproveitar o modo “Big Brain” para um raciocínio adicional e mais cuidadoso. A xAI descreve os modos como mais adequados para perguntas relacionadas a matemática, ciência e programação.

Musk disse que parte do processo de raciocínio está sendo obscurecido para evitar a destilação, um método usado por desenvolvedores de modelos de IA para extrair conhecimento de outro modelo. Recentemente, a empresa chinesa DeepSeek foi acusada de destilar os modelos da OpenAI para criar o seu próprio.

O modo de raciocínio do Grok se junta a outro novo recurso chamado DeepSearch, a resposta da xAI a ferramentas de “pesquisa profunda” alimentadas por IA, como a Deep Research da OpenAI. O DeepSearch escaneia a internet e o X para analisar informações e entregar um resumo em resposta a uma consulta.

Os assinantes da assinatura Premium+ do X terão acesso ao Grok 3 primeiro, e outros recursos estão bloqueados atrás de uma assinatura que a xAI chama de SuperGrok. Com um preço de $30 por mês ou $300 por ano, o SuperGrok desbloqueia raciocínios adicionais e consultas DeepSearch e inclui geração de imagens ilimitada.

No futuro — em cerca de uma semana — o Grok ganhará um modo de voz, disse Musk. Algumas semanas depois, os modelos Grok 3 chegarão à API da xAI.

Quando Musk anunciou o Grok há cerca de dois anos, ele apresentou a IA como ousada, sem filtros e anti-“woke” — em geral, disposta a responder perguntas controversas que outros sistemas de IA não responderiam. Ele cumpriu parte dessa promessa. Quando solicitado a ser vulgar, por exemplo, o Grok e o Grok 2 obedeceriam alegremente, soltando linguagem colorida que você provavelmente não ouviria do ChatGPT.

Mas os modelos Grok anteriores ao Grok 3 hesitaram em assuntos políticos e não cruzaram certos limites. De fato, um estudo descobriu que o Grok tendia para a esquerda política em tópicos como direitos transgêneros, programas de diversidade e desigualdade.

Musk culpou o comportamento nos dados de treinamento do Grok — páginas da web públicas — e prometeu “mover o Grok mais perto da neutralidade política”. Não está claro ainda se a xAI alcançou esse objetivo.

Fonte

Compartilhe esse conteúdo: