Palestra principal da GTC 2025 da Nvidia: salto de 40x no desempenho de IA, ‘Dynamo’ de código aberto e um robô ‘Azul’ inspirado em Star Wars

SAN JOSE, Califórnia — O CEO da Nvidia, Jensen Huang, subiu ao palco no SAP Center na manhã de terça-feira, com seu casaco de couro intacto e sem teleprompter, para entregar o que se tornou uma das palestras mais aguardadas da indústria de tecnologia. A Conferência de Tecnologia de GPU (GTC) 2025, autodenominada por Huang como o “Super Bowl da IA”, chega em um momento crítico para a Nvidia e o setor de inteligência artificial mais amplo.

“Que ano incrível foi este, e temos muitas coisas incríveis para discutir”, disse Huang à arena lotada, dirigindo-se a um público que cresceu exponencialmente à medida que a IA se transformou de uma tecnologia de nicho em uma força fundamental que remodela indústrias inteiras. As apostas eram particularmente altas este ano após a turbulência do mercado desencadeada pelo lançamento do modelo de raciocínio altamente eficiente R1 da startup chinesa DeepSeek, que fez as ações da Nvidia despencarem no início deste ano, em meio a preocupações sobre a possível redução da demanda por suas GPUs caras.

Nesse contexto, Huang apresentou uma visão abrangente do futuro da Nvidia, enfatizando um roteiro claro para computação em data centers, avanços nas capacidades de raciocínio em IA e movimentos ousados em robótica e veículos autônomos. A apresentação pintou um quadro de uma empresa trabalhando para manter sua posição dominante na infraestrutura de IA enquanto se expande para novos territórios onde sua tecnologia pode criar valor. As ações da Nvidia caíram durante toda a apresentação, fechando mais de 3% mais baixas no dia, sugerindo que os investidores podem ter esperado anúncios ainda mais dramáticos.

Mas se a mensagem de Huang era clara, era esta: a IA não está desacelerando, e a Nvidia também não. Desde chips inovadores até um impulso para a IA física, aqui estão os cinco principais pontos da GTC 2025.

A plataforma Blackwell aumenta a produção com ganho de desempenho de 40x em relação à Hopper

O centro da estratégia de computação em IA da Nvidia, a plataforma Blackwell, agora está em “produção total”, de acordo com Huang, que enfatizou que “a demanda dos clientes é incrível”. Este é um marco significativo após o que Huang havia descrito anteriormente como um “problema” na produção inicial.

Huang fez uma comparação impressionante entre Blackwell e seu antecessor, Hopper: “Blackwell NVLink 72 com Dynamo é 40 vezes o desempenho da fábrica de IA de Hopper”. Esse salto de desempenho é particularmente crucial para cargas de trabalho de inferência, que Huang posicionou como “uma das cargas de trabalho mais importantes na próxima década à medida que escalamos a IA”.

Os ganhos de desempenho chegam em um momento crítico para a indústria, já que modelos de IA de raciocínio como o R1 da DeepSeek exigem substancialmente mais computação do que modelos de linguagem tradicionais. Huang ilustrou isso com uma demonstração comparando a abordagem de um LLM tradicional para um arranjo de assentos em um casamento (439 tokens, mas errado) versus a abordagem de um modelo de raciocínio (quase 9.000 tokens, mas correto).

“A quantidade de computação que temos que fazer em IA é muito maior como resultado da IA de raciocínio e do treinamento de sistemas de IA de raciocínio e sistemas agentes”, explicou Huang, abordando diretamente o desafio colocado por modelos mais eficientes como o da DeepSeek. Em vez de posicionar modelos eficientes como uma ameaça ao modelo de negócios da Nvidia, Huang os enquadrou como impulsionadores de uma demanda aumentada por computação — efetivamente transformando uma potencial fraqueza em uma força.

Arquitetura Rubin de próxima geração revelada com um roteiro claro de vários anos

Em um movimento claramente projetado para dar confiança aos clientes empresariais e provedores de nuvem na trajetória de longo prazo da Nvidia, Huang apresentou um roteiro detalhado para a infraestrutura de computação em IA até 2027. Este é um nível incomum de transparência sobre produtos futuros para uma empresa de hardware, mas reflete os longos ciclos de planejamento exigidos para a infraestrutura de IA.

“Temos um ritmo anual de roteiros que foi elaborado para que você possa planejar sua infraestrutura de IA”, afirmou Huang, enfatizando a importância da previsibilidade para os clientes que fazem investimentos de capital massivos.

O roteiro inclui o Blackwell Ultra, que chegará na segunda metade de 2025, oferecendo 1,5 vezes mais desempenho em IA do que os chips Blackwell atuais. Isso será seguido pelo Vera Rubin, nomeado em homenagem à astrônoma que descobriu a matéria escura, na segunda metade de 2026. Rubin contará com uma nova CPU que é duas vezes mais rápida que a atual CPU Grace, juntamente com uma nova arquitetura de rede e sistemas de memória.

“Basicamente, tudo é totalmente novo, exceto pelo chassi”, explicou Huang sobre a plataforma Vera Rubin.

O roteiro se estende ainda mais para o Rubin Ultra na segunda metade de 2027, que Huang descreveu como uma “escalada extrema” oferecendo 14 vezes mais poder computacional do que os sistemas atuais. “Você pode ver que Rubin vai reduzir os custos tremendamente”, observou, abordando preocupações sobre a economia da infraestrutura de IA.

Esse roteiro detalhado serve como a resposta da Nvidia às preocupações do mercado sobre a concorrência e a sustentabilidade dos investimentos em IA, efetivamente dizendo aos clientes e investidores que a empresa tem um caminho claro a seguir, independentemente de como a eficiência do modelo de IA evolui.

Nvidia Dynamo emerge como o ‘sistema operacional’ para fábricas de IA

Um dos anúncios mais significativos foi o Nvidia Dynamo, um sistema de software de código aberto projetado para otimizar a inferência em IA. Huang descreveu-o como “essencialmente o sistema operacional de uma fábrica de IA”, traçando um paralelo com a forma como data centers tradicionais dependem de sistemas operacionais como VMware para orquestrar aplicativos empresariais.

O Dynamo aborda o complexo desafio de gerenciar cargas de trabalho de IA em sistemas de GPU distribuídos, lidando com tarefas como paralelismo de pipeline, paralelismo de tensor, paralelismo de especialistas, agrupamento em voo, inferência desagregada e gerenciamento de carga de trabalho. Esses desafios técnicos se tornaram cada vez mais importantes à medida que os modelos de IA se tornam mais complexos e as abordagens baseadas em raciocínio exigem mais computação.

O sistema recebe seu nome do dínamo, que Huang observou ser “o primeiro instrumento que iniciou a última Revolução Industrial, a revolução industrial da energia”. A comparação posiciona o Dynamo como uma tecnologia fundamental para a revolução da IA.

Ao tornar o Dynamo de código aberto, a Nvidia está tentando fortalecer seu ecossistema e garantir que seu hardware permaneça a plataforma preferida para cargas de trabalho de IA, mesmo à medida que a otimização de software se torna cada vez mais importante para desempenho e eficiência. Parceiros, incluindo a Perplexity, já estão trabalhando com a Nvidia na implementação do Dynamo.

“Estamos muito felizes que tantos de nossos parceiros estão trabalhando conosco nisso”, disse Huang, destacando especificamente a Perplexity como “um dos meus parceiros favoritos” devido ao “trabalho revolucionário que eles fazem”.

A abordagem de código aberto é um movimento estratégico para manter a posição central da Nvidia no ecossistema de IA, reconhecendo a importância da otimização de software além do desempenho bruto do hardware.

IA física e robótica estão em destaque com o modelo Groot N1 de código aberto

Em um dos momentos mais visualmente impressionantes da palestra, Huang revelou um impulso significativo em robótica e IA física, culminando com a aparição de “Blue”, um robô inspirado em Star Wars que caminhou para o palco e interagiu com Huang.

“Até o final desta década, o mundo terá pelo menos 50 milhões de trabalhadores a menos”, explicou Huang, posicionando a robótica como uma solução para a escassez global de mão de obra e uma enorme oportunidade de mercado.

A empresa anunciou o Nvidia Isaac Groot N1, descrito como “o primeiro modelo de fundação aberto e totalmente personalizável para raciocínio e habilidades humanoides generalizados”. Tornar esse modelo de código aberto representa um movimento significativo para acelerar o desenvolvimento no campo da robótica, semelhante a como LLMs de código aberto aceleraram o desenvolvimento da IA geral.

Juntamente com o Groot N1, a Nvidia anunciou uma parceria com o Google DeepMind e a Disney Research para desenvolver o Newton, um motor de física de código aberto para simulação de robótica. Huang explicou a necessidade de “um motor de física que seja projetado para corpos rígidos e macios muito finos, projetado para ser capaz de treinar feedback tátil e habilidades motoras finas e controles de atuadores”.

O foco na simulação para treinamento de robôs segue o mesmo padrão que se mostrou bem-sucedido no desenvolvimento de direção autônoma, usando dados sintéticos e aprendizado por reforço para treinar modelos de IA sem as limitações da coleta de dados físicos.

“Usando o Omniverse para condicionar o Cosmos, e o Cosmos para gerar um número infinito de ambientes, nos permite criar dados que são fundamentados, controlados por nós e, ainda assim, sistematicamente infinitos ao mesmo tempo”, explicou Huang, descrevendo como as tecnologias de simulação da Nvidia permitem o treinamento de robôs em escala.

Esses anúncios de robótica representam a expansão da Nvidia além da computação tradicional em IA para o mundo físico, potencialmente abrindo novos mercados e aplicações para sua tecnologia.

A parceria com a GM sinaliza um grande impulso em veículos autônomos e IA industrial

Concluindo a estratégia da Nvidia de estender a IA de data centers para o mundo físico, Huang anunciou uma parceria significativa com a General Motors para “construir sua futura frota de carros autônomos”.

“A GM selecionou a Nvidia para ser seu parceiro na construção de sua futura frota de carros autônomos”, anunciou Huang. “A hora dos veículos autônomos chegou, e estamos ansiosos para construir com a GM IA em todas as três áreas: IA para fabricação, para que possam revolucionar a forma como fabricam; IA para empresas, para que possam revolucionar a forma como trabalham, projetam carros e simulam carros; e também IA para dentro do carro”.

Essa parceria é um voto de confiança significativo na tecnologia de veículos autônomos da Nvidia por parte do maior fabricante de automóveis da América. Huang observou que a Nvidia tem trabalhado em carros autônomos por mais de uma década, inspirada pelo desempenho revolucionário do AlexNet em competições de visão computacional.

“O momento em que vi o AlexNet foi um momento inspirador, um momento tão emocionante, que nos fez decidir investir tudo na construção de carros autônomos”, lembrou Huang.

Juntamente com a parceria com a GM, a Nvidia anunciou o Halos, descrito como “um sistema de segurança abrangente” para veículos autônomos. Huang enfatizou que a segurança é uma prioridade que “raramente recebe atenção”, mas que requer tecnologia “desde o silício até os sistemas, o software do sistema, os algoritmos, as metodologias”.

Os anúncios automotivos estendem o alcance da Nvidia de data centers para fábricas e veículos, posicionando a empresa para capturar valor em toda a pilha de IA e em várias indústrias.

O arquiteto do segundo ato da IA: a evolução estratégica da Nvidia além dos chips

A GTC 2025 revelou a transformação da Nvidia de fabricante de GPU para empresa de infraestrutura de IA de ponta a ponta. Através do roteiro Blackwell-Rubin, Huang sinalizou que a Nvidia não abrirá mão de sua dominância computacional, enquanto sua mudança em direção ao software de código aberto (Dynamo) e modelos (Groot N1) reconhece que apenas hardware não pode garantir seu futuro.

A Nvidia reformulou habilmente o desafio de eficiência da DeepSeek, argumentando que modelos mais eficientes impulsionarão uma maior computação geral à medida que o raciocínio em IA se expande — embora os investidores tenham permanecido céticos, fazendo com que as ações caíssem apesar do roteiro abrangente.

O que diferencia a Nvidia é a visão de Huang além do silício. A iniciativa de robótica não se trata apenas de vender chips; trata-se de criar novos paradigmas computacionais que exigem enormes recursos computacionais. Da mesma forma, a parceria com a GM posiciona a Nvidia no centro da transformação da IA automotiva em toda a fabricação, design e veículos em si.

A mensagem de Huang era clara: a Nvidia compete pela visão, não apenas pelo preço. À medida que a computação se estende de data centers para dispositivos físicos, a Nvidia aposta que controlar toda a pilha de IA — do silício à simulação — definirá a próxima fronteira da computação. No mundo de Huang, a revolução da IA está apenas começando, e desta vez, está saindo da sala de servidores.

Fonte

Compartilhe esse conteúdo: