Você quer um robô humanoide?
OK, isso não é um teste. Os robôs estão vindo. A Nvidia anunciou um portfólio de tecnologias para supercarregar o desenvolvimento de robôs humanoides, incluindo o Nvidia Isaac GR00T N1, o primeiro modelo de fundação totalmente personalizável e aberto para raciocínio e habilidades humanoides generalizados.
As outras tecnologias incluem frameworks de simulação e blueprints, como o Nvidia Isaac GR00T Blueprint para gerar dados sintéticos, bem como Newton, um motor de física de código aberto – em desenvolvimento com o Google DeepMind e a Disney Research – projetado para o desenvolvimento de robôs.
Disponível agora, o GR00T N1 é o primeiro de uma família de modelos totalmente personalizáveis que a Nvidia irá pré-treinar e liberar para desenvolvedores de robótica em todo o mundo – acelerando a transformação de indústrias desafiadas por escassez global de mão de obra estimada em mais de 50 milhões de pessoas.
“A era da robótica generalista chegou”, disse Jensen Huang, fundador e CEO da Nvidia, em um comunicado. “Com o Nvidia Isaac GR00T N1 e novos frameworks de geração de dados e aprendizado de robôs, desenvolvedores de robótica em todos os lugares abrirão a próxima fronteira na era da IA.”
A empresa revelou a notícia durante o discurso de abertura de Huang no evento GTC 2025.
“Isso pode ser a maior indústria de todas”, disse Huang.
Ele observou que o aprendizado por reforço e recompensas verificáveis (na forma de física) impulsionarão a tecnologia robótica para frente.
“Precisamos de um motor de física projetado para corpos flexíveis e rígidos de forma detalhada”, disse ele. “Precisamos que seja acelerado por GPU para que esses virtuais possam viver em tempo super linear.”
O Nvidia GR00T gera dados sintéticos para robôs.
O modelo de fundação GR00T N1 apresenta uma arquitetura de sistema duplo, inspirada em princípios da cognição humana. “O Sistema 1” é um modelo de ação de pensamento rápido, refletindo reflexos ou intuição humana. “O Sistema 2” é um modelo de pensamento lento para tomada de decisões deliberadas e metódicas.
Movido por um modelo de linguagem visual, o Sistema 2 raciocina sobre o ambiente e as instruções que recebeu para planejar ações. O Sistema 1 então traduz esses planos em movimentos robóticos precisos e contínuos. O Sistema 1 é treinado com dados de demonstração humana e uma quantidade massiva de dados sintéticos gerados pela plataforma Nvidia Omniverse.
GR00T N1 pode facilmente generalizar em tarefas comuns – como agarrar, mover objetos com uma ou ambas as mãos e transferir itens de um braço para outro – ou realizar tarefas em várias etapas que requerem contexto longo e combinações de habilidades gerais. Essas capacidades podem ser aplicadas em casos de uso como manuseio de materiais, embalagem e inspeção.
Desenvolvedores e pesquisadores podem pós-treinar o GR00T N1 com dados reais ou sintéticos para seu robô humanoide ou tarefa específica.
Em sua apresentação no GTC, Huang demonstrou o robô humanoide 1X realizando autonomamente tarefas domésticas usando uma política pós-treinada construída sobre o GR00T N1. As capacidades autônomas do robô são o resultado de uma colaboração de treinamento de IA entre a 1X e a Nvidia.
“O futuro dos humanoides é sobre adaptabilidade e aprendizado”, disse Bernt Børnich, CEO da 1X Technologies, em um comunicado. “O modelo GR00T N1 da Nvidia fornece um grande avanço para o raciocínio e habilidades robóticas. Com uma quantidade mínima de dados de pós-treinamento, conseguimos implantar totalmente no NEO Gamma – avançando nossa missão de criar robôs que não são ferramentas, mas companheiros que podem ajudar os humanos de maneiras significativas e imensuráveis.”
Entre os desenvolvedores de humanoides de destaque em todo o mundo com acesso antecipado ao GR00T N1 estão Agility Robotics, Boston Dynamics, Mentee Robotics e Neura Robotics.
Nvidia, Google DeepMind e Disney Research Focam na Física
O Nvidia Isaac GR00T facilita o design de robôs humanoides.
A Nvidia anunciou uma colaboração com o Google DeepMind e a Disney Research para desenvolver Newton, um motor de física de código aberto que permite que robôs aprendam como lidar com tarefas complexas com maior precisão.
Construído sobre a estrutura Nvidia Warp, o Newton será otimizado para aprendizado de robôs e compatível com frameworks de simulação como o MuJoCo do Google DeepMind e o Nvidia Isaac Lab. Além disso, as três empresas planejam permitir que o Newton use o motor de física da Disney.
Google DeepMind e Nvidia estão colaborando para desenvolver o MuJoCo-Warp, que deve acelerar as cargas de trabalho de aprendizado de máquina em robótica em mais de 70 vezes e estará disponível para desenvolvedores através da biblioteca de código aberto MJX do Google DeepMind, bem como através do Newton.
A Disney Research será uma das primeiras a usar o Newton para avançar sua plataforma de personagens robóticos que alimenta robôs de entretenimento de próxima geração, como os expressivos droides BDX inspirados em Star Wars que se juntaram a Huang no palco durante sua apresentação no GTC.
“Os droides BDX são apenas o começo. Estamos comprometidos em trazer mais personagens à vida de maneiras que o mundo nunca viu antes, e essa colaboração com a Disney Research, Nvidia e Google DeepMind é uma parte chave dessa visão”, disse Kyle Laughlin, vice-presidente sênior da Walt Disney Imagineering Research & Development, em um comunicado. “Essa colaboração nos permitirá criar uma nova geração de personagens robóticos que são mais expressivos e envolventes do que nunca – e se conectar com nossos convidados de maneiras que só a Disney pode.”
A Nvidia e a Disney Research, juntamente com a Intrinsic, anunciaram uma colaboração adicional para construir pipelines OpenUSD e melhores práticas para fluxos de trabalho de dados robóticos.
Mais Dados para Avançar a Pós-treinação em Robótica
Conjuntos de dados grandes, diversos e de alta qualidade são críticos para o desenvolvimento de robôs, mas custosos de capturar. Para humanoides, dados de demonstração humana do mundo real são limitados pelo dia de 24 horas de uma pessoa.
Anunciado hoje, o Nvidia Isaac GR00T Blueprint para a geração de movimento de manipulação sintética ajuda a abordar esse desafio. Construído sobre o Omniverse e os modelos de fundação da Nvidia Cosmos Transfer, o blueprint permite que desenvolvedores gerem quantidades exponencialmente grandes de dados sintéticos de movimento para tarefas de manipulação a partir de um pequeno número de demonstrações humanas.
Usando os primeiros componentes disponíveis para o blueprint, a Nvidia gerou 780.000 trajetórias sintéticas – o equivalente a 6.500 horas, ou nove meses contínuos, de dados de demonstração humana – em apenas 11 horas. Então, combinando os dados sintéticos com dados reais, a Nvidia melhorou o desempenho do GR00T N1 em 40%, em comparação com o uso apenas de dados reais.
Para equipar ainda mais a comunidade de desenvolvedores com dados de treinamento valiosos, a Nvidia está lançando o conjunto de dados GR00T N1 como parte de um conjunto de dados de IA física de código aberto maior – também anunciado na GTC e agora disponível no Hugging Face.
Disponibilidade
Os dados de treinamento e os cenários de avaliação de tarefas do Nvidia GR00T N1 estão agora disponíveis para download no Hugging Face e GitHub. O Nvidia Isaac GR00T Blueprint para a geração de movimento de manipulação sintética também está agora disponível como uma demonstração interativa em build.nvidia.com ou para download no GitHub.
O supercomputador pessoal de IA Nvidia DGX Spark, também anunciado hoje na GTC, fornece aos desenvolvedores um sistema pronto para expandir as capacidades do GR00T N1 para novos robôs, tarefas e ambientes sem extensa programação personalizada. O motor de física Newton deve estar disponível ainda este ano.
Na GTC 2025, a Nvidia realizará sessões do Humanoid Developer Day, incluindo:
● “Uma Introdução à Construção de Robôs Humanoides” para uma análise aprofundada do Nvidia Isaac GR00T;
● “Insights sobre a Plataforma de Personagens Robóticos da Disney” para aprender como a Disney Research redefine a robótica de entretenimento com os droides BDX;
● “Anunciando Mujoco-Warp e Newton: Como o Google DeepMind e a Nvidia estão Supercarregando o Desenvolvimento de Robótica” para uma análise mais profunda dessas novas tecnologias e como o Google implanta modelos de IA para treinar humanoides movidos a IA para tarefas do mundo real.