O Google DeepMind está montando uma nova equipe de pesquisadores em inteligência artificial para desenvolver “modelos de mundo” que podem simular ambientes físicos.
A iniciativa será liderada por Tim Brooks, um ex-co-líder do projeto Sora da OpenAI, que se juntou ao DeepMind em outubro para trabalhar na geração de vídeo do Google e simuladores de mundo.
Modelos de mundo são um desenvolvimento relativamente novo dentro da IA que pode servir a uma variedade de propósitos, como criar ambientes interativos em tempo real para videogames e filmes, e cenários de treinamento realistas para robôs e outros sistemas de IA. Também faz parte do esforço do Google para alcançar um sistema de inteligência geral artificial, ou AGI, antes de seus concorrentes.
“O DeepMind tem planos ambiciosos para criar modelos generativos massivos que simulam o mundo,” anunciou Brooks em uma postagem no X na segunda-feira. Brooks incluiu duas vagas abertas para engenheiros de pesquisa e cientistas que ajudarão a avançar os “modelos de mundo” da IA capazes de simular cenários do mundo real, resolvendo problemas em torno do treinamento “em grande escala”, curando dados de treinamento e estudando como podem ser integrados com modelos de linguagem multimodal.
“Acreditamos que escalar o pré-treinamento em vídeo e dados multimodais está no caminho crítico para a inteligência geral artificial,” disse o DeepMind nas descrições das vagas. “Modelos de mundo alimentarão numerosos domínios, como raciocínio visual e simulação, planejamento para agentes incorporados e entretenimento interativo em tempo real.”
A corrida para ser o primeiro a declarar AGI está esquentando, então o foco do Google aqui não é surpreendente. O CEO da OpenAI, Sam Altman, disse recentemente que a empresa descobriu como alcançar o marco tão buscado pela indústria de tecnologia, e que agentes de IA autônomos podem começar a se juntar de forma significativa às forças de trabalho este ano.
Existem vários concorrentes que já têm uma vantagem sobre o projeto de modelagem do mundo do DeepMind, incluindo a plataforma Cosmos da Nvidia para avançar a IA física, desenvolvimento de veículos autônomos e robôs; e a startup World Labs criada pela “madrinha da IA”, Fei-Fei Li.
A nova equipe do DeepMind trabalhará ao lado de projetos existentes da Google AI, incluindo seus modelos de IA Gemini, o gerador de vídeo Veo e o Genie — o modelo de mundo anterior do Google para simular ambientes 3D jogáveis em tempo real.