A IA do World Labs pode gerar cenas 3D interativas a partir de uma única foto

O World Labs, a startup fundada pela pioneira em IA Fei-Fei Li, revelou seu primeiro projeto: um sistema de IA que pode gerar cenas 3D semelhantes a jogos de vídeo a partir de uma única imagem.

As cenas geradas pela IA, que qualquer um com um teclado e mouse pode explorar em uma demonstração no site do World Labs, parecem impressionantes — se um pouco cartunescas. Elas são renderizadas ao vivo no navegador e têm uma câmera controlável com um campo de profundidade simulado ajustável (DoF). Quanto mais forte o efeito DoF, mais borrados os objetos de fundo aparecem.

O sistema do World Labs é parte de uma categoria emergente de IA chamada “modelos de mundo”. Muitos desses modelos podem simular jogos e ambientes 3D — mas com problemas de artefatos e consistência. Por exemplo, o modelo de mundo da startup Decart, que simula Minecraft, Oasis, tem uma resolução baixa e rapidamente “esquece” o layout dos níveis.

Em contraste, a abordagem do World Labs garante que as cenas permaneçam as mesmas uma vez geradas, e que obedeçam às leis básicas da física, significando que têm uma sensação de solidez e profundidade.

O sistema do World Labs também pode aplicar efeitos e animações interativas às cenas, como mudar a cor dos objetos e iluminar dinamicamente os fundos.

“A maioria das ferramentas de IA generativa faz conteúdo 2D, como imagens ou vídeos”, escreveu o World Labs em um post no blog. “Gerar em 3D em vez disso melhora o controle e a consistência. Isso mudará a forma como fazemos filmes, jogos, simuladores e outras manifestações digitais do nosso mundo físico.”

Agora, certamente há espaço para melhorias. As cenas do World Labs não são totalmente exploráveis — seus movimentos são limitados a uma pequena área. (Tente se mover para fora dela, e você encontrará um limite.) E há o ocasional erro de renderização, por exemplo, objetos que se misturam de maneiras não naturais.

Mas o World Labs diz que isso é apenas uma “prévia inicial.”

“Estamos trabalhando arduamente para melhorar o tamanho e a fidelidade de nossos mundos gerados e experimentando novas maneiras para os usuários interagirem com eles”, escreveram no blog.

O World Labs, que foi lançado no início deste ano, levantou $230 milhões em capital de risco de investidores, incluindo Andreessen Horowitz (a16z), Ashton Kutcher, Intel Capital, AMD Ventures e Eric Schmidt. Avaliada em mais de $1 bilhão, a empresa espera ter seu primeiro produto pronto em 2025.

Além de cenas interativas, o World Labs planeja construir ferramentas que possam ser úteis para profissionais como artistas, designers, desenvolvedores, cineastas e engenheiros. Está mirando clientes que vão desde desenvolvedores de jogos até estúdios de cinema.

“Já temos a capacidade de criar mundos virtuais e interativos, mas isso custa centenas e centenas de milhões de dólares e um monte de tempo de desenvolvimento”, disse Justin Johnson, cofundador do World Labs, em um episódio recente do podcast a16z. “[Modelos de mundo] permitirão que você não apenas obtenha uma imagem ou um clipe, mas um mundo 3D totalmente simulado, vibrante e interativo.”

Fonte

Compartilhe esse conteúdo: