Uma startup está treinando um modelo de IA que afirma permitir que criadores gerem mundos cinematográficos, com controle total sobre a paisagem, personagens, iluminação e movimento. Como? Fazendo com que humanos coloquem câmeras em suas costas e caminhem pelo mundo.
Odyssey, fundada pelos pioneiros da direção autônoma Oliver Cameron e Jeff Hawke (Cameron foi anteriormente vice-presidente de produto na Cruise), diz que criou um ‘sistema avançado de captura de câmeras’ que pode coletar dados em quase qualquer lugar que uma pessoa possa alcançar. Pesando cerca de 25 quilos, o sistema contém seis câmeras, dois sensores lidar e uma unidade de medição inercial.
Com uma aparência semelhante ao Trekker do Google Street View, o sistema pode capturar seu entorno em ‘resolução de 3,5K’ e 360 graus, com informações de profundidade ‘precisas em física’ anexadas como metadados.
Então, qual é o objetivo? Bem, a Odyssey diz que está pegando os dados do sistema e alimentando-os em algoritmos para ‘capturar os detalhes finos que compõem nosso mundo.’ Essencialmente, a empresa está gerando reconstruções digitais de cenas do mundo real — cenas com florestas, cavernas, trilhas, praias, geleiras, parques, edifícios e assim por diante.
Uma das cenas recriadas da Odyssey. Créditos da imagem: Odyssey
Agora, não está totalmente claro como essas reconstruções se traduzirão em melhores ferramentas generativas para criativos. Mesmo os melhores ‘modelos de mundo’ hoje têm limitações, e a Odyssey não afirma ter resolvido todas elas.
No entanto, está levantando recursos para seguir em frente. A Odyssey anunciou hoje que garantiu 18 milhões de dólares em uma rodada de financiamento da Série A liderada pela EQT Ventures, com participação da GV e Air Street Capital. O novo dinheiro, que eleva o total arrecadado pela empresa para 27 milhões de dólares, será usado para expandir as operações de coleta de dados da Odyssey na Califórnia.
A Odyssey planeja expandir sua coleta de dados para outros estados e países no futuro — espera-se que isso ocorra com proteções de privacidade em vigor. (A equipe do Google Street View, por exemplo, já se viu no alvo de reguladores por capturar imagens de cenas cotidianas que violavam a privacidade das pessoas.)
‘Acreditamos que será impossível para modelos generativos gerarem mundos de qualidade de Hollywood que pareçam vivos sem treinar em um vasto volume de dados 3D multimodais ricos do mundo real,’ escreveu a empresa em uma postagem em seu blog. ‘Acreditamos que um modelo avançado de construção de mundos generativos desbloqueará uma maneira melhor de criar filmes, jogos e mais.’