Sora, o gerador de vídeo da OpenAI, está sendo lançado hoje — pelo menos para alguns usuários.
O YouTuber Marques Brownlee revelou a notícia em um vídeo publicado em seu canal na manhã de segunda-feira. Brownlee obteve acesso antecipado ao Sora e deu suas impressões iniciais em uma revisão de 15 minutos.
Sora está disponível em Sora.com, disse Brownlee, a página inicial da qual mostra uma rolagem de vídeos gerados recentemente e curados pela OpenAI. (Não estava disponível para nós aqui na TechCrunch até o momento da publicação.) Notavelmente, a ferramenta não está integrada ao ChatGPT, a plataforma de chatbot da OpenAI. O Sora parece ser um produto separado por enquanto.
Os vídeos na página inicial do Sora podem ser salvos para visualização posterior em uma aba “Salvos”, organizados em pastas e clicados para ver quais prompts de texto foram usados para criá-los. O Sora pode gerar vídeos a partir de imagens carregadas, bem como de prompts, de acordo com Brownlee, e editar vídeos existentes originados no Sora.
Usando o recurso “Re-mix”, os usuários podem descrever as mudanças que desejam ver em um vídeo e o Sora tentará incorporá-las em um clipe recém-gerado. O Re-mix tem uma configuração de “força” que permite aos usuários especificar quão drasticamente desejam que o Sora mude o vídeo-alvo, com valores mais altos resultando em vídeos que tomam mais liberdades artísticas.
O Sora pode gerar vídeos em até 1080p, diz Brownlee — mas quanto maior a resolução, mais tempo os vídeos levam para serem gerados. Vídeos em 1080p levam 8 vezes mais tempo do que 480p, a opção mais rápida, enquanto 720p leva 4 vezes mais.
Brownlee disse que o vídeo médio em 1080p levou “alguns minutos” para ser gerado em seus testes. “Isso também é, tipo, agora, quando quase ninguém mais está usando. Eu meio que me pergunto quanto tempo levará quando isso estiver aberto para qualquer um usar.”
Além de gerar clipes únicos, o Sora tem um recurso de “Storyboard” que permite aos usuários juntar prompts para criar uma cena, diz Brownlee. Isso é destinado a ajudar com a consistência, presumivelmente — um ponto fraco notório para geradores de vídeo.
Mas como o Sora se sai? Bem, Brownlee diz que ele sofre dos mesmos defeitos que outras ferramentas por aí, a saber, objetos passando na frente ou atrás de outros de maneiras que não fazem sentido, ou que desaparecem e reaparecem sem razão.
As pernas são outra grande fonte de problemas para o Sora, diz Brownlee. Sempre que uma pessoa ou animal com pernas tem que andar por um longo período em um clipe, o Sora confundirá as pernas dianteiras e traseiras. As pernas “trocariam” de lugar, basicamente, de uma maneira anatomicamente impossível.
O Sora tem uma série de salvaguardas incorporadas, diz Brownlee, e proíbe os criadores de gerar imagens mostrando pessoas com menos de 18 anos, contendo violência ou “temas explícitos”, e que estejam sob direitos autorais pertencentes a outra parte. O Sora também não gerará vídeos a partir de imagens de figuras públicas, personagens reconhecíveis ou logotipos, diz Brownlee, e marca cada vídeo — embora com uma marca d’água visual que pode ser facilmente recortada.
Então, para que serve o Sora? Brownlee achou útil para coisas como slides de título em um certo estilo, animações, abstratos e imagens em stop-motion. Mas ele não o endossaria para nada fotorealista.
“É impressionante que seja um vídeo gerado por IA, mas você pode perceber rapidamente que é um vídeo gerado por IA”, disse ele sobre a maioria dos clipes do Sora. “As coisas ficam realmente estranhas.”