O novo modelo de vídeo gerado por IA do Google já está disponível

Veo, o mais recente modelo de vídeo gerado por IA do Google, já está disponível para as empresas começarem a incorporá-lo em seus processos de criação de conteúdo.

Após ser apresentado pela primeira vez em maio — três meses depois que a OpenAI demonstrou seu produto concorrente Sora — Veo chegou ao mercado primeiro, lançando-se em uma prévia privada através da plataforma Vertex AI do Google.

Veo é capaz de gerar vídeos em resolução 1080p de “alta qualidade” em uma variedade de estilos visuais e cinematográficos a partir de prompts baseados em texto ou imagem. Quando o modelo foi anunciado pela primeira vez, esses clipes gerados poderiam ter vagamente “mais de um minuto” de duração, mas o Google não especifica restrições de comprimento para o lançamento da prévia. Alguns novos clipes de exemplo no anúncio do Google estão à altura do que já vimos do Veo — sem um olhar atento, é extremamente difícil perceber que os vídeos são gerados por IA.

O exemplo do cachorro nesses clipes do Veo é especialmente impressionante — note como o padrão de pelagem e a coleira permanecem consistentes durante seu movimento.

A versão mais recente do gerador de texto para imagem Imagen 3 do Google também estará disponível para todos os clientes do Google Cloud via Vertex “a partir da próxima semana”, expandindo seu lançamento inicial nos EUA na AI Test Kitchen do Google em agosto. Usuários na lista de permissões do Google também podem acessar novos recursos, como edição de fotos baseada em prompts e a capacidade de “infundir sua própria marca, estilo, logotipo, assunto ou características de produto” nas imagens geradas.

No entanto, o Veo não é perfeito — veja como a luz brilha através da mão de alguém no canto superior esquerdo do vídeo de concerto gerado por IA.

O Google afirma que Veo e Imagen 3 possuem salvaguardas integradas para evitar a geração de conteúdo prejudicial ou a violação de proteções de direitos autorais — embora tenhamos descoberto que a última não era difícil de contornar. Tudo produzido pelo Veo e Imagen 3 também é incorporado com a tecnologia SynthID da DeepMind — uma espécie de marca d’água digital invisível que o Google afirma poder “diminuir preocupações com desinformação e atribuição incorreta”. É um conceito semelhante ao sistema de Credenciais de Conteúdo da Adobe, que pode ser incorporado ao conteúdo produzido pelos próprios modelos de IA gerativa de imagem e vídeo da gigante do software criativo.

Com o modelo de vídeo do Google agora disponível, a OpenAI está notavelmente atrás de seus concorrentes e ficando sem tempo para cumprir sua promessa de lançar o Sora até o final de 2024. Já estamos vendo conteúdo gerado por IA aparecendo em anúncios, como a recente campanha de férias da Coca-Cola, e as empresas têm um incentivo para não esperar pelo Sora — de acordo com o Google, 86% das organizações que já utilizam IA generativa estão vendo um aumento na receita.

Fonte

Compartilhe esse conteúdo: