Amazon lança a família de modelos Nova AI para gerar texto, imagens e vídeos

Como uma das maiores empresas de tecnologia do mundo, a posição da Amazon na corrida de IA generativa tem se concentrado principalmente na construção de suas ferramentas e plataformas para desenvolvedores — além de fornecer financiamento significativo para a startup Anthropic.

Mas não mais: como anunciado hoje pelo CEO Andy Jassy na conferência anual re:Invent da Amazon Web Services (AWS), o gigante do comércio eletrônico está lançando uma nova família de modelos de IA chamada Nova, que permite aos usuários gerar texto, imagens e vídeos — colocando-a em competição direta com nomes como OpenAI, Google e até mesmo seu próprio investimento Anthropic.

Vários dos novos modelos — incluindo as ofertas de texto, imagem e vídeo — supostamente estarão disponíveis hoje (embora, atualmente, o link fornecido no comunicado de imprensa da Amazon leve a uma página de erro), com um modelo de geração de áudio para áudio previsto para 2025.

Super nova

A suíte Amazon Nova introduz vários modelos adaptados a casos de uso específicos, todos suportando mais de 200 idiomas:
• Amazon Nova Micro: Um modelo apenas de texto otimizado para respostas de baixa latência a um custo mínimo.
• Amazon Nova Lite: Um modelo multimodal que oferece processamento rápido para texto, imagens e vídeos a um custo muito baixo.
• Amazon Nova Pro: Um modelo multimodal que combina precisão, velocidade e eficiência de custo, projetado para uma ampla gama de tarefas.
• Amazon Nova Premier: O modelo multimodal mais avançado para tarefas de raciocínio complexo e para destilar modelos personalizados (lançamento no primeiro trimestre de 2025).
• Amazon Nova Canvas: Um modelo avançado de geração de imagens para desenvolvimento de conteúdo criativo.
• Amazon Nova Reel: Um modelo de geração de vídeo de última geração que oferece capacidades dinâmicas.

Todos os modelos suportam ajuste fino e destilação de conhecimento, permitindo que os clientes adaptem as ferramentas de IA aos seus dados proprietários para melhorar a precisão e o desempenho.

Esses modelos se destacam no suporte à Geração Aumentada por Recuperação (RAG), que fundamenta as saídas em dados organizacionais específicos para aumentar a confiabilidade.

Uma tela de imagem e controles de câmera complexos

Os modelos Nova Canvas e Reel destacam o impulso da Amazon na geração de conteúdo criativo:
• Nova Canvas: Os usuários podem editar imagens por meio de prompts de texto em linguagem natural e ajustar layouts ou esquemas de cores. Medidas de segurança integradas, como marca d’água e moderação de conteúdo, garantem o uso responsável da IA.
• Nova Reel: Este modelo de geração de vídeo suporta recursos avançados, incluindo controles de movimento de câmera como panorâmica, zoom e rotações de 360 graus. Permite a criação de vídeos dinâmicos de seis segundos, com funcionalidades adicionais esperadas no futuro.

Avaliações humanas validaram as capacidades do modelo. O Nova Reel superou o Gen-3 Alpha da Runway em testes A/B, alcançando taxas de vitória de 61,4% para qualidade de vídeo e 71,6% para consistência de vídeo.

Integrado com Bedrock (óbvio)

Não surpreendentemente, os modelos Amazon Nova estão profundamente integrados com seu serviço gerenciado Bedrock, que simplifica o acesso a modelos de IA de alto desempenho por meio de uma única API.

Os clientes podem usar esta plataforma para experimentar, avaliar e implantar modelos Nova ou outros modelos fundamentais disponíveis no Bedrock.

Há também opções para ajuste fino e destilação, permitindo que os usuários adaptem os modelos às suas necessidades específicas.

Projetado para marcas

Rohit Prasad, Vice-Presidente Sênior de Inteligência Artificial Geral da Amazon, observou que o Amazon Nova foi projetado para abordar desafios comuns enfrentados por desenvolvedores de aplicativos.

Os modelos oferecem avanços em latência, custo-efetividade e fundamentação de informações, proporcionando soluções flexíveis e poderosas para clientes internos e externos.

Marcas que utilizam as ferramentas Amazon Nova em publicidade relataram melhorias significativas, incluindo um aumento de cinco vezes no número de produtos anunciados e uma duplicação das imagens por produto.

Essas ferramentas também permitem que os anunciantes explorem novas estratégias, como otimização criativa em nível de palavra-chave e publicidade em vídeo.

Mais por vir

A Amazon anunciou planos para expandir a família Nova em 2025 com dois modelos adicionais:
• Um modelo de áudio para áudio para interações verbais naturais e semelhantes às humanas.
• Um modelo de qualquer para qualquer modalidade que pode processar e gerar texto, imagens, áudio e vídeo, permitindo tradução e edição sem costura entre modalidades.

A Amazon enfatiza a segurança e a transparência com proteções integradas em todos os modelos Nova. A empresa introduziu os AWS AI Service Cards, oferecendo documentação clara sobre casos de uso, limitações e práticas responsáveis de IA. Recursos como marca d’água e moderação de conteúdo estão embutidos para garantir conformidade com padrões éticos.

Amazon Nova representa um passo significativo na jornada de IA da empresa, trazendo ferramentas inovadoras de IA generativa para empresas e indivíduos. À medida que essas ferramentas se tornam mais amplamente disponíveis, a Amazon continua a priorizar a entrega de valor real para seus clientes.

Fonte

Compartilhe esse conteúdo: