A Nvidia anunciou que seu Nvidia AI Blueprint tornará fácil para desenvolvedores de qualquer setor construir agentes de IA para analisar conteúdo de vídeo e imagem.
Com essa tecnologia, a Nvidia afirmou que qualquer setor agora pode pesquisar e resumir vastos volumes de dados visuais.
Accenture, Dell e Lenovo estão entre as empresas que utilizam o novo Nvidia AI Blueprint para desenvolver agentes de IA visual que podem aumentar a produtividade, otimizar processos e criar espaços mais seguros.
Empresas e organizações do setor público em todo o mundo estão desenvolvendo agentes de IA para aumentar as capacidades de forças de trabalho que dependem de informações visuais de um número crescente de dispositivos — incluindo câmeras, sensores IoT e veículos.
Para apoiar seu trabalho, um novo Nvidia AI Blueprint para busca e resumação de vídeo permitirá que desenvolvedores de praticamente qualquer setor construam agentes de IA visual que analisam conteúdo de vídeo e imagem. Esses agentes podem responder a perguntas dos usuários, gerar resumos e permitir alertas para cenários específicos.
Parte do Nvidia Metropolis, um conjunto de ferramentas para desenvolvedores de aplicativos de IA de visão, o blueprint é um fluxo de trabalho personalizável que combina tecnologias de visão computacional e IA generativa da Nvidia.
Integradores de sistemas globais e provedores de soluções de tecnologia, incluindo Accenture, Dell e Lenovo, estão levando o Nvidia AI Blueprint para busca e resumação visual a empresas e cidades em todo o mundo, impulsionando a próxima onda de aplicativos de IA que podem ser implantados para aumentar a produtividade e a segurança em fábricas, armazéns, lojas, aeroportos, interseções de tráfego e muito mais.
Anunciado antes do Smart City Expo World Congress, o Nvidia AI Blueprint oferece aos desenvolvedores de computação visual um conjunto completo de software otimizado para construir e implantar agentes impulsionados por IA generativa que podem ingerir e entender volumes massivos de fluxos de vídeo ao vivo ou arquivos de dados.
Os usuários podem personalizar esses agentes de IA visual com prompts de linguagem natural, em vez de código de software rígido, reduzindo a barreira para implantar assistentes virtuais em vários setores e aplicações de cidades inteligentes.
O Nvidia AI Blueprint aproveita modelos de linguagem visual.
Agentes de IA visual são alimentados por modelos de linguagem visual (VLMs), uma classe de modelos de IA generativa que combinam visão computacional e compreensão de linguagem para interpretar o mundo físico e realizar tarefas de raciocínio.
O Nvidia AI Blueprint para busca e resumação de vídeo pode ser configurado com microsserviços Nvidia NIM para VLMs como Nvidia VILA, LLMs como Llama 3.1 405B da Meta e modelos de IA para perguntas e respostas aceleradas por GPU e geração aumentada de recuperação contextual.
Os desenvolvedores podem facilmente trocar outros VLMs, LLMs e bancos de dados em gráfico e ajustá-los usando a plataforma Nvidia NeMo para seus ambientes e casos de uso exclusivos.
A adoção do Nvidia AI Blueprint pode economizar meses de esforço dos desenvolvedores na investigação e otimização de modelos de IA generativa para aplicações de cidades inteligentes.
Implantado em GPUs da Nvidia na borda, em instalações ou na nuvem, pode acelerar vastamente o processo de análise de arquivos de vídeo para identificar momentos chave.
Em um ambiente de armazém, um agente de IA construído com esse fluxo de trabalho poderia alertar os trabalhadores se os protocolos de segurança forem violados. Em interseções movimentadas, um agente de IA poderia identificar colisões de trânsito e gerar relatórios para auxiliar os esforços de resposta de emergência. E no campo da infraestrutura pública, trabalhadores de manutenção poderiam pedir a agentes de IA que revisassem imagens aéreas e identificassem estradas, trilhos de trem ou pontes degradadas para apoiar a manutenção proativa.
Além de espaços inteligentes, agentes de IA visual também poderiam ser usados para resumir vídeos para pessoas com deficiência visual, gerar automaticamente recapitulações de eventos esportivos e ajudar a rotular imensos conjuntos de dados visuais para treinar outros modelos de IA.
O fluxo de trabalho de busca e resumação de vídeo se junta a uma coleção de Nvidia AI Blueprints que facilitam a criação de avatares digitais impulsionados por IA, construção de assistentes virtuais para atendimento ao cliente personalizado e extração de insights empresariais de dados em PDF.
Os Nvidia AI Blueprints são gratuitos para os desenvolvedores experimentarem e baixarem, e podem ser implantados em produção em data centers acelerados e nuvens com o Nvidia AI Enterprise, uma plataforma de software de ponta a ponta que acelera pipelines de ciência de dados e simplifica o desenvolvimento e a implantação de IA generativa.
Agentes de IA para fornecer insights de armazéns a capitais do mundo.
Clientes do setor empresarial e público também podem aproveitar toda a coleção de Nvidia AI Blueprints com a ajuda do ecossistema de parceiros da Nvidia.
A Accenture, uma empresa global de serviços profissionais, integrou os Nvidia AI Blueprints em seu Accenture AI Refinery, que é construído sobre o Nvidia AI Foundry e permite que os clientes desenvolvam modelos de IA personalizados treinados com dados empresariais.
Integradores de sistemas globais no Sudeste Asiático — incluindo ITMAX na Malásia e FPT no Vietnã — estão construindo agentes de IA baseados no Nvidia AI Blueprint de busca e resumação de vídeo para aplicações de cidades inteligentes e transporte inteligente.
Os desenvolvedores também podem construir e implantar Nvidia AI Blueprints nas plataformas de IA da Nvidia com computação, redes e software fornecidos por fabricantes globais de servidores. Os Nvidia AI Blueprints estão incorporados na Dell AI Factory com a Nvidia e nas soluções de IA híbridas da Lenovo.
Empresas como a K2K, um provedor de aplicações de cidades inteligentes no ecossistema Nvidia Metropolis, usarão o novo Nvidia AI Blueprint para construir agentes de IA que analisam câmeras de tráfego ao vivo em tempo real. Isso permitirá que funcionários da cidade façam perguntas sobre a atividade nas ruas e recebam recomendações sobre maneiras de melhorar as operações. A empresa também está trabalhando com gerentes de tráfego da cidade de Palermo, na Itália, para implantar agentes de IA visuais usando microsserviços NIM e Nvidia AI Blueprints.
A Nvidia falará mais sobre isso no Smart Cities Expo World Congress, que ocorre em Barcelona até 7 de novembro.