ApertureData oferece um aumento de velocidade de 10x para empresas que utilizam dados multimodais

Os dados são o santo graal da IA. Desde startups ágeis até conglomerados globais, organizações em toda parte estão investindo bilhões de dólares para mobilizar conjuntos de dados para aplicações e sistemas de IA altamente performáticos.

Mas, mesmo após todo o esforço, a realidade é que acessar e utilizar dados de diferentes fontes e across várias modalidades—seja texto, vídeo ou áudio—está longe de ser simples. O esforço envolve diferentes camadas de trabalho e integrações, o que muitas vezes leva a atrasos e oportunidades de negócios perdidas.

Entra a ApertureData, com sede na Califórnia. Para enfrentar esse desafio, a startup desenvolveu uma camada de dados unificada, o ApertureDB, que mescla o poder de bancos de dados de grafos e vetores com gerenciamento de dados multimodais. Isso ajuda equipes de IA e dados a levar suas aplicações ao mercado muito mais rápido do que tradicionalmente possível. Hoje, a ApertureData anunciou um financiamento seed de $8,25 milhões juntamente com o lançamento de uma versão nativa em nuvem de seu banco de dados de grafos e vetores.

“O ApertureDB pode reduzir os tempos de infraestrutura de dados e preparação de conjuntos de dados em 6-12 meses, oferecendo um valor incrível para CTOs e CDOs que agora são esperados para definir uma estratégia para a implantação bem-sucedida de IA em um ambiente extremamente volátil com requisitos de dados conflitantes”, disse Vishakha Gupta, fundadora e CEO da ApertureData, ao VentureBeat. Ela observou que a oferta pode aumentar a produtividade das equipes de ciência de dados e ML que constroem IA multimodal em dez vezes, em média.

O que a ApertureData traz à mesa?

Muitas organizações acham que gerenciar sua crescente pilha de dados multimodais—terabytes de texto, imagens, áudio e vídeo diariamente—é um gargalo para aproveitar a IA para ganhos de desempenho.

O problema não é a falta de dados (o volume de dados não estruturados só tem crescido), mas o ecossistema fragmentado de ferramentas necessárias para colocá-los em IA avançada.

Atualmente, as equipes têm que ingerir dados de diferentes fontes e armazená-los em buckets de nuvem—com metadados em evolução contínua em arquivos ou bancos de dados. Então, elas precisam escrever scripts sob medida para pesquisar, buscar ou talvez fazer algum pré-processamento nas informações.

Uma vez que o trabalho inicial é feito, elas têm que integrar bancos de dados de grafos e capacidades de busca e classificação vetorial para entregar a experiência generativa de IA planejada. Isso complica a configuração, deixando as equipes lutando com tarefas significativas de integração e gerenciamento e, em última análise, atrasando projetos por vários meses.

“As empresas esperam que sua camada de dados permita gerenciar diferentes modalidades de dados, preparar dados facilmente para ML, ser fácil para gerenciamento de conjuntos de dados, gerenciar anotações, rastrear informações de modelos e permitir que elas pesquisem e visualizem dados usando buscas multimodais. Infelizmente, sua escolha atual para alcançar cada um desses requisitos é uma solução integrada manualmente onde elas têm que reunir armazenamento em nuvem, bancos de dados, rótulos em vários formatos, bibliotecas de processamento (visão) complicadas e bancos de dados vetoriais, para transferir a entrada de dados multimodais em saídas significativas de IA ou análises”, explicou Gupta, que viu os primeiros vislumbres desse problema enquanto trabalhava com dados de visão na Intel.

Impulsionada por esse desafio, ela se juntou a Luis Remis, um colega cientista de pesquisa no Intel Labs, e começou a ApertureData para construir uma camada de dados que pudesse lidar com todas as tarefas de dados relacionadas à IA multimodal em um só lugar.

O produto resultante, o ApertureDB, hoje permite que as empresas centralizem todos os conjuntos de dados relevantes—incluindo grandes imagens, vídeos, documentos, embeddings e seus metadados associados—para recuperação e manipulação de consultas eficientes. Ele armazena os dados, oferecendo uma visão uniforme do esquema para os usuários, e então fornece capacidades de busca em grafos e vetores para uso posterior em toda a pipeline de IA, seja para construir um chatbot ou um sistema de busca.

“Através de centenas de conversas, aprendemos que precisamos de um banco de dados que não apenas entenda a complexidade do gerenciamento de dados multimodais, mas também compreenda os requisitos de IA para facilitar a adoção e a implantação em produção pelas equipes de IA. É isso que construímos com o ApertureDB”, acrescentou Gupta.

Painel do ApertureDB

Como é diferente do que está no mercado?

Embora haja muitos bancos de dados focados em IA no mercado, a ApertureData espera criar um nicho para si mesma oferecendo um produto unificado que armazena nativamente e reconhece dados multimodais e mistura facilmente o poder de grafos de conhecimento com uma busca vetorial multimodal rápida para casos de uso de IA. Os usuários podem facilmente armazenar e explorar as relações entre seus conjuntos de dados e, em seguida, usar frameworks e ferramentas de IA de sua escolha para aplicações direcionadas.

“Nossa verdadeira concorrência é uma plataforma de dados construída internamente com uma combinação de ferramentas de dados como um banco de dados relacional/grafo, armazenamento em nuvem, bibliotecas de processamento de dados, banco de dados vetorial e scripts ou ferramentas de visualização internas para transformar diferentes modalidades de dados em insights úteis. Os incumbentes que normalmente substituímos são bancos de dados como Postgres, Weaviate, Qdrant, Milvus, Pinecone, MongoDB ou Neo4j—mas no contexto de casos de uso de IA multimodal ou generativa”, enfatizou Gupta.

A ApertureData afirma que seu banco de dados, em sua forma atual, pode aumentar facilmente a produtividade das equipes de ciência de dados e IA em uma média de 10x. Ele pode ser até 35 vezes mais rápido do que soluções díspares na mobilização de conjuntos de dados multimodais. Enquanto isso, em termos de busca vetorial e classificação especificamente, é 2-4x mais rápido do que os bancos de dados vetoriais de código aberto existentes no mercado.

A CEO não compartilhou os nomes exatos dos clientes, mas apontou que eles conseguiram implantações de clientes selecionados da Fortune 100, incluindo um grande varejista de móveis para casa, um grande fabricante e algumas startups de biotecnologia, varejo e IA generativa emergente.

“Através de nossas implantações, os benefícios comuns que ouvimos de nossos clientes são produtividade, escalabilidade e desempenho”, disse ela, observando que a empresa economizou $2 milhões para um de seus clientes.

Como próximo passo, planejam continuar esse trabalho expandindo a nova plataforma em nuvem para acomodar as classes emergentes de aplicações de IA, focando em integrações de ecossistema para oferecer uma experiência perfeita aos usuários e estendendo implantações de parceiros.

Fonte

Compartilhe esse conteúdo: