À medida que a inteligência artificial impulsiona uma demanda sem precedentes por processamento de dados, uma startup de Mountain View está oferecendo uma solução para um dos desafios menos discutidos, mas mais críticos da IA: mover e transformar conjuntos de dados massivos rapidamente o suficiente para acompanhar.
A Voltron Data, que anunciou uma parceria estratégica com a Accenture hoje, desenvolveu um motor de análise acelerado por GPU que pode ajudar as empresas a superar o gargalo de preparação de dados que está prejudicando as iniciativas de IA. O produto principal da empresa, Theseus, permite que organizações processem dados em escala de petabytes usando unidades de processamento gráfico (GPUs) em vez de processadores de computador tradicionais (CPUs).
“Todo mundo está focado nas coisas novas e brilhantes que você pode tocar e sentir, mas é essa fundação de conjunto de dados por baixo que será a chave”, disse Michael Abbott, que lidera a prática de bancos e mercados de capitais da Accenture, em uma entrevista exclusiva ao VentureBeat. “Para fazer a IA funcionar, você precisa mover dados a uma velocidade e ritmo que você nunca precisou antes.”
Construindo para a tsunami da IA: Por que o processamento de dados tradicional não vai cortar
A parceria vem em um momento em que empresas que correm para adotar IA generativa estão descobrindo que sua infraestrutura de dados existente não está equipada para lidar com o volume e a velocidade de dados exigidos. Este desafio deve se intensificar à medida que agentes de IA se tornam mais prevalentes nas operações empresariais.
“Os agentes provavelmente escreverão mais consultas SQL do que os humanos em um horizonte de tempo muito curto”, disse Rodrigo Aramburu, CTO e cofundador da Voltron Data. “Se os CIOs e CTOs já estão dizendo que gastam muito em análise de dados e infraestrutura em nuvem, e a demanda está prestes a aumentar exponencialmente, então precisamos de uma redução exponencial no custo de execução dessas consultas.”
Diferentemente dos fornecedores tradicionais de banco de dados que adaptaram o suporte a GPU em sistemas existentes, a Voltron Data construiu seu motor do zero para aceleração por GPU. “O que a maioria das empresas fez quando tentou fazer a aceleração por GPU foi forçar GPUs em um sistema existente”, disse Aramburu ao VentureBeat. “Ao construir do zero… conseguimos 10x, 20x, 100x dependendo do perfil de desempenho de uma carga de trabalho específica.”
De 1.400 servidores para 14: Primeiros adotantes veem resultados dramáticos
A empresa posiciona o Theseus como complementar a plataformas estabelecidas como Snowflake e Databricks, aproveitando a estrutura Apache Arrow para movimentação eficiente de dados. “É realmente um acelerador para todos esses bancos de dados, em vez de concorrência”, disse Abbott. “Ainda está usando o mesmo SQL que foi escrito para obter a mesma resposta, mas chega lá muito mais rápido e de forma mais rápida em um modo paralelo.”
A adoção inicial se concentrou em indústrias intensivas em dados, como serviços financeiros, onde os casos de uso incluem detecção de fraudes, modelagem de riscos e conformidade regulatória. Um grande varejista reduziu sua contagem de servidores de 1.400 máquinas CPU para apenas 14 servidores GPU após implementar o Theseus, de acordo com Aramburu.
Desde o lançamento na conferência GTC da Nvidia no mês passado, a Voltron Data garantiu cerca de 14 clientes empresariais, incluindo duas grandes agências governamentais. A empresa planeja lançar uma versão de “teste” que permitirá que clientes potenciais experimentem consultas aceleradas por GPU em conjuntos de dados em escala de terabytes.
Transformando a escassez de GPU em uma oportunidade
A atual escassez de GPU provocada pela demanda de IA tem sido tanto desafiadora quanto benéfica para a Voltron Data. Embora novas implantações enfrentem restrições de hardware, muitas empresas têm infraestrutura de GPU subutilizada que foi comprada originalmente para cargas de trabalho de IA e que poderia ser reaproveitada para processamento de dados durante períodos ociosos.
“Na verdade, vimos isso como uma bênção, pois há tantas GPUs no mercado que anteriormente não estavam lá”, observou Aramburu, acrescentando que o Theseus pode funcionar efetivamente em gerações mais antigas de GPUs que poderiam de outra forma ser descontinuadas.
A tecnologia pode ser particularmente valiosa para bancos lidando com o que Abbott chama de “dados aprisionados” — informações bloqueadas em formatos como PDFs e documentos que poderiam ser valiosas para treinamento de IA, mas são difíceis de acessar e processar em escala. “Você viu alguns dos dados que a Voltron mostraria a você que potencialmente são 90% mais eficazes e eficientes para mover dados usando essa tecnologia do que CPUs padrão”, disse Abbott. “Esse é o poder.”
À medida que as empresas lutam com as demandas de dados da IA, soluções que podem acelerar o processamento de dados e reduzir os custos de infraestrutura provavelmente se tornarão cada vez mais críticas. A parceria com a Accenture pode ajudar a Voltron Data a alcançar mais organizações que enfrentam esses desafios, enquanto dá aos clientes da Accenture acesso a uma tecnologia que poderia melhorar significativamente o desempenho e a eficiência das iniciativas de IA.