Dados são praticamente tudo quando se trata de treinar sistemas de IA, mas acessar dados suficientes para produzir produtos de qualidade que atendam às suas promessas é um grande desafio, mesmo para empresas com os bolsos mais profundos.
Esse é um problema que a Advex AI está se propondo a resolver, usando IA generativa e dados sintéticos para “resolver o problema dos dados”, como a empresa coloca. Mais especificamente, a Advex permite que os clientes treinem seus sistemas de visão computacional usando uma pequena amostra de imagens, com a Advex gerando milhares de fotos “falsas” a partir dessa amostra.
Hoje marca o lançamento formal da Advex no TechCrunch Disrupt 2024 no palco do Startup Battlefield, embora já tenha garantido um punhado de clientes durante sua fase de sigilo. Isso inclui o que ela chama de “sete grandes” clientes corporativos, que afirma não estar autorizada a divulgar. O TechCrunch também pode revelar que a startup com sede em San Francisco levantou US$ 3,6 milhões em financiamento, a maior parte disso veio de uma rodada de sementes de US$ 3,1 milhões em dezembro passado, com investidores notáveis, incluindo Construct Capital, Pear VC e Emerson Collective de Laurene Powell Jobs.
O CEO Pedro Pachuca começou a Advex com seu cofundador CTO Qasim Wani há pouco mais de um ano, e a empresa tem uma equipe de seis pessoas. O fato de uma startup tão pequena já ter entrado na indústria com clientes reais pagantes é notável, com Pachuca atribuindo pelo menos parte disso ao seu histórico, além de boas e velhas redes de contatos e contatos frios. De fato, Pachuca foi anteriormente pesquisador de aprendizado de máquina em Berkeley e, mais tarde, se juntou à equipe de pesquisa do Google Brain antes de se fundir com o DeepMind.
“Se o ROI [retorno sobre investimento] fizer sentido, eles [os clientes] confiarão um pouco em nós,” disse Pachuca. “Eu fiz muitas pesquisas nesse espaço – estar no Google Brain antes me dá um pouco de credibilidade. Mas no começo foram e-mails frios, e isso nos rendeu nossos primeiros dois grandes clientes. Depois foram conferências – é por isso que vou a tantas delas!”
Pachuca estava prestes a viajar para a Europa logo após concluir sua entrevista com o TechCrunch, onde planejava participar de várias reuniões e conferências, incluindo a Conferência Europeia sobre Visão Computacional (ECCV) em Milão (Itália) e Vision em Estugarda (Alemanha).
“Há muitas conferências lá na Europa,” disse Pachuca. “Vamos para a ECCV para aprender e contratar, basicamente,” acrescentou Pachuca. “E a Vision é mais do lado industrial, então estamos lá para vender.”
Clientes potenciais incluem desenvolvedores legados de sistemas de visão computacional, ao longo das linhas da Cognex ou Keyence, que estão se esforçando para aprimorar seus produtos com melhor IA. Mas, por outro lado, a Advex pode vender diretamente para as empresas finais, como fabricantes de automóveis ou empresas de logística que estão construindo suas próprias ferramentas internas.
Por exemplo, um fabricante de automóveis pode precisar ensinar seu sistema de visão computacional a reconhecer defeitos no material de seus bancos de carro. No entanto, mesmo que a empresa tenha acesso a centenas de imagens distintas, o fato é que nenhum dos defeitos parece o mesmo. Portanto, em vez disso, o fabricante pode enviar uma dúzia de fotos de bancos com rasgos, com a Advex extrapolando a partir disso para gerar milhares de fotos de bancos “defeituosos” para construir um conjunto de dados de treinamento muito mais extenso e diversificado.
O mesmo pode ser aplicado a praticamente qualquer setor de manufatura, desde petróleo e gás até móveis de madeira – tudo se resume a reduzir o tempo e os custos de coleta de dados criando artificialmente imagens de treinamento.
A geração de imagens sintéticas de defeitos de resina em madeira. Créditos da imagem: Advex
Dados sintéticos não são um conceito novo, é claro, mas com a revolução da IA em pleno andamento, as empresas estão buscando preencher as lacunas de dados – isso inclui áreas como pesquisa de mercado, onde amostras de pesquisa podem ser muito pequenas, assim como visão computacional, como estamos vendo com a Advex, entre outras startups financiadas por VC, como Synthesis AI e Parallel Domain.
De maneira geral, existem dois tipos de modelos com os quais a Advex lida. O modelo que é implantado no site do cliente, aquele que as próprias imagens do cliente treinam, é apenas “coisas de código aberto” padrão, como Pachuca coloca. “Isso porque eles precisam ser pequenos, e também não acreditamos que os ganhos venham da arquitetura do modelo – eles vêm do treinamento com os dados corretos,” disse ele.
Mas o verdadeiro diferencial está no modelo de difusão proprietário da empresa, semelhante a algo como Midjourney ou Dall-E, e é o que é usado para criar os dados sintéticos. “Esse é personalizado e é altamente complicado – é onde colocamos todo o nosso esforço,” acrescentou Pachuca.
Enquanto o foco da Advex na manufatura é uma maneira de se diferenciar, é realmente a abordagem do modelo de difusão onde a empresa se vê se destacando.
Em comparação com outras técnicas de simulação e modelagem, como aquelas alinhadas com motores de jogos/física (por exemplo, Unity), Pachuca diz que usar difusão significa que não há configuração necessária, e a geração leva apenas alguns segundos por par de imagem/etiqueta – além de ser muito mais próxima dos dados da vida real.
“Não estamos apenas criando imagens quaisquer, estamos criando as imagens que você não tem – especificamente tentando entender o que está faltando e criando isso,” disse Pachuca. “E essa parte do ‘o que está faltando’ é realmente difícil, e é muito invisível, mas é uma das maiores inovações que fizemos.