SuperAnnotate quer ajudar empresas a gerenciar seus conjuntos de dados de IA

Dados de alta qualidade podem ser a chave para uma IA de alta qualidade. Com estudos mostrando que a curadoria de conjuntos de dados, em vez do tamanho, é o que realmente afeta o desempenho de um modelo de IA, não é surpreendente que haja uma ênfase crescente nas práticas de gerenciamento de conjuntos de dados. Segundo algumas pesquisas, os pesquisadores de IA hoje passam muito do seu tempo em tarefas de preparação e organização de dados.

Os irmãos Vahan Petrosyan e Tigran Petrosyan sentiram a dor de ter que gerenciar muitos dados enquanto treinavam algoritmos na faculdade. Vahan chegou a criar uma ferramenta de gerenciamento de dados durante sua pesquisa de doutorado sobre segmentação de imagens.

Alguns anos depois, Vahan percebeu que desenvolvedores — e até mesmo corporações — pagariam felizmente por ferramentas semelhantes. Assim, os irmãos fundaram a empresa SuperAnnotate para construí-la.

“Durante a explosão de inovação em 2023 em torno de modelos e IA multimodal, a necessidade de conjuntos de dados de alta qualidade se tornou mais rigorosa, com cada organização tendo múltiplos casos de uso que exigem dados especializados”, disse Vahan em um comunicado. “Vimos uma oportunidade de construir uma plataforma fácil de usar e de baixo código, como um canivete suíço para dados de treinamento de IA modernos.”

A SuperAnnotate, cujos clientes incluem Databricks e Canva, ajuda os usuários a criar e acompanhar grandes conjuntos de dados de treinamento de IA. A startup inicialmente se concentrou em software de rotulagem, mas agora fornece ferramentas para ajustar, iterar e avaliar conjuntos de dados.

Com a plataforma da SuperAnnotate, os usuários podem conectar dados de fontes locais e da nuvem para criar projetos de dados nos quais podem colaborar com colegas. A partir de um painel, os usuários podem comparar o desempenho dos modelos pelos dados que foram usados para treiná-los e, em seguida, implantar esses modelos em vários ambientes uma vez que estejam prontos.

A SuperAnnotate também oferece às empresas acesso a um mercado de trabalhadores crowdsourced para tarefas de anotação de dados. Anotações são geralmente peças de texto rotulando o significado ou partes dos dados que os modelos treinam, e servem como guias para os modelos, “ensinando-os” a distinguir coisas, lugares e ideias.

Para ser sincero, há vários tópicos no Reddit sobre o tratamento da SuperAnnotate aos anotadores de dados que utiliza, e eles não são nada elogiosos. Anotadores reclamam sobre problemas de comunicação, expectativas pouco claras e baixa remuneração.

Por sua parte, a SuperAnnotate afirma que paga taxas justas de mercado e que suas exigências sobre os anotadores não estão fora do normal para a indústria. Pedimos à empresa que fornecesse informações mais detalhadas sobre suas práticas e atualizaremos este artigo se tivermos notícias.

Existem vários concorrentes no espaço de gerenciamento de dados de IA, incluindo startups como Scale AI, Weka e Dataloop. A SuperAnnotate, com sede em San Francisco, conseguiu se manter firme, recentemente levantando US$ 36 milhões em uma rodada de Série B liderada pela Socium Ventures, com participação da Nvidia, Databricks Ventures, Play Time Ventures e Defy.vc.

O capital fresco, que eleva o total levantado pela SuperAnnotate para pouco mais de US$ 53 milhões, será usado para aumentar sua equipe atual de cerca de 100 pessoas, para P&D de produtos e para expandir a base de clientes da SuperAnnotate, que conta com cerca de 100 empresas.

“Nosso objetivo é construir uma plataforma capaz de se adaptar totalmente às necessidades em evolução das empresas e oferecer extensa personalização na afinação de dados”, disse Vahan.

Fonte

Compartilhe esse conteúdo: