Um novo relatório do provedor de dados de IA Appen revela que as empresas estão lutando para obter e gerenciar os dados de alta qualidade necessários para alimentar os sistemas de IA à medida que a inteligência artificial se expande nas operações empresariais.
O Relatório de Estado da IA da Appen de 2024, que entrevistou mais de 500 tomadores de decisão de TI nos EUA, revela que a adoção de IA generativa disparou 17% no último ano; no entanto, as organizações agora enfrentam obstáculos significativos na preparação de dados e na garantia de qualidade. O relatório mostra um aumento de 10% ano a ano nos gargalos relacionados à obtenção, limpeza e rotulagem de dados, sublinhando as complexidades de construir e manter modelos de IA eficazes.
Si Chen, Chefe de Estratégia da Appen, explicou em uma entrevista ao VentureBeat: “À medida que os modelos de IA enfrentam problemas mais complexos e especializados, os requisitos de dados também mudam”, disse ela. “As empresas estão descobrindo que apenas ter muitos dados não é mais suficiente. Para ajustar um modelo, os dados precisam ser de qualidade extremamente alta, o que significa que são precisos, diversos, devidamente rotulados e adaptados ao caso de uso específico da IA.”
Embora o potencial da IA continue a crescer, o relatório identifica várias áreas-chave onde as empresas estão encontrando obstáculos. Abaixo estão os cinco principais pontos do Relatório de Estado da IA da Appen de 2024:
1. A adoção de IA generativa está disparando — mas os desafios de dados também
A adoção de IA generativa (GenAI) cresceu impressionantes 17% em 2024, impulsionada por avanços em modelos de linguagem de grande porte (LLMs) que permitem que as empresas automatizem tarefas em uma ampla gama de casos de uso. Desde operações de TI até P&D, as empresas estão aproveitando a GenAI para agilizar processos internos e aumentar a produtividade. No entanto, o aumento rápido no uso de GenAI também introduziu novos obstáculos, particularmente em torno da gestão de dados.
“Os resultados da IA generativa são mais diversos, imprevisíveis e subjetivos, tornando mais difícil definir e medir o sucesso”, disse Chen ao VentureBeat. “Para alcançar uma IA pronta para a empresa, os modelos devem ser personalizados com dados de alta qualidade adaptados a casos de uso específicos.”
A coleta de dados personalizados emergiu como o principal método para obter dados de treinamento para modelos de GenAI, refletindo uma mudança mais ampla de dados genéricos coletados na web em favor de conjuntos de dados confiáveis e adaptados.
O uso de IA generativa em processos empresariais continua a se expandir, com aumentos notáveis em operações de TI, manufatura e pesquisa e desenvolvimento. No entanto, a adoção em áreas como marketing e comunicações diminuiu ligeiramente. (Fonte: Relatório de Estado da IA da Appen 2024)
2. As implantações de IA empresarial e o ROI estão diminuindo
Apesar da empolgação em torno da IA, o relatório encontrou uma tendência preocupante: menos projetos de IA estão chegando à implantação, e aqueles que chegam estão mostrando menos ROI. Desde 2021, a porcentagem média de projetos de IA que chegam à implantação caiu 8,1%, enquanto a porcentagem média de projetos de IA implantados que mostram ROI significativo diminuiu 9,4%.
Essa queda se deve em grande parte à crescente complexidade dos modelos de IA. Casos de uso simples, como reconhecimento de imagem e automação de fala, agora são considerados tecnologias maduras, mas as empresas estão mudando para iniciativas de IA mais ambiciosas, como IA generativa, que requerem dados personalizados e de alta qualidade e são muito mais difíceis de implementar com sucesso.
Chen explicou: “A IA generativa tem capacidades mais avançadas em compreensão, raciocínio e geração de conteúdo, mas essas tecnologias são inerentemente mais desafiadoras de implementar.”
A porcentagem de projetos de IA que chegam à implantação caiu constantemente desde 2021, com uma queda acentuada para 47,4% em 2024. Da mesma forma, a porcentagem média de projetos implantados que mostram ROI significativo caiu para 47,3%, refletindo os crescentes desafios que as empresas enfrentam para alcançar implementações bem-sucedidas de IA. (Fonte: Relatório de Estado da IA da Appen 2024)
3. A qualidade dos dados é essencial — mas está diminuindo
O relatório destaca um problema crítico para o desenvolvimento de IA: a precisão dos dados caiu quase 9% desde 2021. À medida que os modelos de IA se tornam mais sofisticados, os dados que eles requerem também se tornaram mais complexos, frequentemente exigindo anotações especializadas e de alta qualidade.
Um impressionante 86% das empresas agora re-treinam ou atualizam seus modelos pelo menos uma vez a cada trimestre, sublinhando a necessidade de dados frescos e relevantes. No entanto, à medida que a frequência das atualizações aumenta, garantir que esses dados sejam precisos e diversos se torna mais difícil. As empresas estão recorrendo a provedores de dados externos para ajudar a atender a essas demandas, com quase 90% dos negócios dependendo de fontes externas para treinar e avaliar seus modelos.
“Embora não possamos prever o futuro, nossa pesquisa mostra que gerenciar a qualidade dos dados continuará a ser um grande desafio para as empresas”, disse Chen. “Com modelos de IA generativa mais complexos, a obtenção, limpeza e rotulagem de dados já se tornaram gargalos-chave.”
A gestão de dados emergiu como o principal desafio para projetos de IA em 2024, com 48% dos entrevistados citando-a como um gargalo significativo. Outros obstáculos incluem a falta de recursos técnicos, ferramentas e dados, destacando a crescente complexidade da implementação de IA. (Fonte: Relatório de Estado da IA da Appen 2024)
4. Os gargalos de dados estão piorando
O relatório da Appen revela um aumento de 10% ano a ano nos gargalos relacionados à obtenção, limpeza e rotulagem de dados. Esses gargalos estão impactando diretamente a capacidade das empresas de implantar projetos de IA com sucesso. À medida que os casos de uso de IA se tornam mais especializados, o desafio de preparar os dados certos se torna mais agudo.
“Os problemas de preparação de dados se intensificaram”, disse Chen. “A natureza especializada desses modelos exige novos conjuntos de dados adaptados.”
Para abordar esses problemas, as empresas estão se concentrando em estratégias de longo prazo que enfatizam a precisão, consistência e diversidade dos dados. Muitas também estão buscando parcerias estratégicas com provedores de dados para ajudar a navegar pelas complexidades do ciclo de vida dos dados de IA.
A precisão dos dados nos EUA caiu constantemente, passando de 63,5% em 2021 para apenas 54,6% em 2024. A diminuição destaca o crescente desafio de manter dados de alta qualidade à medida que os modelos de IA se tornam mais complexos. (Fonte: Relatório de Estado da IA da Appen 2024)
5. O humano no loop é mais vital do que nunca
Embora a tecnologia de IA continue a evoluir, a participação humana continua sendo indispensável. O relatório descobriu que 80% dos entrevistados enfatizaram a importância do aprendizado de máquina com humano no loop, um processo onde a experiência humana é usada para orientar e melhorar os modelos de IA.
“A participação humana continua sendo essencial para desenvolver sistemas de IA de alto desempenho, éticos e contextualmente relevantes”, disse Chen.
Especialistas humanos são particularmente importantes para garantir a mitigação de viés e o desenvolvimento ético da IA. Ao fornecer conhecimento específico do domínio e identificar potenciais viéses nas saídas da IA, eles ajudam a refinar modelos e alinhá-los com comportamentos e valores do mundo real. Isso é especialmente crítico para a IA generativa, onde as saídas podem ser imprevisíveis e requerem supervisão cuidadosa para evitar resultados prejudiciais ou tendenciosos.
Confira o relatório completo de Estado da IA 2024 da Appen aqui.