Se 2024 foi tudo sobre experimentação, 2025 será verdadeiramente o ano em que as empresas escalarão a IA, de acordo com um novo relatório de tendências do Google Cloud divulgado hoje.
Notavelmente, a sofisticada IA multimodal apoiará tarefas cada vez mais complexas, agentes de IA serão incorporados em toda a empresa e mecanismos de busca internos desbloquearão insights críticos de negócios.
Curiosamente, o Google identificou essas tendências usando o NotebookLM para analisar dados de um estudo de pesquisa anterior, retirou os tópicos de IA que mais crescem nas Tendências do Google e integrou pesquisas e insights de terceiros.
“No futuro, você verá diferentes agentes conversando com diferentes agentes, quase ao ponto em que todos nós vamos dormir no final da noite, e haverá uma série de tarefas e coisas acontecendo nos bastidores”, disse Oliver Parker, VP de go-to-market de IA generativa global do Google Cloud, ao VentureBeat.
As empresas passarão de chatbots para sistemas de múltiplos agentes.
Os agentes de IA podem trabalhar de forma autônoma (ou semi-autônoma) e realizar processos de múltiplas etapas. Segundo a Capgemini, apenas cerca de 10% das grandes empresas já estão usando agentes de IA — mas 82% planejam integrá-los nos próximos três anos.
O Google identifica seis tipos de agentes de IA:
Agentes de cliente que entendem as necessidades dos usuários, respondem perguntas, resolvem problemas e recomendam produtos e serviços. Eles operam em diversos canais e podem integrar voz e vídeo.
Agentes de funcionários que ajudam a simplificar processos, gerenciar tarefas repetitivas, responder perguntas e editar e traduzir.
Agentes criativos que geram conteúdo, imagens e ideias para apoiar design, marketing, redação e outros projetos.
Agentes de dados que podem ajudar com pesquisa e análise de dados, encontrando e atuando com informações (enquanto garantem a integridade factual).
Agentes de código que apoiam a geração de código e fornecem assistência técnica.
Agentes de segurança que ajudam a mitigar ataques ou aumentar a velocidade de investigações.
No entanto, Parker apontou que ter muitos agentes assumindo muitos processos em várias funções pode criar um pouco de caos, o que dará origem a novas plataformas, ele prevê.
“Ser capaz de ter uma única tela para gerenciar e habilitar seus agentes é onde acreditamos que haverá uma grande oportunidade”, disse ele. Isso levará a “governança agentica”, ou a necessidade de uma camada agentica que suporte “diferentes agentes que estão indo a todos os lugares e trabalhando em todos esses diferentes sistemas”.
A IA multimodal fornecerá mais contexto.
O mercado global de IA multimodal foi estimado em 2,4 bilhões de dólares em 2025 e deve alcançar 98,9 bilhões de dólares até o final de 2037.
A IA multimodal eleva a compreensão da IA para outro nível, permitindo que modelos decifrem e processem uma variedade de fontes de dados, incluindo não apenas texto, mas também imagens, vídeos e áudios. Vários fornecedores líderes e startups de ponta já oferecem ferramentas multimodais altamente capacitadas — por exemplo, o próprio Gemini 2.0 Flash do Google, Mistral’s Pixtral 12B ou Cohere’s Embed 3.
O Google prevê que a explosão da IA multimodal apoiará análises de dados complexas e levará a insights mais fundamentados e personalizados.
Além disso, as empresas serão multimodais ao adotarem IA. Parker apontou que as conversas evoluíram de as empresas adotarem um único modelo para implantarem muitos para diferentes casos de uso. “Não é apenas um modelo OpenAI”, disse ele. “É também Gemini, é Anthropic, é Mistral, é Cohere, é Llama”.
Foi uma evolução rápida ao longo dos últimos 12 meses, observou Parker. As empresas foram além de apenas avaliar modelos para analisar diferentes plataformas e traçar roteiros de IA e agentes de IA. Embora muito do foco até este ponto tenha sido no desenvolvimento, o objetivo em 2025 será colocar as capacidades da IA generativa nas mãos dos usuários empresariais.
“A primeira metade de 24 foi pesada, pesada em experimentação, mas sem muita produção”, disse Parker. Agora, as empresas estão começando a passar para a produção, embora ainda não seja produção em larga escala (mais disso deverá vir em 2025).
“Essas são tipicamente tendências que você vê ao longo de vários anos”, disse ele. “Nós vimos isso ser muito comprimido ao longo de um período de 12 meses. É de tirar o fôlego.”
Finalmente, desbloquearemos o poder da pesquisa empresarial.
A pesquisa empresarial — apoiada por mecanismos de busca internos que consultam dados específicos da empresa — se tornará cada vez mais intuitiva com a IA, prevê o Google. Não será mais apenas busca baseada em palavras-chave; os funcionários poderão usar imagens, áudios, vídeos e prompts de conversação para acessar rapidamente dados internos. Isso permitirá buscas mais avançadas e intuitivas, destacou Parker, e a IA generativa pode processar diferentes formatos de dados, como documentos, planilhas e multimídia.
“Não é apenas busca, é busca mais IA conversacional”, disse Parker. “Os empregos das pessoas realmente se resumem a encontrar informações e reuni-las para poder obter insights e tomar ações.”
Ele observou que muitas organizações possuem informações isoladas em diferentes aplicações — seja um sistema de codificação, Jira, Confluence, Box, ou plataformas como SharePoint ou Service Now.
A busca por IA pode rapidamente navegar por esses sistemas para reunir dados. “Esses sistemas de raciocínio podem pesquisar em sistemas empresariais”, afirmou ele. “Então, como você consulta e descobre o que está acontecendo em toda a sua organização, em todos os seus sistemas, e então começa a aplicar agentes para agir sobre isso?”
Sim, aqui também, os agentes de IA desempenharão um grande papel. “Estamos vendo uma confluência de capacidades conversacionais e baseadas em agentes combinadas com busca dentro das organizações”, disse Parker.