Os humanos automatizaram tarefas por séculos. Agora, as empresas de IA veem um caminho para o lucro ao aproveitar nosso amor pela eficiência, e elas têm um nome para sua solução: agentes.
Agentes de IA são programas autônomos que realizam tarefas, tomam decisões e interagem com ambientes com pouco input humano, e eles são o foco de todas as grandes empresas que trabalham com IA hoje. A Microsoft tem “Copilotos” projetados para ajudar empresas a automatizar coisas como atendimento ao cliente e tarefas administrativas. O CEO do Google Cloud, Thomas Kurian, detalhou recentemente uma proposta para seis diferentes agentes de produtividade em IA, e o Google DeepMind acaba de contratar o co-líder da OpenAI em seu produto de vídeo IA, Sora, para trabalhar no desenvolvimento de uma simulação para treinar agentes de IA. A Anthropic lançou uma funcionalidade para seu chatbot de IA, Claude, que permitirá que qualquer pessoa crie seu próprio “assistente de IA”. A OpenAI inclui agentes como nível 2 em sua abordagem de 5 níveis para alcançar AGI, ou inteligência artificial em nível humano.
Obviamente, a computação está cheia de sistemas autônomos. Muitas pessoas visitaram um site com um chatbot de atendimento ao cliente popup, usaram uma funcionalidade assistente de voz automatizada como Alexa Skills, ou escreveram um modesto script IFTTT. Mas as empresas de IA argumentam que “agentes” — é melhor não chamá-los de bots — são diferentes. Em vez de seguir um conjunto simples e mecânico de instruções, eles acreditam que os agentes poderão interagir com ambientes, aprender com feedback e tomar decisões sem constante input humano. Eles poderiam gerenciar dinamicamente tarefas como fazer compras, reservar viagens ou agendar reuniões, adaptando-se a circunstâncias imprevistas e interagindo com sistemas que poderiam incluir humanos e outras ferramentas de IA.
As empresas de inteligência artificial esperam que os agentes forneçam um caminho para monetizar modelos de IA poderosos e caros. Capital de risco está sendo despejado em startups de agentes de IA que prometem revolucionar nossa interação com a tecnologia. As empresas visualizam um salto na eficiência, com agentes lidando com tudo, desde o atendimento ao cliente até análise de dados. Para os indivíduos, as empresas de IA estão promovendo uma nova era de produtividade em que tarefas rotineiras são automatizadas, liberando tempo para trabalho criativo e estratégico. O objetivo final para os verdadeiros crentes é criar uma IA que seja um verdadeiro parceiro, não apenas uma ferramenta.
“O que você realmente quer”, disse o CEO da OpenAI, Sam Altman, à MIT Technology Review no início deste ano, “é apenas essa coisa que está te ajudando”. Altman descreveu o aplicativo matador para IA como um “colega supercompetente que sabe absolutamente tudo sobre minha vida inteira, cada e-mail, cada conversa que já tive, mas não se sente como uma extensão”. Ele pode realizar tarefas simples instantaneamente, acrescentou Altman, e para as mais complexas, ele tentará realizá-las, mas retornará com perguntas se necessário. As empresas de tecnologia estão tentando automatizar o assistente pessoal desde pelo menos a década de 1970, e agora, prometem que finalmente estão chegando lá.
Em um evento de imprensa da OpenAI antes do dia anual Dev Day da empresa, o chefe da experiência do desenvolvedor, Romain Huet, demonstrou a nova API em tempo real da empresa com um agente assistente. Huet deu ao agente um orçamento e algumas restrições para comprar 400 morangos cobertos de chocolate e pediu que ele fizesse um pedido via ligação para uma loja fictícia.
O serviço é semelhante a um bot de reservas do Google chamado Duplex de 2018. Mas aquele bot podia lidar apenas com os cenários mais simples – descobriu-se que um quarto de suas chamadas era feito por humanos.
Você trabalha na OpenAI? Eu adoraria conversar. Você pode me contatar com segurança pelo Signal @kylie.01 ou via e-mail em [email protected].
Embora o pedido tenha sido feito em inglês, Huet me disse que fez uma demonstração mais complexa em Tóquio: ele pediu a um agente que reservasse um quarto em um hotel para ele em japonês, onde ele lidaria com a conversa em japonês e então ligaria de volta em inglês para confirmar que estava feito. “Claro, eu não entenderia a parte em japonês – ele apenas cuida disso”, disse Huet.
Mas a demonstração de Huet imediatamente gerou preocupações na sala cheia de jornalistas. O assistente de IA não poderia ser usado para chamadas de spam? Por que não se identificou como um sistema de IA? (Huet atualizou a demonstração para o Dev Day oficial, disse um participante, fazendo com que o agente se identificasse como “Assistente de IA do Romain”). A inquietação era palpável e não era surpreendente – mesmo sem agentes, ferramentas de IA já estão sendo usadas para engano.
Havia outro problema, possivelmente mais imediato: a demonstração não funcionou. O agente não tinha informações suficientes e gravou incorretamente os sabores de sobremesas, causando a auto-preenchimento de sabores como baunilha e morango em uma coluna, em vez de dizer que não tinha essas informações. Agentes frequentemente enfrentam problemas com fluxos de trabalho em várias etapas ou cenários inesperados. E eles consomem mais energia do que um bot ou assistente de voz convencional. Sua necessidade de um poder computacional significativo, especialmente ao raciocinar ou interagir com vários sistemas, torna-os caros para rodar em larga escala.
Os agentes de IA oferecem um salto em potencial, mas para tarefas do dia-a-dia, eles ainda não são significativamente melhores do que bots, assistentes ou scripts. A OpenAI e outros laboratórios buscam melhorar seu raciocínio por meio de aprendizado por reforço, enquanto esperam que a Lei de Moore continue a proporcionar computação mais barata e poderosa.
Então, se os agentes de IA ainda não são muito úteis, por que a ideia é tão popular? Em suma: pressões de mercado. Essas empresas estão sentadas em tecnologia poderosa, mas cara, e estão desesperadas para encontrar casos de uso práticos pelos quais também possam cobrar dos usuários. A lacuna entre promessa e realidade também cria um ciclo de hype atraente que alimenta o financiamento, e acontece que a OpenAI arrecadou $6,6 bilhões bem na hora em que começou a promover agentes.
Startups de agentes de IA garantiram $8,2 bilhões em financiamento de investidores nos últimos 12 meses
As grandes empresas de tecnologia estão correndo para integrar todo tipo de “IA” em seus produtos, mas elas esperam que assistentes de IA, em particular, possam ser a chave para desbloquear receitas. A demonstração de chamadas de Huet supera o que os modelos podem fazer atualmente em escala, mas ele me disse que espera que recursos como esses apareçam mais comumente assim que o OpenAI refinar seu modelo “de raciocínio”.
Por enquanto, o conceito parece estar principalmente isolado em pilhas de software corporativo, não em produtos para consumidores. A Salesforce, que fornece software de gerenciamento de relacionamento com clientes (CRM), lançou uma funcionalidade de “agente” com grande alarde algumas semanas antes de sua conferência anual Dreamforce. A funcionalidade permite que os clientes usem linguagem natural para construir essencialmente um chatbot de atendimento ao cliente em alguns minutos através do Slack, em vez de gastar muito tempo codificando um. Os chatbots têm acesso aos dados de CRM de uma empresa e podem processar linguagem natural mais facilmente do que um bot que não é baseado em modelos de linguagem grande, potencialmente tornando-os melhores em tarefas limitadas, como fazer perguntas sobre pedidos e devoluções.
Startups de agentes de IA (ainda um termo inegavelmente nebuloso) já estão se tornando um investimento bastante chamativo. Elas garantiram $8,2 bilhões em financiamento de investidores nos últimos 12 meses, espalhados por 156 negócios, um aumento de 81,4 por cento ano a ano, de acordo com dados da PitchBook. Um dos projetos mais conhecidos é a Sierra, um agente de atendimento ao cliente semelhante ao último projeto da Salesforce, lançado pelo ex-co-CEO da Salesforce, Bret Taylor. Também há a Harvey, que oferece agentes de IA para advogados, e a TaxGPT, um agente de IA para cuidar de seus impostos.
Apesar de todo o entusiasmo por agentes, esses usos de alto risco levantam uma pergunta clara: eles podem realmente ser confiáveis com algo tão sério como direito ou impostos? As alucinações da IA, que frequentemente atrapalharam usuários do ChatGPT, atualmente não têm remédio à vista. Mais fundamentalmente, como a IBM prescientemente afirmou em 1979, “um computador nunca pode ser responsabilizado” – e como um corolário, “um computador nunca deve tomar uma decisão de gestão”. Em vez de tomadores de decisão autônomos, os assistentes de IA são melhor vistos como o que realmente são: ferramentas poderosas, mas imperfeitas, para tarefas de baixo risco. Vale a pena investir um bom dinheiro que as empresas de IA esperam que as pessoas paguem?
Por enquanto, as pressões do mercado prevalecem, e as empresas de IA estão correndo para monetizar. “Acho que 2025 será o ano em que os sistemas agentes finalmente se tornam mainstream”, disse Kevin Weil, novo diretor de produtos da OpenAI, no evento de imprensa. “E se fizermos isso direito, nos levará a um mundo onde realmente passamos mais tempo nas coisas humanas que importam e um pouco menos tempo olhando para nossos telefones.”