Na terça-feira, a OpenAI lançou novas ferramentas projetadas para ajudar desenvolvedores e empresas a construir agentes de IA – sistemas automatizados que podem realizar tarefas de forma independente – usando os próprios modelos e estruturas de IA da empresa.
As ferramentas fazem parte da nova API de Respostas da OpenAI, que permite que as empresas desenvolvam agentes de IA personalizados que podem realizar pesquisas na web, escanear arquivos da empresa e navegar em sites, muito parecido com o produto Operator da OpenAI. A API de Respostas efetivamente substitui a API de Assistentes da OpenAI, que a empresa planeja descontinuar na primeira metade de 2026.
O hype em torno dos agentes de IA cresceu dramaticamente nos últimos anos, apesar do fato de que a indústria de tecnologia tem lutado para mostrar às pessoas, ou mesmo definir, o que realmente são “agentes de IA”. No exemplo mais recente do hype dos agentes correndo à frente da utilidade, a startup chinesa Butterfly Effect se tornou viral esta semana por uma nova plataforma de agentes de IA chamada Manus, que os usuários rapidamente descobriram que não cumpria muitas das promessas da empresa.
Em outras palavras, as apostas são altas para a OpenAI acertar os agentes.
“É bem fácil demonstrar seu agente”, disse Olivier Godemont, chefe de produtos da API da OpenAI, em uma entrevista ao TechCrunch. “Escalar um agente é bem difícil, e fazer as pessoas usá-lo com frequência é muito difícil.”
No início deste ano, a OpenAI introduziu dois agentes de IA no ChatGPT: Operator, que navega em sites em seu nome, e pesquisa profunda, que compila relatórios de pesquisa para você. Ambas as ferramentas ofereceram um vislumbre do que a tecnologia agente pode alcançar, mas deixaram bastante a desejar no departamento de “autonomia”.
Agora, com a API de Respostas, a OpenAI quer vender acesso aos componentes que alimentam os agentes de IA, permitindo que os desenvolvedores construam suas próprias aplicações de estilo agente como Operator e pesquisa profunda. A OpenAI espera que os desenvolvedores possam criar algumas aplicações com sua tecnologia de agentes que pareçam mais autônomas do que o que está disponível hoje.
Usando a API de Respostas, os desenvolvedores podem acessar os mesmos modelos de IA (em pré-visualização) que estão por trás da ferramenta de pesquisa na web ChatGPT: GPT-4o search e GPT-4o mini search. Os modelos podem navegar na web em busca de respostas para perguntas, citando fontes enquanto geram respostas.
A OpenAI afirma que o GPT-4o search e o GPT-4o mini search são altamente precisos em termos factuais. No benchmark SimpleQA da empresa, que mede a capacidade dos modelos de responder a perguntas curtas e factuais, o GPT-4o search pontua 90%, enquanto o GPT-4o mini search pontua 88% (quanto maior, melhor). Para comparação, o GPT-4.5 – o modelo muito maior da OpenAI, lançado recentemente – pontua apenas 63%.
O fato de que as ferramentas de pesquisa alimentadas por IA são mais precisas do que os modelos de IA tradicionais não é necessariamente surpreendente – em teoria, o GPT-4o search pode simplesmente procurar a resposta certa. No entanto, a pesquisa na web não resolve o problema das alucinações. Além de sua precisão factual, as ferramentas de pesquisa de IA também tendem a ter dificuldades com consultas curtas e de navegação (como “placar dos Lakers hoje”), e relatórios recentes sugerem que as citações do ChatGPT nem sempre são confiáveis.
A API de Respostas também inclui uma utilidade de pesquisa de arquivos que pode rapidamente escanear arquivos nos bancos de dados de uma empresa para recuperar informações. (A OpenAI afirma que não treinará modelos com esses arquivos.) Além disso, os desenvolvedores que usam a API de Respostas podem acessar o modelo Computer-Using Agent (CUA) da OpenAI, que alimenta o Operator. O modelo gera ações de mouse e teclado, permitindo que os desenvolvedores automatizem tarefas de uso de computador, como entrada de dados e fluxos de trabalho de aplicativos.
As empresas podem opcionalmente executar o modelo CUA, que está sendo lançado em pré-visualização de pesquisa, localmente em seus próprios sistemas, disse a OpenAI. A versão do consumidor do CUA disponível no Operator só pode realizar ações na web.
Para ser claro, a API de Respostas não resolverá todos os problemas técnicos que afligem os agentes de IA hoje.
Embora as ferramentas de pesquisa alimentadas por IA sejam mais precisas do que os modelos de IA tradicionais – um fato que não é surpreendente, dado que podem simplesmente procurar a resposta certa – a pesquisa na web não resolve o problema das alucinações de IA. O GPT-4o search ainda erra 10% das perguntas factuais. Além de sua precisão, as ferramentas de pesquisa de IA também tendem a ter dificuldades com consultas curtas e de navegação (como “placar dos Lakers hoje”), e relatórios recentes sugerem que as citações do ChatGPT nem sempre são confiáveis.
Em um post no blog fornecido ao TechCrunch, a OpenAI disse que o modelo CUA “ainda não é altamente confiável para automatizar tarefas em sistemas operacionais” e que é suscetível a cometer erros “inadvertidos”.
No entanto, a OpenAI disse que estas são iterações iniciais de suas ferramentas de agentes e que está constantemente trabalhando para melhorá-las.
Juntamente com a API de Respostas, a OpenAI está lançando um kit de ferramentas de código aberto chamado Agents SDK, que oferece aos desenvolvedores ferramentas gratuitas para integrar modelos com seus sistemas internos, implementar salvaguardas e monitorar as atividades dos agentes de IA para fins de depuração e otimização. O Agents SDK é uma espécie de continuação do Swarm da OpenAI, uma estrutura para orquestração de múltiplos agentes que a empresa lançou no final do ano passado.
Godemont disse que espera que a OpenAI possa preencher a lacuna entre as demonstrações de agentes de IA e produtos este ano, e que, em sua opinião, “agentes são a aplicação mais impactante de IA que acontecerá”. Isso ecoa uma declaração feita pelo CEO da OpenAI, Sam Altman, em janeiro: que 2025 é o ano em que os agentes de IA entram na força de trabalho.
Se 2025 realmente se tornará o “ano do agente de IA”, os últimos lançamentos da OpenAI mostram que a empresa quer mudar de demonstrações de agentes chamativas para ferramentas impactantes.