OpenAI apresenta a API de Respostas, SDK de Agentes de código aberto, permitindo que desenvolvedores construam sua própria Pesquisa Profunda e Operador

A OpenAI está lançando um novo conjunto de APIs e ferramentas projetadas para ajudar desenvolvedores e empresas a construir agentes de IA mais eficientemente com base em algumas das mesmas tecnologias que alimentam seus próprios agentes de IA de primeira linha, como a ferramenta de Pesquisa Profunda (que vasculha a internet de forma independente para desenvolver relatórios ricamente pesquisados, bem organizados e citados) e o Operador (sua ferramenta para controlar um cursor de navegador web autonomamente com base nas instruções de texto de um usuário e realizar ações como encontrar ingressos para esportes ou fazer reservas).

Agora, com acesso aos blocos de construção por trás desses poderosos agentes de IA de primeira linha da OpenAI, os desenvolvedores podem construir seus próprios rivais de terceiros ou produtos e serviços mais especializados em domínios específicos para seus casos de uso e público-alvo.

Os recentes avanços da OpenAI em raciocínio, processamento multimodal e mecanismos de segurança estabeleceram as bases para essas capacidades, especialmente sua família de modelos de raciocínio “o” (o1 e o3).

“É difícil exagerar o quão crítico os modelos de raciocínio são para permitir agentes de IA”, disse Olivier Godement, chefe de produto da plataforma da OpenAI, em uma chamada de vídeo com a VentureBeat. “Uma das maiores limitações antes era lidar com tarefas de longo prazo, como planejamento.”

Mas a empresa afirma que os desenvolvedores ainda não tinham as ferramentas necessárias para integrá-las facilmente em aplicações prontas para produção para empresas e seus clientes – até agora.

Para abordar esses obstáculos, a OpenAI está introduzindo várias novas ofertas: a API de Respostas, ferramentas integradas para busca na web e de arquivos, uma ferramenta de uso de computador e o SDK de Agentes de código aberto.

Essas ferramentas têm como objetivo simplificar o desenvolvimento de agentes de IA, reduzindo a necessidade de engenharia de prompts extensiva e lógica de orquestração personalizada. Elas também devem tornar uma proposta atraente continuar a construir sobre a plataforma da OpenAI, mesmo diante da crescente concorrência de players chineses como Manus, Qwen da Alibaba, DeepSeek, e rivais locais como Anthropic e Google.

Embora esses outros players ofereçam ferramentas ou produtos para desenvolvedores, a contínua evolução da plataforma de desenvolvedores da OpenAI torna difícil competir como uma “solução única” para aqueles que buscam aproveitar os últimos avanços em IA de maneira limpa, fácil de usar, rápida e acessível.

Em um movimento que certamente agitará o blogosfera de IA e o espaço das redes sociais, a OpenAI está voltando ao código aberto de forma significativa com o lançamento de seu SDK de Agentes, uma caixa de ferramentas projetada para ajudar desenvolvedores a gerenciar, coordenar e otimizar fluxos de trabalho de agentes – mesmo construindo agentes alimentados por outros modelos que não são da OpenAI, como aqueles de concorrentes como Anthropic e Google, ou modelos de código aberto de DeepSeek, Qwen, Mistral e da família Llama da Meta.

“O SDK de Agentes é de código aberto, permitindo que as empresas misturem e combinem diferentes modelos”, disse Godement. “Não queremos forçar ninguém a usar apenas modelos da OpenAI.”

O SDK oferece recursos-chave, como:

• Agentes Configuráveis – Modelos de IA com instruções pré-definidas e acesso a ferramentas.

• Transferências Inteligentes – Mecanismos para transferir tarefas entre agentes com base no contexto.

• Guardrails Integrados – Medidas de segurança para validação de entradas e moderação de conteúdo.

• Rastreabilidade e Observabilidade – Ferramentas para depuração e otimização do desempenho do agente.

“Com o SDK de Agentes, os desenvolvedores podem rastrear exatamente o que um agente está fazendo – quais tarefas ele cria, quais dados ele coleta e como ele gera respostas”, disse Handa.

O que a nova API de Respostas oferece

No centro desta atualização está a API de Respostas, que combina recursos da API de Conclusões de Chat da OpenAI com a funcionalidade de uso de ferramentas da API de Assistentes.

Essa integração permite que os desenvolvedores aproveitem várias ferramentas integradas em uma única chamada de API, facilitando a construção de aplicações que requerem interações complexas e em várias etapas.

A API de Respostas inicialmente suporta três ferramentas integradas:

• Busca na Web – Fornece respostas em tempo real, citadas, buscando informações na web.

• Busca de Arquivos – Recupera informações relevantes de grandes repositórios de documentos usando filtragem de metadados e processamento de consultas otimizado.

• Ferramenta de Uso de Computador – Permite que agentes de IA realizem ações em um computador, como navegação, entrada de dados e navegação por interfaces de software.

“Com a API de Respostas, os desenvolvedores têm mais visibilidade sobre o que o modelo está fazendo – quais ferramentas ele está chamando, por que está chamando elas e quais decisões está tomando antes e depois dessas chamadas”, disse Nikunj Handa, PM da equipe de API da OpenAI, na mesma chamada de vídeo com a VentureBeat.

Com essas capacidades, a OpenAI imagina a API de Respostas servindo como uma fundação para aplicações de agentes, eliminando a necessidade de várias integrações externas. A API está disponível para todos os desenvolvedores a partir de hoje, com uso faturado nas taxas padrão de token e ferramenta da OpenAI.

Além disso, a OpenAI observa que, embora a API de Conclusões de Chat continue a receber atualizações, a API de Respostas é considerada sua superconjunto. Os desenvolvedores que precisam de ferramentas integradas ou interações de modelos em várias etapas devem usar a API de Respostas para novas integrações.

A OpenAI também está disponibilizando suas ferramentas de busca na web, busca de arquivos e uso de computador diretamente através da API de Respostas. Essas ferramentas permitem que agentes de IA acessem informações do mundo real, recuperem contexto de documentos e interajam com ambientes digitais de forma mais eficaz.

Busca na Web oferece a desenvolvedores informações em tempo real com citações

A ferramenta de busca na web permite que os desenvolvedores integrem capacidades de busca em tempo real em suas aplicações, tornando-a útil para assistentes de pesquisa, guias de compras e ferramentas de agregação de conteúdo. Ela fornece fontes para suas respostas, garantindo que os usuários possam verificar a precisão das informações.

“A primeira coisa que estamos lançando são ferramentas integradas, como a busca na web, que permite que modelos acessem informações em tempo real”, disse Handa. “É a mesma ferramenta que alimenta a Busca do ChatGPT, e agora estamos trazendo para a API.”

A OpenAI também confirmou que os resultados da busca na web na API incluirão citações claras, permitindo que os usuários cliquem para acessar as fontes originais. Os desenvolvedores podem implementar a busca na web como parte de um sistema de recuperação mais amplo que inclui fontes de dados proprietárias.

Busca de arquivos: recuperação inteligente de documentos em nuvens privadas

Com a ferramenta de busca de arquivos, agentes de IA podem recuperar rapidamente informações relevantes de grandes coleções de documentos. Essa ferramenta suporta vários formatos de arquivo e inclui recursos como otimização de consultas, filtragem de metadados e classificação personalizada para resultados mais precisos.

“A terceira ferramenta que estamos lançando é a busca de arquivos, que facilita para os desenvolvedores levar todos os seus dados, armazená-los em nosso sistema e extrair as informações corretas com alta precisão”, explicou Handa.

A ferramenta de busca de arquivos é precificada em $2,50 por mil consultas, com taxas de armazenamento de $0,10 por GB por dia (o primeiro GB é gratuito).

Os desenvolvedores também podem acessar o Uso de Computador, a tecnologia que alimenta o Operador da OpenAI

A ferramenta de uso de computador expande as capacidades do agente além de tarefas simples baseadas em texto, permitindo que a IA interaja com interfaces de computador.

Alimentada pelo modelo de agente que usa computador (CUA) da OpenAI, essa ferramenta traduz ações geradas por IA em comandos executáveis, permitindo a automação de tarefas como entrada de dados e navegação na web.

“Estamos também lançando uma ferramenta de uso de computador, permitindo que modelos interajam com interfaces gráficas de usuário quando não há uma API existente para uma tarefa”, observou Handa.

A ferramenta de uso de computador está atualmente disponível como uma prévia de pesquisa para desenvolvedores selecionados nas faixas de uso 3-5. A precificação é de $3 por milhão de tokens de entrada e $12 por milhão de tokens de saída.

O que isso significa para líderes empresariais

Para líderes de equipes de TI, CTOs e gerentes de nível médio que buscam otimizar fluxos de trabalho, as novas ferramentas da OpenAI oferecem um caminho claro para automatizar e escalar processos impulsionados por IA sem exigir desenvolvimento personalizado extenso.

As capacidades integradas de busca na web e busca de arquivos permitem que as empresas integrem rapidamente a recuperação de informações alimentadas por IA em seus sistemas existentes, enquanto a ferramenta de uso de computador permite interações automatizadas com aplicações legadas que não possuem acesso à API.

O SDK de Agentes de código aberto ainda capacita as organizações a coordenar fluxos de trabalho impulsionados por IA entre equipes, tornando mais fácil implantar agentes que melhoram a eficiência em áreas como suporte ao cliente, processamento de documentos e pesquisa de mercado.

Com segurança empresarial e observabilidade integradas nessas ferramentas, os tomadores de decisão podem adotar soluções de IA com maior transparência e controle, garantindo conformidade e monitoramento de desempenho em escala.

O que vem a seguir?

A OpenAI vê esses novos lançamentos como o primeiro passo na construção de uma plataforma abrangente para agentes de IA. A empresa planeja lançar ferramentas e integrações adicionais nos próximos meses para ajudar desenvolvedores a implantar, avaliar e escalar aplicações de agentes de forma mais eficaz.

“Acreditamos que os próximos meses serão críticos para implantar mais e mais agentes em escala”, disse Godement. “Já fizemos isso com agentes de primeira linha como a Pesquisa Profunda, mas a OpenAI não vai construir todos os agentes – é por isso que temos uma plataforma para desenvolvedores.”

A OpenAI também afirmou que continuará a melhorar as características de segurança para aplicações de agentes, incluindo salvaguardas para injeções de prompt e acesso não autorizado a dados.

Desenvolvedores interessados em construir com as novas ferramentas podem explorar a documentação e o playground da API da OpenAI para começar hoje.

Fonte

Compartilhe esse conteúdo: