.
Na terça -feira, o OpenAI lançou novas ferramentas projetadas para ajudar desenvolvedores e empresas a criar agentes de IA – sistemas automatizados que podem realizar tarefas independentemente – usando os próprios modelos e estruturas de IA da empresa.
As ferramentas fazem parte da nova API de respostas do OpenAI, que permite que as empresas desenvolvam agentes de IA personalizados que possam executar pesquisas na Web, examinar os arquivos da empresa e navegar em sites, assim como o produto da operadora da OpenAI. A API de respostas substitui efetivamente a API de assistentes do OpenAI, que a empresa planeja o pôr do sol na primeira metade de 2026.
O hype em torno dos agentes da IA cresceu dramaticamente nos últimos anos, apesar de o setor de tecnologia ter lutado para mostrar às pessoas, ou mesmo definir, o que realmente são os “agentes da IA”. No exemplo mais recente do hype do agente, com a utilidade, a startup chinesa Butterfly Effect no início desta semana se tornou viral para uma nova plataforma de agente de IA chamada Manus que os usuários descobriram rapidamente que não cumpriram muitas das promessas da empresa.
Em outras palavras, as apostas são altas para o OpenAI acertar os agentes.
“É muito fácil demonstrar seu agente”, disse Olivier Godemont, chefe de produto da API da Openai, ao Strong The One em uma entrevista. “Escalar um agente é muito difícil e fazer com que as pessoas o usem geralmente são muito difíceis.”
No início deste ano, o OpenAI introduziu dois agentes de IA no ChatGPT: Operator, que navega em sites em seu nome, e pesquisas profundas, que compilam relatórios de pesquisa para você. Ambas as ferramentas ofereceram um vislumbre do que a tecnologia Agentic pode alcançar, mas deixou um pouco a desejar no departamento de “autonomia”.
Agora, com a API de respostas, o OpenAI deseja vender acesso aos componentes que alimentam os agentes da IA, permitindo que os desenvolvedores construam seus próprios aplicativos agênticos de operador e profundo no estilo de pesquisa. O OpenAI espera que os desenvolvedores possam criar alguns aplicativos com sua tecnologia de agentes que parecem mais autônomos do que o que está disponível hoje.
Usando a API de respostas, os desenvolvedores podem tocar nos mesmos modelos de IA (em visualização) sob o capô do OpenAI, a Ferramenta de Pesquisa da Web do ChatGPT: Pesquisa GPT-4O e pesquisa GPT-4O Mini. Os modelos podem navegar na Web para obter respostas a perguntas, citando fontes enquanto geram respostas.
O OpenAI afirma que a pesquisa do GPT-4O e a pesquisa do Mini GPT-4O são altamente precisas de fato. No benchmark SimpleQA da empresa, que mede a capacidade dos modelos de responder a perguntas curtas e de busca de fatos, o GPT-4O de pesquisa pontua 90%, enquanto o GPT-4O Mini Pesquisa pontuações 88% (mais alto é melhor). Para comparação, o GPT-4.5-o modelo muito maior e muito maior do OpenAI-recebe apenas 63%.
O fato de as ferramentas de pesquisa movidas a IA serem mais precisas do que os modelos tradicionais de IA não é necessariamente surpreendente-em teoria, a pesquisa do GPT-4O pode apenas procurar a resposta certa. No entanto, a pesquisa na web não torna as alucinações um problema resolvido. Além de sua precisão factual, as ferramentas de pesquisa de IA também tendem a lutar com consultas curtas e de navegação (como “Lakers Score hoje”), e relatórios recentes sugerem que Citações de Chatgpt nem sempre são confiáveis.
A API de respostas também inclui um utilitário de pesquisa de arquivos que pode escanear rapidamente os arquivos nos bancos de dados de uma empresa para recuperar informações. (O OpenAI afirma que não treinará modelos nesses arquivos.) Além disso, os desenvolvedores que usam a API de respostas podem tocar no modelo de agente de uso de computador (CUA) da OpenAI, que alimenta o operador. O modelo gera ações de mouse e teclado, permitindo que os desenvolvedores automatizem tarefas de uso do computador, como entrada de dados e fluxos de trabalho do aplicativo.
Opcionalmente, as empresas podem executar o modelo CUA, que está lançado em pré -visualização de pesquisa, localmente em seus próprios sistemas, disse o Openai. A versão do consumidor do CUA disponível no operador só pode tomar ações na web.
Para ficar claro, a API de respostas não resolverá todos os problemas técnicos que assolam os agentes da IA hoje.
Embora as ferramentas de pesquisa movidas a IA sejam mais precisas do que os modelos tradicionais de IA-um fato que não é surpreendente, pois eles podem apenas procurar a resposta certa-a pesquisa da web não torna as alucinações de AI um problema resolvido. A pesquisa do GPT-4O ainda recebe 10% das perguntas factuais erradas. Além de sua precisão, as ferramentas de pesquisa de IA também tendem a lutar com consultas curtas e de navegação (como “Lakers Score hoje”), e relatórios recentes sugerem que Citações de Chatgpt nem sempre são confiáveis.
Em uma postagem de blog fornecida ao Strong The One, o OpenAI disse que o modelo CUA “ainda não é altamente confiável para automatizar tarefas em sistemas operacionais” e que é suscetível a cometer erros “inadvertidos”.
No entanto, o OpenAI disse que essas são iterações precoces de suas ferramentas de agentes, e está constantemente trabalhando para melhorá -las.
Juntamente com a API de respostas, o OpenAI está lançando um kit de ferramentas de código aberto chamado agentes SDK, que oferece aos desenvolvedores ferramentas gratuitas para integrar modelos com seus sistemas internos, implementar salvaguardas e monitorar atividades de agentes de IA para fins de depuração e otimização. O SDK dos agentes é uma espécie de acompanhamento do Swarm do OpenAI, uma estrutura para orquestração multi-agente que a empresa divulgou no final do ano passado.
Godemont disse que espera que o OpenAI possa preencher a lacuna entre demos e produtos de agentes de IA este ano, e que, em sua opinião, “os agentes são a aplicação mais impactante da IA que acontecerá”. Isso ecoa um CEO da Proclamação Openai, Sam Altman, feito em janeiro: Esse 2025 é o ano em que os agentes da IA entram na força de trabalho.
Se o 2025 realmente se torna o “ano do agente da IA”, os lançamentos mais recentes da OpenAI mostram que a empresa deseja mudar de demos chamativos de agentes para ferramentas impactantes.
.