OpenAI Lança a Guerra do Navegador de IA

ChatGPT se libertou do chatbot. Na terça-feira, a OpenAI anunciou que está lançando um navegador web chamado ChatGPT Atlas, que diz que irá reimaginar a experiência de navegação desde o início, agora construído em torno de uma experiência baseada em chat para o que a empresa chamou de “próxima era da web.”

Durante uma demonstração, o Líder de Engenharia da Atlas, Ben Goodger, explicou que o Atlas é a resposta da empresa à pergunta: “E se você pudesse conversar com seu navegador?” Embora haja muitos elementos familiares de navegadores web no Atlas, incluindo abas, favoritos e preenchimento automático de senhas, a empresa fez do ChatGPT o centro da experiência, em vez de um “navegador antigo, apenas com um chatbot que foi anexado.” Isso começa na tela inicial, onde a barra de pesquisa padrão agora serve como uma barra de composição para se comunicar com o ChatGPT.

Os usuários podem usar comandos conversacionais para fazer o ChatGPT encontrar certas páginas da web, realizar uma pesquisa padrão na web ou ir diretamente para um site ou favorito. Na demonstração, o Designer Principal do Atlas, Ryan O’Rouke, explicou que os usuários devem ser capazes de usar “linguagem humana” para pesquisar tanto na web quanto em seu histórico de navegação (que a OpenAI chama de “memórias”) para encontrar páginas da web, documentos e informações através de informações contextuais. Por exemplo, a empresa mostrou como poderia encontrar um Google Doc sem saber o URL ou o nome exato do documento.

Os resultados de pesquisa no Atlas são exibidos em uma página inicial que curadoria uma variedade de informações da web com base no prompt do usuário. Os usuários também podem alternar entre resultados de pesquisa mais tradicionais, incluindo uma lista de links, imagens, vídeos ou histórias de notícias semelhantes ao Google Search.

O principal atrativo do Atlas é que um usuário poderá chamar o ChatGPT a qualquer momento enquanto navega na web e usar o chatbot para interagir com a página em que está. O CEO da OpenAI, Sam Altman, descreveu isso durante a demonstração como conversar com uma página da web. O chatbot pode ser convocado através de um botão no canto superior direito da tela no desktop e aparecerá como uma barra lateral. Uma vez aberto, um usuário pode pedir que resuma informações na página, faça perguntas específicas sobre a página e faça com que o chatbot puxe a resposta diretamente do site que o usuário está visualizando, e até mesmo interagir com a página por eles.

Esse recurso final é onde o Agente do ChatGPT entra. A OpenAI tem promovido seu novo recurso de Agente há meses, incluindo a introdução de um kit de ferramentas para Agentes durante seu recente evento DevDay para dar aos desenvolvedores a capacidade de construir seus próprios agentes de IA. Mas esse Agente será incorporado ao navegador, ativado na parte inferior da barra lateral do ChatGPT, e pode realizar tarefas em nome do usuário. Em uma demonstração do recurso, Will Ellsworth, Líder de Pesquisa do Agente Atlas, pediu ao agente que comprasse os ingredientes necessários para uma receita. Uma vez solicitado, o Agente navegou até o Instacart e comprou os ingredientes relevantes.

De acordo com a empresa, o Agente terá acesso às credenciais do usuário para que possa realizar tarefas em nome do usuário, embora haja prompts que exigirão que o usuário aprove certas ações. Os usuários podem assistir à tarefa sendo concluída pelo Agente em tempo real com o cursor se movendo visivelmente na página, ou podem deixar que ela ocorra em segundo plano. Se o usuário precisar intervir, pode retomar o controle a qualquer momento. Ellsworth descreveu o Agente como uma ferramenta para permitir “elevação de vibrações” e sugeriu que os usuários poderiam delegar “todo tipo de tarefas, tanto em sua vida pessoal quanto profissional, ao Agente no Atlas.”

O Atlas estará disponível imediatamente para macOS, com planos de trazer o navegador para Windows, iOS e Android “em breve.” Embora pareça que o navegador estará disponível para todos os usuários do ChatGPT, o Agente será pago, disponível apenas para assinantes Plus que pagam $20 por mês ou usuários Pro que pagam $200 por mês.

No início deste ano, o Google fez o seu melhor para antecipar essa inevitabilidade. A empresa anunciou uma reformulação de IA de seu navegador Chrome, que atualmente detém mais de 70% do total de participação de mercado de navegadores, incluindo a integração de seu chatbot Gemini em todo o navegador para fazer coisas como resumir páginas da web e realizar pesquisas contextuais dentro de uma página. A empresa também sugeriu que eventualmente incluirá um agente de IA capaz de navegar na web e completar tarefas em nome do usuário, embora esse recurso atualmente não esteja disponível. A Perplexity também possui um navegador primeiro em IA chamado Comet, enquanto empresas como Opera, Microsoft e The Browser Company integraram recursos de IA em seus respectivos navegadores.

Fonte

Compartilhe esse conteúdo: