O Google pode apresentar sua própria versão do conceito de grande modelo de ação do Rabbit já em dezembro, relata o The Information. “Projeto Jarvis”, como é supostamente chamado, realizaria tarefas para os usuários, incluindo “coletar pesquisas, comprar um produto ou reservar um voo”, de acordo com três pessoas com conhecimento direto do projeto com quem o veículo conversou.
Impulsionado por uma versão futura do Gemini do Google, o Jarvis supostamente funciona apenas com um navegador da web (está ajustado especificamente para o Chrome). A ferramenta visa ajudar as pessoas a “automatizar tarefas diárias baseadas na web” ao tirar e interpretar capturas de tela e, em seguida, clicar em botões ou inserir texto, escreve o The Information. Em seu estado atual, aparentemente leva “alguns segundos” entre as ações.
As maiores empresas de IA estão todas trabalhando em modelos que fazem coisas semelhantes ao que o The Information está descrevendo. O Copilot Vision da Microsoft permitirá que você converse com ele sobre páginas da web que está visualizando. A Inteligência da Apple deve estar ciente do que está na sua tela e fazer coisas por você em vários aplicativos em algum momento no próximo ano. A Anthropic lançou uma atualização beta “incômoda e propensa a erros” do Claude que pode usar um computador para você, e a OpenAI também está supostamente trabalhando em uma versão disso.
O The Information alerta que o plano do Google de mostrar o Jarvis em dezembro está sujeito a mudanças. A empresa está supostamente considerando liberá-lo para um pequeno número de testadores para encontrar e ajudar a empresa a resolver bugs.