Não faltam startups tentando criar assistentes de IA para empresas. O que é menos comum é um assistente de IA que realmente pode executar tarefas em vários de seus aplicativos de trabalho ao mesmo tempo. Essa é a proposta da Narada AI, uma startup que está construindo um assistente de IA com base em uma nova pesquisa da UC Berkeley.
A Narada operou em modo stealth por dois anos e fez sua estreia pública hoje no palco como parte do Startup Battlefield 20 no TechCrunch Disrupt 2024.
Dois de seus cofundadores, Kurt Keutzer e Amir Gholami, co-autores de um artigo no início deste ano sobre ‘Compiladores LLM’, que são sistemas de IA que realizam várias funções simultaneamente. A startup é amplamente baseada nessa técnica de código aberto e acredita que esse é um diferencial importante em relação aos chatbots de IA de propósito geral.
O cofundador e CEO da startup, Dave Park, diz que sua equipe usou isso como base para construir um modelo de IA personalizado que pode usar ferramentas de produtividade. Park, doutor em ciência da computação pela Stanford, que passou 24 anos trabalhando em vendas empresariais, acredita que o Compilador LLM e a capacidade da Narada de usar sites sem APIs são o ‘segredo’ da empresa para vencer a corrida dos agentes empresariais.
A ideia parece promissora, mas como o agente realmente funciona? Na prática, eu descobri que o assistente era capaz de executar algumas tarefas diferentes usando IA generativa através de vários aplicativos de trabalho, economizando alguns segundos ou minutos em várias partes do meu dia.
O assistente se senta em uma janela de chat separada no seu navegador e pode redigir e-mails, fazer convites de calendário, tomar notas de reuniões e pesquisar na web em seu nome. A empresa afirma que seu assistente também pode navegar em aplicativos empresariais, como encontrar uma fatura no SAP, tomar notas em uma videochamada ou analisar informações de vários aplicativos da Salesforce.
Eu pedi ao assistente de IA para redigir um e-mail amigável recusando um convite que recebi. Em segundos, um e-mail redigido apareceu no meu Gmail com o destinatário correto (mesmo que eu não tivesse dito o e-mail da pessoa, ele encontrou o correto), assunto e corpo tudo preenchido com minha assinatura na parte inferior. Tudo o que eu precisei fazer foi revisar e clicar em enviar.
Em outra ocasião, pedi ao assistente de IA para encontrar um restaurante japonês altamente avaliado na minha vizinhança em São Francisco e reservar um convite de calendário para jantar com um amigo em um horário que funcionasse com minha agenda. Ele encontrou um restaurante, criou o convite de calendário e redigiu um e-mail para meu amigo com as informações.
Então, como o agente está fazendo tudo isso?
Para usar seu e-mail e calendário, o agente está usando parcialmente APIs para acessar esses programas por meio de um back-end voltado para desenvolvedores. No entanto, Park diz que seu agente de IA também está clicando, rolando e digitando pela interface de sites (é assim que ele está abrindo rascunhos de e-mail no Gmail, por exemplo). Este agente de front-end, que eles chamam de Web Redemption, deve permitir que a Narada use aplicativos empresariais sem APIs, como o HubSpot.
Gholami, o CTO da startup, diz que o agente funciona como um Roomba, criando um mapa interno para entender novos sites ou aplicativos. Assim que um usuário diz à Narada que gostaria de usar um novo aplicativo, o agente supostamente o mapeia para que possa entender como usá-lo. Essa é a ideia que os fundadores apresentaram para mim.
Mas a Narada está longe de ser a única startup tentando criar um agente de IA que pode usar sites pela interface. É semelhante à ideia por trás do uso de computadores da Anthropic ou do LAM da Rabbit. No entanto, esses agentes são difíceis de implementar na prática e exigem muita manutenção para mantê-los funcionando. Se as páginas da web atualizarem seu layout, isso pode quebrar o agente.
A principal diferença para o agente da Narada é que ele está focado exclusivamente em aplicativos empresariais, em vez de ser um agente de propósito geral para qualquer site. (Quando tentei usar a Narada para LinkedIn ou Facebook, recebi uma mensagem de erro, embora haja uma demonstração no site da empresa onde um engenheiro consegue usar a ferramenta com o LinkedIn.)
Quanto ao Compilador LLM, pessoas da indústria já parecem estar implementando o método de código aberto. Gholami diz ao TechCrunch que LangChain e LlamaIndex já têm integrações com o Compilador LLM. Mas a ferramenta da Narada é única em relação a essas ferramentas porque é focada na empresa – a startup já tem uma empresa da Fortune 500 usando seu agente, mas não revelou qual.
Portanto, isso é um substituto para um assistente de vida real? Não realmente. No entanto, a ferramenta às vezes parecia ser um atalho para tarefas mundanas, o que é mais do que posso dizer para muitas ferramentas de IA hoje.
Uma coisa que me deixou um pouco desconfortável foi quanta acesso tive que dar a este assistente de IA. A Narada pode ler todos os meus e-mails, pode ver meu calendário inteiro e conhece toda a minha lista de contatos.
Como qualquer ‘assistente inteligente’ ou aplicativo de ajuda como este, você tem que confiar não apenas na tecnologia, mas na própria empresa – que a Narada não abusará de seus dados, ou dos dados de sua empresa. Dito isso, a empresa promete não treinar seus modelos de IA com dados de clientes.
Até agora, a Narada diz que levantou alguns milhões de dólares de alguns conselheiros que trouxe a bordo, mas o CEO diz que agora está procurando levantar mais de investidores de capital de risco tradicionais.