O Alexa da Amazon foi anunciado em 6 de novembro de 2014. Um projeto de paixão para seu fundador, Jeff Bezos, o assistente de voz digital da Amazon foi inspirado e aspirava ser o “Computador” de Star Trek — uma inteligência artificial onisciente, onipresente e proativa controlada pela sua voz. “Tem sido um sonho desde os primeiros dias da ficção científica ter um computador com o qual você possa falar de uma maneira natural e realmente pedir que ele tenha uma conversa com você e peça que ele faça coisas para você”, disse Bezos logo após o lançamento do Alexa. “E isso está se tornando realidade.”
Na época, esse futuro parecia ao alcance. Nos meses seguintes ao lançamento do Alexa, ele surpreendeu os primeiros compradores com suas capacidades. Tocar música, obter a previsão do tempo e configurar um timer eram, de repente, experiências sem mãos. Embalado dentro de um alto-falante em forma de lata de Pringles chamado Echo, o Alexa se mudou para 5 milhões de casas em apenas dois anos, incluindo a minha.
O Alexa ainda faz principalmente o que sempre fez: tocar música, relatar o tempo e configurar timers. Avançamos para hoje, e há mais de 40 milhões de alto-falantes Echo em lares nos EUA, com o Alexa processando bilhões de comandos por semana globalmente. Mas, apesar dessa proliferação de produtos e popularidade, o “assistente sobre-humano que está lá quando você precisa, desaparece quando você não precisa e está sempre trabalhando nos bastidores em seu nome” que a Amazon prometeu simplesmente não está aqui.
O Alexa ainda faz principalmente o que sempre fez: tocar música, relatar o tempo e configurar timers. Suas capacidades se expandiram — o Alexa agora pode fazer coisas úteis como controlar suas luzes, ligar para sua mãe e lembrá-lo de tirar o lixo. Mas, apesar de um investimento significativo de tempo, dinheiro e recursos ao longo da última década, o assistente de voz não se tornou visivelmente mais inteligente. Como disse um ex-funcionário da Amazon, “Nos preocupamos que contratamos 10.000 pessoas e construímos um timer inteligente.”
É decepcionante. O Alexa tem tanto potencial. Embora suas capacidades sejam indiscutivelmente impressionantes — e indispensáveis para muitas pessoas (particularmente em áreas como acessibilidade e cuidados para idosos) — ainda é basicamente um controle remoto em nossas casas. Estou mantendo a esperança do sonho de um computador ambiente altamente capaz — uma inteligência artificial que ajudará a gerenciar nossas vidas e lares tão perfeitamente quanto o Capitão Picard administrava a USS Enterprise. (Somente de preferência com menos alertas vermelhos).
Hoje, posso ter um alto-falante inteligente Alexa em cada cômodo da minha casa, mas isso não o tornou mais útil. O Alexa ganhou milhares de habilidades ao longo dos últimos anos, mas ainda não confio nele para fazer nada mais complicado do que executar um comando em uma programação, adicionar leite à minha lista de compras e talvez me dizer se uvas são venenosas para galinhas. (Elas não são, mas o Alexa diz que eu deveria verificar com meu veterinário para ter certeza.) Se alguma coisa, na véspera do aniversário de 10 anos do assistente de voz, o sonho original do Alexa parece mais distante.
Meu primeiro Echo chegou debaixo da árvore de Natal em 2015. Uma década depois, e ele ainda está funcionando.
É fácil esquecer como o Alexa foi revolucionário quando apareceu pela primeira vez. Em vez de estar preso em um telefone como a Siri da Apple ou em um computador como a Cortana da Microsoft, o Alexa veio dentro do Echo, o primeiro alto-falante ativado por voz do mundo. Seu reconhecimento de fala de campo distante, alimentado por uma matriz de sete microfones, era realmente impressionante — usá-lo parecia quase mágico. Você podia gritar para um Echo de qualquer lugar de um cômodo, e aquele anel azul brilhante se acenderia (quase) sempre, sinalizando que o Alexa estava pronto para contar uma piada ou configurar aquele timer de ovo.
Foi a mudança da Amazon para o controle da casa inteligente que forneceu as primeiras pistas do prometido futuro ao estilo de Star Trek. Piadas bobas e conhecimento enciclopédico à parte, o lançamento de uma API para casa inteligente do Alexa em 2016, seguido pelo Echo Plus embalando um rádio Zigbee em 2017, permitiu que o assistente se conectasse e controlasse dispositivos em nossas casas. Dizer “Alexa, Chá. Earl Grey. Quente.” e ter uma xícara quente em suas mãos alguns momentos depois parecia mais próximo do que nunca.
Isso foi genuinamente emocionante. Embora o chá de um replicador não estivesse aqui ainda, pedir ao Alexa para desligar as luzes enquanto está sentado no sofá ou aumentar o termostato sem sair de debaixo das cobertas parecia viver no futuro. Finalmente, tínhamos algo que se assemelhava ao “Computador” de Star Trek em nossas casas — a Amazon até deixou que o chamássemos de “Computador.”
Em retrospectiva, o Alexa trouxe consigo os começos da casa inteligente moderna. O controle de voz simples tornou a Internet das Coisas acessível; trouxe tecnologia para o lar sem estar trancada atrás de uma interface de computador complicada ou dentro de um dispositivo pessoal. Além disso, a abordagem aberta da Amazon para a casa conectada — em um momento de ecossistemas de casas inteligentes proprietários — ajudou a estimular uma onda de novos dispositivos conectados de nível consumidor. Nest, August, Philips Hue, Ecobee, Lutron e LiFX devem em parte seu sucesso à facilidade de operação do Alexa.
Mas o ecossistema que surgiu em torno do Alexa cresceu rápido demais. Qualquer um podia desenvolver capacidades (que a Amazon chama de habilidades) para o assistente com pouca supervisão. Enquanto algumas habilidades eram simples e divertidas, muitas eram com problemas e não confiáveis, e uma redação específica era necessária para evocar cada uma. Tudo isso se acumulava em uma experiência inconsistente e, muitas vezes, frustrante.
Pedir ao Alexa para aumentar seu termostato sem sair de debaixo das cobertas parecia viver no futuro.
Então, o Alexa atingiu um parede. Há uma suposição com a tecnologia de que ela continuará melhorando. Mas, em vez de desenvolver a tecnologia central, a Amazon confiou em desenvolvedores terceirizados para fazer o Alexa fazer mais, concentrando seus recursos em colocar o assistente em mais dispositivos e torná-lo capaz de controlar mais coisas.
Quanto mais dispositivos funcionavam com o Alexa e mais capacidades a Amazon adicionava à plataforma, mais difícil se tornava gerenciá-los, controlá-los e acessá-los todos. O controle por voz é ótimo para comandos simples, mas sem maneiras mais fáceis de falar com o Alexa, esses novos recursos eram perdidos na maioria dos usuários.
Rotinas do Alexa surgiram como uma solução para reunir todos os diferentes gadgets e funções que você poderia usar o Alexa. Mas isso exigia que você passasse tempo programando em um aplicativo, além de estar constantemente solucionando problemas de dispositivos e sua conectividade.
Ouvir “‘Lâmpada’ não está respondendo. Verifique a conexão da rede e a fonte de energia” após emitir um comando é além de frustrante. E passar horas por mês configurando e solucionando problemas de sua casa inteligente não fazia parte da promessa. Isso é o que um computador inteligente deveria ser capaz de fazer por você.
Nós tivemos que aprender como falar com o Alexa, em vez de o Alexa aprender a falar conosco.
A boa notícia, pelo menos nesse aspecto, é que a tecnologia está alcançando. Modelos de linguagem grandes e IA generativa poderiam nos trazer um Alexa com o qual podemos conversar de forma mais natural. No ano passado, a Amazon anunciou que está trabalhando em um “novo” Alexa alimentado por LLM que é mais proativo e conversacional e menos pedestre e transacional.
Isso por si só seria um grande avanço. Mas, embora a IA generativa possa tornar os assistentes de voz mais inteligentes, não é uma solução mágica. LLMs resolvem o problema básico de “entender a linguagem”, mas eles não — ainda — têm a capacidade de agir com base nessa linguagem, sem mencionar as preocupações sobre uma IA poderosa alucinar em sua casa.
O que o Alexa realmente precisa para se tornar “Computador” é contexto. Para ser eficaz, um assistente de voz onisciente precisa saber tudo sobre você, sua casa e as pessoas e dispositivos nela. Essa é uma tarefa difícil. E embora os alto-falantes Echo com tecnologia de ultrassom e sensores domésticos possam fornecer algum contexto, há uma área crucial onde a Amazon está muito atrasada em relação à concorrência: você.
Diferentemente do Google e da Apple — que têm acesso a dados sobre você através de seu smartphone, calendário, e-mail ou pesquisas na internet — a Amazon está, em grande parte, excluída de sua vida pessoal além do que você compra em sua loja ou de dados específicos aos quais você dá acesso a ela. E seus erros de privacidade impediram as pessoas de confiarem nela.
Mas o Google e a Apple não conseguiram decifrar a casa inteligente ainda, e enquanto eles estão fazendo movimentos sérios nesse espaço, o Alexa ainda tem uma considerável vantagem. De acordo com a Amazon, o “Novo Alexa” pode completar rotinas de múltiplos passos que você pode criar apenas listando tarefas. Adicione contexto sobre quem vive em sua casa, onde eles estão a qualquer momento e o que eles deveriam estar fazendo, e é viável que o assistente possa lidar com uma tarefa como esta com apenas um comando:
Alexa, diga ao meu filho para não esquecer seu projeto de ciências; configure o alarme quando ele sair. Desarme o alarme e desbloqueie a porta de trás para o encanador às 16h, depois tranque novamente às 17h. Preaqueça o forno a 190 graus às 18h, mas se eu estiver atrasado, ajuste o tempo.
Esse tipo de capacidade traria um novo nível de utilidade ao Alexa, talvez o suficiente para justificar a cobrança por isso, como a empresa disse que planeja fazer.
É hora do Alexa ir ousadamente onde nenhum assistente de voz foi antes.
No entanto, apesar do lançamento chamativo do ano passado deste assistente alimentado por LLM, não ouvimos mais nada. A Amazon até pulou seu grande evento de hardware este ano, onde tradicionalmente anuncia dezenas de novos dispositivos e serviços compatíveis com o Alexa. Isso provavelmente se deve ao fato de que, com base em relatórios, a Amazon está longe de alcançar seu prometido “Novo Alexa”.
Mas precisa realizar a prometida reinvenção do Alexa, ou a Apple e o Google a superarão.
Em 2014, a Amazon preparou o cenário para o controle por voz em casa e, ao longo da última década, lançou as bases para uma casa mais inteligente. Hoje, o Alexa é o assistente de voz mais popular dentro de um alto-falante inteligente — com mais de dois terços do mercado dos EUA. Fora de casa, o Assistente do Google e a Siri da Apple dominam. À medida que essas empresas investem mais na casa inteligente e eventualmente trazem a Inteligência da Apple e a inteligência do Gemini para seus produtos domésticos, os dias de domínio do Alexa podem estar contados.
O caminho para uma casa inteligente, consciente de contexto e alimentada por IA generativa é repleto de obstáculos, mas com toda a sua história aqui, a Amazon parece estar melhor posicionada para concretizá-la — se conseguir sair do seu próprio caminho. A casa é a última fronteira, e é hora do Alexa ir ousadamente onde nenhum assistente de voz foi antes e se tornar verdadeiramente inteligente.