O Gemini Live do Google pode conversar com você, mas eu não chamaria o chatbot de IA com som humano de um conversador estimulante. Apesar disso, o Google quer que você—pelo menos—imagine o Gemini Live como um verdadeiro companheiro. À medida que os modelos de IA da empresa se tornam mais capazes, as atualizações mais recentes do Gemini fazem parecer que o bot está ligando para você no seu telefone, em vez de você estar conversando com um modelo de IA baseado em nuvem.
Na semana passada, o Google atualizou seu modelo Gemini 2.0 Flash e o tornou disponível para qualquer pessoa que use o aplicativo Gemini, portanto, não é necessário pagar por uma assinatura. Parece haver uma atualização oculta entre essas mudanças, como evidenciado pelo 9to5Google, que descobriu que a empresa havia mudado as notificações do Gemini Live para que parecessem muito mais humanas do que antes.
Anteriormente, quando você saía do Gemini Live no Android enquanto o executava em segundo plano, isso aparecia como uma simples notificação com um botão para os usuários “Encerrar o modo Live”. Na nova versão do aplicativo, o Gemini Live aparece como uma chamada, com a opção de “Desligar” ou colocar a IA em “Espera”. Se você estiver executando o aplicativo a partir da tela de bloqueio, verá uma notificação para “Ao Vivo com Gemini” e uma nota de que a IA está “Ouvindo”.
É uma pequena mudança, mas ajuda a exemplificar como o Google posicionará sua IA em 2025. O Gemini Live pode conversar com os usuários e, recentemente, ganhou a capacidade de entender conteúdo de fotos ou vídeos enviados. Eventualmente, o Google quer adicionar capacidades de visão do assistente Project Astra da Google DeepMind. Com essas capacidades extras, o Gemini Live precisará operar em segundo plano sem interferir no uso normal do telefone.
O Google também está atualizando seu atual Gemini 2.0 para incluir vários modelos de IA menores e maiores para diferentes casos de uso. Em um post no blog na quarta-feira, a empresa mostrou sua nova versão “experimental” do Gemini 2.0 Pro, afirmando que é seu modelo mais poderoso para usuários até agora. O Gemini 2.0 Pro é principalmente voltado para codificadores e programadores, e deve estar disponível no aplicativo para qualquer pessoa que pague pelo Gemini Advanced. Se algum codificador quiser usar mais IA para se livrar de um trabalho de forma eficiente, aqui está uma nova opção para você.
Uma pergunta é se o modelo mais recente do Google é tão bom quanto afirma. No entanto, a empresa diz que supera o Gemini 2.0 Flash na maioria dos benchmarks, exceto em um que verificou sua capacidade de fornecer “respostas factualmente corretas dadas documentos e solicitações de usuários diversas”. Por outro lado, está o Gemini 2.0 Flash-Lite, que o Google afirma ter os mesmos requisitos de energia, mas respostas muito mais precisas do que o Gemini 1.5 Flash. Os novos modelos chegaram após a OpenAI mostrar ao público seu modelo de raciocínio o3. Na semana passada, a empresa lançou seu modelo de raciocínio em miniatura o3-mini.
O grande recurso de lançamento do telefone Galaxy S25 da Samsung foi as capacidades de aplicativos cruzados com o Gemini. Com um longo pressionar do botão de energia, você pode realizar ações simples, como transformar uma mensagem de texto em um convite de calendário sem usar as mãos. No entanto, nos próprios testes do Gizmodo, os recursos de IA eram muito mais mundanos. A IA é menos capaz de lidar com tarefas mais complexas. Se você está gastando tempo verificando o trabalho da IA, pode muito bem realizar a tarefa você mesmo.
O Google guardará seus melhores recursos de IA móvel para mais tarde este ano, mais perto do Google I/O 2025 e do lançamento esperado do Pixel 10. Comparado às capacidades medianas dos telefones da Samsung, o Google estará buscando impressionar o público com suas capacidades de IA. Teremos que esperar para ver se todo esse esforço e hype valeram a pena.