O Google lançou o Gemini 2.0, seu novo modelo de IA para praticamente tudo

O mais recente modelo de IA do Google tem muito trabalho a fazer. Como todas as outras empresas na corrida da IA, o Google está construindo a IA em praticamente todos os produtos que possui, tentando criar produtos que outros desenvolvedores queiram usar e correndo para estabelecer toda a infraestrutura para tornar essas coisas possíveis sem que sejam tão caras que levem a empresa à falência. Enquanto isso, a Amazon, Microsoft, Anthropic e OpenAI estão despejando seus próprios bilhões na mesma gama de problemas.

Isso pode explicar por que Demis Hassabis, o CEO do Google DeepMind e responsável por todos os esforços de IA da empresa, está tão empolgado com quão abrangente é o novo modelo Gemini 2.0. O Google está lançando o Gemini 2.0 na quarta-feira, cerca de 10 meses após o primeiro lançamento do 1.5. Ele ainda está no que o Google chama de ‘preview experimental’, e apenas uma versão do modelo – o 2.0 Flash, de menor capacidade – está sendo lançada. Mas Hassabis afirma que ainda é um grande dia.

‘Efetivamente’, diz Hassabis, ‘é tão bom quanto o modelo Pro atual. Então, você pode pensar nisso como um nível inteiro melhor, pelo mesmo custo e eficiência de desempenho e velocidade. Estamos realmente felizes com isso.’ E não só é melhor em fazer as coisas antigas que o Gemini poderia fazer, mas também pode fazer novas coisas. O Gemini 2.0 agora pode gerar audio e imagens nativamente, e traz novas capacidades multimodais que Hassabis diz que estabelecem as bases para a próxima grande novidade em IA: agentes.

IA agente, como todos chamam, refere-se a bots de IA que podem realmente ir e realizar tarefas em seu nome. O Google tem demonstrado um, o Projeto Astra, desde a primavera – é um sistema visual que pode identificar objetos, ajudar você a navegar pelo mundo e dizer onde você deixou seus óculos. O Gemini 2.0 representa uma enorme melhoria para o Astra, diz Hassabis.

O Google também está lançando o Projeto Mariner, uma nova extensão experimental do Chrome que pode literalmente usar seu navegador da web por você. Há também Jules, um agente especificamente para ajudar desenvolvedores a encontrar e corrigir códigos ruins, e um novo agente baseado no Gemini 2.0 que pode olhar para sua tela e ajudá-lo a jogar video games melhor. Hassabis chama o agente de jogo de ‘um Easter egg’, mas também aponta para isso como o tipo de coisa que um modelo verdadeiramente multimodal, embutido, pode fazer por você.

‘Veemos 2025 como o verdadeiro começo da era baseada em agentes’, diz Hassabis, ‘e o Gemini 2.0 é a fundação disso.’ Ele tem cuidado em notar que o desempenho não é a única atualização aqui; enquanto a conversa sobre uma desaceleração em todo o setor nas melhorias dos modelos continua, ele afirma que o Google ainda está vendo ganhos à medida que treina novos modelos, mas ele está igualmente empolgado com as melhorias de eficiência e velocidade.

O plano do Google para o Gemini 2.0 é usá-lo em absolutamente todos os lugares.

Isso não vai te surpreender, mas o plano do Google para o Gemini 2.0 é usá-lo em absolutamente todos os lugares. Ele irá alimentar as Visões de IA na Pesquisa do Google, que o Google diz agora alcançar 1 bilhão de pessoas e que a empresa afirma que agora será mais nuançado e complexo graças ao Gemini 2.0. Estará no bot e aplicativo Gemini, é claro, e eventualmente alimentará os recursos de IA no Workspace e em outros lugares no Google. O Google trabalhou para trazer o maior número possível de recursos para dentro do modelo em si, em vez de executar uma série de produtos individuais e isolados, a fim de poder fazer mais com o Gemini em mais lugares. A multimodalidade, os diferentes tipos de saídas, os recursos – o objetivo é colocar tudo isso no modelo fundamental do Gemini. ‘Estamos tentando construir o modelo mais geral possível’, diz Hassabis.

À medida que a era agente da IA começa, Hassabis diz que há problemas novos e antigos a serem resolvidos. Os antigos são eternos, sobre desempenho, eficiência e custo de inferência. Os novos são em muitos aspectos desconhecidos. Para citar um: quais riscos de segurança esses agentes irão representar no mundo operando por conta própria? O Google está tomando algumas precauções com o Mariner e Astra, mas Hassabis diz que há mais pesquisas a serem feitas. ‘Vamos precisar de novas soluções de segurança’, diz ele, ‘como testes em sandboxes resistentes. Eu acho que isso vai ser bastante importante para testar os agentes, em vez de deixá-los soltos… eles serão mais úteis, mas também haverá mais riscos.’

O Gemini 2.0 pode estar em uma fase experimental por enquanto, mas você já pode usá-lo selecionando o novo modelo no aplicativo web do Gemini. (Sem notícias ainda sobre quando você poderá experimentar os modelos não Flash.) E no início do próximo ano, Hassabis diz que ele estará disponível para outras plataformas Gemini, tudo o que mais o Google faz, e a internet inteira.

Fonte

Compartilhe esse conteúdo: