Meta acaba de vencer o Google e a Apple na corrida para colocar IA poderosa nos telefones

Meta Platforms criou versões menores de seus modelos de inteligência artificial Llama que podem rodar em smartphones e tablets, abrindo novas possibilidades para IA além dos data centers.

A empresa anunciou versões compactadas de seus modelos Llama 3.2 1B e 3B hoje, que rodam até quatro vezes mais rápido enquanto usam menos da metade da memória das versões anteriores. Esses modelos menores apresentam desempenho quase tão bom quanto suas contrapartes maiores, de acordo com os testes da Meta.

O avanço utiliza uma técnica de compressão chamada quantização, que simplifica os cálculos matemáticos que alimentam os modelos de IA. A Meta combinou dois métodos: Treinamento Consciente de Quantização com adaptadores LoRA (QLoRA) para manter a precisão e SpinQuant para melhorar a portabilidade.

Essa conquista técnica resolve um problema chave: rodar IA avançada sem um poder computacional massivo. Até agora, modelos de IA sofisticados exigiam data centers e hardware especializado.

Testes em telefones Android OnePlus 12 mostraram que os modelos compactados eram 56% menores e usavam 41% menos memória enquanto processavam texto mais de duas vezes mais rápido. Os modelos podem lidar com textos de até 8.000 caracteres, o suficiente para a maioria dos aplicativos móveis.

Os modelos de IA compactados da Meta (SpinQuant e QLoRA) mostram melhorias dramáticas em velocidade e eficiência em comparação com as versões padrão quando testados em telefones Android. Os modelos menores rodam até quatro vezes mais rápido enquanto usam metade da memória.

A liberação da Meta intensifica uma batalha estratégica entre grandes empresas de tecnologia para controlar como a IA opera em dispositivos móveis. Enquanto Google e Apple adotam abordagens cuidadosas e controladas para a IA móvel — mantendo-a estritamente integrada com seus sistemas operacionais — a estratégia da Meta é marcadamente diferente.

Ao tornar esses modelos compactados de código aberto e fazer parcerias com fabricantes de chips Qualcomm e MediaTek, a Meta contorna os gatekeepers tradicionais da plataforma. Desenvolvedores podem criar aplicativos de IA sem esperar pelas atualizações do Android do Google ou pelos recursos do iOS da Apple. Esse movimento ecoa os primeiros dias dos aplicativos móveis, quando plataformas abertas aceleraram dramaticamente a inovação.

As parcerias com Qualcomm e MediaTek são particularmente significativas. Essas empresas alimentam a maioria dos telefones Android do mundo, incluindo dispositivos em mercados emergentes onde a Meta vê potencial de crescimento. Ao otimizar seus modelos para esses processadores amplamente utilizados, a Meta garante que sua IA possa rodar de forma eficiente em telefones de diferentes faixas de preço — não apenas em dispositivos premium.

A decisão de distribuir os modelos através do site Llama da Meta e do Hugging Face, o hub de modelos de IA cada vez mais influente, mostra o compromisso da Meta em alcançar desenvolvedores onde eles já trabalham. Essa estratégia de distribuição dupla pode ajudar os modelos compactados da Meta a se tornarem o padrão de fato para o desenvolvimento de IA móvel, assim como TensorFlow e PyTorch se tornaram padrões para aprendizado de máquina.

O anúncio da Meta hoje aponta para uma mudança maior na inteligência artificial: a transição do computação centralizada para a computação pessoal. Enquanto a IA baseada em nuvem continuará a lidar com tarefas complexas, esses novos modelos sugerem um futuro onde os telefones possam processar informações sensíveis de forma privada e rápida.

O momento é significativo. As empresas de tecnologia enfrentam uma pressão crescente sobre a coleta de dados e a transparência da IA. A abordagem da Meta — tornando essas ferramentas abertas e rodando-as diretamente nos telefones — aborda ambas as preocupações. Seu telefone, e não um servidor distante, pode em breve lidar com tarefas como resumir documentos, analisar textos e escrever criativamente.

Isso reflete outras mudanças fundamentais na computação. Assim como o poder de processamento se moveu de mainframes para computadores pessoais, e a computação se deslocou de desktops para smartphones, a IA parece pronta para sua própria transição para dispositivos pessoais. A aposta da Meta é que os desenvolvedores abracem essa mudança, criando aplicativos que misturam a conveniência dos aplicativos móveis com a inteligência da IA.

O sucesso não é garantido. Esses modelos ainda precisam de telefones poderosos para funcionar bem. Os desenvolvedores devem ponderar os benefícios da privacidade contra o poder bruto da computação em nuvem. E os concorrentes da Meta, especialmente Apple e Google, têm suas próprias visões para o futuro da IA nos telefones.

Mas uma coisa é clara: a IA está se libertando do data center, um telefone de cada vez.

Fonte

Compartilhe esse conteúdo: