O ex-CEO da Intel, Pat Gelsinger, já está usando o DeepSeek em vez do OpenAI em sua startup, Gloo

O novo modelo de raciocínio de IA de código aberto da DeepSeek, R1, provocou uma venda massiva das ações da Nvidia e fez seu aplicativo consumidor disparar para o topo das lojas de aplicativos.

No mês passado, a DeepSeek disse que treinou um modelo usando um data center de cerca de 2.000 GPUs H800 da Nvidia em apenas dois meses, a um custo de cerca de 5,5 milhões de dólares. Na semana passada, publicou um artigo mostrando que o desempenho de seu último modelo correspondeu aos modelos de raciocínio mais avançados do mundo. Esses modelos estão sendo treinados em data centers que estão gastando bilhões em chips de IA da Nvidia, que são mais rápidos e muito caros.

A reação na indústria de tecnologia ao modelo de alto desempenho e baixo custo da DeepSeek foi intensa. Pat Gelsinger, por exemplo, se manifestou no X com alegria, postando: “Obrigado, DeepSeek.”

A sabedoria é aprender as lições que pensávamos já saber. A DeepSeek nos lembra de três aprendizados importantes da história da computação:
1) A computação obedece à lei dos gases. Torná-la dramaticamente mais barata expandirá o mercado para ela. Os mercados estão se enganando, isso fará a IA…
— Pat Gelsinger (@PGelsinger) 27 de janeiro de 2025

Gelsinger é, claro, o ex-CEO da Intel, um engenheiro de hardware e atual presidente de sua própria startup prestes a abrir o capital, a Gloo, uma plataforma de mensagens e engajamento para igrejas. Ele deixou a Intel em dezembro após quatro anos e uma tentativa de alcançar a Nvidia com os chips de IA alternativos da Intel, os Gaudi 3 AI.

Gelsinger escreveu que a DeepSeek deve lembrar a indústria de tecnologia de suas três lições mais importantes: custos mais baixos significam adoção mais ampla; a engenhosidade floresce sob restrições; e “o aberto vence. A DeepSeek ajudará a redefinir o mundo cada vez mais fechado do trabalho com modelos fundamentais de IA,” escreveu ele. A OpenAI e a Anthropic são ambas de código fechado.

Gelsinger disse ao TechCrunch que o R1 é tão impressionante que a Gloo já decidiu não adotar e pagar pelo OpenAI. A Gloo está construindo um serviço de IA chamado Kallm, que oferecerá um chatbot e outros serviços.

“Meus engenheiros da Gloo estão rodando o R1 hoje,” ele disse. “Eles poderiam ter rodado o o1 — bem, eles só podem acessar o o1, através das APIs.”

Em vez disso, em duas semanas, a Gloo espera ter reconstruído o Kallm do zero “com nosso próprio modelo fundamental que é todo de código aberto,” disse ele. “Isso é empolgante.”

Ele disse que acredita que a DeepSeek tornará a IA tão acessível que a IA não estará apenas em todos os lugares. Uma boa IA estará em todos os lugares. “Eu quero uma IA melhor no meu Oura Ring. Eu quero uma IA melhor no meu aparelho auditivo. Eu quero mais IA no meu telefone. Eu quero uma IA melhor em meus dispositivos embutidos, como o reconhecimento de voz no meu EV,” ele diz.

A reação feliz de Gelsinger foi talvez em desacordo com outros que estavam menos entusiasmados com o fato de que modelos fundamentais de raciocínio agora têm um concorrente mais acessível e de melhor desempenho. A IA tem se tornado mais cara, não menos.

Outros reagiram insinuando que a DeepSeek deve ter manipulado seus números de alguma forma e que o treinamento deve ter sido mais caro. Alguns pensaram que não poderiam dizer que usaram chips de ponta devido a restrições de exportação de chips de IA dos EUA para a China. Outros estavam apontando falhas em seu desempenho, encontrando pontos onde outros modelos se saíram melhor. Outros ainda acreditam que o próximo modelo da OpenAI, o o3, superará o R1 quando for lançado, e que o status quo será restaurado.

Gelsinger ignora tudo isso. “Você nunca terá total transparência, dado que a maior parte do trabalho foi feita na China,” disse ele. “Mas ainda assim, todas as evidências indicam que é de 10 a 50 vezes mais barato em seu treinamento do que o o1.”

A DeepSeek prova que a IA pode ser avançada “por meio da criatividade de engenharia, não jogando mais poder de hardware e recursos computacionais no problema. Então isso é emocionante,” ele disse.

Quanto a ser um desenvolvedor chinês, com tudo que isso implica, como preocupações sobre privacidade e censura, Gelsinger metaforicamente balança a cabeça.

“Ter os chineses nos lembrando do poder dos ecossistemas abertos é talvez um pouco constrangedor para nossa comunidade, para o mundo ocidental,” disse ele.

Fonte

Compartilhe esse conteúdo: