Há uma batalha de chips de IA se formando entre os principais fornecedores de nuvem. O Trillium do Google, um chip personalizado para treinar e executar modelos de IA, recentemente entrou em pré-visualização, e o Maia da Microsoft deve seguir em breve.
Para não ficar atrás, a Amazon Web Services também tem chips de IA: Trainium, Inferentia e Graviton. Em um esforço para chamar a atenção para o Trainium em particular, a empresa está lançando um novo programa de subsídios para pesquisa em IA.
Chamado Build on Trainium, o novo programa concederá um total de $110 milhões a instituições, cientistas e estudantes que pesquisam IA. A AWS dará até $11 milhões em créditos de Trainium para universidades com as quais possui parcerias estratégicas, além de subsídios individuais de até $500.000 para a comunidade de pesquisa em IA em geral.
A AWS também afirma que está estabelecendo um “cluster de pesquisa” de até 40.000 chips Trainium que equipes de pesquisa e estudantes podem acessar através de reservas autogeridas.
Gadi Hutt, diretor sênior da Annapurna Labs da AWS, uma empresa de fabricação de chips adquirida pela AWS em 2015, disse que o Build on Trainium tem como objetivo fornecer aos pesquisadores o suporte de hardware necessário para prosseguir com seu trabalho. Os participantes do subsídio também serão conectados a recursos educacionais e programas de capacitação relacionados ao Trainium, acrescentou Hutt.
“A pesquisa acadêmica em IA hoje está severamente bloqueada pela falta de recursos e, como tal, o setor acadêmico está ficando para trás rapidamente”, disse Hutt. “Com o Build on Trainium, a AWS está investindo em uma nova onda de pesquisa em IA guiada por pesquisas acadêmicas de ponta nas universidades que avançarão o estado das aplicações, bibliotecas e otimizações generativas de IA.”
De fato, os acadêmicos na área de IA carecem da infraestrutura considerável que as grandes empresas de tecnologia têm à sua disposição. A Meta, por exemplo, adquiriu bem mais de 100.000 chips de IA para desenvolver seus modelos principais. Em contraste, o Grupo de Processamento de Linguagem Natural de Stanford possui 68 GPUs para todo o seu trabalho.
Mas nem todos acreditam que a AWS será um patrocinador benevolente. “Isso parece um esforço para generalizar uma corrupção do financiamento de pesquisa acadêmica”, disse Os Keyes, um candidato a PhD na Universidade de Washington que estuda o impacto ético das tecnologias emergentes, ao TechCrunch.
Com o Build on Trainium, a AWS terá a palavra final sobre quais projetos receberão subsídios. O processo de seleção é opaco; Hutt disse apenas que a AWS alocará fundos “com base no mérito e nas necessidades da pesquisa” e “avaliará o sucesso e os resultados do programa.”
Um porta-voz da AWS esclareceu posteriormente que um comitê de “praticantes de IA e aplicações” revisará propostas e selecionará “os projetos mais impactantes e promissores que ajudarão a avançar a ciência do aprendizado de máquina.”
Há evidências que sugerem que a pesquisa em IA apoiada por empresas tende a favorecer trabalhos com aplicações comerciais em detrimento de outras áreas de estudo. Em um artigo recente, pesquisadores descobriram que as principais empresas de IA têm uma produção significativamente menor para pesquisas que examinam criticamente as implicações éticas da IA em comparação com estudos convencionais. Além disso, a pesquisa em IA “responsável” que as grandes empresas realizam é mais restrita em escopo, de acordo com os co-autores, e carece de diversidade nos tópicos abordados.
Pesquisadores têm pressionado por proteções legais e técnicas para examinar a IA sem medo de que os fornecedores suspendam suas contas ou ameaçam ações legais.
O Build with Trainium está fazendo propaganda para, bem, o Trainium. Mas será que o outro ângulo da AWS está tentando atrair pesquisadores para sua plataforma? Perguntei se os beneficiários dos subsídios estarão “presos” ao ecossistema da AWS ou ao Trainium se aceitarem um prêmio. Hutt disse que não estarão, e que as únicas exigências que terão que cumprir são publicar um artigo e “open-sourcing” seu trabalho no GitHub sob uma licença permissiva.
“Não há um bloqueio contratual que faça com que as universidades sejam parceiras tecnológicas exclusivas”, disse ele. “O que pedimos em troca é que os resultados da pesquisa sejam open-sourced para o benefício da comunidade.”
De qualquer forma, não está claro se o Build with Trainium fará muito para fechar a lacuna entre a academia de IA e a indústria.
Em 2021, agências governamentais dos EUA, além do Departamento de Defesa, alocaram $1,5 bilhão para financiamento acadêmico para pesquisa em IA. No mesmo ano, a indústria de IA em todo o mundo gastou mais de $340 bilhões no total (não apenas para pesquisa).
Quase 70% das pessoas com Ph.D.s em IA acabam na indústria privada, atraídas não apenas por salários competitivos, mas também pelo acesso a computação e dados essenciais (e os meios para processá-los). Nos últimos anos, as empresas aumentaram seu assédio a pesquisadores acadêmicos de IA e reservaram subsídios maiores para estudantes de Ph.D. que realizam pesquisas.
O resultado final? Os maiores modelos de IA desenvolvidos em qualquer ano agora vêm da indústria mais de 90% das vezes, enquanto o número de artigos de IA publicados com co-autores da indústria quase dobrou desde 2000.
Os formuladores de políticas tomaram algumas medidas para abordar a lacuna de financiamento entre academia e indústria. No ano passado, a National Science Foundation anunciou um investimento de $140 milhões para lançar sete Institutos Nacionais de Pesquisa em IA liderados por universidades para examinar como a IA poderia mitigar os efeitos da mudança climática e melhorar a educação. Em outros lugares, esforços estão em andamento para estabelecer o Recurso Nacional de Pesquisa em IA dos EUA, uma iniciativa de $2,6 bilhões que forneceria a pesquisadores e estudantes de IA acesso a recursos computacionais e conjuntos de dados.
Mas ainda são iniciativas pequenas em comparação com programas corporativos. E há poucas razões para pensar que o status quo mudará em breve.