Para minha última edição do ano, estou focando na guerra por talentos em IA, que é um tema que venho cobrindo desde que este boletim foi lançado há quase dois anos. E continue lendo para as últimas novidades de dentro do Google e da Meta esta semana.
Mas primeiro, preciso das suas perguntas para uma edição de perguntas e respostas que estou planejando para minha primeira edição de 2025. Você pode enviar perguntas através deste formulário ou deixá-las nos comentários.
“É como procurar LeBron James”
Esta semana, a Databricks anunciou a maior rodada de financiamento conhecida para qualquer empresa de tecnologia privada na história. A empresa de IA está na fase final de arrecadar $10 bilhões, quase tudo destinado a recomprar ações de funcionários que já estão adquiridas.
Como as empresas abordam a compensação é frequentemente pouco coberto na indústria de tecnologia, embora as estratégias desempenhem um papel crucial na determinação de qual empresa avança mais rapidamente. Em nenhum lugar essa dinâmica é tão intensa quanto na guerra por talentos em IA, como já cobri antes.
Para entender melhor o que está impulsionando o estado das coisas indo para 2025, esta semana conversei com Naveen Rao, VP de IA na Databricks. Rao é uma das minhas pessoas favoritas para conversar sobre a indústria de IA. Ele é profundamente técnico, mas também voltado para os negócios, tendo vendido com sucesso várias startups. Sua última empresa, MosaicML, foi vendida para a Databricks por $1,3 bilhão em 2023. Agora, ele supervisiona os produtos de IA da Databricks e está intimamente envolvido com seus esforços de recrutamento para talentos de alto nível.
Nossa conversa abaixo aborda a lógica por trás da enorme rodada de financiamento da Databricks, quais talentos específicos em IA continuam escassos, por que ele acredita que a AGI não está iminente e mais.
A seguinte conversa foi editada para comprimento e clareza:
Por que essa rodada é principalmente para ajudar os funcionários a vender ações? Porque $10 bilhões é muito. Você pode fazer muito com isso.
A empresa tem pouco mais de 11 anos. Existem funcionários que estão aqui há muito tempo. Esta é uma maneira de dar a eles liquidez.
A maioria das pessoas não entende que isso não está indo para o balanço da Databricks. Isso está, em grande parte, proporcionando liquidez para funcionários anteriores, [e] liquidez para funcionários atuais e novos. Isso acaba sendo neutro em relação à diluição porque são ações que já existem. Elas foram alocadas para os funcionários e isso permite que eles vendam essas ações para cobrir os impostos associados a essas ações.
Quanto do rápido aumento nas avaliações das empresas de IA se deve à guerra por talentos?
É real. A questão chave aqui é que não se trata apenas de talentos em IA pura — pessoas que criam a próxima grande coisa, o próximo grande artigo. Definitivamente estamos tentando contratar essas pessoas. Existe toda uma infraestrutura de software e nuvem que precisa ser construída para apoiar essas coisas. Quando você constrói um modelo e deseja escalá-lo, isso na verdade não é talento em IA, por si só. É talento em infraestrutura.
A bolha percebida em que estamos em torno da IA criou um ambiente onde todos esses talentos estão sendo recrutados intensamente. Precisamos nos manter competitivos.
Quem está sendo mais agressivo em definir as taxas de mercado para talentos em IA?
A OpenAI certamente está lá. Anthropic. Amazon. Google. Meta. xAI. Microsoft. Estamos em constante competição com todas essas empresas.
Você colocaria o número de pesquisadores que podem construir um novo modelo de fronteira abaixo de 1.000?
Sim. É por isso que a guerra por talentos é tão intensa. O poder que um pesquisador tem em uma organização é sem precedentes. As ideias de um único pesquisador podem mudar completamente o produto. Isso é algo novo. Em semicondutores, pessoas que criaram uma nova arquitetura de transistor tinham esse tipo de poder.
É por isso que esses pesquisadores são tão procurados. Alguém que cria a próxima grande ideia e o próximo grande desbloqueio pode ter uma influência massiva na capacidade de uma empresa vencer.
Você vê esse pool de talentos se expandindo no futuro próximo ou ele vai continuar restrito?
Vejo alguns aspectos do pool se expandindo. A capacidade de construir a infraestrutura apropriada e gerenciá-la, esses papéis estão se expandindo. O lado dos pesquisadores de alto nível é a parte difícil. É como procurar LeBron James. Não existem muitas pessoas capazes disso.
Eu diria que as aquisições no estilo Inflection foram em grande parte impulsionadas por essa mentalidade. Você tem essas concentrações de talentos de alto nível nessas startups e parece ridículo quanto as pessoas pagam. Mas não é ridículo. Acho que é por isso que você vê o Google contratando de volta Noam Shazeer. É muito difícil encontrar outro Noam Shazeer.
Um cara que tivemos na minha empresa anterior que fundei, Nervana, é indiscutivelmente o melhor programador de GPU do mundo. Ele está na OpenAI agora. Cada inferência que acontece em um modelo da OpenAI passa pelo código dele. Você começa a calcular o custo a montante e é como, “Caramba, esse cara salvou $4 bilhões.”
“Você começa a calcular o custo a montante e é como, ‘Caramba, esse cara salvou $4 bilhões.'”
Qual é a vantagem que você tem ao tentar contratar um pesquisador para a Databricks?
Você começa a ver algum viés de seleção de diferentes candidatos. Alguns são AGI ou nada, e isso é ok. É uma grande motivação para algumas das pessoas mais inteligentes por aí. Nós pensamos que vamos chegar à AGI construindo produtos. Quando as pessoas usam a tecnologia, ela melhora. Essa é parte da nossa proposta.
A IA está em uma base de crescimento massivo, mas também atingiu o pico de hype e está a caminho de descer a curva de hype de Gartner. Acho que estamos nessa inclinação descendente agora, enquanto a Databricks estabeleceu um negócio muito forte. Isso é muito atraente para alguns porque não acho que somos tão suscetíveis ao hype.
Os pesquisadores com quem você fala realmente acreditam que a AGI está logo ali na esquina? Existe algum consenso sobre quando ela chegará?
Honestamente, não há um grande consenso. Estive neste campo por muito tempo e fui bastante vocal ao dizer que não está logo ali. O grande modelo de linguagem é uma ótima peça de tecnologia. Tem enormes quantidades de aumento econômico e eficiências que podem ser obtidas construindo ótimos produtos ao redor dele. Mas não é o espírito do que costumávamos chamar de AGI, que era inteligência humana ou até mesmo animal.
Essas coisas não estão criando inteligência mágica. Elas são capazes de dividir o espaço que estamos chamando de fatos e padrões mais facilmente. Não é o mesmo que construir um aprendiz causal. Eles não realmente entendem como o mundo funciona.
Você pode ter visto a palestra de Ilya Sutskever. Todos nós estamos meio que tateando no escuro. A escalabilidade foi um grande desbloqueio. Era natural para muitas pessoas se sentirem entusiasmadas com isso. Acontece que não estávamos resolvendo o problema certo.
A nova ideia que vai chegar à AGI é a abordagem de computação em tempo de teste ou “raciocínio”?
Não. Acho que será uma coisa importante para o desempenho. Podemos melhorar a qualidade das respostas, provavelmente reduzir a probabilidade de alucinações e aumentar a probabilidade de ter respostas que estão fundamentadas em fatos. Isso é definitivamente positivo para o campo. Mas isso vai resolver o problema fundamental do espírito da AGI? Eu não acredito. Estou feliz em estar errado também.
Você concorda com o sentimento de que há muito espaço para construir mais bons produtos com os modelos existentes, uma vez que eles são tão capazes, mas ainda estão restritos por computação e acesso?
Sim. A Meta começou anos depois da OpenAI e da Anthropic e basicamente alcançou, e a xAI alcançou extremamente rápido. Acho que é porque a taxa de melhoria essencialmente parou.
Nilay Patel compara a corrida dos modelos de IA ao Bluetooth inicial. Todo mundo continua dizendo que há um Bluetooth mais sofisticado, mas meu telefone ainda não se conecta.
Você vê isso com cada ciclo de produto. As primeiras versões do iPhone eram drasticamente melhores do que as versões anteriores. Agora, não consigo perceber a diferença entre um telefone de três anos e um novo.
Acho que é isso que vemos aqui. Como utilizamos esses LLMs e a distribuição que foi construída neles para resolver problemas de negócios é a próxima fronteira.