‘Onde estamos hoje em AI biológica é similar ao GPT em 2020’: Uma entrevista com o CEO da maior startup de IA da África

Em janeiro do ano passado, a empresa alemã de biotecnologia BioNTech adquiriu a startup africana de IA Instadeep por mais de $550 milhões, um negócio finalizado em julho do mesmo ano. A Instadeep, cuja saída é atualmente a maior da África, tem operado sob o guarda-chuva da farmacêutica alemã por pouco mais de um ano. Agora é um bom momento para olhar como ela se saiu desde a aquisição.

A Instadeep utiliza técnicas avançadas de aprendizado de máquina para trazer IA para aplicações empresariais. Seus produtos vão desde insights acelerados por GPU até sistemas de tomada de decisão auto-aprendizes. Antes da aquisição do ano passado, a startup de IA, nascida na Tunísia e com sede em Paris e Londres, levantou mais de $108 milhões de vários investidores globais, incluindo Google, Deutsche Bahn e BioNTech. Esses três estratégicos também estavam entre os maiores parceiros e clientes da startup.

Notavelmente, a startup de uma década colaborou com a BioNTech para desenvolver um sistema de alerta precoce que poderia detectar variantes de COVID-19 de alto risco meses antes durante a pandemia. A Instadeep trabalhou com a Google DeepMind para criar um sistema de detecção antecipada de surtos de gafanhotos do deserto na África. Ela também colaborou em um projeto ambicioso para automatizar o agendamento ferroviário para a Deutsche Bahn, o maior operador ferroviário da Europa.

Enquanto essas parcerias mostram várias aplicações para as soluções da Instadeep, seu adquirente tinha um caso de uso claro: usar IA para desenvolver terapias e vacinas para vários cânceres e doenças infecciosas – algo em que agora está dobrando sob seu novo proprietário.

Quinze meses após a conclusão da aquisição pela BioNTech, o co-fundador e CEO Karim Beguir disse ao TechCrunch em uma entrevista que a Instadeep fez progressos significativos nesse sentido, mesmo enquanto a empresa de IA – que continua a operar de forma independente – ainda entrega soluções a clientes fora da biotecnologia.

“Estamos alinhados estrategicamente com a BioNTech nos objetivos a serem perseguidos em biologia e capacidades de bio IA,” disse o chefe da Instadeep. “Mas também temos espaço para manobrar e continuar a ser uma força em IA na África e, em geral, enquanto continuamos a desenvolver tecnologias que empurram a fronteira da inovação em outros verticais, como otimização industrial.”

Aumentando as capacidades dentro da biotecnologia

Beguir observa que o objetivo da Instadeep no último ano desde sua aquisição tem sido implantar IA em cada etapa do pipeline da BioNTech para melhorar os processos existentes.

Ele compartilha um exemplo em histologia, que envolve análise de tecidos e a tarefa visual de rotular diferentes tecidos, como identificar células tumorais ou células saudáveis. Segundo ele, especialistas da BioNTech tradicionalmente realizavam esse trabalho manualmente. No entanto, a tecnologia da Instadeep ajudou a acelerar o processo ao implantar IA visual e sistemas de segmentação, acelerando esse fluxo de trabalho de rotulagem de tecidos em 5x.

Outro é a conclusão de seu projeto RiboMab, que envolve anticorpos codificados por mRNA que agora se tornaram parte do arsenal da BioNTech como uma empresa de imunoterapia para combater câncer e outras doenças. A Instadeep introduziu este projeto em sua plataforma DeepChain, que projeta proteínas e analisa dados biológicos, durante sua primeira colaboração em 2020.

A biotecnologia envolve uma riqueza de dados sensíveis de saúde. Coletá-los e analisá-los é uma coisa. Mantê-los seguros é outra. Basta perguntar à 23andMe, uma vez saudada como uma disruptora no espaço da biotecnologia antes de se tornar vítima de uma violação maciça que expôs os dados de quase 7 milhões de pessoas, metade de sua base de clientes.

Curiosamente, a BioNTech não é estranha a tais eventos. Em 2020, hackers acessaram ilegalmente documentos relacionados à sua vacina COVID-19, desenvolvida com a Pfizer, atacando a Agência Europeia de Medicamentos (EMA), o regulador de medicamentos da Europa, que avalia medicamentos e vacinas. Embora Pfizer e BioNTech tenham confirmado que seus sistemas e dados de ensaio permaneceram seguros, o incidente destaca como as organizações, mesmo as regulatórias, podem ser vulneráveis a ciberataques.

Como qualquer CEO diria, Beguir me diz que Instadeep e BioNTech são altamente cautelosos com dados de saúde, especialmente enquanto a parceria está atualmente usando IA para aumentar ativos de dados, permitindo-lhes identificar sequências de proteínas precisas e potencialmente desbloquear novos alvos para câncer e outros casos de uso de imunoterapia.

Mas há uma segmentação nos dados que ambas as empresas usam. A BioNTech lida com dados pessoais de pacientes da vida real, e a Instadeep tipicamente desenvolve modelos e os treina em dados disponíveis publicamente. É assim que, por exemplo, treinou seu Nucleotide Transformer, uma série de modelos em IA genômica, que hoje é o modelo de IA genômica mais baixado e popular do mundo. [Graças em parte a este acordo de código aberto.]

“A Instadeep desenvolveu e treinou o modelo de nucleotídeos em dados públicos,” observa Beguir. “No entanto, quando queríamos implantar o modelo em casos de uso específicos e dados de pacientes da vida real, fizemos isso no nível da BioNTech, com todas as garantias de privacidade que vêm de sua posição como um dos principais players em biopharma operando sob regulamentos rigorosos e seguindo protocolos de qualidade rigorosos.

Desenvolvendo novas tecnologias dentro da BioNTech e fora da biotecnologia

Quando perguntado quais são os próximos marcos para a Instadeep dentro da BioNTech, Beguir menciona a “última descoberta” da startup: redes de fluxo bayesianas (BFN), um novo modelo de IA generativa para proteínas que supera significativamente modelos autorregressivos e de difusão, de acordo com a empresa. O CEO da BioNTech, Ugur Sahin, em uma declaração, descreve isso como uma “tecnologia de ponta.”

De acordo com Beguir, o modelo produz as proteínas mais naturais e com melhor comportamento do mercado, permitindo que os sistemas busquem propriedades específicas na cadeia pesada de um anticorpo, incluindo características químicas, hidrofobicidade ou comprimento da sequência. Esses modelos são cruciais para entender funções complexas de proteínas e engenharia de novas proteínas terapêuticas.

“Estamos entusiasmados com o potencial de inovações de IA como a nossa para identificar casos de uso reais, colaborar de perto com a BioNTech e construir produtos que serão testados em laboratórios e clínicas, salvando, em última análise, vidas de pacientes,” disse Beguir. “Se você considera onde estamos hoje em biologia e IA, é similar a onde estávamos com o processamento de linguagem natural em 2020 com o GPT-3. Os sistemas estavam começando a funcionar, e suas capacidades eram impressionantes, mas ainda havia espaço para melhorias.”

A Instadeep lançou o novo modelo de IA na semana passada juntamente com um novo supercomputador quase exaescala, que, de acordo com as empresas, coloca a parceria entre os 100 principais em computação e infraestrutura e entre os 20 principais de clusters de GPU H100 globalmente.

Ambos os desenvolvimentos destacam onde a Instadeep, sob a BioNTech, implanta IA em vários casos de uso em ciências da vida. Por outro lado, ela lida independentemente com sua outra linha de negócios, que envolve IA e aprendizado de reforço profundo para otimização industrial.

Um exemplo é seu projeto em andamento de 12 anos para automatizar o planejamento e a despachamento ferroviário para a Deutsche Bahn, um de seus parceiros de longa data e o maior operador ferroviário da Europa. Da mesma forma, a empresa de IA com sede em Tunis e Londres intensificou os esforços para desenvolver outros casos de uso de otimização industrial, como colaborar com a Fraport na Alemanha para otimizar operações complexas de aeroportos com IA.

“Em geral, também vemos o potencial de agentes de IA como muito atraente para o futuro. Acreditamos que a otimização industrial e sistemas baseados em agentes, trabalhando em conjunto com colegas humanos, revolucionarão a eficiência industrial. Então, esta também é outra área em que estivemos por muitos anos e onde continuamos a investir,” observou Beguir.

Enquanto isso, a Instadeep, no início deste mês, lançou a versão pro de seu produto DeepPCB (Placa de Circuito Impresso Profunda), um design de hardware ou placa de circuito impresso totalmente assistido com IA autônoma alimentada por aprendizado de reforço, em São Francisco. Beguir diz que os concorrentes da empresa são startups de IA menores em áreas específicas em que opera, como a Intelmatix, baseada em Riyadh.

O chefe da Instadeep se orgulha do trabalho de sua empresa em resolver casos de uso mais complexos de IA – por exemplo, Gen IA para DNA ou proteômica ou fluxos de trabalho baseados em agentes para otimização combinatória – e se afastando de casos simples, como Gen IA para PLN. Ele afirma que, além da aquisição da BioNTech, essa engenhosidade desempenha um papel considerável na atração de interesse de clientes nos EUA, onde a empresa de IA agora tem dois escritórios, e também em toda a Europa: Berlim, Paris e Reino Unido, em particular.

Apesar de a BioNTech ter gasto $500 milhões na Instadeep para aumentar suas capacidades em biotecnologia, ela mantém a empresa de IA operacionalmente independente por razões como esta, enquanto financia suas atividades para atender clientes além da indústria biotecnológica.

“Porque contribuímos valor sendo líderes em IA, e as habilidades de IA podem ser aprimoradas em múltiplos setores,” respondeu Beguir quando perguntado por que a BioNTech ainda permite que a empresa de IA trabalhe em projetos não biotecnológicos. “É a mesma pilha de tecnologia, então o tempo trabalhando em IA fora da biotecnologia não é tempo perdido. A BioNTech também implanta a Instadeep em tarefas fora da P&D biotecnológica, como na otimização de operações.”

Beguir explica que, embora a Instadeep não tenha sido forçada a vender, foi a visão compartilhada e os projetos bem-sucedidos com a BioNTech desde 2019, muito antes da aquisição, que convenceram a empresa de IA a seguir em frente com o negócio. Ele acredita que a confiança construída ao longo de anos de colaboração é a razão pela qual a Instadeep permanecerá independente sob a BioNTech. A chave para a Instadeep agora é manter seu ímpeto, manter resultados de alta qualidade e continuar inovando pelo maior tempo possível.

Desde a aquisição, a Instadeep cresceu para mais de 400 funcionários em todo o mundo. Isso inclui sua equipe na África, baseada em um novo escritório em Kigali, que lidera o trabalho de inteligência geoespacial da empresa.

Inicialmente um esforço no local em parceria com a Google para detectar locais de reprodução de gafanhotos na África, a Instadeep agora usa dados de rotulagem passados e imagens de satélite para inferir com alta qualidade e 80-85% de precisão onde os locais de reprodução de gafanhotos estarão nos próximos 30 dias. Beguir diz que a InstaGeo, a estrutura da empresa que usa imagens de satélite multiespectrais da NASA ou da Agência Espacial Europeia (ESA), é de código aberto e está disponível para outras empresas desenvolverem soluções escaláveis por todo o continente.

“Este é um exemplo real de como a tecnologia e a capacidade de IA estão tendo um impacto. Em vez de coletar amostras no solo ou depender de infraestrutura terrestre, podemos entregar esses insights via satélites em escala e notificar vários governos e atores para enfrentar um desafio crescente à segurança alimentar, especialmente dado os problemas climáticos do continente.”

Fonte