Cientista da OpenAI Noam Brown impressiona Conferência TED de IA: ’20 segundos de pensamento valem 100.000x mais dados’

Noam Brown, um dos principais cientistas de pesquisa da OpenAI, subiu ao palco da Conferência TED de IA em San Francisco na terça-feira para fazer um discurso poderoso sobre o futuro da inteligência artificial, com foco particular no novo modelo o1 da OpenAI e seu potencial de transformar indústrias por meio de raciocínio estratégico, programação avançada e pesquisa científica.

Brown, que anteriormente impulsionou avanços em sistemas de IA como Libratus, a IA jogadora de pôquer, e CICERO, que dominou o jogo de Diplomacia, agora prevê um futuro onde a IA não é apenas uma ferramenta, mas um motor central de inovação e tomada de decisões em vários setores.

“O incrível progresso em IA nos últimos cinco anos pode ser resumido em uma palavra: escala,” começou Brown, dirigindo-se a um público cativado de desenvolvedores, investidores e líderes do setor. “Sim, houve avanços em uplink, mas os modelos de fronteira de hoje ainda são baseados na mesma arquitetura de transformador que foi introduzida em 2017. A principal diferença é a escala dos dados e do processamento que entra nisso.”

Brown, uma figura central nos esforços de pesquisa da OpenAI, destacou rapidamente que, embora a escalabilidade dos modelos tenha sido um fator crítico no progresso da IA, é hora de uma mudança de paradigma. Ele apontou a necessidade de a IA ir além do mero processamento de dados e entrar no que ele chamou de “pensamento do sistema dois” — uma forma de raciocínio mais lenta e deliberada que espelha como os humanos abordam problemas complexos.

Para enfatizar esse ponto, Brown compartilhou uma história de seus dias de doutorado, quando trabalhava em Libratus, a IA jogadora de pôquer que derrotou jogadores humanos de topo em 2017.

“Aconteceu que fazer uma IA pensar por apenas 20 segundos em uma mão de pôquer teve o mesmo aumento de desempenho que escalar o modelo em 100.000x e treiná-lo por 100.000 vezes mais tempo,” disse Brown. “Quando obtive esse resultado, pensei literalmente que isso quebrava tudo. Nos primeiros três anos do meu doutorado, consegui escalar esses modelos em 100x. Eu estava orgulhoso desse trabalho. Escrevi vários artigos sobre como fazer essa escalabilidade, mas sabia rapidamente que tudo isso seria uma nota de rodapé comparado a essa escalabilidade do pensamento do sistema dois.”

A apresentação de Brown introduziu o pensamento do sistema dois como a solução para as limitações da escalabilidade tradicional. Popularizada pelo psicólogo Daniel Kahneman no livro “Pensar, Rápido e Devagar”, o pensamento do sistema dois refere-se a um modo de pensamento mais lento e deliberado que os humanos usam para resolver problemas complexos. Brown acredita que a incorporação dessa abordagem em modelos de IA poderia levar a grandes ganhos de desempenho sem exigir exponencialmente mais dados ou poder computacional.

Ele relatou que permitir que Libratus pensasse por 20 segundos antes de tomar decisões teve um efeito profundo, equiparando-se a escalar o modelo em 100.000x. “Os resultados me surpreenderam,” disse Brown, ilustrando como as empresas poderiam alcançar melhores resultados com menos recursos ao focar no pensamento do sistema dois.

A palestra de Brown vem logo após o lançamento da série de modelos o1 da OpenAI, que introduzem o pensamento do sistema dois na IA. Lançados em setembro de 2024, esses modelos são projetados para processar informações de forma mais cuidadosa do que seus antecessores, tornando-os ideais para tarefas complexas em campos como pesquisa científica, programação e tomada de decisões estratégicas.

“Não estamos mais restritos apenas à escalabilidade do treinamento do sistema um. Agora podemos escalar o pensamento do sistema dois também, e a coisa bonita sobre escalar nessa direção é que é amplamente inexplorada,” explicou Brown. “Essa não é uma revolução que está a 10 anos de distância ou mesmo a 2 anos de distância. É uma revolução que está acontecendo agora.”

Os modelos o1 já demonstraram um forte desempenho em vários benchmarks. Por exemplo, em um exame de qualificação para a Olimpíada Internacional de Matemática, o modelo o1 alcançou uma taxa de precisão de 83% — um salto significativo em relação aos 13% marcados pelo GPT-4o da OpenAI. Brown observou que a capacidade de raciocinar sobre fórmulas matemáticas complexas e dados científicos torna o modelo o1 especialmente valioso para indústrias que dependem de decisões baseadas em dados.

Para as empresas, o modelo o1 da OpenAI oferece benefícios além do desempenho acadêmico. Brown enfatizou que escalar o pensamento do sistema dois poderia melhorar os processos de tomada de decisões em indústrias como saúde, energia e finanças. Ele usou o tratamento do câncer como exemplo, perguntando ao público: “Levantem a mão se estariam dispostos a pagar mais de $1 por um novo tratamento para câncer… Que tal $1.000? E $1.000.000?”

Brown sugeriu que o modelo o1 poderia ajudar os pesquisadores a acelerar a coleta e análise de dados, permitindo que se concentrassem na interpretação dos resultados e na geração de novas hipóteses. Na energia, observou que o modelo poderia acelerar o desenvolvimento de painéis solares mais eficientes, potencialmente levando a avanços em energia renovável.

Ele reconheceu o ceticismo sobre modelos de IA mais lentos. “Quando menciono isso para as pessoas, uma resposta frequente que recebo é que talvez as pessoas não estejam dispostas a esperar alguns minutos para obter uma resposta ou pagar alguns dólares para ter uma resposta à pergunta,” disse ele. Mas para os problemas mais importantes, argumentou, esse custo vale muito a pena.

A mudança da OpenAI em direção ao pensamento do sistema dois poderia reconfigurar o cenário competitivo para a IA, especialmente em aplicações empresariais. Enquanto a maioria dos modelos atuais é otimizada para velocidade, o processo de raciocínio deliberado por trás do o1 poderia oferecer às empresas informações mais precisas, particularmente em indústrias como finanças e saúde.

No setor de tecnologia, onde empresas como Google e Meta estão investindo fortemente em IA, o foco da OpenAI em raciocínio profundo a diferencia. A IA Gemini do Google, por exemplo, é otimizada para tarefas multimodais, mas ainda não se sabe como se comparará aos modelos da OpenAI em termos de capacidade de resolução de problemas.

Dito isso, o custo de implementar o o1 pode limitar sua adoção generalizada. O modelo é mais lento e mais caro de operar do que as versões anteriores. Relatórios indicam que o modelo o1-preview custa $15 por milhão de tokens de entrada e $60 por milhão de tokens de saída, muito mais do que o GPT-4o. Ainda assim, para empresas que precisam de resultados de alta precisão, o investimento pode valer a pena.

Ao concluir sua palestra, Brown enfatizou que o desenvolvimento da IA está em um ponto crítico: “Agora temos um novo parâmetro, um onde podemos escalar o pensamento do sistema dois também — e estamos apenas no início de escalar nessa direção.

Fonte

Compartilhe esse conteúdo: