Dentro do lançamento — e futuro — do ChatGPT

À medida que o inverno descia sobre São Francisco no final de 2022, a OpenAI lançou discretamente um novo serviço chamado ChatGPT com uma postagem no blog e um único tweet do CEO Sam Altman. A equipe o rotulou como uma “prévia de pesquisa discreta” — eles tinham bons motivos para manter as expectativas baixas.

“Não conseguia nem fazer aritmética”, diz Liam Fedus, chefe de pós-treinamento da OpenAI. Também era propenso a alucinações ou a inventar coisas, acrescenta Christina Kim, pesquisadora da equipe de meio de treinamento.

No final, o ChatGPT se tornaria tudo, menos discreto.

Enquanto os pesquisadores da OpenAI dormiam, os usuários no Japão inundaram os servidores do ChatGPT, derrubando o site apenas algumas horas após o lançamento. Isso foi apenas o começo.

“Os painéis naquele momento estavam sempre vermelhos”, lembra Kim. O lançamento coincidiu com a NeurIPS, a principal conferência de IA do mundo, e logo o ChatGPT era a única coisa que todos podiam falar lá. A página de erro do ChatGPT — “O ChatGPT está com capacidade máxima no momento” — se tornaria uma visão familiar.

“Tivemos a reunião de lançamento inicial em uma sala pequena, e não foi como se o mundo simplesmente pegasse fogo de repente”, diz Fedus durante uma entrevista recente na sede da OpenAI. “Estamos tipo, ‘Ok, legal. Acho que está lá fora agora.’ Mas foi no dia seguinte que percebemos — oh, espere, isso é grande.”

“Os painéis naquele momento estavam sempre vermelhos.”

Dois anos depois, o ChatGPT ainda não conseguiu resolver aritmética avançada ou se tornar confiável em fatos. Não importou. O chatbot evoluiu de um protótipo para um motor de receita de 4 bilhões de dólares com 300 milhões de usuários ativos semanais. Ele abalou as fundações da indústria de tecnologia, mesmo enquanto a OpenAI perde dinheiro (e cofundadores) a todo vapor, enquanto concorrentes como a Anthropic ameaçam sua liderança.

Seja usado como elogio ou pejorativo, “ChatGPT” se tornou quase sinônimo de IA generativa. Ao longo de uma série de chamadas de vídeo recentes, sentei-me com Fedus, Kim, o chefe de produto do ChatGPT, Nick Turley, e o líder de engenharia do ChatGPT, Sulman Choudhry, para falar sobre as origens do ChatGPT e para onde ele está indo a seguir.

Um nome “estranho” e um começo improvisado

O ChatGPT nasceu efetivamente em dezembro de 2021 com um projeto da OpenAI chamado WebGPT: uma ferramenta de IA que podia pesquisar na internet e escrever respostas. A equipe se inspirou na interface conversacional do WebGPT e começou a encaixar uma interface semelhante no GPT-3.5, um sucessor do modelo de texto GPT-3 lançado em 2020. Eles deram a ele o nome desajeitado de “Chat com GPT-3.5” até que, em uma decisão de fração de segundo, como Turley se lembra, simplificaram para ChatGPT.

O nome poderia ter sido ainda mais direto, “Chat”, e retrospectivamente, ele acha que talvez devesse ter sido. “O mundo inteiro se acostumou a esse nome estranho, esquisito, provavelmente estamos presos a ele. Mas, obviamente, sabendo o que sei agora, eu gostaria que tivéssemos escolhido um nome um pouco mais fácil de pronunciar”, diz ele. (Foi revelado recentemente que a OpenAI comprou o domínio chat.com por mais de 10 milhões de dólares em dinheiro e ações em meados de 2023.)

À medida que a equipe descobria as óbvias limitações do modelo, debatiam se deveriam restringir seu foco lançando uma ferramenta para ajudar com reuniões, escrita ou codificação. Mas o cofundador da OpenAI, John Schulman (que desde então saiu para a Anthropic), defendeu manter o foco amplo.

A equipe descreve isso como uma aposta arriscada na época; os chatbots eram vistos como um canto sem importância do aprendizado de máquina, pensavam eles, sem precedentes de sucesso. Para aumentar suas preocupações, o bot de IA Galactica do Facebook havia acabado de falhar espetacularmente e foi retirado do ar após gerar pesquisas falsas.

A equipe lutou com o tempo. O GPT-4 já estava em desenvolvimento com recursos avançados como Interprete de Código e navegação na web, então faria sentido esperar para lançar o ChatGPT em cima do modelo mais capaz. Kim e Fedus também se lembram de que as pessoas queriam esperar e lançar algo mais polido, especialmente após ver outras empresas falharem com seus bots mal preparados.

Apesar das preocupações iniciais sobre os chatbots serem um beco sem saída, o New York Times relatou que outros membros da equipe estavam preocupados que concorrentes superariam a OpenAI no mercado com uma nova onda de bots. O voto decisivo foi de Schulman, dizem Fedus e Kim. Ele defendeu um lançamento antecipado, ao lado de Altman, ambos acreditando que era importante colocar a IA nas mãos das pessoas rapidamente.

A OpenAI havia demonstrado um chatbot na Microsoft Build no início daquele ano e gerou virtualmente nenhum burburinho. Além disso, muitos dos primeiros usuários do ChatGPT não pareciam estar realmente usando-o tanto assim. A equipe compartilhou seu protótipo com cerca de 50 amigos e familiares. Turley “enviou um e-mail pessoalmente para cada um deles” todos os dias para verificar. Enquanto Fedus não conseguia lembrar de números exatos, ele se recorda de que cerca de 10% desse grupo de teste inicial o usava todos os dias.

Mais tarde, a equipe veria isso como um indicativo de que haviam criado algo com potencial de permanência.

“Tivemos dois amigos que basicamente estavam nele desde o início de seu dia de trabalho — e eles eram fundadores”, lembra Kim. “Eles estavam nele basicamente por 12 a 16 horas por dia, apenas conversando com ele o dia todo.” Com apenas duas semanas antes do final de novembro, Schulman fez a chamada final: a OpenAI lançaria o ChatGPT no último dia desse mês.

A equipe cancelou seus planos de Ação de Graças e começou um sprint de duas semanas para o lançamento público. Grande parte do sistema já estava construída nesse ponto, diz Kim, mas suas vulnerabilidades de segurança não foram testadas. Então, eles se concentraram muito em red teaming, ou testando o sistema para potenciais problemas de segurança.

“Se eu soubesse que seria um grande negócio, eu certamente não teria querido lançá-lo bem antes de uma semana de feriado de inverno, quando todos nós iríamos para casa”, diz Turley. “Eu me lembro de ter trabalhado muito, mas também me lembro de pensar, ‘Ok, vamos colocar isso para fora, e depois voltaremos após as férias para olhar os aprendizados, para ver o que as pessoas querem de um assistente de IA.'”

Em uma pesquisa interna no Slack, os funcionários da OpenAI adivinhavam quantos usuários teriam. A maioria das previsões variava de meros 10.000 a 50.000. Quando alguém sugeriu que poderia alcançar um milhão de usuários, outros entraram dizendo que isso era otimista demais.

No dia do lançamento, perceberam que todos estavam incrivelmente errados.

Depois que o Japão derrubou seus servidores, e os painéis vermelhos e mensagens de erro abundavam, a equipe estava ansiosamente pegando os pedaços e atualizando o Twitter para avaliar a reação pública, diz Kim. Eles acreditavam que a reação ao ChatGPT poderia apenas ir de duas maneiras: total indiferença ou desprezo ativo. Eles se preocupavam que as pessoas pudessem descobrir maneiras problemáticas de usá-lo (como tentar desbloqueá-lo), e a incerteza sobre como o público receberia sua criação os mantinha em um estado de antecipação nervosa.

O lançamento foi recebido com emoções mistas. O ChatGPT rapidamente começou a enfrentar críticas sobre problemas de precisão e viés. Muitas escolas correram para bani-lo imediatamente devido a preocupações com trapaças. Alguns usuários no Reddit o compararam aos primeiros dias do Google (e ficaram chocados que era gratuito). Por sua parte, o Google considerou o chatbot uma ameaça de “código vermelho”.

A OpenAI acabaria superando sua mais ambiciosa meta de 1 milhão de usuários em apenas cinco dias após o lançamento. Dois meses após sua estreia, o ChatGPT conquistou mais de 30 milhões de usuários.

Quando alguém sugeriu que poderia alcançar um milhão de usuários, outros entraram dizendo que isso era otimista demais.

Dentro de semanas após o lançamento em 30 de novembro, a equipe começou a implementar atualizações incorporando o feedback dos usuários (como sua tendência a dar respostas excessivamente verbosas). O caos inicial havia se acalmado, os números de usuários ainda estavam crescendo, e a equipe teve uma realização sóbria: se quisessem manter esse impulso, as coisas teriam que mudar. O pequeno grupo que lançou uma “prévia de pesquisa discreta” — um termo que se tornaria uma piada recorrente na OpenAI — precisaria crescer muito.

Nos meses e anos seguintes, a equipe do ChatGPT cresceria enormemente e mudaria de prioridades — às vezes para desgosto de muitos funcionários iniciais. O principal pesquisador Jan Leike, que desempenhou um papel crucial na melhoria das habilidades conversacionais do ChatGPT e na garantia de que suas saídas estivessem alinhadas com as expectativas dos usuários, saiu este ano para se juntar à Anthropic após afirmar que “a cultura de segurança e os processos ficaram em segundo plano em relação a produtos brilhantes” na OpenAI.

Hoje em dia, a OpenAI está focada em descobrir como é o futuro do ChatGPT.

“Eu ficaria muito surpreso se um ano a partir de agora essa coisa ainda parecesse um chatbot”, diz Turley, acrescentando que as interações atuais baseadas em chat logo parecerão tão ultrapassadas quanto o bate-papo instantâneo dos anos 90. “Ficamos bastante distraídos apenas em fazer o chatbot ótimo, mas na verdade, não era isso que pretendíamos construir. Pretendíamos construir algo muito mais útil do que isso.”

Cada vez mais poderoso e caro

Eu converso com Turley durante uma chamada de vídeo enquanto ele está sentado em uma vasta sala de conferências na sede da OpenAI em São Francisco que epitomiza a transformação da empresa. O escritório é todo curvas amplas e minimalismo polido, um contraste distante de seu escritório original que era frequentemente descrito como um armazém histórico sem graça.

Com cerca de 2.000 funcionários, a OpenAI evoluiu de um laboratório de pesquisa improvisado para uma potência tecnológica de 150 bilhões de dólares. A equipe está espalhada por diversos projetos, incluindo a construção de modelos fundacionais subjacentes e o desenvolvimento de ferramentas não textuais, como o gerador de vídeo, Sora. O ChatGPT ainda é de longe o produto mais conhecido da OpenAI. Sua popularidade trouxe muitas dores de cabeça.

“Eu ficaria muito surpreso se um ano a partir de agora essa coisa ainda parecesse um chatbot”

O ChatGPT ainda cria mentiras elaboradas com confiança inabalável, mas agora estão sendo citadas em processos judiciais e discursos políticos. Ele permitiu uma quantidade impressionante de experimentação e criatividade, mas alguns de seus casos de uso mais distintos acabaram sendo spam, fraudes e trabalhos de faculdade escritos por IA.

Enquanto algumas publicações (incluindo a Vox Media, empresa mãe do The Verge) estão optando por se associar à OpenAI, outras, como o New York Times, estão optando por processá-la por infração de direitos autorais. E a OpenAI está queimando dinheiro a uma taxa estonteante para manter as luzes acesas.

Turley reconhece que as alucinações do ChatGPT ainda são um problema. “Nossos primeiros usuários estavam muito confortáveis com as limitações do ChatGPT”, diz ele. “Está tudo bem que você vai verificar o que ele disse. Você vai saber como contornar isso. Mas a grande maioria do mundo, eles não são engenheiros, e eles não deveriam ter que ser. Eles deveriam apenas usar essa coisa e confiar nela como qualquer outra ferramenta, e ainda não chegamos lá.”

A precisão é uma das três áreas de foco da equipe do ChatGPT para 2025. As outras são velocidade e apresentação (ou seja, estética).

“Acho que ainda temos um longo caminho a percorrer para tornar o ChatGPT mais preciso e melhor em citar suas fontes e iterar sobre a qualidade deste produto”, diz Turley.

A OpenAI também ainda está descobrindo como monetizar o ChatGPT. Apesar de implantar modelos de IA cada vez mais poderosos e caros, a empresa manteve uma camada gratuita limitada e um serviço ChatGPT Plus de 20 dólares por mês desde fevereiro de 2023.

Quando pergunto a Turley sobre rumores de uma futura assinatura de 2.000 dólares, ou se a publicidade será incorporada ao ChatGPT, ele diz que não há “nenhum plano atual para aumentar os preços”. Quanto aos anúncios: “Não nos importamos com quanto tempo você passa no ChatGPT.”

“Eles deveriam apenas usar essa coisa e confiar nela como qualquer outra ferramenta, e ainda não chegamos lá.”

“Estou muito orgulhoso do fato de que temos incentivos que estão incrivelmente alinhados com nossos usuários”, diz ele. Aqueles que “usam nosso produto muito pagam-nos dinheiro, o que é uma transação muito, muito direta e transparente. Estou orgulhoso disso. Talvez tenhamos uma tecnologia que seja muito mais cara de servir e teremos que repensar esse modelo. Você precisa permanecer humilde sobre onde a tecnologia vai chegar.”

Apenas dias depois que Turley me diz isso, o ChatGPT realmente recebeu uma nova etiqueta de preço de 200 dólares para um nível profissional que inclui acesso a um modelo de raciocínio especializado. Sua principal camada de 20 dólares Plus está ficando, mas claramente não é o teto do que a OpenAI acha que as pessoas estarão dispostas a pagar.

ChatGPT e outros serviços da OpenAI exigem enormes quantidades de poder computacional e armazenamento de dados para manter seus serviços funcionando sem problemas. Além da base de usuários que a OpenAI ganhou por meio de seus próprios produtos, está prestes a alcançar milhões de pessoas a mais através de uma parceria com a Apple que integra o ChatGPT com iOS e macOS.

Isso representa uma grande pressão de infraestrutura para uma empresa de tecnologia relativamente jovem, diz Sulman Choudhry, líder de engenharia do ChatGPT. “Manter tudo funcionando é uma tarefa muito, muito grande”, diz ele. As pessoas adoram recursos como o modo de voz avançado do ChatGPT. Mas as limitações de escalonamento significam que frequentemente há uma lacuna significativa entre as capacidades da tecnologia e o que as pessoas podem experimentar. “Há uma diferença muito, muito grande lá, e essa diferença é como você escala a tecnologia e como você escala a infraestrutura.”

Mesmo enquanto a OpenAI enfrenta esses problemas, está tentando se integrar mais profundamente na vida dos usuários. A empresa está correndo para construir agentes, ou ferramentas de IA que podem realizar tarefas complexas e em múltiplas etapas de forma autônoma. No mundo da IA, essas são chamadas de tarefas com um “horizonte de tempo” mais longo, exigindo que a IA mantenha coerência ao longo de um período mais longo enquanto lida com múltiplos passos. Por exemplo, no início deste ano, na conferência Dev Day da empresa, a OpenAI apresentou agentes de IA que podiam fazer chamadas telefônicas para fazer pedidos de comida e fazer reservas em hotéis em vários idiomas.

Para Turley e outros, é aqui que as apostas se tornarão particularmente altas. Os agentes poderiam tornar a IA muito mais útil, movendo o que ela pode fazer para fora da interface de chatbot. A mudança também poderia conceder a essas ferramentas um nível alarmante de acesso ao restante de sua vida digital.

“Estou muito animada para ver onde as coisas vão em uma direção mais agente com a IA”, diz Kim. “Neste momento, você vai até o modelo com sua pergunta, mas estou animada para ver o modelo mais integrado em sua vida e fazendo coisas proativamente, e tomando ações em seu nome.”

O objetivo do ChatGPT não é ser apenas um chatbot, diz Fedus. Como existe hoje, o ChatGPT é “bastante limitado” por sua interface e computação. Ele diz que o objetivo é criar uma entidade com a qual você possa conversar, ligar e confiar para trabalhar para você. Fedus acha que sistemas como a linha de modelos de “raciocínio” da OpenAI, que criam um rastro de etapas verificáveis explicando sua lógica, poderiam torná-lo mais confiável para esses tipos de tarefas.

Turley diz que, ao contrário de alguns relatos, “não acho que haverá tal coisa como um agente da OpenAI”. O que você verá é “funcionalidade cada vez mais agente dentro do ChatGPT”, no entanto. “Nosso foco será lançar essa coisa gradualmente. A última coisa que quero é um grande lançamento em que isso possa de repente fazer coisas ao longo de horas com todos os seus dados.”

“A última coisa que quero é um grande lançamento”

Até o terceiro aniversário do ChatGPT no próximo ano, a OpenAI provavelmente parecerá muito diferente do que parece hoje. A empresa provavelmente levantará bilhões de dólares a mais em 2025, lançará seu próximo grande modelo “Orion”, enfrentará uma concorrência crescente e terá que navegar pela complexidade de um novo presidente dos EUA e seu czar de IA.

Turley espera que a versão de 2024 do ChatGPT em breve pareça tão antiquada quanto o AOL Instant Messenger. Daqui a um ano, provavelmente riremos de quão básico era, diz ele. “Lembra quando tudo o que podíamos fazer era fazer perguntas a ele?”

Fonte

Compartilhe esse conteúdo: