Se você esteve na internet — ou, pelo menos, na rede social X — nos últimos dias, provavelmente se deparou com imagens coloridas e suaves no estilo anime de fotografias famosas renderizadas no estilo do estúdio japonês, Studio Ghibli (o mesmo que fez Princesa Mononoke, O Menino e a Garça, e Meu Amigo Totoro, entre muitos outros filmes clássicos de animação).
Na verdade, alguns usuários estão reclamando porque seus feeds parecem estar preenchidos quase exclusivamente com esse tipo de imagem.
Seja o atual presidente Trump, a imagem icônica do “Homem do Tanque” durante os protestos pró-democracia na Praça Tiananmen em 1989, Osama Bin Laden, Jeffrey Epstein, ou até mesmo outros momentos e personagens da cultura pop, como a icônica participação de Sam Rockwell em The White Lotus e muitos memes populares de outrora, as pessoas têm feito e compartilhado essas imagens a uma velocidade impressionante.
Muito disso se deve à nova atualização do modelo GPT-4o da OpenAI, que está por trás do ChatGPT para os níveis de assinatura Pro, Plus e Team, que ativa a “geração de imagens nativa”.
Enquanto o ChatGPT anteriormente permitia que os usuários criassem imagens a partir de prompts de texto, ele o fazia roteando-os para outro modelo separado da OpenAI, o DALL-E 3.
Mas o modelo GPT-4o da OpenAI é chamado assim com um “o” porque é um modelo “omni” — a empresa o treinou não apenas em texto e código, mas também em imagens e, presumivelmente, em vídeo e áudio, permitindo que ele compreenda todas essas formas de mídia e suas semelhanças e diferenças, conceba ideias entre elas (uma “maçã” não é apenas uma palavra, mas também algo que pode ser desenhado como uma fruta vermelha, amarela ou verde) e produza com precisão essa mídia dada uma solicitação de texto por um usuário sem se conectar a modelos externos.
Como consequência, assim como a recente atualização do Google AI Studio para incluir um modelo experimental de criação de imagens Gemini 2.0 Flash, o novo GPT-4o da OpenAI também pode aceitar uploads de imagens de qualquer imagem pré-existente em sua galeria ou que você tenha capturado ou salvo da web.
Como usar o ChatGPT para fazer imagens no estilo Studio Ghibli (e mudar ou transferir qualquer imagem para qualquer estilo!)
Primeiro, navegue até Chat.com ou ChatGPT.com e certifique-se de que você está logado com sua conta ChatGPT Plus, Pro ou Team e que o seletor de modelo de IA (localizado no canto esquerdo da janela de sessão) está mostrando “GPT-4o” como o modelo escolhido (você pode clicar nele para abrir um menu suspenso e selecionar o modelo apropriado entre as opções disponíveis).
Uma vez feito isso, você pode fazer upload de uma imagem para o ChatGPT usando o botão “+” no canto inferior esquerdo da caixa de entrada de texto do prompt, agora você pode pedir ao novo GPT-4o com o modelo de criação de imagens para renderizar sua imagem pré-existente em um novo estilo.
Se desejar, você pode tentar fazendo upload de uma foto sua e de amigos e digitando “faça todas essas pessoas no estilo de uma animação do Studio Ghibli”. E após alguns segundos, ele fará isso com resultados bastante convincentes e divertidos. Ele até suporta anexar várias imagens e combiná-las em uma única peça.
Uso do nível gratuito do ChatGPT atrasado
A OpenAI inicialmente disse que também ativaria esse recurso para usuários gratuitos (não pagantes do ChatGPT), mas, infelizmente para eles, o cofundador e CEO Sam Altman postou hoje que o recurso será atrasado devido à demanda esmagadora por parte dos assinantes pagantes dos níveis Plus, Pro e Team do ChatGPT.
Como ele escreveu no X:
“as imagens no chatgpt são muito mais populares do que esperávamos (e tínhamos expectativas bastante altas).
o lançamento para nosso nível gratuito, infelizmente, será atrasado por um tempo.”
Enquanto isso, aqueles que têm acesso provavelmente continuarão criando edições de imagem neste e em outros estilos reconhecíveis ou novos.
Claro, nem todos são fãs do trabalho da OpenAI aqui. Na verdade, o criador do Studio Ghibli, Hayao Miyazaki, apareceu em um documentário em 2016 — e um dos momentos mais memoráveis dele ainda é referenciado até hoje é sua reação de desgosto e repulsa a um exemplo inicial de animação e física impulsionadas por IA, adivinha, um modelo da OpenAI.
Como acontece com muitos produtos e serviços de IA generativa, os dados de treinamento da OpenAI para essa nova capacidade de geração de imagens permanecem em sigilo, mas é amplamente especulado que contenham material protegido por direitos autorais — e enquanto imitar um estilo geralmente não é considerado infração de direitos autorais nos EUA, isso está incomodando alguns fãs da animação original.
Por enquanto, as marcas e empresas que desejam brincar com esse estilo devem fazê-lo com cautela e após séria consideração, dada a possível repercussão negativa entre alguns usuários. Mas para aqueles que são incondicionalmente a favor de ferramentas de IA ou com bases de fãs mais indulgentes e divertidas, está claro que a OpenAI tem mais um sucesso em suas mãos.