Midjourney, a startup de geração de imagens AI fundada e dirigida pelo ex-engenheiro da Magic Leap, David Holz, está impressionando os usuários com um novo recurso lançado na noite passada: edição de imagens AI.
Como uma boa parte dos mais de 20 milhões de usuários da Midjourney (incluindo alguns de nós na VentureBeat) provavelmente sabe, a Midjourney anteriormente permitia que os usuários enviassem suas próprias imagens coletadas fora do serviço para sua interface web alfa e/ou servidor Discord para servir como referência para seus modelos de geração de imagens AI — o mais recente sendo o Midjourney 6.1. Após receber uma imagem de referência enviada, o modelo AI da Midjourney é capaz de gerar novas imagens com base no arquivo fornecido pelo usuário.
No entanto, esse recurso de referência não fazia alterações na imagem original — apenas a utilizava como um ponto de partida solto.
Agora, com o novo recurso “Editar” da Midjourney, os usuários podem enviar qualquer imagem de sua escolha e realmente editar seções dela com AI, ou mudar o estilo e a textura de algo totalmente diferente, como transformar uma fotografia vintage em anime — enquanto preserva a maioria dos sujeitos e objetos da imagem e suas relações espaciais.
Funciona até mesmo com rabiscos e desenhos à mão que os usuários enviam, transformando rabiscos em peças de arte completas em segundos.
A Midjourney postou um vídeo de demonstração mostrando como usar os novos recursos.
Apesar de sua popularidade, a Midjourney é uma das várias empresas de AI que estão sendo processadas por um grupo de artistas humanos por suposta violação de direitos autorais devido à sua coleta de obras criadas por humanos sem permissão, autorização, consentimento ou compensação para treinar seus modelos. O caso ainda está nos tribunais.
O Editor de Imagens Midjourney parece estar restrito ao seu mais recente modelo de AI, Midjourney 6.1, o que faz sentido.
Em uma mensagem para a comunidade do Discord da Midjourney, Holz escreveu que: “Todas essas coisas são muito novas, e queremos dar à comunidade e à equipe de moderação humana tempo para se acostumar com isso lentamente…”
Como consequência, o novo recurso do Editor Midjourney está, por enquanto, restrito a usuários que geraram mais de 10.000 imagens com o serviço, aqueles com assinaturas anuais pagas e aqueles que são assinantes há um ano ou mais.
No entanto, se você se encaixa nesses critérios, pode usar o novo Editor de Imagens Midjourney seguindo as instruções abaixo.
Como encontrar e começar a usar o Editor de Imagens Midjourney
O novo Editor de Imagens Midjourney está disponível apenas na interface web alfa, acessível em alpha.midjourney.com.
Uma vez lá e logado, o usuário qualificado deve ver um novo botão na barra lateral esquerda, cerca de metade do caminho para baixo, com um ícone mostrando um pequeno lápis em um bloco. Passar o mouse sobre ele mostrará que diz “Editar” (ou o texto será exibido automaticamente se a janela do seu navegador for larga o suficiente).
Clicar nisso deve abrir a nova tela do Editor, que deve solicitar ao usuário duas opções principais: “Editar a partir da URL” e “Editar Imagem Enviada”.
A última requer que o usuário tenha um arquivo salvo em sua máquina, enquanto a primeira pode aceitar uma ampla gama de imagens hospedadas em vários sites, como Wikimedia Commons, se o usuário simplesmente colar o link correto para a imagem hospedada na web.
Uma vez que uma cópia do arquivo é enviada para a Midjourney via URL ou repositório de arquivos do usuário, a imagem deve aparecer no meio da nova tela do editor.
Você notará que há uma ampla variedade de opções e vários botões no menu da barra lateral esquerda que os usuários podem selecionar para modificar a imagem com o Midjourney 6.1, incluindo “1. Apagar” que permite ao usuário remover e pintar sobre partes da imagem com AI usando um pincel e um prompt de texto, “2. Mover/Redimensionar” que permite ao usuário mover a imagem ao redor da tela virtual e estender suas bordas com novas imagens correspondentes geradas por AI, e “3. Restaurar” que é o inverso de Apagar e permite ao usuário reter quaisquer partes da imagem original que eles acidentalmente pintaram sobre com o pincel Apagar.
O usuário pode controlar o tamanho do pincel com um controle deslizante na barra lateral esquerda, bem como a “escala” da imagem, aumentando ou diminuindo, e a proporção da imagem em si com mais predefinições abaixo disso.
Há também um botão “Sugerir Prompt” que a Midjourney explica através de um texto de ajuda ao passar o mouse que é projetado para ajudar o usuário a gerar um prompt descrevendo a imagem que ele acabou de enviar — caso queira alterar esse prompt ou usá-lo para gerar uma nova imagem semelhante. O texto do prompt sugerido deve aparecer automaticamente na barra de entrada de prompt na parte superior da tela.
Olhando para nosso exemplo do carro conceito, eu usei a ferramenta de pincel Apagar no motorista e usei a barra de entrada de texto na parte superior da interface web da Midjourney para substituir o motorista por um “esqueleto em chamas dirigindo”. Depois de digitar meu prompt de texto na barra de entrada superior, pressionei o botão marcado “Enviar Edição” ou pressionei enter no meu teclado para aplicar as alterações.
Assim como o gerador de imagens bruto da Midjourney, o Editor cria quatro versões automaticamente para cada prompt de texto — visíveis na barra lateral direita sob o botão “Enviar”.
Aqui está o melhor resultado do meu experimento:
O usuário pode então continuar fazendo novas alterações nesta imagem resultante, aumentar a resolução com o upscaler embutido da Midjourney através de um botão abaixo, ou baixá-la como está.
Retexturização transforma imagens em novas adaptações em diferentes estilos
Além disso, o leitor exigente e o usuário da Midjourney notarão que também havia um conjunto inteiro de opções para o Editor encontrado clicando na aba marcada “Retexturizar” na barra lateral esquerda.
Como a própria Midjourney explica na barra lateral esquerda após clicar nesta opção: “Retexturizar mudará o conteúdo da imagem de entrada enquanto tenta preservar a estrutura original. Para bons resultados, evite usar prompts que sejam incompatíveis com a estrutura geral da imagem.”
Como você verá na captura de tela acima que eu embeddei, a tela de Retexturização tem muito menos opções do que a tela de Edição regular. Na verdade, basicamente a única opção é usar a barra de entrada de texto na parte superior da tela para descrever que tipo de retexturização você deseja que seja feita na imagem original que você forneceu.
Depois de inserir isso, o usuário pode pressionar “Enviar Retexturização” e voila, a Midjourney usará AI para aplicar a nova textura e adaptar a imagem de acordo com o prompt do usuário, novamente gerando quatro versões para escolher.
No meu caso, eu tentei vários estilos diferentes, incluindo anime, pintura de caverna, areia colorida, gosma grotesca e estilos cyberpunk, entre outros. Veja alguns exemplos de retexturização que recebi abaixo. Uma nota cautelar em meus testes limitados até agora — o recurso de retexturização parece distorcer e remover alguns detalhes da imagem original, além de trocar de gênero os sujeitos e adicionar novos detalhes extrínsecos. No entanto, isso faz parte da diversão de usar a Midjourney ou outras ferramentas criativas de AI generativa — ver o que o modelo produz com base na sua orientação!
Recepção calorosa entre criadores de imagens AI no X
A comunidade de arte e imagem AI no X aplaudiu o novo editor da Midjourney — que havia sido rumores por várias semanas. Já, alguns dos principais criadores de AI experimentaram e postaram seus exemplos, muitos dos quais são impressionantes. Aqui está uma amostra:
Se você é um usuário da Midjourney que atende aos critérios descritos acima, vá em frente e faça login e experimente! Deixe-me saber seus pensamentos: [email protected]. A Midjourney também foi aberta sobre seus planos de lançar um editor 3D ou de vídeo, que pode vir ainda este ano.