technology

IA imager Midjourney v5 impressiona com imagens fotorrealistas e mãos com 5 dedos

.

Um exemplo de iluminação e efeitos de pele no gerador de imagem AI Midjourney v5.
Prolongar / Um exemplo de iluminação e efeitos de pele no gerador de imagem AI Midjourney v5.

Na quarta-feira, no meio da jornada anunciado versão 5 de seu serviço comercial de síntese de imagens de IA, que pode produzir imagens fotorrealistas em um nível de qualidade que alguns fãs de arte de IA estão chamando repugnante e “perfeito demais.” Midjourney v5 já está disponível como um teste alfa para clientes que assinam o serviço Midjourney, que está disponível através do Discord.

“MJ v5 atualmente me parece como finalmente conseguir óculos depois de ignorar a visão ruim por um tempo demais”, disse Julie Wieland, uma designer gráfica que muitas vezes compartilha suas criações Midjourney no Twitter. “De repente, você vê tudo em 4k, parece estranhamente opressor, mas também incrível.”

Wieland compartilhou algumas de suas gerações Midjourney v5 com Strong The One (visto abaixo em uma galeria e na imagem principal acima), e eles certamente mostram uma progressão nos detalhes da imagem desde que Midjourney chegou pela primeira vez em março de 2022. A versão 3 estreou em agosto e a versão 4 estreou em novembro. Cada iteração adicionou mais detalhes aos resultados gerados, como mostram nossos experimentos:

Uma comparação entre a saída de Midjourney v3 (esquerda), v4 (centro) e v5 (direita) com o prompt
Prolongar / Uma comparação entre a saída de Midjourney v3 (esquerda), v4 (centro) e v5 (direita) com o prompt “um bárbaro musculoso com armas ao lado de um aparelho de televisão CRT, cinematográfico, 8K, iluminação de estúdio”.

Strong The One

O Midjourney funciona de maneira semelhante a sintetizadores de imagem como Stable Diffusion e DALL-E, pois gera imagens com base em descrições de texto chamadas “prompts” usando um modelo de IA treinado em milhões de obras de arte feitas pelo homem. Recentemente, Midjourney esteve no centro de uma controvérsia de direitos autorais em relação a uma história em quadrinhos que usava versões anteriores do serviço.

Depois de experimentar a v5 por um dia, Wieland notou melhorias que incluem texturas de pele e características faciais “incrivelmente realistas”; iluminação mais realista ou cinematográfica; melhores reflexos, brilhos e sombras; ângulos ou visões gerais mais expressivos de uma cena e “olhos que são quase perfeitos e não mais vacilantes”.

E, claro, as mãos.

No ano passado, a ideia de que os geradores de arte de IA não podem renderizar as mãos corretamente se tornou uma espécie de clichê cultural. Notavelmente, Midjourney v5 pode gerar mãos humanas realistas muito bem. “As mãos estão corretas na maioria das vezes, com 5 dedos em vez de 7-10 em uma mão”, disse Wieland.

Nas notas de lançamento do Discord do serviço, Midjourney também observou que a v5 agora responde com uma “faixa estilística muito mais ampla” do que a versão 4, além de ser mais sensível a solicitações, gerando menos texto indesejado e oferecendo um aumento de 2x na resolução da imagem.

Se há uma desvantagem visual na atualização Midjourney para fãs de arte de IA, talvez ela venha de imagens que podem ser tão realistas e “perfeitas” que a precisão do modelo tira um pouco da emoção de gerar repetidamente imagens de IA para encontrar um resultado adequado, o que pode-se chamar de “efeito caça-níqueis”. Embora um usuário do Twitter chamado Philipp Lenssen observado“Se você tem um assunto de imagem específico em mente, ainda é um pouco como loteria. Mas com maiores chances de ganhar do que v4.”

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo