technology

“Impressionante” – atualização do meio da jornada impressiona artistas de IA com recurso de câmera

.

Midjourney 5.2 permite
Prolongar / Midjourney 5.2 permite “diminuir o zoom” em imagens sintetizadas. A imagem sintética original é mostrada aqui na caixa pontilhada vermelha.

meio da jornada

Na quinta-feira, a Midjourney revelou a versão 5.2 de seu modelo de síntese de imagem com inteligência artificial, que inclui um novo recurso de “zoom out” que permite manter uma imagem sintetizada central enquanto constrói automaticamente uma cena maior ao seu redor, simulando o zoom com uma lente de câmera.

Semelhante ao outpainting – uma técnica de imagem de IA introduzida pelo DALL-E 2 da OpenAI em agosto de 2022 – o recurso de redução de zoom do Midjourney pode pegar uma imagem gerada por IA existente e expandir suas bordas, mantendo o assunto original centralizado na nova imagem. Mas, ao contrário do DALL-E e do recurso Generative Fill do Photoshop, você não pode selecionar uma imagem personalizada para expandir. No momento, o zoom-out da v5.2 funciona apenas em imagens geradas no Midjourney, um serviço gerador de imagens de IA por assinatura.

No servidor Midjourney Discord (ainda a interface oficial do Midjourney, embora haja planos para mudar isso), os usuários podem experimentar diminuir o zoom gerando qualquer imagem v5.2 (agora o padrão) e aumentar o resultado. Depois disso, botões especiais de “Zoom” aparecem abaixo da saída. Você pode diminuir o zoom por um fator de 1,5x, 2x ou um valor personalizado entre 1 e 2. Outro botão, chamado “Make Square”, gerará material em torno da imagem existente de uma forma que cria uma proporção quadrada de 1:1 .

David Holz, o criador do Midjourney, anunciou os novos recursos e melhorias da versão 5.2 no servidor Discord na noite de quinta-feira. Além de “zoom out”, as adições mais significativas incluem um sistema estético revisado, prometendo melhor qualidade de imagem e um comando “–stylize” mais forte que efetivamente influencia a aparência de uma imagem não realista. Há também um novo “modo de alta variação”, ativado por padrão, que aumenta a variedade de composição entre as gerações de imagens. Além disso, um novo comando “/shorten” permite que os usuários avaliem os prompts na tentativa de eliminar palavras não essenciais.

Apesar do lançamento imediato da versão 5.2, Holz enfatizou em seu anúncio que mudanças podem ocorrer sem aviso prévio. Versões mais antigas do modelo Midjourney ainda estão disponíveis usando o comando “/settings” ou o argumento de comando em linha “–v 5.1”.

Uma comparação entre a saída do Midjourney v3 (esquerda), v4 (centro-esquerda), v5 (centro-direita) e v5.2 (direita) com o prompt
Prolongar / Uma comparação entre a saída de Midjourney v3 (esquerda), v4 (centro-esquerda), v5 (centro-direita) e v5.2 (direita) com o prompt “um bárbaro musculoso com armas ao lado de um aparelho de televisão CRT, cinematográfico, 8K , iluminação de estúdio.”

meio da jornada

Para os fãs desta nova forma de arte de síntese de imagem que às vezes é chamada de “sintografia” por proponentes como Julie Wieland, as mudanças na versão 5.2 são bem-vindas, com alguns usuários do Midjourney chamando-as de “esplêndido” e “surpreendente“, que não são superlativos incomuns no mundo da IA ​​no momento. Mas os fãs provavelmente argumentariam que as melhorias visuais do Midjourney justificam o espanto reações entre eles.

A atualização mais recente faz parte de uma série de melhorias de qualidade desde março de 2022, quando o modelo gerou imagens relativamente mal definidas que careciam de detalhes. Mais recentemente, a Midjourney introduziu a v5.0 em março e a v5.1 em maio deste ano, ambas aprimorando o realismo e os detalhes da imagem. A introdução da série de modelos v5 permitiu a criação de imagens realistas do Papa Francisco e de Donald Trump, o que despertou preocupações sobre deepfakes nas redes sociais.

Apesar da empolgação com os novos recursos entre os entusiastas do Midjourney, a síntese de imagens permanece altamente controversa entre alguns artistas devido à forma como esses sistemas de IA são treinados, utilizando milhões de imagens extraídas da web sem consulta, crédito ou permissão do artista. Midjourney nunca revelou oficialmente o conteúdo exato de seus dados de treinamento. A Adobe está tentando um caminho mais ético com o Firefly, mas a Venture Beat relatou recentemente que o consentimento ativo do artista ainda é marginal.

Por enquanto, é difícil não apreciar os avanços técnicos surpreendentes do Midjourney enquanto ainda se pergunta se há um caminho mais ético a seguir para essa tecnologia – um que agrade aos artistas, tanto tradicionais quanto sintetizadores.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo