“Impressionante” – atualização do meio da jornada impressiona artistas de IA com recurso de câmera

Prolongar / Midjourney 5.2 permite “diminuir o zoom” em imagens sintetizadas. A imagem sintética original é mostrada aqui na caixa pontilhada vermelha.

meio da jornada

Na quinta-feira, a Midjourney revelou a versão 5.2 de seu modelo de síntese de imagem com inteligência artificial, que inclui um novo recurso de “zoom out” que permite manter uma imagem sintetizada central enquanto constrói automaticamente uma cena maior ao seu redor, simulando o zoom com uma lente de câmera.

Semelhante ao outpainting – uma técnica de imagem de IA introduzida pelo DALL-E 2 da OpenAI em agosto de 2022 – o recurso de redução de zoom do Midjourney pode pegar uma imagem gerada por IA existente e expandir suas bordas, mantendo o assunto original centralizado na nova imagem. Mas, ao contrário do DALL-E e do recurso Generative Fill do Photoshop, você não pode selecionar uma imagem personalizada para expandir. No momento, o zoom-out da v5.2 funciona apenas em imagens geradas no Midjourney, um serviço gerador de imagens de IA por assinatura.

No servidor Midjourney Discord (ainda a interface oficial do Midjourney, embora haja planos para mudar isso), os usuários podem experimentar diminuir o zoom gerando qualquer imagem v5.2 (agora o padrão) e aumentar o resultado. Depois disso, botões especiais de “Zoom” aparecem abaixo da saída. Você pode diminuir o zoom por um fator de 1,5x, 2x ou um valor personalizado entre 1 e 2. Outro botão, chamado “Make Square”, gerará material em torno da imagem existente de uma forma que cria uma proporção quadrada de 1:1 .

Uma imagem inicial de uma “mulher guerreira” gerada por Midjourney 5.2.

meio da jornada
A imagem foi “ampliada” 2x pelo Midjourney 5.2.

meio da jornada
A imagem foi “ampliada” 2x pelo Midjourney 5.2 novamente.

meio da jornada
A imagem foi “ampliada” 2x pelo Midjourney 5.2 novamente.

meio da jornada
A imagem foi “ampliada” 2x pelo Midjourney 5.2 ainda mais!

meio da jornada

David Holz, o criador do Midjourney, anunciou os novos recursos e melhorias da versão 5.2 no servidor Discord na noite de quinta-feira. Além de “zoom out”, as adições mais significativas incluem um sistema estético revisado, prometendo melhor qualidade de imagem e um comando “–stylize” mais forte que efetivamente influencia a aparência de uma imagem não realista. Há também um novo “modo de alta variação”, ativado por padrão, que aumenta a variedade de composição entre as gerações de imagens. Além disso, um novo comando “/shorten” permite que os usuários avaliem os prompts na tentativa de eliminar palavras não essenciais.

Apesar do lançamento imediato da versão 5.2, Holz enfatizou em seu anúncio que mudanças podem ocorrer sem aviso prévio. Versões mais antigas do modelo Midjourney ainda estão disponíveis usando o comando “/settings” ou o argumento de comando em linha “–v 5.1”.

Uma comparação entre a saída do Midjourney v3 (esquerda), v4 (centro-esquerda), v5 (centro-direita) e v5.2 (direita) com o prompt — Prolongar / Uma comparação entre a saída de Midjourney v3 (esquerda), v4 (centro-esquerda), v5 (centro-direita) e v5.2 (direita) com o prompt “um bárbaro musculoso com armas ao lado de um aparelho de televisão CRT, cinematográfico, 8K , iluminação de estúdio.”

meio da jornada

Para os fãs desta nova forma de arte de síntese de imagem que às vezes é chamada de “sintografia” por proponentes como Julie Wieland, as mudanças na versão 5.2 são bem-vindas, com alguns usuários do Midjourney chamando-as de “esplêndido” e “surpreendente“, que não são superlativos incomuns no mundo da IA no momento. Mas os fãs provavelmente argumentariam que as melhorias visuais do Midjourney justificam o espanto reações entre eles.

A atualização mais recente faz parte de uma série de melhorias de qualidade desde março de 2022, quando o modelo gerou imagens relativamente mal definidas que careciam de detalhes. Mais recentemente, a Midjourney introduziu a v5.0 em março e a v5.1 em maio deste ano, ambas aprimorando o realismo e os detalhes da imagem. A introdução da série de modelos v5 permitiu a criação de imagens realistas do Papa Francisco e de Donald Trump, o que despertou preocupações sobre deepfakes nas redes sociais.

Vamos diminuir o zoom em uma das imagens “um bárbaro musculoso com armas ao lado de um aparelho de televisão CRT, cinematográfico, 8K, iluminação de estúdio” mostradas acima.

meio da jornada
Com zoom de 2x, a caverna do bárbaro ganha mais detalhes ocultos.

meio da jornada
Com zoom de 2x novamente, agora podemos ver um elegante lustre de cristal. Isso poderia realmente ser a sala de estar formal?

meio da jornada

Apesar da empolgação com os novos recursos entre os entusiastas do Midjourney, a síntese de imagens permanece altamente controversa entre alguns artistas devido à forma como esses sistemas de IA são treinados, utilizando milhões de imagens extraídas da web sem consulta, crédito ou permissão do artista. Midjourney nunca revelou oficialmente o conteúdo exato de seus dados de treinamento. A Adobe está tentando um caminho mais ético com o Firefly, mas a Venture Beat relatou recentemente que o consentimento ativo do artista ainda é marginal.

Por enquanto, é difícil não apreciar os avanços técnicos surpreendentes do Midjourney enquanto ainda se pergunta se há um caminho mais ético a seguir para essa tecnologia – um que agrade aos artistas, tanto tradicionais quanto sintetizadores.

Akanejunho 23, 2023

0 3 minutos de leitura

Mostrar mais

Ler o Próximo

“Impressionante” – atualização do meio da jornada impressiona artistas de IA com recurso de câmera

Akane

Ler o Próximo

Esta função do Google Sheets faz o Excel se sentir como um dinossauro

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

Os agentes de fronteira dos EUA estão pedindo ajuda para tirar fotos de todos que entram no país de carro

Os Rovers da NASA acabaram de encontrar rochas retorcidas semelhantes em lados opostos de Marte

Centenas de sites de comércio eletrônico invadidos em ataques de cadeia de suprimentos

Esta função do Google Sheets faz o Excel se sentir como um dinossauro

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

Os agentes de fronteira dos EUA estão pedindo ajuda para tirar fotos de todos que entram no país de carro

Os Rovers da NASA acabaram de encontrar rochas retorcidas semelhantes em lados opostos de Marte

Centenas de sites de comércio eletrônico invadidos em ataques de cadeia de suprimentos

Deixe um comentário Cancelar resposta

Ler o Próximo

Esta função do Google Sheets faz o Excel se sentir como um dinossauro

Não bloqueado arrecada US $ 20 milhões para a IA para ajudar os desenvolvedores a entender as bases de código

A Newlimit, fundada pelo CEO da Coinbase, Brian Armstrong, arrecada US $ 130 milhões para desenvolver tratamentos de reversão da idade

O Google estreia um modelo atualizado Gemini 2.5 Pro Ai antes da E/S

A relevância da IA ​​levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA

O novo Surface Pro da Microsoft é menor, mais leve e mais amigável

Impulsionado pela Defesa e Starlink, Orca AI recebe US $ 72,5 milhões para sua plataforma de remessa autônoma

Os agentes de fronteira dos EUA estão pedindo ajuda para tirar fotos de todos que entram no país de carro

Os Rovers da NASA acabaram de encontrar rochas retorcidas semelhantes em lados opostos de Marte

Centenas de sites de comércio eletrônico invadidos em ataques de cadeia de suprimentos

Artigos relacionados

Deixe um comentário Cancelar resposta

A relevância da IA levanta US $ 24 milhões para ajudar as empresas a criar agentes de IA