technology

“Muito fácil”—Midjourney testa nova versão dramática de seu gerador de imagens de IA

.

Oito imagens que geramos com a versão alfa do Midjourney v4.
Prolongar / Oito imagens que geramos com a versão alfa do Midjourney v4.

Strong The One

No sábado, o serviço de imagens AI Midjourney começou a testar a versão alfa 4 (“v4”) de seu modelo de síntese de texto para imagem, que está disponível para assinantes em seu servidor Discord. O novo modelo fornece mais detalhes do que o disponível anteriormente, inspirando alguns artistas de IA a comentar que a v4 quase torna “fácil demais” obter resultados de alta qualidade a partir de prompts simples.

Midjourney abriu ao público em março como parte de uma onda inicial de modelos de síntese de imagens de IA. Rapidamente ganhou muitos seguidores devido ao seu estilo distinto e por estar disponível publicamente antes de DALL-E e Stable Diffusion. Em pouco tempo, obras de arte criadas em Midjourney foram notícia ao vencer concursos de arte, fornecendo material para registros de direitos autorais potencialmente históricos e aparecendo em sites de ilustração de ações (mais tarde sendo banidos).

Com o tempo, a Midjourney refinou seu modelo com mais treinamento, novos recursos e mais detalhes. O modelo padrão atual, conhecido como “v3”, estreou em agosto. Agora, Midjourney v4 está sendo testado por milhares de membros do servidor Discord do serviço que criam imagens por meio do bot Midjourney. Atualmente, os usuários podem experimentar a v4 anexando “–v 4” aos prompts.

“V4 é uma base de código totalmente nova e uma arquitetura de IA totalmente nova”, escreveu o fundador da Midjourney, David Holz, em um anúncio do Discord. “É o nosso primeiro modelo treinado em um novo superaglomerado de IA Midjourney e está em andamento há mais de 9 meses.”

Saída de comparação entre Midjourney v3 (esquerda) e v4 (direita) com o prompt
Prolongar / Saída de comparação entre Midjourney v3 (esquerda) e v4 (direita) com o prompt “um bárbaro musculoso com armas ao lado de um aparelho de televisão CRT, cinematográfico, 8K, iluminação de estúdio”.

Strong The One

Em nossos testes do modelo v4 do Midjourney, descobrimos que ele fornece uma quantidade muito maior de detalhes do que o v3, uma melhor compreensão dos prompts, melhores composições de cena e, às vezes, melhor proporcionalidade em seus assuntos. Ao buscar imagens fotorrealistas, alguns resultados que vimos podem ser difíceis de distinguir de fotos reais em resoluções mais baixas.

De acordo com Holz, outros recursos da v4 incluem:

– Muito mais conhecimento (de criaturas, lugares e muito mais)
– Muito melhor em acertar pequenos detalhes (em todas as situações)
– Lida com prompts mais complexos (com vários níveis de detalhes)
– Melhor com cenas multi-objeto / multi-personagem
– Suporta funcionalidades avançadas como prompt de imagem e multi-prompts
– Suporta –chaos arg (defina de 0 a 100) para controlar a variedade de grades de imagem

A reação ao Midjourney v4 foi positiva no Discord do serviço, e os fãs de outros modelos de síntese de imagem – que lutam regularmente com prompts complexos para obter bons resultados – estão prestando atenção.

Um redditor chamado Jon Bristow postou na comunidade r/StableDiffusion: “Alguém mais acha que Midjourney v4 é ‘muito fácil’? Isso foi ‘Fotografia em close de um rosto’ e parece que você não conseguiu. Tipo foi pré-fabricado.” Em resposta, alguém brincou: “Triste para os prompters profissionais que perderão seu novo emprego criado há um mês”.

Midjourney diz que a v4 ainda está em alfa, então continuará corrigindo as peculiaridades do novo modelo ao longo do tempo. A empresa planeja aumentar a resolução e a qualidade das imagens aprimoradas da v4, adicionando proporções personalizadas (como a v3), aumentando a nitidez da imagem e reduzindo os artefatos de texto. Midjourney está disponível por uma taxa de assinatura mensal que varia entre US$ 10 e US$ 50 por mês.

Considerando o progresso que Midjourney fez ao longo de oito meses de trabalho, nos perguntamos o que o progresso do próximo ano na síntese de imagens trará.

Vai para discussão…

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo