technology

Fazendo caretas: como treinar uma IA em seu rosto para criar retratos bobos

.

Sempre quis ser um super-herói?  Mostraremos como.
Prolongar / Sempre quis ser um super-herói? Mostraremos como.

Shaun Hutchinson | Aurich Lawson | Difusão estável

Até agora, você leu muito sobre tecnologias de IA generativas, como Midjourney e Stable Diffusion, que traduzem a entrada de texto em imagens em segundos. Se você é como eu, imediatamente se perguntou como poderia usar essa tecnologia para dar um tapa na Mona Lisa ou no Capitão América. Afinal, quem não quer ser o cu da América?

A velha maneira de fazer as coisas.
Prolongar / A velha maneira de fazer as coisas.

Eu tenho uma longa história de colocar minha cara nas coisas. Anteriormente, fazer isso era um processo meticuloso de encontrar ou tirar uma foto com o ângulo e a expressão certos e, em seguida, usar o Photoshop para enxertar meu rosto no original. Embora eu considerasse os resultados loucos, mas valiosos, o processo exigia muito tempo. Mas com Stable Diffusion e Dreambooth, agora sou capaz de treinar um modelo em meu rosto e colá-lo em qualquer coisa que meu estranho coração desejar.

Neste passo a passo, mostrarei como instalar o Stable Diffusion localmente em seu computador, treinar o Dreambooth em seu rosto e gerar tantas fotos suas que seus amigos e familiares acabarão bloqueando você para impedir o dilúvio de fotos bobas. Todo o processo levará cerca de duas horas do início ao fim, com a maior parte do tempo gasta como babá de um notebook do Google Colab enquanto ele treina em suas imagens.

Antes de começarmos, algumas notas:

Especificações do sistema

Para este passo a passo, estou trabalhando em um computador Windows com uma Nvidia 3080Ti com 12 GB de VRAM. Para executar o Stable Diffusion, você deve ter uma placa de vídeo Nvidia com no mínimo 4 GB de RAM de vídeo. Difusão estável pode roda em sistemas Linux, Macs com chip M1 ou M2 e GPUs AMD, e você pode gerar imagens usando apenas a CPU. Esses métodos exigem alguns ajustes, portanto, para os propósitos deste passo a passo, é preferível uma máquina Windows com uma GPU Nvidia.

Preocupações éticas

Quando se trata de programas de geração de imagens como Stable Diffusion, há preocupações éticas que eu deveria reconhecer. Existem questões válidas sobre como os dados usados ​​para treinar o Stable Diffusion foram coletados e se é ético treinar o programa no trabalho de um artista sem seu consentimento. É um grande tópico que está fora do escopo deste passo a passo. Pessoalmente, uso o Stable Diffusion como autor para me ajudar a criar esboços rápidos de personagens, e isso se tornou uma parte inestimável do meu processo. No entanto, não acho que o trabalho criado pela Stable Diffusion deva ser comercializado, pelo menos até resolvermos os dilemas éticos e determinarmos como compensar os artistas que podem ter sido explorados. E, por enquanto, sinto que a difusão estável deve permanecer apenas para uso pessoal.

Por fim, tecnologias como Stable Diffusion são simultaneamente emocionantes e aterrorizantes. É emocionante porque dá a pessoas como eu, que atingiram o auge artístico com pinturas a dedo no jardim de infância, a capacidade de criar as imagens que imagino. Mas é assustador porque pode ser usado para criar propaganda assustadoramente realista e deepfakes com o potencial de arruinar a vida das pessoas. Portanto, você só deve treinar a difusão estável em fotos suas ou de alguém que tenha lhe dado consentimento. Período.

Agora, quem está pronto para fazer isso?

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo