technology

Quando a IA pode fazer arte – o que isso significa para a criatividade? | Inteligência Artificial (IA)

.

Cuando o artista conceitual e ilustrador RJ Palmer testemunhou pela primeira vez o fotorrealismo afinado das composições produzidas pelo gerador de imagens de IA Dall-E 2, sua sensação foi de desconforto. A ferramenta, lançada pela empresa de pesquisa de IA OpenAI, mostrou uma melhoria acentuada no Dall-E de 2021 e foi rapidamente seguida por rivais como Stable Diffusion e Midjourney. Digite qualquer prompt surreal, de Kermit, o sapo no estilo de Edvard Munch, a Gollum de O senhor dos Anéis banqueteando-se com uma fatia de melancia, e essas ferramentas retornarão uma representação surpreendentemente precisa momentos depois.

A internet se divertiu com as oportunidades de criação de memes, com uma conta no Twitter documentando “gerações estranhas de Dall-E” acumulando mais de um milhão de seguidores. Cosmopolita alardeou a primeira capa de revista gerada por IA do mundo, e os investidores em tecnologia caíram sobre si mesmos para acenar na nova era da “IA generativa”. Os recursos de geração de imagem já se espalharam para o vídeo, com o lançamento do Imagen Video do Google e do Make-A-Video da Meta.

Mas a nova proeza artística da IA ​​não foi recebida com tanto entusiasmo por alguns criativos. “A principal preocupação para mim é o que isso faz com o futuro não apenas da minha indústria, mas das indústrias humanas criativas em geral”, diz Palmer.

A capa da Cosmopolitan mostrando um astronauta caminhando em um planeta roxo e lendo 'Conheça a primeira capa de revista artificialmente inteligente do mundo... e levou apenas 20 segundos para ser feita.'
Em junho, a Cosmopolitan publicou a primeira capa de revista gerada por IA, uma colaboração entre a artista digital Karen X Cheng e a OpenAI.

Ao ingerir grandes conjuntos de dados para analisar padrões e construir modelos preditivos, a IA há muito se mostra superior aos humanos em algumas tarefas. É esse nous de processamento de números que levou uma IA a derrotar o campeão mundial de Go em 2016, calculando rapidamente a estratégia de jogo mais vantajosa e sem medo de executar movimentos que teriam provocado zombarias se tivessem vindo de uma pessoa. Mas até recentemente, produzir trabalhos originais, especialmente trabalhos criativos, era considerado uma atividade distintamente humana.

Melhorias recentes na IA mudaram o dial. Não apenas os geradores de imagens de IA podem agora transpor frases escritas em novas imagens, mas avanços também foram feitos na geração de fala de IA: grandes modelos de linguagem, como o GPT-3, atingiram um nível de fluência que convenceu pelo menos um pesquisador do Google recentemente demitido de senciência da máquina. Conecte a obra de Bach e uma IA pode improvisar música mais ou menos no mesmo estilo – com a ressalva de que muitas vezes seria impossível para uma orquestra humana realmente tocar.

Essa classe de tecnologia é conhecida como IA generativa e funciona por meio de um processo conhecido como difusão. Essencialmente, grandes conjuntos de dados são reunidos para treinar a IA e, por meio de um processo técnico, a IA é capaz de criar novos conteúdos que se assemelham aos dados de treinamento, mas não são idênticos. Depois de ver milhões de fotos de cães marcados com a palavra “cachorro”, é capaz de estabelecer pixels na forma de um filhote inteiramente novo que se assemelha ao conjunto de dados o suficiente para que não tenhamos problemas em rotulá-lo como um cachorro. Não é perfeito – as ferramentas de imagem de IA ainda lutam para renderizar mãos que parecem humanas, as proporções do corpo podem estar erradas e elas têm o hábito de produzir escrita sem sentido.

Embora os usuários da Internet tenham abraçado esse potencial criativo sobrecarregado – armados com o prompt corretamente refinado, até mesmo os novatos podem agora criar telas digitais atraentes – alguns artistas recusaram a capacidade de imitação da nova tecnologia. Entre os prompts inseridos nos geradores de imagem Stable Diffusion e Midjourney, muitos marcam o nome de um artista para garantir um estilo esteticamente mais agradável para a imagem resultante. Algo tão mundano quanto uma tigela de laranjas pode se tornar atraente se renderizado no estilo de, digamos, Picasso. Como a IA foi treinada em bilhões de imagens, algumas das quais são obras protegidas por direitos autorais de artistas vivos, geralmente pode criar uma aproximação bastante fiel.

Uma colagem de imagens de Kermit the Frog como a figura na ponte em The Scream de Munch
‘Kermit o sapo pintado por Munch’, criado por Floris Groesz com software Dall-E. Fotografia: @SirJanosFroglez

Alguns estão indignados com o que consideram roubo de sua marca artística. Greg Rutkowski, um artista conceitual e ilustrador conhecido por suas cenas de fantasia épicas com luz dourada, já foi mencionado em centenas de milhares de prompts usados ​​em Midjourney e Stable Diffusion. “Faz apenas um mês. E em um ano? Provavelmente não conseguirei encontrar meu trabalho por aí porque [the internet] será inundado com arte de IA”, disse Rutkowski Revisão de Tecnologia do MIT. “Isso é preocupante.”

Dall-E 2 é uma caixa preta, com a OpenAI se recusando a liberar o código ou compartilhar os dados nos quais as ferramentas foram treinadas. Mas a Stable Diffusion optou por abrir seu código e compartilhar detalhes do banco de dados de imagens usado para treinar seu modelo.

Spawning, um coletivo de artistas, construiu uma ferramenta chamada Eu fui treinado? para ajudar os artistas a descobrir se suas obras de arte estão entre as 5,8 bilhões de imagens usadas para treinar Difusão Estável e para optar por não aparecer em conjuntos de treinamento futuros. A empresa por trás da Stable Diffusion, Stability AI, disse que está aberta a trabalhar com a ferramenta. Dos 1.800 artistas que já se inscreveram para usar a ferramenta, Matthew Dryhurst, acadêmico e membro do Spawning, diz que é uma divisão de 60/40 a favor do opt-out.

Mas a Concept Art Association (CAA) ressalta que o estrago já foi feito desta vez, porque as ferramentas já foram treinadas no trabalho dos artistas sem o seu consentimento. “É como se alguém que já roubou você dissesse: ‘Você quer me recusar a roubar você?’”, diz Karla Ortiz, ilustradora e membro do conselho da CAA.

Emad Mostaque, da Stability AI, diz que, embora os dados usados ​​para treinar Stable Diffusion não oferecessem uma opção de exclusão, “era um modelo de teste, muito pouco otimizado em um instantâneo de imagens na Internet”. Ele diz que os novos modelos são normalmente treinados em novos conjuntos de dados e é aí que a empresa leva em consideração as solicitações dos artistas.

Um homem de gola e gibão sentado em um computador desktop
Uma ‘pintura renascentista de uma pessoa sentada em um cubículo de escritório, digitando em um teclado, estressada’, criada por Dall-E.

Não são apenas obras de arte: a análise do banco de dados de treinamento para Stable Diffusion revelou que também absorveu fotografias médicas privadas, fotos de membros do público (às vezes ao lado de seus nomes completos) e pornografia.

Ortiz se opõe particularmente à Stability AI comercializando parte de sua operação – DreamStudio, que oferece aos clientes modelos personalizados e maior facilidade de uso. “Essas empresas agora estabeleceram um precedente de que você usa os dados privados e protegidos por direitos autorais de todos sem que ninguém sequer opte por isso”, diz ela. “Então eles dizem: ‘Não podemos fazer nada sobre isso, o gênio está fora da garrafa!’”

O que pode ser feito sobre isso além de contar com a beneficência das empresas por trás dessas ferramentas ainda está em questão.

A CAA cita a preocupante legislação do Reino Unido que pode permitir que as empresas de IA tenham ainda mais liberdade para absorver trabalhos criativos protegidos por direitos autorais para treinar ferramentas que podem ser implantadas comercialmente. Nos EUA, a organização se reuniu com funcionários do governo para falar sobre a lei de direitos autorais e está atualmente conversando com lobistas de Washington para discutir como reprimir isso como uma indústria.

Além da cópia, há um problema ainda maior apontado por Palmer: essas ferramentas colocam em risco toda uma classe de criativos? Em alguns casos, a IA pode ser usada no lugar de imagens de estoque – a biblioteca de imagens Shutterstock recentemente fez um acordo com a OpenAI para integrar o Dall-E em seu produto. Mas Palmer argumenta que obras de arte como ilustrações para artigos, livros ou capas de álbuns podem em breve enfrentar a concorrência da IA, minando uma área próspera da arte comercial.

Os donos de geradores de imagens de IA tendem a argumentar que, ao contrário, essas ferramentas democratizam a arte. “Grande parte do mundo está constipada criativamente”, disse o fundador da Stability AI, Emad Mostaque, em um evento recente para celebrar uma rodada de arrecadação de US$ 101 milhões, “e vamos fazer com que eles possam fazer cocô no arco-íris”. Mas se todos podem aproveitar a IA para criar imagens tecnicamente magistrais, o que isso diz sobre a essência da criatividade?

Anna Ridler, uma artista conhecida por seu trabalho com IA, diz que apesar de Dall-E 2 se sentir “como mágica” na primeira vez que você a usa, até agora ela não sentiu uma centelha de inspiração em seus experimentos com a ferramenta. Ela prefere trabalhar com outro tipo de IA chamado redes adversariais generativas (GANs). As GANs funcionam como uma troca entre duas redes, uma criando novas imagens e a outra decidindo até que ponto a imagem atende a um objetivo específico. Um GAN artístico pode ter o objetivo de criar algo tão diferente quanto possível de seus dados de treinamento sem sair da categoria do que os humanos considerariam arte visual.

Essas questões intensificaram o debate sobre até que ponto podemos atribuir criatividade à IA. De acordo com Marcus du Sautoy, matemático da Universidade de Oxford e autor de O código da criatividade: como a IA está aprendendo a escrever, pintar e pensar, Dall-E e outros geradores de imagens provavelmente chegam mais perto de replicar um tipo de criatividade “combinacional”, porque os algoritmos são ensinados a criar novas imagens no mesmo estilo que milhões de outras nos dados de treinamento. GANs do tipo com que Ridler trabalha estão mais próximas da criatividade “transformacional”, diz ele – criando algo em um estilo inteiramente novo.

Uma imagem desbotada e com foco suave de um corgi em uma praia
Uma imagem gerada por Dall-E de “uma foto vintage de um corgi na praia” – mostrando que o software também pode criar imagens realistas.

Ridler se opõe a essa abordagem estereotipada para definir a criatividade. “Isso reduz a ideia de arte como um papel de parede interessante, em vez de algo que está tentando expressar ideias e buscar a verdade”, diz ela. Como artista conceitual, ela está bem ciente das deficiências da IA. “A IA não pode lidar com conceitos: colapso de momentos no tempo, memória, pensamentos, emoções – tudo isso é uma habilidade humana real, que faz uma obra de arte em vez de algo que parece visualmente bonito.”

As ferramentas de imagem de IA demonstram algumas dessas deficiências. Enquanto “astronauta montando um cavalo” retornará uma renderização precisa, “cavalo montando um astronauta” retornará imagens que parecem muito iguais – indicando que a IA realmente não compreende as relações causais entre diferentes atores no mundo.

Dryhurst e Ridler afirmam que a ideia de “substituição do artista” decorre da subestimação do processo artístico. Dryhurst lamenta o que vê como a mídia estimulando narrativas alarmistas, destacando uma recente New York Times artigo sobre um artista que usou Midjourney para vencer a categoria digital do concurso anual de arte da feira estadual do Colorado. Dryhurst ressalta que uma feira estadual não é exatamente um fórum de prestígio. “Eles estavam distribuindo prêmios por frutas enlatadas”, diz ele. “O que me incomoda é que parece haver esse tipo de sede de assustar os artistas.”

“A arte está morta, cara”, disse o vencedor da feira estadual.

É possível que o hype em torno dessas ferramentas como forças disruptivas ultrapasse a realidade. Mostaque diz que os geradores de imagens de IA fazem parte do que ele chama de “mídia inteligente”, que representa uma oportunidade de “um trilhão de dólares”, citando o orçamento de conteúdo da Disney de mais de US$ 10 bilhões (£ 8,7 bilhões), e o valor de toda a indústria de jogos de mais de US$ 170 bilhões. “Cada parte do conteúdo da BBC à Disney será interativa por esses modelos”, diz ele.

As aplicações emergentes no momento são mais prosaicas, incluindo moodboards para consultoria de design, storyboards para filmes e maquetes para design de interiores, e Mark Beccue, analista da divisão de IA da Omdia, está cético em relação ao valor de US$ 1 trilhão. “Quais são os casos de uso assassino aqui?” ele diz. “Não faz sentido. Que problema você está resolvendo com isso?” Um analista da consultoria Accenture diz que as ferramentas podem um dia ser usadas para criar conteúdo para treinar algoritmos de aprendizado de máquina, como em veículos autônomos, e acelerar a criação de jogos. Se será algo tão lucrativo quanto os geradores de imagens de IA e seus apoiadores propõem, ainda não se sabe.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo