.

Microsoft
Durante um evento de imprensa do Surface hoje, a Microsoft anunciou integrações de tecnologia de geração de imagem com inteligência artificial em seu mecanismo de pesquisa Bing, navegador Edge e um novo aplicativo do Office chamado Microsoft Designer. A tecnologia será alimentada pelo DALL-E 2 da OpenAI, que fez ondas em abril por sua capacidade de gerar novas imagens com base em prompts escritos. A tecnologia também tem sido alvo de ira entre alguns artistas devido a preocupações éticas.
As ofertas da Microsoft visam ajudar os criadores a superar a síndrome da página em branco, sugerindo cursos de ação criativos. Em um exemplo do Microsoft Designer fornecido pela Microsoft, alguém digita uma descrição do que deseja ver, como “Bolo Ombre decorado com flores e folhagens de outono”, e pode rolar pelos exemplos de imagens geradas por IA que podem escolher adicionar ao seu design. “O designer convida você a começar com uma ideia e deixar a IA fazer o trabalho pesado”, escreveu a Microsoft em um comunicado à imprensa.

Microsoft
O Microsoft Designer originou-se como parte do PowerPoint, onde atualmente sugere ideias de design como um subconjunto desse programa. Mas a Microsoft planeja dividir o Designer em seu próprio aplicativo Microsoft 365, que estará disponível como um aplicativo gratuito e como um aplicativo premium disponível para assinantes do Microsoft 365 Personal e Family. Por enquanto, a Microsoft está limitando o Designer a um aplicativo Web público gratuito, que será usado para coletar comentários de testes públicos.

Uma visualização em GIF animada do Image Creator do Microsoft Bing, fornecida pela Microsoft.
Microsoft
A Microsoft também anunciou que integrará o Designer ao Microsoft Edge para fornecer “sugestões de design baseadas em IA para aprimorar visualmente as postagens de mídia social e outros conteúdos visuais sem precisar sair da janela do navegador”. E a síntese de imagens de IA também chegará ao Bing com o Image Creator, onde as pessoas poderão digitar um prompt e obter um novo resultado, alimentado pelo DALL-E 2 da OpenAI.
O elefante ético na sala
Desde que o OpenAI estreou DALL-E 2 em abril, a geração de imagens de IA tem sido controversa com alguns artistas por causa de como funciona. Modelos de síntese de imagens como o DALL-E 2 usam redes neurais de aprendizado profundo para analisar milhões ou bilhões de imagens encontradas publicamente na web sem buscar o consentimento de artistas ou detentores de direitos autorais. Esses modelos, incluindo o Stable Diffusion, concorrente do DALL-E, vinculam estatisticamente o conteúdo dessas imagens com legendas descritivas encontradas na web para associá-las a palavras. O resultado é que esses modelos podem gerar imagens com base em descrições de texto e podem imitar os estilos distintos de artistas humanos específicos.
Além disso, os criadores desses modelos de síntese de imagens alertam que eles refletem preconceitos sociais, como racismo e sexismo em seus dados de treinamento, e também são capazes de produzir imagens perturbadoras ou ilegais se as salvaguardas não forem implementadas. A Microsoft diz que está abordando esses problemas: “Para ajudar a impedir que o DALL∙E 2 forneça resultados inadequados no aplicativo Designer e no Image Creator, estamos trabalhando nós mesmos e com nosso parceiro OpenAI, que desenvolveu o DALL-E 2, para tomar medidas e continuar a evoluir nossa abordagem conforme necessário.”
As mitigações incluem a remoção do “conteúdo sexual e violento mais explícito” do conjunto de dados de treinamento e a adição de filtros para “limitar a geração de imagens que violam a política de conteúdo”. Em relação ao viés, a Microsoft menciona a aplicação de “tecnologia adicional que ajuda a fornecer imagens mais diversas aos nossos resultados”, o que provavelmente é o mesmo que as injeções aleatórias diversas que a OpenAI introduziu no DALL-E em julho, que foi recebida com alguma controvérsia. Talvez por causa desses problemas, a Microsoft esteja adotando uma abordagem de lançamento lento em vez de abrir completamente os portões.
“Estamos adotando uma abordagem ponderada para lançar [Image Creator]”, escreveu a Microsoft em um comunicado à imprensa.
Com esses movimentos da Microsoft, as ferramentas de síntese de imagens estão rapidamente se tornando mais populares. Canva adicionado capacidades de geração de texto para imagem em meados de setembro.
.