Geçen yüzyılın çılgın 20’li yılları her türlü sanatsal ifadeyi dönüştürdü. O dönemin yeni teknolojileri olan fotoğraf ve sinema yaratıcılığı tetikledi. 21. yüzyılın bu çılgın 20’leri yeni bir dönüştürücü teknolojik unsur getiriyor: tüm izleyicilerin kullanımına açık, fotoğraf, resim, video oluşturan, kullanımı kolay yapay zekalar. herhangi bir şey, yazılı bir metinden. Bir kamera tarafından çekilen görüntüler kadar gerçekçi veya tarihin büyük ressamlarını taklit eden sanatsal bir üslupla olabilirler.
Edmond Belamy’nin GAN algoritması tarafından oluşturulan portresi. yaratıcısının imzası sağ alttadır. Bu, onu oluşturmaya yarayan cebir formülüdür: Min (G) max (D) Ex + Ez [log (1-D (G (z)))]
Yazar sağladı
Yazar sağladı
GAN, Obama’yı yaratan algoritma
2018 yılında Obvious kolektifi tarafından sunulan ve GAN adlı bir algoritma tarafından imzalanan Edmond de Belamy portresi açık artırmaya çıktı. 2014 yılında geliştirilen bu yapay sanatçı, ünlü deepfakes
Video, Obama’nın gerçeğinden ayırt edilemeyen şu sözleriyle başlıyor: “Düşmanlarımızın her an herkese her şeyi söyletebildiği bir çağa giriyoruz”.
Mevcut AI’lar
Yeni modeller, önceki görüntülerin öğrenilmesi değil, aynı zamanda metinle ilişkiler kurulması.
Son zamanlarda DALL·E 2, Imagen, Craiyon, Midjourney, Nuwa-Infinity, Stable-Diffusion gibi yeni isimler ortaya çıkıyor… Tüm bu AI modeller, bir açıklamadan, bir metinden bir görüntü oluşturma ilkesine dayanır. Farklılıkları nihai stilde, düzenleme olasılıklarında veya kullanım kısıtlamalarında olabilir. Ama prensip aynı.
Bir yapay zeka metinden nasıl bir görüntü oluşturabilir?
Bir metni görüntüye dönüştürmenin doğal sürecini düşünelim. Örneğin: “Bir sonbahar gününde gün batımında bir ağaç boyayın.” Her insan farklı bir ağaç boyayacaktır. Sıralı olarak okuduğumuz öğelerin gerçek bir görüntüsünü oluşturmuyoruz, bunun yerine o soyutlama etrafında yaptığımız yinelemelere bağlı olarak daha fazla ayrıntı eklediğimiz çok daha genel bir soyutlama yakalarız.
Bir metni okurken en alakalı kelimeleri buluruz. Örneğin, fiillere makaleler kadar önem vermiyoruz, bir anlam ve kesinlikle bir duygu yakalamaktan kaçınamıyoruz: metin komik, hüzünlü, nostaljik görünebilir… Genel olarak tetiklenen ve biraz çabayla bir çizimde veya şarkıda temsil ettiğimiz bir dizi çağrışım vardır. A DALL- tip üretici görüntü modeli ·E bu sezgiden çok uzak değildir. Yapay zekanın bilişsel sürecimizi aslına uygun bir şekilde simüle ediyormuş gibi davranmamasına rağmen, yapay dünya ile biyolojik dünya arasında bazı benzerlikler ortaya çıkmaktadır. 2005 yılında dergisinde yayınlanan bir araştırma makalesi Nature , her belirli kavram için belirli nöronlarımız olduğunu toplamıştır. Örneğin, Jennifer Aniston’ın bir fotoğrafını, bir karikatürünü veya adının yazılı olduğunu gördüğümüzde aynı nöron her zaman aktif hale gelir. Bu etki, Jennifer Aniston’ın nöronundan adını almıştır. Aynı şekilde, yapay zeka DALL·E’nin arkasındaki şirket olan OpenAI’nin geliştiricileri, yakın tarihli bir yayında yapay nöronların varlığından bahsediyor, tekrar ediyoruz, Gönderi ister fotoğraf ister çizim olsun, benzer kavramlara tepki veren yapay nöronlar. Bu durumda, ağ, bir dizi sayısal parametre ile, ünlü bir karakterin temsil ettiği tüm değişkenliği, girişinden bağımsız olarak sıkıştırabilir. Fakat bir iş fikri sadece başlangıçtır, onu yakalamak daha değerlidir. DALL·E, Kararlı Difüzyon ile aynı görünmüyor Sanatçılar sadece teknikten değil, deneyimden de beslenirler. AI deneyimi, sistemin eğitildiği ve daha gerçekçi (DALL·E 2) veya daha sanatsal (Midjourney) stile doğru gelişecek olan veritabanıdır. Stabil Difüzyon bir açık kaynak DALL·E 2, metnin iyi anlaşılmasını ve inpainting Fotoğrafın resimsel gerçekçiliğe ve post-empresyonizm gibi yeni sanatsal tarzlara doğru ittiği gibi, yeni AI jeneratörleri, yaratıcılığı yeni yönlere itecek. Ama DALL·E’ye dayalı, doğal dili işlemek için tasarlanmış bir mimari türü olan GPT-3’ün ne düşündüğünü görelim. DALL·E’nin resimlerinin insanlar tarafından yapılmış sanat eserlerine benzediğini düşünüyor musunuz? AI GPT-3: Sanmıyorum. DALL·E’nin metinsel açıklamalardan ne tür görüntüler oluşturduğunu görmek ilginç, ancak bunların insan sanatı gibi olduğunu düşünmüyorum. Neden olmasın? arka planı tanımla sanatçının Jennifer Aniston’ın ünlü nöronu
Johannes Vermeer’e göre DALL·E tarafından bir sinir ağının temsili.
Kod çözme
DALL·E’ye resimle ilgili her türlü teklifimiz İnci Küpeli Kız , Johannes Vermeer tarafından, hafızasındaki bu temel yaratılıştan, ürettiği gürültüden başlayacaktır. Bir tür hafıza.
Bu sanat mı? GPT-3’e sorduk
DALL·E. Johannes Vermeer’in İnci Küpeli Kız