Colorado Eyalet Fuarı’nda geçen ay bir sanat ödülü, jüri tarafından bilinmeyen bir yapay zeka (AI) sistemi tarafından oluşturulan bir çalışmaya verildi.
Sosyal medyada ayrıca, “bir shiba inu’nun bir mutfak tezgahında bir somun ekmeğin kenarına karıştırılmış yüzü, dijital sanat” gibi metin açıklamalarından AI tarafından oluşturulan garip görüntülerde bir patlama yaşandı.
Ya da belki “Johannes Vermeer’in ‘İnci Küpeli Kız’ tarzında bir deniz samuru”:
Burada neler olduğunu merak ediyor olabilirsiniz. İnsanlar ve yapay zeka arasındaki yaratıcı işbirliklerini araştıran biri olarak, manşetlerin ve memlerin arkasında, derin sosyal, sanatsal, ekonomik ve teknolojik sonuçları olan temel bir devrimin yolda olduğunu söyleyebilirim.
buraya nasıl geldik
Bu devrimin Haziran 2020’de, OpenAI adlı bir şirketin, önceki çabalardan çok daha karmaşık yollarla dili işleyebilen ve üretebilen bir sistem olan GPT-3’ün oluşturulmasıyla AI’da büyük bir atılım gerçekleştirmesiyle başladığını söyleyebilirsiniz. Onunla herhangi bir konu hakkında sohbet edebilir, bir araştırma makalesi veya hikaye yazmasını, metni özetlemesini, fıkra yazmasını ve akla gelebilecek hemen hemen her dil görevini yapmasını isteyebilirsiniz.
2021’de GPT-3’ün geliştiricilerinden bazıları ellerini görüntülere çevirdi. Milyarlarca görüntü ve metin açıklaması çifti üzerinde bir model eğittiler, ardından onu yeni açıklamalardan yeni görüntüler oluşturmak için kullandılar. Bu sisteme DALL-E adını verdiler ve Temmuz 2022’de çok geliştirilmiş yeni bir sürüm olan DALL-E 2’yi piyasaya sürdüler .
GPT-3 gibi, DALL-E 2 de büyük bir atılımdı. Stil ve diğer soyut kavramlar hakkında bilgiler de dahil olmak üzere serbest biçimli metin girişlerinden oldukça ayrıntılı görüntüler üretebilir.
Örneğin, burada Salvador Dalí, Henri Matisse ve Brett Whiteley’in tarzlarını birleştiren “Mind in Bloom” ifadesini örneklendirmesini istedim.
Yarışmacılar sahneye giriyor
DALL-E 2’nin piyasaya sürülmesinden bu yana birkaç rakip ortaya çıktı. Biri, popüler bir meme içeriği kaynağı olan, kullanımı ücretsiz ancak daha düşük kaliteli DALL-E Mini (bağımsız olarak geliştirildi ve şimdi Craiyon olarak yeniden adlandırıldı).
Aynı zamanda, Midjourney adlı daha küçük bir şirket, DALL-E 2’nin yetenekleriyle daha yakından eşleşen bir model yayınladı. Hala DALL-E 2’den biraz daha az yetenekli olmasına rağmen, Midjourney kendisini ilginç sanatsal keşiflere bıraktı. Midjourney ile birlikte Jason Allen, Colorado Eyaleti Sanat Fuarı yarışmasını kazanan sanat eserini yarattı.
Google’ın da DALL-E ve diğerlerinden çok daha iyi sonuçlar ürettiği varsayılan Imagen adlı bir metinden görüntüye modeli vardır. Ancak Imagen henüz daha geniş kullanım için piyasaya sürülmediği için Google’ın iddialarını değerlendirmek zor.
Temmuz 2022’de OpenAI, DALL-E’ye olan ilgiden yararlanmaya başladı ve 1 milyon kullanıcıya kullanım için ödeme temelinde erişim sağlanacağını duyurdu .
Ancak, Ağustos 2022’de yeni bir yarışmacı geldi: Kararlı Yayılma .
Stable Diffusion, yetenekleri bakımından DALL-E 2’ye rakip olmakla kalmaz, daha da önemlisi açık kaynaktır. Herkes kodu istediği gibi kullanabilir, uyarlayabilir ve değiştirebilir.
Stable Diffusion’ın piyasaya sürülmesinden bu yana geçen haftalarda, insanlar kodu yapabileceklerinin sınırlarını zorlamaya başladı bile.
Bir örnek vermek gerekirse: insanlar bir video bir dizi görüntü olduğundan, metinden video oluşturmak için Stable Diffusion’ın kodunu değiştirebileceklerini çabucak anladılar.
Stable Diffusion’ın koduyla oluşturulmuş bir başka büyüleyici araç , basit bir çizim çizmenize, bir metin istemi sağlamanıza ve ondan bir görüntü oluşturmanıza olanak tanıyan Diffuse the Rest’tir . Aşağıdaki videoda çok kaba bir eskizden bir çiçeğin detaylı fotoğrafını oluşturdum.
Aşağıdaki daha karmaşık bir örnekte, vücudunuzla çizim yapmanıza ve ardından bunu bir tabloya veya fotoğrafa dönüştürmek için Kararlı Yayılma’yı kullanmanıza izin veren bir yazılım oluşturmaya başlıyorum.
Yaratıcılığın sonu mu?
Birkaç satırlık metin ve bir düğme tıklamasıyla her türlü görsel içeriği, resmi veya videoyu oluşturabilmeniz ne anlama geliyor? GPT-3 ile bir film senaryosu ve DALL-E 2 ile bir film animasyonu oluşturabileceğiniz zaman ne olacak?
Ve ileriye baktığımızda, sosyal medya algoritmaları yalnızca feed’iniz için içerik düzenlemekle kalmayıp aynı zamanda onu oluşturduğunda ne anlama gelecek? Bu trend birkaç yıl içinde meta evrenle buluştuğunda ve sanal gerçeklik dünyaları gerçek zamanlı olarak sadece sizin için oluşturulduğunda ne olacak?
Bunların hepsi dikkate alınması gereken önemli sorulardır.
Bazıları , kısa vadede bunun insan yaratıcılığının ve sanatının derinden tehdit altında olduğu anlamına geldiğini düşünüyor.
Belki de herkesin herhangi bir görüntü üretebildiği bir dünyada, bugün bildiğimiz grafik tasarımcılar gereksiz olacaktır. Ancak tarih, insan yaratıcılığının bir yolunu bulduğunu gösteriyor. Elektronik sentezleyici müziği öldürmedi ve fotoğrafçılık da resmi öldürmedi. Bunun yerine, yeni sanat biçimlerini katalize ettiler.
AI nesli ile benzer bir şeyin olacağına inanıyorum. İnsanlar, yaratıcı süreçlerinin bir parçası olarak Kararlı Yayılım gibi modelleri dahil etmeyi deniyorlar.
Veya moda tasarımı prototipleri oluşturmak için DALL-E 2’yi kullanmak:
Hatta bazılarının “promptoloji” ya da ” hızlı mühendislik ” dediği alanda yeni bir sanatçı türü ortaya çıkıyor . Sanat, pikselleri elle işlemek değil, bilgisayarı görüntüyü oluşturmaya yönlendiren sözcükleri hazırlamaktır: bir tür AI fısıltısı.
AI ile işbirliği
Yapay zeka teknolojilerinin etkileri çok boyutlu olacaktır: onları tek bir eksende iyiye veya kötüye indirgeyemeyiz.
Yeni sanat biçimleri ve yaratıcı ifade için yeni yollar ortaya çıkacak. Ancak, risklerin de olduğuna inanıyorum.
Kullanıcılardan ekran başında zaman ayırmaya çalışan bir dikkat ekonomisinde yaşıyoruz; otomasyonun şirket kârını yönlendirdiği ancak ücretlerin daha yüksek olmadığı ve sanatın içerik olarak metalaştırıldığı bir ekonomide; gerçek ile sahteyi ayırt etmenin giderek zorlaştığı bir sosyal bağlamda; eğittiğimiz AI modellerindeki önyargıları çok kolay kodlayan sosyoteknik yapılarda. Bu koşullarda, AI kolayca zarar verebilir.
Bu yeni yapay zeka teknolojilerini insanlara fayda sağlayacak bir yöne nasıl yönlendirebiliriz? Bunu yapmanın bir yolunun , insanların yerini almak yerine onlarla işbirliği yapan AI tasarlamak olduğuna inanıyorum.