Abstract:
Üretici Çekişmeli Ağlar (ÜÇA) birbiriyle rekabet eden iki ayrı derin yapay nöron ağından
oluşan, yeni ve gerçekçi yapay örnekler üretmeyi amaçlayan üretici modellerdir. Bu iki
ağdan birisi olan üretici ağ rassal gürültü vektörünü girdi olarak alır ve gürültüyü yapay bir
görüntü örneğine dönüştürerek çıktı olarak verir. Üretici Çekişmeli Ağ’ı oluşturan diğer ağ
ise ayırt edici ağdır. Ayırt edici ağ, üretici ağdan elde edilen görüntü ile gerçek bir görüntü
örneğini girdi olarak alır ve her birini "üretilmiş görüntü" veya "gerçek görüntü" olarak
sınıflandırır. Ağların optimizasyonu için eğitim aşamasında her iki ağın kayıp fonksiyonları
farklı biçimde hesaplanır. Üretici ağda üretilmiş örnek için kayıp hesaplanarak
parametrelerin optimizasyonu yapılır. Ayırt edici ağda ise hem gerçek hem de üretilmiş
örnekler için toplam kayıp hesaplanarak ağ parametrelerine geri besleme uygulanır.
Birbiriyle rekabet eden iki ağdan birisinin parametre güncellemesi diğer ağın
parametrelerini değişime zorlamıyorsa parametre eğitimi sonlandırılır. Üretici ağın güncel
parametre değerleriyle yapay örnekler üretilir.
Eldeki veri kümesinin olasılıksal dağılımını öğrenerek, bu dağılıma uygun örnekler
üretmeyi amaçlayan ÜÇA ile yapay görüntü ve video üretme konusunda çeşitli çalışmalar
yapılmıştır. Bu çalışma ile derin ağların üretici modellerinden birisi olan Üretici Çekişmeli
Ağlar'ın farklı mimari tarzlarda bina ve bina unsurlarını üretmedeki başarımları üzerine bir
araştırma yapılmıştır. ÜÇA yardımıyla Romanesk ve İslam mimarisi gibi farklı mimari
tarzlarda gerçekçi yapılar üretilmiştir. Eğitimde kullanılan görüntü veri kümesi yaklaşık
39000 cami, kilise, katedral, medrese, kütüphane ve kalelere ait görüntülerden
oluşturulmuştur. Veri kümesinde binaların dış ve iç cephe görüntülerinin yanında kubbe,
kule, minare, tonoz, kapı girişi ve vitray gibi mimari unsurlar bulunmaktadır. Bu çalışmada
Üretici Çekişmeli Ağlar ile gerçekçi ve yüksek kalitede Romanesk ve İslam mimarisi
örnekleri üretmek için BigGAN ağ mimarisi üzerinde gerekli düzenlemeler yapılmıştır.
Üretilen görüntüler ile modelin başarısı ve performans değerlendirme metrikleriyle örnek
kalitesi değerlendirilmiştir. Yapılan anket çalışmasıyla görüntülerin gerçekçiliği ve
örneklerdeki problemler araştırılmıştır. 48 katılımcının çoğunluğu örneklerin genellikle
gerçekçi ya da gerçeğe yakın olduğu görüşündedir. Katılımcılara göre gerçekçi olmayan
örneklerde temel problemler mevcuttur: simetri özelliğinin olmaması, detay özelliklerin
eksikliği, görüntülerde çizgisel kayma ve kırılmalar ve keskinliğin yetersiz olması. Ayrıca
bu anketin bir benzeri mimari alanında uzman kişilere uygulanmıştır. Ankete katılan 24
uzmana göre Romanesk mimarisi örnekleri İslam mimarisi örneklerine göre daha
gerçekçidir.
Görüntülerde öne çıkan yapısal özellikler ve modelin üretmekte zorlandığı mimari
özellikler incelenmiştir. Ayrıca üretilen örneklerin kalitesi mimaride uzman bir kişi
tarafından değerlendirilmiştir. İslam mimarisi örneklerinin çok geniş bir coğrafyada yer
alması nedeniyle mimari tarz farklılaşmaktadır. Bu durum da Romanesk mimarisi
örnekleriyle karşılaştırıldığında İslam mimarisi örneklerinin daha başarısız olduğunu
göstermektedir.
Modelin ezberleme yapma olasılığını değerlendirmek için İçerik Tabanlı Görüntü Erişimi
yöntemi yardımıyla eğitilmiş ayırt edici ağ kullanılarak yeni bir yöntem geliştirilmiştir.
Üretilen görüntülere en benzer gerçek görüntüler tespit edilerek bu görüntülere çeşitli
transformasyon işlemleri uygulanmıştır. Üretilen örneklerle karşılaştırıldığında,
transformasyon uygulanmış görüntülerin orijinal görüntülere daha benzer olması modelin
ezberleme yapmış olma olasılığının düşük olduğunu göstermiştir.