Özet:
Dünya; aşırı nüfus artışının yanı sıra terör, savaş ve salgın gibi sınavlardan
geçerken, kamuya açık alanların güvenliğinin sağlanması giderek zorlaşan bir
konu haline gelmektedir. Video kayıtlarından elde edilen görüntüler kullanılarak
kamuya açık alanların denetlenmesi, düzenlenmesi gibi pratik konularda kalabalık
yoğunluk analizinin en uygun şekilde gerçekleştirilmesi amaçlanmaktadır.
Kalabalık analizi, akademik ve pratik hayatta yaygın etkiye sahip, önemli ve
güncel bir araştırma konusudur.
Bu çalışma dâhilinde yapay zekâ alt konularından olan derin öğrenme
yaklaşımları kullanılarak özgün ve etkin bir yöntem önerilmektedir. Çalışmanın
ilk sonuçları CNN (Evrişimli Sinir Ağları) temelli paralel mimari, Gauss-YOLOv3
(You Only Look Once) ve iyi bilinen KNN (K-En Yakın Komşuluk) gibi yöntemlerin
kombinasyonları ile alındı. Kalabalık analizi için literatürde yer alan UCF-QNRF,
UCF_CC_50, UCSD, ShanghaiTech Part A, WorldExpo'10 ve PETS2009 veri
kümeleri hakkında detaylı bilgi verildi. Çalışmanın başarısının genelleştirilebilir
olduğunu göstermek için bu veri kümeleri ile testler yapıldı.
Çalışmanın kalabalık davranış değişiminin kestirilmesi aşaması için PET2009 veri
kümesindeki altı farklı video dizisi kullanıldı. Doğruluk başarım %83,2 ile %96,4
aralığında elde edildi. Bu sonuçların literatürdeki benzerleriyle karşılaştırılabilir
düzeyde olduğu gösterildi.
Çalışmanın nihayetinde, dikkat temelli evrişim ve kapsül ağı modülüne sahip ve
anlaşmalı yönlendirme algoritması kullanan iki sütunlu bir derin öğrenme
mimarisi önerildi. Önerilen yöntemin başarımını kapsamlı bir şekilde göstermek
için MAE (Ortalama Mutlak Hata) ve MSE (Ortalama Karesel Hata) değerlendirme
metrikleri güncel çalışmalarla karşılaştırıldı ve kendilerine en yakın başarıma göre
gerçekleştirilen iyileştirilme oranları hesaplandı. İyileştirme ile önerilen yöntem
literatürdeki son teknoloji yaklaşımlarla karşılaştırıldığında bu problem için etkili
ve genelleştirilebilir olduğunu göstermektedir. Elde edilen sonuçlar şöyledir: UCFQNRF’de %2,18 MSE; UCF_CC_50’de %2,33 MAE ve %1,68 MSE; UCSD’de %8,46
MAE ve %7,03 MSE; ShanghaiTech Part A’de %4,69 MAE ve %3,94 MSE;
WorldExpo'10’de %6,94 MAE.
Önerilen kapsül ağı temelli derin öğrenme mimarisi; davranış analizi için
gelecekteki çalışmalarda optik akış gibi hareket bilgileri kullanılmaksızın, konum
ve yönelim bilgilerinin kalabalık analizlerinde kullanılabileceğini göstermektedir.