Abstract:
Bilgisayar alanındaki hızlı ilerlemeler neticesinde veri tabanlarında çok fazla öznitelik
içeren büyük miktarlarda bilgi depolanmaktadır. Ancak mevcut özniteliklerin hepsi
verinin yorumlanabilmesine katkı sa˘glamayabilir. Bu ilgisiz öznitelikler büyük arama
uzayı oluşturdu˘gundan sınıflama/kümeleme ba¸sarısını olumsuz etkilemektedir. Bu
nedenle benzer veya daha iyi performans elde edebilmek için veriyi dogru temsil eden
öznitelik alt gruplarının belirlenmesi önem kazanmaktadır.
Yapay Arı Kolonisi (YAK) algoritması dogadan esinlemeli bir sürü zekası optimizasyon
algoritmasıdır. Algoritma, bal arılarının doğadaki besin arama davranıslarını
modellemektedir. Sürekli uzay problemleri için geliştirilmiş olan algoritma, hızlı
ve efektif çözümler sunmaktadır. Ancak ayrık uzay problemlerine uygulamak için
modifiye edilmesi gerekmektedir.
Tez kapsamında; sınıflandırma ve kümeleme alanlarında büyük boyutlu veriler söz
konusu oldugunda genel olarak karşılaşılan islem maliyeti, hesaplama zamanı ve
dü¸sük sınıflandırma/kümeleme ba¸sarısı problemlerinin çözümü için YAK tabanlı bir
yaklaşım geliştirmek amaçlanmıştır.
Öznitelik seçimi, bir optimizasyon algoritması ile çözümlenmek istendiğinde, ikili
arama uzayına ihtiyaç duydugu için tez kapsamında, YAK algoritmasının ikili uzaya
taşımak amaçlanmıştır. Bu kapsamda ilk olarak, literatürde mevcut ikili YAK
algoritmaları, öznitelik seçimi problemine uygulanması ve 15 algoritma karşılaştırılarak
güçlü ve zayıf yönleri belirlenmistir. Öznitelik seçimi için efektif oldu˘gu görülen
Biti¸slem Operatörleri Tabanlı ˙Ikili Yapay Arı Kolonisi Algoritması (BitABC), altı farklı
sınıflandırıcı ile farklı veri kümelerine uygulanarak, sınıflandırıcı performansları
karşılaştırılmıştır. BitABC algoritmasının efektif ancak lokal arama kapasitesi yetersiz
görüldü˘günden ilk olarak sürünün en iyi bireyi etrafında yapılmak üzere bir
lokal arama fonksiyonu eklenmiştir. Sonuçlar lokal arama fonksiyonunun ba¸sarıyı
artırdı˘gını göstermektedir. Sonraki adımda lokal aramanın kapsamı genişletilerek,
algoritmanın sezgiseligini etkilemeyecek ¸sekilde işçi ve gözcü arı aşamalarına da
eklenmistir. Geliştirilen yöntem çeşitli büyüklüklerde 13 veri kümesinde test edilmi¸s
ve sonuçlar evrimsel algoritmalar ile karşılatırılmıştır.
Gen ekspresyon seviyelerini ölçmek için kullanılan bir teknoloji olan mikrodiziler,
binlerce boyuttan oluşan veri kümeleridir ve her bir boyut bir geni temsil etmektedir.
Hastalık ile dogrudan iliskili genlerin tespiti için boyut indirgeme yapılması
gerekmektedir. Gen seçimi işlemini YAK algoritması ile efektif bir ¸sekilde çözebilmek
için öğrenme stratejisini kendinden uyarlamalı bir yöntem ile belirleyen Olasılıksal
˙Ikili Yapay Arı Kolonisi (PrBABC) algoritması geliştirilmiş ve dokuz veri kümesinde
performansı test edilmistir. Evrimsel algoritmalar ile sonuçlar kar¸sıla¸stırıldı˘gında
önerilen yöntemin gen seçiminde basarılı oldugu görülmüştür.