YTÜ DSpace Kurumsal Arşivi

Veri madenciliğindeki sınıf dengesizliği sorununun giderilmesi

Basit öğe kaydını göster

dc.contributor.advisor Yrd. Doç. Dr. Songül Albayrak
dc.contributor.author Sarmanova, Akkenzhe
dc.date.accessioned 2018-07-24T11:29:48Z
dc.date.available 2018-07-24T11:29:48Z
dc.date.issued 2013
dc.identifier.uri http://localhost:6060/xmlui/handle/1/7360
dc.description Tez (Yüksek Lisans) - Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013
dc.description.abstract İki-sınıflı veri setlerindeki en önemli sorunlarından biri olan sınıf dengesizliği sorununu çözmek son yıllarda daha fazla önem kazanmıştır. Veri kümesinde sınıf dağılımı dengesiz olduğu zaman, geleneksel makine öğrenme yöntemleri genellikle azınlık sınıfının görülmemiş örnekleri için düşük sınıflama başarısı vermektedir. Çünkü çoğunluk sınıfına doğru kuvvetle yönlenme eğilimindedir. Literatürde sınıf dengesizliği sorununu gidermek için çeşitli algoritmalar mevcuttur. Bu tez, sınıf dengesizliği probleminin önemini ve problemin çözümünün veri madenciliğindeki geniş uygulama alanlarını değerlendirme ölçüleri ile tanıtır. Ayrıca dengesizlik sorununu değerlendirmek ve çözmek için mevcut yöntemleri, C4.5, DVM ve KNN gibi farklı sınıflandırıcıları temel öğrenici olarak kullanarak karşılaştırır. En iyi temel öğreniciyi ve çoğunluk ve azınlık sınıfları dağılımına göre en iyi performansa sahip algoritmayi bulmak amacıyla çeşitli deneyler yapılmıştır. Buna ek olarak, tez kapsamında geliştirilen yeni bir algoritma olarak RusAda önerilmiştir ve bu algoritma tezde incelenen diğer algoritmalarla karşılaştırılmıştır.
dc.subject sınıf dengesizliği
dc.subject İkili sınıflandırma
dc.subject Yeniden örnekleme
dc.subject boosting
dc.subject Topluluk öğrenme
dc.title Veri madenciliğindeki sınıf dengesizliği sorununun giderilmesi
dc.type Tez


Bu öğenin dosyaları

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster