Abstract:
Kümeleme analizi, veri setindeki nesneler arasındaki benzer özellikleri veya farklı özellikleri kullanarak, aynı küme içerisinde homojen, farklı kümeler arasında ise heterojen gruplar oluşturmayı amaçlamaktadır. Başka bir deyişle bir kümeyi oluşturan nesneler birbirine ne kadar benzerse ve farklı kümeler birbirinden ne kadar ayrık ise kümeleme işlemi o ölçüde başarılı olmuştur. Bu tez çalışmasında veri madenciliği yöntemleri kullanılarak öğrenci analizi işlemleri gerçekleştirilmiştir. Bu analiz işleminde mühendislik fakültesi öğrencilerinin demografik bilgileri, ÖSYS puanları ve yerleşme sıraları ile kazandıkları bölümdeki ağırlıklı başarı not ortalamaları sistemin giriş verisi olarak kullanılmıştır. Öğrencilerin gelmiş oldukları bölgelere ve okul türlerine göre de bir kümeleme işlemi gerçekleştirilmiştir. Bunun yanında öğrencilerin belli bir bölümüne anket yapılmıştır. Bu anketler sayesinde de öğrencilerin aile bilgilerinin başarısını nasıl etkilediği incelenmiştir. Kümeleme yöntemleri, bulanık kümeleme ve katı kümeleme olmak üzere iki ana başlık altında karşılaştırmalı olarak ele alınmıştır. Bu bağlamda bulanık kümeleme yöntemlerinden Bulanık C-Ortalamalar, Gustafson-Kessel ve Gath-Geva algoritmaları ile katı kümeleme yöntemlerinden k-ortalamalar ve k-medoids algoritmaları ayrıntılı olarak açıklanmış ve veri seti üzerinde uygulanarak başarıları üzerine bir değerlendirme yapılmıştır. Başarı durumlarının tespitinde küme geçerliliği (cluster validity) yöntemleri ve Box-Plot analizi kullanılmıştır.