Özet:
Veritabanı teknolojisindeki hızlı gelişmenin doğurduğu büyük ölçeklerdeki verilerin analiz edilerek yorumlanması ihtiyacına cevap veren veri madenciliği, verinin veritabanı ortamına aktarılmasından itibaren başlayarak analiz aşamasında elde edilen enformasyonun bilgiye dönüştürülmesi aşamasına kadar geçen uzun bir süreci kapsamaktadır. Veri madenciliği veritabanı teknolojisi, karar destek sistemleri, görselleştirme, makine öğrenmesi ve istatistik gibi bir çok disiplinin bir arada kullanılmasına olanak sağlar. İstatistik disiplini veri madenciliği disiplinin ayrılmaz bir parçasıdır. Bu çalışmada kullanılan SAS Enterprise Miner 8.0 ürünü incelenirse SEMMA metodolojisinin her bir adımında bir istatistik tekniğe rastlamak mümkündür. Bu çalışmada verilerin kaynağı olan veritabanlarına, veri saklamada ve raporlamada kullanılan OLAP teknolojisine ağırlıklı olarak yer verilmiş olup veri madenciliğinin diğer disiplinlerle olan ilişkisi incelenerek uygulamada kullanılan kümeleme ve temel bileşenler analizi teknikleri teorik olarak incelenmiştir. Veri madenciliği metodolojisine yer verildikten sonra SAS Enterprise Miner 8.0 ürününün kullandığı SEMMA metodolojisi ele alınmıştır. Uygulamada İstanbul ilindeki liseler 2001 ÖSS sınavındaki basanlarına göre kümelenmiş ve karar ağacı aracılığı ile oluşturulan kümeleme kuralları sayesinde, farklı dönemlerde liselerin 2001 yılındaki durumlarını koruyup korumadıkları incelenebilecektir. Anahtar Kelimeler: Kümeleme analizi, temel bileşenler analizi, veri madenciliği,