Özet:
Bilgisayar ve teknolojinin hayatımızın her anında bizimle birlikte olması, ihtiyaç duyulan her türlü bilginin bilgisayar ortamında aranmasına ve saklanmasına sebep olmaktadır. Aranan bilginin bulunabileceği en derin kaynak ise Internet' tir. İçeriği katlandıkça artan bu bilgi haznesindeki verilerin kullanılabilir kısmı son kullanıcı için anlamlıyken, bu kullanılabilir verilerin arkasındaki saklanmış, anlamsız veriler ise işlenmeye hazır olarak beklemektedir. Veri madenciliği de bu ihtiyacı karşılamak üzere ortaya atılan bir disiplindir. Veri madenciliği birliktelik kuralları, sınıflandırma, kümeleme gibi yöntemlerle anlamsız verilerden anlamlı, faydalı bilgileri çıkararak, bu faydalı bilgilerin daha sonra alınacak kararlarda, yapılacak iyileştirme çalışmalarında kullanılmasına rehberlik etmektedir.Internet' in her yerden erişilebilmesi ve istenilen her türlü bilgiyi insanlara sağlayabilmesi, gözlerin web sitelerine çevrilmesine neden olmuştur. Web sitesi yöneticileri rekabet ortamında, site içeriği ve teknik altyapı açısından da web sitelerinin güçlü olması için çalışmalar yapmaktadır. Bu noktada, web sitelerindeki anlamsız verilerden faydalı bilgiyi üretmek için web madenciliği kavramı ortaya çıkmıştır. Web madenciliği, web sitesi verilerine veri madenciliği yöntemlerinin uygulanması işlemidir. Web madenciliğinin üç çeşidi olan ?web kullanım madenciliği?, ?web içerik madenciliği? ve ?web yapı madenciliği? bölümlerinden en çok üzerinde çalışma yapılan ve bu tez çalışmasının da konusu olan web kullanım madenciliğidir. Web kullanım madenciliği ile siteyi ziyaret eden kullanıcıların profillerinin değişimleri takip edilebilir. Ayrıca sitede beğenilen ya da beğenilmeyen köşeler ortaya çıkarılarak site tasarımı buna göre güncellenerek daha çok kullanıcının web sitesini ziyaret etmesi sağlanabilir.Bu tez çalışmasındaki amaç, çok ziyaret edilen, güncel bir portal sitesinden alınan kullanıcı log kayıtları üzerinde web kullanım madenciliği yöntemini uygulayarak, saklı bilgileri ortaya çıkarmaktır. Bunu gerçekleştirmek için, veri madenciliği yöntemlerinden olan birliktelik analizinin en sık kullanılan algoritması Apriori algoritması ile bazı bilim adamları tarafından ortaya atılan TFPR algoritması seçilmiştir. Apriori algoritması ile sonuçlara ve kurallara ulaşılmış, TFPR algoritması ile de en sık ziyaret edilen ve edilme olasılığı en yüksek olan sayfalar bulunmuştur.Anahtar Kelimeler: Web kullanım madenciliği, Web madenciliği, Veri madenciliği, Apriori algoritması, Log dosya formatları,TFPR algoritması.