Abstract:
Bilişim uygulamalarının yaygınlaşması ile, bilgisayarlarda büyük miktarlarda veri depolanmasına başlanmıştır. Günümüz veri tabam sistemleri, kullanıcıya depolanan bütün bilgilere kolayca ulaşabileceği araçları ve fonksiyonları sunmamaktadır. Büyük veri tabanlarında saklı olan bu bilgilere ulaşmak ve bu bilgileri kullanmak üzere, otomatik bilgi keşfetmeye yarayan teknikler geliştirilmektedir. Bu tekniklerden biri olan ilişkisel kurallar bulma, depolanan verilerden, ilginç ve sıklıkla rastlanan şemaları tanıma işlevinin, yani veri araştırmasının çok önemli bir dalıdır. İlişkisel kurallar, nesnelerin bir arada olma durumlarını belirlemeyi amaçlar ve bir çok alanda geniş kullanılabilirliğe sahiptir. İlişkisel kurallar bulma, yoğun nesne kümelerinin (verilerde sıkça bir arada görülen nesnelerin) hesaplanması esasına dayanır ve büyük veri tabanlarında hesaplanması oldukça pahalı bir işlemdir. Bu nedenle, daha önce belirlenmiş ilişkisel kuralların korunması oldukça önemli bir konudur. Bu çalışmada, ilişkisel kural üreten temel algoritmalardan biri olan Apriori ve onun türleri olan AprioriTid, AprioriHybrid ve DHP algoritmaları incelenmiş ve C dilinde bu algoritmaların programlan yazılmıştır. Algoritmalar performanslarına, yöntem farklılıklarına, kural üretmeye başladıkları minimum eşik değerlerine göre farklı veri kümeleri üzerinde karşılaştırılmıştır. Son olarak da tüm algoritmaların ortak olarak kullandıkları bir ilişkisel kural üretme prosedürü yazılmış ve üretilen kurallar bir dosya ortamında saklanmıştır.