Abstract:
Bilgisayarın ilk yapılışı bilimsel ve askeri amaçlar ile olmuştur. Teknolojinin gelişmesi ile birlikte bilgisayarların boyutları küçülmeye başladıkça kullanımları yaygınlaşmıştır ve başta ticari uygulamalar olmak üzere farklı alanlar için kullanılmaya başlanmıştır. Farklı programlama
dilleri ortaya çıkmaya başladı. Yazılım projelerindeki karmaşıklığı yönetebilmek
için yazılım mühendisliği kavramının ortaya atılması ile birlikte yazılımcıların hayatını kolaylaştırmak için farklı yöntemler üretilmeye başlandı. Yazılımın hataya yatkınlığının tahmini de bu yöntemlerden biridir. Her yazılım ürünü için kullanıma açılmadan önce test sürecinden geçilmesi bir zorunluluktur. Ancak, yazılım geliştirme sürecinin her aşamasında olduğu gibi test aşamasında da kaynakların verimli bir şekilde kullanılabilmesi için planlama yapılması gerekmektedir. Test sürecinin düzgün bir şekilde planlanması için kaynakların aktarılacağı bölümlerin belirlenmesi gerekmektedir. Hataya yatkınlık tahmini yöntemleri proje yöneticileri tarafından, kısıtlı olan kaynakları test aşamasında verimli bir şekilde
dağıtmak için kullanılmaktadır. Bu yöntemler yazılım tespitinde görev yapan kişilere
test senaryolarının ne şekilde üretileceğine ve organize edileceğine karar vermelerine
yardımcı olmaktadır. Hatalı modüllerin doğru tahmin edilmesi yazılım testinin masrafını
azaltmaktadır ve proje yöneticileri kısıtlı kaynaklarını işlere atama konusunda daha rahat hareket edebilmektedir.
Hataya yatkınlık tahmini, yazılım mühendisliğinde son 10 yılın en aktif araştırma konularından
biri olmakla birlikte, son yıllardaki çalışmalarda tahmin modellerinin başarılarının
doyum noktasına ulaştığı gösterilmiştir. Tahmin modellerinin performansını araştırmak
için genel kanı kullanılan algoritmalardan ziyade veri kümelerinin iyileştirilmesi gerektiği
yönündedir. Şimdiye kadar yapılan araştırmalarda veri kümelerinin iyileştirilmeye çalışılması
için uygulama türüne özel veri çıkarımı gerçekleştirilen bilmediğini fark ettik. Bu noktadan
hareketle web uygulamaları alanını seçerek, bu türdeki açık kaynaklı uygulamalardan özel metrik kümeleri çıkardık. Deneylerimiz sonucunda alana özel çıkarılan metriklerin hataya
yatkınlık tahmini modellerinin performansını araştırmaya yardımcı olduğunu gözlemledik.