Provenans (Veri kökü) verisinin yapısını ve konseptini öğrenmek için bir iş akışını takip
eden iş akışı sistemine ihtiyaç vardır. Provenans (Veri kökü) verisi çok hızlı
büyüdüğünden ayrıntıyı yakalamak gittikçe zorlamaktadır. Bu çalışma da kompleks
yapılı bilgi tabanlı provenance göstermi üzerinde çalışılmıştır. Bilimsel iş akışlarının
çalışma izlerinin takibi için yapılan boyut azaltımlı provenans (veri kökü) gösterimi
yöntemi analizleri gizlenmiş olan yapıları başarılı bir şekilde gruplamayı başarmıştır. Bu
çalışmada aynı zamanda kompleks yapıdaki veriler içerisinden en çok kullanışlı, faydalı
olan yapıları da tespit etmektedir. Bu çalışmanın yapılan bir önceki çalışmalardan farkı
önceki çalışmaların kararsız boyutlarda olması bu yöntemde ise sabit ve daha az boyutlu
veriler ile çalışarak daha iyi başarım elde edilmesidir. Yapılan çalışma da yeni yöntemin
veri madenciliği algoritmaları kullanılarak daha üstün başarım elde ettiği ortaya
konulmuştur.
Learning structure and concepts in provenance data have created a need for monitoring
scientific workflow systems. Provenance data is capable of expanding quickly due to
the catch level of granularity, which can be quite high. This study examines complex
structural information based provenance representations, such as Network Overview
and Social Network Analysis. Further examination includes whether such reduced
provenance representation approaches achieve clustering effective for understanding the
hidden structures within the execution traces of scientific workflows. The study applies
clustering on a scientific dataset from a weather forecast to determine its usefulness,
compares the proposed provenance representations against prior studies on reduced
provenance representation, and analyzes the quality of clustering on different types of
reduced provenance representations. The results show that, compared to prior studies on
representation, the Social Network Analysis based representation is more capable of
completing data mining tasks like clustering while maintaining more reduced
provenance feature space.