Özet:
Bu tez çalışmasında gen ağı çıkarım yöntemleri üzerinde önemli etkiye sahip olan ve moleküler etkileşimleri belirlemek için kullanılan ilişki tahmincilerinin, farklı biyolojik veri türlerinin entegrasyonu üzerindeki etkisi incelenmiştir. Tezde incelenen tüm kanser türleri için gen ifade ve proteomik verileri The Cancer Proteome Atlas (TCPA) tarafından sağlanmıştır. Öncelikle korelasyon tabanlı ilişki tahmincilerin etkisi, literatürde sıklıkla kullanılan Gen Ağı Çıkarım (GAÇ) yöntemleri kullanılarak, on altı farklı kanser türüne ait proteomik veriler analiz edilerek incelenmiştir. Ardından, Amerikan Kanser Topluluğu verilerine göre yaygın olarak görülen beş farklı kanser türüne ait proteomik verileri kullanılarak, hastalıkla ilişkili gen-gen/protein-protein etkileşim alt ağlarındaki merkez genler/proteinler tespit edilmeye çalışılmıştır. Bu işlem sırasında literatürde sıklıkla kullanılan karşılıklı bilgi (KB) ve korelasyon tabanlı dokuz ilişki kestirimci karşılaştırılmıştır. İlişki tahmincilerinin performansını ölçmek için altın standart olarak, Hastalık-Gen ilişkileri entegrasyon platformu (DisGeNET) ve Moleküler İmzalar Veritabanı (MSigDB) kullanılmıştır. Oluşturulan ortak ifade ağları ile hastalıkla ilişkili yollar karşılaştırılmış ve ilişki tahmincilerinin performansını değerlendirmek için Fisher'ın kesinlik testi kullanılmıştır. Ağırlıklı korelasyon ağ analizinde (WGCNA) düzenleyici ağların tahmini için kullanılan Spearman ve Pearson korelasyon yaklaşımlarına göre, KB tabanlı ilişki tahmincilerinin başarımının daha yüksek olduğu gözlenmiştir. Korelasyon tabanlı yöntemlerde beş kanser türü için en iyi ortalama başarı oranı %60 iken, KB tabanlı yöntemlerde ortalama başarı oranı James-Stein Shrinkage (Shrink) için %71, Schurmann-Grassberger (SG) için %64'tür. Sonrasında gen ifade ve proteomik verilerinden çıkarımlanmış ağların entegrasyonu sağlanmıştır. Son olarak her bir kanser türüne göre merkez genler ve çıkarımlanmış alt ağlar, araştırmacıların ve biyologların incelemesi için sunulmuştur.