Özet:
Hastalıklara neden olan biyolojik mekanizmaların moleküler seviyede keşfi son yıllarda
üzerinde önemle durulan bir çalışma alanıdır. İnsan genom projesinin tamamlanması
ve DNA dizileme tekniklerindeki ilerlemelerle hastalıklara neden olan süreçler ve bu
süreçler altında yatan moleküler ilişkiler daha hızlı ve kolay bir şekilde
belirlenmektedir. Gen birliktelik ağları farklı fenotiplere sahip örneklerde benzer
örüntüler sergileyen genler arasındaki ilişkilerden oluşan moleküler ilişki ağlarıdır.
Benzer örüntü sergileyen genlerin yapılan literatür çalışmalarında benzer biyolojik
fonksiyonlara sahip olduğu ve benzer süreçlerde yer aldıkları anlaşılmıştır. Tez
kapsamında mikrodizin gen ifadesi, RNA- Seq ve miRNA- hedef gen verileri üzerinde
farklı gen ağı çıkarım algoritmaları kullanılarak gen birliktelik ağları elde edilmiştir.
Literatürde farklı biyolojik veri kümeleri ve gen ağı çıkarım algoritmalarını aynı yapı
içerisinde kullanarak hastalıklarla ilişkilendirilmiş kapsamlı ve doğruluklu gen birliktelik
ağı çıkarımı gerçekleştiren çalışma sayısı kısıtlıdır. Tez kapsamında temel hedefimiz
farklı gen ağı çıkarım algoritmaları ve biyolojik veri kümelerini birlikte kullanarak göğüs
ve prostat kanseriyle ilgili yüksek doğruluklu ve kapsamlı gen birliktelik ağları
oluşturmaktır. Bu hedefle kesişim, basit çoğunluk oyu ve birleşim gibi temel
entegrasyon yöntemleriyle iki katmanlı bir yapı oluşturularak gen birliktelik ağlarının
entegrasyonunu gerçekleştirilmiştir. İki katmanlı entegrasyon mimarisi ile aynı veri
kümesi üzerinde farklı gen ağı çıkarım algoritmalarından elde edilen gen birliktelik
ağlarının entegrasyonu birinci entegrasyon aşamasında, farklı biyolojik veri kümeleri
kullanılarak elde edilen gen birliktelik ağlarının entegrasyonu ise ikinci entegrasyon
xiii
aşamasında gerçeklenmiştir. Elde edilen gen birliktelik ağlarının performansı biyolojik
ve topolojik özelliklerine göre değerlendirilmiştir. Bu iki değerlendirme kriterine ek
olarak literatür verileri ile örtüşme analizi yapılmıştır. Sonuç olarak, sadece gen ağı
çıkarım algoritmaları kullanılarak yapılan gen birliktelik ağı entegrasyonunun
performans arttırımına etkisi kısıtlı iken, farklı biyolojik veri kümelerinden elde edilen
gen birliktelik ağlarının entegrasyonunun performans artışı sağladığı gözlemlenmiştir.
Çalışmamızda aynı zamanda daha önce miRNA- hedef gen verileri üzerinde gen
birliktelik ağı çıkarımında hiç kullanılmamış hash tabanlı birliktelik kuralı algoritmasını
uygulayarak ilgili veri kümelerinden teorik olarak 152 hastalıkla ilişkili GBA'lar elde
edilmiş ve bu algoritma ARNetMiT R paketi halinde kullanıcılara sunulmuştur.