Özet:
Yeni Nesil Dizileme (YND) teknolojisi, hızlı ve doğru tanıya olanak sağlayan
genetik araştırmaları önemli ölçüde güçlendirmiştir. Bununla birlikte, üretilen
verilerin artması ve analiz basamaklarının karmaşık hale gelmesine bağlı olarak
analizler zorlaşmış ve hataya açık hale gelmiştir. Ayrıca, yapılan analizlerin
tekrarlanabilirliği ve geriye dönük olarak denetlenmesi imkansız hale gelmektedir.
Sözkonusu zorluklara çare olarak yazılım geliştiriciler tarafından kullanılan is akısı
yönetimi programları bulunmakla beraber bu programların biyologlar tarafından
kullanımı oldukça zordur. Ancak, Python tabanlı iş akışlarının yönetimini sağlayan
Snakemake, sayısız biyoinformatik yazılımın kurulumunu veya yapılandırılmasını
kolay ve zahmetsiz hale getirirken, kullanım açısından daha kolaydır. Bu çalışmada,
YND verilerinde Snakemake yardımıyla varyant analizini programlama gerektirmeden
kolaylaştırmak ve daha kullanışlı raporlar elde etmek hedeflenmiştir. Bu amaçla,
GATK’ın tavsiye edilen varyant tespiti uygulamaları kullanılarak oluşturulan mevcut
bir Snakemake iş akışı modifiye edilmiş, ENSEMBL Varyant Efekt Predictor (VEP) ile
varyantlar değerlendirilmiş ve Web tabanlı, interaktif son rapora Integrative Genome
Viewer (IGV) yazılımı entegre edilmiştir. Bu yaklaşım tekrarlanabilir ve taşınabilir
bir çözüm sunmaktadır, bu yüzden kişisel bir dizüstü bilgisayarda veya büyük bir
sunucuda kolayca uygulanabilir. Snakemake paralel isleri yürütebildiğinden, çok
işlemcili bilgisayarlarda SNP analizi paralel şekilde daha hızlı tamamlanabilir. Daha
da önemlisi, bir is akısı yaklaşımı kullanmak çok sayıda analiz gerçekleştirilirken
insan kaynaklı hataları büyük ölçüde önleyecektir. Sonuç olarak, biyoloji veya ilgili
alanlarda uzmanlaşmış bir kullanıcı, programlama bilgisi gerekmeden, geliştirdiğimiz
is akısını kullanarak bir çok ham YND verisini isleyebilir ve kullanışlı, interaktif varyant
raporları ile daha doğru, çabuk ve tekrarlanabilir sonuçlara ulaşabilir.