Yeni makine öğrenmesi metotları ve ilaç tasarımına uygulamaları

Amasyalı, Mehmet Fatih

dc.contributor.advisor	Prof. Dr. Okan Ersoy
dc.contributor.advisor	Prof. Dr. Oya Kalıpsız
dc.contributor.author	Amasyalı, Mehmet Fatih
dc.date.accessioned	2018-07-17T11:38:52Z
dc.date.available	2018-07-17T11:38:52Z
dc.date.issued	2008
dc.identifier.uri	http://localhost:6060/xmlui/handle/1/1270
dc.description	Tez (Doktora) - Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2008
dc.description.abstract	Makine öğrenmesi (yapay öğrenme), eldeki verileri en iyi temsil eden modeli ve parametrelerini bulmak amacıyla geliştirilen algoritmaları içerir. Tezde çeşitli makine öğrenmesi algoritmaları geliştirilmiştir. Günümüzde incelenmesi ve yorumlanması gereken veri miktarı üssel bir biçimde artmaktadır. Bu durum makine öğrenmesinin tüm sektörlerin ihtiyaç duyduğu bir alan haline gelmesine sebep olmuştur. Tezin uygulama alanı olarak, bu sektörlerden biri olan ilaç tasarımı seçilmiştir.İlaçların insan sağlığına olan olumlu etkisi bilinmektedir. Yeni ilaç tasarımı bu nedenle çok önemli ve vazgeçilmezdir. Buna karşılık çok emek ve uzun zaman isteyen ve buna bağlı olarak çok büyük maliyetler içeren bir sektördür. Yüksek maliyet sebebiyle az sayıda firma tarafından gerçekleştirilebilmektedir. Türkiye'de bu alandaki mevcut çalışmalar sınırlı olmakla birlikte TÜBİTAK tarafından yayınlanan raporda ilaç tasarımı, 2003-2023 yıllarını kapsayan dönemde öncelikli teknolojik faaliyet konuları içinde yer almaktadır.İlaç tasarımı sürecinin ve maliyetinin önemli bileşenlerinden biri olası ilaç moleküllerinin seçilmesi işlemidir. Bu seçim işlemleri genelde, sınıflandırma, kümeleme, özellik seçimi/çıkarımı, regresyon (eğri uydurma) problemlerinden bir ya da birkaçını içermektedir. Bu tarz problemlere çözüm üretmeyi amaçlayan makine öğrenmesi metotları yardımıyla ilaç tasarımının süresi ve maliyeti azaltılabilmektedir.Görüldüğü gibi ilaç tasarımı problemlerinde makine öğrenmesinin neredeyse tüm alanlarına ihtiyaç duyulmakta ve kullanılmaktadır. Bu nedenle de tezde makine öğrenmesinin birçok alanını kapsayacak bir çalışma gerçekleştirilmiştir.Sınıflandırma problemleri için Cline adı altında bir algoritma ailesi tasarlanmıştır. Geliştirilen algoritmalar temelde karar ağacı oluşturma algoritmalarıdır. Karar ağaçları, yüksek performansları ve ürettikleri kuralların verinin yapısına ait çıkarımlar yapmayı kolaylaştırması sebebiyle oldukça popüler olmuş makine öğrenmesi algoritmalarındandır. Yapılan denemelerde geliştirilen algoritmaların basitliklerine rağmen UCI ve ilaç veri kümelerinde mevcut algoritmalarla yarışabilecek performansta algoritmalar oldukları görülmüştür.Sınıflandırıcı komiteleri literatürdeki birçok çalışmada tekil sınıflandırıcılardan daha başarılı sonuçlar üretmiştir. Bu çalışmada da buna paralel sonuçlar alınmış ve Cline algoritma ailesine Cline karar ormanları eklenmiştir. UCI ve ilaç veri kümeleri üzerinde Cline karar ormanları mevcut algoritmalardan çok daha iyi sonuçlar sergilemiştir. Cline karar ağacı ve karar ormanları algoritmaları ClineToolbox adlı bir yazılımla kullanıcıların hizmetine sunulmuştur. Yazılıma tez sahibinin web sayfasından erişilebilir.Özellik seçimi problemleri için karar ağaçları ve karar ormanlarından yararlanan bir yaklaşım geliştirilmiş ancak tatmin edici sonuçlar elde edilememiştir.Kümeleme problemleri için Clusline adı altında bir algoritma ailesi geliştirilmiş ve mevcut algoritmalarla çeşitli kümeleme performans kriterlerine göre yarışan sonuçlar elde edilmiştir.Kümeleme komiteleri, sınıflandırıcı komitelerinin üstün performanslarından esinlenilerek geliştirilmiştir. Literatürdeki kümeleme komitelerinin farklı karar birleştirme teknikleri incelenmiş ve geniş bir veri kümesi üzerinde bu teknikler karşılaştırılmıştır. Literatürdeki mevcut karşılaştırmalardan daha kapsamlı olan bu çalışma bu konuda çalışanlara yol gösterici niteliktedir.Regresyon problemleri için verileri çeşitli alt uzaylarda kümelemeye dayalı bir yaklaşım geliştirilmiş ancak tatmin edici sonuçlar alınamamıştır.Regresyon komiteleri için, literatürdeki komite oluşturma, karar birleştirme metotlarının ve komitelerde yer alan regresyon algoritmalarının ilaç tasarımı veri kümelerinde performans üzerindeki etkileri incelenmiştir. Bu kapsamlı çalışmada, ilaç veri kümelerinde regresyon komitelerinin kullanımının sınıflandırma da olduğu kadar sonucu iyileştirmediği görülmüştür.Bütün veri kümelerinde diğer tüm algoritmalardan daha iyi sonuç veren global bir algoritma bulunmamaktadır. Bu nedenle, bir veri kümesinin hangi algoritma ile en iyi sonucu vereceği genelde deneme yanılma metoduyla bulunmaktadır. Literatürde bu eksikliği gidermek ve son kullanıcılara yardımcı kurallar dizisi oluşturabilmek için algoritmaların performanslarının veri kümesinin çeşitli özelliklerine göre tahmin edilmesi amacını taşıyan yaklaşımlar geliştirilmiştir. Bu yaklaşımların genel adı Meta-Öğrenim'dir. Mevcut Meta-öğrenim çalışmalarında genelde sınıflandırma problemleri üzerine çalışılmıştır. İlaç veri kümelerindeki problemlerin büyük bir kısmı regresyon türünden problemler olduğu için bu çalışmada yeni bir Meta-Regresyon yaklaşımı da geliştirilmiştir. Geliştirilen yaklaşımda Meta-öğrenimde kullanılan standart veri kümesi özelliklerine ek yeni özellikler de kullanılmıştır. Çalışma sonunda bir veri kümesi üzerinde bir algoritmanın performansı veri kümesinin çeşitli özelliklerine bakarak tahmin edilebilen bir model geliştirilmiştir. Bu sayede bir veri kümesinde en iyi performansı gösterecek algoritma da tahmin edilebilmektedir. Ayrıca veri kümelerinin ve algoritmaların birbirlerine benzerliklerine göre kümelenmesi konusunda da çalışılmıştır.Sonuç olarak bu tezde, makine öğrenmesinin çeşitli konularında birçok yeni yaklaşım geliştirilmiş ve bu konuda çalışan araştırmacılar ve son kullanıcılar için faydalı olacak sonuçlar üretilmiştir. Bu tezin hem ilaç tasarımı hem de makine öğrenmesi konularında Türkiye'de ve Dünya'da yapılan çalışmalara katkıda bulunması dileğimizdir.
dc.subject	Makine öğrenmesi
dc.subject	Yapay öğrenme
dc.subject	Sınıflandırıcı komiteleri
dc.subject	Kümeleme komiteleri
dc.subject	Eğri uydurma
dc.subject	Regresyon komiteleri
dc.subject	Meta-öğrenim
dc.subject	Bilgisayar destekli ilaç tasarımı
dc.subject	Rasyonel ilaç tasarımı
dc.title	Yeni makine öğrenmesi metotları ve ilaç tasarımına uygulamaları
dc.type	Tez