Özet:
Bilgisayar bilimlerinde ses ile ilgili çalısmalar genel olarak üç ana baslık altında toplanabilir:bunlar konusma tanıma, konusmacı tanıma-doğrulama ve konusma sentezlemedir. Anabaslıklardan konusma tanıma ile makine-bilgisayar tarafından insan konusmasının anlasılmasıveya bundan bilgi çıkarımı hedeflenmektedir.Bu tez çalısmasında çok boyutlu bir tanım uzayına sahip olan konusma tanıma probleminingenis sözlüklü sürekli konusma tanıma gereksinimlerini karsılayacak sekilde çözümüneyönelik bir uygulama gerçeklestirilmistir. Mel Frekans Kepstral Katsayı (MFKK) özellikçıkarımı ve Gizli Markov Modeli (GMM) ile özellik sınıflandırılması bu çalısmanın temeladımlarını olusturmaktadır.MFKK özellikleri konusmacı bağımsız olarak ses verisine iliskin özelliklerin ortayakonmasında etkili bir yöntemdir. GMM de ardısıl özelliklerin gelis sırası dikkate alınaraksınıflandırılmasını sağlayan bir yöntemdir.MFKK özellik çıkarım adımlarının ses verisine uygulanması ile reel değerlikli özellikvektörleri elde edilir. MFKK katsayılarına K-ortalama yönteminin uygulanması ile tekboyutlu ayrık değerlikli bir özellik uzayına geçilir.Herbir fon için dört durumlu, soldan sağa, ayrık çıkıs olasılıklarına sahip GMM temelmodelleri uygun ilk durumları verilerek olusturulur. Eğitimde kullanılan ses verisine iliskinçözümleme doğrultusunda temel GMM'ler bir araya getirilerek sesler arası geçis sayılarınagöre olasılıklandırılırlar. Tüm eğitim seti üzerinde Baum-Welch algoritması çoklu gözlemdurumu dikkate alınarak uygulanır ve tüm temel GMM'ler için model parametrelerigüncellenir. Kullanılan yaklasım ile GMM modelinin eğitim asamasında ses üzerindeetiketleme, bölümleme, kelime baslangıcı ve bitisi isaretleme gereği olmadan ses verisineiliskin istatistiki yapı elde edilebilmektedir.Sistem basarısı iki farklı kelimeyi ayrık olarak tanıma, çok sayıda kelimeyi ayrık olaraktanıma, kısıtlı sayıda tekrarlı kelimeleri sürekli konusma yapısında tanıma, sürekli konusmayapısında cümle tanıma deneysel kurguları üzerinde incelenmistir.Anahtar Kelimeler: Genis sözlüklü sürekli konusma tanıma, Gizli Markov Modeli, MelFrekans Kepstral Katsayıları.