dc.description.abstract |
Bu tezin amacı konuşma işaretinin incelenmesi ve son günlerde en popüler tanıma yöntemi olan Yapay Sinir Ağlarını (YSA) kullanarak Türkçe sesli harflerin tanınmasına dayalı bir uygulama yapmaktır. Bu uygulamada kelime tanımanın temelini oluşturacak şekilde bir yapı kurulmaya çalışıldı. Bu yüzden kelime tanımanın yapı taşı olan sesli seslerin tanınması asıl amaç olarak ele alındı. Tanıma işlemi genellikle işaretin işlenmesi, belirgin özelliklerinin çıkarılması, örü karşılaştırılması safhalarından oluşmaktadır. Sesin analizinde LPC (linear predictive coding) analizi kullanılarak ilgili sistem parametreleri bulunmuştur. Konuşma işaretinin üretilmesini bir süzgeç olarak düşünürsek, bu süzgecin bir transfer fonksiyonu vardır. Bu transfer fonksiyonunun rezonans frekanslarına konuşma literatüründe formant denilir. Genelde ses tanımada ilk üç formant kullanılmaktadır. Fakat bu formantlar kişiden kişiye değişir, yani sabit olmayıp belirli bir alan içinde haraket ederler. Bu tezde DFT (Discrete Fourier transform) yöntemiyle ses birimlerinin, formatlarının çıkarılması yerine, tam bir spektrumu alınmıştır. Alman bu spektrum 16 banda ayrılıp her bandın ortalaması hesaplanarak 16 tane parametre elde edilmiştir. Ses tanıma işlemi bu iki tip parametre kullanılarak Yapay Sinir Ağlan ile gerçekleştirilmiştir. YSA algoritması olarak çok katmanlı genelleştirimiş delta kurallı hatanın geriye yayılması algoritması ile çalışıldı. Bu işlemleri yapabilmek amacıyla çeşitli bölümlerde ilgili algoritma ve yöntemler tartışılacak ve yorumlanacaktır. Altıncı bölümde ise tezin asıl gerçekleştirme aşamasında yapılanlar uygulama anlatılacak ve yazılan program tanıtılacaktır. Son bölümde ise sonuçlar ve öneriler yer almaktadır. |
|