Özet:
Konuşma, birçok kişisel bilgi içeren bir biyometrik işarettir. İnsan iletişiminin en doğal
ve en verimli biçimini temsil etmektedir. Gelişen teknoloji ile birlikte, bu konuşma
işaretinden elde edilen bilgiler kullanılarak konuşma tanıma, konuşmacı tanıma,
konuşma sentezleme ve konuşma kodlama ve çözme gibi çok çeşitli ses işleme
uygulamaları geliştirilmektedir. Günümüzde özellikle güvenlik gerektiren kişisel
işlemlerde bu uygulamalar aktif bir rol oynamaktadır. Bu uygulamaların
geliştirilmesinde çoğu zaman konuşma bölütlerinin tespit sistemi bir ön işlem olarak
kullanıldığından konuşma bölütlerinin doğru tespit edilmesi oldukça önemlidir.
Konuşma bölütleme (segmentasyon), bir konuşma işaretini daha küçük akustik
birimlere bölme işlemi olarak adlandırılır. Aynı zamanda, konuşma işaretini kelimeler,
heceler veya fonemler arasında sınır bulma prosedürü olarak tanımlamak ta
mümkündür. Bu tez çalışmasında, sürekli bir konuşma içerisindeki Ünsüz (Consonant),
Ünlü (Vowel), ve Sessiz (konuşmanın olmadığı, Silent) (C/V/S) bölgeleri Geçitli
Tekrarlayan Birim (Gated Recurrent Unit, GRU) tekrarlayan sinir ağlarına dayalı
tahmin edebilen (belirleyebilen) fonem tabanlı bir konuşma tespit sistemi
geliştirilmiştir. Bu amaçla, C/V/S konuşma bölütlerinin sınırlarını tanımlamak için 4
farklı pencere uzunluğu, 3 farklı pencereleme yöntemi ve 3 farklı hibrit özellik çıkarım
yöntemi birlikte kullanılarak 6 farklı sınıflandırıcı yöntemi ile test edilmiştir. Böylece
çeşitli parametrelerin farklı hibrit özellik çıkarım yöntemleri ile birlikte kullanılmasının
C/V/S konuşma bölütlerinin tespit sistemi üzerindeki etkisi incelenmiştir.
Bu çalışmada, Enerji, Sıfır Geçiş Sayısı (ZCR) ve Mel Frekans Kepstral Katsayı
(MFCC) temelli bir hibrit özellik çıkarım yöntemi kullanılmıştır. Bu bağlamda, farklı
hibrit özellik çıkarım yöntemleri çeşitli parametreler ile birlikte kullanılarak bir ses
işaretinin içerisindeki C/V/S konuşma içeren bölütlerin tespitini en iyi modelleyen
parametre setinin belirlenmesi amaçlanmıştır. Yapılan uygulamalar sonucunda GRU
modelinin, Kürtçe akustik işaretini karakterize etme başarımını arttırdığı gözlenmiştir.
Ayrıca, günümüzde, Kürtçe alanında çok az sayıda akademik çalışma yapıldığından
dolayı, bu çalışma bu alanda önemli bir katkı yapacaktır.