Özet:
Sayısal ortama aktarılan yazılı ve basılı dokümanlar,, bilgiye erişim, depolama, güncelleme veen önemlisi de bilgi paylaşımında kolaylık sağlamıştır. Ancak bu sayısal dokümanlarındüzenlenmesi için sunulan sayfa planını çıkartma, resim ve metin bölgelerini ayırt etmekonusunda yapılan çalışmaların artmasına neden olmuştur.Bu çalışmada, yazı karakterlerinden oluşan metin bölgelerindeki dokusal özelliğin, resimbölgelerindeki dokusal özellikten farklı olduğu değerlendirilerek doküman görüntüsü üzerindemetin alanlarını tespit eden bir sistem geliştirilmiştir. Yazı karakterlerinin duyarlı olduğu açıdeğerlerine göre hazırlanan tek değer oranlı Gabor filtresinin görüntü üzerine uygulanmasıylayüksek frekanslı bileşenler ve düşük frekanslı bileşenler elde edilmiştir. Yüksek frekanslıbileşenlerin olası yazı karakteri olduğu kabul edilmiş , buna uymayan çizgi, çerçeve v.b.yüksek frekanslı bileşenler, bağlı-parçacıklar yöntemiyle elenmiştir. Mevcut yöntemlerdenfarklı olarak, kelime ve cümleleri oluşturan karakterlerin devamlılık ve komşuluk özellikleride değerlendirilerek olası yazı karakterleri üzerinde eleme yapılmıştır. Yazı karakteri,karakter takibi olarak adlandırılan bu eleme yöntemiyle bulunmuştur. Oluşturulan dokümanmodeli optik karakter tanıma işlemi için hazır hale getirilmiştir.Önerilen yöntem doğrultusunda tasarlanılan sistemin Gabor filtreleme basamağında, tek değeroranlı Gabor filtresi kullanılarak metin alanlarının bulunması hızlandırılmıştır. Yeni biryaklaşım olarak sunulan karakter takip yöntemiyle yazı karakterlerinin tespitinde sisteminbaşarı oranı arttırılmıştır. Bu sistemle, karmaşık sayfa planına sahip Latince ve Kirilce gibifarklı alfabelerin harflerinden oluşan değişik dillerdeki dokümanlarda metin alanlarınınbulunmasında başarılı sonuçlar elde edilmiştir.Anahtar Kelimeler: Metin alanlarının çıkarılması, Gabor filtreleme, çok kanallı filtreleme,sayfa plan analizi, karakter takibi.