Özet:
Tabi dillerin işlenmesi, yapay zekanın doğurduğu alt bilim dallarından biridir. Bu bilim dalının temel uğraşım alam, insan konuşma dillerinin belirli bir model çerçevesinde bilgisayara algılattırılması, kullanıcı ile bilgisayar arasındaki iletişimin tabi konuşma dili havasında sağlanmasıdır. Tabi dillerin işlenmesi yada analizi alanında geliştirilen uygulamalardan tabi dil arayüz programlan üzerinde en fazla çalışılan ve uygulama geliştirilen konudur. Sorgulama amaçlı oluşturulan büyük veri tabanları ve uzman sistem programlarında etkileşimli bir soru-cevap ortamı yaratmak için hep bu arayüz programlan kullanılmaktadır. Bu gerçekten yola çıkarak, bu tez çalışmasında tabi dil arayüzüne sahip bir veritabanı tasarımı yapılmıştır. Projede ağırlıklı olarak arayüz programının tasarımı ön planda kalmış olup uygulamanın doğruluğunu gösterebilmek içinde orta büyüklükte bir veritabanı oluşturulmuştur. Projenin amacı herhangi bir alanda kullanıcıların günlük konuşma dili havası içinde öğrenmek istedikleri konulan bilgisayardan sorgulayabilmeleridir. Uygulama için kullanılan veritabanını İstanbul ile ilgili değişik konularda topladığım bilgilerden oluşturdum. Bundaki amacım özellikle bu ve ileride buna benzer olarak geliştirilecek programların turizm sektörlerinde kullanılabileceğini göstermektedir. Nitekim bu alanda yurtdışında kullanılan pek çok program mevcuttur. Geliştirilen programın karakteristik özelliği, kullanıcının, giriş sorulanın İngilizce soru cümleleri halinde sisteme verebilmesidir. Şu anda programın veritabanında aşağıdaki konularda bilgiler mevcuttur. İstanbul'un genel özellikleri ( nüfus, yüzölçümü, komşuluk bilgileri ), ilçeleri ( nüfus, yüzölçümü, komşuluk bilgileri ), coğrafi bilgiler ( dağlar, nehirler, göller ), üniversiteler, oteller ( 5, 4, 3 ve 2 yıldızlı oteller ), tarihi yapıtlar ( camiler, türbeler, çeşmeler, kuleler, müzeler ), valiler, belediye başkanları. Bu bilgiler sayfalarca süren detaylı bilgiler olmayıp, sadece soru-cevap mekanizmasına uygun hazırlanmış birer ikişer cümlelik bilgilerdir. Program tabi dil işleme metodlarından informal metodlar sınıfına giren fark çiftlerinin ayrıştırılması ( difference pair parsing ) tekniği ile yazılmıştır. Sistem kullanıcının girdiği sorgu ifadesinde önceden belirlenmiş sözcük şablonları yada kalıplan arar. Eğer böyle bir şablona rastlarsa oluşturduğu bir sorgulama cümlesiyle veritabanından istenen kıstaslara uyan bilgileri arayıp çıkarır. Bu sözcük şablonları anahtar sözcük arama tekniğinin bir adım ötesidir. Sistem, kullanılan programlama dilinin özelliğinden ötürü oluşturulan veritabanını belleğe almakta ve her türlü sorgulama işlemini bellekte gerçekleştirmektedir. Böylece, kullanılan tekniğinde özelliğinden ötürü sorgulama işlemleri çok hızlı bir şekilde gerçekleşmektedir. vı