Özet:
Hisse senetleri fiyatlarında gerçekleşebilecek değişikliklerin tahmin edilmesi gerek akademik gerekse finansal çevrelerde üzerinde en çok durulan konulardan birisidir. Bu problemin çözümü amacıyla yapılan çalışmalarda veri madenciliği tekniklerinden sıklıkla faydalanılmaktadır. Bu çalışmalarda zengin içerikli finansal haber bilgileri ile hisse senedi fiyatları bilgilerinin birlikte kullanılması ile başarılı sonuçlar elde edilmiştir.Bu çalışmada metin formatındaki finansal haber makalelerinin analiz edilerek hisse senetleri fiyatlarında ileriye dönük gerçekleşebilecek değişikliklerin tahmin edilmesi amaçlanmıştır. Geçmişe yönelik bilgilerden faydalanılarak finansal haber makalelerinin içerikleri ile hisse senetleri fiyatları arasındaki ilişki analiz edilerek ileriye yönelik tahminler yapılması üzerine bir model geliştirilmiştir.Çalışma kapsamında son bir yıl içerisinde Microsoft şirketi hakkında yayınlanmış finansal haber makaleleri ve yine aynı dönem içerisinde Microsoft şirketinin günlük hisse senetleri fiyatları bilgilerinden bir veritabanı oluşturulmuştur. Haber makaleleri yayınlandıkları tarihten itibaren hisse senedi fiyatında gerçekleşen değişikliğe göre olumlu veya olumsuz olarak etiketlenmiştir. Olumlu olarak etiketlenen haberlerin hisse senedi fiyatında artış etkisi, olumsuz olarak etiketlenen haberlerin ise düşüş etkisi yarattığı kabul edilmiştir. Haber makaleleri analiz edilirken kelimeleri ayrı ayrı değerlendirmek yerine, haberlerin özelliklerini belirlemek için aynı cümlede geçen biri isim diğeri fiil türünden iki kelime birlikte kullanılmıştır. Özellik olarak belirlenen isim ve fiil kelime ikililerinden ki-kare istatistik yöntemi ile sınıflandırmada en ayırt edici olanlar seçilmiştir. Veritabanındaki haber makaleleri, seçilen özellikler üzerinden destek vektör makinesi ve k-en yakın komşuluk yöntemleri ile sınıflandırılmıştır. Sınıflandırma sonucunda elde edilen tahminler ile sistemin yatırım stratejileri üretmesi sağlanmıştır.Sistemin doğrulamasını yapmak amacı ile çeşitli senaryolar denenerek sistemin çıktıları değerlendirilmiştir. Elde edilen sonuçlar, finansal haber makalelerinin içerikleri ile hisse senetleri fiyatları arasında güçlü bir ilişki olduğunu ispat etmektedir.Anahtar kelimeler: Hisse senedi fiyatı tahmini, Veri madenciliği, Metin madenciliği, Metin sınıflandırma.