dc.description.abstract |
Haber başlıklarının türü ve sosyal medyada yapılan paylaşımların duygu durumlarına göre sınıflandırılması gelişen teknoloji ile beraber medya sektöründe kullanım açısından büyük önem taşımaktadır. Bir haberin hangi tür olduğunu anlamanın yanı sıra, kişinin çok ziyaret ettiği haber türü bulunabilmekte ve o kişiye özgü ilgi çekebilecek reklamlar gösterilebilmektedir. Ayrıca, haber ajansları için haberlerin otomatik olarak sınıflandırılması önemlidir. Sosyal medya artık iletişim için kullanılmanın ötesinde birçok alanda etkili hale gelmiştir. Kullanıcılar Facebook, Twitter, Blog gibi sosyal medya araçlarında bir olayla alakalı duygusunu, düşüncesini ve deneyimlerini paylaşabilmektedir. Ayrıca, bu araçlar haber paylaşmak ve organizasyon düzenlemek için de kullanılmaktadır. Sosyal medyada yapılan paylaşımlar ile kişi hakkında bilgi de edinilebilmektedir. Yapılan paylaşımlardaki duygulardan yola çıkarak kişinin ruh hali tahmin edilmektedir. Böylece kişiye özgü sayfalar önerilebilmektedir. Çalışmada haberlerin türlerini ve Twitter'dan paylaşılan tivitlerin hangi duyguya sahip olduğunu tespit etmek amaçlanmıştır. Yöntem olarak konu modelleme algoritması Gizli Dirichlet Ayırımı (GDA), N seviyeli bir yapıda geliştirilerek kullanılmıştır. Haberler için oluşturulan veri seti Milliyet, Mynet gibi sitelerden yararlanılarak oluşturulmuştur. Tivitlerin duygu tespitinde kullanılan veri seti de Türkçe tivitlerden oluşturulmuştur. Haber veri seti en fazla 7 sınıflı iken; tivit veri seti kızgın, korku, mutlu, üzgün ve şaşkın duygu türü olmak üzere 5 sınıftan oluşmuştur. Sistemi modellerken kelimelerin kökleri alınmıştır. Köklerin çıkarılması işleminde Zemberek, Snowball ve kelimenin ilk 5 karakterini kök alan yöntemler kullanılmıştır. Haber ve Tivit veri setleri için önce klasik GDA yöntemi ile haberler için konu, tivitler için duygu ataması yapılmış ve sonrasında gerçek etiket değerleri ile karşılaştırarak bir başarı hesaplanmıştır. Klasik GDA yöntemini referans alarak aşamalı olarak değiştirilen GDA yöntemi ile tekrardan konu ve duygu belirleme işlemi yapılarak başarının arttığı gözlemlenmiştir. N-seviyeli GDA yöntemi kullanılarak her haber ve tivit için çıkarılmış olan özellikler kullanılarak Naive Bayes, Multinomial Naive Bayes, Destek Vektör Makineleri, Rastgele Orman ve Çok Katmanlı Algılayıcı gibi makine öğrenmesi yöntemleri kullanılarak sınıflandırıcılar ile sistemin başarısı ölçülmüştür. |
en_US |