This thesis examines the ability of Google Trends (GT), i.e. the free public tool for
obtaining data regarding web search activities, in forecasting economic variables of
Turkey by using different query selection methods. It reports whether internet search
activity improves forecasting of tourism demand, unemployment, and car sales by
comparing forecast errors of models with and without GT variable. For each variable
of interest, three models are constructed. The first, baseline model, is estimated using
only the past values of selected variables. The second model, in addition to the past
values of the economic variables, integrates additional regressor constructed from the
simple query selection method, where search indices of single keywords related to
each of the selected variables are obtained. The third model follows the same
approach as the second, but with different query selection method, where composite
search index using Principal Component Analysis (PCA) is constructed from the
large number of queries related to our economic variables. All models are estimated
using the Autoregressive Integrated Moving Average (ARIMA) methodology.
Forecast comparisons indicate that models with GT information outperformed the
basline models in most of the forecasting experiments. When it comes to
performance of the two query selection methods, composite search index, on
average, provides better forecasts. The study’s results could be beneficial for the
policy makers and other stakeholders as selected variables play important role for the
Turkish economy. GT offers a new way of tracking economic behavior at almost
zero cost. Furthermore, they have ability to get real-time insights regarding economic
decisions.
Bu tez, web arama aktiviteleri ile ilgili bilgi sunan Google Trends (GT) aracının, farklı sorgu seçim yöntemlerini kullanarak Türkiye'deki ekonomik değişkenleri tahmin etmedeki yeteneğini incelemektedir. GT değişkeni olan ve olmayan modellerin tahmin hatalarını karşılaştırarak internet arama etkinliğinin turizm talebi, işsizlik, ve araba satışlarının öngörü başarısını geliştirip geliştirmediğini ortaya koymayı amaçlamaktadır. Her bir değişken için üç model oluşturulmuştur. Baz model, yalnızca seçilen değişkenlerin geçmiş değerlerini kullanarak öngörü oluşturmaktadır. İkinci model, ekonomik değişkenlerin geçmiş değerlerine ek olarak, seçilen değişkenlerin her biri ile ilgili tek anahtar kelimeye ilişkin arama indekslerinin elde edildiği basit sorgu seçim yönteminden oluşturulan ilave değişkeni içermektedir. Üçüncü model, ikinciyle aynı yaklaşımı izlemekte, ancak arama indeksini oluştururken çok sayıda anahtar kelime kullanmakta ve Temel Bileşenler Yöntemi (Principal Component Analysis, PCA) yöntemini kullanarak yeni bir bileşik indeks oluşturmaktadır. Tüm modeller Autoregressive Integrated Moving Average (ARIMA) metodolojisi kullanılarak tahmin edilmiştir. Öngörü karşılaştırmaları, her iki sorgu seçim yöntemini takiben GT değişkenini içeren modellerin, baz modele göre daha başarılı olduğunu ortaya çıkarmaktadır. İki sorgu seçim yönteminin performansları söz konusu olduğunda ise ortalama olarak bileşik arama indeksinin daha iyi sonuçlar sağladığı görülmektedir. Araştırmanın sonuçları, politika yapıcılar ve diğer paydaşlar için çok yararlı olabilir çünkü seçilmiş değişkenler Türkiye ekonomisi için önemli bir rol oynamaktadır. Bu çalışma onlara neredeyse sıfır maliyetle ekonomik hareketleri takip etmenin yeni bir yolunu sunmaktadır. Ayrıca, ekonomik kararlarla ilgili gerçek zamanlı bilgiler edinme olanağı sağlamaktadır.