Abstract:
Gelişen teknoloji ile birlikte insanların ödeme alışkanlıkları değişmiş, kredi kartları
daha güvenilir, hızlı ve pratik olması açısından nakit paranın yerini almaya
başlamıştır. Temassız ve çevrimiçi ödemelerin de yaygınlaşması ile birlikte kredi
kartları günümüzde, temel ödeme aracı olarak anılmaya başlanmıştır. Kredi kartı
kullanımının artması, işlemlerin güvenli bir şekilde yapılmasını zorlaştırmış, kredi
kartı sahtekarlarının yeni dolandırıcılık yöntemleri geliştirmesine olanak sağlamıştır.
Bankalar sahtekarlık işlemlerinden her sene milyarlarca dolar zarar etmektedir.
Oluşan maddi zararın yanında, müşteri ve itibar kaybı gibi manevi zararlara da sebep
olmaktadır. Kredi kartı sahtekarlarının ele geçirdikleri kart bilgileriyle işlem yapmasını
engelleyecek hızlı ve güvenilir sistemlere ihtiyaç duyulmaktadır.
Bu çalışmada kredi kartı sahtekarlığı problemi incelenmiş, sahtekarlık işlemlerinin
tespitinde başarı oranını attırmak için yeni bir yöntem önerilmiştir. Yapılan çalışmada
normal ve sahtekarlık harcamalarına ait gerçek veri kümesi kullanılmıştır. ˙Ilk olarak
hazırlanan veri kümesinin özellikleri belirlenmiştir. Ardından kart sahiplerinin önceki
işlemleri kullanılarak yeni özellikler türetilmiş, mevcut özellikler ile birlikte yeni
türetilen özelliklere, özellik seçimi uygulanmıştır. Yapılan bu özellik türetimi ve seçimi,
kart kullanıcılarının ödeme alışkanlıklarının model tarafından daha iyi öğrenilmesini
sağlamıştır. Mevcut özellikler kullanılarak rastgele orman sınıflandırıcısı ile %86.21
başarı elde edilirken, özellik türetimi ve seçimi işlemleri sonucunda %88.24 başarı
elde edilmiştir.
Kredi kartı sahtekarlığı için kullanılan veri kümelerinin en önemli ortak problemi sahte
xiii
ve yasal işlemlerin aşırı dengesiz olmasıdır. Bu çalışmada, bu soruna çözüm olması
amacıyla GAN (Generative Adversarial Networks) ve SMOTE (Synthetic Minority
Oversampling Technique) yöntemleri kullanılarak sentetik sahte işlemler üretilmiştir.
Öncelikle, özellik türetme ve seçme işlemlerinden sonra elde edilen özelliklerin GAN’a
uygun hale getirilmesi amacıyla özkodlayıcı (autoencoder) model kullanılarak özellik
çıkarılmıştır. Veri kümesinde bulunan işlemler ile GAN modeli eğitilmiş, ardından
çeşitli sayı ve oranlarda sentetik sahte ve yasal işlemler üretilmiştir. GAN, CGAN,
WGAN ve CTGAN ile yapılan deneyler sonucunda en başarılı GAN modelinin CTGAN
olduğu tespit edilmiştir. CTGAN ile 50.000 adet sentetik veri üretildiğinde %88.75
sınıflandırma başarısı elde edilmiştir.
Kredi kartı sahtekarlığı tespiti yapmaya yönelik pek çok sistemde sahte işlem sayısının
yetersizliği en önemli problemdir. Bu nedenle sistem başarısı 500 adet sahte ve 2500
adet yasal işlemden oluşan veri kümesi ile de değerlendirilmiştir. Bu veri kümesi için
%80.59 olan sınıflandırma başarısı, 200 adet sentetik sahte işlem üretilerek mevcut
örneklere eklendiğinde %82.33’e yükselmiştir. Bu sonuç kredi kartı sahtekarlığı için
sentetik veri üretme işleminin sistem başarısını arttırdığını göstermektedir.