TWİTTERDA VERİ MADENCİLİĞİ YÖNTEMLERİN KULLANARAK BOT TESPİTİ
Anahtar Kelimeler:
bot, Twitter, veri madenciliği, karar ağacı, sinir ağları, lojistik regresyonÖzet
Twitter, günde 500 milyon tweet yayınlayan 319 milyon aylık aktif kullanıcıya sahip olan en popüler sosyal medya platformlarından biridir. Bu popülerlik Twitter'ı meşru kullanıcıları kimlik avı yapmak veya kötü amaçlı yazılımlar yaymak, tweet'lerde paylaşılan URL'leri kullanarak reklam vermek, meşru kullanıcıları takip etmek ve dikkatlerini çekmek, cinsel içerikli haberleri yaymak için trend olan konuları ele almak gibi nedenlerle Twitter'i kullanan spam göndericilerin dikkatini çekmektedir. Bu çalışmanın amacı, Twitter’da bot tespiti için kullanılan veri madenciliği yöntemlerinin en doğruluğu yüksek olanın belirtmektedir. Makalede, Twitter bot tespitinin özellikleri sunulmuştur. Ayrıca, literatürde sıkça kullanılan veri madenciliği yöntemleri: karar ağaçları, lojistik regresyon, Naive Bayes, Random forest sınıflandırma ve k Means kümeleme algoritmaların kullanarak Twitter’da bot tespiti yapılmaktadır. Hesap ve tweet üzerinden sınıflandırma doğruluğun yükseltmek için sınıflandırma algoritmaları ile SMOTE ve Resample teknikleri kullanmaktadır. Sonuç olarak kullanılan yöntemlerinin doğruluğu kategorize edilerek tartışılmıştır
İndir
Yayınlanmış
Nasıl Atıf Yapılır
Sayı
Bölüm
Lisans
Bu çalışma Creative Commons Attribution-NonCommercial 4.0 International License ile lisanslanmıştır.