TWİTTERDA VERİ MADENCİLİĞİ YÖNTEMLERİN KULLANARAK BOT TESPİTİ

Yazarlar

  • Alina AMANZHOLOVA Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı
  • İbrahim Alper DOĞRU Gazi Üniversitesi, Teknoloji Fakültesi, Bilgisayar Mühendisliği Bölümü
  • Aysun COŞKUN Gazi Üniversitesi, Teknoloji Fakültesi, Bilgisayar Mühendisliği Bölümü

Anahtar Kelimeler:

bot, Twitter, veri madenciliği, karar ağacı, sinir ağları, lojistik regresyon

Özet

Twitter, günde 500 milyon tweet yayınlayan 319 milyon aylık aktif kullanıcıya sahip olan en popüler sosyal medya platformlarından biridir. Bu popülerlik Twitter'ı meşru kullanıcıları kimlik avı yapmak veya kötü amaçlı yazılımlar yaymak, tweet'lerde paylaşılan URL'leri kullanarak reklam vermek, meşru kullanıcıları takip etmek ve dikkatlerini çekmek, cinsel içerikli haberleri yaymak için trend olan konuları ele almak gibi nedenlerle Twitter'i kullanan spam göndericilerin dikkatini çekmektedir. Bu çalışmanın amacı, Twitter’da bot tespiti için kullanılan veri madenciliği yöntemlerinin en doğruluğu yüksek olanın belirtmektedir. Makalede, Twitter bot tespitinin özellikleri sunulmuştur. Ayrıca, literatürde sıkça kullanılan veri madenciliği yöntemleri: karar ağaçları, lojistik regresyon, Naive Bayes, Random forest sınıflandırma ve k Means kümeleme algoritmaların kullanarak Twitter’da bot tespiti yapılmaktadır. Hesap ve tweet üzerinden sınıflandırma doğruluğun yükseltmek için sınıflandırma algoritmaları ile SMOTE ve Resample teknikleri kullanmaktadır. Sonuç olarak kullanılan yöntemlerinin doğruluğu kategorize edilerek tartışılmıştır

İndir

Yayınlanmış

2019-03-18

Nasıl Atıf Yapılır

AMANZHOLOVA, A., DOĞRU, İbrahim A., & COŞKUN, A. (2019). TWİTTERDA VERİ MADENCİLİĞİ YÖNTEMLERİN KULLANARAK BOT TESPİTİ. Journal on Mathematic, Engineering and Natural Sciences (EJONS), 3(11), 98–107. Erişim adresi: https://ejons.org/index.php/ejons/article/view/81