Klasifikasi Akun Bot dan Human di Twitter dalam Domain Crypto Menggunakan Algoritma Machine Learning
Abstract
Mata uang kripto telah mengalami peningkatan signifikan dalam dekade terakhir, dengan Twitter menjadi platform utama komunikasi antara penerbit aset dan investor. Namun, prevalensi bot otomatis yang terlibat dalam manipulasi pasar menimbulkan risiko bagi investor. Penelitian ini bertujuan mengembangkan model machine learning untuk mengklasifikasikan akun bot dan human di Twitter dalam domain cryptocurrency. Dataset dikumpulkan dari 10 akun Twitter (5 human expert dan 5 AI agents) dengan total 19.798 tweet setelah deduplikasi. Metodologi meliputi preprocessing modular, ekstraksi 15 fitur linguistik dan metrik interaksi, serta implementasi arsitektur hybrid CNN-LSTM dengan dynamic thresholding. Hasil menunjukkan bahwa model XGBoost dengan fitur lengkap mencapai akurasi tertinggi 97.22% dan F1-score 0.9722, sementara CNN-LSTM mencapai F1-score 91.59% pada konfigurasi linguistik. Fitur seperti capital_token_ratio, punctuation_ratio terbukti menjadi indikator kuat pembeda bot dan human. Penelitian ini berkontribusi pada pengembangan sistem deteksi bot yang dapat membantu investor mengidentifikasi manipulasi pasar dalam ekosistem cryptocurrency.
