PENERAPAN SMOTE DAN CLUSTER-BASED UNDERSAMPLING TECHNIQUE DALAM KLASIFIKASI OPINI PUBLIK BERBASIS SUPPORT VECTOR MACHINE

Dina Zulfiana Matiyeni; Djihad Wungguli; Siti Nurmardia Abdussamad

doi:10.26618/n8cyqc26

Authors

Dina Zulfiana Matiyeni Universitas Negeri Gorontalo
Djihad Wungguli Universitas Negeri Gorontalo
Siti Nurmardia Abdussamad Universitas Negeri Gorontalo

DOI:

https://doi.org/10.26618/n8cyqc26

Keywords:

Analisis Sentimen, SVM, SMOTE, Cluster-Based Undeersampling , Imbalanced Data

Abstract

Tujuan: Penelitian ini bertujuan untuk menerapkan metode hybrid yang menggabungkan SMOTE dan Cluster-Based Undersampling Technique guna mengatasi ketidakseimbangan data dalam klasifikasi sentimen terhadap Rancangan Undang-Undang Perampasan Aset menggunakan Support Vector Machine (SVM).

Metode: Penelitian ini menggunakan pendekatan kuantitatif dengan rancangan eksperimental komparatif. Data dikumpulkan dari media sosial X terkait Rancangan Undang-Undang Perampasan Aset, dilanjutkan dengan preprocessing, pelabelan, ekstraksi fitur, serta pemisahan data latih dan data uji. Ketidakseimbangan data diatasi dengan menggabungkan metode SMOTE dan Cluster-Based Undersampling Technique pada data latih. Selanjutnya, klasifikasi sentimen dilakukan menggunakan Support Vector Machine (SVM).

Hasil: Hasil penelitian menunjukkan bahwa model SVM tanpa penyeimbangan data menghasilkan akurasi 70,10%, presisi 62%, recall 46%, dan F1-score 47%, dengan recall kelas negatif yang sangat rendah sebesar 8%. Setelah penerapan metode resampling hybrid SMOTE dan Cluster-Based Undersampling Technique, performa model meningkat signifikan dengan akurasi 82%, presisi 84%, recall 82%, dan F1-score 82%, yang mengindikasikan bahwa metode hybrid mampu mengatasi dominasi kelas mayoritas dan meningkatkan sensitivitas model secara merata pada seluruh kelas sentimen.

Simpulan: Temuan penelitian ini mengindikasikan bahwa penerapan metode SMOTE dan Cluster-Based Undersampling Technique berkontribusi signifikan dalam meningkatkan keadilan prediksi model SVM pada data yang tidak seimbang. Oleh karena itu, kombinasi kedua metode tersebut dapat dijadikan solusi yang efektif dalam pengembangan sistem klasifikasi sentimen opini publik, khususnya pada kasus dengan distribusi kelas yang tidak proporsional.

Author Biographies

Dina Zulfiana Matiyeni, Universitas Negeri Gorontalo

Matematika
Djihad Wungguli, Universitas Negeri Gorontalo

Matematika
Siti Nurmardia Abdussamad, Universitas Negeri Gorontalo

Matematika

References

Bach, M., Trofimiak, P., Kostrzewa, D., & Werner, A. (2023). CLEANSE—Cluster-based undersampling method. Procedia Computer Science, 225, 4541–4550. https://doi.org/10.1016/j.procs.2023.10.452

Fajriyah, N., Lapatta, N. T., Nugraha, D. W., & Laila, R. (2025). Implementasi SVM dan SMOTE pada analisis sentimen media sosial X terhadap pelantikan Agus Harimurti Yudhoyono. JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), 10(2), 1359–1370. https://doi.org/10.29100/jipi.v10i2.6246

Fred, A. (Ed.). (2016). IC3K 2015: Proceedings of the 7th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management (Vol. 3, KMIS): Lisbon, Portugal, November 12–14, 2015. SCITEPRESS - Science and Technology Publications.

Handayani, A., & Zufria, I. (2023). Analisis sentimen terhadap bakal capres RI 2024 di Twitter menggunakan algoritma SVM. Journal of Information System Research (JOSH), 5(1), 53–63. https://doi.org/10.47065/josh.v5i1.4379

Indra, M., Arsya, H., Akbari, D., Novianty, A., & Setianingsih, C. (n.d.). Analisis sentimen menggunakan metode learning vector quantization.

Indrawati, A. (2021). Penerapan teknik kombinasi oversampling dan undersampling untuk mengatasi permasalahan imbalanced dataset. Jurnal Informatika dan Komputer, 4(1). https://doi.org/10.33387/jiko

Larassetya, T. D., Suryasuciramdhan, A., Salsa, N. U., & Aeni, I. S. (2024). Analisis opini publik terhadap Pemilu 2024 pada media sosial X. TUTURAN: Jurnal Ilmu Komunikasi, Sosial dan Humaniora, 2(2), 292–301. https://doi.org/10.47861/tuturan.v2i2.994

Mujilahwati, S. (2016). Pre-processing text mining pada data Twitter. Dalam Prosiding Seminar Nasional Teknologi Informasi dan Komunikasi.

Mustaqim, E. R. N., Pagalay, U., & Crysdian, C. (n.d.). Prediksi tingkat kepercayaan masyarakat terhadap Pilpres 2024 menggunakan TF-IDF dan BoW menggunakan metode SVM.

Ningsih, W., Alfianda, B., Rahmaddeni, R., & Wulandari, D. (2024). Perbandingan algoritma SVM dan Naïve Bayes dalam analisis sentimen Twitter pada penggunaan mobil listrik di Indonesia. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 4(2), 556–562. https://doi.org/10.57152/malcom.v4i2.1253

Pritama, F., Leluni, E. R. D., Parhusip, J., & Universitas Palangka Raya. (2024). Analisis distribusi kinerja SVM dan KNN berdasarkan rata-rata simpangan baku dan stabilitas. Jurnal Ilmiah Informatika dan Komputer, 1(2), 170–174.

Putra, K. T. (2023). Analisis feature extraction pada text processing untuk analisis sentimen.

Rahman Fauzan, M., Oktafia Lingga Wijaya, H., & Karman, J. (2023). Analisis sentimen masyarakat terhadap kenaikan harga BBM di media sosial Twitter menggunakan metode support vector machine. Dalam Seminar Riset Mahasiswa-Computer & Electrical (SERIMA-CE), 1(1).

Salehi, A. R., & Khedmati, M. (2024). A cluster-based SMOTE both-sampling (CSBBoost) ensemble algorithm for classifying imbalanced data. Scientific Reports, 14(1). https://doi.org/10.1038/s41598-024-55598-1

Sondriva, W., Kurniawati, Y., Amalita, N., & Salma, A. (2024). Penanganan ketidakseimbangan multikelas pada dataset survei kerangka sampel area menggunakan metode SCUT. UNP Journal of Statistics and Data Science, 2(2), 159–164. https://doi.org/10.24036/ujsds/vol2-iss2/163

PENERAPAN SMOTE DAN CLUSTER-BASED UNDERSAMPLING TECHNIQUE DALAM KLASIFIKASI OPINI PUBLIK BERBASIS SUPPORT VECTOR MACHINE

Authors

DOI:

Keywords:

Abstract

Author Biographies

References

Downloads

Published

Issue

Section

License

sertifikat sigma

Quick Menu

template 1

recommended tool 1

visitor 1

Information

Latest publications