Perbandingan Kinerja IndoBERT dan TF-IDF pada Analisis Sentimen Ulasan Aplikasi ChatGPT

M.Fathur Rochim

Abstrak

Analisis sentimen pada ulasan aplikasi merupakan mekanisme krusial bagi pengembang untuk memahami umpan balik pengguna. Namun, data ulasan aplikasi seringkali bersifat imbalanced, di mana ulasan dengan sentimen "Netral" atau "Campuran" menjadi minoritas dibandingkan sentimen ekstrem. Hal ini menyebabkan metode klasifikasi tradisional seperti Term Frequency-Inverse Document Frequency (TF-IDF) kesulitan dalam menangkap nuansa kontekstual pada kalimat yang kompleks. Penelitian ini bertujuan untuk membandingkan kinerja model Deep Learning berbasis Transformer, yakni IndoBERT, dengan metode TF-IDF dalam melakukan klasifikasi sentimen ulasan ChatGPT pada platform Google Play Store. Fokus utama penelitian ini adalah menangani masalah ketimpangan data melalui teknik pra-pemrosesan lanjutan seperti anotasi hibrida (hybrid annotation) dan metode penyeimbangan data (resampling). Hasil penelitian diharapkan dapat menunjukkan bahwa penggunaan IndoBERT dengan teknik penyeimbangan data mampu memberikan akurasi yang lebih tinggi dalam mendeteksi sentimen netral dibandingkan dengan pendekatan TF-IDF konvensional, serta memberikan pemahaman yang lebih dalam mengenai pola kepuasan pengguna terhadap aplikasi ChatGPT.

Kata Kunci

Analisis Sentimen ChatGPT IndoBERT TF-IDF Imbalanced Dataset, Ulasan

Referensi

Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics.
IndoBenchmark. (2020). IndoBERT: Pre-trained Language Model for Indonesian. (Diakses melalui Hugging Face Model Hub: indobenchmark/indobert-base-p1).
Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press. (Referensi dasar untuk TF-IDF).
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., & Duchesnay, E. (2011). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research.
Rangkuti, F. (2015). Analisis SWOT: Teknik Membedah Kasus Bisnis. Gramedia Pustaka Utama. (Referensi pendukung untuk analisis sentimen praktis).
Raschka, S., & Mirjalili, V. (2019). Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow. Packt Publishing.
Sastrawi. (2017). Sastrawi: Python Library for Indonesian Language Preprocessing. (Tersedia di: https://github.com/sastrawi/sastrawi).
Wolf, T., Debut, L., Sanh, V., Chaumond, J., Delangue, C., Moi, A., Cistac, P., Rault, T., Louf, R., Funtowicz, M., Davison, J., Shleifer, S., von Platen, P., Ma, C., Jernite, Y., Plu, J., Xu, C., Le Scao, T., Gugger, S., ... & Rush, A. M. (2020).
Transformers: State-of-the-art Natural Language Processing. Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations.

Cara Mengutip

Perbandingan Kinerja IndoBERT dan TF-IDF pada Analisis Sentimen Ulasan Aplikasi ChatGPT. (2026). EPISTEMEUS, 1(1). https://epistemeus.org/index.php/epistemeus/article/view/19