Topic Modelling Latent Dirichlet Allocation untuk Klasifikasi Komentar pada Layanan Streaming Platform
DOI:
https://doi.org/10.23887/jstundiksha.v12i3.68492Keywords:
Latent Dirichlet Allocation, Klasifikasi Komentar, Streaming PlatformAbstract
Seiring dengan berkembangnya teknologi, memunculkan banyak platform online untuk streaming film. Streaming platform banyak digunakan masyarakat seperti netflix, disney+, hbo go, we tv, vidio. Banyaknya perbandingan antar streaming platform menjadi perbincangan dimedia sosial yaitu twitter. Opini yang disampaikan pengguna streaming platform berisi komentar positif dan komentar negatif yang mempengaruhi pengguna lainnya yang ingin menonton film. Penelitian ini dilakukan untuk mengkaji perbandingan antara komentar positif dan komentar negatif pengguna streaming platform pada media sosial Twitter. Metode Latent dirichlet allocation dapat digunakan sebagai topic modelling dan Support Vector Machine untuk klasifikasi. Pada tahapan pengambilan data dengan menggunakan tools framework scrapy dengan python, data diambil sebanyak 5.000 dan dilakukan preprocessing text. Metode LDA dapat mempresentasikan topik dan dokumen serta klasifikasi menggunakan Support Vector Machine (SVM) mendapatkan hasil komentar positif lebih banyak dari pada komentar negatif. Hasil evaluasi preforma didapatkan nilai akurasi 0,88, recall 0,88, F1score 0,87, precision 0,88. Topic Modelling Latent Dirichlet Allocation (LDA) untuk Klasifikasi Komentar pada Layanan Streaming Platform dengan menggunakan 5,000 data diambil dari sosial media yaitu twitter yang terbagi menjadi komentar positif dan komentar negatif. Hasil ini dipengaruhi dari jumlah komentar positif yang lebih dominan dari pada komentar negatif. Implikasi dari penelitian ini adalah pentingnya memperhatikan keseimbangan data dalam melakukan klasifikasi komentar pada platform streaming agar hasil prediksi klasifikasi dapat lebih akurat.
References
Anggraeni, S. (2019). Pengaruh Pengetahuan Tentang Dampak Gadget Pada Kesehatan Terhadap Perilaku Penggunaan Gadget Pada Siswa SDN Kebun Bunga 6 Banjarmasin. Faletehan Health Journal, 6(2), 64–68. https://doi.org/10.33746/fhj.v6i2.68.
Annisa, R., & Surjandari, I. (2019). Opinion Mining on Mandalika Hotel Reviews Using Latent Dirichlet Allocation. Procedia Computer Science, 161, 739–746. https://doi.org/10.1016/j.procs.2019.11.178.
Anshari, I. N. (2019). Sirkulasi Film dan Program Televisi di Era Digital: Studi Kasus Praktik Download dan Streaming melalui Situs Bajakan. Komuniti: Jurnal Komunikasi Dan Teknologi Informasi, 10(2), 88–102. https://doi.org/10.23917/komuniti.v10i2.7125.
Bustami, D. K., & Noviaristanti, S. (2022). Service Quality Analysis of Tokopedia Application Using Text Mining Method. International Journal of Management, Finance and Accounting, 3(1), 1–21. https://doi.org/10.33093/ijomfa.2022.3.1.1.
Çallı, L., & Çallı, F. (2023). Understanding airline passengers during covid-19 outbreak to improve service quality: topic modeling approach to complaints with latent dirichlet allocation algorithm. Transportation Research Record, 2677(4), 656–673. https://doi.org/10.1177/03611981221112096.
Farsiah, L., Misbullah, A., & Husaini, H. (2022). Analisis Sentimen Menggunakan Arsitektur Long Short-Term Memory (Lstm) Terhadap Fenomena Citayam Fashion Week. Cyberspace: Jurnal Pendidikan Teknologi Informasi, 6(2), 86–94. https://doi.org/10.22373/cj.v6i2.14687.
Ferdiana, R., Jatmiko, F., Purwanti, D. D., Ayu, A. S. T., & Dicka, W. F. (2019). Dataset Indonesia untuk Analisis Sentimen. Jurnal Nasional Teknik Elektro Dan Teknologi Informasi (JNTETI), 8(4), 334–339. https://journal.ugm.ac.id/v3/JNTETI/article/view/2558.
Firdaus, M. R., Rizki, F. M., Gaus, F. M., & Susanto, I. K. (2020). Analisis sentimen dan topic modelling dalam aplikasi ruangguru. J-SAKTI (Jurnal Sains Komputer Dan Informatika), 4(1), 66–76. https://doi.org/10.30645/j-sakti.v4i1.188.
Gifari, O. I., Adha, M., Hendrawan, I. R., & Durrand, F. F. S. (2022). Analisis Sentimen Review Film Menggunakan TF-IDF dan Support Vector Machine. Journal of Information Technology, 2(1), 36–40. https://doi.org/10.46229/jifotech.v2i1.330.
Hafidz, N., & Liliana, D. Y. (2021). Klasifikasi Sentimen pada Twitter Terhadap WHO Terkait Covid-19 Menggunakan SVM, N-Gram, PSO. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(2), 213–219. https://doi.org/10.29207/resti.v5i2.2960.
Hermanto, H., Mustopa, A., & Kuntoro, A. Y. (2020). Algoritma klasifikasi naive bayes dan support vector machine dalam layanan komplain mahasiswa. JITK (Jurnal Ilmu Pengetahuan Dan Teknologi Komputer), 5(2), 211–220. https://doi.org/10.33480/jitk.v5i2.1181.
Hua, T., Lu, C. T., Choo, J., & Reddy, C. K. (2020). Probabilistic topic modeling for comparative analysis of document collections. ACM Transactions on Knowledge Discovery from Data (TKDD), 14(2), 1–27. https://doi.org/10.1145/3369873.
Imron, R. (2018). Hubungan Penggunaan Gadget dengan Perkembangan Sosial dan Emosional Anak Prasekolah di Kabupaten Lampung Selatan. Jurnal Ilmiah Keperawatan Sai Betik, 13(2), 148–154. https://doi.org/10.26630/jkep.v13i2.922.
Indrayuni, E. (2019). Klasifikasi Text Mining Review Produk Kosmetik Untuk Teks Bahasa Indonesia Menggunakan Algoritma Naive Bayes. Jurnal Khatulistiwa Informatika, 7(1), 29–36. https://doi.org/10.31294/jki.v7i1.5740.g3245.
Jia, S. (2019). Toward a better fitness club: Evidence from exerciser online rating and review using latent Dirichlet allocation and support vector machine. International Journal of Market Research, 61(1), 64–76. https://doi.org/10.1177/1470785318770571.
Khomsah, S. (2021). Sentiment Analysis On YouTube Comments Using Word2Vec and Random Forest. Telematika: Jurnal Informatika Dan Teknologi Informasi, 18(1), 61–72. https://doi.org/10.31315/telematika.v18i1.4493.g3346.
Kurnia, P., & Mella, N. F. (2018). Opini Audit Going Concern: Kajian Berdasarkan Kualitas Audit, Kondisi Keuangan, Audit Tenure, Ukuran Perusahaan, Pertumbuhan Perusahaan dan Opini Audit Tahun Sebelumnya pada Perusahaan yang Mengalami Financial Distress pada Perusahaan Manufaktur (Studi pa. Jurnal Riset Akuntansi Dan Keuangan, 6(1), 105–122. https://doi.org/10.17509/jrak.v6i1.8937.
Kusairi, M. M., & Agustian, S. (2022). SVM Method with FastText Representation Feature for Classification of Twitter Sentiments Regarding the Covid-19 Vaccination Program. Digital Zone: Jurnal Teknologi Informasi Dan Komunikasi, 13(2), 140–150. https://doi.org/10.31849/digitalzone.v13i2.11531.
Manullang, O., Prianto, C., & Harani, N. H. (2023). Analisis Sentimen Untuk Memprediksi Hasil Calon Pemilu Presiden Menggunakan Lexicon Based dan Random Forest. Jurnal Ilmiah Dan Informatika, 11(2), 159–169. https://doi.org/10.33884/jif.v11i02.7987.
Min, K. B., Song, S. H., & Min, J. Y. (2020). Topic modeling of social networking service data on occupational accidents in Korea: latent dirichlet allocation analysis. Journal of Medical Internet Research, 22(8), 1–12. https://doi.org/10.2196/19222.
Minerva, L., Sumeisey, V. S., Stefani, S., Wijaya, S., & Lim, C. A. (2020). Pengaruh Kualitas Audit, Debt Ratio, Ukuran Perusahaan dan Audit Lag terhadap Opini Audit Going Concern. Owner: Riset Dan Jurnal Akuntansi, 4(1), 254–266. https://doi.org/10.33395/owner.v4i1.180.
Musliadi, K. H., Zainuddin, H., & Wabula, Y. (2022). Twitter Social Media Conversion Topic Trending Analysis Using Latent Dirichlet Allocation Algorithm. Journal of Applied Engineering and Technological Science (JAETS), 4(1), 390–399. https://doi.org/10.37385/jaets.v4i1.1143.
Negara, E. S., & Triadi, D. (2021). Topic modeling using latent dirichlet allocation (LDA) on twitter data with Indonesia keyword. Bulletin of Social Informatics Theory and Application, 5(2), 124–132. https://doi.org/10.31763/businta.v5i2.455.
Nurmawati, E., & Amanda, A. (2023). Analisis Sentimen dan Pemodelan Topik Pada Tweet Terkait Data Badan Pusat Statistik. Jurnal Sistem Informasi Dan Informatika (Simika), 6(2), 165–176. https://doi.org/10.47080/simika.v6i2.2789.
Putranti, N. D., & Winarko, E. (2014). Analisis Sentimen Twitter untuk Teks Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 8(1), 91–100. https://doi.org/10.22146/ijccs.3499.
Putri, A. J., Syafira, A. S., Purbaya, M. E., & Purnomo, D. (2022). Analisis Sentimen E-Commerce Lazada pada Jejaring Sosial Twitter Menggunakan Algoritma Support Vector Machine. Jurnal TRINISTIK: Jurnal Teknik Industri, Bisnis Digital, Dan Teknik Logistik, 1(1), 16–21. https://doi.org/10.20895/trinistik.v1i1.447.
Putri, I. R., & Kusumaningrum, R. (2017). Latent Dirichlet Allocation (LDA) for Sentiment Analysis Toward Tourism Review in Indonesia. Journal of Physics: Conference Series, 801(1). https://doi.org/10.1088/1742-6596/801/1/012073.
Ramadhan, N. G., & Ramadhan, T. I. (2022). Analysis Sentiment Based on IMDB Aspects from Movie Reviews using SVM. Sinkron: Jurnal Dan Penelitian Teknik Informatika, 7(1), 39–45. https://doi.org/10.33395/sinkron.v7i1.11204.
Roiqoh, S., Zaman, B., & Kartono, K. (2023). Analisis Sentimen Berbasis Aspek Ulasan Aplikasi Mobile JKN dengan Lexicon Based dan Naïve Bayes. Jurnal Media Informatika Budidarma, 7(3), 1582–1592. https://doi.org/10.30865/mib.v7i3.6194.
Royyan, A. R., & Setiawan, E. B. (2022). Feature Expansion Word2Vec for Sentiment Analysis of Public Policy in Twitter. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 6(1), 78–84. https://doi.org/10.29207/resti.v6i1.3525.
Santoso, K. R. A. P., Husna, A., Putri, N. W., & Rakhmawati, N. A. (2022). Analisis Topik Tagar Covidindonesia pada Instagram Menggunakan Latent Dirichlet Allocation. JISKA (Jurnal Informatika Sunan Kalijaga), 7(1), 1–9. https://doi.org/10.14421/jiska.2022.7.1.1-9.
Shidqi, F., & Febrianta, M. Y. (2023). Analisis Kualitas Layanan Internet Service Provider Menggunakan Metode Analisis Sentimen Dan Topic Modelling. SEIKO : Journal of Management & Business, 6(2), 439–450. https://doi.org/10.37531/sejaman.v6i2.5305.
Singgalen, Y. A. (2021). Analisis Sentimen dan Pemodelan Topik dalam Optimalisasi Pemasaran Destinasi Pariwisata Prioritas di Indonesia. Journal of Information Systems and Informatics, 3(3), 459–470. https://doi.org/10.51519/journalisi.v3i3.171.
Sutherland, I., Sim, Y., Lee, S. K., Byun, J., & Kiatkawsin, K. (2020). Topic Modeling of Online Accommodation Reviews via Latent Dirichlet Allocation. Sustainability, 12(5), 1821. https://doi.org/10.3390/su12051821.
Vulić, I., De Smet, W., Tang, J., & Moens, M. F. (2015). Probabilistic topic modeling in multilingual settings: An overview of its methodology and applications. Information Processing & Management, 55(4), 77–84. https://doi.org/10.1016/j.ipm.2014.08.003.
Wibowo, T. O. (2018). Fenomena website streaming film di era media baru: Godaan, perselisihan, dan kritik. Jurnal Kajian Komunikasi, 6(2), 191–203. https://doi.org/10.24198/jkk.v6i2.15623.
Widodo, A. O., Septiadi, F., & Rakhmawati, N. A. (2023). Analisis Tren Konten Pada Vtuber Indonesia Menggunakan Latent Dirichlet Allocation. Jurnal Informatika Dan Rekayasa Elektronik, 6(1), 56–63. https://doi.org/10.36595/jire.v6i1.718.
Xu, H., Zhang, M., Zeng, J., Hao, H., Lin, H. C. K., & Xiao, M. (2022). Use of Latent Dirichlet Allocation and Structural Equation Modeling in Determining the Factors for Continuance Intention of Knowledge Payment Platform. Sustainability (Switzerland), 14(15), 8992. https://doi.org/10.3390/su14158992.
Xue, J., Chen, J., Chen, C., Zheng, C., Li, S., & Zhu, T. (2020). Public discourse and sentiment during the COVID 19 pandemic: Using latent dirichlet allocation for topic modeling on twitter. PLoS ONE, 15(9 September), 1–12. https://doi.org/10.1371/journal.pone.0239441.
Zou, Y., Luh, D. B., & Lu, S. (2022). Public perceptions of digital fashion: An analysis of sentiment and Latent Dirichlet Allocation topic modeling. Frontiers in Psychology, 13(December), 1–21. https://doi.org/10.3389/fpsyg.2022.986838.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Noorhanida Royani, Catur Edi Widodo, Budi Warsito
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Authors who publish with the Jurnal Sains dan Teknologi (JST) agree to the following terms:
- Authors retain copyright and grant the journal the right of first publication with the work simultaneously licensed under a Creative Commons Attribution License (CC BY-SA 4.0) that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work. (See The Effect of Open Access)