Stemming Teks Bahasa Bali dengan Algoritma Enhanced Confix Stripping
DOI:
https://doi.org/10.23887/ijnse.v4i3.30309Keywords:
Bahasa Bali, Stemming, Enhanced Confix Stripping StemmerAbstract
Masih banyak yang mengalami permasalahan saat melakukan stemming dimana belum mampu melakukan stemming dengan tepat pada beberapa kata untuk aturan peluluhan prefix P3, P4, P5, P10, P11, dan P12. Tujuan penelitian ini adalah untuk mengkaji efektivitas algoritma Enhanced Confix Stripping Stemmer (ECS) terhadap stemming Bahasa Bali. Data yang digunakan dalam penelitian ini adalah 376 akar kata dalam bahasa Bali yang terdiri dari 240 kata yang mengandung prefiks, 17 akar kata yang mengandung infiks dan 199 akar kata yang mengandung sufix. Hasil penelitian ini menunjukkan bahwa Enhanced Confix Stripping dapat meningkatkan performansi yang sebelumnya memiliki akurasi. dari hanya 77,82% menjadi 96,94% dengan tingkat kesalahan 3,06% dan memperbaiki kesalahan yang semula berjumlah 120 sampai 20 kesalahan. Berdasarkan hasil penelitian, dapat ditarik simpulan bahwa algoritma ECS Stemmer dapat memperbaiki kesalahan yang dilakukan oleh metoda Rule Based Approach
References
Agus, M., Subali, P., & Fatichah, C. (2019). Kombinasi Metode Rule-Based Dan N-Gram Stemming Untuk a Combination of Methods Rule-Based and N-Gram Stemming To Recognize Balinese Language Stemmer. Jurnal Teknologi Informasi Dan Ilmu Komputer (JTIIK), 6(2). https://doi.org/10.25126/jtiik.201961105 DOI: https://doi.org/10.25126/jtiik.2019621105
Amin, F., & Razaq, J. A. (2018). Implementasi Stemmer Bahasa Jawa dengan Metode Rule Base Approach pada Sistem Temu Kembali Informasi Dokumen Teks Berhasa Jawa. 978–979.
Arifin, A. Z., & Ciptaningtyas, H. T. (2009). Enhanced Confix Stripping Stemmer and Ants Algorithm for Classifying News Document in Indonesian Language.
Bawa, I. W., & Jendra, I. W. (1981). Struktur Bahasa Bali. Pusat Pembinaan dan Pengembangan Bahasa.
Fadziah, Y. N., & R, E. F. (2018). Penerapan Algoritma Enchanced Confix Stripping dalam Pengukuran Keterbacaan Teks Menggunakan Gunning Fog Index. 1(1), 15–24.
Fallis, A. . (2013). Peran Bahasa Indonesia dan Bahasa Daerah Dalam Pendidikan Karakter. Journal of Chemical Information and Modeling, 53(9), 1689–1699. https://doi.org/10.1017/CBO9781107415324.004 DOI: https://doi.org/10.1017/CBO9781107415324.004
Gede, P., Cipta, S., & Wardani, N. W. (2020). Stemming Dokumen Teks Bahasa Bali Dengan Metode Rule Base Approach. Jurnal Teknik Informatika Dan Sistem Informasi, 7(3), 510–521. https://doi.org/https://doi.org/10.35957/jatisi.v7i3.538 DOI: https://doi.org/10.35957/jatisi.v7i3.538
Guterres, A., & Santoso, J. (2019). Stemming Bahasa Tetun Menggunakan Pendekatan Rule Based. 8(November), 142–147. https://doi.org/10.34148/teknika.v8i2.224 DOI: https://doi.org/10.34148/teknika.v8i2.224
Hidayatullah, N., Aji Prasetya Wibawa, & Harits Ar Rosyid. (2019). Penerapan ECS Stemmer untuk Modifikasi Nazief & Adriani Berbahasa Jawa. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3(3), 343–348. https://doi.org/10.29207/resti.v3i3.994 DOI: https://doi.org/10.29207/resti.v3i3.994
Maulidi, R. (2016). Stemmer untuk Bahasa Madura dengan Modifikasi Metode Enhanced Confix Stripping Stemmer. December.
Nata, G. N. M., & Yudiastra, P. P. (2017). Stemming teks sor-singgih Bahasa Bali. E-Proceedings KNS&I STIKOM Bali, 608–612. http://knsi.stikom-bali.ac.id/index.php/eproceedings/article/view/111
Pramudita, Y. D., Putro, S. S., & Makhmud, N. (2018). Klasifikasi Berita Olahraga Menggunakan Metode Naïve Bayes dengan Enhanced Confix Stripping Stemmer. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(3), 269. https://doi.org/10.25126/jtiik.201853810 DOI: https://doi.org/10.25126/jtiik.201853810
Rahmat, & Mansyur, U. (2020). Pengaruh Bahasa Daerah Terhadap Pola Komunikasi Mahasiswa Fakultas Sastra Universitas Muslim Indonesia. Jurnal Pembelajaran Bahasa Dan Sastra Indonesia Berada, 1(3), 156–160. https://ojs.unm.ac.id/Indonesia/article/view/15189/pdf DOI: https://doi.org/10.26858/indonesia.v1i3.15189
Riani. (2012). Permasalahan dalam Perencanaan Bahasa pada Mayarakat Multikultur. Madah, 3(2), 133–140. https://doi.org/https://doi.org/10.31503/madah.v32. DOI: https://doi.org/10.31503/madah.v3i2.575
Rizki, A. S., Tjahyanto, A., & Trialih, R. (2019). Comparison of stemming algorithms on Indonesian text processing. Telkomnika (Telecommunication Computing Electronics and Control), 17(1), 95–102. https://doi.org/10.12928/TELKOMNIKA.v17i1.10183 DOI: https://doi.org/10.12928/telkomnika.v17i1.10183
Simarangkir, M. S. H. (2017). Studi Perbandingan Algoritma - Algoritma Stemming Untuk Dokumen Teks Berbahasa Indonesia. Jurnal Inkofar, 1(1), 41–47. DOI: https://doi.org/10.46846/jurnalinkofar.v1i1.2
Tahitoe, A. D., & Purwitasari, D. (2010). Implementasi Modifikasi Enhanced Confix Stripping Stemmer Untuk Bahasa Indonesia Dengan Metode Corpus Based Stemming. Jurnal Ilmiah, 1–15. http://digilib.its.ac.id/public/ITS-Undergraduate-14255-paperpdf.pdf
Wirayasa, I. P. M., Wirawan, I. M. A., & Pradnyana, I. M. A. (2019). Algoritma Bastal: Adaptasi Algoritma Nazief & Adriani untuk Stemming Teks Bahasa Bali. JANAPATI, 8, 60–69. DOI: https://doi.org/10.23887/janapati.v8i1.13500