Implementasi Naïve Bayes Pada Data Mining Untuk Mengklasifikasikan Penjualan Barang Terlaris Pada Perusahaan Ritel
DOI:
https://doi.org/10.23887/jstundiksha.v12i3.38605Keywords:
data mining, Naïve Bayes, ritel, klasifikasiAbstract
Perusahaan ritel UD. Mawar Sari memiliki hingga 1,000,541 record data transaksi penjualan pada tahun 2019–2020 yang selama ini belum dipergunakan dengan baik. Data tersebut membutuhkan banyak ruang penyimpanan. Data tersebut juga belum dipergunakan secara efektif untuk tujuan apapun. Berdasarkan permasalahan tersebut, maka penelitian ini bertujuan untuk melakukan klasifikasi terhadap data transaksi penjualan untuk menemukan klasifikasi barang terlaris dengan data mining. Penelitian ini merupakan penelitian studi kasus yang menggunakan pendekatan penelitian kuantitatif. Metode yang digunakan adalah Naïve Bayes. Implementasi penelitian ini menggunakan Rapidminer 9.0. Hasil penelitian dari klasifikasi data transaksi penjualan adalah klasifikasi produk yang laris dan tidak laris. Peneliti melakukan pengujian dengan 6043 data training dan hasil dari split validation terbaik pada split validation 0,7 dengan accuracy sebesar 93,82%. Hasil penelitian ini dapat digunakan dan berimplikasi baik untuk manajemen UD. Mawar Sari dalam pengambilan keputusan untuk menentukan suatu produk setelah mendapatkan hasil perhitungan data mining menggunakan metode Naïve Bayes.
References
Al Zukri, P., Widyaningrum, S. N., & Aini, Q. (2020). Forecasting permintaan pompa air dangkal shimizu menggunakan metode time series. Sistemasi: Jurnal Sistem Informasi, 9(2), 226–234. https://doi.org/10.32520/stmsi.v9i2.694.
Apriliah, W., Kurniawan, I., Baydhowi, M., & Haryati, T. (2021). Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest. Sistemasi: Jurnal Sistem Informasi, 10(1), 163–171. https://doi.org/10.32520/stmsi.v10i1.1129.
Apriyani, P., Dikananda, A. R., & Ali, I. (2023). Penerapan Algoritma K-Means dalam Klasterisasi Kasus Stunting Balita Desa Tegalwangi. Hello World Jurnal Ilmu Komputer, 2(1), 20–33. https://doi.org/10.56211/helloworld.v2i1.230.
Aulia, W. (2018). Sistem Pakar Diagnosa Penyakit Jantung Koroner Dengan Metode Probabilistic Fuzzy Decision Tree. Jurnal Sains Dan Informatika, 4(2), 106–106. https://doi.org/10.22216/jsi.v4i2.3258.
Azhari, M., Situmorang, Z., & Rosnelly, R. (2021). Perbandingan Akurasi, Recall, dan Presisi Klasifikasi pada Algoritma C4.5, Random Forest, SVM dan Naive Bayes. Jurnal Media Informatika Budidarma, 5(2), 640–651. https://doi.org/10.30865/mib.v5i2.2937.
Bimantara, B., & Safii, M. (2021). Penerapan Data Mining Menentukan Kelayakan Penjualan Kendaraan Bekas Roda Dua Dengan Menggunakan Metode Bayesian Classifier. In Seminar Nasional Informatika (SENATIKA (pp. 67–77).
Burhanudin, M., Y., & Wihardi, Y. (2018). Klasifikasi Komentar Spam Pada Youtube Menggunakan Metode Naïve Bayes, Support Vector Machine, Dan K-Nearest Neighbors. Jurnal Informatika Dan Komputer, 3(2), 54–59. https://doi.org/10.26798/jiko.v3i2.139.
Cholil, W., Dalimunthi, A. R., & Atika, L. (2019). Model Data Mining Dalam Mengidentifikasi Pola Laju Pertumbuhan Antar Sektor Ekonomi di Provinsi Sumatera Selatan dan Bangka Belitung. Teknika, 8(2), 103–109. https://doi.org/10.34148/teknika.v8i2.181.
Darmansah, D. D., & Wardani, N. W. (2021). Analisis Pesebaran Penularan Virus Corona di Provinsi Jawa Tengah Menggunakan Metode K-Means Clustering. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi, 8(1), 105–117. https://doi.org/10.35957/jatisi.v8i1.590.
Darmansah, D., & Wardani, N. W. (2020). Analisa Penyebab Kerusakan Tanaman Cabai Menggunakan Metode K-Means. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 7(2), 126–134. https://doi.org/10.35957/jatisi.v7i2.309.
Dewanti, M., Muchbarak, A., & Widiyatun, F. (2021). Sistem Pakar Penentuan Menu Diet Bagi Penderita Diabetes Mellitus. JRKT (Jurnal Rekayasa Komputasi Terapan), 1(2). https://doi.org/10.30998/jrkt.v1i02.4092.
Exenberger, E., & Bucko, J. (2020). Analysis of Online Consumer Behavior—Design of CRISP-DM Process Model. Agris On-Line Papers in Economics and Informatics, 12(3), 13–22. https://doi.org/10.7160/aol.2020.120302.
Faisal, S., & Tutz, G. (2021). Multiple imputation using nearest neighbor methods. Information Sciences, 570, 500–516. https://doi.org/10.1016/j.ins.2021.04.009.
Feblian, D., & Daihani, D. U. (2016). Implementasi Model CRISP-DM Untuk Menentukan Sales Pipeline pada PT X. Jurnal Teknik Industri, 6(1), 1–12. https://e-journal.trisakti.ac.id/index.php/tekin/article/view/1526/1316.
Fibrianda, M. F., & Bhawiyuga, A. (2018). Analisis Perbandingan Akurasi Deteksi Serangan Pada Jaringan Komputer Dengan Metode Naïve Bayes Dan Support Vector Machine (SVM. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(9), 3112–3123. https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/2559.
Firmansyah, F., & Yulianto, A. (2021). Machine Learning Dengan Decision Tree untuk Prediksi Pembayaran Invoice, Case Study: Gramedia Jakarta. Journal Of Informatics And Telecommunication. Engineering, 5(1), 167–175. https://doi.org/10.31289/jite.v5i1.5066.
Ginantra, N. L. W. S. R., & Wardani, N. W. (2019a). Implementasi Metoda Naïve Bayes dan Vector Space Model dalam Deteksi Kesamaan Artikel Jurnal Berbahasa Indonesia. Jurnal Infomedia, 4(2), 94–100. https://doi.org/10.30811/jim.v4i2.1530.
Ginantra, N. L. W. S. R., & Wardani, N. W. (2019b). Measurement of the Similarity of Indonesian Papers on One Journal Topic with the Naive Bayes Algorithm and Vector Space Model. International Journal of Computer, Network Security and Information System (IJCONSIST, 1(1), 20–26. https://doi.org/10.33005/ijconsist.v1i1.7.
Gunawan, R., Nugroho, N. B., & Arbianto, R. (2018). Penerapan Data Mining Untuk Estimasi Laju Pertumbuhan Produk Domestik Regional Bruto (PDRB) Perkapita Atas Dasar Harga Berlaku Menurut Lapangan Usaha Pada Kota Medan Menggunakan Metode Regresi Linier Barganda. Jurnal Teknologi Sistem Informasi Dan Sistem Komputer TGD, 1(2), 106–113. https://doi.org/10.53513/jsk.v1i2.36.
Gupta, M. K., & Chandra, P. (2020). A comprehensive survey of data mining. International Journal of Information Technology, 1(1), 1–15. https://doi.org/10.1007/s41870-020-00427-7.
Indriyani, N., Ali, E., Rio, U., & Rahmaddeni, R. (2020). Menentukan Kualitas Pelayanan Maskapai Penerbangan Domestik Dengan Menggunakan Metode Naïve Bayes: SATIN. Sains Dan Teknologi Informasi, 6(1), 37–44. https://doi.org/10.33372/stn.v6i1.605.
Irawan, A., Rohaniah, R., Sulistiani, H., & Priandika, A. T. (2019). Sistem Pendukung Keputusan Untuk Pemilihan Tempat Servis Komputer di Kota Bandar Lampung Menggunakan Metode AHP. Jurnal Tekno Kompak, 13(1), 30–35. https://doi.org/10.33365/jtk.v13i1.267.
Islamiyati, D. S., & Fikri, A. (2022). Penerapan Algoritma Knuth-Morris-Pratt dalam Mendeteksi Tingkat Kemiripan Judul Skripsi Berbasis Web. Journal of Information System Research (JOSH), 3(2), 58–63. https://doi.org/10.47065/josh.v3i2.1168.
Kant, S., & Ansari, I. A. (2016). An improved K means clustering with Atkinson index to classify liver patient dataset. International Journal of System Assurance Engineering and Management, 7, 222–228. https://doi.org/10.1007/s13198-015-0365-3.
Kück, M., & Freitag, M. (2021). Forecasting of customer demands for production planning by local k-nearest neighbor models. International Journal of Production Economics, 231, 107837. https://doi.org/10.1016/j.ijpe.2020.107837.
Mahendra, G. S., & Aryanto, K. Y. E. (2019). SPK Penentuan Lokasi ATM Menggunakan Metode AHP dan SAW. Jurnal Nasional Teknologi Dan Sistem Informasi, 5(1), 49–56. https://doi.org/10.25077/TEKNOSI.v5i1.2019.49-56.
Mahendra, G. S., & Indrawan, I. P. Y. (2020). Metode AHP-TOPSIS Pada Sistem Pendukung Keputusan Penentuan Penempatan Atm. JST (Jurnal Sains Dan Teknologi, 9(2), 130–142. https://doi.org/10.23887/jst-undiksha.v9i2.24592.
Mahendra, G. S., Karsana, I. W. W., & Paramitha, A. A. I. I. (2021). DSS for best e-commerce selection using AHP-WASPAS and AHP-MOORA methods. Matrix : Jurnal Manajemen Teknologi Dan Informatika, 11(2), 81–94. https://doi.org/10.31940/matrix.v11i2.2306.
Mahendra, G. S., & Nugraha, P. G. S. C. (2020). Komparasi Metode AHP-SAW dan AHP-WP Pada SPK Penentuan E-Commerce Terbaik di Indonesia. JUSTIN (Jurnal Sistem Dan Teknologi Informasi), 8(4), 346–356. https://doi.org/10.26418/justin.v8i4.42611.
Mansyur, T. P., Said, L. B., & Syafei, I. (2021). Analisis Kualitas Layanan Lanside Terhadap Kepuasan Pengguna Jasa pada Bandar Udara Internasional Sultan Hasanuddin Makassar. Jurnal Teknik Sipil MACCA, 6(2), 159–165. https://doi.org/10.33096/jtsm.v6i2.341.
Nugraha, P. G. S. C., & Mahendra, G. S. (2020). ). Explorasi Algoritma C4.5 dan Forward Feature Selection untuk Menentukan Debitur Baik dan Debitur Bermasalah pada Produk Kredit Tanpa Agunan (KTA). JST (Jurnal Sains Dan Teknologi), 9(1), 39–46. https://doi.org/10.23887/jst-undiksha.v9i1.24627.
Rahmat, C. A., Permatasari, H., Rasywir, E., & Pratama, Y. (2023). Penerapan K-Means Untuk Clustering Kondisi Gizi Balita Pada Posyandu. Jurnal Media Informatika Budidarma, 7(1), 207–213. https://doi.org/10.30865/mib.v7i1.5142.
Rahmi, A. N., & Mikola, Y. A. (2021). Implementasi Algoritma Apriori Untuk Menentukan Pola Pembelian Pada Customer (Studi Kasus: Toko Bakoel Sembako). Information System Journal, 4(1), 14–19. https://doi.org/10.24076/infosjournal.2021v4i1.561.
Rifky, L., Nugraha, Z., Pratama, D., & Raswir, E. (2022). Implementasi Data Mining Untuk Penjualan Mobil Menggunakan Metode Naive Bayes. Jurnal Informatika Dan Rekayasa Komputer (JAKAKOM), 2(2), 225–230. https://doi.org/10.33998/jakakom.2022.2.2.109.
Rivai, M. A. (2020). Analysis of Corona Virus spread uses the CRISP-DM as a Framework: Predictive Modelling. International Journal of Advanced Trends in Computer Science and Engineering, 9(3), 2987–2994. https://doi.org/10.30534/ijatcse/2020/76932020.
Romadhan, M. I. (2018). Personal Branding Jokowi dalam Mempertahankan Brand Image Melalui Video Blog Youtube. MetaCommunication; Journal of Communication Studies, 3(2). https://doi.org/10.20527/mc.v3i2.5446.
Rukmana, I., Rasheda, A., Fathulhuda, F., & Cahyadi, M. R. (2021). Analisis Perbandingan Kinerja Algoritma Naïve Bayes, Decision Tree- J48 dan Lazy-IBK. Jurnal Media Informatika Budidarma, 5(3), 1038–1044. https://doi.org/10.30865/mib.v5i3.3055.
Saputra, M. I. H., & Nugraha, N. (2021). Sistem Pendukung Keputusan Dengan Metode Analytical Hierarchy Process (Ahp)(Studi Kasus: Penentuan Internet Service Provider Di Lingkungan Jaringan Rumah). Jurnal Ilmiah Teknologi Dan Rekayasa, 25(3), 199–212. https://doi.org/10.35760/tr.2020.v25i3.3422.
Schröer, C., Kruse, F., & Gómez, J. M. (2021). A Systematic Literature Review on Applying CRISP-DM Process Model. Procedia Computer Science, 181, 526–534. https://doi.org/10.1016/j.procs.2021.01.199.
Sisodia, D., & Sisodia, D. S. (2018). Prediction of diabetes using classification algorithms. Procedia Computer Science, 132, 1578–1585. https://doi.org/10.1016/j.procs.2018.05.122.
Sudarsono, B. G., Leo, M. I., Santoso, A., & Hendrawan, F. (2021). Analisis Data Mining Data Netflix Menggunakan Aplikasi Rapid Miner. JBASE - Journal of Business and Audit Information Systems, 4(1). https://doi.org/10.30813/jbase.v4i1.2729.
Syahril, M., Erwansyah, K., & Yetri, M. (2020). Penerapan Data Mining untuk menentukan pola penjualan peralatan sekolah pada brand wigglo dengan menggunakan algoritma apriori. Jurnal Teknologi Sistem Informasi Dan Sistem Komputer TGD, 3(1), 118–136. https://doi.org/10.53513/jsk.v3i1.202.
Thoib, I., Setyanto, A., & Raharjo, S. (2018). Pengaruh Normalisasi Teks Dengan Text Expansion Dalam Deteksi Komentar Spam Pada Youtube. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 2(3), 708–715. https://doi.org/10.29207/resti.v2i3.602
Vora, P., & Oza, B. (2013). A survey on k-mean clustering and particle swarm optimization. International Journal of Science and Modern Engineering, 1(3), 24–26. https://www.ijisme.org/wp-content/uploads/papers/v1i3/C0150020213.pdf.
Wantoro, A. (2020). Kombinasi Metode Analitical Hierarchy Process (Ahp) Dan Simple Addtive Weight (Saw) Untuk Menentukan Website E-Commerce Terbaik. Sistemasi: Jurnal Sistem Informasi, 9(1), 131–142. https://doi.org/10.32520/stmsi.v9i1.608.
Wardani, N. W. (2020). Penerapan Data Mining dalam Analytic CRM. Yayasan Kita Menulis.
Wardani, N. W., & Ariasih, N. K. (2019). Analisa Komparasi Algoritma Decision Tree C4.5 dan Naïve Bayes untuk Prediksi Churn Berdasarkan Kelas Pelanggan Retail. International Journal of Natural Sciences and Engineering, 3(3), 103–112. https://doi.org/10.23887/ijnse.v3i3.23113.
Wardani, N. W., Dantes, G. R., & Indrawan, G. (2018). Prediksi Customer Churn dengan Algoritma Decision Tree C4.5 Berdasarkan Segmentasi Pelanggan pada Perusahaan Retail. Jurnal Resistor, 1(1), 16–24. https://doi.org/10.31598/jurnalresistor.v1i1.219.
Wulandari, S., Kridalaksana, A. H., & Khairina, D. M. (2019). Sistem Pakar Penerapan Menu Gizi Pada Penderita Jantung Koroner Menggunakan Metode Teorema Bayes. Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer, 14(2), 1–7. https://doi.org/10.30872/jim.v15i1.2716.
Yuniastari, N. L. A. K., & Wirawan, I. W. W. (2014). Peramalan Permintaan Produk Perak Menggunakan Metode Simple Moving Average Dan Exponential Smoothing. Jurnal Sistem Dan Informatika (JSI), 9(1), 97–106. https://mail.jsi.stikom-bali.ac.id/index.php/jsi/article/view/41/62.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 JST (Jurnal Sains dan Teknologi)
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Authors who publish with the Jurnal Sains dan Teknologi (JST) agree to the following terms:
- Authors retain copyright and grant the journal the right of first publication with the work simultaneously licensed under a Creative Commons Attribution License (CC BY-SA 4.0) that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work. (See The Effect of Open Access)