IDENTIFIKASI DAN NORMALISASI TEKS SLANG DENGAN FASTTEXT PADA TWITTER DALAM BAHASA INDONESIA

Authors

  • pande sindu univeristas pendidikan ganesha
  • Agus Aan Jiwa Permana universitas pendidikan ganesha
  • I Nyoman Saputra Wahyu Wijaya universitas pendidikan ganesha

DOI:

https://doi.org/10.23887/jptkundiksha.v21i1.66381

Abstract

Salah satu dampak yang signifikan dari popularitas media sosial adalah munculnya istilah slang yang semakin banyak. Istilah slang adalah bahasa yang digunakan oleh kelompok-kelompok tertentu untuk berkomunikasi secara informal. Slang juga dapat muncul melalui singkatan, penggunaan kata-kata yang berbeda dari arti aslinya, atau penggabungan kata-kata yang tidak konvensional. Dalam pengolahan bahasa alami (Natural Language Processing) Slang sering kali memiliki makna yang tidak jelas atau ambigu, dan kata-kata slang dapat memiliki konotasi yang berbeda tergantung pada konteks dan subkultur tertentu. Ini dapat menyebabkan kesalahan dalam pemrosesan bahasa alami dan menghasilkan hasil yang tidak akurat atau salah dalam tugas seperti klasifikasi teks atau analisis sentimen. Dari permasalahan tersebut dalam penelitian ini dikembangkan suatu metode untuk mengidentifikasi dan melakukan normalisasi slang pada kalimat yang akan diproses oleh NLP. Proses normalisasi slang ke bahasa yang lebih standar dilakukan dengan memanfaatkan pretrain model dari fasttext untuk mencari kata – kata yang memiliki kedekatan dengan slang. Data yang digunakan pada penelitian ini didapatkan dari sosial media twitter. Sebelum dinormalisasi data melewati beberapa proses seperti preprocessing data yang meliputi proses cleaning, case folding, dan stopword removal kemudian dilanjutkan dengan proses identifikasi slang pada kalimat dan terakhir dilakukan proses normalisasi slang yang didapatkan. Penelitian ini menemukan bahwa metode fasttext masih belum cukup baik melakukan normalisasi slang dikarenakan masih ada sekitar 1329 data dari 3239 data yang tidak berhasil dinormalisasi dengan baik yaitu sekitar 41%. Penelitian ini memberikan kontribusi dalam membantu proses pengolahan kata yang lebih baik untuk NLP.

 

Kata kunci: slang, normalisasi, fasttext, NLP

Downloads

Published

2024-01-30