Sistem Deteksi Tingkatan Bahasa Jawa Menggunakan Metode Naive Bayes

Authors

  • Esti Mulyani Politeknik Negeri Indramayu
  • Dea Zulfaniar

DOI:

https://doi.org/10.33795/jip.v12i1.8991

Abstract

Bahasa Jawa memiliki berbagai tingkatan dalam penggunaannya yang bervariasi tergantung konteks sosial, yakni Ngoko, Madya, dan Krama Inggil. Penguasaan dan penerapan tingkatan tersebut sangat penting untuk komunikasi sehari-hari. Tujuan penelitian ini adalah menciptakan sistem yang dapat mendeteksi dan mengklasifikasikan tingkat bahasa Jawa secara otomatis melalui metode N-Gram dan algoritma Naive Bayes berbasis platform web. Langkah awal penelitian melibatkan pengumpulan data, tahap preprocessing yang mencakup pengubahan huruf kecil, pembersihan, tokenisasi, penghapusan kata umum, dan stemming. Fitur diekstraksi melalui metode TF-IDF dan N-Gram, diikuti dengan pelatihan menggunakan model Multinomial Naive Bayes. Hasil evaluasi menunjukkan bahwa model mencapai akurasi 83%, dengan performa terbaik pada kelas Ngoko, performa yang cukup baik pada Madya, namun masih rendah pada Krama Inggil akibat adanya ketidakseimbangan dalam data. Sistem ini dapat memberikan bantuan kepada pengguna dalam belajar dan memahami tingkatan Bahasa Jawa secara efisien, serta mendukung pelestarian budaya Bahasa Jawa melalui teknologi. Diperlukan pengembangan lebih lanjut untuk memperbaiki akurasi prediksi pada semua tingkatan dengan lebih merata, terutama di Krama Inggil, agar sistem ini bisa digunakan secara optimal dalam proses pembelajaran dan praktik berbahasa Jawa

Downloads

Download data is not yet available.

References

Angeline, G., Wibawa, A. P., & Pujianto, U. (2022). Klasifikasi Dialek Bahasa Jawa Menggunakan Metode Naives Bayes. Jurnal Mnemonic, 5(2), 103–110. https://doi.org/10.36040/mnemonic.v5i2.4748

Arasy, A., & Agustian, S. (2025). Sentiment Classification Using Multilayer Perceptron Algorithm with TF-IDF Features Klasifikasi Sentimen Menggunakan Metode Multilayer Perceptron dengan Fitur TF-IDF. 5(July), 908–919.

Cahyo Prianto, Markuci, D., & Pane, S. F. (2023). Implementasi Spelling Corrector Untuk Mengatasi Typographical Error Pada Fitur Pencarian Aplikasi Kamus Istilah Informatika. Jurnal Teknologi Informasi: Jurnal Keilmuan dan Aplikasi Bidang Teknik Informatika, 17(1), 20–30. https://doi.org/10.47111/jti.v17i1.5520

Dewi, P. N., Irawan, D., & Ulumuddin, I. (2025). Perancangan Aplikasi Masdika Untuk Pembelajaran Bahasa Jawa Krama. 4(1), 8–14.

Garcia, A. R., Filipe, S. B., Fernandes, C., Estevão, C., & Ramos, G. (n.d.). No 主観的健康感を中心とした在宅高齢者における 健康関連指標に関する共分散構造分析Title. 9(April 2025), 1–6.

Gifari, O. I., Adha, M., Freddy, F., & Durrand, F. F. S. (2022). Film Review Sentiment Analysis Using TF-IDF and Support Vector Machine. Journal of Information Technology, 2(1), 36–40.

Gita Segara, K., & Irwan Padli Nasution, M. (2025). Perkembangan Teknologi Informasi di Indonesia: Tantangan dan Peluang. Jurnal Sains Student Research, 3(1), 21–33. https://doi.org/10.61722/jssr.v3i1.3128

Haris, A., Sandi, K., Haerani, E., Oktavia, L., & Kurnia, F. (2025). BULLETIN OF COMPUTER SCIENCE RESEARCH Klasifikasi Sentimen Masyarakat Terhadap Revisi Undang-Undang Tentara Nasional Indonesia Menggunakan Naïve Bayes Classifier. 5(4), 594–603. https://doi.org/10.47065/bulletincsr.v5i4.615

Hidayatullah, A. F., Apong, R. A., Lai, D. T. C., & Qazi, A. (2023). Corpus creation and language identification for code-mixed Indonesian-Javanese-English Tweets. PeerJ Computer Science, 9, 1–24. https://doi.org/10.7717/PEERJ-CS.1312

Nauli, S., Berutu, S., Budiati, H., & Maedjaja, F. (2025). JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika) Journal homepage: https://jurnal.stkippgritulungagung.ac.id/index.php/jipi KLASIFIKASI KALIMAT PERUNDUNGAN PADA TWITTER MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE. JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), 10(1), 107–122. https://doi.org/10.29100/jipi.v10i1.5749

Nurhidayat, R., & Dewi, K. E. (2023). Penerapan Algoritma K-Nearest Neighbor Dan Fitur Ekstraksi N-Gram Dalam Analisis Sentimen Berbasis Aspek. Komputa : Jurnal Ilmiah Komputer dan Informatika, 12(1), 91–100. https://doi.org/10.34010/komputa.v12i1.9458

Puji Arfianingrum. (2020). Penerapan Unggah-Ungguh Bahasa Jawa Sesuai Dengan Konteks Tingkat Tutur Budaya Jawa. Jurnal Prakarsa Paedagogia, 03(02), 139–140.

Putri, S. D. A., Ibrohim, M. O., & Budi, I. (2021). Abusive language and hate speech detection for Javanese and Sundanese languages in tweets: Dataset and preliminary study. 2021 11th International Workshop on Computer Science and Engineering, WCSE 2021, Wcse, 461–465. https://doi.org/10.18178/wcse.2021.02.011

Putri, U. S., Taryo, T., & Hindasyah, A. (2025). Analisis Pemetaan Kemampuan Akademik Mahasiswa Program Studi Teknik Informatika Dengan Metode Naive Bayes Classifier Dan K- Nearest Neighbor ( KNN ) ( Studi Kasus : Universitas Pamulang ). 7(1), 24–31.

Rayuwati, Husna Gemasih, & Irma Nizar. (2022). IMPLEMENTASI AlGORITMA NAIVE BAYES UNTUK MEMPREDIKSI TINGKAT PENYEBARAN COVID. Jural Riset Rumpun Ilmu Teknik, 1(1), 38–46. https://doi.org/10.55606/jurritek.v1i1.127

Sentimen, A., Di, M., Sosial, M., Terhadap, X., Dengan, K., Bayes, N., Svm, D., Ryandi, F. A., Pratiwi, D., & Sari, S. (2025). Analisis Sentimen Masyarakat Di Media Sosial X Terhadap Kemenkes Dengan Naive Bayes dan SVM. Jurnal Sains dan Teknologi, 7(1), 1–6.

SLAM, B. E., Feri Irawan, Nolan Efranda, & Rifaldi Herikson. (2025). Implementasi Machine Learning untuk Klasifikasi Buku Otomatis pada Perpustakaan Digital. Jurnal Informatika Polinema, 11(3), 305–310. https://doi.org/10.33795/jip.v11i3.7298

Zaman, B., Hariyanti, E., Purwanti, E., & Bahasa, A. D. (2015). Sistem Deteksi Bahasa pada Dokumen menggunakan N-Gram. 1(2), 21–26.

Downloads

Published

2025-11-30

How to Cite

Mulyani, E., & Zulfaniar, D. (2025). Sistem Deteksi Tingkatan Bahasa Jawa Menggunakan Metode Naive Bayes. Jurnal Informatika Polinema, 12(1), 63–72. https://doi.org/10.33795/jip.v12i1.8991