Sistem Deteksi Tingkatan Bahasa Jawa Menggunakan Metode Naive Bayes
DOI:
https://doi.org/10.33795/jip.v12i1.8991Abstract
Bahasa Jawa memiliki berbagai tingkatan dalam penggunaannya yang bervariasi tergantung konteks sosial, yakni Ngoko, Madya, dan Krama Inggil. Penguasaan dan penerapan tingkatan tersebut sangat penting untuk komunikasi sehari-hari. Tujuan penelitian ini adalah menciptakan sistem yang dapat mendeteksi dan mengklasifikasikan tingkat bahasa Jawa secara otomatis melalui metode N-Gram dan algoritma Naive Bayes berbasis platform web. Langkah awal penelitian melibatkan pengumpulan data, tahap preprocessing yang mencakup pengubahan huruf kecil, pembersihan, tokenisasi, penghapusan kata umum, dan stemming. Fitur diekstraksi melalui metode TF-IDF dan N-Gram, diikuti dengan pelatihan menggunakan model Multinomial Naive Bayes. Hasil evaluasi menunjukkan bahwa model mencapai akurasi 83%, dengan performa terbaik pada kelas Ngoko, performa yang cukup baik pada Madya, namun masih rendah pada Krama Inggil akibat adanya ketidakseimbangan dalam data. Sistem ini dapat memberikan bantuan kepada pengguna dalam belajar dan memahami tingkatan Bahasa Jawa secara efisien, serta mendukung pelestarian budaya Bahasa Jawa melalui teknologi. Diperlukan pengembangan lebih lanjut untuk memperbaiki akurasi prediksi pada semua tingkatan dengan lebih merata, terutama di Krama Inggil, agar sistem ini bisa digunakan secara optimal dalam proses pembelajaran dan praktik berbahasa Jawa
Downloads
References
Angeline, G., Wibawa, A. P., & Pujianto, U. (2022). Klasifikasi Dialek Bahasa Jawa Menggunakan Metode Naives Bayes. Jurnal Mnemonic, 5(2), 103–110. https://doi.org/10.36040/mnemonic.v5i2.4748
Arasy, A., & Agustian, S. (2025). Sentiment Classification Using Multilayer Perceptron Algorithm with TF-IDF Features Klasifikasi Sentimen Menggunakan Metode Multilayer Perceptron dengan Fitur TF-IDF. 5(July), 908–919.
Cahyo Prianto, Markuci, D., & Pane, S. F. (2023). Implementasi Spelling Corrector Untuk Mengatasi Typographical Error Pada Fitur Pencarian Aplikasi Kamus Istilah Informatika. Jurnal Teknologi Informasi: Jurnal Keilmuan dan Aplikasi Bidang Teknik Informatika, 17(1), 20–30. https://doi.org/10.47111/jti.v17i1.5520
Dewi, P. N., Irawan, D., & Ulumuddin, I. (2025). Perancangan Aplikasi Masdika Untuk Pembelajaran Bahasa Jawa Krama. 4(1), 8–14.
Garcia, A. R., Filipe, S. B., Fernandes, C., Estevão, C., & Ramos, G. (n.d.). No 主観的健康感を中心とした在宅高齢者における 健康関連指標に関する共分散構造分析Title. 9(April 2025), 1–6.
Gifari, O. I., Adha, M., Freddy, F., & Durrand, F. F. S. (2022). Film Review Sentiment Analysis Using TF-IDF and Support Vector Machine. Journal of Information Technology, 2(1), 36–40.
Gita Segara, K., & Irwan Padli Nasution, M. (2025). Perkembangan Teknologi Informasi di Indonesia: Tantangan dan Peluang. Jurnal Sains Student Research, 3(1), 21–33. https://doi.org/10.61722/jssr.v3i1.3128
Haris, A., Sandi, K., Haerani, E., Oktavia, L., & Kurnia, F. (2025). BULLETIN OF COMPUTER SCIENCE RESEARCH Klasifikasi Sentimen Masyarakat Terhadap Revisi Undang-Undang Tentara Nasional Indonesia Menggunakan Naïve Bayes Classifier. 5(4), 594–603. https://doi.org/10.47065/bulletincsr.v5i4.615
Hidayatullah, A. F., Apong, R. A., Lai, D. T. C., & Qazi, A. (2023). Corpus creation and language identification for code-mixed Indonesian-Javanese-English Tweets. PeerJ Computer Science, 9, 1–24. https://doi.org/10.7717/PEERJ-CS.1312
Nauli, S., Berutu, S., Budiati, H., & Maedjaja, F. (2025). JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika) Journal homepage: https://jurnal.stkippgritulungagung.ac.id/index.php/jipi KLASIFIKASI KALIMAT PERUNDUNGAN PADA TWITTER MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE. JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), 10(1), 107–122. https://doi.org/10.29100/jipi.v10i1.5749
Nurhidayat, R., & Dewi, K. E. (2023). Penerapan Algoritma K-Nearest Neighbor Dan Fitur Ekstraksi N-Gram Dalam Analisis Sentimen Berbasis Aspek. Komputa : Jurnal Ilmiah Komputer dan Informatika, 12(1), 91–100. https://doi.org/10.34010/komputa.v12i1.9458
Puji Arfianingrum. (2020). Penerapan Unggah-Ungguh Bahasa Jawa Sesuai Dengan Konteks Tingkat Tutur Budaya Jawa. Jurnal Prakarsa Paedagogia, 03(02), 139–140.
Putri, S. D. A., Ibrohim, M. O., & Budi, I. (2021). Abusive language and hate speech detection for Javanese and Sundanese languages in tweets: Dataset and preliminary study. 2021 11th International Workshop on Computer Science and Engineering, WCSE 2021, Wcse, 461–465. https://doi.org/10.18178/wcse.2021.02.011
Putri, U. S., Taryo, T., & Hindasyah, A. (2025). Analisis Pemetaan Kemampuan Akademik Mahasiswa Program Studi Teknik Informatika Dengan Metode Naive Bayes Classifier Dan K- Nearest Neighbor ( KNN ) ( Studi Kasus : Universitas Pamulang ). 7(1), 24–31.
Rayuwati, Husna Gemasih, & Irma Nizar. (2022). IMPLEMENTASI AlGORITMA NAIVE BAYES UNTUK MEMPREDIKSI TINGKAT PENYEBARAN COVID. Jural Riset Rumpun Ilmu Teknik, 1(1), 38–46. https://doi.org/10.55606/jurritek.v1i1.127
Sentimen, A., Di, M., Sosial, M., Terhadap, X., Dengan, K., Bayes, N., Svm, D., Ryandi, F. A., Pratiwi, D., & Sari, S. (2025). Analisis Sentimen Masyarakat Di Media Sosial X Terhadap Kemenkes Dengan Naive Bayes dan SVM. Jurnal Sains dan Teknologi, 7(1), 1–6.
SLAM, B. E., Feri Irawan, Nolan Efranda, & Rifaldi Herikson. (2025). Implementasi Machine Learning untuk Klasifikasi Buku Otomatis pada Perpustakaan Digital. Jurnal Informatika Polinema, 11(3), 305–310. https://doi.org/10.33795/jip.v11i3.7298
Zaman, B., Hariyanti, E., Purwanti, E., & Bahasa, A. D. (2015). Sistem Deteksi Bahasa pada Dokumen menggunakan N-Gram. 1(2), 21–26.






