IMPLEMENTASI EXPLICIT SEMANTIC ANALYSIS BERBAHASA INDONESIA MENGGUNAKAN CORPUS WIKIPEDIA INDONESIA
DOI:
https://doi.org/10.33795/jip.v4i4.215Abstract
Pengembangan terhadap Ujian Online Bahasa Indonesia dalam bentuk esai masih terus dilakukan sampai sekarang guna memperoleh nilai akurasi yang lebih baik dalam memberikan suatu penilaian. Penilaian yang sudah ada saat ini masih menggunakan kemiripan kata pada teks kunci jawaban dan teks jawaban. Cara tersebut memiliki kelemahan mengingat kata dengan tulisan berbeda dapat memiliki makna yang sama. Masalah tersebut dapat diatasi menggunakan skema vektor konsep. Vektor konsep bekerja pada level makna dari sebuah kata. Skema vektor konsep ini dapat diimplementasikan salah satunya menggunakan metode Explicit Semantic Analysis (ESA). Metode ESA memerlukan sebuah korpus yang besar, penelitian ini akan menggunakan korpus dari Artikel Wikipedia Indonesia. Dengan menggunakan metode ESA proses penilaian akan dilakukan dengan membandingkan kemiripan makna dari teks kunci jawaban dengan teks jawaban. Pengujian dilakukan dengan membandingkan 400 teks jawaban soal esai online dengan kunci jawabannya. Dari hasil pengujian tersebut didapatkan kesimpulan bahwa nilai percentage error metode ESA adalah 65%, di mana angka tersebut merupakan probabilitas error yang terlalu tinggi. Pengujian lain yang dilakukan adalah dengan membandingkan nilai percentage error metode ESA dengan metode lain seperti Cosine Similarity, Euclidean Distance, dan Jaccard yang memberikan konklusi bahwa metode ESA tidaklah lebih akurat dari metode-metode lain tersebut.