Komparasi Metode Mean dan KNN Imputation dalam Mengatasi Missing Value pada Dataset Kecil

Authors

  • Fandi Yulian Pamuji Universitas Merdeka Malang
  • Ahmad Rofiqul Muslikh Universitas Merdeka Malang
  • Rizza Muhammad Arief Universitas Merdeka Malang
  • Delviana Muti Universitas Merdeka Malang

DOI:

https://doi.org/10.33795/jip.v10i2.5031

Keywords:

metode imputasi, missing value, mean, KNN imputation

Abstract

Missing value pada dataset yang kecil akan mengakibatkan berkurangnya data yang dapat digunakan untuk pembelajaran sehingga prediksi hasil klasifikasi dari data tersebut akan berkurang. Metode Imputasi sebagai solusi metode yang paling umum digunakan untuk menangani masalah dataset yang tidak lengkap. Metode Imputasi proses di mana beberapa teknik statistik digunakan untuk mengganti data yang hilang dengan nilai pengganti. Tujuan penelitian ini dengan kinerja klasifikasi yang dapat dipertahankan dengan metode imputasi missing value, karena metode ini dapat menghindari berkurangnya jumlah dataset yang digunakan dalam proses klasifikasi pada dataset dan meningkatkan kinerja klasifikasi pada dataset yang tidak ideal terutama untuk jumlah dataset yang kecil. Berdasarkan hasil eksperimen yang telah dilakukan dari penelitian ini yaitu bahwa pengujian metode imputasi Mean dan KNN Imputation dengan metode klasifikasi mampu menangani data kosong dengan jumlah missing value sedikit maupun banyak dengan menghasilkan nilai accuracy mencapai kinerja prediksi yang lebih besar dibandingkan dengan menggunakan missing value nilai 0. Kemudian untuk dataset Hepatitis nilai Accuracy tinggi menggunakan metode imputasi KNN Imputasi dengan nilai 0,79 menggunakan metode Logistic Regression dan dataset Ginjal Kronis nilai Accuracy tinggi menggunakan metode imputasi Mean dengan nilai 0,97 dengan menggunakan metode Naïve Bayes. Hal tersebut menunjukkan bahwa proses metode imputasi terhadap nilai kosong disetiap column dataset kecil pada tahap data preprocessing memberikan pengaruh terhadap nilai Accuracy metode Mean dan KNN Imputation pada metode klasifikasi.

Downloads

Download data is not yet available.

Downloads

Published

2024-02-29

How to Cite

Yulian Pamuji, F., Ahmad Rofiqul Muslikh, Rizza Muhammad Arief, & Delviana Muti. (2024). Komparasi Metode Mean dan KNN Imputation dalam Mengatasi Missing Value pada Dataset Kecil. Jurnal Informatika Polinema, 10(2), 257–264. https://doi.org/10.33795/jip.v10i2.5031