Cost Sensitive Tree dan Naïve Bayes pada Klasifikasi Multiclass

Authors

  • M. Aldiki Febriantono
  • Ridho Herasmara
  • Gusti Pangestu

DOI:

https://doi.org/10.33795/jip.v7i2.533

Keywords:

cost sensitive, decision tree, multiclass classification, naïve bayes.

Abstract

Data mining merupakan proses pengolahan data untuk mengambil keputusan secara cepat, tepat dan akurat. Data mining pada bidang kesehatan dan manufacturing menjadi hal yang sangat penting dikarenakan suatu kesalahan klasifikasi (misclassification) akan memiliki dampak serius. Masalah utama pada data mining ketika data yang digunakan bersifat imbalanced multiclass karena classifier kesulitan untuk mengklasifikasikan data sehingga menyebabkan terjadinya misclassification. Solusi untuk meminimalkan missclasification dengan menggunakan metode cost sensitive pada classifier decision tree C5.0 dan naïve bayes. Penelitian ini menggunakan dataset glass, lympografi, vehicle, thyroid dan wine yang diperoleh dari UCI Respository. Kelima dataset dilakukan proses seleksi atribut menggunakan particle swarm optimazation. Kemudian dataset diuji menggunakan metode cost sensitive decision tree C5.0 dan cost sensitive naïve bayes. Hasil pengujian menggunakan metode cost sensitive decision tree C5.0 diperoleh nilai accuracy pada dataset glass, lympografi, vehicle, thyroid dan wine berturut-turut sebesar 76.17%, 83.33%, 75.27%, 95.81% dan 95.83%. Sedangkan metode cost sensitive naïve bayes memiliki performa accuracy pada dataset berturut-turut sebesar 32.24%, 82.61%, 25.53%, 97.67% dan 94.94%.

Downloads

Download data is not yet available.

Downloads

Published

2021-02-23

How to Cite

Febriantono, M. A. ., Ridho Herasmara, & Gusti Pangestu. (2021). Cost Sensitive Tree dan Naïve Bayes pada Klasifikasi Multiclass. Jurnal Informatika Polinema, 7(2), 57–64. https://doi.org/10.33795/jip.v7i2.533