Klasifikasi Harapan Hidup Pasien Karsinoma Hepatoseluler Menggunakan Extreme Learning Machine Dengan Perbaikan Data Hilang
DOI:
https://doi.org/10.33795/jip.v9i4.1287Keywords:
Karsinoma Hepatoseluler, MissForest, Extreme Learning Machine, K-Nearest Neighbors ImputationAbstract
International Agency for Research on Cancer (IARC) mengestimasi bahwa pada tahun 2020 kanker hati primer berada di peringkat ke-6 sebagai kanker yang paling banyak didiagnosis dan peringkat ke-3 sebagai penyebab utama kematian akibat kanker di dunia. Mayoritas kanker hati primer muncul dari sel-sel hati dan disebut Karsinoma Hepatoseluler (KHS). Salah satu upaya yang dapat dilakukan untuk mengatasi permasalahan tersebut adalah dengan mengklasifikasikan harapan hidup pasien KHS. Terdapat banyak metode yang dapat digunakan dalam klasifikasi, salah satunya adalah menggunakan Extreme Learning Machine (ELM). Dataset yang digunakan pada penelitian ini adalah HCC Survival Data Set yang memiliki 49 fitur dengan rata-rata data hilang sebesar 10,22% secara keseluruhannya. ELM merupakan metode yang mengharuskan semua data pada datasetnya lengkap tanpa memiliki data hilang. Sehingga harus dilakukan penanganan data hilang terlebih dahulu sebelum dilakukan klasifikasi. Penanganan data hilang pada penelitian ini dilakukan dengan menggunakan teknik imputasi. Pada penelitian ini dilakukan perbandingan antara hasil klasifikasi dari data yang diimputasi menggunakan MissForest dengan hasil klasifkasi dari data yang diimputasi menggunakan K-Nearest Neighbors Imputation (KNNI). Perbandingan tersebut dilakukan untuk mengetahui metode imputasi mana yang menghasilkan data imputasi dengan kinerja terbaik pada klasifikasi kelangsungan hidup pasien KHS. Hasil menunjukkan bahwa data yang diimputasi menggunakan KNNI menghasilkan nilai akurasi rata-rata dan nilai rata-rata AUC yang lebih unggul dibandingkan dengan data yang diimputasi dengan MissForest, yaitu dengan nilai akurasi rata-rata sebesar 92,941% dan rata-rata AUC sebesar 0,9758.