Metode Ensemble Weighted Voting untuk Deteksi Risiko Diabetes
DOI:
https://doi.org/10.33795/jip.v11i4.7353Keywords:
Prediksi Diabetes, Logistic Regression, Random Forest, SVM, Weighted VotingAbstract
Diabetes Melitus (DM) adalah penyakit kronis yang ditandai dengan peningkatan kadar glukosa darah akibat gangguan produksi atau fungsi insulin. Secara global, prevalensi DM terus meningkat, dengan sekitar 537 juta penderita pada tahun 2021 dan proyeksi mencapai 783 juta pada tahun 2045 jika tidak ada penanganan yang lebih efektif. Deteksi dini penyakit ini sangat penating untuk mencegah komplikasi yang lebih serius. Namun, diagnosis manual konvensional sering kali memakan waktu dan biaya yang besar, sehingga menghambat upaya tersebut. Penelitian ini bertujuan mengembangkan model prediksi risiko diabetes yang efisien dan mudah diakses menggunakan metode ensemble weighted voting. Pendekatan ini mengombinasikan tiga algoritma machine learning, yaitu Logistic Regression, Support Vector Machine, dan Random Forest. Data yang digunakan berasal dari survei publik "Diabetes Health Indicators Dataset" (BRFSS 2021) serta data primer lokal. Metodologi penelitian mencakup pengumpulan data, pra-pemrosesan, pelatihan model individual, dan pembentukan model ensemble dengan pembobotan berdasarkan akurasi model. Kinerja model dievaluasi menggunakan metrik akurasi, presisi, recall, dan F1-score melalui empat skenario pengujian. Hasil menunjukkan bahwa model ensemble weighted voting memberikan kinerja yang baik dengan akurasi tertinggi 90,00% pada skenario yang memadukan data latih terbatas dan data uji lokal. Penelitian ini menyimpulkan bahwa metode ensemble weighted voting merupakan metode yang cukup baik untuk pengembangan model prediksi risiko diabetes yang lebih akurast dan praktis
Downloads
References
Datafair. (2018). Kernel Functions-Introduction to SVM Kernel & Examples. https://data-flair.training/blogs/svm-kernel-functions/
Fremmuzar, P., & Baita, A. (2023). Uji Kernel SVM dalam Analisis Sentimen Terhadap Layanan Telkomsel di Media Sosial Twitter. Komputika : Jurnal Sistem Komputer, 12(2), 57–66. https://doi.org/10.34010/komputika.v12i2.9460
G, A., Ganesh, B., Ganesh, A., Srinivas, C., Dhanraj, & Mensinkal, K. (2022). Logistic regression technique for prediction of cardiovascular disease. Global Transitions Proceedings, 3(1), 127–130. https://doi.org/10.1016/j.gltp.2022.04.008
Garrochamba Peñafiel, B. D. (2024). Factores de Riesgo Asociados a Diabetes Mellitus Tipo 2. Revista Científica de Salud y Desarrollo Humano, 5(2), 101–115. https://doi.org/10.61368/r.s.d.h.v5i2.123
Khan, F. A., Zeb, K., Al-Rakhami, M., Derhab, A., & Bukhari, S. A. C. (2021). Detection and Prediction of Diabetes Using Data Mining: A Comprehensive Review. IEEE Access, 9, 43711–43735. https://doi.org/10.1109/ACCESS.2021.3059343
Kusumastuti, R. (2024). PREDIKSI RISIKO DIABETES MENGGUNAKAN ALGORITMA DECISION TREE DENGAN APLIKASI RAPID MINER. November, 14–24.
Lestari, Zulkarnain, Sijid, & Aisyah, S. (2021). Diabetes Melitus: Review Etiologi, Patofisiologi, Gejala, Penyebab, Cara Pemeriksaan, Cara Pengobatan dan Cara Pencegahan. UIN Alauddin Makassar, 1(2), 237–241. http://journal.uin-alauddin.ac.id/index.php/psb
Marlina Haiza, Elmayati, Zulius Antoni, & Wijaya Harma Oktafia Lingga. (2023). Penerapan Algoritma Random Forest Dalam Klasifikasi Penjurusan Di SMA Negeri Tugumulyo. Penerapan Kecerdasan Buatan, 4(2), 138–143.
Mase, J., Furqon, M. T., & Rahayudi, B. (2018). Penerapan Algoritme Support Vector Machine ( SVM ) Pada Pengklasifikasian Penyakit Kucing. Jurnal Pegembangan Teknologi Informasi Dan Ilmu Komputer, 2(10), 3648–3654.
Noreen, N., Palaniappan, S., Qayyum, A., Ahmad, I., & Alassafi, M. O. (2021). Brain Tumor Classification Based on Fine-Tuned Models and the Ensemble Method. Computers, Materials and Continua, 67(3), 3967–3982. https://doi.org/10.32604/cmc.2021.014158
Rajendra, P., & Latifi, S. (2021). Computer Methods and Programs in Biomedicine Update Prediction of diabetes using logistic regression and ensemble techniques. Computer Methods and Programs in Biomedicine Update, 1, 100032. https://doi.org/10.1016/j.cmpbup.2021.100032
Sidharth. (2022). The Kernel RBF in SVM. Pycodemates. https://www.pycodemates.com/2022/10/the-rbf-kernel-in-svm-complete-guide.html
Triyana, D., Muharrom Al Haromainy, M., & Maulana, H. (2024). Implementasi Metode Ensemble Majority Vote Pada Algoritma Naive Bayes Dan Random Forest Untuk Analisis Sentimen Twitter Harga Tiket Pesawat Domestik. JATI (Jurnal Mahasiswa Teknik Informatika), 8(4), 7885–7894. https://doi.org/10.36040/jati.v8i4.10475
Viloria, A., Herazo-Beltran, Y., Cabrera, D., & Pineda, O. B. (2020). Diabetes Diagnostic Prediction Using Vector Support Machines. Procedia Computer Science, 170, 376–381. https://doi.org/10.1016/j.procs.2020.03.065
Yazar, K. (n.d.). Definition logistic regression. Tech Target. Retrieved March 2, 2025, from https://www.techtarget.com/searchbusinessanalytics/definition/logistic-regression






