Komparasi Metode SMOTE-Tomek dan SMOTE-ENN untuk Mengatasi Data Imbalanced

Authors

  • Fandi Yulian Pamuji Universitas Merdeka Malang
  • Mohammad Dwi Irfan Affandi Universitas Merdeka Malang
  • Andriyan Rizki Jatmiko Universitas Merdeka Malang

DOI:

https://doi.org/10.33795/jip.v12i3.9550

Keywords:

Binary, Data imbalanced, SMOTE-Tomek, SMOTE-ENN

Abstract

Perkembangan teknologi informasi dan data analisis saat ini mendorong meningkatnya pemanfaatan machine learning dalam berbagai bidang. Namun, salah satu permasalahan umum yang sering muncul dalam penerapan machine learning adalah kondisi data tidak seimbang (imbalanced data) yaitu ketidakseimbangan jumlah data antar kelas, di mana kelas mayoritas jauh lebih dominan dibandingkan kelas minoritas. Untuk mengatasi permasalahan dataset tidak seimbang adalah dengan menyeimbangkan distribusi kelas tidak seragam di antara kelas-kelas dengan komparasi menggunakan metode SMOTE-Tomek dan SMOTE-ENN supaya jumlahnya seimbang dari kelas mayoritas (negatif) maupun kelas minoritas (positif). Berdasarkan hasil eksperimen yang telah dilakukan dari penelitian ini yaitu bahwa pengujian metode SMOTE-Tomek dengan metode klasifikasi mampu menangani jumlah kelas mayoritas (negatif) dan kelas minoritas (positif) pada data tidak seimbang dengan menghasilkan nilai MCC dan G-mean mencapai kinerja prediksi yang lebih besar dibandingkan dengan menggunakan metode klasifikasi saja maupun menggunakan Metode SMOTE-ENN. Kemudian untuk dataset Binary nilai MCC dan G-mean yang paling tinggi menggunakan SMOTE-ENN + Random Forest dengan nilai tertinggi MCC = 0.99 dan nilai G-mean = 0.99 dari nilai MCC dan G-mean diatas akurasinya sudah bagus karena nilai MCC dan G-mean yang mendekati 1 menunjukkan bahwa model memiliki performa klasifikasi yang sangat baik dalam menangani data tidak seimbang dengan menggunakan Metode SMOTE-Tomek + Random Forest dapat mencapai kinerja prediksi yang lebih besar untuk menangani dataset tidak seimbang Binary. Hal tersebut menunjukkan bahwa proses penanganan terhadap distribusi kelas yang tidak seimbang pada tahap preprocessing data memberikan pengaruh terhadap nilai akurasi MCC maupun G-mean metode SMOTE-Tomek + Random Forest.

Downloads

Download data is not yet available.

References

Agustian, S., & Ramadhani, S. (2022). Jurnal Computer Science and Information Technology ( CoSciTech ) menggunakan algoritma lexrank. 3(3), 371–381.

Amin, F. M., & Dinika, Q. A. (n.d.). Penerapan Algoritma Hybrid Sampling SMOTE-TomekLink dan Random Forest untuk Klasifikasi Penyakit Diabetes. September 2025, 24–31.

Aprianti, S. D., Alzami, F., Rizqa, I., Pramunendar, R. A., & Megantara, R. A. (2025). Comparative Analysis of PCOS Classification Using Random Forest : Integration of Mutual Information , SMOTE-Tomek , and Outlier Handling. 10(1), 78–87.

Aryabima, M. I., Roeswidiah, R., & Pudoli, A. (2025). Deteksi Dini Penyakit Stroke pada Data Tidak Seimbang Menggunakan SMOTE dan Random. 13, 141–146.

Assyifa, D. S., & Luthfiarta, A. (2024). SMOTE-Tomek Re-sampling Based on Random Forest Method to Overcome Unbalanced Data for Multi-class Classification. 9(2), 151–160.

Damari, A., Azhima, T., Siswa, Y., Pranoto, W. J., Muhammadiyah, U., Timur, K., & Timur, K. (2025). IMPLEMENTATION OF THE PSO-SMOTE METHOD ON THE NAIVE BAYES ALGORITHM TO ADDRESS CLASS IMBALANCE IN LANDSLIDE DISASTER DATA PENERAPAN METODE PSO-SMOTE PADA ALGORITMA NAIVE BAYES UNTUK MENGATASI CLASS IMBALANCE. 10(1), 332–343.

Eltehewy, R., Abouelfarag, A., & Saleh, S. N. (2023). Efficient Classification of Imbalanced Natural Disasters Data Using Generative Adversarial Networks for Data Augmentation. ISPRS International Journal of Geo-Information, 12(6), 245. https://doi.org/10.3390/ijgi12060245

Geologi, P., & Pertambangan, D. A. N. (2025). PENERAPAN NAÏVE BAYES DENGAN BALANCING DATA SMOTE UNTUK. 2(1), 1–8.

Hermaliani, E. H., & Ernawati, M. (2024). Penerapan Metode SMOTE Untuk Mengatasi Imbalanced Data Pada Klasifikasi Ujaran Kebencian. 4(1).

Illawati, A. R., Hadiana, A. I., Informatika, J. T., Jenderal, U., Yani, A., Artikel, I., & Imbalance, D. (2025). Klasifikasi Penyakit Monkeypox dengan XGBoost dan SMOTE untuk Penanganan Data Tidak Seimbang. 35–44. https://doi.org/10.33364/algoritma/v.22-2.2349

Jantung, G. (2023). Perbandingan model klasifikasi random forest dengan resampling dan tanpa resampling pada pasien penderita gagal jantung 1. 12, 136–145. https://doi.org/10.14710/j.gauss.12.1.136-145

Latief, M. A., Nabila, L. R., Miftakhurrahman, W., Ma, S., Tantyoko, H., & Latief, M. A. (2024). Handling Imbalance Data Using Hybrid Sampling SMOTE-ENN in Lung Cancer Classification Corresponding Author : 3(1), 11–18. https://doi.org/10.30812/IJECSA.v3i1.3758

Misdram, M., Muljono, Purwanto, & Noersasongko, E. (2023). Gradually Generative Adversarial Networks Method for Imbalanced Datasets. International Journal of Advanced Computer Science and Applications, 14(4), 51–58. https://doi.org/10.14569/IJACSA.2023.0140408

Nugroho, A., & Harini, D. (2024). Teknik Random Forest untuk Meningkatan Akurasi Data Tidak Seimbang. 2(2), 128–140.

Pamuji, F. Y., Dwi, S., & Putri, A. (2021). Komparasi Metode SMOTE dan ADASYN Untuk Penanganan Data Tidak Seimbang MultiClass. 331–338.

Pamuji, F. Y., & Ramadhan, V. P. (2021). Komparasi Algoritma Random Forest dan Decision Tree untuk Memprediksi Keberhasilan Immunotheraphy. Jurnal Teknologi Dan Manajemen Informatika, 7(1), 46–50. https://doi.org/10.26905/jtmi.v7i1.5982

Qolbu, A. A., Fitriyati, N., & Inayah, N. (2025). Performa Naïve Bayes , SVM , dan IndoBERT pada Analisis Sentimen Twitter IndiHome dengan Strategi Penanganan Data Tidak Seimbang. 814(1), 29–44. https://doi.org/10.14421/fourier.2025.141.29-44

Sun, Y., Lee, J., Kim, S., Seon, J., Lee, S., Kyeong, C., & Kim, J. (2023). Energy Theft Detection Model Based on VAE-GAN for Imbalanced Dataset. Energies, 16(3). https://doi.org/10.3390/en16031109

Yulian Pamuji, F., Ahmad Rofiqul Muslikh, Rizza Muhammad Arief, & Delviana Muti. (2024). Komparasi Metode Mean dan KNN Imputation dalam Mengatasi Missing Value pada Dataset Kecil. Jurnal Informatika Polinema, 10(2), 257–264. https://doi.org/10.33795/jip.v10i2.5031

Downloads

Published

2026-05-31

How to Cite

Yulian Pamuji, F., Mohammad Dwi Irfan Affandi, & Rizki Jatmiko, A. (2026). Komparasi Metode SMOTE-Tomek dan SMOTE-ENN untuk Mengatasi Data Imbalanced. Jurnal Informatika Polinema, 12(3), 601–606. https://doi.org/10.33795/jip.v12i3.9550