Model Prediksi Churn Pelanggan Indibiz Menggunakan Regresi Logistik dan Extreme Gradient Boosting (XGBoost)

Authors

  • Aulia Rahmadiva Wardana Universitas Logistik dan Bisnis Internasional
  • Woro Isti Rahayu Universitas Logistik dan Bisnis Internasional
  • Kiki Mustaqim Universitas Logistik dan Bisnis Internasional

DOI:

https://doi.org/10.33795/jip.v12i3.9377

Keywords:

churn pelanggan, regresi logistik, XGBoost, Indibiz, telekomunikasi

Abstract

Kebutuhan digitalisasi yang semakin pesat mendorong PT. Telekomunikasi Indonesia (Persero) Tbk menghadirkan IndiBiz sebagai layanan internet berbasis fiber untuk mendukung transformasi digital UMKM. Namun, meningkatnya persaingan industri telekomunikasi menimbulkan risiko churn pelanggan yang berpotensi menurunkan pendapatan dan loyalitas. Penelitian ini bertujuan membangun dan membandingkan model prediksi churn menggunakan Regresi Logistik dan Extreme Gradient Boosting (XGBoost), mengidentifikasi tingkat risiko churn pelanggan, serta mengembangkan dashboard interaktif berbasis Streamlit sebagai pendukung pengambilan keputusan. Metode yang digunakan adalah klasifikasi biner pada data pelanggan IndiBiz dengan evaluasi menggunakan akurasi, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa XGBoost memiliki performa lebih baik dengan akurasi 83%, recall 0,58, dan F1-score yang lebih tinggi dibandingkan Regresi Logistik (akurasi 81% dan recall 0,56). Namun, nilai precision yang sangat tinggi dan recall yang relatif rendah pada kedua model mengindikasikan kecenderungan model yang konservatif serta kemungkinan ketidakseimbangan kelas, sehingga masih terdapat pelanggan churn yang tidak terdeteksi. Model XGBoost mengelompokkan pelanggan ke dalam kategori risiko churn tinggi (14.255 pelanggan), sedang (3.418 pelanggan), dan rendah (889 pelanggan). Interpretasi menggunakan SHAP menunjukkan bahwa Lama_Berlangganan_Bulan, PAKET_DIGI, dan STO merupakan faktor utama yang memengaruhi churn. Implementasi model dalam dashboard berbasis Streamlit memungkinkan eksplorasi data dan prediksi secara interaktif. Penelitian ini berkontribusi dalam mendukung strategi retensi pelanggan berbasis data, meskipun masih diperlukan pengembangan lebih lanjut untuk meningkatkan kemampuan deteksi churn.

Downloads

Download data is not yet available.

References

Amanda, A., & Ridwan Yusuf. (2025). ANALISIS SENTIMEN MASYARAKAT INDONESIA PADA PLATFROM X TERHADAP ISU FUFUFAFA MENGGUNAKAN BIDIRECTIONAL ENCODER REPRESENTATIONS FROM TRANSFORMER. Jurnal Informatika Teknologi Dan Sains (JINTEKS), 7, 72–80.

Aydin, Z. E. (2021). Performance Analysis of XGBoost Classifier with Missing Data. March.

Chen, T. (n.d.). XGBoost : A Scalable Tree Boosting System.

Dhani, C. R., Trisnawarman, D., Budiyantara, A., Studi, P., Informasi, S., Teknologi, F., Universitas, I., Barat, J., Teknologi, F., Universitas, I., & Barat, J. (n.d.). MENINGKATKAN PENGELOLAAN INSIDEN LAYANAN TI. i, 1–5.

Hermawan, A., Saputra, A., Rafi, M. D., & Basmallah, S. (2025). Implementing XGBoost Model for Predicting Customer Churn in E-Commerce Platforms. 3(2).

Hermawan, E., Panjaitan, S. D., & Ripanti, E. F. (2024). Sistem Prediksi Banjir Rob Kota Pontianak Berbasis Machine Learning Menggunakan Framework Streamlit. 10(3), 351–361.

Hidayat, R., Mahdiana, D., & Fergina, A. (2024). Comparative Analysis of Logistic Regression , SVM , Xgboost , and Random Forest Algorithms for Diabetes Classification. 7(1), 281–291. https://doi.org/10.32493/jtsi.v7i1.38258

Id, M. I., Id, R. I., Kawakami, E., Michihata, N., Goto, T., Shinozaki, T., & Sun, Y. (2024). PLOS DIGITAL HEALTH Comparison of machine-learning and logistic regression models for prediction of 30-day unplanned readmission in electronic health records : A development and validation study. 1–16. https://doi.org/10.1371/journal.pdig.0000578

Iffadah, A. S., & Prasetya, D. A. (2025). Shapley Additive Explanations Interpretation of the XGBoost Model in Predicting Air Quality in Jakarta. 7(3).

Kingawa, E. D., & Hailu, T. T. (2022). Customer Churn Prediction Using Machine Learning Techniques : the case of Lion Insurance. 4(4), 60–73.

Kishendrian, H., Hanum, N., Prianto, C., & Rahayu, W. I. (2023). Penerapan Metode Clustering Dalam Segmentasi Pelanggan Perusahaan Logistik. SINTECH (Science and Information Technology) Journal, 6(3), 137–146. https://doi.org/10.31598/sintechjournal.v6i3.1432

Putra, I. S. (2023). Inovasi dan Strategi Pemasaran Produk Indibiz di PT . Telkom Indonesia Prosiding Seminar Nasional Teknologi Komputer dan Sains. 1(1), 299–306.

Saputra, M. A., & Sugihartono, T. (2025). Evaluasi Kinerja Model LSTM Untuk Prediksi Risiko Penyakit Jantung Menggunakan Dataset Program Studi Teknik Informasi , Fakultas Teknologi Informasi , ISB Atma Luhur , Indonesia Performance Evaluation of the LSTM Model for Heart Disease Risk Prediction Using a Dataset. 5(7), 1823–1833.

Surabaya, U. N. (2025). Journal of Emerging Information Systems and Business Intelligence ISSN: 2774-3993. 6(2), 230–240.

Umam, K. (2024). MENGANALISIS RESPONS NETIZEN TWITTER TERHADAP PROGRAM MAKAN SIANG GRATIS MENERAPKAN NLP METODE NAÏVE BAYES. 14(3), 201–208.

Downloads

Published

2026-05-31

How to Cite

Wardana, A. R., Rahayu, W. I., & Mustaqim, K. (2026). Model Prediksi Churn Pelanggan Indibiz Menggunakan Regresi Logistik dan Extreme Gradient Boosting (XGBoost). Jurnal Informatika Polinema, 12(3), 425–430. https://doi.org/10.33795/jip.v12i3.9377