Klasifikasi Koleksi Perpustakaan Berbasis Dewey Decimal Classification Menggunakan Algoritma TF-RF dan K-Nearest Neighbor
DOI:
https://doi.org/10.33795/jip.v12i3.9663Keywords:
pengelompokan koleksi perpustakaan, sistem identifikasi, term frequency-relevance frequency, digitalisasi perpustakaan, koleksi e-library PoliwangiAbstract
Perpustakaan Politeknik Negeri Banyuwangi memiliki banyak koleksi buku dari berbagai bidang keilmuan yang terus bertambah setiap tahunnya. Pertambahan koleksi ini menimbulkan tantangan dalam proses pengklasifikasian buku yang masih dilakukan secara manual, sehingga memakan waktu dan tenaga yang besar. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan sistem klasifikasi koleksi perpustakaan berbasis Dewey Decimal Classification (DDC) menggunakan algoritma Term Frequency-Relevance Frequency (TF-RF) dan K-Nearest Neighbor (kNN). Data yang digunakan berupa judul buku berbahasa Indonesia dengan jumlah 4056 data pada 73 label. Prosesnya dimulai dari pre-processing, ekstraksi fitur menggunakan TF-RF untuk mengukur relevansi kata kunci dan pengklasifikasian model dengan kNN, serta evaluasi performa model dengan K-Fold Cross validation 10. Hasil penelitian ini menunjukkan bahwa sistem klasifikasi yang dikembangkan mampu menghasilkan akurasi terbaik sebesar 74,38% dan presisi 78,91% dengan tunning parameter menggunakan pendekatan GridSearch pada parameter K=1 yang diperoleh pada skenario ketiga dengan 7 kelas dan 2831 data. Penelitian ini membuktikan bahwa kombinasi TF-RF dan KNN efektif diterapkan untuk klasifikasi teks koleksi buku.
Downloads
References
Albab, M. Ulil, Yohana Karuniawati P., and Mohammad Nur Fawaiq. 2023. “Optimization of the Stemming Technique on Text Preprocessing President 3 Periods Topic.” Jurnal Transformatika 20(2): 1–12. https://journals.usm.ac.id/index.php/transformatika/article/view/5374.
Alvian, Verdi et al. 2021. “Klasifikasi Siswa Berprestasi Menggunakan Metode K-Nearest Neighbor (KNN) Pada SMA Negeri 2 Situbondo Classification Of Achieving Students Using K-Nearest Neighbor (KNN) Method At SMA Negeri 2 Situbondo.” Jurnal Smart Teknologi 1(1): 2774–1702.
Apriansyah, Ferryma Arba, Arief Hermawan, and Donny Avianto. 2024. “Optimization of K Value in KNN Algorithm for Spam and HAM Classification in SMS Texts.” International Journal Software Engineering and Computer Science (IJSECS) 4(2): 767–79. https://journal.lembagakita.org/ijsecs/article/view/2681.
Asiyah, Siti Nur, and Kartika Fithriasari. 2016. “Klasifikasi Berita Online Menggunakan Metode Support Vector Machine Dan K- Nearest Neighbor.” Jurnal Sains dan Seni ITS 5(2): 317–22.
Assidyk, Agung N, Erwin Budi Setiawan, and Isman Kurniawan. 2020. “Analisis Perbandingan Pembobotan TF-IDF Dan TF-RF Pada Trending Topic Di Twitter Dengan Menggunakan Klasifikasi K-Nearest Neighbor.” e-proceeding of Engineering 7(2): 9.
Dananjaya, I Kadek Wahyu, and I Gusti Ayu Agung Diatri Indradewi. 2023. “Perbandingan Metode Pembobotan TF-RF Dan TF-ABS Pada Kategorisasi Berita Di BDI Denpasar.” SINTECH (Science and Information Technology) Journal 6(1): 16–25. https://ejournal.instiki.ac.id/index.php/sintechjournal/article/view/1252.
Fadilla, Nurul. 2021. “Komparasi Pemikiran Berwick Sayers Dan Mary Mortimer Tentang Sistem Klasifikasi Perpustakaan.” Jurnal Pustaka Ilmiah 6(2): 1065. https://jurnal.uns.ac.id/jurnalpustakailmiah/article/view/46421.
Firmansyah, Ferdian, Lutfi Hakim, and Sepyan Purnama Kristanto. 2024. “Implementasi Metode MOORA Pada Sistem Pendukung Keputusan Pengadaan Buku Perpustakaan Implementation of the MOORA Method in the Library Book Procurement Decision Support System.” Sistemasi: Jurnal Sistem Informasi 13(5): 1876–92.
Hadiansyah, Zikri, Zaenur Rozikin, and Muhamad Fatchan. 2024. “Implementasi Algoritma K-Nearest Neighbor Dalam Klasifikasi Penyakit Kanker Paru Paru.” Journal of Computer System and Informatics (JoSYC) 6(1): 96–106. https://ejurnal.seminar-id.com/index.php/josyc/article/view/6195.
Hakim, Lutfi et al. 2021. “Disease Detection of Dragon Fruit Stem Based on The Combined Features of Color and Texture.” INTENSIF: Jurnal Ilmiah Penelitian dan Penerapan Teknologi Sistem Informasi 5(2): 161–75.
Harahap, Bella Lisda Hasunita, and Jazzimatul Husna. 2019. “Penerapan Sistem Klasifikasi Mandala Di Perpustakaan Gelaran Indonesia Buku Yogyakarta.” Jurnal Ilmu Perpustakaan 7(1): 181–90. https://ejournal3.undip.ac.id/index.php/jip/article/view/22829.
Manurung, Jonson, Hondor Saragih, Muhammad Azhar Prabukusumo, and Eryan Ahmad Firdaus. 2025. “Optimizing the Performance of the K-Nearest Neighbors Algorithm Using Grid Search and Feature Scaling to Improve Data Classification Accuracy.” Jurnal Mandiri IT 14(2): 260–68. www.ejournal.isha.or.id/index.php/Mandiri.
Muhammad Alwi, Oddy Virgantara Putra, and Dihin Muriyatmoko1. 2021. “Classification of Book Collections Based on DDC 23 Using Text Mining Algorithm at UNIDA Gontor Library.” Procedia of Engineering and Life Science 2. https://pels.umsida.ac.id/index.php/PELS/article/view/1164.
Nugraha, Wahyu, and Agung Sasongko. 2022. “Hyperparameter Tuning on Classification Algorithm with Grid Search.” SISTEMASI 11(2): 391. http://sistemasi.ftik.unisi.ac.id/index.php/stmsi/article/view/1750.
Ogunsanya, Michael, Joan Isichei, and Salil Desai. 2023. “Grid Search Hyperparameter Tuning in Additive Manufacturing Processes.” Manufacturing Letters 35: 1031–42. https://linkinghub.elsevier.com/retrieve/pii/S221384632300113X.
Pangestu, Mohamad Sugeng, and Maulida Ayu Fitriani. 2022. “Perbandingan Perhitungan Jarak Euclidean Distance, Manhattan Distance, Dan Cosine Similarity Dalam Pengelompokan Data Bibit Padi Menggunakan Algoritma K-Means.” Sainteks 19(2): 141. http://jurnalnasional.ump.ac.id/index.php/SAINTEKS/article/view/14495.
Rahmadhani, Sadesty et al. 2024. “Sistem Rekomendasi Penelusuran Buku Berbasis Content-Based Filtering Dengan Pembobotan TF-RF.” JIP (Jurnal Informatika Polinema) 10(4): 491–500. https://jurnal.polinema.ac.id/index.php/jip/article/view/5565.
Saadatfar, Hamid et al. 2020. “A New K-Nearest Neighbors Classifier for Big Data Based on Efficient Data Pruning.” Mathematics. https://www.semanticscholar.org/paper/632669af604dc2418f635b041573d1bb204378a3.
Saputra, Joni, Yuan Sa’adati, Valian Yoga Pudya Ardhana, and M Afriansyah. 2023. “Klasifikasi Kematangan Buah Alpukat Mentega Menggunakan Metode K-Nearest Neighbor Berdasarkan Warna Kulit Buah.” RESOLUSI : Rekayasa Teknik Informatika dan Informasi 3(5): 214–21. https://djournals.com/resolusi.
Saranya, G., and A. Pravin. 2023. “Grid Search Based Optimum Feature Selection by Tuning Hyperparameters for Heart Disease Diagnosis in Machine Learning.” The Open Biomedical Engineering Journal 17(1). https://openbiomedicalengineeringjournal.com/VOLUME/17/ELOCATOR/e187412072304061/.
Sari, Yuslena, Andreyan RIzky Baskara, Puguh Budi Prakoso, and Noorhanida Royani. 2022. “Perbandingan Metode Pembobotan Tf-Rf Dan Tf-Idf Dikombinasikan Dengan Weighted Tree Similarity Untuk Sistem Rekomendasi Buku.” Jurnal Teknologi Informasi dan Ilmu Komputer 9(6): 1323–32. http://localhost/jtiik.ub.ac.id/index.php/jtiik/article/view/5709.
Setiawan, Dita, Ali Muhammad, and Angge Firizkiansah. 2024. “Pengklasifikasian Dokumen Teks Bahasa Indonesia Berbasis Vektor Space Model Dengan Menggunakan Metode K-Nearest Neighbor (k-NN) Dan Euclidean Distance.” JIKOMTI : Jurnal Ilmiah Ilmu Komputer dan Teknologi Informasi 1(1): 30–37. https://ojs.sains.ac.id/index.php/Jikomti/article/view/37.
Sukamto, Hadiyanto, and Kurnianingsih. 2023. “KNN Optimization Using Grid Search Algorithm for Preeclampsia Imbalance Class” eds. R. Isnanto, Hadiyanto, and B. Warsito. E3S Web of Conferences 448: 02057. https://www.e3s-conferences.org/10.1051/e3sconf/202344802057.
Suryadi, Mulia Kevin et al. 2024. “Comparative Study of Various Hyperparameter Tuning on Random Forest Classification With SMOTE and Feature Selection Using Genetic Algorithm in Software Defect Prediction.” Journal of Electronics, Electromedical Engineering, and Medical Informatics. https://www.semanticscholar.org/paper/cf156c99e43cc894fb6d95103400a920af5bb9c1.
Sutianah, Tia, Petrus Sokibi, and Viar Dwi Kartika. 2024. “Sistem Klasifikasi Penentuan Penerima Bantuan Langsung Tunai Menggunakan Metode K-Nearest Neighbor.” Jurnal Eksplora Informatika 13(2): 145–55. https://eksplora.stikom-bali.ac.id/index.php/eksplora/article/view/907.
Taufiq, Akmal et al. 2024. “Comparison of Hyperparameter Tuning Techniques on KNN Algorithm to Find the Best K Value Using Grid Search and Random Search Methods.” In 2024 7th International Seminar on Research of Information Technology and Intelligent Systems (ISRITI), IEEE, 180–86. https://ieeexplore.ieee.org/document/10963519/.
Widyaningsih, Yekti, Graceilla Puspita Arum, and Kevin Prawira. 2021. “Aplikasi K-Fold Cross Validation Dalam Penentuan Model Regresi Binomial NEgatif Terbaik.” BAREKENG: Jurnal Ilmu Matematika dan Terapan 15(2): 315–22. https://ojs3.unpatti.ac.id/index.php/barekeng/article/view/3073.
Yunitarini, Rika, Jhon Filius Gultom, and Evy Maya Stefany. 2024. “Klasifikasi Jamu Tradisional Madura Menggunakan Metode K-Nearest Neighbors (KNN) Dan Term Frequency-Inverse Document Frequency (TF-IDF) Sebagai Representasi Teks.” Jurnal Informatika Polinema 11(1): 99–106. https://jurnal.polinema.ac.id/index.php/jip/article/view/6456.






