ANALISA SISTEM KLASIFIKASI JUDUL SKRIPSI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER
DOI:
https://doi.org/10.33795/jip.v5i1.261Keywords:
klasifikasi, persebaran judul skripsi, Naïve Bayes ClassifierAbstract
Skripsi adalah hasil karya tulis ilmiah yang berbasis pada penelitian dengan mengulas permasalahan beserta solusi yang dihasilkan pada disiplin ilmu tertentu. Hal ini juga didukung oleh rujukan pustaka terdahulu, beserta temuan dari hasil pengembangan eksperiman, pengamatan dengan arahan dosen pembimbing. Pada Jurusan Teknik Informatika Politeknik Negeri Malang terdapat banyak judul skripsi dalam berbagai bidang yang telah dibuat, tetapi judul tersebut belum terklasifikasikan kedalam bidangnya masing-masing. Berangkat dari masalah yang ada, dibuatlah sistem klasifikasi judul skripsi dengan mengambil studi kasus dijurusan Teknologi Informasi Politeknik Negeri Malang. Pada sistem ini data judul skripsi akan dikategorikan kedalam daftar bidang keahlian Teknik Informatika, sehingga setiap judul akan memiliki label sesuai dengan kategori bidang keahlian yang ada. Mengacu pada Association for Computing Machinery (ACM) terdapat 24 kategori bidang keahlian diantaranya : Networking, Information Management, Web and Mobile System, Platform Technology, System Integration, Software Fundamental, Cyber Security, Global Prfessional Practice, System Administration and Maintenance, Applied Network, Data Scalability, Integrated System, IoT, Software development Management, User Experience Desain, Virtual System and Services, Social Responsibility, Mobile Aplication, Cloud Computing, Information Retrival, Digital Image Processing, CyberSecurity Emerging Challenges, Geographical Information Service dan Game Development.Pengkategorian judul skripsi sangat diperlukan untuk mengetahui persebaran judul skripsi pada masing-masing kategori. Penelitian ini bertujuan untuk mengkategorikam judul skripsi dibidang informatika kedalam 24 kategori menggunakan Naïve Bayes Classifier, karena menurut penelitian sebelumnya metode tersebut memberikan nilai akurasi yang cenderung baik. Pengujian algoritma menggunakan data training pada 50 judul, 100 judul dan 150 judul menghasilkan nilai akurasi sebesar 52%, 56% dan 58%. Berdasarkan penelitian tersebut dapat disimpulkan bahwa semakin banyak data training yang digunakan, maka nilai akurasi akan semakin meningkat.