Author : Amru Hasan   , Tessy Badriyah, Iwan Syarif
ABSTRAK

Klasifikasi merupakan sebuah model dalam data mining dimana, classifier dibangun untuk memprediksi label bertipe kategorikal. Salah satu dari metode klasifikasi adalah K-nearest neighbor (kNN). kNN adalah algoritma klasifikasi yang termasuk dalam kategori supervised learning (pembelajaran dengan supervisi) dimana hasil dari data yang baru diklasifikasikan berdasarkan mayoritas dari kategori K-tetangga terdekat. Salah satu faktor terpenting yang mempengaruhi kualitas dan kinerja dari hasil klasifikasi adalah nilai dari k (jumlah tetangga), yang sulit untuk ditentukan dengan pasti. Untuk mengoptimalisasi penentuan nilai k, maka pada proyek akhir ini mengimplementasikan pembangkitan nilai k dengan metode heuristik. Metode heuristik yang dipakai dapat menurunkan tingkat error melalui normalisasi data. Di samping itu digunakan penanganan nilai yang hilang (missing value) untuk meningkatkan kinerja dari metode kNN. Dari hasil pengujian, didapatkan peningkatan akurasi pada metode kNN setelah dilakukan optimalisasi penggunaan k dan penanganan missing value. Error rate (tingkat kesalahan) dapat direduksi secara signifikan.

[DOWNLOAD ABSTRACT]