PENINGKATAN KINERJA ALGORITMA k-NEAREST NEIGHBOURS (kNN) DENGAN PENANGANAN MISSING VALUE DAN PENGGUNAAN METODE HEURISTIK UNTUK MENGOPTIMALISASI NILAI k
ABSTRAK
Klasifikasi merupakan sebuah model dalam data mining dimana, classifier dibangun untuk memprediksi label bertipe kategorikal. Salah satu dari metode klasifikasi adalah K-nearest neighbor (kNN). kNN adalah algoritma klasifikasi yang termasuk dalam kategori supervised learning (pembelajaran dengan supervisi) dimana hasil dari data yang baru diklasifikasikan berdasarkan mayoritas dari kategori K-tetangga terdekat. Salah satu faktor terpenting yang mempengaruhi kualitas dan kinerja dari hasil klasifikasi adalah nilai dari k (jumlah tetangga), yang sulit untuk ditentukan dengan pasti. Untuk mengoptimalisasi penentuan nilai k, maka pada proyek akhir ini mengimplementasikan pembangkitan nilai k dengan metode heuristik. Metode heuristik yang dipakai dapat menurunkan tingkat error melalui normalisasi data. Di samping itu digunakan penanganan nilai yang hilang (missing value) untuk meningkatkan kinerja dari metode kNN. Dari hasil pengujian, didapatkan peningkatan akurasi pada metode kNN setelah dilakukan optimalisasi penggunaan k dan penanganan missing value. Error rate (tingkat kesalahan) dapat direduksi secara signifikan.
[DOWNLOAD ABSTRACT]Kategori
D3 Teknik ElektronikaD3 Teknik Telekomunikasi
D3 Teknik Elektro Industri
D3 Teknik Informatika
D3 Teknologi Multimedia Broadcasting
D4 Teknik Elektronika
D4 Teknik Telekomunikasi
D4 Teknik Elektro Industri
D4 Teknik Informatika
D4 Teknik Mekatronika
D4 Teknik Komputer
D4 Teknik Teknologi Game
S2 Teknik Elektro
S2 Teknik Informatika dan Komputer