Author : Muhammad Alfian   , Ali Ridho Barakbah, Muhammad Febrian Ardiansyah
ABSTRAK

Terdapat 43.000 media online di Indonesia yang setiap jamnya menerbitkan sedikitnya satu hingga dua berita. Besarnya informasit ersebut melebihi kapasitas pemrosesan manusia, sehingga mengakibatkan beberapa dampak bagi manusia seperti kebingungan dan tekanan psikologis. Penelitian ini mengusulkan teknik representasi berita menggunakan metode Automatic Incremental Clustering, untuk membantu manusia memilah berita secara efektif. Pengelompokkan berita berbasis information retrieval memungkinkan berita terkelompok sesuai dengan informasi yang sama. Sistem ini berjalan secara incremental pada big data environment untuk memaksimalkan performa pemrosesan data dalam jumlah besar. Hasil percobaan menunjukkan dari 3.000 berita didapatkan 388 cluster sebagai predefined cluster dengan satu cluster sebagai unknown cluster. Data berita yang berjalan streaming berjumlah 12.164 berita selama 3 hari diolah menggunakan Incremental Clustering menghasilkan 490 cluster baru. Hasil evaluasi yang diambil dari 50 sampel cluster lama dan 50 cluster baru menunjukkan nilai akurasi algoritma Automatic Incremental Clustering sebesar 88%. Berita dapat terkelompok berdasarkan informasi yang sama, namun pada beberapa kasus terdapat cluster yang kurang tepat. Hal tersebut menjadi masukan bagi penelitian setelahnya, untuk dapat memperhatikan semantik dan pola perkembangan cluster.

[DOWNLOAD ABSTRACT]