Author : Alvintha Maharani Hanafiah   , Ali Ridho Barakbah, Tita Karlita, Tri Hadiah Muliawati
ABSTRAK

Saat ini jumlah pasien penderita COVID19 di Indonesia belum menunjukkan penurunan yang signifikan. Salah satu penyebabnya adalah susahnya menganalisis data rekam medis pasien COVID19. Analisis tersebut menjadi susah karena banyaknya volume data dan karakteristik isi yang beragam (heterogen). Hal itulah yang membuat tenaga medis membutuhkan waktu lama dalam proses analisis data pasien COVID19, dan menyebabkan lambatnya penanganan kasus di Indonesia. Oleh karena itu, penelitian ini mengusulkan pendekatan baru untuk menganalisis dan mengklasifikasikan data rekam medis pasien COVID19 menggunakan pendekatan data analytics dengan metode descriptive dan predictive mining. Dimana metode descriptive mining disini menggunakan Hierarchical Clustering dengan Complete Linkage untuk mengelompokkan kategorisasi resiko penyakit pasien dan metode predictive mining menggunakan Decision Tree dan KNearest Neighbor (KNN) untuk mengklasifikasikan pasien positif/negatif. Data input yang digunakan untuk proses analisis tersebut bersumber dari hasil tes RTPCR pasien COVID-19. Sebelum dianalisis, data tersebut diproses terlebih dahulu dengan merubah semua nilainya menjadi decimal, lalu memisahkan antara data pasien positif dan negatif, selanjutnya dilakukan seleksi fitur dan reduksi baris, dan yang terakhir digabungkan lagi antara data pasien positif dan data pasien negatifnya. Dan fitur yang ditemukan pada akhir proses yakni sebanyak 19 fitur, diantaranya adalah Leukocytes, Eosinophils, Red blood cells, Patient age quantile, dll. Khusus untuk handling missing value, dilakukan imputasi menggunakan nilai rata-rata dari setiap kelasnya. Selanjutnya dilakukan proses descriptive mining dan predictive mining. Jika sudah, maka hasil dari proses tersebut ditesting menggunakan metrics error ratio dan confusion matrix. Dari keseluruhan proses tersebut diperoleh kesimpulan bahwa error ratio dari pendekatan ini adalah 8% untuk predictive mining dan 21% untuk descriptive mining.

[DOWNLOAD ABSTRACT]