Pengelompokan Data yang Memuat Pencilandengan Kriteria Elbowdan Koefisien Silhouette (Algoritme K-Medoids)
Abstract
Analisis kelompok adalah metode statistika multivariat yang bertujuan untuk mengelompokkan objek pengamatan yang memiliki kemiripan (karakteristik sama). Terdapat dua metode pengelompokan dalam analisis kelompok yaitu metode pengelompokan hierarchical (hierarki) dan nonhierarchical (nonhierarki). K-medoids merupakan metode pengelompokan nonhierarki yang mempartisi n data ke dalam k kelompok yang memiliki karakteristik sama dan menggunakan medoid (median) sebagai pusat kelompoknya. Dengan demikian, k-medoids ini robust terhadap adanya data pencilan. Dalam proses pengelompokan digunakan algoritme k-medoidsdengan kriteria elbow dan validasinya dengan koefisien silhouette. Kriteria elbow digunakan dengan melihat plot jumlah kuadrat sesatan (JKS) dari beberapa jumlah kelompok(k). Jika terbentuk siku (elbow) untuk nilai JKS pada suatu nilai k, maka nilai tersebut menjadi banyaknya kelompok yang akan dibentuk. Koefisien silhouette berada antara-1dan 1. Pada artikel ini dilakukan kajian kriteria elbow dan koefisien silhouette dengan algoritme k-medoids untuk pengelompokan data yang memuat pencilandan penerapannya pada kasus demam berdarah di Indonesia tahun 2016. Kajian menunjukkan bahwa pengelompokan kasus demam berdarah pada 34 provinsi di Indonesia tahun 2016 menghasilkan 3 kelompok dengan nilai koefisien silhouette sebesar 0.6409981.