Metode Dasar Clustering (Partisi)

Salah satu metode yang banyak digunakan dalam melakukan clustering dengan partisi ini adalah metode k-means.

Secara umum metode k-means ini melakukan proses pengelompokan dengan prosedur sebagai berikut:

-Tentukan jumlah cluster
-Alokasikan data secara random ke cluster yang ada
-Hitung rata-rata setiap cluster dari data yang tergabung di dalamnya
-Alokasikan kembali semua data ke cluster terdekat
-Ulang proses nomor 3, sampai tidak ada perubahan atau perubahan yang terjadi masih sudah di bawah treshold

Misalkan, ditentukan satu set object sebanyak n, metode partisi akan membuat partisi data sebanyak k, dimana setiap partisi akan mewakili satu cluster dan k <= n. Artinya, metode ini akan membagi data menjadi kelompok/grup sebanyak k sedemikian rupa sehingga masing-masing kelompok/grup berisi minimal satu object. Dengan kata lain, metode partisi melakukan partisi satu-tingkat pada dataset. Metode-metode partisi dasar biasanya mengadopsi apa yang disebut dengan exclusive cluster separation (atau pemisahan cluster ekslusif). Artinya, masing-masing object harus tepat masuk dalam satu kelompok/grup. Syarat ini bisa dilonggarkan, misalnya, dalam berbagai teknik partisi samar (fuzzy).

Kebanyakan metode-metode partisi adalah berbasiskan jarak (distance-based). Misalnya, ditentukan k, yaitu jumlah partisi yang akan dibuat, metode partisi akan membuat partisi awal. Kemudian, metode ini menggunakan teknik pemindahan object secara iteratif untuk mencoba memperbaiki partisi dengan memindah-mindahkan object-object dari satu kelompok/grup ke kelompok/grup lainnya.

Tinggalkan komentar