Panduan clustering

K-Means Clustering: Cara Mesin Mengelompokkan Data Tanpa Label

Pelajari cara kerja K-Means Clustering secara visual dan ikuti animasi perpindahan centroid step-by-step.

Tim editorialscikit-learn Clustering Guide11 menit baca341 kata
Ilustrasi artikel K-Means Clustering: Cara Mesin Mengelompokkan Data Tanpa Label

Bagaimana toko online tahu kamu termasuk tipe pembeli hemat, pemburu diskon, atau pelanggan premium jika tidak ada label? Salah satu pendekatan awal adalah clustering, dan K-Means adalah algoritma clustering yang paling mudah divisualisasikan.

Unsupervised learning singkat

K-Means bekerja tanpa label target. Ia tidak diberi jawaban benar. Tugasnya adalah mencari struktur: titik mana yang saling berdekatan dan bisa dianggap satu kelompok.

Ide dasar K-Means

Kita memilih jumlah cluster K. Algoritma lalu menempatkan centroid, yaitu pusat sementara tiap cluster. Setiap titik masuk ke centroid terdekat, centroid digeser ke rata-rata titik anggotanya, lalu proses diulang sampai stabil.

min sum ||x_i - mu_k||^2Tujuan K-Means adalah meminimalkan jarak kuadrat titik ke centroid cluster terdekat.

Langkah algoritma

  1. Inisialisasi K centroid.
  2. Assign setiap titik ke centroid terdekat.
  3. Hitung ulang centroid sebagai rata-rata cluster.
  4. Ulangi sampai centroid tidak banyak bergerak.
Centroid bergerak
AwalCentroid acak, cluster belum stabil.
KonvergenCentroid berhenti banyak berubah.

Cara memilih K

Elbow method membantu membaca jumlah cluster yang masuk akal. Kita coba beberapa K, hitung inertia, lalu cari titik siku ketika penurunan error mulai melambat. Tetapi elbow bukan aturan mutlak; konteks data tetap penting.

Kelemahan K-Means

K-Means sensitif terhadap inisialisasi, skala fitur, dan bentuk cluster. Ia cenderung cocok untuk cluster yang relatif bulat. Untuk bentuk bulan sabit atau density tidak rata, metode lain bisa lebih cocok.

Buka lab K-Means, jalankan Step, dan amati centroid bergerak. Setelah itu coba PCA untuk mereduksi fitur sebelum clustering, atau bandingkan dengan KNN yang namanya mirip tetapi supervised.

POIN PENTING

Ringkasan praktis

  • Pelajari cara kerja K-Means Clustering secara visual dan ikuti animasi perpindahan centroid step-by-step.
  • Mulai dari intuisi visual, lalu cocokkan dengan rumus, contoh, dan batasan penggunaannya.
  • Gunakan lab interaktif untuk menguji konsep setelah membaca, terutama jika artikel membahas metode atau evaluasi model.
FAQ SINGKAT

Pertanyaan yang sering muncul

Siapa yang cocok membaca artikel ini?

Pembaca yang ingin memahami clustering dengan bahasa Indonesia yang praktis, tanpa kehilangan konteks teknis penting.

Apa langkah berikutnya setelah membaca?

Coba ulang konsep dengan data kecil, bandingkan hasilnya, lalu buka artikel terkait atau eksperimen interaktifnya agar pemahaman tidak berhenti di teori.

Jalankan iterasi centroid otomatis atau satu per satuUbah parameter dan lihat konsep bekerja langsung pada kanvas.
Buka lab interaktif →
SUMBER ASLI

scikit-learn Clustering Guide

Lanjutkan membaca pada sumber penerbit untuk mendapatkan konteks lengkap.

Buka sumber asli →
BACA JUGA

Artikel terkait