Satu decision tree mudah dijelaskan, tetapi sering terlalu percaya diri pada data latih. Random Forest memakai ide sederhana: daripada bertanya pada satu pohon, minta banyak pohon memberi suara.
Decision Tree: jelas tetapi mudah overfit
Decision Tree membagi data dengan aturan seperti x1 <= 0.3 atau x2 <= 0.6. Setiap split dipilih untuk membuat kelas di cabang menjadi lebih murni. Ukuran yang sering dipakai adalah Gini impurity.
Gini = 1 - sum p_k^2Semakin kecil Gini, semakin murni kelas pada node.prediksi RF = mode(h_1(x), ..., h_T(x))Random Forest mengambil suara mayoritas dari banyak pohon.Masalah satu pohon
Jika kedalaman terlalu besar, pohon dapat menghafal noise. Boundary menjadi patah-patah dan performa pada data baru menurun. Inilah overfitting: model terlihat pintar saat latihan, tetapi rapuh saat ujian.
Random Forest sebagai panel ahli
Random Forest membuat banyak pohon dari sampel bootstrap dan subset fitur acak. Tiap pohon melihat versi data yang sedikit berbeda. Kesalahan satu pohon tidak selalu diulang pohon lain, sehingga voting ensemble menjadi lebih stabil.
Coba dua lab sekaligus
- Buka Decision Tree dan ubah kedalaman maksimum.
- Lihat arsitektur pohon dan perhitungan Gini.
- Buka Random Forest.
- Naikkan jumlah pohon dan perhatikan boundary menjadi lebih stabil.
Kapan Random Forest kurang cocok?
Random Forest lebih sulit dijelaskan daripada satu tree. Untuk sistem real-time sangat ketat, banyak pohon juga bisa lebih berat. Jika butuh interpretasi aturan sederhana, Decision Tree masih berguna. Jika butuh akurasi tabular stabil, Random Forest sering menjadi baseline kuat.
Bandingkan juga dengan SVM, KNN, dan Gradient Descent agar intuisi pemilihan model lebih matang.
Ringkasan praktis
- Mengapa Random Forest sering lebih stabil dari Decision Tree? Pahami ensemble learning dengan visualisasi decision boundary interaktif.
- Mulai dari intuisi visual, lalu cocokkan dengan rumus, contoh, dan batasan penggunaannya.
- Gunakan lab interaktif untuk menguji konsep setelah membaca, terutama jika artikel membahas metode atau evaluasi model.
Pertanyaan yang sering muncul
Siapa yang cocok membaca artikel ini?
Pembaca yang ingin memahami ensemble dengan bahasa Indonesia yang praktis, tanpa kehilangan konteks teknis penting.
Apa langkah berikutnya setelah membaca?
Coba ulang konsep dengan data kecil, bandingkan hasilnya, lalu buka artikel terkait atau eksperimen interaktifnya agar pemahaman tidak berhenti di teori.
Random Forests, Leo Breiman
Lanjutkan membaca pada sumber penerbit untuk mendapatkan konteks lengkap.
Buka sumber asli →