Bagaimana mesin bisa membedakan tepi, pola, dan objek dari gambar? CNN atau Convolutional Neural Network memulai semuanya dari operasi lokal: kernel kecil menyapu piksel dan menghasilkan feature map.
Gambar adalah matriks angka
Citra digital tersusun dari piksel. Pada grayscale, tiap piksel punya satu nilai intensitas. Pada RGB, tiap piksel punya tiga channel: merah, hijau, dan biru. CNN membaca angka-angka ini, bukan melihat gambar seperti manusia.
Konvolusi
Kernel adalah matriks kecil, misalnya 3 x 3. Kernel ditempelkan ke area gambar, setiap nilai dikalikan dengan piksel yang sejajar, lalu semua hasil dijumlahkan. Nilai inilah yang mengisi satu sel feature map.
Y[i,j] = sum_m sum_n X[i+m,j+n] * K[m,n] + bX adalah input, K adalah kernel, b adalah bias, dan Y adalah feature map.Dari feature map ke arsitektur CNN
Layer konvolusi mendeteksi pola lokal. ReLU membuat nilai negatif menjadi nol agar aktivasi lebih sederhana. Pooling merangkum area kecil agar representasi lebih tahan terhadap pergeseran. Fully connected layer di akhir mengubah fitur menjadi prediksi kelas.
Coba langsung
- Buka lab CNN.
- Edit pola piksel input.
- Pilih kernel edge, blur, atau sharpen.
- Tekan Run dan lihat posisi kernel berjalan.
- Bandingkan tampilan matriks angka dengan tampilan citra skala.
Transfer learning
Dalam proyek nyata, kita jarang melatih CNN besar dari nol. Model pretrained seperti ResNet, VGG, atau MobileNet sering dipakai sebagai ekstraktor fitur, lalu disesuaikan untuk dataset baru.
Sebelum CNN, pahami juga RGB Channel dan RGB ke HSV. Keduanya membantu menjelaskan bagaimana citra disusun sebelum masuk ke model.
Ringkasan praktis
- Pahami cara kerja CNN dari nol, edit pixel sendiri, pilih kernel, dan lihat feature map dihitung langsung.
- Mulai dari intuisi visual, lalu cocokkan dengan rumus, contoh, dan batasan penggunaannya.
- Gunakan lab interaktif untuk menguji konsep setelah membaca, terutama jika artikel membahas metode atau evaluasi model.
Pertanyaan yang sering muncul
Siapa yang cocok membaca artikel ini?
Pembaca yang ingin memahami deep learning dengan bahasa Indonesia yang praktis, tanpa kehilangan konteks teknis penting.
Apa langkah berikutnya setelah membaca?
Coba ulang konsep dengan data kecil, bandingkan hasilnya, lalu buka artikel terkait atau eksperimen interaktifnya agar pemahaman tidak berhenti di teori.
Stanford CS231n dan Deep Learning Guides
Lanjutkan membaca pada sumber penerbit untuk mendapatkan konteks lengkap.
Buka sumber asli →