implementasi metode knn untuk …dinus.ac.id/repository/docs/ajar/learning_05.pdfcontoh •terdapat...
TRANSCRIPT
K-Nearest Neighbor
• Metoda untuk mengelompokkan objek yang tidak diketahui ke dalam kelas yang terdekatdengan menggunakan ukuran jarak, biasanyamenggunakan Euclidian metric
• Jumlah tetangga (K) terdekat ditentukan olehuser
Sifat nearest neighbor
• Parametrik,tidak memperhatikan distribusi dari data yang ingin kita kelompokkan
• Sangat sederhana dan mudah diimplementasikan
• Mengandalkan pada training set dari obyek yang telahdiketahui anggota kelas untuk membuat keputusan anggotaobjek yang tidak diketahui
• Ukuran training set tidak terbatas
Teknik K-Nearest Neighbor
• Mulai input: data training, label data training, k, data testing
• Untuk semua data testing, hitung jaraknya ke setiap data training
• Tentukan k titik data training yang jaraknya paling dekat dengan data testing
• Periksa label dari k titik data ini
• Tentukan label yang frekuensinya paling banyak dari k titik data tsb.
• Masukkan data testing ke kelas dengan frekuensi paling banyak
• stop
• Kita menentukan tetangga yang akan dijadikan acuan.
• Jika tetangga terdekat yang ditentukan Cuma 1, maka data tersebutakan masuk pada A
• Jika tetangga terdekat yang ditentukan ada 3, maka data tersbut akanmasuk pada B
Contoh
• Terdapat 2 kelas (kelas merah dan kelas biru) dan 1 data tidakdiketahui.
• Kita tentukan bahwa k adalah kelas dan kita cari k-Nearest Neighbor
• Jika kita menetukan k=3, maka data tersebut masuk kedalam kelasmerah karena terdapat 2 merah dan 1 biru di dalam lingkaran yang kita tentukan
• Jika kita menentukan k=5, maka data tersebut masuk ke dalam kelasbiru karena terdapat 3 biru dan 2 merah di dalam lingkaran
Batasan :
Menggunakan metode KNN menggunakan fitur StastistikHistogram dengan konversi warna RGB, YCbCr, dan BW
Data yang digunakan adalah citra uang kertas rupiah dengan nominal Rp.1000; Rp.2000; Rp.5000; Rp.10.000; Rp.20.000;
Rp.50.000; Rp.100.000
Data citra yang digunakan adalah dengan ukuran 700 x 300 piksel, pengambilan citra menggunakan kamera DSLR Canon
dengan kondisi siang hari ruangan terbuka
Tujuan :
Mencari fitur terbaik antara warna RGB, YCbCr
atau BW untuk pengenalan nominal mata uang.
Ekstraksi Fitur Statistik dari Histogram
Tekstur Berbasis
Histogram
rerata intensitas
standart deviasi
skewness
entropi
energi
smoothness
1 5 4 7 3
6 3 1 0 6
7 4 5 2 7
2 6 7 1 4
3 1 5 3 2
i P(i)
0 1/25
1 4/25
2 3/25
3 4/25
4 3/25
5 3/25
6 3/25
7 4/25
RERATA INTENSITAS (m)
Contoh Ekstraksi Fitur Statistik Histogram
SMOTHNESS (R)
Rerata Intensitas 3,8
Standart Deviasi 5,34
Skewness 0,2588
Energi 0,04
Entropi 0,879932
Smothness 0,96
K-Nearest Neighbor (KNN)
Algoritma k-nearest neighbor (k-NN atau KNN) adalah
sebuah metode untuk melakukan klasifikasi terhadap objek
berdasarkan data pembelajaran yang jaraknya paling dekat
dengan objek tersebut.
Pada fase klasifikasi, fitur – fitur yang
sama dihitung untuk testing data.
Jarak dari vektor yang baru ini
terhadap seluruh vektor training
sample dihitung, dan sejumlah k buah
yang paling dekat diambil.
Dari hasil sorting perhitungan jarak yang
sudah di dapatkan dan berdasarkan
ketentuan ketetanggan terdekat adalah
k=1 maka di dapatkan hasil pengenalan
uang Rp 5000.