Algoritma Nearest Neighbor
Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat mem[erkirakan kelas dari suatu objek yang labelnya belum diketahui. Model itu sendiri dapat berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural network. Salah satu metode klasifikasi yaitu Nearest Neighbor.
Nearest Neighbor merupakan metode untuk mengklasifikasikan suatu data baru berdasarkan similaritas atau kemiripan dengan labeled data. Similaritas menggunakan metrik jarak dengan satuan Euclidian. Macam-macam algoritma Nearest Neighbor yaitu:
- Algoritma 1-NN
Pengklasifikasian dilakukan terhadap 1 labeled data terdekat. Berikut ini adalah ilustrasi algoritma 1-NN:
Pada ilustrasi diatas, data baru (node warna biru) akan diklasifikasikan ke dalam kelompok hipertensi dan tidak hipertensi. Dari kelima data yang tersebar dalam kelompok hipertensi dan tidak hipertensi, data input (node biru) lebih dekat dengan salah satu pada kelompok hipertensi. Dengan demikian, dapat disimpulkan bahwa data baru tersebut termasuk ke dalam kelompok hipertensi.
Rumus euclide distance yang digunakan dalam metode 1-NN untuk mengambil keputusan dengan menghitung jarak terpendek antara input dengan masing-masing data yang penentuan bobot atau label dilakukan secara acak atau random yaitu:
- Algoritma K-NN
Pengklasifikasian dilakukan terhadap k labeled data terdekat. Dimana k>1. Berikut ini adalah ilustrasi algoritma K-NN:
Langkah-langkah dalam metode K-NN adalah sebagai berikut:
- Tentukan k.
- Hitung jarak antara data baru ke setiap labeled data.
- Tentukan k labeled data yang mempunyai jarak yang paling minimal.
- Klasifikasikan data baru ke dalam labeled data yang mayoritas.
Sumber :paninalone.wordpress.com