Quality Threshold Clustering
Quality Threshold (QT) Clustering merupakan sub ilmu dari Data Mining dan Soft Computing.
Quality Threshold (QT) Clustering adalah salah satu metode clustering yang awalnya ditemukan untuk melakukan pengelompokan gene. Adapun algoritma yang digunakan adalah sebagai berikut:
- Tentukan diameter maksimum dari cluster
- Bangun kandidat cluster untuk setiap data dengan memasukkan data terdekat, data terdekat selanjutnya dan seterusnya, sampai diameter dari cluster melewati batas threshold.
- Simpan kandidat cluster dengan data terbanyak sebagai cluster terpilih pertama dan hilangkan semua data yang termasuk di dalam cluster tersebut untuk proses selanjutnya.
- Ulangi dengan kumpulan data yang telah dikurangi tersebut.
Beberapa hal yang terkait dengan QT Clustering ini adalah:
- Clustering jenis ini memerlukan kemampuan komputer yang lebih dibandingkan dengan K-Means
- Clustering jenis ini tidak perlu menentukan jumlah cluster di awal
- Selalu memberikan hasil clustering yang sama
- Jarak antara suatu data ke suatu cluster dihitung menggunakan metode complete linkage (jarak data tersebut ke semua data yang ada di dalam cluster tersebut).
Referensi:
Heyer, L.J., Kruglyak, S. and Yooseph, S. (1999), Exploring Expression Data: Identification and Analysis of Coexpressed Genes, Genome Research 9:1106-1115.
Heyer, L.J., Kruglyak, S. and Yooseph, S. (1999), Exploring Expression Data: Identification and Analysis of Coexpressed Genes, Genome Research 9:1106-1115.
Sumber:yudiagusta.wordpress.com