Teknik Analisis Statistika yang bisa dilakukan dalam Data Mining
Berikut adalah beberapa teknik analisis statistika yang sering digunakan dalam Data Mining :
- Deskripsi
Analisis secara deskriptif merupakan bentuk analisis data yang sederhana yang sering digunakan oleh analis atau peneliti. Deskripsi suatu data dapat disajikan dalam bentuk penjelasan secara grafis melalui suatu pola atau tren tertentu. Model-model dalam data mining harus se-transparan mungkin. Artinya hasil dari model data mining harus menggambarkan pola yang jelas dan dapat diinterpretasikan dengan baik. - Klasifikasi
Teknik analisis data menggunakan klasifikasi bertujuan untuk mengelompokkan sejumlah data ke dalam kategori-kategori tertentu. Misalkan terdapat data hasil ujian mata kuliah Teori Statistika Mahasiswa Jurusan Statistika Universitas A. Kemudian data nilai ujian tersebut akan diklasifikasikan dalam 3 (tiga) kategori, yaitu Sangat Memuaskan, Cukup Memuaskan, dan Kurang Memuaskan. Pengklasifikasian tersebut dibuat berdasarkan kriteria atau batasan tertentu. - Klaster
Pengklasteran adalah teknik mengumpulkan data atau hasil observasi yang sama atau memiliki kemiripan satu sama lain dalam satu kelompok yang sama, sedangkan hasil observasi lain yang berbeda dikumpulkan dalam klaster lain. Pengklasteran berbeda dengan pengklasifikasian, di mana tidak ada target variabel yang akan diklasterkan. Pengklasteran bukan untuk mengklasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Pengklasteran dilakukan untuk mengelompokkan data set ke dalam kelompok yang homogen, di mana tingkat kehomogenan data/unit dalam klaster dimaksimumkan, sedangkan kehomogenan data/unit antar klaster diminimumkan.
Sumber :masakdata.com