Data Mining Dalam Proses KDD (Knowledge Data Discovery)
Data Selection
Pada proses ini, seluruh data yang ada si data base dihimpun dan dipilih menjadi target data. Seleksi data ini dilakukan sebelum tahap penggalian informasi yang lebih dalam. Data disimpan dalam berkas terpisah.
Pre-processing/ Cleaning
Proses pembersihan dari noise yang mengganggu data yang relevan. Proses cleaning mencakup pembuangan data yang dupliat, memeriksa data yang inkonsisten, memeperbaiki kesalahan data seperti kesalahan cetak (tipografi). Dilakukan juga proses enrichmnent yaitu menambah data ekternal yang mungkin bisa memperkaya informasi yang berkaitan.
Transformation
Seluruh data yang tealh di perkaya dan dipilih mengalami perubahan (transformasi) sesuai kebutuhan pada proses data mining. Intinya, data disesuaikan agar bisa diolah pada data mining.
Data mining
Pemilihan data yang berkaitan dengan kebutuhan. Pemilihan tersebut terdiri dari klasifikasi, regresi, clustering, dan lainnya. Proses pencarian data yang menarik menggunakan metode tertentu yang sesuai dengan tujuan dan proses KDD secara keseluruhan.
Interpretation/ Evaluation
Pola yang dihasilkan oleh data mining diterjemahkan sehingga lebih dimengerti. Tahap ini akan memeriksa apakah ada data yang bertentangan atau berbeda dengan hipotesa yang sudah dibuat sebelumnya.
Arsitektur Data Mining
1. Data cleaning: membuang data yang tidak perlu atau noise
2. Data integration : menggabungkan data dari banyak sumber
3. Data Mining Engine : Mentranformasikan data agar bisa diolah oleh data mining
4. Pattern evaluation : untuk menemukan data yang bernilai lewat knowledge base.
5. Graphical User Interface (GUI) : untuk end user.
Kelebihan dan Kekurangan Data Mining
Kelebihan:
- Tidak perlu lagi jasa dalam menganalisa data perusahaan dengan cara manual karena sudah ada piranti lunak data mining yang bisa memprediksi target ke depan.
- Meminimalkan biaya riset.
- Meminimalkan kemungkinan kerugian ke depannya.
- Khususnya bagi pemasaran interaktif, para pelaku bisnis yangv baru ingin membuat web, data mining membantu untuk penyusunan konten. Hal ini bisa membuat web perusahaan menjadi lebih efektif.
Kelemahan:
Data perusahaan yang tidak lengkap membuat sistem data mining kurang akurat, terlebih bila data tersebut penting dan relevan, kelompok data yang tidak konsisten bisa membuat data sulit teranalisa. Misalnya: data customer tidak di update, sehingga customer yang tidak loyal masih masuk dalam customer tetap.
Penggunaan Data Mining
- Perusahaan kartu kredit dapat memanfaatkan data transaksi pelanggan-pelanggannya untuk merancang produk kredit baru yang akan menarik minat para customer tersebut.
- Perusahaan produk makanan atau kebutuhan keseharian bisa menggunakan data mining untuk meningkatkan penjualan produk ke retailer. Dengan melihat data customer, pengiriman, competitor, kita bisa menganalisis sebab mengapa customer berpindah ke produk lainnya dan bisa menyususn strategi pemasaran baru yang lebih efektif.
- Perusahaan farmasi bisa melihat aktivitas penjualan terkininya dan menargetkan produk apa yang kedepannya bisa lebih berkembang atau laku dipasaran.
Sumber : xerma.blogspot.co.id