-->
g2QFCKwavghUp2yzjKrIFwEeG13RASCerFTCMH35

KDD Dan Data Mining

Hasil gambar untuk Pengertian Data Mining

Knowledge Discovery and Data Mining

Database sekarang dapat memiliki besar sampai hitungan terrabyte. Dalam data yang besar ini tersembunyi informasi yang bersifat strategik. Tapi dengan banyaknya data, timbul masalah untuk menggali informasi yang berguna dari data.
Banyak perusahaan telah mengumpulkan data berkuantitas besar. Teknik data mining dapat diimplementasikan ke platform software dan hardware yang sudah ada untuk meningkatkan nilai dari sumberdaya informasi yang sudah ada. Implementasi data mining pada client/server berperforma tingi atau komputasi paralel dapat menganalisis database yang besae untuk menjawab pertanyaan seperti,”Klien mana yang paling mungkin merespon surat promosi kami selanjutnya, dan kenapa?”

Pengertian

Knowledge Discovery and Data Mining(KDD) adalah proses yang dibantu oleh komputer untuk menggali dan menganalisis sejumlah besar himpunan data dan mengekstrak informasi dan pengetahuan yang berguna. Data mining tools memperkirakan perilaku dan tren masa depan, memungkinkan bisnis untuk membuat keputusan yang proaktif dan berdasarkan pengetahuan. Data mining tools mampu menjawab permasalahan bisnis yang secara tradisional terlalu lama untuk diselesaikan. Data mining tools menjelajah database untuk mencari pola tersembunyi, menemukan infomasi yang prediktif yang mungkin dilewatkan para pakar karena berada di luar ekspektasi mereka.

Proses Data Mining

Proses dalam KDD adalah proses yang digambarkan pada dan terdiri dari rangkaian proses iteratif sebagai berikut:
1. Data cleaning, menghilangkan noise dan data yang inkonsisten.
2. Data integration, menggabungkan data dari berbagai sumber data yang berbeda
3. Data selection, mengambil data yang relevan dengan tugas analisis dari database
4. Data transformation, Mentransformasi atau menggabungkan data ke dalam bentuk yang sesuai untuk penggalian lewat operasi summary atau aggregation.
5. Data mining, proses esensial untuk mengekstrak pola dari data dengan metode cerdas.
6. Pattern evaluation, mengidentifikasikan pola yang menarik dan merepresentasikan pengetahuan berdasarkan interestingness measures.
7. Knowledge presentation, penyajian pengetahuan yang digali kepada pengguna dengan menggunakan visualisasi dan teknik representasi pengetahuan.
Proses KDD

Metode

Banyak teknik dan metode yang ada untuk melakukan berbagai jenis tugas data mining. Metode ini dikelompokkan dalam 3 paradigma utama data mining: Predictive Modeling, Discovery, danDeviation Detection.

 Predictive Modeling

Aplikasi Predictive Modeling menghasilkan klasifikasi atau prediksi. Tujuan dari predictive modelingadalah menemukan pola yang melibatkan variabel untuk memprediksi dan mengklasifikasi perilaku masa depan dari sebuah entitas. Ada dua tipe masalah yang diselesaikan oleh predictive modeling: klasifikasi dan regresi.
Klasifikasi melibatkan model pembelajaran yang memetakan (atau mengklasifikasi) data contoh ke dalam satu atau beberapa kelas yang telah didefinisikan. Sebagai contoh, bank dapat menggunakan skema klasifikasi untuk menentukan pengajuan pinjaman yang akan disetujui. Teknik klasifikasi meliputi Naive Bayesian, neural networks, dan decision trees.
Regresi melibatkan model yang memetakan data contoh ke prediksi real-valued. Teknik regresi meliputi neural networks dan decision (atau regression) trees.

 Discovery

Aplikasi discovery adalah pendekatan eksploratoris untuk analisis data. Aplikasi discoverymenggunakan teknik yang menganalisis data set yang besar untuk menemukan association rules(atau pola), atau menemukan kluster dari sampel yang dapat dikelompokan. Hasil dari metode discoveryumumnya dimaksudkan untuk pengguna. Walau begitu, hasilnya juga dapat diaplikasikan ke metode data mining yang lain

 Deviation Detection

Deviation Detection melakukan deteksi anomali secara otomatis. Tujuannya untuk mengidentifikasi kebiasaan suatu entitas dan menetapkan sejumlah norm melalui pattern discovery. Sampel yang berdeviasi dari norm lalu diidentifikasi sebagai tidak biasa. teknik Deviation Detection melalui visualisasi melalui parallel coordinates, scatterplots, dan surface plots.
Klasifikasi Metode

 Aplikasi

Aplikasi dari KDD dalam bisnis antara lain:
§ Market segmentation – Mengidentifikasi karakteristik umum dari pelanggan yang membeli produk yang sama dari perusahaan
§ Customer churn – Memprediksi pelanggan yang mungkin meninggalkan perusahaan untuk beralih ke kompetitor
§ Fraud detection – Mengidentifikasi transaksi yang mungkin merupakan transaksi curang.
§ Direct marketing – Memprediksi prospek yang harus dimasukkan dalam mailing-list untuk mendapatkan respon maksimum
§ Interactive marketing – Memprediksi hal-hal yang menarik bagi setiap individu yang mengakses website.
§ Market basket analysis – Memahami produk atau layanan yang biasanya dibeli bersamaan.
§ Trend analysis – Mengungkap perbedaan antara tipikal pelanggan bulan ini dan bulan lalu dan prediksi tipikal pelanggan bulan depan.

Sumber : dnial.wordpress.com
Related Posts

Related Posts

Post a Comment