- Back to Home »
- Contoh Penerapan Kasus Pada Data Mining Beserta Penjelasannya
Posted by : Unknown
Saturday, April 7, 2018
Nama : Asep Kurniawan
NPM : 1B117041
Penerapan Kasus
Pada Data Mining
Pertumbuhan
data yang ekplosif disimpan dalam database-database sementara yang
bersifat operasional. Dengan berjalannya waktu, database tersebut menjadi
gudang data atau lebih dikenal dengan data warehouse. Di dalam data warehouse
ini tersimpan banyak sekali data yang telah direkap setiap harinya. Melalui
data-data ini lah terdapat informasi yang harus digali untuk menunjang proses
bisnis yang ada dalam menjalankan visi misi perusahaan.
Dibutuhkan
suatu teknik untuk menggali informasi yang terdapat pada data warehouse
tersebut. Lahirlah data mining, yaitu suatu teknik untuk meng-ekstrasi suatu
pola dari data. Data mining diterapkan dengan paradigma untuk melihat informasi
yang tersembunyi. Proses pencarian ini dilakukan secara otomatis terhadap pola
dalam data dengan jumlah besar dengan menggunakan teknik-teknik seperti
klasifikasi, clustering, dll. Data mining adalah suatu multidisiplin ilmu yang
kompleks dan beririsan dengan ilmu lain seperti statistika, database,
information retrieval, machine learning, pattern recognition, algoritma dan
ilmu lainnya.
Data
mining yang diartikan sebagai penggalian data merupakan suatu proses pencarian
otomatis terhadap pola dalam data yang melibatkan data dalam jumlah besar
dengan menggunakan perangkat seperti clustering, pengelompokan, dll. Data
mining diterapkan dengan tujuan untuk menemukan informasi yang “tersembunyi”
didalam data, oleh sebab itu data mining juga dikenal dengan nama Knowledge
Discovery in Database (KDD)
Sebagai
contoh kasus data mining yang terjadi yaitu data transaksi disebuah supermarket
dapat berjumlah ribuan dalam periode singkat dan terus bertambah. Seringkali
perusahaan hanya membiarkan data tersebut menggunung untuk laporan transaksi,
tetapi dengan data mining kita dapat menggali informasi yang sangat
berharga dari data tersebut, misalnya asosiasi antar produk yang dapat
digunakan untuk menentukan tata letak produk, dapat juga digunakan untuk
menentukan daftar barang yang telah kadaluarsa.
Sebagai
contoh lain kasus data mining yaitu misalnya dalam bidang
pemasaran, sebelum sebuah perusahaan mengeluarkan suatu produk baru kepasaran,
perusahaan tersebut harus memiliki informasi tentang kecenderungan pelanggan
untuk membeli produk yang akan di keluarkan. Perkiraan (hypothesis) dapat
disusun untuk mengidentifikasikan pelanggan yang potensial dan karakteristik
dari pelanggan yang ada. Data-data tentang pembelian pelanggan sebelumnya dan
data tentang keadaan pelanggan, dapat digunakan untuk melakukan perbandingan
antara pembelian dan karakteristik pelanggan untuk menetapkan dan menguji
target yang telah diperkirakan sebelumnya. Dari keseluruhan operasi yang ada
selanjutnya dapat dilakukan penyaringan dengan cermat sehingga jumlah perkiraan
(hypothesys) yang sebelumnya banyak akan menjadi semakin berkurang sesuai
dengan keadaan yang sebenarnya.Permasalahan utama dengan model ini adalah tidak
ada informasi baru yang dapat dibuat, melainkan hanya pembuktian atau
melemahkan perkiraan (hypothesys) dengan data-data yang ada sebelumnya.
Datadata yang ada pada model ini hanya digunakan untuk membuktikan mendukung
perkiraan (hypothesis) yang telah diambil sebelumnya. Jadi model ini sepenuhnya
tergantung pada kemampuan user untuk melakukan analisa terhadap permasalahan
yang ingin digali dan diperoleh informasinya.
1.
Pengertian Data Mining
Data Mining adalah proses yang
menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning
untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005).
Terdapat beberapa istilah lain yang memiliki makna sama dengan data mining,
yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge
extraction), Analisa data/pola (data/pattern analysis), kecerdasan
bisnis (business intelligence) dan data archaeology dan data
dredging (Larose, 2005) Kemampuan Data mining untuk mencari informasi bisnis
yang berharga dari basis data yang sangat besar, dapat dianalogikan dengan
penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk :
- Prediksi trend dan sifat-sifat bisnis, dimana data mining mengotomatisasi proses pencarian informasi pemprediksi di dalam basis data yang besar.
- Penemuan pola-pola yang tidak diketahui sebelumnya, dimana data mining menyapu basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan.
- Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.
Berikut ini beberapa definisi data mining dari
beberapa sumber (Larose, 2005):
·
Data mining adalah proses menemukan sesuatu yang
bermakna dari suatu korelasi baru, pola dan tren yang ada dengan cara
memilah-milah data berukuran besar yang disimpan dalam repositori, menggunakan
teknologi pengenalan pola serta teknik matematika dan statistik.
- Data mining adalah analisis pengamatan database untuk menemukan hubungan yang tidak terduga dan untuk meringkas data dengan cara atau metode baru yang dapat dimengerti dan bermanfaat kepada pemilik data.
- Data mining merupakan bidang ilmu interdisipliner yang menyatukan teknik pembelajaran dari mesin (machine learning), pengenalan pola (pattern recognition), statistik, database, dan visualisasi untuk mengatasi masalah ekstraksi informasi dari basis data yang besar.
- Data mining diartikan sebagai suatu proses ekstraksi informasi berguna dan potensial dari sekumpulan data yang terdapat secara implisit dalam suatu basis data.
2. Fungsi Data Mining
Data mining mempunyai fungsi yang
penting untuk membantu mendapatkan informasi yang berguna serta meningkatkan
pengetahuan bagi pengguna. Pada dasarnya, data mining mempunyai empat fungsi
dasar yaitu:
- Fungsi Prediksi (prediction). Proses untuk menemukan pola dari data dengan menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenis atau nilainya.
- Fungsi Deskripsi (description). Proses untuk menemukan suatu karakteristik penting dari data dalam suatu basis data.
- Fungsi Klasifikasi (classification). Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan.
- Fungsi Asosiasi (association). Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data.
3. Proses
Data Mining Dan Metode Beserta Tekniknya
Proses yang umumnya dilakukan oleh
data mining antara lain: deskripsi, prediksi, estimasi, klasifikasi, clustering
dan asosiasi. Secara rinci proses data mining dijelaskan sebagai berikut
(Larose, 2005) :
a.
Deskripsi
Deskripsi bertujuan untuk mengidentifikasi pola yang
muncul secara berulang pada suatu data dan mengubah pola tersebut menjadi
aturan dan kriteria yang dapat mudah dimengerti oleh para ahli pada domain
aplikasinya. Aturan yang dihasilkan harus mudah dimengerti agar dapat dengan
efektif meningkatkan tingkat pengetahuan (knowledge) pada sistem. Tugas
deskriptif merupakan tugas data mining yang sering dibutuhkan pada teknik
postprocessing untuk melakukan validasi dan menjelaskan hasil dari proses data
mining. Postprocessing merupakan proses yang digunakan untuk memastikan hanya
hasil yang valid dan berguna yang dapat digunakan oleh pihak yang
berkepentingan.
b.
Prediksi
Prediksi memiliki kemiripan dengan klasifikasi, akan
tetapi data diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan
pada masa yang akan datang. Contoh dari tugas prediksi misalnya untuk
memprediksikan adanya pengurangan jumlah pelanggan dalam waktu dekat dan
prediksi harga saham dalam tiga bulan yang akan datang.
c.
Estimasi
Estimasi hampir sama dengan prediksi, kecuali variabel
target estimasi lebih ke arah numerik dari pada ke arah kategori. Model
dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target
sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai
dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai
contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit
berdasarkan umur pasien, jenis kelamin, berat badan, dan level sodium darah.
Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses
pembelajaran akan menghasilkan model estimasi.
d.
Klasifikasi
Klasifikasi merupakan proses menemukan sebuah model
atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-kelas.
Klasifikasi melibatkan proses pemeriksaan karakteristik dari objek dan memasukkan
objek ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.
e.
Clustering
Clustering merupakan pengelompokan data tanpa
berdasarkan kelas data tertentu ke dalam kelas objek yang sama. Sebuah kluster
adalah kumpulan record yang memiliki kemiripan suatu dengan yang lainnya dan
memiliki ketidakmiripan dengan record dalam kluster lain. Tujuannya adalah
untuk menghasilkan pengelompokan objek yang mirip satu sama lain dalam
kelompok-kelompok. Semakin besar kemiripan objek dalam suatu cluster dan semakin
besar perbedaan tiap cluster maka kualitas analisis cluster semakin baik.
f.
Asosiasi
Tugas
asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu
waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja (market
basket analisys). Tugas asosiasi berusaha untuk mengungkap aturan untuk
mengukur hubungan antara dua atau lebih atribut.
4. Data Mining - Tahap Tahapan Knowladge Discovery In Database (KDD)
3.1 Atribute
Importance (AI)
Attribute Importance (AI) memberi peringkat atribut
dengan menghilangkan atribut yang berulang, tidak relevan, atau tidak
informatif dan mengidentifikasi atribut yang mungkin memiliki pengaruh yang
paling tinggi dalam membuat prediksi.
Gambar 2. AI
menggunakan algoritma Minimum Description Length (MDL).
Algoritma MDL mempertimbangkan
setiap atribut sebagai model prediktif sederhana dari kelas target. Teknik AI
digunakan untuk mengoptimalkan analisa model classification dengan mengurangi
atribut yang digunakan dan akan meningkatkan kecepatan dan akurasi saat
membangun model.
3.2. Naive Bayes
Algorithm (Classification)
Classification adalah proses untuk Menemukan model
Atau fungsi yang atau membedakan konsep atau kelas data, Dengan tujuan untuk
dapat memperkirakan Kelas dari Suatu objek yang labelnya tidak Berupa aturan “jika--‐maka”. Dalam Teknik
classification terdapat beberapa Algoritma yang Bisa digunakan antara
lain decision tree, Naive bayes , adaptive naive bayes,logistic regression dan support vector machine. Bayesian
Classification didasarkan pada Teorema Bayesian. Konsep dasar teori
bayes itu pada dasarnya adalah peluang bersyarat P(H∣X). Dimana dalam
Bayesian H adalah posterior dan X adalah prior. Prior adalah pengetahuan kita
tentang karakteristik suatu parameter (bisa dibaca sebagai pengalaman di masa lalu
atas suatu parameter atau juga bisa berdasarkan teori), sedangkan posterior
adalah karakteristik yang akan kita duga pada kejadian yang akan datang.
Teorema Bayesian berguna untuk melakukan kalkulasi
probabilitas posterior, P(H|X), dari P(H), P(X) dan P(X|H). Teori Bayes adalah
sebagai berikut : P(H|X) =P(X|H)P(H) P(X)
Proses classification biasanya dibagi
menjadi dua fase : learning dan test. Pada fase
learning, sebagian data yang telah diketahui kelas datanya diumpankan untuk
membentuk model perkiraan. Kemudian pada fase test model yang sudah terbentuk
diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model
tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi
kelas data yang belum diketahui. [3]
Jelaskan algoritma Classification lainnya , yaitu : decision tree, adaptive naive bayes,
logistic regression dan support vector machine.
Bagaimana penerapannya dalam kasus.
3.3 Decision Tree
Decision Tree (Pohon
Keputusan) adalah pohon dimana setiap cabangnyamenunjukkan pilihan diantara
sejumlah alternatif pilihan yang ada, dan setiapdaunnya menunjukkan keputusan
yang dipilih.Decision tree biasa digunakan untuk mendapatkan informasi untuk
tujuanpengambilan sebuah keputusan. Decision tree dimulai dengan sebuah root
node(titik awal) yang dipakai oleh user untuk mengambil tindakan. Dari node
root ini,user memecahnya sesuai dengan algoritma decision tree. Hasil akhirnya
adalahsebuah decision tree dengan setiap cabangnya menunjukkan
kemungkinansekenario dari keputusan yang diambil serta hasilnya
Contoh Pemanfaatan Decision
Tree
- Diagnosa beberapa penyakit seperti kanker, hipertensi, stroke.
- Menentukan apakah dengan kondisi yang ada layak untuk bermaintenis atau tidak
- Menentukan apakah sebuah investasi bisnis layak dilakukan atau tidak
- Pemilihan pegawai teladan sesuai dengan kriteria tertentu
- Deteksi gangguan pada komputer atau jaringan komputer
- Pemilihan produk seperti rumah, kendaraan dan lain lain
3.4 Adaptive Naive Bayes
Naive Bayes
merupakan algoritma pembelajaran untuk klasifikasi dengan efisiensi komputasi
dan akurasi yang baik, khususnya untuk dimensi dan jumlah data yang besar. Akan
tetapi performa algoritma ini akan menurun ketika antar atribut tidak memiliki
keterkaitan satu sama lain. Beberapa solusi untuk menyelesaikan permasalahan
ini yaitu dengan structure extension, pemilihan atribut, pembobotan pada
masing-masing atribut, instance weighting, pembelajaran lokal, dan sebagainya.
Dalam paper tersebut, penulis membahas teknik pembobotan (Weighting) atribut
pada klasifikasi Naive Bayes (NB) dengan menggunakan Artificial Immune System
(AIS), disingkat AISWNB.
Metode ini digunakan untuk
menghitung bobot optimal antar atribut, yaitu penentuan bobot secara mandiri
dalam menentukan independensi atribut sehingga probabilitas masing-masing
atribut bisa ditentukan dengan lebih akurat. Keunggulan dari metode ini yaitu
mampu menyesuaikan bobot berdasarkan atribut secara mandiri karena metode ini
mengadopsi cara kerja sistem imun, yaitu melalui proses penggandaan diri,
pembelahan, mutasi, dan memory. Metode ini mampu memilih bobot yang baik selama
proses pembelajaran sehingga performa Naive Bayes dapat ditingkatkan.
Penelitian dilakukan dengan membandingkan 36 jenis data pembelajaran dalam
mengklasifikasikan 6 kelompok gambar. Hasil penelitian ini yaitu performa,
akurasi, dan estimasi probabilitas Naive Bayes lebih bagus daripada
metode-metode lainnya.
3.5 Logistic
Regression
Regresi
logistic merupakan salah satu analisi multivariate, yang berguna untuk
memprediksi dependent variabel berdasarkan variabel independen. Atau bisa juga
sebagai salah satu jenis regresi yang menghubungkan antara satu atau beberapa
variabel independen (variabel bebas) dengan variabel dependen yang berupa
kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah
yang membedakan regresi logistik dengan regresi berganda atau regresi linear
lainnya.
Nilai
kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan
peneliti menggunakan regresi logistik untuk memproses 2 kategori saja. 0
biasanya digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1
biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan
maksud penelitian.
Konsep
Regresi logistik merupakan alternative uji jika asumsi multivariate
normal distribution pada variabel bebasnya tidak bisa terpenuhi ketika akan
dilakukan analisis diskriminan. Tidak terpenuhinya asumsi ini dikarenakan
variabel bebas merupakan campuran antara variabel kontinyu (metric) dan
kategorial (non metric). Misalnya, probabilitas bahwa orang yang menderita
serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia,
kebiasaan merokok, jenis kelamin, dan lainnya.
3.6
Support
Vector Machine
Support
Vector Machine (SVM) pertama kali diperkenalkan oleh Vapnik pada tahun 1992
sebagai rangkaian harmonis konsep-konsep unggulan dalam bidang pattern recogn
ition. Sebagai salah satu metode pattern recognition, usia SVM terbilang masih
relatif muda. Walaupun demikian , evaluasi kemampuannya dalam berbagai
aplikasinya menempatkannya sebagai state of the art dalam pattern recognition,
dan dewasa ini merupakan salah satu tema yang berkembang dengan pesat. SVM
adalah metode learning machine yang bekerja atas prinsip Structural Risk
Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan
dua buah class pada input space. Tulisan ini membahas teori dasar SVM dan
aplikasinya dalam bioinf ormatika, khususnya pada analisa ekspresi gen yang
diperoleh dari analisa microarray
Sedangkan Menurut Santoso (2007) Support vector machine
(SVM) adalah suatu teknik untuk melakukan prediksi, baik dalam kasus
klasifikasi maupun regresi. SVM berada dalam satu kelas dengan Artificial
Neural Network (ANN) dalam hal fungsi dan kondisi permasalahan yang bisa
diselesaikan. Keduanya masuk dalam kelas supervised learning.
Dalam penelitian ini, teknik SVM digunakan untuk
menemukan fungsi pemisah(klasifier) yang optimal yang bisa memisahkan
dua set data dari dua kelas yang berbeda. Penggunaan teknik machine learning
tersebut, karena performansinya yang meyakinkan dalam memprediksi kelas suatu
data baru. Teori SVM dimulai dengan kasus klasifikasi yang secara linier bisa
dipisahkan. Dalam hal ini fungsi pemisah yang dicari adalah fungsi linier.
Fungsi ini bisa didefinisikan sebagai;
g(x) := sgn(f(x))
(2.1)
dengan
(2,2)
atau (2.3)
Masalah klasifikasi
ini bisa dirumuskan set parameter (w, b) sehingga f(xi) =<
w, x > +b = yi untuk semua i. Teknik SVM
berusaha menemukan fungsi pemisah (klasifier/hyperplane) terbaik
diantara fungsi yang tidak terbatas jumlahnya untuk memisahkan dua macam obyek.
Hyperplane terbaik adalah hyperplane yang terletak di tengah-tengah antara dua
set obyek dari dua kelas. Mencari hyperplane terbaik ekuivalen dengan
memaksimalkan margin atau jarak antara dua set obyek dari kelas yang berbeda.
Jika adalah hyperplane-pendukung (supporting hyperplane) dari kelas dan
hyperplane-pendukung dari kelas
, margin antara dua kelas dapat dihitung dengan mencari jarak antara kedua hyperplane-pendukung dari kedua kelas. Secara spesifik
, margin antara dua kelas dapat dihitung dengan mencari jarak antara kedua hyperplane-pendukung dari kedua kelas. Secara spesifik
4. Data Mining - Tahap Tahapan Knowladge Discovery In Database (KDD)
4.1 Knowladge Discovery In Database (KDD)
- KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data.
- Knowledge discovery in databases (KDD) adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.
4.2 Tahapan Proses KDD
Tahapan yang dilakukan pada proses
data mining diawali dari seleksi data dari data sumber ke data target, tahap
preprocessing untuk memperbaiki kualitas data, transformasi, data mining serta
tahap interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan
baru yang diharapkan memberikan kontribusi yang lebih baik. Secara detail
dijelaskan sebagai berikut (Fayyad, 1996):
1. Data selection
Gambar 1. Tahapan Data Mining
1. Data selection
Pemilihan (seleksi) data dari sekumpulan data
operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD
dimulai. Data hasil seleksi yang digunakan untuk proses data mining, disimpan
dalam suatu berkas, terpisah dari basis data operasional.
2.
Pre-processing / cleaning
Sebelum proses data mining dapat dilaksanakan, perlu
dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning
mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten,
dan memperbaiki kesalahan pada data.
3.
Transformation
Coding adalah proses transformasi pada data yang telah
dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding
dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola
informasi yang akan dicari dalam basis data.
4. Data
mining
Data mining adalah proses mencari pola atau informasi
menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu.
Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan
metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD
secara keseluruhan.
5.
Interpretation / evalution
Pola
informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam
bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini
merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini
mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan
dengan fakta atau hipotesis yang ada sebelumnya.
6. Penerapan KDD pada
toko swalayan
Selama
ini banyak organisasi atau perusahaan-perusahan besar telah mengumpulkan data
sekian tahun lamanya (data pembelian, data penjualan, data transaksi dan
sebagainya). Hampir semua data tersebut dimasukkan dengan menggunakan aplikasi
komputer untuk menangani transaksi sehari-hari. Sebagai contoh, toko swalayan
setiap hari merekam transaksi penjualan barang, database penjualan tersebut
bisa mencapai beberapa GigaByte setiap harinya untuk sebuah toko swalayan
berskala nasional.
Pertumbuhan
yang pesat dari akumulasi data itu telah menciptakan kondisi yang disebut
sebagai “kebanjiran data tetapi miskin informasi” karena data yang terkumpul
tidak dapat digunakan untuk aplikasi yang berguna, tidak jarang kumpulan data
tersebut dibiarkan begitu saja seakan-akan menjadi kuburan data (data tombs).
Kebutuhan akan suatu data menjadi sangat penting untuk pengambilan keputusan
yang cepat dan akurat.
Dengan kondisi seperti ini, pelaku bisnis tidak dapat memprediksi atau menebak target pasar sehingga memungkinkan toko swalayan tersebut tidak mengalami peningkatan dalam melakukan penjualan.
Dengan kondisi seperti ini, pelaku bisnis tidak dapat memprediksi atau menebak target pasar sehingga memungkinkan toko swalayan tersebut tidak mengalami peningkatan dalam melakukan penjualan.
Kemampuan
teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data telah
jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi
“pengetahuan” dari data. Sementara para pelaku bisnis memiliki
kebutuhan-kebutuhan untuk memanfaatkan “gudang data” yang sudah dimilikinya.
Dengan
melakukan tahapan-tahapan Knowledge Discovery in Database (KDD) dapat
meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk
mendukung pengambilan keputusan penting. Sebagai contoh beberapa solusi yang
bisa diselesaikan diantaranya yaitu menebak target pasar, yaitu dengan
melakukan pengelompokan dari model-model pembeli dan melakukan klasifikasi
setiap pembeli dari kebiasaan membeli, dari tingkat penghasilan dan
karakteristik lainnya.
Selain
itu, pelaku bisnis dapat melihat profil customer untuk mengetahui kelompok
konsumen tertentu misalnya suka membeli produk apa saja serta mengidentifikasi
produk-produk apa saja yang terbaik untuk setiap kelompok konsumen sehingga
bisa menyusun faktor-faktor apa saja yang dapat menarik konsumen baru untuk
bergabung atau membeli.
Daftar
Pustaka :
·
Turban, E, 2005, Decision Support Systems and
Intelligent Systems Edisi Bahasa Indonesia Jilid 1. Andi: Yogyakarta.
·
Larose, Daniel T. 2005. Discovering Knowledge in
Data : An Introduction to Data Mining. John Willey & Sons, Inc.
·
ayyad, Usama. 1996. Advances in Knowledge
Discovery and Data Mining. MIT Press.
Sumber :
·
https://heiqmadinar.wordpress.com/2012/03/13/support-vector-machine/
Excellent) Good Article
ReplyDelete