Tantangan dan Permasalahan Data Mining
Pengertian Data Mining
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Dengan perkembangan ilmu dan teknologi yang semakin pesat ini maka kita sering menjumpai implementasi atau penerapan data mining dilingkungan sekitar kita. Akan tetapi implementasi dari data mining tentu tidak bisa berjalan mulus, ada beberapa tantangan yang harus dihadapai dalam data mining
Baca Juga: Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining
Tantangan Dalam Data mining
Tantangan dalam data mining meliputi :
Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Permasalahan Dalam Data mining
Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.
Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak dapat dimintai dari dunia nyata. Data yang tidak meyakinkan menyebabkan permasalahan karena jika ada atribut-atribut esensial bagi pengetahuan tentang domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang tepat mengenai domain yang diberikan.
Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Dengan perkembangan ilmu dan teknologi yang semakin pesat ini maka kita sering menjumpai implementasi atau penerapan data mining dilingkungan sekitar kita. Akan tetapi implementasi dari data mining tentu tidak bisa berjalan mulus, ada beberapa tantangan yang harus dihadapai dalam data mining
Baca Juga: Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining
Tantangan Dalam Data mining
Tantangan dalam data mining meliputi :
- Scalability, yaitu besarnya ukuran basis data yang digunakan.
- Dimensionality, yaitu banyaknya jumlah atribut dalam data yang akan diproses.
- Complex and Heterogeneous Data, yaitu data yang kompleks dan mempunyai variasi yang beragam.
- Data'QuaIity, kualitas data yang akan diproses seperti data yang bersih dari noise, missing value, dsb.
- Data Ownership and Distribution, yaitu siapa yang memiliki data dan bagaimana distribusinya.
- Privacy Preservation, yaitu menjaga kerahasiaan data yang banyak diterapkan pada data nasabah perbankan.
- Streaming Data, yaitu aliran data itu sendiri.
Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining
Permasalahan Dalam Data mining
Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.
Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak dapat dimintai dari dunia nyata. Data yang tidak meyakinkan menyebabkan permasalahan karena jika ada atribut-atribut esensial bagi pengetahuan tentang domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang tepat mengenai domain yang diberikan.
Tantangan dan Permasalahan Data Mining
Reviewed by Mujiono
on
8:30 AM
Rating:

Since we are worldwide animals living as individuals from a worldwide domain. No man (or nation) is an island. Information goes around our reality at the speed of idea through web based life and interconnected frameworks. ExcelR Data Science Courses
ReplyDeleteAccording to the experts, GPUs have a distinct advantage over the hashing technology of CPU because of their higher processing power. Apart from handling bitcoins, GPUs can also manage the data transfer of crypto-currencies without any problem making it compatible with other applications. antminer s5+
ReplyDeletePretty good post. I just stumbled upon your blog and wanted to say that I have really enjoyed reading your blog posts. Any way I’ll be subscribing to your feed and I hope you post again soon.
ReplyDeletedata science course
wonderful article. Very interesting to read this article.I would like to thank you for the efforts you had made for writing this awesome article. This article resolved my all queries.
ReplyDeleteData Science Course
Very interesting to read this article.I would like to thank you for the efforts you had made for writing this awesome article. This article inspired me to read more. keep it up.
ReplyDeleteCorrelation vs Covariance
Simple linear regression
Very interesting blog. Many blogs I see these days do not really provide anything that attracts others, but believe me the way you interact is literally awesome.You can also check my articles as well.
ReplyDeleteData Science In Banglore With Placements
Data Science Course In Bangalore
Data Science Training In Bangalore
Best Data Science Courses In Bangalore
Data Science Institute In Bangalore
Thank you..
Amazing Article ! I would like to thank you for the efforts you had made for writing this awesome article. This article inspired me to read more. keep it up.
ReplyDeleteSimple Linear Regression
Correlation vs covariance
data science interview questions
KNN Algorithm
Logistic Regression explained