SEKILAS TENTANG DATA MINING (Definisi, Kegunaan, dan Jenis)

 DATA MINING



Pada materi pertama kita di bidang data science sekarang adalah mencoba membahas sekilas apa itu Data Mining, yang pada dasarnya akan benar-benar menjadi pengetahuan yg menakjubkan bila kita menekuni-nya. Mari kita coba perkanalan dulu dengan Data Mining.

Apa Itu Data Mining ?

Definisi Data Mining

Cara pandang dan pengetahuan yang berbeda membuat para ahli memberikan defiinisi berbeda tentang data mining. data mining, sebagian ahli menyatakan bahwa data mining adalah langkah analisis terhadap proses penemuan pengetahuan di dalam basis data atau knowledge discovery in databases yang di singkat menjad iKDD (Fayed et al. 1996). Pengetahuan bisa berupa pola data atau relasi antar data yang valid.


Data mining merupakan gabungan sejumlah disiplin ilmu komputer (ACM, 2006) (Clifton 2010), yang di definiskan sebagai proses penemuan pola pola baru dari kumpulan kumpulan data data besar, meliputi metode metoda yang merupakan irisandari artifial intelligence, machine learning, statistics dan database system. (ACM 2006)


Data mining ditujukan untuk mengekstrak (mengambil intisari) pengtahuan dari sekumpula ndata sehingga didapatkan struktur yang dapat dimengerti manusia (ACM 2006) serta meliputi basisdata dan menagemen data, prapemrosesan data, pertimbangan model dan inferensi, ukuran ketertarikan, pertimbangan komplesifitas pasca pemrosesan terhadap struktur yang ditemukan, visualisasi dan online update (ACM 2006).


Mengapa Perlu Data Mining?


Beberapa tahun terakhir, data semakin heterogen dan kompleks dengan volume yang meningkat cepat secara eksponensial , Menurut  John Gantz dan David Reinsel dalam investigasi yang dilakukan di IDC, volume data pada tahun 2011 mencapai 1,8 Zettabyte atay 1,8 triliyun Gigabyte (GB), pada tahun 2012 mengalami peningkatan sampai lebih dari 50% menjadi 1,8 zettabytes (Gants, Et. Al. 2012). Pada tahun 2013 Volume data sudah menjadi 4,4 zettabytes dan akan terus meningkat dengan sangat cepat sehingga perkiraan akan menjadi 44 zettabytes di tahun 2020. (Turner 2014)/ oleh karena itu saat ini terkenal dengan istilah big data, yang menggambarkan volume data yang sangat besar, terstruktur maupun tidak terstruktur, yang membanjiri segala bidang, dari mulai dunia bisnis, kesehatan, ekonomi, pendidikan dan lainnya. big data mempunyai empat karakteristik: berukuran sangat besar (high-volume), sangat bervariasi (high-variety), kecepatan pertumbuhan tinggi (high velocity), dan sangat tidak jelas (high veracity). Namun, big data dapat dianalisis sehingga perusahaan dapat mengambil keputusan keputusan strategis agar bisnis bisa berjalan dengan baik.

Kegunaan Data Mining

secara umum, kegunaan data mining dapat di bagi menjadi  dua : deskriptif dan prediktif. Deskriptif berarti data mining digunakan untuk mencari pola-pola yang dapat di pahami manusia yang menjelaskan karakteristik data. sedangkan prediktif berarti data mining digunakan untuk membentuk sebuah model pengetahuan yang akan di gunakan untuk melakukan prediksi.


berdasarkan fungsionalitasnya, tugas-tugas data mining bisa dikelompokkan ke dalaam enak kelompok beriktu ini (Fayyad et al. 1996).


  • Klasifikasi (classification)
Men-generalisasi struktur yang diketahui untuk diaplikasikan data-data baru. Misalkan klasifikasi penyakit ke dalam jumlah jenis, klasifikasi email ke dalam spam atau bukan


  • Klasterisasi (clustering)
mengelompokkan data, yang tidak diketahui label kelasnya, ke dalam sejumlah                       kelompok tertentu sesuai dengan ukuran kemiripannya


  • Regresi (Regression)

Menemukan suatu fungsi yang memodelkan data dengan galat (kesalahan prediksi) seminimal mungkin


  • Deteksi Anomali (anomaly detection)

Mengidentifikasi data yang tidak umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin sangat penting dan perlu investigasi lebih lanjut


  • Asosiasi (association)

Atau pemodelan ketergantungan (dependency modelling): mencari relasi antar variable


  • Perangkuman (Summaryzation)


Menyediakan representasi data yang lebih sederhana, memanipulasi visualisasi dan pembuatan laporan



Sekian untuk pengenalan pertama untuk Data Mining, di materi selanjutnya kita akan membahas tentang DATA. Semoga sedikit pengenalan materi kali ini bisa bermanfaat ke depan nya.





3 Comments

Post a Comment

Previous Post Next Post