Pengertian data mining
Data Mining, learning machine, knowledge discovery
Kenapa
disebut data mining kok bukan Gold mining? data mining kita mngambil istilah dari
bahasa asing yang artinya menambang data dalam arti lebih spesifik kegiatan
untuk melakukan pencarian informasi tersimpan dalam sebuah data yang sangat
besar yang belum pernah ditemukan atau knowledge
discovery atau penemuan pengetahuan yang tepat yang masih tersembunyi dalam
sebuah data yang sangat besar. mungkin jika dibayangkan anda berdiri diatas
gunung yang terbuat dari data-data yang sangat tinggi dan besar yang didalamnya
ada harta karun bisa berupa emas atau bahkan permata tetapi kita belum
mengetahui seberapa besar potensi harta karun yang tersimpan didalam gunung
data tersebut. Untuk mengambil emas dan permata tersebut maka, dibutuhkan
peralatan-peralatan tambang yang
digungakan untuk membongkar, menggali bongkahan gugnung data tersebut sehingga
kita dapat mengetahui seberapa besar nilai data harta karun tersebut.
Faktor Pembentukan
Data Mining
Teknik data
mining dibentuk melaluai gabungan dari berbagai multi disiplin ilmu seperti teknologi
database, data warehouse, statistik, pembelajaran mesin(Machine Learning),
komputasi kinerja tinggi, pencocokan pola data (patern recognition), Neural Network, datavisualization, Image
Processing, Analisa Data(statistik).
Apa yang dapat dilakukan data mining ? Data
Mining(DM) adalah proses menemukan pengetahuan yang menarik dari besar
jumlah data yang disimpan dalam database, gudang data, repositori informasi
yang lainnya untuk menghasilkan informasi yang berharga dan menarik dalam
kumpulan data yang sangat besar
Macam-Macam Database
yang dapat digali dalam Teknik Data Mining
Database Relational
Database Relatinal
biasanya dibangun sebagai media penyimpanan data transaksitonal seperti data transaksi
penjualan, data transaksi pembelian
Database Object
relational
dibangun berdasar pada model object relational,mempunyai
tipe data yang kaya untuk menangani com-object
komplek dan orientasi objek. Bentuk data ini digunakan untuk menangani objek
yang komplek danterstruktur. Secara konseptual setiap entitas dianggab sebagai object contoh Pelanggan, supplier, item
barang. Objek yang berbagi set properti umum dapat dikelompokkan menjadi class object setiap objek merupakan
sebuah instance dari Class misalnya Class pelanggan dapat berisi nama, alamat,tanggal daftar, no
telepon, no HP, email,sosmed.
Database temporal dan time series
Sebuah database
yang biasanya menyimpan data relational
yang meliputi atribut waktu terkait contoh untuk mengetahui historis belanja
pelanngan E-commerce untuk mengetahui seberapa sering pelanggan belanja(harian,
mingguan,bulanan). Dalam data time series ini teknik data mining dapat digunakan
untuk menemukan karakteristik object evolusi dengan tren perubahan untuk object
dalam database.
Database Spasial
Contoh data
base spasial adalah keadaan geografis database (peta), Edy Large Scale Integration (VLSI) atau computer aided design database dan medis, satelit database gambar. Contoh
navigasi GPS(Global Positioning System),
GIS(Geographic Information Sistem)
.
Database
Text dan Multimedia
Database text
dan multimedia berisi deskripsi kata email, catatan, hypertext, gambar,
video, audio, Word Wide Web (data
informasi pada internet)
Sebagai
contoh perusahaan raksasa IT terbesar didunia GOOGLE, Yahoo, MSN yang memanfaatkan
teknik data mining untuk mengetahui pola atau kebiasaan user untuk mencari kata
kunci atau informasi dari mesin pencari dalam mendapatkan sebuah informasi.
Kebiasan kebiasan itu ditampung sehingga bisa ditemukan informasi informasi apa
yang sering diakses melalui mesin pencari. Kita ambil contoh kita ketikan tek
di google dengan kata “bisnis” google mengetahui seberapa banyak kata bisnis
ini terdapat yang baru kita yang ada diinternet contoh kedua bagaimana google
bisa melakukan rangking situs web yang ditampilkan dalam sebuah mesin pencari?
. Lalu mungkin anda berpikir bagaimana google bisa menemukan informasi yang
tersebar didalam internet ? dengan menggunakan fungsi-fungsi yang terdapat
dalam data mining salah satu caranya adalah text mining.
Database
Heterogen dan Database Legacy
Sebuah database
Heterogen terdiri dari satu set saling berhubungan, komponen otonom database. Komponen
berkomunikasi untuk bertukar informasi dan jawaban Query contoh warisan database perusahaan yang merupakan hasil
sejarah panjang dari informasi pengembangan teknologi yang terdiri dari
berbagai macam pengolahan data.
Data Streams
Contoh umum data stream meliputi berbagai jenis data
ilmiah dan rekayasa, data time series, dan
data yang dihasilkan dalam lingkungan dimamis seperti power supply, bursa, jaringan telekomunikasi, video surveilance(youtube)
Fungsi-Fungsi
Data Mining
6 Fungsi-Fungsi Data mining Larose (2005),