-->

Tuesday, August 5, 2014

rumus algoritma regresi linier sederhana data mining

Fungsi Prediksi Data mining

Fungsi Prediksi merupakan bagian dari fungsi minor data mining. Prediksi adalah suatu cara untuk mencari kemungkinan hasil dari suatu hal pada masa akan datang. Pada teknologi data mining,metode peramalan digunakan sebagai alat bantu memprediksi kemungkinan akan datang berdasarkan bukti-bukti temuan pada data.proses prediksi berhubungan erat dengan perhitungan matematik dan statistik.
Langkah prediksi dapat dilakukan menggunakan perhitungan rumus regresi linier matematika. Ada 2 jenis rumus regresi sebagai langkah proses analisis prediksi yaitu, regresi linear sederhana dan regresi linear berganda. Cara membaca hubungan korelasi data hipotesis hasil analisis prediksi dilakukan melalui analisis statistik. Contoh proses prediksi data mining kali ini dilakukan dengan menggunakan regresi linier sederhana

Regresi Linier : merupakan suatu cara mengukur data prediksi melalui garis lurus sebagai gambaran hubungan korelasi diantara 2 variabel atau lebih. Prediksi regresi linier, digunakan sebagai teknik mempelajari bagaimana hubungan variabel-variabel pada proses peramalan data.
Variabel : adalah besaran yang berubah-ubah nilainya. Ada 2 tipe variabel dalam regresi linier yaitu: variabel pemberi pengaruh dan variabel terpengaruh. Variabel pemberi pengaruh digunakan sebagai sebab, sedangkan variabel terpengaruh sebagai akibat. Sebagai uji kualitas prediksi maka, harus menggunakan variabel relevan.Kapan fungsi prediksi data mining dibutuhkan?. Apa hasil dari fungsi prediksi data mining?. Bagaimana cara untuk memprediksi suatu data?.
Untuk menjawab beberapa pertanyaan tentang fungsi prediksi diatas maka, cara yang paling tepat untuk memahami harus menggunakan studi kasus data. Sebagai contoh data yang dapat digunakan untuk prediksi waktu layanan antar restoran siap saji seperti:Pizza hut, MC.donald, KFC, Hoka-hoka bento, jasa layanan logistik dan dokumen misalkan: Tiki, PT POS Indonesia, JNE, Pandu Logistic, Fedex, Amazon.

Contoh Perhitungan Prediksi Data Mining

Contoh prediksi : memprediksi waktu tempuh pengiriman order jasa laundry. Dalam kasus ini menggunakan analogi perusahaan laundry kelas premium dengan tarif harga bukan perkilo melainkan per-potong(piece) sedangkan kategori pelangganya adalah hotel, home spa , beauty salon, kantor dan para pelanggan kelas premium. Perusahaan melayani jasa laundry meliputi : baju, celana, tas, sepatu, karpet, korden, carpot, jaket , dsb.
Untuk melayani jasa layanan ambil-antar dengan jumlah pelanggan tetap relatif banyak, maka waktu antar layanan laundry menjadi suatu prioritas sebagai cara menghindari komplain pelanggan.
Hal yang harus diketahui seberapa lama layanan akan diantar sampai ketangan pelanggan?. Pegawai memakai mobil untuk mengantarkan jasa layanan antar ambil laundry. Beberapa sample data waktu yang dibutuhkan pegawai untuk mengantarkan laundry sejak dari proses produksi sampai barang diterima pelanggan.
Data tabel waktu pengantaran jasa laundry
NO Order
Jarak (KM)
Waktu(Menit)
1
0.50
9.95
2
1.10
24.45
3
1.20
31.75
4
5.50
35.00
5
2.95
25.02
6
2.00
16.86
7
3.75
14.38
8
0.52
9.60
9
1.00
24.35
10
3.00
27.50
11
4.12
17.08
12
4.00
37.00
13
5.00
41.95
14
3.60
11.66
15
2.05
21.65
16
4.00
17.89
17
6.00
69.00
18
5.85
10.30
19
5.40
34.93
20
2.50
46.59
21
2.90
44.88
22
5.10
54.12
23
5.90
56.23
24
1.00
22.13
25
4.00
21.15
Berdasar data yang tertera diatas, seandainya, datang pesanan ke-26 dari hotel dengan jarak tempuh 1.5 km dari produksi laundry maka, seharusnya "waktu pengantaran dapat diprediksi". Contoh ini akan digunakan sebagai cara untuk menggambarkan "sebuah kegiatan prediksi data mining"
Bagaimana hubungan sebab-akibat jarak dan waktu tempuh pengantaran jasa laundry? Jarak lokasi pelanggan mengakibatkan panjang-pendeknya waktu tempuh pengiriman barang maka, jarak merupakan variabel pemberi pengaruh sebagai sumbu X(dalam kilometer) dan waktu sebagai variabel teperngaruh sebagai sumbu Y(dalam menit) . Setiap pasang data jarak-waktu digambarkan sebagai titik potong.
Tujuan regresi ini untuk mencari garis lurus sedekat mungkin dengan semua titik untuk mewakili titi-titik tersebut.
Secara rumus persamaan Y = β0 + β1x
Y = Variabel terpengaruh
β0 = Konstanta
β1 = Gradien garis
x = Variabel pemberi pengaruh
Bagaimana cara mencari garis regresi linier yang paling baik?. Untuk mengetahui garis regresi linier yang paling baik diperlukan perhitungan konstanta β0 dan gradien β1 dengan rumus
NO Order
Jarak (KM)
Waktu(Menit)
Yixi
X2
1
0.50
9.95
4.98
0.25
2
1.10
24.45
26.90
1,21
3
1.20
31.75
38.10
1.44
4
5.50
35.00
192.50
30.25
5
2.95
25.02
73.81
8.70
6
2.00
16.86
33.72
4.00
7
3.75
14.38
53.93
14.06
8
0.52
9.60
4.99
0.27
9
1.00
24.35
24.35
1.00
10
3.00
27.50
82.50
9.00
11
4.12
17.08
70.37
16.97
12
4.00
37.00
148.00
16.00
13
5.00
41.95
209.75
25.00
14
3.60
11.66
41.98
12.96
15
2.05
21.65
44.38
4.20
16
4.00
17.89
71.56
16.00
17
6.00
69.00
414.00
36.00
18
5.85
10.30
60.26
34.22
19
5.40
34.93
188.62
29.16
20
2.50
46.59
116.48
6.25
21
2.90
44.88
130.15
8.41
22
5.10
54.12
276.01
26.01
23
5.90
56.23
331.76
34.81
24
1.00
22.13
22.13
1.00
25
4.00
21.15
84.60
16.00
Jumlah
82.94
725.42
2745.81
353.18
Rata-rata
3.32
29.02
Kesimpulan:
Berdasarkan hasil perhitungan rumus regresi linear sederhana diatas maka, diperoleh persamaan Y = 14.58 + 4.35X.
Infomasi apa yang diperoleh dari perhitungan regresi linear sederhana sebagai, prediksi data waktu tempuh ? dengan mengacu hasil nilai Y pada perhitungan regresi linier , maka prediksi jumlah waktu yang dibutuhkan pengiriman jasa laundry 14.58 menit ditambah 4.35 kali jarak pelanggan. Dengan uraian data lebih detail peresamaan garis regresi linear ini menyatakan bahwa bila rumah pelanggan berjarak 0 km dari produksi laundry, waktu antar jasa laundry diprediksi 14.58 menit. Setiap pertambahan jarak sepanjang 1km, maka lama waktu tempuh diprediksi akan bertambah selama 3.58 menit. Untuk menjawab berapa lama waktu tempuh karyawan mengantar pesanan ke-26 dengan jarak tempuh 1.5 km ?
Cara prediksi waktu antar jasa laundry yang dibutuhkan karyawan untuk mengantarkan layanan kepada pelanggan dengan cara
Y= 14.58 + 4.35X
Y = 14.58 + 4.35(1.5) = 21.1 menit
Maka dapat ditarik kesimpulah prediksi pengiriman jasa laundry sampai kelokasi pelanggan dalam waktu 21.1 menit
contoh diatas merupakan bagian dari "Algoritma Prediksi Data Mining"

No comments: