การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย...

30

Click here to load reader

Upload: kannikanune

Post on 14-Aug-2015

90 views

Category:

Education


3 download

TRANSCRIPT

Page 1: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

การวิ�เคราะห์ข้�อมู�ลใบเสร�จ 7-ELEVEN ด้�วิย

WEKA

นางสาว กรรณิกา เชื้ �อร��ง 55102010984

Page 2: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

AGENDA

การแบ�งกล��มูข้�อมู�ล (Data Clustering) การจ�าแนกประเภทข้�อมู�ล (Data Classification) การห์ากฎควิามูส"มูพั"นธ์ (Association Rules)

Page 3: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING การแบ�งกล��มูข้�อมู�ล (Clustering) โด้ยใช้� Simple K-Means น�า

ข้�อมู�ลใบเสร�จ 7-eleven ท'(เตร'ยมูไวิ�เพั+(อมูาท�าการแบ�งกล��มู

Page 4: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING

การ Clustering โด้ยใช้�เทคน�ค SimpleKMeans

โด้ยก�าห์นด้ numCluster = 2 จนถึ-ง numClusters = 30 เพั+(อน�าCluster sum of squared errors น�ามูา Plot กราฟ เพั+(อห์า Knee Curve

Page 5: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING ต"วิอย�างห์น�าจอการท�างานโปรแกรมู WEKA ในการ Clustering ก�าห์นด้numClusters = 2

Page 6: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING ต"วิอย�างห์น�าจอการท�างานโปรแกรมู WEKA ในการ Clustering ก�าห์นด้numClusters = 10

Page 7: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING น�าค�า Within cluster sum of squared errors มูา plot Graph เพั+(อห์า Knee

Curve Graph แสด้ง Knee Curve ท'( numClusters= 18

Page 8: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING เมู+(อต�องการทราบวิ�า ใบเสร�จ แต�ละใบ อย��ใน Cluster ใด้บ�างสามูารถึ

แสด้ง โด้ย Weka ด้"งน'/ 1. ต�องท�าการ Save ไฟล การแบ�งข้�อมู�ล numClusters = 18 เป0น

ไฟล Arff

Page 9: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING 2. เมู+(อคล�ก Visualize cluster assignments จะมู'ห์น�าจอแสด้งข้-/นมูา และ

ท�าการ Save ไฟล .arff

Page 10: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING 3. เป1ด้ไฟล .arff ท'( Save ไวิ� แล�วิท�าการกด้ Save เป0นไฟล .csv

Page 11: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING 4. เป1ด้ไฟล .csv โด้ยไปท'( Tool > ArffViewer แล�วิเล+อกไฟล csv

เพั+(อเป1ด้ด้�ผลล"พัธ์

Page 12: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING 5. ผลล"พัธ์ สามูารถึบอกได้�วิ�า แต�ละใบเสร�จอย��ใน Cluster ใด้บ�าง

Page 13: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLUSTERING สร�ปการแบ�งกล��มู 18 กล��มู โด้ยแบ�ง ส�นค�าท'(ซื้+/อในแต�ละ Cluster ด้"งร�ป

Page 14: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

การท�า CLASSIFICATION โด้ยใช้�FUNCTION : MULTILAYERPERCEPTRON การเตร'ยมูข้�อมู�ลท"/งห์มูด้ เพั+(อน�ามูาสร�าง Model ส�าห์ร"บการ train

Page 15: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION การเตร'ยมูข้�อมู�ลจ�านวิน 10 แถึวิ เพั+(อน�ามูาสร�าง Model ส�าห์ร"บการtest

Page 16: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION

วิ�เคราะห์ข้�อมู�ลจากใบเสร�จ 7-eleven

“ วิ�เคราะห์ ข้�อมู�ลข้องสมูาช้�กล��มูท�านายการซื้+/อส�นค�าจาก 7-eleven วิ�า สมูาช้�กอย��บ�าน ท'(กร�งเทพัฯ (Bangkok) ห์ร+อ

ต�างจ"งห์วิ"ด้ (Countryside)”

Page 17: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION เล+อก Classify (1) และ Classifier>MultilayerPerceptron (2) เปล'(ยนจ�านวินTrainingTime = 200

Page 18: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION น�า Model ท'(เตร'ยมูไวิ�มูา Test ก"บ ข้�อมู�ลจ�านวิน 10 แถึวิท'(ได้�เตร'ยมูไวิ�ก�อนห์น�า

Page 19: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION Result ArffView TrainingTime = 200

โปรแกรมูจะท�านายเป0นผลล"พัธ์วิ�า สมูาช้�กอย��บ�านท'(กร�งเทพัฯ (Bangkok) ห์ร+อ ต�างจ"งห์วิ"ด้ (Countryside) ออกมูา

Page 20: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION เล+อก Classify และ Classifier>MultilayerPerceptron เปล'(ยนจ�านวินTrainingTime = 500

Page 21: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION น�า Model ท'(เตร'ยมูไวิ�มูา Test ก"บ ข้�อมู�ลจ�านวิน 10 แถึวิท'(ได้�เตร'ยมูไวิ�ก�อนห์น�า

Page 22: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

CLASSIFICATION

Result ArffView TrainingTime = 500

โปรแกรมูจะท�านายเป0นผลล"พัธ์วิ�า สมูาช้�กอย��บ�านท'(กร�งเทพัฯ (Bangkok) ห์ร+อ ต�างจ"งห์วิ"ด้ (Countryside) ออกมูา

Page 23: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

การท�า ASSOCIATION โด้ยใช้�APRIORI ข้�อมู�ลท'(เตร'ยมูส�าห์ร"บการท�า Associate แต�ละใบเสร�จถึ�ามู'การซื้+/อส�นค�า จะใส�ค�าเป0น t

และถึ�าไมู�มู'การซื้+/อส�นค�า ใส�ค�าเป0น ? (เพั+(อไมู�ให์�โปรแกรมูน�าค�าท'(ไมู�มู'การซื้+/อเข้�ามูาค�ด้ค�านวิณ)

Page 24: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

ASSOCIATION เป1ด้ไฟล csv ข้องข้�อมู�ลใบเสร�จ 7-eleven ท'(เราได้�เตร'ยมูไวิ�

Page 25: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

ASSOCIATION เล+อก Associate (1) และ

เล+อก Associator เป0น Apriori (2)

จากน"/น กด้ Start (3)

Page 26: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

ASSOCIATION

ผลล"พัธ์

Page 27: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

ASSOCIATION ผลล"พัธ์ท'(แสด้งออกมูา จะเป0นควิามูส"มูพั"นธ์การซื้+/อส�นค�า 7-eleven โด้ยโปรแกรมูจะ

แสด้งค�าควิามูเช้+(อมู"(น (Confidence) , Correlation Analysis (Lift) , Support(LHS) และ Support(RHS)

Page 28: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

ASSOCIATION

ผลล"พัธ์การวิ�เคราะห์ข้�อมู�ลโด้ยใช้�กฎควิามูส"มูพั"นธ์ (Association Rules)

Best rules found:

1. IceCream=t 40 ==> Water=t 40 <conf:(1)> lift:(1.79) lev:(0.21) [17] conv:(17.67)

2. Sandwich=t 38 ==> Water=t 38 <conf:(1)> lift:(1.79) lev:(0.2) [16] conv:(16.79)

3. IceCream=t Sandwich=t 33 ==> Water=t 33 <conf:(1)> lift:(1.79) lev:(0.17) [14] conv:(14.58)

4. Milk=t IceCream=t 28 ==> Water=t 28 <conf:(1)> lift:(1.79) lev:(0.14) [12] conv:(12.37)

5. Milk=t Sandwich=t 27 ==> Water=t 27 <conf:(1)> lift:(1.79) lev:(0.14) [11] conv:(11.93)

6. Milk=t IceCream=t Sandwich=t 24 ==> Water=t 24 <conf:(1)> lift:(1.79) lev:(0.12) [10] conv:(10.6)

Page 29: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

ASSOCIATION

Best rules found ( ต�อ ):

6. Milk=t IceCream=t Sandwich=t 24 ==> Water=t 24 <conf:(1)> lift:(1.79) lev:(0.12) [10] conv:(10.6)

7. TissuePaper=t Sandwich=t 18 ==> Water=t 18 <conf:(1)> lift:(1.79) lev:(0.09) [7] conv:(7.95)

8. TissuePaper=t IceCream=t 17 ==> Water=t 17 <conf:(1)> lift:(1.79) lev:(0.09) [7] conv:(7.51)

9. Yoghurt=t IceCream=t 16 ==> Water=t 16 <conf:(1)> lift:(1.79) lev:(0.08) [7] conv:(7.07)

10. TissuePaper=t IceCream=t Sandwich=t 14 ==> Water=t 14 <conf:(1)> lift:(1.79) lev:(0.07) [6] conv:(6.19)

Page 30: การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย Weka

THANK YOU