การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย...
TRANSCRIPT
การวิ�เคราะห์ข้�อมู�ลใบเสร�จ 7-ELEVEN ด้�วิย
WEKA
นางสาว กรรณิกา เชื้ �อร��ง 55102010984
AGENDA
การแบ�งกล��มูข้�อมู�ล (Data Clustering) การจ�าแนกประเภทข้�อมู�ล (Data Classification) การห์ากฎควิามูส"มูพั"นธ์ (Association Rules)
CLUSTERING การแบ�งกล��มูข้�อมู�ล (Clustering) โด้ยใช้� Simple K-Means น�า
ข้�อมู�ลใบเสร�จ 7-eleven ท'(เตร'ยมูไวิ�เพั+(อมูาท�าการแบ�งกล��มู
CLUSTERING
การ Clustering โด้ยใช้�เทคน�ค SimpleKMeans
โด้ยก�าห์นด้ numCluster = 2 จนถึ-ง numClusters = 30 เพั+(อน�าCluster sum of squared errors น�ามูา Plot กราฟ เพั+(อห์า Knee Curve
CLUSTERING ต"วิอย�างห์น�าจอการท�างานโปรแกรมู WEKA ในการ Clustering ก�าห์นด้numClusters = 2
CLUSTERING ต"วิอย�างห์น�าจอการท�างานโปรแกรมู WEKA ในการ Clustering ก�าห์นด้numClusters = 10
CLUSTERING น�าค�า Within cluster sum of squared errors มูา plot Graph เพั+(อห์า Knee
Curve Graph แสด้ง Knee Curve ท'( numClusters= 18
CLUSTERING เมู+(อต�องการทราบวิ�า ใบเสร�จ แต�ละใบ อย��ใน Cluster ใด้บ�างสามูารถึ
แสด้ง โด้ย Weka ด้"งน'/ 1. ต�องท�าการ Save ไฟล การแบ�งข้�อมู�ล numClusters = 18 เป0น
ไฟล Arff
CLUSTERING 2. เมู+(อคล�ก Visualize cluster assignments จะมู'ห์น�าจอแสด้งข้-/นมูา และ
ท�าการ Save ไฟล .arff
CLUSTERING 3. เป1ด้ไฟล .arff ท'( Save ไวิ� แล�วิท�าการกด้ Save เป0นไฟล .csv
CLUSTERING 4. เป1ด้ไฟล .csv โด้ยไปท'( Tool > ArffViewer แล�วิเล+อกไฟล csv
เพั+(อเป1ด้ด้�ผลล"พัธ์
CLUSTERING 5. ผลล"พัธ์ สามูารถึบอกได้�วิ�า แต�ละใบเสร�จอย��ใน Cluster ใด้บ�าง
CLUSTERING สร�ปการแบ�งกล��มู 18 กล��มู โด้ยแบ�ง ส�นค�าท'(ซื้+/อในแต�ละ Cluster ด้"งร�ป
การท�า CLASSIFICATION โด้ยใช้�FUNCTION : MULTILAYERPERCEPTRON การเตร'ยมูข้�อมู�ลท"/งห์มูด้ เพั+(อน�ามูาสร�าง Model ส�าห์ร"บการ train
CLASSIFICATION การเตร'ยมูข้�อมู�ลจ�านวิน 10 แถึวิ เพั+(อน�ามูาสร�าง Model ส�าห์ร"บการtest
CLASSIFICATION
วิ�เคราะห์ข้�อมู�ลจากใบเสร�จ 7-eleven
“ วิ�เคราะห์ ข้�อมู�ลข้องสมูาช้�กล��มูท�านายการซื้+/อส�นค�าจาก 7-eleven วิ�า สมูาช้�กอย��บ�าน ท'(กร�งเทพัฯ (Bangkok) ห์ร+อ
ต�างจ"งห์วิ"ด้ (Countryside)”
CLASSIFICATION เล+อก Classify (1) และ Classifier>MultilayerPerceptron (2) เปล'(ยนจ�านวินTrainingTime = 200
CLASSIFICATION น�า Model ท'(เตร'ยมูไวิ�มูา Test ก"บ ข้�อมู�ลจ�านวิน 10 แถึวิท'(ได้�เตร'ยมูไวิ�ก�อนห์น�า
CLASSIFICATION Result ArffView TrainingTime = 200
โปรแกรมูจะท�านายเป0นผลล"พัธ์วิ�า สมูาช้�กอย��บ�านท'(กร�งเทพัฯ (Bangkok) ห์ร+อ ต�างจ"งห์วิ"ด้ (Countryside) ออกมูา
CLASSIFICATION เล+อก Classify และ Classifier>MultilayerPerceptron เปล'(ยนจ�านวินTrainingTime = 500
CLASSIFICATION น�า Model ท'(เตร'ยมูไวิ�มูา Test ก"บ ข้�อมู�ลจ�านวิน 10 แถึวิท'(ได้�เตร'ยมูไวิ�ก�อนห์น�า
CLASSIFICATION
Result ArffView TrainingTime = 500
โปรแกรมูจะท�านายเป0นผลล"พัธ์วิ�า สมูาช้�กอย��บ�านท'(กร�งเทพัฯ (Bangkok) ห์ร+อ ต�างจ"งห์วิ"ด้ (Countryside) ออกมูา
การท�า ASSOCIATION โด้ยใช้�APRIORI ข้�อมู�ลท'(เตร'ยมูส�าห์ร"บการท�า Associate แต�ละใบเสร�จถึ�ามู'การซื้+/อส�นค�า จะใส�ค�าเป0น t
และถึ�าไมู�มู'การซื้+/อส�นค�า ใส�ค�าเป0น ? (เพั+(อไมู�ให์�โปรแกรมูน�าค�าท'(ไมู�มู'การซื้+/อเข้�ามูาค�ด้ค�านวิณ)
ASSOCIATION เป1ด้ไฟล csv ข้องข้�อมู�ลใบเสร�จ 7-eleven ท'(เราได้�เตร'ยมูไวิ�
ASSOCIATION เล+อก Associate (1) และ
เล+อก Associator เป0น Apriori (2)
จากน"/น กด้ Start (3)
ASSOCIATION
ผลล"พัธ์
ASSOCIATION ผลล"พัธ์ท'(แสด้งออกมูา จะเป0นควิามูส"มูพั"นธ์การซื้+/อส�นค�า 7-eleven โด้ยโปรแกรมูจะ
แสด้งค�าควิามูเช้+(อมู"(น (Confidence) , Correlation Analysis (Lift) , Support(LHS) และ Support(RHS)
ASSOCIATION
ผลล"พัธ์การวิ�เคราะห์ข้�อมู�ลโด้ยใช้�กฎควิามูส"มูพั"นธ์ (Association Rules)
Best rules found:
1. IceCream=t 40 ==> Water=t 40 <conf:(1)> lift:(1.79) lev:(0.21) [17] conv:(17.67)
2. Sandwich=t 38 ==> Water=t 38 <conf:(1)> lift:(1.79) lev:(0.2) [16] conv:(16.79)
3. IceCream=t Sandwich=t 33 ==> Water=t 33 <conf:(1)> lift:(1.79) lev:(0.17) [14] conv:(14.58)
4. Milk=t IceCream=t 28 ==> Water=t 28 <conf:(1)> lift:(1.79) lev:(0.14) [12] conv:(12.37)
5. Milk=t Sandwich=t 27 ==> Water=t 27 <conf:(1)> lift:(1.79) lev:(0.14) [11] conv:(11.93)
6. Milk=t IceCream=t Sandwich=t 24 ==> Water=t 24 <conf:(1)> lift:(1.79) lev:(0.12) [10] conv:(10.6)
ASSOCIATION
Best rules found ( ต�อ ):
6. Milk=t IceCream=t Sandwich=t 24 ==> Water=t 24 <conf:(1)> lift:(1.79) lev:(0.12) [10] conv:(10.6)
7. TissuePaper=t Sandwich=t 18 ==> Water=t 18 <conf:(1)> lift:(1.79) lev:(0.09) [7] conv:(7.95)
8. TissuePaper=t IceCream=t 17 ==> Water=t 17 <conf:(1)> lift:(1.79) lev:(0.09) [7] conv:(7.51)
9. Yoghurt=t IceCream=t 16 ==> Water=t 16 <conf:(1)> lift:(1.79) lev:(0.08) [7] conv:(7.07)
10. TissuePaper=t IceCream=t Sandwich=t 14 ==> Water=t 14 <conf:(1)> lift:(1.79) lev:(0.07) [6] conv:(6.19)
THANK YOU