การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ...

86
การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ กรณีศึกษา: บริษัท กรุงไทยคาร์เร้นท์ แอนด์ ลีส จากัด (มหาชน) ทิพย์ธิดา วงศ์พิพันธ์ งานค้นคว้าอิสระนี้เป็นส่วนหนึ่งของการศึกษาตามหลักสูตรวิทยาศาสตร มหาบัณฑิต สาขาวิชาเทคโนโลยีคอมพิวเตอร์และการสื่อสาร คณะวิศวกรรมศาสตร์ มหาวิทยาลัยธุรกิจบัณฑิตย์ พ.ศ.2556 DPU

Upload: others

Post on 08-May-2020

15 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

การใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ กรณศกษา: บรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน)

ทพยธดา วงศพพนธ

งานคนควาอสระนเปนสวนหนงของการศกษาตามหลกสตรวทยาศาสตรมหาบณฑต สาขาวชาเทคโนโลยคอมพวเตอรและการสอสาร

คณะวศวกรรมศาสตร มหาวทยาลยธรกจบณฑตย พ.ศ.2556

DPU

Page 2: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

Lease Approval Using Data Mining Techniques

THIPTIDA VONGPIPAN

An Independent Study Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Science (Computer and

Communication Technology) Department of Computer and Communication Technology

Faculty of Engineering, Dhurakij Pundit University 2013

DPU

Page 3: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

หวของานคนควาอสระ การใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ

ชอผเขยน ทพยธดา วงศพพนธ

อาจารยทปรกษางานคนควาอสระ อาจารย ดร.วรพล พงษเพชร

สาขาวชา เทคโนโลยคอมพวเตอรและการสอสาร

ปการศกษา 2555

บทคดยอ

วตถประสงคของการวจยในครงนเพอน าความรทไดจากการท าเหมองขอมลชวยในการตดสนใจการใหสนเชอของ บรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน) มาเปนแนวทางสนบสนนการตดสนใจการอนมตสนเชอของบรษทไดอยางมประสทธภาพมากขน ซงอาจมสวนชวยลดปรมาณหนสญได

โดยการศกษาจะเรมตงแตการศกษารวบรวมขอมลประวตลกคาทผานการพจารณาใหสนเชอแลว การเตรยมและคดเลอกขอมลใหสมบรณเหมาะส าหรบการท าเหมองขอมล ไดแก การโอนยายขอมล (Data Transfer) การลดขนาดของขอมล (Data Reduction) และการท าความสะอาดขอมล (Data Cleaning) หลงจากนนจงไดท าการทดสอบขอมล โดยใชเทคนคการจ าแนกกลมเพอหากฎทใชในการจ าแนกลกคากลมด และลกคากลมไมด ซงไดทดลองจ าแนกกลมขอมลดวยเทคนคการจ าแนกกลม 3 เทคนค ซงใหผลลพธเปนกฎ ไดแก โมเดลการจ าแนกกลมแบบ Decision Tree : C4.5 หรอเรยกวาโมเดล Classifires trees J48 โมเดลการจ าแนกกลมแบบ Decision Rule : Part หรอเรยกวาโมเดล Classifires PART และ โมเดลการจ าแนกกลมแบบ Bayes : Naïve Bayes หรอเรยกวาโมเดล Classifier Naïve Bayes

ผลลพธทไดคอกฎทใชในการจ าแนก ลกคากลมด และลกคากลมไมด ซงผลการทดลอง

พบวา การจ าแนกกลมขอมลดวยเทคนค J48 ใหผลลพธดทสด เนองจากมความถกตองมากทสด

และสามารถแบงกลมไดตามเงอนไขทชดเจนมากทสด เมอเทยบกบอกสองเทคนค ซงทายสดจงน า

กฎทไดจากผลลพธมาเปนแนวทางและเงอนไข ในการน ามาเปนตวอยางทส าคญส าหรบการเขยน

โปรแกรมเปนระบบการตดสนใจอนมตสนเชอออนไลนไดอยางมประโยชน

DPU

Page 4: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

Independent Study Title Lease Approval Using Data Mining Techniques Author Thiptida Vongpipan Independent Study Advisor Dr. Worapol Pongpech Department Computer and Communication Technology Academic Year 2012

ABSTRACT

This research investigates employing data mining techniques for extracting potential useful information from the Krungthai Car Rent and Lease Public Company Limited database. The obtained information can then be used to facilitate decision making for credit approval of the company.

The first part of the research focuses on organizing, analyzing, and cleaning approved customer’s information through data transfer, data reduction, and data cleaning. The second part of the research focuses on identifies potential rejected customers and potential approved customers using data mining techniques such as Classifiers tree J48, Classifiers PART, and Naïve Bayes techniques.

The results are a set of potential approved customers and a set of potential rejected customers. The results also revealed that the J48 provides the highest correction rate and maximum number of association rules when compared to the other two techniques. Finally, a simple credit approval decision making web-based software using this obtained information as a guideline and conditions has been written as a concrete example of a useful application.

DPU

Page 5: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

กตตกรรมประกาศ

งานคนควาอสระฉบบนส าเรจลลวงไดดวยด โดยไดรบความอนเคราะหอยางดยงจาก อาจารย ดร.วรพล พงษเพชร ทกรณาเสยสละเวลาอนมคา และใหค าแนะน า และชแนะแนวทาง การคนควาหาขอมลเพมเตม อนเปนประโยชนท าใหงานวจยครงนสมบรณ ผวจยขอกราบขอบพระคณและจารกพระคณนไวในความทรงจ าอยางมรลมเลอน นอกจากนนขอกราบขอบพระคณคณะกรรมการอน ๆ อนประกอบดวย ดร.ประศาสน จนทราทพย และดร.ณฐพชร อารรชกลกานต ทกรณาใหความชวยเหลอในการแกไข และใหค าแนะน าทมประโยชนทมสวนท าใหงานวจยครงนมคณคามากยงขน

ขอขอบพระคณ ผจดการหนวยงานตางๆ ทกรณาใหความเออเฟอในการใหขอมล และเสยสละเวลาใหสมภาษณ เพอการพฒนาระบบ

คณคาและประโยชนใดๆ ทอาจมจากงานคนควาอสระฉบบน ผวจยขอมอบเปนเครองบชาพระคณของบดามารดาทใหก าเนดและเลยงดใหการศกษา ตลอดจนครบาอาจารยและผทมพระคณทกทานทมสวนในการวางรากฐานการศกษาใหแกผวจย

ผศกษาหวงเปนอยางยงวา งานคนควาอสระฉบบน จะเปนประโยชนกบผทตองการศกษาการใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ และหากมขอผดพลาดประการใดในงานคนควาอสระฉบบน ผศกษาตองกราบขออภยเปนอยางสงมา ณ ทนดวย

ทพยธดา วงศพพนธ

DPU

Page 6: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

สารบญ

หนา บทคดยอภาษาไทย…………………………………………………………………………... ฆ บทคดยอภาษาองกฤษ………………………………………………………………..……… ง กตตกรรมประกาศ…………………………………………………………………...……… จ สารบญตาราง……………………………………………………………………...………… ซ สารบญภาพ…………………………………………………………………………….…… ฌ บทท

1. บทน า………………………………………………………………….……..……. 1 1.1 ความเปนมาและความส าคญของปญหา………………………...……..……... 1 1.2 วตถประสงคของสารนพนธ. ………………………………………………… 2 1.3 ขอบเขตของการวจย……………………………………...…………………... 2 1.4 ผลทคาดวาจะไดรบ…………………………………………………………... 3 1.5 นยามศพทเฉพาะ………………………………………………………...…… 3

2. แนวคด ทฤษฎ และผลงานวจยทเกยวของ………………………..……….…….… 5 2.1 แนวคดและทฤษฎทเกยวของ…………………………………...…….……… 5 2.2 งานวจยทเกยวของกบประเดนปญหา…………………………..……….……. 19

3. ระเบยบวธวจย……………………………………………………………..……… 22 3.1 ขนตอนการด าเนนการวจย....…………………………………...…….……… 22 3.2 เครองมอทใชในการวจย.......…………………………………...…….……… 23

4. ผลด าเนนการวจย..........…………………………………………...……………… 24 4.1 วธการเกบและรวบรวมขอมล..............................…………………………… 24 4.2 การเตรยมขอมลและคดเลอกขอมลทจะน ามาใช....…………………………. 26 4.3 การทดสอบขอมลและเลอกเทคนคทเหมาะสม......…………………………. 30 4.4 ผลการวเคราะห......................................................…………………………. 35 4.5 การพฒนาระบบวเคราะหสนเชอ............................………………………….

4.6 การน าระบบงานทพฒนาขนมาใหมมาใชในองคกร........................................ 50 54

DPU

Page 7: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

สารบญ (ตอ)

บทท หนา 5. สรปผลการวจยและขอเสนอแนะ.....………………...……………………………. 59

5.1 สรปผลการวจย……………………………………………...……………….. 59 5.2 ปญหาและแนวทางแกไข...…………………………………..……...………. 60 5.3 ขอเสนอแนะส าหรบการพฒนาตอไป.........…………...…………………….. 60

บรรณานกรม…………………………………………………………………………...…… 62 ภาคผนวก………………………………………………………………….………………… 65

ก ผลการรนฉบบเตม.............................................................……......................…... 66 ข ขนตอนการลงโปรแกรม Weka.…………………...…………………………….. 70

ประวตผเขยน…………………………………………………………………………..……. 77

DPU

Page 8: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

สารบญตาราง

ตารางท หนา 4.1 การแปลงคาของขอมลวตถประสงคการใชงาน...…………...……………… 28 4.2 อธบายความหมายแตละแอทรบวต…………………………………………. 4.3 อธบายความหมายแตละฟลด Object Car typ และ Bus Typ……………...... 4.4 อธบายความหมายแตละฟลด CusTyp Long Run และ Capital…………….. 4.5 อธบายความหมายแตละฟลด NP Income และ OE………………………… 4.6 อธบายความหมายแตละฟลด Cur ratio Debt Ratio และ DE………………. 4.7 อธบายความหมายแตละฟลด Growth Inc และ Growth NP………………... 4.8 อธบายความหมายแตละฟลด Grade………………………………………...

35 36 37 37 37 38 38

DPU

Page 9: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

สารบญภาพ

ภาพท หนา 2.1 การแทนตนไมการตดสนใจ…………………………..……………………….. 8 2.2 เครอขายใยประสาท………………………………………………………… 2.3 แสดงหนาจอโปรแกรม Weka………………………………………………….. 2.4 แสดงเมนหลกของ Explorer………………………………………………. 2.5 แสดงสวนประกอบหลกของ Explorer………………………………………. 2.6 สรางแฟมขอมลแบบ CSV…………………………………………………..

10 11 12 13 14

2.7 แสดงตวอยางแฟม carrent.csv…………………………………………………. 4.1 แสดงแบบวเคราะหและพจารณาสนเชอเพอเชารถยนต………………………..

14

25

4.2 การโอนยายขอมลจากแบบฟอรมน ามาอยในรปแบบเดยวกน ในไฟล Excel ทสรางเปนฐานขอมล……………………………………………. 4.3 ผลการแปลงคาของขอมลวตถประสงคการใชงาน……………………………... 4.4 การบนทกขอมลในรปแบบนามสกล .csv……………………………………… 4.5 แสดงไฟลขอมลในรปแบบนามสกล .csv……………………………………… 4.6 แสดงการเปดโปรแกรม Weka 3.6.6…………………………………………… 4.7 แสดงการเขาหนาโปรแกรม Weka 3.6.6……………………………………. 4.8 การน าเขาขอมลในโปรแกรม Weka……………………………………………

27 29 29 30 31 31 32

4.9 หนาจอการแสดงขอมลทน าเขา……………………………………………… 32 4.10 หนาจอแสดงการเลอกเทคนค Classify……………………………………….. 4.11 การเลอกเทคนคทใชในการจ าแนกกลมขอมล แบบ trees J48………………… 4.12 หนาจอแสดงผลลพธการจ าแนกกลมขอมลดวยเทคนค Decision Tree : J48…. 4.13 หนาจอแสดงผลลพธทไดของโมเดล………………………………………..

33 33 34 34

4.14 หนาจอแสดงผลลพธการจ าแนกกลมขอมลดวยเทคนค Decision Tree : C4.5... 4.15 หนาจอแสดงผลลพธทไดของโมเดล………………………………………..

39 39

4.16 ผลลพธบางสวนจากการจ าแนกกลมแบบ Decision Tree : C4.5……………… 40

DPU

Page 10: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

สารบญภาพ (ตอ) ภาพท หนา

4.17 ผลลพธบางสวนจากการจ าแนกกลมแบบ Decision Rule : Part………………. 4.18 ผลลพธบางสวนจากการจ าแนกกลมแบบ Bayes : Naive Bayes………………. 4.19 หนาจอบนทกขอมลลกคาทตองการวเคราะหอนมตสนเชอ……………...……

41 42 51

4.20 หนาจอแสดงผลการวเคราะหขอมลลกคา……………………………….....…. 51 4.21 หนาจอแสดงการน ากฎมาเขยนโปรแกรมสวนแรก………………………....... 4.22 หนาจอแสดงการน ากฎมาเขยนโปรแกรมสวนทเปนเงอนไข……………….... 4.23 หนาจอแสดงการน ากฎมาเขยนโปรแกรมสวนทเปนเงอนไขสวนสดทาย……. 4.24 หนาจอแสดงรายงานขอมลลกคา…………………………………………....... 4.25 แบบวเคราะหและพจารณาสนเชอ (CREDIT SCORING)-Test A…………… 4.26 แบบวเคราะหและพจารณาสนเชอ (CREDIT SCORING)-Test B…………… 4.27 หนาจอแสดงรายงานขอมลลกคา......................................................................

52 52 53 53 54 56 58

DPU

Page 11: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

บทท 1 บทน า

1.1 ความเปนมาและความส าคญของปญหา

บรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน) ด าเนนธรกจหลกคอ ใหบรการรถเชาระยะยาว (Operating Lease) สญญาเชาระยะเวลา 3-5 ป และระยะสน (Rent) สญญาเชาระยะเวลาเปนรายวน รายสปดาห และรายเดอน กลมลกคาเปนนตบคคลทงขนาดกลางและขนาดใหญ บรษทขามชาต หนวยงานราชการและรฐวสาหกจ โดยลกคาสามารถเลอก ยหอและรนของ

รถยนต รวมถงอปกรณเสรมตางๆ ไดตามความตองการ การท าสญญาเชาเพอการด าเนนงานเปนการลดภาระทางดานการเงน โดยทลกคาไมตองลงทนจายเงนกอนเพอซอรถยนต ไมมภาระในการจดหาวงเงนกและหลกประกนตางๆ ดงนน หวใจหลกของการพจารณาอนมตใหเชารถ จ าเปนตองมการวเคราะหขอมลของผเชาอยางเขมงวดกอนการใหเชารถยนต

การวเคราะหขอมลการใหสนเชอน ถอเปนสงส าคญอยางมาก เพราะมผลตอรายไดและสภาพคลองขององคกร ซงจากประวตทผานมาบรษทฯ ตองสญเสยรายไดจากลกคาทไมด คดเปนหนสญประมาณ 0.4 % ของรายไดรวม ซงถอเปนรายไดทไมควรสญเสย

วธการตรวจเครดตของลกคาแบบปจจบน เปนการตรวจสอบจากเอกสารผเชา โดยพจารณาจากคณสมบตของผเชา เชน ประเภทธรกจ ระยะเวลาด าเนนธรกจ รายได และก าไร เปนตน เพอบงบอกความสามารถในการช าระหน และท าการวเคราะหขอมลเหลานผาน excel ซงท าใหเกดความลาชาในการวเคราะห และวเคราะหไดผลแบบไมละเอยด มโอกาสผดพลาดได สงผลใหการวเคราะหเครดตไมดพอ และกอใหเกดหนสญ

จากทกลาวมา มวธการหลายวธทสามารถชวยในการแกปญหาดงกลาวได เชน การตรวจเครดตบโร การใชโปรแกรมระบบการจดการฐานขอมล DBMS (Data Base Management System ) ซงมความสามารถทางดานการจดการแฟมขอมลมากมาย เชน การสรางแฟม การก าหนดความสมพนธของขอมลซงความสมพนธขอมลน สามารถใชประมวลผลขอมล หลาย ๆ แฟมรวมกนเสมอนเปนแฟมใหญแฟมเดยวได มวธการจดระบบขอมลใหเปนระเบยบเรยบรอย สามารถทจะคนหา ขอมลทตองการไดสะดวกรวดเรว และการท าเหมองขอมล (Data Mining) วธเหลานทกลาวมาด แตในการศกษางานวจยครงนเลอกการท าเหมองขอมล เพราะเปนวธการทเหมาะกบการ

DPU

Page 12: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

2

เพอคนหาความสมพนธของขอมลจากขอมลขนาดใหญทมอย เพอน าไปวเคราะห ปรากฏการณ ตาง ๆ โดยสามารถน ามาใชท านายผลได

การท าเหมองขอมล จากเดมทมการจดเกบขอมลอยางงายๆ มาสการจดเกบในรปแบบฐานขอมลทสามารถดงขอมลสารสนเทศมาใช ซงขอมลทถกเกบไวในฐานขอมลหากเกบไวเฉย ๆ กจะไมเกดประโยชนดงนนจงตองมการสกดสารสนเทศไปใช การสกดสารสนเทศ หมายถง การคดเลอกขอมลออกมาใชงานในสวนทเราตองการ ในปจจบนการวเคราะหขอมลจากฐานขอมลเดยวอาจไมใหความรเพยงพอและลกซงส าหรบการด าเนนงานภายใตภาวะทมการแขงขนสงและมการเปลยนแปลงทรวดเรวจงจ าเปนทจะตองรวบรวมฐานขอมลหลาย ๆ ฐานขอมลเขาดวยกน เรยกวา คลงขอมล ( Data Warehouse) เปนการเกบรวบรวมขอมลจากหลายแหลงมาเกบไวในรปแบบเดยวกนและรวบรวมไวในทๆ เดยวกน

งานวจยนจงขอเสนอการประยกตใชเทคนค การใชเหมองขอมล (Data Mining) มาชวยในการตดสนใจการใหสนเชอ ของลกคาแตละประเภทธรกจทมาเชารถ ซงเปนกรณศกษาของ บรษท กรงไทย คารเรนท แอนด ลส จ ากด (มหาชน) โดยใชขอมลลกคา ของป 2551-2553 ซงการวเคราะหการใหสนเชอน จะมประโยชนตอเจาหนาทฝายกฎหมายในสวนของการพจารณาการใหสนเชอกบลกคา โดยการท าเหมองขอมลจะชวยท าใหวเคราะหขอมล ไดรวดเรว ทนสมย ลดความเสยงดานหนสญ ท าใหมเกณฑในการคดเลอกลกคาชนดทมประสทธภาพมากขนใหกบองคกรได 1.2 วตถประสงคของสารนพนธ

1. เพอการวเคราะหขอมลของลกคาทมาเชารถ 2. เพอชวยการตดสนใจพจารณาขอมลสนเชอของลกคา ใหมประสทธภาพมากยงขน 3. เพอลดความเสยงดานหนสญ ในการอนมตใหเชารถยนต ตอลกคาทไมเหมาะสม

1.3 ขอบเขตของการวจย

1. รวบรวมขอมลทตองการน ามาใช ในการท าเหมองขอมล 2. ศกษาวธการของเครองมอ โปรแกรม Weka ทจะใชในการท าเหมองขอมล (Data Mining ) 3. น าเหมองขอมลทได (Data Mining ) มาพฒนาใชกบเครองมอ โปรแกรม Weka เพอใชใน

การตดสนใจการใหสนเชอ 4. วเคราะหผลการวจย 5. สรปผลการวจย

DPU

Page 13: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

3

1.4 ผลทคาดวาจะไดรบ 1. ชวยใหการวเคราะหสนเชอเปนไปอยางถกตองมากขน ลดความผดพลาดในการอนมต

สนเชอ 2. ชวยใหการตดสนใจการใหสนเชอ ไดรวดเรวขน และทนสมย 3. ท าใหมเครองมอทชวยในการตดสนใจทเสถยรขน เปนระบบมากขน 4. ท าใหไดซอฟตแวรทชวยในการพฒนา การตดสนใจการใหสนเชอ 5. ท าใหขอมลทม เกบอยางเปนระบบ และไดใชขอมลอยางมประสทธภาพมากทสด

1.5 นยามศพทเฉพาะ

การท าเหมองขอมล (Data Mining) คอ กระบวนการทกระท ากบขอมลจ านวนมาก เพอคนหารปแบบและความสมพนธ ทซอนอยในชดขอมลนน ซงการจดระบบฐานขอมลกมความส าคญในการจดการกบขอมลจ านวนมาก และควรจะมระบบฐานขอมลทด ในปจจบนการท าเหมองขอมลไดถกน าไปประยกตใชในงานหลายประเภท เชนดานธรกจทชวยในการตดสนใจของผบรหาร

ระบบฐานขอมล (Database System) หมายถง โครงสรางสารสนเทศทประกอบดวยรายละเอยดของขอมลทเกยวของกนทจะน ามาใชในระบบตาง ๆ รวมกน โดยการจดเกบขอมลอยางเปนระบบ ซงผใชสามารถจดการกบขอมลไดในลกษณะตาง ๆ ทงการเพม การแกไข การลบ ตลอดจนการเรยกดขอมลซงสวนใหญจะเปนการประยกตน าเอาระบบคอมพวเตอรเขามาชวยในการจดการฐานขอมล

บท (Bit) หมายถง หนวยของขอมลทมขนาดเลกทสด ไบท (Byte) หมายถง หนวยของขอมลทเกดจากการน าบท มารวมกนเปนตวอกขระ

(Character) เขตขอมล (Field) หมายถง หนวยของขอมลทประกอบขนจากตวอกขระตงแตหนงตว

ขนไปมารวมกนแลวไดความหมายของสงใดสงหนง ระเบยน (Record) หมายถง หนวยของขอมลทเกดจากการเอาเขตขอมลหลาย ๆ เขต

ขอมลมารวมกน เพอเกดเปนขอมลเรองใดเรองหนง แฟมขอมล (File) หมายถงหนวยของขอมลทเกดจากการน าขอมลหลาย ๆ ระเบยนท

เปนเรองเดยวกนมารวมกน เอสควแอล (SQL) ยอมาจาก structured query language คอภาษาทใชในการเขยน

โปรแกรม เพอจดการกบฐานขอมลโดยเฉพาะ

DPU

Page 14: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

4

ลกคาด หมายถง ลกคาทมประวตการช าระเงนตรงตามก าหนดของเงอนไขทลกคาไดรบการอนมต

ลกคาไมด หมายถง ลกคาทมประวตการช าระเงนไมตรงตามก าหนดของเงอนไขทลกคาไดรบการอนมต

DPU

Page 15: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

บทท 2

แนวคด ทฤษฎ และผลงานวจยทเกยวของ

จากการศกษาและคนควาเอกสาร และงานวจยทเกยวของกบการศกษาเรอง การใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ ของบรษท กรงไทย คารเรนท แอนด ลส จ ากด(มหาชน) ท าใหสามารถจ าแนก และประมวลความรทไดจากการทบทวนเอกสาร ออกเปน 2 สวน ไดแก แนวคด ทฤษฎ และผลงานวจยทเกยวของ ซงมรายละเอยด ดงน

2.1 แนวคดและทฤษฎทเกยวของ

2.1.1 การท าเหมองขอมล การท าเหมองขอมล (Data Mining) คอการคนหาความสมพนธและรปแบบทงหมด ซง

มอยจรงในฐานขอมลแตไดถกซอนไวภายในขอมลจ านวนมาก โดยการท าเหมองขอมลจะเหมาะกบการแกปญหาบางชนดเทานน มเทคนคตางๆ ทใชในการแกไขปญหาอยหลายเทคนค ซงไมมเทคนคใดสามารถแกปญหาไดทกปญหา ดงนนความหลากหลายของเทคนคเปนสงทจ าเปนทจะน าไปสวธการแกปญหาทดทสดของการท าเหมองขอมล

เหมองขอมล วทยา พรพชรพงศ(2547) กลาววา เหมองขอมล (Data Mining) หรอ การคนหาความรในฐานขอมล (Knowledge Discovery in Database - KDD) เปนเทคนคเพอคนหารปแบบ (Pattern) ของความรจากขอมลจ านวนมหาศาลโดยอตโนมต

2.1.2 ขนตอนการท างานของการท าเหมองขอมล จากขนตอนการท างานของการท าเหมองขอมล ประกอบไปดวย 4 ขนตอนหลก ๆ

ดงน 1. การระบปญหาทเกดขนกบธรกจเปนการระบขอบเขตของขอมลทจะน ามาท าการวเคราะหเพอหาความไดเปรยบทางการตลาดหรอเพอน ามาแกไขปญหา

2. สวนของการท าเหมองขอมล เปนการน าเทคนคของการท าเหมองขอมลไปใชถายทอด หรอท าการเปลยนแปลงขอมลดบใหอยในรปของขอมลจะน าไปใชไดจรงในทางธรกจ

3. การน าเอาขอมลทเปนผลลพธของสวนการท าเหมองขอมลมาลองปฎบตจรงกบธรกจ 4. การวดประสทธภาพของเทคนคการท าเหมองขอมลทจะน ามาใชจากผลลพธ เชน วด

จากสวนแบงของตลาด วดจากปรมาณลกคา หรอ วดจากก าไรสทธ เปนตน จากทง 4 ขนตอนท

DPU

Page 16: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

6

กลาวมาขางตนคอการน าเอา Data Mining ไปใชกบระบบทางธรกจ โดยแตละขนตอนจะพงพาอาศยกนผลลพธจากขนตอนหนงจะกลายมาเปนอนพทจากอกขนตอนตอไป ซง Data Mining จะเปลยนขอมลดบใหเปนขอมลประยกต ดงนนการระบแหลงขอมลทถกตองจงเปนสงทส าคญอยางยงตอผลลพธทไดจากการวเคราะห

2.1.3 งานของการท าเหมองขอมล ในทางปฏบตจรง การท าเหมองขอมลจะประสบความส าเรจกบงานบางกลมเทานน

และตองอยภายใต ภาวะทจ ากดปญหาเหมาะสมกบการใชเทคนคการท าเหมองขอมล จะเปนปญหาทตองใชเหตผลในการแก เปนปญหาทเกยวของกบเศรษฐศาสตรและการเงน ซงจะสามารถจดรปแบบของธรกจใหอยในรปแบบของงานทง 6 งานได ดงน

1. การจดหมวดหม (Classification) 2. การประเมนคา (Estimation) 3. การท านายลวงหนา (Prediction) 4. การจดกลมโดยอาศยความใกลชด (Affinity Group) 5. การรวมตว (Clustering) 6. การบรรยาย (Description)

ไมมเทคนคหรอเครองมอเพยงชนดเดยวของการท าเหมองขอมล ทเหมาะสมกบงานทกชนด งานในแตละชนดกจะมเทคนคของการท าเหมองขอมล ทแตกตางกนไปขนอยกบชนดของงาน

1. การจดหมวดหม การจดหมวดหมถอวาเปนงานธรรมดาทวไปของ การท าเหมองขอมล เพราะการท าความเขาใจและการตดตอสอสารตางๆ กเกยวของกบการแบงเปนหมวดหมการจดแยกประเภท และการแบงแยกชนดโดยการจดหมวดหมประกอบดวยการส ารวจจดเดนของวตถทปรากฏออกมา และท าการก าหนด จดเดนนนๆ เปนตวท ใชแบงหมวดหม งานในการแบงหมวดหมคอการบงบอกลกษณะ โดยการอธบายจดเดนทเปนทรจกดในหมวดหมนน และชดขอมลเรยนร (Training Set) ของตวอยางในแตละหมวดหม ซงมภาระหนาทในการสรางโมเดลของบางชนดทไมสามารถจะจดหมวดหมของขอมลได ใหสามารถจดเปน หมวดหมได ตวอยางของการจดหมวดหม เชน การจดหมวดหมของผยนขอเครดต (Credits) เปนระดบต าระดบกลางและระดบสงของความเสยงทจะไดรบเปนตน…………………………………………………………… 2. การประเมนคา ทางธรกจอยางตอเนองจะกอใหเกดผลลพธทมประโยชนกบธรกจ การปอนขอมลทเรามอยเขาไป เพอใชในการประเมนสงตางๆ ทจะกอใหเกดประโยชน หรอส าหรบตวแปรทเราไมรคา แนนอนเชน รายไดจากการคา จดสงสดทางธรกจ หรอดลยภาพของบตร

DPU

Page 17: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

7

เครดต ในทางปฏบตการประเมน คาจะถกใชในการท างานการจดหมวดหม ตวอยางของการประเมนคาเชนการประเมนรายไดรวมของครอบครวหรอการประเมนจ านวนบตรในครอบครว 3. การท านายลวงหนา การท านายลวงหนากเปนงานทมลกษณะคลายกบการจดหมวดหมหรอการประเมนคา ยกเวน เพยงแตจะใชสถตการบนทกของการจดหมวดหมในการท านายอนาคตของพฤตกรรมหรอการประเมน คาทจะเกดขนในอนาคต ตวอยางของงานการท านายลวงหนา เชน การท านายการเปลยนแปลงพฤตกรรม ของตลาด หรอการท านายจ านวนลกคาทจะออกจากธรกจของเราใน 6 เดอนขางหนาเปนตน…………………………………………………… 4. การจดกลมโดยอาศยความใกลชดกนหรอการวเคราะหของตลาด งานในการจดกลมหรอการวเคราะหตลาด คอการตดสนใจรวมสงทสามารถไปดวยกนเขาไวในกลมเดยวกน ตวอยางของการจดกลมโดยอาศยความใกลชดกนหรอการวเคราะหตลาด เชน การตดสนใจวาลกคาคนใดจดอยในกลมคาประเภทใด

5. การรวมตว การรวมตวคองานทท าการรวมสวนตางๆในแตละสวนทตางชนดกนใหอยในรวมกนเปนกลมยอย หรอคลสเตอร (Clusters) โดยในแตละกลมยอย อาจจะประกอบดวยสวนตางๆทตางชนดกน ซงความแตกตางของการรวมตวจากการจดหมวดหมคอ การรวมตวจะไมพงพาอาศยการก าหนดหมวดหมลวงหนา และไมใชตวอยางขอมลจะรวมตวกนบนพนฐานของความคลายในตวเอง……………………………………………………………………………………… 6. การบรรยาย ในบางครงวตถประสงคของการท าเหมองขอมล คอตองการอธบายความสบสนของฐานขอมลในทางทจะเพมความเขาใจในสวนของประชากร ผลตภณฑ หรอขบวนการใหมากขน เทคนคการท าเหมองขอมล สวนใหญตองการเทรนนงขอมลจ านวนมากทประกอบดวยหลายๆ ตวอยางเพอจะสรางกฎทใชในการจดหมวดหม กฎของความสมพนธ กลมยอย การท านายลวงหนา ดงนนชดของขอมลขนาดเลก จะน าไปสความไมนาไววางใจของผลสรปทไดไมมเทคนคใดเลย ทจะสามารถแกปญหาของการท าเหมองขอมลไดทกปญหา ดงนนความหลากหลายของเทคนคจงเปนสงทจ าเปนในการไปสวธการแกปญหาของData Miningไดดทสด

2.1.4 เทคนคการท าเหมองขอมล 2.1.4.1 การจ าแนกประเภทขอมล (Data Classification) กฤษณะ ไวยมย และคณะ

(2544, น.135) กลาววา การจ าแนกประเภทขอมล เปนกระบวนการสรางโมเดลจดการขอมลใหอยในกลมทก าหนดมาให โดยการสรางกฎเพอชวยในการตดสนใจจากขอมลทมอย เพอใชท านายแนวโนมการเกดขนของขอมลทยงไมเกดขน โดยการน าเสนอกฎทไดจากเทคนคการจ าแนกประเภทขอมล นยมน าเสนอในรปแบบของแผนภมตนไมซงเรยกวาตนไมชวยในการตดสนใจ

DPU

Page 18: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

8

2.1.4.2 ตนไมชวยการตดสนใจ (decision tree)(C4.5) เปนโครงสรางทใชแสดงกฏทไดจากเทคนคการจ าแนกประเภทขอมล โดยตนไมชวยการตดสนใจจะมลกษณะคลายโครงสรางตนไมทแตละโหนดแสดงคณลกษณะ (attribute), แตละกงแสดงเงอนไขในการทดสอบ และโหนดปลาย (leaf node) แสดงกลมทก าหนดไว การแทนตนไมการตดสนใจ (Decision Tree Representation)

1. โหนดภายใน (internal node) คอ คณสมบตตาง ๆ ของขอมล ซงเมอขอมลใด ๆ ตกลงมาทโหนด จะใชคณสมบตนเปนตวตดสนใจวาขอมลจะไปในทศทางใด โดยโหนดภายในทเปนจดเรมตนของตนไมเรยกวาโหนดราก

2. กง (Branch, link) เปนคาคณสมบตของคณสมบตในโหนดภายในทแตกกงนออกมา ซงโหนดภายในจะแตกกงเปนจ านวนเทากบจ านวนคาคณสมบตของโหนดภายในนน

3. โหนดใบ (leaf node) คอ กลมตาง ๆ ซงเปนผลลพธในการแยกแยะขอมล ภาพท 2.1 การแทนตนไมการตดสนใจ

2.1.4.3 ตวจ าแนกประเภทเบยอยางงาย (Naïve Bayes Classifier) เปนตวจ าแนกประเภทแบบหนงทใชงานไดด เหมาะกบกรณของเซตตวอยางมจ านวนมากและคณสมบต (Attrıbute) ของตวอยางไมขนตอกน มการน าตวจ าแนกประเภทเบยอยางงายไปประยกตใชงานในดานการจ าแนกประเภทขอความ (text classification) การวนจฉย (diagnosis) และพบวาใชงานไดดไมตางจากการจ าแนกประเภทวธการอน

Naïve Bayes เปนเทคนคทถกตงชอตาม Thomas Bayes น าเสนอโดย Kohavi ในป 1996 ไดใชทฤษฎ Bayes Theorem ในการแกปญหาเรองการจ าแนกประเภทขอมลทใชแบบจ าลองของการท านาย โดยจะท าการวเคราะหความสมพนธระหวางตวแปรอสระแตละตว กบตวแปรตาม ทงน เพอใชในการสรางเงอนไขความนาจะเปนส าหรบแตละความสมพนธทางทฤษฎ การท านาย

A

C B

D E F G

H I

DPU

Page 19: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

9

ผลของ Naïve-Bayes จะมความถกตอง เมอตวแปรอสระทงหมดมความเปนอสระตอกน ซงจะไมขนกบตวแปรอสระตวใดตวหนง

ขอจ ากดของอลกอรทก Naïve Bayes เทคนคแบบ Naïve-Bayes จะไมรองรบขอมลทเปนคาตอเนอง (Continuoues Data)

ดงนน ตวแปรอสระ หรอตวแปรตามทมคาตอเนอง จะตองมการแบงเปนขอมลเปนชวง ๆ เชน อายงาน เปนตน จะเหนไดวาถามการแบงชวงของขอมลไมเหมาะสม จะมผลตอคณภาพของแบบจ าลองทสรางขนได

2.1.4.4 กฎการตดสนใจ ( Decision rule) สามารถสรางขนจากตนไมการตดสนใจไดงาย โดยจะอยในรปของกฎ IF...THEN โดยท IF{สวนของการก าหนดเงอนไข} THEN {สวนของการกระท าตามเงอนไข}

กฎการตดสนใจ จะน าเสนอรปของ Production Rules ในลกษณะของ IF…Then ทใชในการแกปญหา สามารถสรางกฎไดงายและเปนทเขาใจของผน ากฎนไปใชงาน สวนประกอบของกฎ มดวยกน 2 สวน ไดแก IF ทจะเรยกวา Antecedent เปนสวนของการกระท าตามเงอนไขทก าหนด หรออาจเปนสวนของการแสดงบทสรปวาจะเปนอะไร หรอจะไดอะไร เปนตน

เราสามารถเชอมกฎทสรางขนดวยค าเชอม AND , OR ซงจะเรยกวา Production rules 2.1.4.5 เครอขายใยประสาท (Neural Network) เปนเทคโนโลยทมาจากงานวจยดาน

ปญญาประดษฐ (Artificial Intelligence: AI) เพอใชในการค านวณคาฟงกชนจากกลมขอมล วธการของเครอขายใยประสาทเปนวธการทใหเครองเรยนรจากตวอยางตนแบบแลวฝกใหระบบไดรจกคดแกปญหาทกวางขนไดในโครงสรางของเครอขายใยประสาทประกอบดวยโหนด Node ส าหรบ Input-output และการประมวลผลกระจายอยในโครงสรางเปนชน ๆ ไดแก Input layer, output layer และ Hidden layers การประมวลผลของเครอขายใยประสาทจะอาศยการสงการท างานผานโหนดตาง ๆ ใน Layers เหลาน ตวอยาง เครอขายใยประสาท กฤษณะ ไวยมย และคณะ (2544, น.138)

DPU

Page 20: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

10

Input Hidden processing layer Output ภาพท 2.2 เครอขายใยประสาท

2.1.4.6 การวเคราะหกลม (Cluster Analysis) เปนเทคนคการแบงกลมหนวยขอมล

หรอเปนการแบงคน สตว สงของ องคกร ฯลฯ ออกเปนกลมยอยอยางนอย 2 กลม โดยมหลกเกณฑในการแบงดงน “ใหหนวยทอยในกลมเดยวกนมลกษณะทสนใจเหมอนกนหรอคลายกน แตหนวยทอยตางกลมกนจะมลกษณะทสนใจตางกน” ค าวาลกษณะทสนใจอาจจะมหลาย ๆ ตวแปร เชน ถาสนใจความคดเหนทางดานการเมอง จะมค าถามหลาย ๆ ค าถามดานการเมอง และจะน าค าตอบเหลานนมาแบงกลม (กลยา วานชยบญชา. 2552, น.286)

การจด Case (หมายถง คน สตว สงของ หรอ องคกร ฯลฯ) หรอเปนการจดตวแปรออกเปนกลมยอย ๆ ตงแต 2 กลมขนไป Case ทอยในกลมเดยวกนจะมลกษณะทเหมอนกนหรอคลายกน สวน Case ทอยตางกลมกนจะมลกษณะทแตกตางกน

ตวแปรทอยในกลมเดยวกนจะมความสมพนธกนมากกวาตวแปรทอยตางกลมกน ตวแปรทอยตางกลมกนจะมความสมพนธกนนอยหรอไมมความสมพนธกนเลย

2.1.4.7 การคนหากฎความสมพนธ (Association rule discovery) การคนหาความสมพนธของขอมลจากฐานขอมลขนาดใหญทมอยเพอน าไปใชในการวเคราะห หรอท านายปรากฏการณตาง ๆ เปนการประเมนจากขอมลในฐานขอมลทรวบรวมไว โดยกฎความสมพนธทไดมสวนชวยในกระบวนการตดสนใจทางดานธรกจ ตวอยางของการคนหากฎความสมพนธ คอ การวเคราะหพฤตกรรมของผบรโภค โดยการหาความสมพนธระหวางสนคาทตางชนดกน แตลกคาจะเลอกซอไปพรอมกน

2.1.4.8 K-Nearest Neighbour (K-NN) คอ วธการในการจดแบงคลาส เทคนคนจะตดสนใจ วาคลาสใดทจะแทนเงอนไขหรอกรณใหมๆ ไดบาง โดยการตรวจสอบจ านวนบางจ านวน (“K” ใน K-nearest neighbor) ของกรณหรอเงอนไขทเหมอนกนหรอใกลเคยงกนมากทสด โดยจะ

DPU

Page 21: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

11

หาผลรวม (Count Up)ของจ านวนเงอนไข หรอกรณตางๆส าหรบแตละคลาส และก าหนดเงอนไขใหมๆ ใหคลาสทเหมอนกนกบคลาสทใกลเคยงกนมากทสด

2.1.5 โปรแกรม WEKA ยอมาจาก Waikato Environment for Knowledge Analysis เรมพฒนามาตงแตป 1997 โดยมหาวทยาลย Waikato ประเทศนวซแลนด เปนซฮฟตแวรเสรทอยภายใตขอตกลงของ GNU General Public License เขยนโดยใชภาษาจาวา ซอฟตแวรวกานอกจากจะสนบสนนเกยวกบเทคนคการเรยนรเรองเครองจกร(Machine Learning)แลวยงมอลกอรทมทสนบสนนการท างานของการท าเหมองขอมลดวยกจกรรมทเกยวของกบการท าเหมองขอมล ประกอบดวยการเตรยมขอมล(Data Preprocessing)การท าเหมองขอมลดวยเทคนคการจดกลม(Clustering)การท าเหมองขอมลดวยเทคนคการวเคราะหความสมพนธ(Associating)เทคนคการคดเลอกขอมล(Selecting Attributes)และเทคนคการท าเหมองขอมลดวยรปภาพ(Visualization)

ภาพท 2.3 แสดงหนาจอโปรแกรม Weka โปรแกรมหลกของซอฟตแวร Weka

1) Simple CLI (Command Line Interface) เปนโปรแกรมรบค าสงการท างานผานการพมพ 2) Explorer เปนโปรแกรมทออกแบบในลกษณะ GUI 3) Experimenter เปนโปรแกรมทออกแบบการทดลองและการทดสอบผล 4) KnowledgeFlow เปนโปรแกรมออกแบบผงการไหลของความร 5) ArffViewer เปนโปรแกรมทใช ส าหรบแก ไขแฟมประเภท Arff

DPU

Page 22: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

12

6) Log เปนโปรแกรมทใช อานขอความบนทกเกบระหวางการท างาน ในการวจยนจะใชเฉพาะโปรแกรม Explorer ในการศกษาวเคราะหและท าเหมองขอมล

ภาพท 2.4 แสดงเมนหลกของ Explorer Preprocess การเตรยมขอมล

1) Classify รวมโมดลการท าเหมองขอมลแบบจดแบงประเภท 2) Cluster รวมโมดลการท าเหมองขอมลแบบการเกาะกลม 3) Associate รวมโมดลการท าเหมองขอมลแบบกฎทเชอมโยง 4) Select attributes รวมโมดลส าหรบกาสรว เคราะห ความเกยวพนของลกษณะประจ า 5) Visualize น าเสนอขอมลดวยภาพนามธรรมสองมต

DPU

Page 23: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

13

ภาพท 2.5 แสดงสวนประกอบหลกของ Explorer ประเภทของแฟมขอมลทรบได

1) แฟมขอมลทรบตองเปน ARFF หรอ CSV 2) ในกรณทแฟมขอมลอยในเครอขายสามารถเรยกใชผาน URL ได 3) สามารถเรยกใชขอมลจากฐานขอมลได โดยเชอมโยงผาน JDBC

DPU

Page 24: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

14

ภาพท 2.6 สรางแฟมขอมลแบบ CSV

ภาพท 2.7 แสดงตวอยางแฟม carrent.csv

DPU

Page 25: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

15

2.1.6 ความรทวไปเกยวกบระบบฐานขอมล ฐานขอมลเปนการจดเกบขอมลอยางเปนระบบ ท าใหผใชสามารถใชขอมลทเกยวของ

ในระบบงานตาง ๆ รวมกนได โดยทจะไมเกดความซ าซอนของขอมล และยงสามารถหลกเลยงความขดแยงของขอมลดวย อกทงขอมลในระบบกจะถกตองเชอถอได และเปนมาตรฐานเดยวกน โดยจะมการก าหนดระบบความปลอดภยของขอมลขน

นบไดวาปจจบนเปนยคของสารสนเทศ เปนทยอมรบกนวา สารสนเทศเปนขอมลทผานการกลนกรองอยางเหมาะสม สามารถน ามาใชประโยชนอยางมากมาย ไมวาจะเปนการน ามาใชงานดานธรกจ การบรหาร และกจการอน ๆ องคกรทมขอมลปรมาณมาก ๆ จะพบความยงยากล าบากในการจดเกบขอมล ตลอดจนการน าขอมลทตองการออกมาใชใหทนตอเหตการณ ดงนนคอมพวเตอรจงถกน ามาใชเปนเครองมอชวยในการจดเกบขอมล การประมวลผลขอมล ซงท าใหระบบการจดเกบขอมลเปนไปไดสะดวก ทงนโปรแกรมแตละโปรแกรมจะตองสรางวธควบคมและจดการกบขอมลขนเอง ฐานขอมลจงเขามามบทบาทส าคญอยางมาก โดยเฉพาะระบบงานตาง ๆ ทใชคอมพวเตอร การออกแบบและพฒนาระบบฐานขอมล จงตองค านงถงการควบคมและการจดการความถกตองตลอดจนประสทธภาพในการเรยกใชขอมลดวย จากการจดเกบขอมลรวมเปนฐานขอมลจะกอใหเกดประโยชนดงน

1. สามารถลดความซ าซอนของขอมลได การเกบขอมลชนดเดยวกนไวหลาย ๆ ท ท าใหเกดความซ าซอน (Redundancy) ดงนน

การน าขอมลมารวมเกบไวในฐานขอมล จะชวยลดปญหาการเกดความซ าซอนของขอมลได โดยระบบจดการฐานขอมล (Database Management System : DBMS) จะชวยควบคมความซ าซอนได เนองจากระบบจดการฐานขอมลจะทราบไดตลอดเวลาวามขอมลซ าซอนกนอยทใดบาง

2. หลกเลยงความขดแยงของขอมลได หากมการเกบขอมลชนดเดยวกนไวหลาย ๆ ทและมการปรบปรงขอมลเดยวกนน แตปรบปรงไมครบทกททมขอมลเกบอยกจะท าใหเกดปญหาขอมลชนดเดยวกน อาจมคาไมเหมอนกนในแตละททเกบขอมลอย จงกอใหเกดความขดแยงของขอมลขน (Inconsistency)

3. สามารถใชขอมลรวมกนได ฐานขอมลจะเปนการจดเกบขอมลรวมไวดวยกน ดงนนหากผใชตองการใชขอมลใน

ฐานขอมลทมาจากแฟมขอมลตางๆ กจะท าไดโดยงาย 4. สามารถรกษาความถกตองเชอถอไดของขอมล

บางครงพบวาการจดเกบขอมลในฐานขอมลอาจมขอผดพลาดเกดขน เชน จากการทผปอนขอมลปอนขอมลผดพลาดคอปอนจากตวเลขหนงไปเปนอกตวเลขหนง โดยเฉพาะกรณม

DPU

Page 26: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

16

ผใชหลายคนตองใชขอมลจากฐานขอมลรวมกน หากผใชคนใดคนหนงแกไขขอมลผดพลาดกท าใหผอนไดรบผลกระทบตามไปดวย ในระบบจดการฐานขอมล (DBMS) จะสามารถใสกฎเกณฑเพอควบคมความผดพลาดทเกดขน

5. สามารถก าหนดความปนมาตรฐานเดยวกนของขอมลได การเกบขอมลรวมกนไวในฐานขอมลจะท าใหสามารถก าหนดมาตรฐานของขอมลได

รวมทงมาตรฐานตาง ๆ ในการจดเกบขอมลใหเปนไปในลกษณะเดยวกนได เชนการก าหนดรปแบบการเขยนวนท ในลกษณะ วน/เดอน/ป หรอ ป/เดอน/วน ทงนจะมผทคอยบรหารฐานขอมลทเราเรยกวา ผบรหารฐานขอมล (Database Administrator : DBA) เปนผก าหนดมาตรฐานตางๆ

6. สามารถก าหนดระบบความปลอดภยของขอมลได ระบบความปลอดภยในทน เปนการปองกนไมใหผใชทไมมสทธมาใช หรอมาเหนขอมลบางอยางในระบบ ผบรหารฐานขอมลจะสามารถก าหนดระดบการเรยกใชขอมลของผใชแตละคนไดตามความเหมาะสม

7. เกดความเปนอสระของขอมล ในระบบฐานขอมลจะมตวจดการฐานขอมลทท าหนาทเปนตวเชอมโยงกบฐานขอมล

โปรแกรมตาง ๆ อาจไมจ าเปนตองมโครงสรางขอมลทกครง ดงนนการแกไขขอมลบางครง จงอาจกระท าเฉพาะกบโปรแกรมทเรยกใชขอมลทเปลยนแปลงเทานน สวนโปรแกรมทไมไดเรยกใชขอมลดงกลาว กจะเปนอสระจากการเปลยนแปลง

2.1.7 รปแบบของระบบฐานขอมล รปแบบของระบบฐานขอมล มอยดวยกน 3 ประเภท คอ 1. ฐานขอมลเชงสมพนธ (Relational Database) เปนการเกบขอมลในรปแบบทเปนตาราง

(Table) หรอเรยกวา รเลชน (Relation) มลกษณะเปน 2 มต คอเปนแถว (row) และเปนคอลมน (column) การเชอมโยงขอมลระหวางตาราง จะเชอมโยงโดยใชแอททรบวต (attribute) หรอคอลมนทเหมอนกนทงสองตารางเปนตวเชอมโยงขอมล ฐานขอมลเชงสมพนธนจะเปนรปแบบของฐานขอมลทนยมใชในปจจบน

2. ฐานขอมลแบบเครอขาย (Network Database) ฐานขอมลแบบเครอขายจะเปนการรวมระเบยนตาง ๆ และความสมพนธระหวางระเบยนแตจะตางกบฐานขอมลเชงสมพนธ คอ ในฐานขอมลเชงสมพนธจะแฝงความสมพนธเอาไว โดยระเบยนทมความสมพนธกนจะตองมคาของขอมลในแอททรบวตใดแอททรบวตหนงเหมอนกน แตฐานขอมลแบบเครอขาย จะแสดงความสมพนธอยางชดเจน

3. ฐานขอมลแบบล าดบชน (Hierarchical Database) ฐานขอมลแบบล าดบชน เปนโครงสรางทจดเกบขอมลในลกษณะความสมพนธแบบพอ-ลก (Parent-Child Relationship Type :

DPU

Page 27: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

17

PCR Type) หรอเปนโครงสรางรปแบบตนไม (Tree) ขอมลทจดเกบในทน คอ ระเบยน (Record) ซงประกอบดวยคาของเขตขอมล (Field) ของเอนทตหนง ๆ ฐานขอมลแบบล าดบชนนคลายคลงกบฐานขอมลแบบเครอขาย แตตางกนทฐานขอมลแบบล าดบชน มกฎเพมขนมาอกหนงประการ คอ ในแตละกรอบจะมลกศรวงเขาหาไดไมเกน 1 หวลกศร

2.1.8 โปรแกรมฐานขอมล โปรแกรมฐานขอมล เปนโปรแกรมหรอซอฟแวรทชวยจดการขอมลหรอรายการตาง ๆ

ทอยในฐานขอมล ไมวาจะเปนการจดเกบ การเรยกใช การปรบปรงขอมล จะชวยใหผใชสามารถคนหาขอมลไดอยางรวดเรว ซงโปรแกรมฐานขอมลทนยมใชมอยดวยกนหลายตว แตในทนของยกตวอยางเชน SQL เปนโปรแกรมฐานขอมลทมโครงสรางของภาษาทเขาใจงาย ไมซบซอน มประสทธภาพการท างานสง สามารถท างานทซบซอนไดโดยใชค าสงเพยงไมกค าสง โปรแกรม SQL จงเหมาะทจะใชกบระบบฐานขอมลเชงสมพนธ และเปนภาษาหนงทมผนยมใชกนมาก โดยทวไปโปรแกรมฐานขอมลของบรษทตาง ๆ ทมใชอยในปจจบน เชน Oracle, DB2 กมกจะมค าสง SQL ทตางจากมาตรฐานไปบางเพอใหเปนจดเดนของแตละโปรแกรมไป

2.1.9 เอสควแอล (SQL) SQL ยอมาจาก structured query language คอภาษาทใชในการเขยนโปรแกรม เพอ

จดการกบฐานขอมลโดยเฉพาะ เปนภาษามาตราฐานบนระบบฐานขอมลเชงสมพนธและเปนระบบเปด (open system) หมายถงเราสามารถใชค าสง sql กบฐานขอมลชนดใดกได และ ค าสงงานเดยวกนเมอสงงานผาน ระบบฐานขอมลทแตกตางกนจะได ผลลพธเหมอนกน ท าใหเราสามารถเลอกใชฐานขอมล ชนดใดกไดโดยไมตดยดกบฐานขอมลใดฐานขอมลหนง นอกจากนแลว SQL ยงเปนชอโปรแกรมฐานขอมล ซงโปรแกรม SQL เปนโปรแกรมฐานขอมลทมโครงสรางของภาษาทเขาใจงาย ไมซบซอน มประสทธภาพการท างานสง สามารถท างานทซบซอนไดโดยใชค าสงเพยงไมกค าสง โปรแกรม SQL จงเหมาะทจะใชกบระบบฐานขอมลเชงสมพนธ

เอสควแอล (SQL) คอ ภาษาสอบถามขอมล หรอภาษาจดการขอมลอยางมโครงสราง มการพฒนาภาษาคอมพวเตอร และโปรแกรมฐานขอมลทรองรบมากมาย เพราะจดการขอมลไดงาย เชน MySQL ซงเปน Open Source ทใชงานไดทงใน Linux และ Windows

SQL เปนภาษาทใชในการเขยนโปรแกรม เพอจดการกบฐานขอมลโดยเฉพาะ เราสามารถแบงการท างานไดเปน 4 ประเภท ดงน

DPU

Page 28: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

18

1) Select query ใชในการดงขอมลในฐานขอมล จะมการคนหารายการจากตารางในฐานขอมล ตงแต

หนงตารางขนไป ตามเงอนไขทสง ผลลพธทไดจะเปนเซตของขอมลทสามารถสราง เปนตารางใหม

2) Update query ใชส าหรบการแกไขขอมลในตาราง โดยแกในคอลมนทมคาตรงตามเงอนไขมรปแบบ

ดงน Update ชอตาราง Set [ชอคอลมน=คาทจะใสเขาไปในคอลมนนน ๆ ] Where เงอนไข 3) Insert query ใชในการเพมเตมขอมลใหม ๆ เขาไปในฐานขอมล มรปแบบดงน Insert Into ชอตาราง

[=ชอคอลมน1,2..] Values [คาทจะใสลงในคอลมน 1,2…] 4) Delete query

ใชลบขอมลออกจากตาราง มรปแบบดงน Delete From ชอตาราง Where เงอนไข 2.1.10 MySQL (มายเอสควแอล)

เปนระบบจดการฐานขอมลโดยใชภาษา SQL. แมวา MySQL เปนซอฟตแวรโอเพนซอรส แตแตกตางจากซอฟตแวรโอเพนซอรสทวไป โดยมการพฒนาภายใตบรษท MySQL AB ในประเทศสวเดน โดยจดการ MySQL ทงในแบบทใหใชฟร และแบบทใชในเชงธรกจ นยมใชงานรวมกบภาษาโปรแกรม PHP นอกจากน หลายภาษาโปรแกรมทสามารถท างานรวมกบฐานขอมล MySQL ซงรวมถง ภาษาซ ซพลสพลส ปาสคาล ซชารป ภาษาจาวา ภาษาเพรล พเอชพ ไพทอน รบ และภาษาอน ใชงานผาน API ส าหรบโปรแกรมทตดตอผาน ODBC หรอ สวนเชอมตอกบภาษาอน (database connector) เชน เอเอสพ สามารถเรยกใช MySQL ผานทาง MyODBC,ADO,ADO.NET เปนตน

DPU

Page 29: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

19

2.2 ผลงานวจยทเกยวของ งานวจยของปรชา ยามนสะบดน และคณะ (2549) ศกษาเรอง การท าเหมองขอมลมาใช

ในการบรหารลกคาสมพนธส าหรบนกศกษาระดบอดมศกษา ซงพบวาใชขอมลของนกศกษาระดบปรญญาตร มหาวทยาลยสโขทยธรรมาธราช จากฐานขอมลทงหมด 94,244 คน ไดขนาดตวอยางจ านวน 94,244 คน เปนการเลอกกลมตวอยางดวยวธสมเทากนอยางเปนระบบ โดยน าขอมลสวนตวของนกศกษาและขอมลการลงทะเบยนเรยนของนกศกษามาใชในการท านายวาในอนาคต นกศกษาจะมโอกาสถกรไทรหรอไม โดยใชเทคนคโครงสรางตนไมตดสนใจ (Decısıon Tree) ในการสรางกฎได 1,082 กฎ และไดกฎทส าคญ 2 ขอ คอ กฎขอทหนง ถานกศกษามอตราสวนการสอบผานนอยกวา หรอ เทากบ 0.333 และมภาคการศกษานอยกวาหรอเทากบ 10 ภาคการศกษาและมอตราการสอบไมผานมากกวา 0.654 นกศกษาคนนนจะถกตดชอออกกลางคน สวนกฎขอทสองนนคอ ถานกศกษามอตราการสอบผานมากกวาหรอเทากบ 0.704 และมจ านวนชดวชาทลงทะเบยนเรยนมากกวา 4 ชดวชา และจ านวนภาคการศกษามากกวา 6 ภาคการศกษา และนกศกษามอายมากกวา 27 ปแลว นกศกษาคนนนจะส าเรจการศกษา

นอกจากน นางสาวบญมา เพงซวน (2548: 102) ไดเสนอขนตอนวธการศกษาตวแบบและพฒนาตวแบบ เพอน าตวแบบทไดน าไปประยกตใชในการสนบสนนการตดสนใจดานการผลตบณฑตระดบปรญญาตร โดยขนตอนวธทน าเสนอแบงเปน 5 สวน สวนแรกเปนการเตรยมขอมลสภาวะการมงานท าของบณฑต โดยน าขอมลสภาวะการมงานท าของบณฑตมาแปลงขอมลใหอยในรปทเหมาะสมส าหรบการน าไปศกษา สวนท 2 เปนการศกษาตวแบบเพอใชในการท านายแนวโนมการเลอกอาชพแรกหลงส าเรจการศกษาของนกศกษาระดบปรญญาตร โดยใชเทคนคการคนหากฎความสมพนธ ผวจยไดศกษาตวแปรทจะน ามาใชสรางเปนเงอนไขและผลลพธ ซงในการวจยน ไดใชสาขาวชาและเพศเปนเงอนไขสวนผลลพธคออาชพ สวนท 3 เปนการพฒนาตวแบบโดยน าขอมลสภาวะการมงานท าของบณฑตทผานการเตรยมขอมลเรยบรอยแลวมาสรางตวแบบตามทไดศกษามา โดยแบงขอมลออกเปน 2 ชด คอ ขอมลเรยนร และขอมลตรวจสอบ สวนท 4 เปนการทดสอบตวแบบ เพอหาความถกตองของตวแบบ และค านวณหารอยละความถกตองของตวแบบ เพอพจารณาวาตวแบบทศกษาและพฒนานนสามารถน าไปใชในการสนบสนนการตดสนใจดานการผลตบณฑตระดบปรญญาตรไดหรอไม สวนท 5 เปนการพฒนาระบบสนบสนนการตดสนใจ หลงจากททดสอบตวแบบแลววาตวแบบทศกษาและสรางขนนน สามารถน าไปใชได จากคาความเชอมนสงสด และคาสนบสนนสงสดของแตละเงอนไข ตอจากนนจงท าการแปลความหมายโดยน าขอมลรายบคคลนกศกษาทผานการแปลงขอมลแลวกบตวแบบทผานการจ าแนกกฎความสมพนธแลวมาประมวลผล โดยการตรวจสอบสาขาวชาและเพศของนกศกษาและน ามาเปรยบเทยบกบตว

DPU

Page 30: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

20

แบบกจะไดวานกศกษาจะประกอบอาชพอะไรตามตวแบบทได เมอแปลความหมายเสรจเรยบรอยแลว สามารถเรยกดรายงานจ านวนผประกอบอาชพตาง ๆ โดยระบเงอนไขตาง ๆ เชน ป หรอ อาชพ ซงรายงานกสามารถเลอกแบบรายงานทออกรายงานไดจากผลการวจยแสดงใหเหนวาสามารถสรางตวแบบในรปแบบกฎความสมพนธไดจรงและทดสอบความถกตองของตวแบบตามสดสวนทแบงขอมลเปน 3 ชวง คอ 60 : 40, 70 : 30 และ 80 : 20 ชวงละ 4 ครง และคดคาเฉลยรอยละความถกตองไดผล (Train : Validation) 60 : 40, 70 : 30, 80 : 20 ความถกตองของตวแบบ (คาเฉลย) 65.39%, 74.72%, 81.89% ตามล าดบ

ในสวนของงานวจย ณฐรน เจรญเกยรตบวรและปานใจ ธารทศนวงศ (2549) ไดใชการท าเหมองขอมล โดยใชเทคนคการคนหากฎความสมพนธ (Association Rule Discovery) เพอชวยในการแนะแนวการศกษาตอระดบอดมศกษาจากผลการศกษาในระดบมธยมปลาย 7 รายวชา คอ วชาภาษาไทย ภาษาองกฤษ สงคมศกษา คณตศาสตร ฟสกส เคม และ ชววทยา เปนองคประกอบในการคดเลอกโดยแบง Training Set : Validation เปน 60 : 40, 70 : 30 และ 75 : 25 พบวา ความถกตองเปน 82.32 %, 81.87%, 97.78% และ 92.37% ตามล าดบ ซงโมเดลนมความถกตองเฉลยเปน 87.06% สงเกตไดวาสดสวน Training Set มากขน ท าใหมความถกตองของผลลพธมากขน เมอส ารวจความพงพอใจในการใชโปรแกรมของนกเรยนและครพบวามความพงพอใจในระดบมากทสด และขอมลสามารถน าไปใชประโยชนในการแนะแนวการศกษาคดเปน 95.12%

จราพร ยงกวาชาตและคณะ (2549) ไดน าการท าเหมองขอมลมาใชการท านายผลส าเรจการศกษาของนกศกษาระดบอดมศกษาดวยการใชเทคนคการเรยนรแบบเบย โดยใชขอมลนกศกษาของมหาวทยาลยราชภฎอบลราชธาน ปการศกษา 2534-2545 ซงมขอมลนกศกษา 37,859 คน และไดคดเลอกขอมลทมความครบถวนสามารถน ามาสรางแบบจ าลองไดทงหมด 5,140 คน นอกจากนยงมขอมลนกศกษาของมหาวยาลยศรปทม 800 คน และไดคดเลอกขอมลทมความครบถวน สามารถน ามาสรางแบบจ าลองไดทงหมด 145 คน จากผลการวเคราะหเบองตนพบวาตวแปรทมผลตอการส าเรจการศกษาดงน คอ เกรดเฉลยในชนปแรก อาชพของมารดา และรายไดของครอบครว เมอน าตวแปรดงกลาวมาสรางแบบจ าลองดวยเทคนคขายงานเบยจะไดความแมนย าในการท านายผลถง 91.26% อยางไรกด ผลการวจยยงมอกตวแปรทงสามวามความสอดคลองกบผลการวเคราะหความถดถอยเชงพหคณ (Multiple Regression Analysis) นนคอ มผลตอการอธบายคาของตวแปรตาม ดงนน จงนาเชอวาตวแปรทงสามอน ไดแก เกรดเฉลยในขนปแรก อาชพของมารดา และรายไดของครอบครว นมความเหมาะสมในการน ามาสรางแบบจ าลองเพอท านายผลส าเรจการศกษาของนกศกษา

DPU

Page 31: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

21

ชลนศา สาระ (2550) เสนอวธการจ าแนกกลมสถานภาพการส าเรจการศกษาโดย แบบจ าลองตนไมตดสนใจ ซงใชอลกอรทม C4.5 ท าใหเขาใจถงกระบวนการ พารามเตอรทใช และการวดประสทธภาพในการสรางแบบจ าลองตนไมส าหรบอลกอรทม C4.5

วโรจน ภาคคร, กาญจนา วรยะพนธ (2550) ไดท าการวเคราะหรปแบบการบกรกขอมลบนเครอขาย โดยใชเทคนคดาตาไมนนง ซงไดใชเทคนคกาคดแยกกลมขอมล 3 ชนด คอ การใชแผนผงตนไมเพอการตดสนใจ โดยใชอลกอรทม C4.5 ซงใชกฎความสมพนธของรปเปอร และการใชนวรอลเนทเวรค ซงการใชแผนผงตนไมจะมรอยละของความถกตองมากทสด

ยงลกษณ ยงสวสด (2553) การพฒนาเครองมอจดกลมลกคาโดยใชเทคนคดาตาไมนง โดยใชตนไมการตดสนใจในการเรยนรขอมลของลกคาในอดต เพอท าการสรางตวแบบจ าลอง ส าหรบการตดสนใจในการจดกลมลกคารานคาชวง เพอใหสามารถพฒนาความสมพนธ และเพมประสทธภาพในการดแลรกษาลกคาใหดยงขน

เมอผวจยไดศกษาแนวคด ทฤษฎ และผลงานวจยทเกยวของดงทไดน าเสนอแลวนน ท าใหผวจยมความเขาใจในหลกการการใชเหมองขอมล ขนตอนการจดท า การจดเตรยมขอมลใหสมบรณ ประโยชนทไดจากการท าเหมองขอมลมากขน ซงเปนสวนส าคญทท าใหผวจยน าความรทไดเหลานไปประยกตใชในการท าเหมองขอมลเพอน ามาชวยในการตดสนใจการใหสนเชอ ภายในองคกร ซงจะน าเสนอในบทท 3 ระเบยบวธวจย และ บทท 4 ผลด าเนนการวจย ตอไป

DPU

Page 32: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

บทท 3 ระเบยบวธวจย

3.1 ขนตอนการด าเนนการวจย

งานวจยน จะกลาวถงขนตอนการด าเนนการวจย และไดน าเทคนคการใชเหมองขอมลมาชวยในการตดสนใจการใหสนเชอการเชารถยนตของบรษท กรงไทย คารเรนท แอนด ลส จ ากด (มหาชน) โดยมขนตอนการด าเนนการวจย ดงน

3.1.1 วธการเกบ และรวบรวมขอมล จากการทผวจยไดท าการสมภาษณ ผจดการแผนกกฎหมาย ของบรษท กรงไทย คารเรนท แอนด ลส จ ากด (มหาชน) ผวจยพบวา บรษทฯ มการเกบขอมลคอประวตของลกคาโดย ท าการวเคราะหขอมลลกคาจากแบบแบบวเคราะหและพจารณาสนเชอ (CREDIT SCORING) และมการเกบขอมลของลกคาแตละรายอยในลกษณะของไฟล Excel จงท าการเกบและรวบรวมขอมลประวตของลกคาทพจารณาใหสนเชอแลว ในป 2551–2553 จ านวน 441 ราย มาใชในการวจยครงน

3.1.2 การเตรยมขอมล และคดเลอกขอมลทจะน ามาใช หลงจากทผวจยไดรวบรวมขอมลแลว ในขนตอนแรก ตองมการเตรยมขอมลและคดเลอกขอมลทจะน ามาใช เนองจากขอมลมรปแบบทยงไมสามารถน าไปใช ผานกระบวนการทดสอบและวเคราะหดวยเครองมอการท าเหมองขอมลได จงตองมการเตรยมขอมลใหเปนไปตามรปแบบมาตรฐานเดยวกน และคดเลอกเฉพาะขอมลทสมบรณและรปแบบถกตอง ครบถวน และลดความหลากหลายของขอมล เพอใหไดผลการทดสอบทมประสทธภาพสงสด ไดแกขนตอนการโอนยายขอมล (Data Transfer) การลดขนาดของขอมล (Data Reduction) และการท าความสะอาดขอมล (Data Cleaning)

3.1.3 การทดสอบขอมล และเลอกเทคนคทเหมาะสม เปนการน าขอมลทไดคดเลอกแลวจากขนตอนทผานมา จงน าขอมลดงกลาว มาทดสอบกบโปรแกรม Weka ซงตองเลอกเทคนคการจ าแนกกลมขอมลทเหมาะสม โดยแตละเทคนคจะใหผลลพธออกมาในรปแบบทแตกตางกน ซงในการศกษาวจยครงนตองการน าโมเดลทไดจากการเลอกเทคนคทเหมาะสม มาใชในการวเคราะหเพออนมตใหสนเชอลกคา และน าไปพฒนาระบบสนบสนนการตดสนใจในการใหสนเชอลกคา ซงไดมการทดสอบจ านวน 3 เทคนค โดย

DPU

Page 33: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

23

รายละเอยดแตละเทคนคไดอธบายไวในบทท 2 และจะแสดงรายละเอยดของผลลพธในแตละเทคนคในบทท 4

3.1.4 ผลการวเคราะห เปนการวเคราะหผลลพธทไดจากการทดสอบของเทคนคทน ามาทดสอบ จ านวน 3 เทคนค โดยน าผลลพธทไดของแตละเทคนคมาวเคราะหความถกตองจากขอมลทน ามาทดสอบ เพอท าการเลอกกฎ ทมความนาเชอถอมากทสด จากกฎทมคาความเปนจรงมากสด เพอใชเปนเงอนไขในการพฒนาระบบสนบสนนการตดสนใจเพอการอนมตสนเชอ ในขนตอนตอไป

3.1.5 พฒนาระบบสนบสนนการตดสนใจอนมตสนเชอ เปนการน ากฎทไดจากการท าเหมองขอมลมาเปนเงอนไขในการพฒนาโปรแกรมใหเปนเครองมอชวยในการตดสนใจเพอการอนมตสนเชอ

3.1.6 สรปผลการวจยและขอเสนอแนะ เปนการกลาวถงผลการวจย การใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ นอกจากสามารถกฎมาพฒนาเปนระบบอนมตสนเชอแลว ยงสามารถน าการใชเหมองขอมลมาพฒนาเพอชวยในการตดสนใจส าหรบผบรหาร เพอชวยในการบรหารดานอน ๆ อกดวย เชน การหาความสมพนธของขอมลดานความพงพอใจของลกคา การท านายวาลกคาจะเชารถตอหรอไม เปนตน

3.1.7 เรยบเรยงงานคนควาอสระ 3.2 เครองมอทใชในการวจย

3.2.1 ระบบปฎบตการ Windows XP Professional Version 2002 pack 3 3.2.2 โปรแกรม Microsoft Excel ใชในการคดเลอกขอมลทจะน ามาใช เตรยมขอมล ส าหรบ

น าเขาทดสอบในโปรแกรม Weka 3.2.3 โปรแกรม CS 4, PHP, Apache และฐานขอมล My SQL พฒนาระบบสนบสนนการ

ตดสนใจอนมตสนเชอ 3.2.4 โปรแกรม Microsoft Word ใชในการจดท าเอกสารงานคนควาอสระ

DPU

Page 34: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

บทท 4 ผลด าเนนการวจย

จากวธการด าเนนงานทผศกษาไดท าการน าเสนอไปในบทท 3 นนไดผลการด าเนนวจย

ในแตละขนตอนดงน 1. วธการเกบ และรวบรวมขอมล 2. การเตรยมขอมล และคดเลอกขอมลทจะน ามาใช 3. การทดสอบขอมล และเลอกเทคนคทเหมาะสม 4. ผลการวเคราะห 5. พฒนาระบบสนบสนนการตดสนใจอนมตสนเชอ

4.1 วธการเกบ และรวบรวมขอมล

งานวจยครงนไดรวบรวมขอมลประวตของลกคาทพจารณาใหสนเชอ จากแบบวเคราะหและพจารณาสนเชอเพอเชารถยนต ( CREDIT SCORING ) จดท าโดยแผนกกฎหมาย ของบรษท กรงไทย คารเรนท แอนด ลส จ ากด (มหาชน) ตามภาพท 4.1

ขอมลทน ามาใชในการศกษาน ไดเกบรวบรวมขอมลลกคาผานการอนมตแลว ตงแตป พ.ศ. 2551-2553 มจ านวนลกคารวม 441 ราย โดยขอมลทจดเกบมทงหมด 30 แอทรบวต แตขอมลทมความจ าเปนตองใชในการประกอบการพจารณาใหสนเชอมจ านวน 17 แอทรบวต ประกอบดวย แอทรบวต ดงนคอ วตถประสงคการใชงานรถยนต, ประเภทรถยนต ประเภทธรกจ ประเภทลกคา, ระยะเวลาด าเนนธรกจ ทนจดทะเบยน ก าไรสทธ รายไดหลก สวนผถอหน อตราสนทรพยหมน/หนสนหมนเวยน อตราหนสนรวม/สนทรพยรวม อตราหนสนรวม/สวนผถอหน อตราการเพมของยอดขาย อตราการเพมของก าไรสทธ วงเงนอนมต เกรดลกคา และสถานะลกคา โดยรวบรวมขอมลลกคาทงหมดใหอยในรปแบบฐานขอมลเดยวกน

DPU

Page 35: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

25

ภาพท 4.1 แสดงแบบวเคราะหและพจารณาสนเชอเพอเชารถยนต (CREDIT SCORING)

DPU

Page 36: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

26

ภาพท 4.1 (ตอ) 4.2 การเตรยมขอมล และคดเลอกขอมลทจะน ามาใช

เนองจากการเกบขอมลของบรษทฯ ไดจดเกบไวในรปแบบทไมสามารถน ามาใชในการทดสอบและวเคราะหดวยเครองมอการท าเหมองขอมลได จงตองมการเตรยมขอมล และคดเลอกขอมลทจะน ามาใชในการท าเหมองขอมล เพอใหไดผลการทดสอบทมประสทธภาพสงสด โดยประกอบดวย 3 ขนตอน คอ การโอนยายขอมล (Data Transfer) การลดขนาดของขอมล (Data Reduction) และการท าความสะอาดขอมล (Data Cleaning)

4.2.1 การโอนยายขอมล (Data Transfer) การโอนยายขอมลเปนการโอนขอมลเดม ทถกจดเกบอยในรปแบบไฟล Excel ทม

รปแบบการกรอกขอมลลงในแบบฟอรมทก าหนดไวลวงหนา ของลกคาแตละราย ท าใหขอมลของลกคา ไมถกจดเกบ หรอรวบรวมไวในฐานขอมลเดยวกน จงจ าเปนตองมการโอนยายขอมลของลกคาแตละราย ใหอยในรปแบบฐานขอมลเดยวกน ซงใช excel ในการสรางเปนฐานขอมล และบนทกขอมลใหอยในรปแบบ .CSV เพอใหสามารถน าไปใชงานได และสะดวกตอการน าเขาขอมลในโปรแกรม Weka ตามภาพท 4.1 ขอมลของลกคา ไมถกจดเกบ หรอรวบรวมไวในฐานขอมล

DPU

Page 37: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

27

เดยวกน จงจ าเปนตองมการโอนยายขอมลของลกคาแตละราย ใหอยในรปแบบฐานขอมลเดยวกน และตามภาพท 4.2

ภาพท 4.2 การโอนยายขอมลจากแบบฟอรมน ามาอยในรปแบบเดยวกนในไฟล Excel ทสรางเปนฐานขอมล

4.2.2 การลดขนาดของขอมล (Data Reduction) การลดขนาดของขอมล เพอใหไดขอมลทสมบรณ และมรปแบบทสามารถน าเขาไป

ทดลองการท าเหมองขอมลกบโปรแกรม Weka ได จงตองท าการลดขนาดของขอมล 3 สวน คอ สวนท 1. ลดจ านวนแอทรบวต โดยขอมลทรวบรวมมาจากแบบวเคราะหและพจารณาสนเชอเพอเชารถยนต ( CREDIT SCORING ) มทงหมดจ านวน 30 แอทรบวต แตขอมลทมความจ าเปนตองใชในการประกอบการพจารณาใหสนเชอมจ านวน 17 แอทรบวต จงลดจ านวนแอทรบวตสวนทไมจ าเปนออก คงเหลอแอทรบวต ดงนคอ วตถประสงคการใชงานรถยนต ประเภทรถยนต ประเภทธรกจ ประเภทลกคา ระยะเวลาด าเนนธรกจ ทนจดทะเบยน ก าไรสทธ รายไดหลก สวนผถอหน อตราสนทรพยหมน : หนสนหมนเวยน อตราหนสนรวม : สนทรพยรวม อตราหนสนรวม : สวนผถอหน อตราการเพมของยอดขาย อตราการเพมของก าไรสทธ วงเงนอนมต เกรดลกคา และสถานะลกคา สวนท 2. ลดขอมลทมแอทรบวตไมครบถวน ซงหลงจากลดจ านวนแอทรบวตแลว ตองตรวจสอบความครบถวนของขอมล ซงขอมลลกคาบางราย มขอมลไมครบทกแอทรบวต จงตองคดเลอกขอมลเฉพาะรายทระเบยนมความสมบรณครบถวน โดยหลงจากคดเลอกแลวคงเหลอขอมลทสมบรณจ านวน 441 ราย และสวนท 3. ลดความหลากหลายของแอทรบวต ไดแก วงเงนอนมต ซง

DPU

Page 38: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

28

ลกคาแตละรายจะไดรบอนมตในวงเงนทไมเทากน จงตองจดกลมของวงเงนใหคงเหลอเพยง 4 กลม ไดแก

กลมท 1 1-10,000,000 กลมท 2 10,000,001-50,000,000 กลมท 3 50,000,001-100,000,000 กลมท 4 100,000,001-1,000,000,000

4.2.3 การท าความสะอาดขอมล (Data Cleaning) แกคาของขอมลทมความหมายเหมอนกนใหเปนมาตรฐานเดยวกน ตามตารางภาพท 4.1

ตารางท 4.1 การแปลงคาของขอมลวตถประสงคการใชงาน ขอมลเดม ขอมลใหม

ขนสงสนคา transport งานบรการ-ขนสงสนคา

ใชบรรทกของ พนกงาน

private ผจดการสาขา ประจ าต าแหนง ผบรหาร การตลาด mkt.

ตดตอลกคา

DPU

Page 39: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

29

ภาพท 4.3 ผลการแปลงคาของขอมลวตถประสงคการใชงาน ภาพท 4.4 การบนทกขอมลในรปแบบนามสกล .csv

DPU

Page 40: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

30

ภาพท 4.5 แสดงไฟลขอมลในรปแบบนามสกล .csv 4.3 การทดสอบขอมล และเลอกเทคนคทเหมาะสม

4.3.1 การทดสอบขอมล หลงจากเตรยมขอมลทมความสมบรณ ครบถวน และลดความหลากหลายของ

ขอมลแลว จงน าขอมลดงกลาว มาทดสอบกบโปรแกรม Weka ซงมขนตอนดงน ขนตอนท 1. เปดโปรแกรม ตามภาพท 4.6 และแสดงหนาโปรแกรมตามภาพท 4.7

DPU

Page 41: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

31

ภาพท 4.6 แสดงการเปดโปรแกรม Weka 3.6.6 ภาพท 4.7 แสดงการเขาหนาโปรแกรม Weka 3.6.6

ขนตอนท 2. น าเขาขอมลทจดเตรยมไว โดยการ เลอก Application >> Explorer >> Open file เลอกไฟลขอมลทตองการน าเขา ตามภาพท 4.8 และ หลงจากนน จะแสดงหนาจอขอมล ตามภาพท 4.9 ซงหนาจอนจะท าการวเคราะหหาจ านวนของขอมลทใชในการวจย เพอใหทราบจ านวนเปอรเซนต ตอขอมลทงหมด และคาเฉลยของขอมลในแตละแอทรบวต

DPU

Page 42: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

32

ภาพท 4.8 การน าเขาขอมลในโปรแกรม Weka ภาพท 4.9 หนาจอการแสดงขอมลทน าเขา

ขนตอนท 3. เลอกเทคนคทตองการ ไดแก การจดกลมขอมลโดยการเลอก Classify >> Choose (ตามภาพ 4.10) >> trees >> เลอกเทคนคการจ าแนกขอมลทตองการ เชน J48 (ตามภาพ 4.11) กดปม Start (ตามภาพ 4.12) และจะแสดงผลลพธทไดตามภาพ 4.13

เลอกไฟล carrent.csv DPU

Page 43: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

33

ภาพท 4.10 หนาจอแสดงการเลอกเทคนค Classify

ภาพท 4.11 การเลอกเทคนคทใชในการจ าแนกกลมขอมล แบบ trees J48

เลอก trees

เลอก J48

DPU

Page 44: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

34

ภาพท 4.12 หนาจอแสดงผลลพธการจ าแนกกลมขอมลดวยเทคนค Decision Tree: J48

ภาพท 4.13 หนาจอแสดงผลลพธทไดของโมเดล

ผลลพธทได

DPU

Page 45: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

35

4.3.2 การเลอกเทคนค เทคนคการจ าแนกกลมขอมลมหลายเทคนค แตละเทคนคกใหผลลพธออกมาใน

รปแบบทแตกตางกน ในการศกษาวจยครงนตองการน าโมเดลทไดจากการเลอกเทคนคทเหมาะสม มาใชในการวเคราะหเพออนมตใหสนเชอลกคา และน าไปพฒนาระบบสนบสนนการตดสนใจในการใหสนเชอลกคา ดงนนเทคนคการจ าแนกกลมทน ามาใชในการศกษาครงน ซงรายละเอยดแตละเทคนคไดอธบายไวในบทท 2

1. โมเดลการจ าแนกกลมแบบ Decision Tree : C4.5 หรอเรยกวาโมเดล Classifires trees J48 ในโปรแกรม Weka

2. โมเดลการจ าแนกกลมแบบ Decision Rule : Part หรอเรยกวาโมเดล Classifires PART ในโปรแกรม Weka

3. โมเดลการจ าแนกกลมแบบ Bayes : Naïve Bayes หรอเรยกวาโมเดล Classifier Naïve Bayes ในโปรแกรม Weka 4.4 ผลการวเคราะห

ในการศกษาครงนท าการทดสอบ โมเดลโดยใชโปรแกรมประยกต Weka เวอรชน 3.6.6 ขอมลทใชในการทดสอบมทงหมด 441 แถว และ 17 แอทรบวต ในการทดสอบไดใชการทดสอบแบบ 10-fold cross validation ซงไดแก การแบงกลมขอมลออกเปน 10 กลม ในแตละรอบจะน ากลมขอมลจ านวน 9 กลม เปนกลมศกษา (Training Set) และกลมขอมลทเหลอเปนกลมทดสอบ (Testing Set) โดยท าซ าเปนจ านวน 10 รอบ เพอเปลยนกลมทดสอบใหครบทกกลม และน าผลลพธทไดมาหาคาเฉลย โดยอธบายความหมายแตละแอทรบวต ซงม 17 แอทรบวต ดงน ตารางท 4.2 อธบายความหมายแตละแอทรบวต

Object วตถประสงคการใชงานรถยนต Car typ ประเภทรถยนต Bus Typ ประเภทธรกจ CusTyp ประเภทลกคา Long Run ระยะเวลาด าเนนธรกจ

DPU

Page 46: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

36

ตารางท 4.2 (ตอ)

Capital ทนจดทะเบยน NP ก าไรสทธ Income รายไดหลก OE สวนผถอหน Cur ratio อตราสนทรพยหมน/หนสนหมนเวยน Debt Ratio อตราหนสนรวม/สนทรพยรวม DE อตราหนสนรวม/สวนผถอหน Growth Inc อตราการเพมของยอดขาย Growth NP อตราการเพมของก าไรสทธ Credit line วงเงนอนมต Grade เกรดลกคา Status สถานะลกคา

ตารางท 4.3 อธบายความหมายแตละฟลด

Object ความหมาย Car typ ความหมาย Bus Typ ความหมาย

mkt รถเพอใชเดนทางพบลกคา Large รถยนตเกงขนาดใหญ five 5 คะแนน

private รถ เพ อก าร เด นท า งสวนตว Lux รถยนตLuxury four 4 คะแนน

transport รถเพอการขนสง Medium รถยนตเกงขนาดกลาง two 2 คะแนน MPV รถยนตเอนกประสงค zero 0 คะแนน Pickup รถกระบะ Small รถยนตเกงขนาดเลก Van รถยนตต

DPU

Page 47: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

37

ตารางท 4.4 อธบายความหมายแตละฟลด

ตารางท 4.5 อธบายความหมายแตละฟลด

NP ความหมาย Income ความหมาย OE ความหมาย 0 ขาดทนตอเนองLLL 0 ลดลงตอเนอง 0 ลดลงตอเนอง 2 ป 13 สลบกน LPP, LPL, PLP 13 เพม-ลดสลบกน 8 เพม-ลดสลบกน 14 ก าไร 2 ปลาสด PPL 14 เพมขนตอเนอง 1 ป 9 เพมขนตอเนอง 1 ป 15 ก าไร 3 ป PPP 15 เพมขนตอเนอง 2 ป 10 เพมขนตอเนอง 2 ป

ตารางท 4.6 อธบายความหมายแตละฟลด Cur ratio ความหมาย

Debt Ratio ความหมาย DE ความหมาย

0 คาตดลบ 0 > 250% 0 > 300% 3 คาเฉลย 0-0.75 เทา 3 คาเฉลย 151-250% 3 คาเฉลย 201-300% 4 คาเฉลย0.76-1 เทา 4 คาเฉลย50-150% 4 คาเฉลย100-200% 5 คาเฉลย 3 ป > 1 เทา 5 คาเฉลย < 50% 5 คาเฉลย < 100%

CusTyp ความหมาย Long Run ความหมาย Capital ความหมาย

CCC ลกคาเกาช าระด>3ป 0 < 3ป 0 < 3ลานบาท DDD ลกคาเกาช าระด 13 3-5ป 8 3-60ลานบาท EEE ลกคาใหม 14 6-10ป 9 61-100ลานบาท ZZZ ลกคาเกาช าระไมด 15 > 10ป 10 > 100ลานบาท DPU

Page 48: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

38

ตารางท 4.7 อธบายความหมายแตละฟลด

Growth Inc ความหมาย Growth NP ความหมาย

0 คาเฉลย ตดลบ 0 คาเฉลย ตดลบ

3 คาเฉลย 1-5% 3 คาเฉลย 1-5%

4 คาเฉลย 6-10% 4 คาเฉลย 6-10%

5 คาเฉลย> 10% 5 คาเฉลย> 10%

ตารางท 4.8 อธบายความหมายแตละฟลด

Grade ความหมาย A เกรดลกคา A = คะแนนรวมตงแต 89-100 คะแนน B B = คะแนนรวมตงแต 76 - 88 คะแนน C C = คะแนนรวมตงแต 60 - 75 คะแนน D D = คะแนนรวมต ากวา 60 คะแนน z

จากการทดสอบ 3 เทคนคทไดกลาวไวในบทท 3 ไดรายละเอยดผลลพธ ดงน ผลลพธเทคนคท 1 Decision Tree : C4.5 หรอเรยกวาโมเดล Classifires trees J48

แสดงตามภาพท 4.14 4.15 และ 4.16

DPU

Page 49: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

39

ภาพท 4.14 หนาจอแสดงผลลพธการจ าแนกกลมขอมลดวยเทคนค Decision Tree : C4.5

ภาพท 4.15 หนาจอแสดงผลลพธทไดของโมเดล

DPU

Page 50: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

40

ภาพท 4.16 ผลลพธบางสวนจากการจ าแนกกลมแบบ Decision Tree : C4.5

จากการทดสอบเทคนคน พบวา ใหผลลพธการจ าแนกกลมลกคาด และไมด ซง ลกคาด หมายถง ลกคาทมประวตการช าระเงนตรงตามก าหนดของเงอนไขทลกคาไดรบการอนมต และ ลกคาไมด หมายถง ลกคาทมประวตการช าระเงนไมตรงตามก าหนดของเงอนไขทลกคาไดรบการอนมต มความถกตองเปน 90.47% และไดจ านวนกฎจ านวน 40 กฎ ซงจะแสดงผลลพธเปนกฎในลกษณะของตนไมการตดสนใจ ทมกงตนไมจ านวนมาก

โดยผลลพธทไดจะแสดงเงอนไขของกฎ โดยคาของขอมลของแอทรบวตทมคาตอเนองจะใชเครองหมาย “<” “<= ” และ “>” “=>” และในการพจารณาสวนขอมลทเปนคาไมตอเนองจะใชเครองหมาย “=” และใชเงอนไข “AND” ในการเชอมโยงระหวางแอทรบวต โดยจะเชอมโยงไปจนถงแอทรบวตทจะแบงกลมได และจะมขอมลความถกตองของกฎ เชน

Car typ = Pickup: Good (6.0/1.0) หมายถง ถาประเภทรถ เปนรถ Pickup จะเปนลกคาด และมขอมลทสอดคลองหรอใหผลลพธตรงกนจ านวน 6 ตวอยาง และใหผลลพธทไมตรงกนจ านวน 1 ตวอยาง และไดแสดงตวอยางผลการรนไวทภาคผนวก

DPU

Page 51: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

41

ผลลพธเทคนคท 2 การจ าแนกกลมแบบ Decision Rule : Part แสดงตามภาพท 4.17

ภาพท 4.17 ผลลพธบางสวนจากการจ าแนกกลมแบบ Decision Rule: Part

จากการทดสอบเทคนคน พบวา ใหผลลพธการจ าแนกกลมลกคาด และไมด มความถก

ตองเปน 90.24% และไดจ านวนกฎจ านวน 26 กฎ ซงแสดงผลลพธเปนกฎทเขาใจงายใหจ านวนกฎนอย ตามทแสดงดงภาพท 4.17

เชน CusTyp = CCC AND Grade = C AND Object = private AND Growth NP > 0: Good(110.0) หมายถง ถาประเภทลกคาเปนลกคาใหม และเกรดเทากบผลคะแนนรวมตงแต 60-75 คะแนน และวตถประสงคการใชงานคอใชงานสวนตว และอตราการเพมของก าไรสทธมากกวา 0 จะเปนลกคาด และมขอมลทสอดคลองหรอใหผลลพธตรงกนจ านวน 110 ตวอยาง

DPU

Page 52: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

42

ผลลพธเทคนคท 3 การจ าแนกกลมแบบ Bayes : Naive Bayes แสดงตามภาพท 4.18

ภาพท 4.18 ผลลพธบางสวนจากการจ าแนกกลมแบบ Bayes : Naive Bayes

จากการทดสอบเทคนคน พบวา ใหผลลพธการจ าแนกกลมลกคาด และไมด มความถก

ตองเปน 87.52% วธนจะไมรองรบขอมลทเปนคาตอเนอง (Continuous Data) ดงนน ผลลพธจะแสดง

การแบงกลมขอมลเปนชวง ๆ ไดแก แบงกลมวตถประสงคการใชงานรถยนต (Object) ม 3 กลม คอ มวตถประสงคใชงานสวนตว (private) ใชท าการขนสง (transport) และ ใชส าหรบเดนทางพบลกคา (mkt.) และแสดงใหเหนวาลกคาด และลกคาไมด มจ านวนเทาไหร เชน ถาแบงกลมตามวตถประสงคการใชรถยนตแบบสวนตว จะไดผลลพธเปนลกคาดจ านวน 281 ราย และลกคาไมดจ านวน 19 ราย ถาแบงกลมตามวตถประสงคการใชรถยนตเพอขนสง จะไดผลลพธเปนลกคาดจ านวน 121 ราย และลกคาไมดจ านวน 10 ราย ถาแบงกลมตามวตถประสงคการใชรถยนตส าหรบเดนทางพบลกคา จะไดผลลพธเปนลกคาดจ านวน 15 ราย และลกคาไมดจ านวน 1 ราย

DPU

Page 53: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

43

4.4.1 การวเคราะหและการคดเลอกกฎ จากผลการทดลอง การจ าแนกกลมทง 3 แบบ คอ 1) แบบ Decision Tree: C4.5 2) แบบ Decision Rule: Part และ 3) แบบ Bayes: Naive Bayes พบวาแตละแบบใหผลลพธทมความถกตองคอ 90.47 เปอรเซนต 90.24 เปอรเซนต และ 87.52 เปอรเซนต ตามล าดบ และใหกฎจ านวน 40 กฎ 26 กฎ และ ไมมกฎ ตามล าดบ ซงการจ าแนกกลมแบบ Decision Tree: C4.5 ใหผลลพธทมความถกตองมากทสด สามารถแบงกลมไดตามเงอนไขทชดเจนมากทสด และสามารถแสดงกฎใหสามารถน าไปวเคราะหกฎตอไปได (ผลการรนฉบบเตมอยทภาคผนวก) โดยแบงเปน 4 กลมหลก ๆ ดงน

1. กฎทจ าแนกกลมลกคาด (Good) ไดถกตอง 100 เปอรเซนต มจ านวน 23 กฎ ซงกฎทอยในกลมนเปนกฎทมความนาเชอถอมากทสด เพราะสามารถจ าแนกกลมตวอยางไดถกตองทงหมด

ตวอยางกฎในกลมน เชน Grade = C and Object = private and Growth NP > 0 : Good (115.0)หมายถง ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ ไมมผลขาดทนตอเนอง จะเปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 115 ตวอยาง

2. กฎทจ าแนกกลมลกคาไมด (Bad) ไดถกตอง 100 เปอรเซนต มจ านวน 4 กฎ ซงกฎทอยในกลมนเปนกฎทมความนาเชอถอมากทสด เพราะสามารถจ าแนกกลมตวอยางไดถกตองทงหมด

ตวอยางกฎในกลมน เชน Grade = C and Object = transport and LongRun >13 Car typ = Pickup and Bus typ = four and OE <=0 : Bad (2.0) หมายถง ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถกระบะ และประเภทธรกจ เปนกลม Four และ สวนของผถอหน ลดลงตอเนอง 2 ป เปนกลมลกคาไมด โดยมขอมลทสอดคลองกบกฎน จ านวน 2 ตวอยาง

3. กฎทจ าแนกกลมลกคาด (Good) ไดถกตองนอยกวา 100 เปอรเซนต มจ านวน 12 กฎ ตวอยางกฎในกลมน เชน Grade = C and Object = private and Growth NP <= 0 and

OE <=9 : Good (59.63/2.0) หมายถง ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผล

ขาดทนตอเนอง และสวนของผถอหน ไมมการเพมขนตอเนอง 2 ป จะเปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 58 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 2 ตวอยาง

4. กฎทจ าแนกกลมลกคาไมด (Bad) ไดถกตองนอยกวา 100 เปอรเซนต มจ านวน 1 กฎ

DPU

Page 54: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

44

ตวอยางกฎในกลมน เชน Grade = B and Car typ = Small and Income <= 13 and LongRun <=14 : BAD (3.0/1.0)

หมายถง เปนลกคาเกรด B รถทเชาเปนรถยนตเกงขนาดเลก รายไดหลก ไมมการเพมขนอยางตอเนอง ระยะเวลาการด าเนนธรกจต ากวา 15 ป เปนกลมลกคาไมด โดยมขอมลทสอดคลองกบกฎน จ านวน 2 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง

แตเนองจากกฎทได มบางกฎทมความถกตอง นอยกวา 90% หรอ บางกฎไมมตวอยางสนบสนนกบกฎดงกลาว หรอ บางกฎทไมสมบรณ

ดงนน จงท าการลบกฎดงกลาวออกไป จ านวน 12 กฎ ดงตอไปน 1. กฎทไมมกลมตวอยางสนบสนน มจ านวน 3 กฎ ไดแก Grade = B and CarTyp = Lux : Good (0.0) หมายถง ถาลกคาไดเกรด B และ

ประเภทรถทใชเปนกลม Luxury เปนกลมลกคาด Grade = C and Object = transport and LongRun>13 and CarTyp = Lux : Good

(0.0) หมายถง ถาลกคาไดเกรด C และ วตถประสงคการใชรถเพอการขนสง และ ระยะเวลาการด าเนนธรกจ มากกวา 6 ป และประเภทรถทใชเปนกลม Luxury เปนกลมลกคาด นอกจากไมมกลมตวอยางสนบสนนแลว เงอนไขยงไมเหมาะสมดวย เนองจาก ถาใชรถเพอการขนสง ไมสอดคลองกบประเภทรถทเปนกลม Luxury

Grade = C and Object = private and Growth NP <= 0 and OE >9 and CarTyp = Pickup : Good (0.0) หมายถง ถาลกคาไดเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และมการผลขาดทนตอเนอง และสวนของผถอหน เพมขนตอเนองอยางนอย 1 ป และประเภทรถเปนรถกระบะ เปนกลมลกคาด

2. กฎทมความถกตองนอยกวา 90% มจ านวน 8 กฎ ไดแก Grade = B and Car typ = Small and Income <= 13 and Long Run >14 : Good

(3.0/1.0) หมายถง ถาลกคาไดเกรด B และประเภทรถ เปนรถยนตเกงขนาดเลก (เครองยนต 1.5-1.6 ซซ) และรายไดหลก ลดลงอยางตอเนอง หรอ เพมลดสลบกน และ ระยะเวลาการด าเนนธรกจนานกวา 10 ป เปนกลมลกคาดโดยมขอมลทสอดคลองกบกฎน จ านวน 2 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 67%

Grade = B and Car typ = Small and Income <= 13 LongRun <=14 : Bad (3.0/1.0) หมายถง ถาลกคาไดเกรด B และประเภทรถ เปนรถยนตเกงขนาดเลก (เครองยนต 1.5-1.6 ซซ) และรายไดหลก ลดลงอยางตอเนอง หรอ เพมลดสลบกน และ ระยะเวลาการด าเนนธรกจนอยกวา 10 ป

DPU

Page 55: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

45

เปนกลมลกคาไมด โดยมขอมลทสอดคลองกบกฎน จ านวน 2 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 67%

Grade = C and Object = private and Growth NP <= 0 and OE >9 and Car typ = Small : Good (4.0/1.0) หมายถง ถาลกคาไดเกรด C และมวตถประสงคการใชรถยนตเพอการเดนทางสวนตว และ มขาดทนตอเนอง และ สวนของผถอหน เพมขนตอเนอง 2 ป และ ประเภทรถ เปนรถยนตเกงขนาดเลก (เครองยนต 1.5-1.6 ซซ) เปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 3 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 75%

Grade = D and Bus Typ = Four and OE <=0 : Good (7.0/2.0) หมายถง ถาลกคาไดเกรด D และประเภทธรกจอยในกลม D ไดแก ธรกจจดหางาน ธรกจรถเชา และธรกจรบเหมากอสรางขนาดเลกทนต ากวา 3 ลานบาท และสวนของผถอหน ลดลงตอเนอง 2 ป เปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 5 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 2 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 71%

Grade = B and Car typ = Pickup : Good (6.0/1.0) หมายถง ถาลกคาไดเกรด B และประเภทรถทใชเปนรถกระบะ เปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 5 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 83%

Grade = C and Object = private and Growth NP <= 0 and OE > 9 and Car typ = Large and LongRun > 14 : Good (5.0/1.0) หมายถง ถาลกคาไดเกรด C และมวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผลขาดทนตอเนอง และ สวนของผถอหน เพมขนตอเนอง 2 ป และประเภทรถทใชเปนรถยนตเกงขนาดใหญ (เครองยนต มากกวา 2.0 ซซ) และมระยะเวลาการด าเนนธรกจ นานกวา 10 ป เปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 4 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 80%

Grade = D and Bus Typ = Zero : Good (6.0/1.0) หมายถง ถาลกคาไดเกรด D และประเภทธรกจอยในกลม Zero ไดแก ธรกจจดหางาน ธรกจรถเชา และธรกจรบเหมากอสรางขนาดเลกทนต ากวา 3 ลานบาท เปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 5 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 1 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 83%

DPU

Page 56: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

46

Grade = C and Object = transport and LongRun>13 and CarTyp = Pickup and Bus typ = Four and OE > 0 : Good (13.2/2.0) หมายถง ถาลกคาไดเกรด C และ วตถประสงคการใชรถเพอการขนสง และ ระยะเวลาการด าเนนธรกจ มากกวา 6 ป และประเภทรถทใชเปนรถกระบะ และประเภทธรกจ อยในกลม Four และ สวนของผถอหน ไมมการลดลงอยางตอเนอง เปนกลมลกคาด โดยมขอมลทสอดคลองกบกฎน จ านวน 11 ตวอยาง และมขอมลทไมสอดคลองกบกฎน จ านวน 2 ตวอยาง มความถกตองของตวอยางทสนบสนนคดเปน 85%

3. กฎทไมสมบรณ มจ านวน 1 กฎ ไดแก Grade = Z หมายถง ลกคาทไมมเกรด จงท าใหกฎไมสมบรณ

กฎทอยในกลมลกคาด (Good) มจ านวน 24 กฎ ไดแก 1. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ ไมมผล

ขาดทนตอเนอง จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = private and Growth NP > 0 : Good (115.0) 2. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผลขาดทน

ตอเนอง และสวนของผถอหน ไมมการเพมขนตอเนอง 2 ป จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = private and Growth NP <= 0 and OE <=9 :

Good (59.63/2.0) 3. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผลขาดทน

ตอเนอง และสวนของผถอหน มการเพมขนตอเนอง 2 ป ประเภทรถทใชเปนกลม Luxury จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = private and Growth NP <= 0 and OE > 9 and Car typ = Lux : Good (1.0)

4. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผลขาดทนตอเนอง และสวนของผถอหน มการเพมขนตอเนอง 2 ป ประเภทรถทใชเปนรถยนตเกงขนาดกลาง (เครองยนตขนาด 1.6-1.8 ซซ) จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = private and Growth NP <= 0 and OE > 9 and Car typ = Medium : Good (2.0)

5. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผลขาดทนตอเนอง และสวนของผถอหน มการเพมขนตอเนอง 2 ป ประเภทรถทใชเปนรถยนตเอนกประสงค จะเปนกลมลกคาด

DPU

Page 57: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

47

กฎทอางอง : Grade = C and Object = private and Growth NP <= 0 and OE > 9 and Car typ = MPV : Good (2.0)

6. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และ มผลขาดทนตอเนอง และสวนของผถอหน มการเพมขนตอเนอง 2 ป ประเภทรถทใชเปนรถยนตต จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = private and Growth NP <= 0 and OE > 9 and Car typ = Van : Good (1.0)

7. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ นอยกวาหรอเทากบ 5 ป จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = transport and LongRun<=13 : Good (25.34) 8. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนน

ธรกจ มากกวา 5 ป ประเภทรถ เปนรถยนตเกงขนาดเลก (เครองยนต 1.5-1.6 ซซ) จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Small : Good (20.0/1.0)

9. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถยนตเกงขนาดกลาง (เครองยนต 1.6 -1.8 ซซ) จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Medium : Good (3.0)

10. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถเอนกประสงค จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = MPV : Good (1.0)

11. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถยนตเกงขนาดใหญ (เครองยนต มากกวา 2.0 ซซ) จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Large : Good (3.0)

DPU

Page 58: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

48

12. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถกระบะ และประเภทธรกจ อยในกลม Zero จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Pickup and Bus typ = Zero : Good (1.0)

13. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถกระบะ และประเภทธรกจ อยในกลม Five จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Pickup and Bus typ = Five : Good (28.0/1.0)

14. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถกระบะ และประเภทธรกจ อยในกลม Two จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Pickup and Bus typ = Two : Good (4.0)

15. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถต และอตราหนสนรวมตอสนทรพยรวม มคาเฉลยมากกวา 151% จะเปนกลมลกคาด กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Van and DE <= 3 : Good (2.0)

16. ลกคาเกรด C และวตถประสงคการใชรถเพอใชเดนทางพบลกคา จะเปนกลมลกคาด

กฎทอางอง : Grade = C and Object = mkt : Good (9.03) 17. ลกคาเกรด D และประเภทธรกจ อยในกลม Two จะเปนกลมลกคาด

กฎทอางอง : Grade = D and Bus typ = Two : Good (8.0) 18. ลกคาเกรด D และประเภทธรกจ อยในกลม Five จะเปนกลมลกคาด

กฎทอางอง : Grade = D and Bus typ = Five : Good (10.0) 19. ลกคาเกรด B และประเภทรถ เปนรถยนตเกงขนาดใหญ (เครองยนต มากกวา 2.0 ซ

ซ) จะเปนกลมลกคาด กฎทอางอง : Grade = B and Car typ = Large : Good (17.0)

DPU

Page 59: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

49

20. ลกคาเกรด B และประเภทรถ เปนรถต จะเปนกลมลกคาด กฎทอางอง : Grade = B and Car typ = VAN : Good (3.0)

21. ลกคาเกรด B และประเภทรถ เปนรถเอนกประสงค จะเปนกลมลกคาด กฎทอางอง : Grade = B and Car typ = MPV : Good (2.0)

22. ลกคาเกรด B และประเภทรถ เปนรถยนตเกงขนาดกลาง (เครองยนต 1.6-1.8 ซซ) จะเปนกลมลกคาด กฎทอางอง : Grade = B and Car typ = Mudium : Good (12.0/1.0)

23. ลกคาเกรด B และประเภทรถ เปนรถยนตเกงขนาดเลก (เครองยนต 1.5 ซซ) และมรายไดหลก เพมขนตอเนองอยางนอย 1 ป จะเปนกลมลกคาด

กฎทอางอง : Grade = B and Car typ = Small and Income > 13 : Good (6.0) 24. ลกคาเกรด A จะเปนกลมลกคาด กฎทอางอง : Grade = A : Good (48.0/3.0) กฎทอยในกลมลกคาไมด (Bad) มจ านวน 4 กฎ ไดแก 1. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนน

ธรกจ มากกวา 5 ป ประเภทรถ เปนรถต และอตราหนสนรวมตอสนทรพยรวม มคาเฉลย ต ากวา 151% จะเปนกลมลกคาไมด

กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Van and DE > 3 : Bad (2.0)

2. ลกคาเกรด C และวตถประสงคการใชรถเพอการขนสง และมระยะเวลาการด าเนนธรกจ มากกวา 5 ป ประเภทรถ เปนรถกระบะ และประเภทธรกจ เปนกลม Four และ สวนของผถอหน ลดลงตอเนอง 2 ป จะเปนกลมลกคาไมด

กฎทอางอง : Grade = C and Object = transport and LongRun >13 Car typ = Pickup and Bus typ = four and OE <=0 : Bad (2.0)

3. ลกคาเกรด D และประเภทธรกจ เปนกลม Four และ สวนของผถอหน ไมมการลดลงตอเนอง 2 ป จะเปนกลมลกคาไมด

กฎทอางอง : Grade = D and Bus typ = four and OE > 0 : Bad (2.0) 4. ลกคาเกรด C และวตถประสงคการใชรถเพอการเดนทางสวนตว และมผลขาดทน

ตอเนอง และ สวนของผถอหน เพมขนตอเนองอยางนอย 2 ป และประเภทรถยนตทใชเปนรถยนตเกงขนาดใหญ (เครองยนตมากกวา 2.0 ซซ) และมระยะเวลาการด าเนนธรกจ ไมเกน 10 ป จะเปนกลมลกคาไมด

DPU

Page 60: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

50

กฎทอางอง : Grade = C and Object = private and Growth NP <= 0 and OE > 9 and Car typ = Large and LongRun <=14 : Bad (2.0)

สรปกฎจากผลการทดสอบการจ าแนกกลมขอมลแบบ Decision Tree : C4.5 เปนการจดกลมทเหมาะสมทสดในการทดสอบเนองจากมกฎจ านวนมาก และ มเงอนไขทเหมาะสม แตมบางกฎทมเงอนไขไมเหมาะสม จงท าการลบกฎดงกลาวออก จ านวน กฎ 12 กฎ จากทงหมด 40 กฎ เหลอ 28 กฎ

เมอไดผลของการท าเหมองขอมลแลวจงท าการเลอกกฎทมความนาเชอถอมากทสดเพอใชเปนเงอนไขในการเขยนโปรแกรมระบบวเคราะหสนเชอตอไป 4.5 การพฒนาระบบวเคราะหสนเชอ

เปนการน ากฎทไดจากการท าเหมองขอมล มาใชเปนเงอนไขในการเขยนโปรแกรมระบบวเคราะหสนเชอออนไลน เพอเปนเครองมอชวยในการตดสนใจการอนมตสนเชอ ของ บรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน) โดยใชโปรแกรม PHP และใชฐานขอมล My SQL ในการพฒนาโปรแกรม

4.5.1 การออกแบบหนาจอ โปรแกรม CS 4 ใชในการออกแบบหนาจอระบบวเคราะหสนเชอ เพอบนทกขอมล

ลกคาทตองการวเคราะหอนมตสนเชอ ซงหนาจอนจะบนทกรายละเอยดตาง ๆ ทใชในการวเคราะห ดงนคอ ชอ นามสกลลกคา วตถประสงคการใชงานรถยนต ประเภทรถยนต ประเภทธรกจ ประเภทลกคา ระยะเวลาด าเนนธรกจ ทนจดทะเบยน ก าไรสทธ รายไดหลก สวนผถอหน อตราสนทรพยหมน : หนสนหมนเวยน อตราหนสนรวม : สนทรพยรวม อตราหนสนรวม : สวนผถอหน อตราการเพมของยอดขาย : อตราการเพมของก าไรสทธ วงเงนอนมต เกรดลกคา ซงเมอท าการปอนขอมลรายละเอยดของลกคาทตองการขอสนเชอเสรจ กท าการบนทกและประมวลผล โปรแกรมกจะประมวลผลและแสดงผลลพธลกคานวาเปน ลกคาด (Good) หรอ ลกคาไมด (Bad)

DPU

Page 61: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

51

ภาพท 4.19 หนาจอบนทกขอมลลกคาทตองการวเคราะหอนมตสนเชอ

ภาพท 4.20 หนาจอแสดงผลการวเคราะหขอมลลกคา

DPU

Page 62: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

52

4.5.2 การเขยนโปรแกรม

น ากฎทไดจากการท าเหมองขอมลมาเปนเงอนไขในการเขยนโปรแกรม ผลการสรปไดกฎทงหมด 28 กฎ โดยท าการแปลงกฎทไดมาใหเปน โคด ของตวโปรแกรมใน 1 กฎทไดจะเทากบ 1 กรณ ในโคด ของโปรแกรมจะไดทงหมด 28 กรณ

ภาพท 4.21 หนาจอแสดงการน ากฎมาเขยนโปรแกรมสวนแรก

ภาพท 4.22 หนาจอแสดงการน ากฎมาเขยนโปรแกรมสวนทเปนเงอนไข

DPU

Page 63: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

53

ภาพท 4.23 หนาจอแสดงการน ากฎมาเขยนโปรแกรมสวนทเปนเงอนไขสวนสดทาย

4.5.3 การออกแบบรายงาน การน าผลทไดจากการประมวลผลของโปรแกรม มาออกรายงานเพอใหทราบขอมล

ตาง ๆ ของลกคาทมาขอสนเชอกบทางบรษทฯ ซงจะมขอมลแสดงสถานะของลกคาทด และลกคาทไมด

ภาพท 4.24 หนาจอแสดงรายงานขอมลลกคา

DPU

Page 64: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

54

4.6 การน าระบบงานทพฒนาขนมาใหมมาใชในองคกร

ขอมลลกคาทน ามาวเคราะหเพอใหเกรดลกคาตามภาพท 4.25 และ 4.26

ภาพท 4.25 แบบวเคราะหและพจารณาสนเชอ (CREDIT SCORING)-Test A

DPU

Page 65: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

55

ภาพท 4.25 (ตอ)

DPU

Page 66: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

56

ภาพท 4.26 แบบวเคราะหและพจารณาสนเชอ (CREDIT SCORING) -Test B

DPU

Page 67: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

57

ภาพท 4.26 (ตอ)

DPU

Page 68: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

58

น าเกรดทไดและขอมลลกคามาบนทกในระบบทพฒนาใหม เพอใหทราบผลการอนมต ตามภาพท

4.27

ภาพท 4.27 หนาจอแสดงรายงานขอมลลกคา

จากการน าระบบทพฒนามาใชในการอนมตใหสนเชอลกคา จะเหนไดวา กรณลกคาชอ

Test B (นามสมมต) หากอนมตจากผลคะแนนของลกคาตามระบบงานเดมเพยงอยางเดยว จะท าให

มการอนมตสนเชอตอลกคารายนน แตหากน าเกรดของลกคาทไดและขอมลของลกคามาบนทกใน

ระบบทพฒนาใหม ผลทไดคอ Bad หมายถง ลกคารายดงกลาวไมผานการอนมตสนเชอ ชวยให

บรษทมการพจารณาสนเชอของลกคาไดอยางมประสทธภาพมากยงขน อกทงยงอาจชวยลดความ

เสยงดานหนสญ ในการอนมตใหเชารถยนตตอลกคาทไมเหมาะสม

DPU

Page 69: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

บทท 5 สรปผลการวจย และขอเสนอแนะ

5.1 สรปผลการวจย

การวจยเรอง การใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ ของบรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน) มวตถประสงคเพอวเคราะหขอมลลกคาเชารถ เพอพจารณาสนเชอไดอยางมประสทธภาพ และลดปรมาณหนสญ โดยมขนตอนหลกๆ 5 สวน ไดแก

สวนท 1 ศกษาและเกบรวบรวมขอมลประวตลกคาทพจารณาใหสนเชอแลว ในป 2551–2553 จ านวน 441 ราย อยในรปแบบไฟล Excel

สวนท 2 เตรยมขอมลใหเปนไปตามรปแบบมาตรฐานเดยวกน และคดเลอก เฉพาะขอมลทสมบรณและรปแบบถกตอง ครบถวน และลดความหลากหลายของขอมล เพอใหน ามาใชกบโปรแกรม Weka 3.5.7 ได โดยม 3 ขนตอน ไดแก ขนตอนการโอนยายขอมล (Data Transfer) การลดขนาดของขอมล (Data Reduction) และการท าความสะอาดขอมล (Data Cleaning)

สวนท 3 การทดสอบขอมล และเลอกเทคนคทเหมาะสม ซงในการศกษาวจยครงน ไดทดสอบเทคนคการจ าแนกกลม จ านวน 3 เทคนค ใหผลลพธเปนกฎ ไดแก โมเดลการจ าแนกกลมแบบ Decision Tree: C4.5 หรอเรยกวาโมเดล Classifires trees J48 โมเดลการจ าแนกกลมแบบ Decision Rule: Part หรอเรยกวาโมเดล Classifires PART และ โมเดลการจ าแนกกลมแบบ Bayes: Naïve Bayes หรอเรยกวาโมเดล Classifier Naïve Bayes ในโปรแกรม Weka จากการทดสอบการจ าแนกกลมดงกลาวขางตน พบวา การจ าแนกกลมแบบ Decision Tree: C4.5 ใหผลลพธดทสด เนองจากมความถกตองมากทสด สามารถแบงกลมไดตามเงอนไขทชดเจนมากทสด และสามารถแสดงกฎใหสามารถน าไปวเคราะหกฎตอไปได โดยผลลพธมความถกตอง 90.47 เปอรเซนต และไดกฎจ านวน 40 กฎ

สวนท 4 การวเคราะหขอมล จากผลการทดสอบการจ าแนกกลมขอมลแบบ Decision Tree: C4.5 เปนการจดกลมทเหมาะสมทสดในการทดสอบเนองจากมกฎจ านวนมาก และ มเงอนไขทเหมาะสม แตมบางกฎทมเงอนไขไมเหมาะสม กฎทมความถกตองนอยกวา 90% บางกฎไมมตวอยางสนบสนนกบกฎดงกลาว หรอ บางกฎทไมสมบรณ จงท าการลบกฎดงกลาวออก จ านวน

DPU

Page 70: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

60

กฎ 12 กฎ จากทงหมด 40 กฎ เหลอ 28 กฎ เพอใชเปนเงอนไขในการเขยนโปรแกรมระบบวเคราะหสนเชอตอไป

สวนท 5 การพฒนาระบบวเคราะหสนเชอ เปนการน ากฎทไดจากการท าเหมองขอมล มาใชเปนเงอนไขในการเขยนโปรแกรมระบบวเคราะหสนเชอออนไลน เพอเปนเครองมอชวยในการตดสนใจการอนมตสนเชอ ของ บรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน) โดยใชโปรแกรม PHP และใชฐานขอมล My SQL ในการพฒนาโปรแกรม โดยโปรแกรมทไดจะเปนเครองมอชวยวเคราะหสนเชอใหมประสทธภาพมากยงขนเพอลดปรมาณหนสญใหนอยลง ซงควรท าควบคกบการพจารณา สภาวการณปจจบนประกอบดวย เชน การแขงขน ภาวะเศรษฐกจ และ ตลาดอตสาหกรรมรถเชา เปนตน 5.2 ปญหาและแนวทางแกไข

1. ขอมลประวตลกคาทไมผานการพจารณาสนเชอ บรษทไมไดมการจดเกบไว จงไม ไดน าขอมลมาทดสอบ จงไดกฎลกคาไมด (BAD) จ านวนนอย และหากมการเกบขอมลดงกลาวและน ามาทดสอบ ผลทไดอาจเปนลกคาด (GOOD) ท าใหบรษทมโอกาสในการขยายฐานลกคาเพมขน

2. การเกบขอมลของบรษท มการบนทกไมครบถวน หรอ ไมถกตอง เชน ไมมระบวตถประสงคการใชรถยนต ไมระบเกรดลกคา รวมยอดคะแนนผดพลาด หากมระบบการเตอนใหการบนทกขอมลใหสมบรณ ถกตอง กอนการบนทก จะท าใหไดขอมลทสมบรณและผลการวจยทไดมความนาเชอถอมากยงขน

5.3 ขอเสนอแนะส าหรบการพฒนาตอไป

ในหวขอของการเสนอแนะในการด าเนนงานสามารถสรปเปนขอคดเหนภายหลงการด าเนนการวจยไดดงตอไปน

1. ขอมลเปนปจจยส าคญทน ามาท าเหมองขอมล ดงนน ควรมการน าระบบคลงขอมล (Data Warehouse) มาพฒนาตอเพอใหบรษทสามารถน าขอมลมาวเคราะหใหเกดประโยชนอยางมประสทธภาพ

2. การท าเหมองขอมล สามารถน ามาเปนตนแบบในการหาความสมพนธของการวเคราะหการตดสนใจการเชารถของลกคาอยางตอเนอง เพอการรกษาฐานลกคาเกาในการตดสนใจเชาซ า หรอน ามาหาความสมพนธของปจจยทมผลตอการตดสนใจเชารถของลกคา เพอขยายฐานลกค าใหม เปนตน

DPU

Page 71: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

62

บรรณานกรม

DPU

Page 72: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

63

บรรณานกรม

ภาษาไทย

หนงสอ

จราพร ยงกวาชาต และคณะ. (2549). การท านายผลส าเรจการศกษาของนกศกษาระดบอดมศกษาดวยการเรยนรแบบเบยและการท าเหมองขอมล (วทยานพนธปรญญามหาบณฑต). กรงเทพ: มหาวทยาลยศรปทม.

ชลนศา สาระ. (2550). การจ าแนกกลมสถานภาพการส าเรจการศกษาโดยแบบจ าลองตนไมตดสนใจ (สารนพนธปรญญามหาบณฑต). กรงเทพ: มหาวทยาลยเทคโนโลยพระจอมเกลาพระนครเหนอ.

ณฐรน เจรญเกยรตบวร และปานใจ ธารทศนวงศ . (2549). การใชเทคนคเหมองขอมลเพอชวย ในการแนะแนวการศกษาตอระดบอดมศกษา (วทยานพนธปรญญามหาบณฑต). กรงเทพฯ: มหาวทยาลยศลปกร.

บญมา เพงซวน. (2548). การศกษาตวแบบและพฒนาตวแบบ เพอน าตวแบบทไดน าไปประยกตใชในการสนบสนนการตดสนใจดานการผลตบณฑต (วทยานพนธปรญญามหาบณฑต). กรงเทพฯ: มหาวทยาลยศลปกร.

ปรชา ยามนสะบดน และคณะ. (2549). การท าเหมองขอมลมาใชในการบรหารลกคาสมพนธ (วทยานพนธปรญญามหาบณฑต). กรงเทพฯ: จฬาลงกรณมหาวทยาลย.

ยงลกษณ ยงสวสด . (2553). การพฒนาเครองมอจดกลมลกคาโดยใชเทคนคดาตาไมนง (วทย านพ นธป รญญาม หาบ ณฑ ต ) . ก รง เท พฯ : มหาวท ยาล ย เทคโนโล ย พระจอมเกลาพระนครเหนอ.

วโรจน ภาคคร, กาญจนา วรยะพนธ. (2550, กรกฎาคม – ธนวาคม). การวเคราะหรปแบบการบกรกขอมลบนเครอขาย โดยใชเทคนคดาตาไมนนง. วารสารเทคโนโลยสารสนเทศ, 3(6). หนา 40-46.

DPU

Page 73: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

64

กฤษณะ ไวยมย, ชดชนก สงศร และธนาวนท รกธรรมานนท. (2544). การใชเทคนคดาตาไมนนง เพอพฒนาคณภาพการศกษานสตคณะวศวกรรมศาสตร. The NECTEC Technical journal, หนา 135.

DPU

Page 74: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

65

ภาคผนวก

DPU

Page 75: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

66

ภาคผนวก

ผลการรนฉบบเตม (วธการอาน ดไดจากกฎทคดเลอกในบทท 4) === Run information === Scheme:weka.classifiers.trees.J48 -C 0.6 -M 2 Relation: carrent Instances: 441 Attributes: 17 Object Car typ Bus Typ CusTyp Long Run Capital NP Income OE Cur ratio Debt Ratio DE Growth Inc Growth NP credit line Grade Status Test mode:10-fold cross-validation

DPU

Page 76: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

67

=== Classifier model (full training set) === J48 pruned tree ------------------ Grade = C | Object = private | | Growth NP <= 0 | | | OE <= 9: Good (59.63/2.0) | | | OE > 9 | | | | Car typ = Large | | | | | Long Run <= 14: Bad (2.0) | | | | | Long Run > 14: Good (5.0/1.0) | | | | Car typ = Van: Good (1.0) | | | | Car typ = MPV: Good (2.0) | | | | Car typ = Pickup: Good (0.0) | | | | Car typ = Medium: Good (2.0) | | | | Car typ = Small: Good (4.0/1.0) | | | | Car typ = Lux: Good (1.0) | | Growth NP > 0: Good (115.0) | Object = transport | | Long Run <= 13: Good (25.34) | | Long Run > 13 | | | Car typ = Large: Good (3.0) | | | Car typ = Van | | | | DE <= 3: Good (2.0) | | | | DE > 3: Bad (2.0) | | | Car typ = MPV: Good (1.0) | | | Car typ = Pickup | | | | Bus Typ = four

DPU

Page 77: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

68

| | | | | OE <= 0: Bad (2.0) | | | | | OE > 0: Good (13.0/2.0) | | | | Bus Typ = two: Good (4.0) | | | | Bus Typ = five: Good (28.0/1.0) | | | | Bus Typ = zero: Good (1.0) | | | Car typ = Medium: Good (3.0) | | | Car typ = Small: Good (20.0/1.0) | | | Car typ = Lux: Good (0.0) | Object = mkt: Good (9.03) Grade = D | Bus Typ = four | | OE <= 0: Good (7.0/2.0) | | OE > 0: Bad (2.0) | Bus Typ = two: Good (8.0) | Bus Typ = five: Good (10.0) | Bus Typ = zero: Good (6.0/1.0) Grade = A: Good (48.0/3.0) Grade = B | Car typ = Large: Good (17.0) | Car typ = Van: Good (3.0) | Car typ = MPV: Good (2.0) | Car typ = Pickup: Good (6.0/1.0) | Car typ = Medium: Good (12.0/1.0) | Car typ = Small | | Income <= 13 | | | Long Run <= 14: Bad (3.0/1.0) | | | Long Run > 14: Good (3.0/1.0) | | Income > 13: Good (6.0) | Car typ = Lux: Good (0.0)

DPU

Page 78: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

69

Grade = z: Good (3.0) Number of Leaves : 40 Size of the tree : 56 Time taken to build model: 1.63 seconds === Stratified cross-validation === === Summary === Correctly Classified Instances 399 90.4762 % Incorrectly Classified Instances 42 9.5238 % Kappa statistic -0.0457 Mean absolute error 0.1182 Root mean squared error 0.2941 Relative absolute error 101.1442 % Root relative squared error 122.629 % Total Number of Instances 441 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.964 1 0.937 0.964 0.95 0.454 Good 0 0.036 0 0 0 0.454 Bad Weighted Avg. 0.905 0.941 0.879 0.905 0.892 0.454 === Confusion Matrix === a b <-- classified as

DPU

Page 79: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

70

399 15 | a = Good 27 0 | b = Bad ขนตอนการลงโปรแกรม Weka หลงจากเปด D:\ แลว ใหคลกท Floder Weka จากนนคลกทโปรแกรม weka-3-6-6jre

คลกปม Next เพอท าการตดตง Weka

DPU

Page 80: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

71

คลกปม I Agree เพอท าการตกลง และท าการตดตงตอไป

คลกปม Next เพอท าการ Install

DPU

Page 81: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

72

คลกปม Browse เพอเลอกแฟมเกบ Weka เมอเลอกแฟมเสรจแลว คลกปม Next เพอท าการตดตงตอไป

คลก Install เพอเรมตนการตดตงโปรแกรม

DPU

Page 82: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

73

จะพบหนาจอ Installing แสดงการประมวลผลการตดตงโปรแกรม

รอจนกวาแถบสเขยวจะขนเตม

DPU

Page 83: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

74

เมอประมวลผลเสรจแลว จะแสดงหนาจอขนมา เราไมตองคลกปด เพราะหนาจอนจะถกปดโดยอตโนมตหลงจากการตดตงเสรจเรยบรอย

DPU

Page 84: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

75

แสดงการตดตงโปรแกรม Waka ทเสรจสมบรณแลว ตรง Start Weka ทถกเชคไว เพอใหรนหนาจอโปรแกรม Weka 3.6.6 ถาไมตองการใหรนโปรแกรมในขณะน ใหคลกเพอใหเครองหมายนนหายไป สดทายใหคลกท Finish

แสดงหนาจอการท างานของโปรแกรม Weka 3.6.6 เมอตดตงเสรจสมบรณจะพบหนาจอดงภาพ

DPU

Page 85: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

76

DPU

Page 86: การใช้เหมืองข้อมูลช่วยในการตัดสินใจการให้สินเชื่อ ...libdoc.dpu.ac.th/thesis/147907.pdf ·

77

ประวตผเขยน ชอ-นามสกล นางสาวทพยธดา วงศพพนธ ประวตการศกษา ปรญญาบญชบณฑต คณะบญช มหาวทยาลยธรกจบณฑตย ปทส าเรจการศกษา 2548 ต าแหนงงานปจจบน พนกงานบญช สถานทท างานปจจบน บรษท กรงไทยคารเรนท แอนด ลส จ ากด (มหาชน)

DPU