data mining

38
DATA MINING

Upload: kridsada-alfred

Post on 07-Aug-2015

67 views

Category:

Documents


2 download

TRANSCRIPT

DATA MINING

ข้�อมู�ลที่�ถู�กเก บไว้�ในฐานข้�อมู�ลหากเก บไว้�เฉย ๆ ก จะไมู�เก�ดประโยชน#จ$งต้�องมู�การคั(ดเล)อกข้�อมู�ลออกมูาใช�งานส่�ว้นที่� เราต้�องการ

ในอด�ต้เราใช�คันเป+นผู้��ส่)บคั�นข้�อมู�ลต้�างๆ ในฐานข้�อมู�ลซึ่$งผู้��ส่)บคั�นจะที่.าการส่ร�างเง) อนไข้ข้$/นมูาต้ามูภู�มู�ป1ญญาข้องผู้��ส่)บคั�น

ในป1จจ3บ(นการว้�เคัราะห#ข้�อมู�ลจากฐานข้�อมู�ลอย�างเด�ยว้อาจให�คัว้ามูร� �ไมู�เพี�ยงพีอส่.าหร(บการด.าเน�นงานที่�มู�การแข้�งข้(นส่�งและมู�การเปล�ยนแปลงที่�รว้ดเร ว้จ$งจ.าเป+นที่�จะต้�องรว้บรว้มูฐานข้�อมู�ลหลาย ๆ ฐานข้�อมู�ลเข้�าด�ว้ยก(น เร�ยกว้�า “คลั�งข้�อมูลั ” (Data Warehouse) ด(งน(/นเราจ$งจ.าเป+นต้�องใช� Data Mining ในการด$งข้�อมู�ลจากฐานข้�อมู�ลที่�มู�ข้นาดใหญ� เพี) อที่�จะน.าข้�อมู�ลน(นมูาใช�งานให�เก�ดประโยชน#ส่�งที่�ส่3ด

ทำ��ไมูจึ�งต้�อง DATA MINING

คั)อ กระบว้นการที่�กระที่.าก(บข้�อมู�ลจ.านว้นมูากเพี) อคั�นหาร�ปแบบและคัว้ามูส่(มูพี(นธ์#ที่�ซึ่�อนอย��ในช3ดข้�อมู�ลน(/น ในป1จจ3บ(นการที่.าเหมู)องข้�อมู�ลได�ถู�กน.าไปประย3กต้#ใช�ในงานหลายประเภูที่ ที่(/งในด�านธ์3รก�จที่�ช�ว้ยในการต้(ดส่�นใจข้องผู้��บร�หาร ในด�านว้�ที่ยาศาส่ต้ร#และการแพีที่ย#รว้มูที่(/งในด�านเศรษฐก�จและส่(งคัมู

ก�รทำ��เหมู�องข้�อมูลั (DATA MINING)

Data Cleaning เป+นข้(/นต้อนส่.าหร(บการคั(ดข้�อมู�ลที่� ไมู�เก�ยว้ข้�องออกไป

Data Integration เป+นข้(/นต้อนการรว้มูข้�อมู�ลที่�มู�หลายแหล�งให�เป+นข้�อมู�ลช3ดเด�ยว้ก(น

Data Selection เป+นข้(/นต้อนการด$งข้�อมู�ลส่.าหร(บการว้�เคัราะห#จากแหล�งที่�บ(นที่$ก

Data Transformation เป+นข้(/นต้อนการแปลงข้�อมู�ลให�เหมูาะส่มูส่.าหร(บการใช�งาน

Data Mining เป+นข้(/นต้อนการคั�นหาร�ปแบบที่� เป+นประโยชน#จากข้�อมู�ลที่�มู�อย��

Pattern Evaluation เป+นข้(/นต้อนการประเมู�นร�ปแบบที่�ได�จากการที่.าเหมู)องข้�อมู�ล

Knowledge Representation เป+นข้(/นต้อนการน.าเส่นอคัว้ามูร� �ที่�คั�นพีบ โดยใช�เที่คัน�คัในการน.าเส่นอเพี) อให�เข้�าใจ

ข้��นต้อนก�รทำ��เหมู�องข้�อมูลั

ส่ถูาป1ต้ยกรรมูข้องการที่.าเหมู)องข้�อมู�ล

Database, Data Warehouse, World Wide Web และ Other Info Repositories เป+นแหล�งข้�อมู�ลส่.าหร(บการที่.าเหมู)องข้�อมู�ล

Database หร)อ Data Warehouse Server ที่.าหน�าที่�น.าเข้�าข้�อมู�ลต้ามูคั.าข้อข้องผู้�� ใช�

Knowledge Base ได�แก� คัว้ามูร� �เฉพีาะด�านในงานที่�ที่.าจะเป+นประโยชน#ต้�อการส่)บคั�น หร)อประเมู�นคัว้ามูน�าส่นใจข้องร�ปแบบผู้ลล(พีธ์#ที่�ได�

Data Mining Engine เป+นส่�ว้นประกอบหล(กประกอบด�ว้ยโมูด�ลที่�ร (บผู้�ดชอบงานที่.าเหมู)องข้�อมู�ลประเภูที่ต้�างๆ ได�แก� การหากฎคัว้ามูส่(มูพี(นธ์# การจ.าแนกประเภูที่ การจ(ดกล3�มู

Pattern Evaluation Module ที่.างานร�ว้มูก(บ Data Mining Engine โดยใช�มูาต้รว้(ดคัว้ามูน�าส่นใจในการกล(นกรองร�ปแบบผู้ลล(ที่ธ์#ที่� ได� เพี) อให�การคั�นหามู3�งเน�นเฉพีาะร�ปแบบที่�น�าส่นใจ

User Interface ส่�ว้นต้�ดต้�อประส่านระหว้�างผู้�� ใช�ก(บระบบการที่.าเหมู)องข้�อมู�ล ช�ว้ยให�ผู้�� ใช�ส่ามูารถูระบ3งานที่.าเหมู)องข้�อมู�ลที่�ต้�องการที่.า ด�ข้�อมู�ลหร)อโคัรงส่ร�างการจ(ดเก บข้�อมู�ล ประเมู�นผู้ลล(พีธ์#ที่� ได�

สถ�ปั�ต้ยกรรมูข้องก�รทำ��เหมู�องข้�อมูลั

Relational Database เป+นฐานข้�อมู�ลที่�จ(ดเก บอย��ในร�ปแบบ

ข้องต้าราง โดยในแต้�ละต้ารางจะประกอบไปด�ว้ยแถูว้และคัอล(มูน# คัว้ามูส่(มูพี(นธ์#ข้องข้�อมู�ลที่(/งหมูดส่ามูารถูแส่ดงได�โดย Entity Relationship Model

Data Warehouses เป+นการเก บรว้บรว้มูข้�อมู�ลจากหลายแหล�งมูาเก บไว้�ในร�ปแบบเด�ยว้ก(นและรว้บรว้มูไว้�ในที่�ๆ เด�ยว้ก(น

Transactional Database ประกอบด�ว้ยข้�อมู�ลที่�แต้�ละที่รานเเซึ่กช(นแที่นด�ว้ยเหต้3การณ์#ในข้ณ์ะใดข้ณ์ะหน$ง เช�น ใบเส่ร จร(บเง�น จะเก บข้�อมู�ลในร�ปช) อล�กคั�าและรายการส่�นคั�าที่�ล�กคั�ารายซึ่)/ อ

Advanced Database เป+นฐานข้�อมู�ลที่�จ(ดเก บในร�ปแบบอ) นๆ เช�น ข้�อมู�ลแบบ Object-Oriented ข้�อมู�ลที่� เป+น Text File ข้�อมู�ลมู(ลต้�มู�เด�ย ข้�อมู�ลในร�ปข้อง Web

ปัระเภทำข้�อมูลัทำ ! ใช้�ทำ��เหมู�องข้�อมูลั

ข้�อมู�ลข้นาดใหญ� เก�นกว้�าจะพี�จารณ์าคัว้ามูส่(มูพี(นธ์#ที่�ซึ่�อนอย��ภูายในข้�อมู�ลได�ด�ว้ยต้าเปล�า หร)อโดยการใช� Database Management System ( DBMS ) ในการจ(ดการฐานข้�อมู�ล

ข้�อมู�ลที่�มูาจากหลายแหล�ง โดยอาจรว้บรว้มูมูาจากหลายระบบปฏิ�บ(ต้�การหร)อหลาย DBMS เช�น Oracle , DB2 , MS SQL , MS Access เป+นต้�น

ข้�อมู�ลที่� ไมู�มู�การเปล�ยนแปลงต้ลอดช�ว้งเว้ลาที่�ที่.าการ Mining หากข้�อมู�ลที่�มู�อย��น( /นเป+นข้�อมู�ลที่� เปล�ยนแปลงต้ลอดเว้ลาจะต้�องแก�ป1ญหาน�/ก�อน โดยบ(นที่$กฐานข้�อมู�ลน(/นไว้�และน.าฐานข้�อมู�ลที่�บ(นที่$กไว้�มูาที่.า Mining แต้�เน) องจากข้�อมู�ลน(/นมู�การเปล�ยนแปลงอย��ต้ลอดเว้ลา จ$งที่.าให�ผู้ลล(พีธ์#ที่� ได�จาการที่.า Mining ส่มูเหต้3ส่มูผู้ลในช�ว้งเว้ลาหน$งเที่�าน(/น ด(งน(/นเพี) อให�ได�ผู้ลล(พีธ์#ที่�มู�คัว้ามูถู�กต้�องเหมูาะส่มูอย��ต้ลอดเว้ลาจ$งต้�องที่.า Mining ใหมู�ที่3กคัร(/งในช�ว้งเว้ลาที่�เหมูาะส่มู

ข้�อมู�ลที่�มู�โคัรงส่ร�างซึ่(บซึ่�อน เช�น ข้�อมู�ลร�ปภูาพี ข้�อมู�ลมู(ลต้�มู�เด�ย ข้�อมู�ลเหล�าน�/ส่ามูารถูน.ามูาที่.า Mining ได�เช�นก(นแต้�ต้�องใช�เที่คัน�คัการที่.า Data Mining ข้(/นส่�ง

ลั�กษณะเฉพ�ะข้องข้�อมูลัทำ !ใช้�ทำ��เหมู�องข้�อมูลั

1. Association rule Discoveryเป+นเที่คัน�คัหน$งข้อง Data Mining ที่�ส่.าคั(ญ และส่ามูารถูน.า

ไปประย3กต้#ใช�ได�จร�งก(บงานต้�าง ๆ หล(กการที่.างานข้องว้�ธ์�น�/ คั)อ การคั�นหาคัว้ามูส่(มูพี(นธ์#ข้องข้�อมู�ลจากข้�อมู�ลข้นาดใหญ�ที่�มู�อย��เพี) อน.าไปใช�ในการว้�เคัราะห# หร)อมูากจากการว้�เคัราะห#การซึ่)/ อส่�นคั�าข้องล�กคั�าเร�ยกว้�า “ Market Basket Analysis ” ซึ่$งประเมู�นจากข้�อมู�ลในต้ารางที่�รว้บรว้มูไว้� ผู้ลการว้�เคัราะห#ที่� ได�จะเป+นคั.าต้อบข้องป1ญหา ซึ่$งการว้�เคัราะห#แบบน�/เป+นการใช� “ กฎคว�มูส�มูพ�นธ์+ ”(Association Rule) เพี) อหาคัว้ามูส่(มูพี(นธ์#ข้องข้�อมู�ล

ต้�วอย,�งเช้,น ระบบแนะน.าหน(งส่)อให�ก(บล�กคั�าแบบอ(ต้โนมู(ต้� ข้อง SE-ED BOOK คั)อ เมู) อล�กคั�าที่�ซึ่)/ อหน(งส่)อ 1 เล�มู อาจจะซึ่)/ อหน(งส่)อเล�มูใดอ�กเล�มูหน$งพีร�อมูก(นด�ว้ยเส่มูอ คัว้ามูส่(มูพี(นธ์#ที่� ได�จากกระบว้นการน�/ส่ามูารถูน.าไปใช�คัาดเดาได�ว้�าคัว้รแนะน.าหน(งส่)อเล�มูใดเพี�มูเต้�มูให�ก(บล�กคั�าที่� เพี�งซึ่)/ อหน(งส่)อจากร�านไป

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

1)โครงสร��งแบบต้�นไมู�ข้อง Decision Tree เป+นที่�น�ยมูก(นมูากเน) องจากเป+นล(กษณ์ะที่�คันจ.านว้นมูาก

คั3�นเคัย ที่.าให�เข้�าใจได�ง�าย มู�ล(กษณ์ะเหมู)อนแผู้นภู�มู�องคั#กร โดยที่�แต้�ละ node แส่ดง attribute แต้�ละก�งแส่ดงผู้ลในการที่ดส่อบ และleaf , nodeแส่ดงคัลาส่ที่�ก.าหนดไว้�

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

2. Classifi cation & PredictionClassifi cation

เป+นกระบว้นการส่ร�าง model จ(ดการข้�อมู�ลให�อย��ในกล3�มูที่�ก.าหนดมูาให� ต้(ว้อย�างเช�น จ(ดกล3�มูน(กเร�ยนว้�า ด�มูาก ด� ปานกลาง ไมู�ด� โดยพี�จารณ์าจากประว้(ต้�และผู้ลการเร�ยน หร)อแบ�งประเภูที่ข้องล�กคั�าว้�าเช) อถู)อได� หร)อไมู�โดยพี�จารณ์าจากข้�อมู�ลที่�มู�อย�� กระบว้นการ classification น�/แบ�งออกเป+น 3 ข้(/นต้อน ด(งน�/

1. Model Construction (Learning) เป+นข้(/นการส่ร�าง model โดยการเร�ยนร� �จากข้�อมู�ลที่� ได�ก.าหนดคัลาส่ไว้�เร�ยบร�อยแล�ว้ (Training data) ซึ่$ง model ที่� ได�อาจแส่ดงในร�ปข้อง

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

2) หร�อ Artificial Neural Networks (ANN) เป+นเที่คัโนโลย�ที่�มูาจากงานว้�จ(ยด�านป1ญญาประด�ษฐ#

Artificial Intelligence: AI เพี) อใช�ในการคั.านว้ณ์คั�าฟั1งก#ช(นจากกล3�มูข้�อมู�ล เป+นว้�ธ์�การที่� ให�เคัร)องเร�ยนร� �จากต้(ว้อย�างต้�นแบบ แล�ว้ฝึ>ก(train)ให�ระบบได�ร� �จ(กที่�จะคั�ดแก�ป1ญหาที่�กว้�างข้$/นได�

โคัรงส่ร�างข้องNeural Net จะประกอบด�ว้ย node ส่.าหร(บ Input – Output และการประมูว้ลผู้ล กระจายอย��ในโคัรงส่ร�างเป+นช(/น ๆ ได�แก� input layer , output layer และ hidden layers การประมูว้ลผู้ลข้อง Neural Net จะอาศ(ยการส่�งการที่.างานผู้�าน node ต้�าง ๆ ใน layer เหล�าน�/

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

2.Model Evaluation ( Accuracy )เป+นข้(/นการประมูาณ์คัว้ามูถู�กต้�องโดยอาศ(ยข้�อมู�ลที่� ใช�

ที่ดส่อบ ( testing data ) ซึ่$งคัลาส่ที่�แที่�จร�งข้องข้�อมู�ลที่� ใช�ที่ดส่อบน�/จะถู�กน.ามูาเปร�ยบเที่�ยบก(บคัลาส่ที่�หามูาได�จาก model เพี) อที่ดส่อบคัว้ามูถู�กต้�อง

3.Model Usage ( Classification )เป+น Model ส่.าหร(บใช�ข้�อมู�ลที่� ไมู�เคัยเห นมูาก�อน

( unseen data ) โดยจะที่.าการก.าหนดคัลาส่ให�ก(บ object ใหมู�ที่� ได�มูา หร)อ ที่.านายคั�าออกมูาต้ามูที่�ต้�องการ

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

Predictionเป+นการที่.านายหาคั�าที่�ต้�องการจากข้�อมู�ลที่�มู�อย��

ต้(ว้อย�างเช�น หายอดข้ายข้องเด)อนถู(ดไปจากข้�อมู�ลที่�มู�อย�� หร)อที่.านายโรคัจากอาการข้องคันไข้�ในอด�ต้ เป+นต้�น

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

3. Database clustering หร�อ Segmentationเป+นเที่คัน�คัการลดข้นาดข้องข้�อมู�ลด�ว้ยการรว้มูกล3�มูต้(ว้แปรที่�มู�

ล(กษณ์ะเด�ยว้ก(นไว้�ด�ว้ยก(น ต้(ว้อย�างเช�น บร�ษ(ที่จ.าหน�ายรถูยนต้#ได�แยกกล3�มูล�กคั�าออกเป+น 3 กล3�มู คั)อ

1.กล3�มูผู้��มู�รายได�ส่�ง (>$80,000) 2.กล3�มูผู้��มู�รายได�ปานกลาง ($25,000 to $ 80,000)3.กล3�มูผู้��มู�รายได�ต้.า (less than $25,000)

และภูายในแต้�ละกล3�มูย(งแยกออกเป+น-Have Children-Married-Last car is a used car-Own cars

จากข้�อมู�ลข้�างต้�นที่.าให�ที่างบร�ษ(ที่ร� �ว้�าเมู) อมู�ล�กคั�าเข้�ามูาที่�บร�ษ(ที่คัว้รจะเส่นอข้ายรถูประเภูที่ใด เช�น ถู�าเป+นกล3�มูผู้��มู�รายได�ส่�งคัว้รจะเส่นอรถูใหมู� เป+นรถูคัรอบคัร(ว้ข้นาดใหญ�พีอส่มูคัว้ร แต้�ถู�าเป+นผู้��มู�รายได�คั�อนข้�างต้.าคัว้รเส่นอรถูมู)อส่อง ข้นาดคั�อนข้�างเล ก

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

4. Deviation Detectionเป+นกรรมูว้�ธ์�ในการหาคั�าที่�แต้กต้�างไปจากคั�า

มูาต้รฐาน หร)อคั�าที่�คัาดคั�ดไว้�ว้�าต้�างไปมูากน�อยเพี�ยงใด โดยที่(ว้ไปมู(กใช�ว้�ธ์�การที่างส่ถู�ต้� หร)อการแส่ดงให�เห นภูาพี (Visualization) ส่.าหร(บเที่คัน�คัน�/ใช�ในการต้รว้จส่อบ ลายเซึ่ นปลอมู หร)อบ(ต้รเคัรด�ต้ปลอมู รว้มูที่(/งการต้รว้จหาจ3ดบกพีร�องข้องช�/นงานในโรงงานอ3ต้ส่าหกรรมู

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

5. Link Analysisจ3ดมู3�งหมูายข้อง Link Analysis คั)อ การส่ร�าง

link ที่�ร �ยกว้�า “ associations” ระหว้�าง recode เด�ยว้ หร)อ กล3�มูข้อง recode ใoฐานข้�อมู�ล link analysis ส่ามูารถูแบ�งออกเป+น 3 ชน�ด คั)อ

•associations discovery•sequential pattern discovery •similar time sequence

เทำคน-คต้,�งๆข้องก�รทำ��เหมู�องข้�อมูลั

การที่.าเหมู)องข้�อมู�ลเว้ บ คั)อ การใช�เที่คัน�คัการที่.าเหมู)องข้�อมู�ลเพี) อคั�นหาและส่ก(ดข้�อมู�ลและส่ารส่นเที่ศจากเอกส่ารเว้ บและบร�การบนเว้ บโดยอ(ต้โนมู(ต้� เพี) อน.าคัว้ามูร� �ที่�ได�มูาแก�ป1ญหาที่�ต้�องการที่(/งที่างต้รงและที่างอ�อมู นอกจากน�/ย(งได�แบ�งประเภูที่ข้องการที่.าเหมู)องข้�อมู�ลเว้ บโดยพี�จารณ์าจากข้�อมู�ลที่�น.ามูาว้�เคัราะห#ออกเป+น 3 ประเภูที่ คั)อ Web Content Mining, Web Structure Mining และ Web Usage Mining

ก�รทำ��เหมู�องข้�อมูลัเว2บ (WEB MINING)

Web Content Mining เป+นการคั�นหาข้�อมู�ลที่�มู�ประโยชน#จากข้�อมู�ลที่�อย��ภูายในเว้ บ เช�น ข้�อคัว้ามู ร�ปภูาพี เป+นต้�น โดย Web Content Mining ส่ามูารถูแบ�งออกเป+น 2 ประเภูที่ต้ามูมู3มูมูองคั)อ มู3มูมูองที่างด�านการส่)บคั�นส่ารน�เที่ศ (Information Retrieval) และมู3มูมูองที่างด�านฐานข้�อมู�ล (Database) เป?าหมูายข้อง Web Content Mining จากมู3มูมูองข้องการส่)บคั�นส่ารน�เที่ศคั)อการที่.าเหมู)องข้�อมู�ลเว้ บเพี) อปร(บปร3งการหาข้�อมู�ลหร)อกรองข้�อมู�ลให�ผู้�� ใช�โดยพี�จารณ์าจากข้�อมู�ลที่�ผู้�� ใช�อ�างอ�งหร)อร�องข้อ ในข้ณ์ะที่� เป?าหมูายข้อง Web Content Mining ในมู3มูมูองข้องฐานข้�อมู�ลส่�ว้นใหญ�พียายามูจ.าลองข้�อมู�ลบนเว้ บและรว้มูข้�อมู�ลน(/น เพี) อให�การส่อบถูามูที่.างานด�ข้$/นมูากกว้�าการใช�คั.าหล(กเป+นต้(ว้คั�นหาเพี�ยงอย�างเด�ยว้

Web Structure Mining เป+นว้�ธ์�การที่�พียายามูคั�นหาร�ปแบบโคัรงส่ร�างการเช) อมูโยงที่�ส่.าคั(ญและซึ่�อนอย��ในเว้ บ ซึ่$งร�ปแบบน�/จะข้$/นอย��ก(บร�ปแบบการเช) อมูโยงเอกส่ารภูายในเว้ บ โดยน.าร�ปแบบที่� ได�มูาใช�เพี) อจ(ดกล3�มูเว้ บเพีจและใช�ส่ร�างข้�อมู�ลส่ารส่นเที่ศที่� เป+นประโยชน# เช�น น.ามูาใช�ในการปร(บโคัรงส่ร�างข้องเว้ บให�ส่ามูารถูให�บร�การผู้�� ใช�ได�อย�างรว้ดเร ว้

ก�รทำ��เหมู�องข้�อมูลัเว2บ (WEB MINING)

Web Usage Mining เป+นว้�ธ์�การที่�พียายามูคั�นหาคัว้ามูหมูายข้องข้�อมู�ลที่�ส่ร�างจากช�ว้งการที่.างานหน$ งข้องผู้�� ใช�หร)อส่ร�างจากพีฤต้�กรรมูข้องผู้�� ใช�เร�ยกอ�กช) อหน$ งว้�า Web Log Mining โดยในข้ณ์ะที่� Web Content Mining และ Web Structure Mining ใช�ประโยชน#จากข้�อมู�ลจร�ง หร)อข้�อมู�ลพี)/ นฐานบนเว้ บแต้� Web Usage Mining ที่.าการคั�นหาคัว้ามูร� �จากข้�อมู�ลการต้�ดต้�อส่) อส่ารระหว้�างก(นข้องผู้�� ใช�ที่�ต้�ดต้�อก(บเว้ บ โดย Web Usage Mining ที่.าการรว้บรว้มูข้�อมู�ลจากบ(นที่$กในการด.าเน�นการต้�างๆ เช�น บ(นที่$กการใช�งานข้อง Proxy (Proxy Server Log) ข้�อมู�ลการลงที่ะเบ�ยน (Registration Data) หร)อข้�อมู�ลอ) นอ(นเป+นผู้ลจากการที่.างานร�ว้มูก(นมูาใช�ว้�เคัราะห# ด(งน(/น Web Usage Mining จ$งเป+นว้�ธ์�การที่.างานที่� เน�นใช�เที่คัน�คัที่�ส่ามูารถูที่.านายพีฤต้�กรรมูข้องผู้�� ใช�ในข้ณ์ะที่�ผู้�� ใช�ที่.างานก(บเว้ บ กระบว้นการที่.างานข้อง Web Usage Mining ส่ามูารถูแบ�งออกเป+น 2 ว้�ธ์�คั)อ

1. ที่.าการจ(บคั��ข้�อมู�ลการใช�งานข้องเคัร)องให�บร�การเว้ บให�อย�� ในร�ปข้องต้ารางคัว้ามูส่(มูพี(นธ์# ก�อนที่�น.าข้�อมู�ลน�/มูาปร(บใช�ก(บเที่คัน�คัการที่.าเหมู)องข้�อมู�ลการใช�เว้ บ

2. ใช�ประโยชน#จากข้�อมู�ลในบ(นที่$กการใช�งานโดยต้รงซึ่$งจะใช�เที่คัน�คัการเต้ร�ยมูข้�อมู�ล (Preprocessing) เพี) อเต้ร�ยมูข้�อมู�ลก�อนหาคัว้ามูส่(มูพี(นธ์# (Pattern Discovery) และว้�เคัราะห#ร�ปแบบ (Pattern Analysis)

ก�รทำ��เหมู�องข้�อมูลัเว2บ (WEB MINING)

งานว้�จ(ยจ.านว้นมูากที่�น.า Web Mining มูาช�ว้ยในการว้�เคัราะห#งานบร�การ web เพี) อน.าไปพี(ฒนาการให�บร�การที่�ด� และน�าส่นใจข้$/นส่�ว้นใหญ�จะเน�นไปที่�การน.าข้�อมู�ลในร�ปข้องต้(ว้อ(กษร (Text ) มูาว้�เคัราะห#รว้มูก(บข้�อมู�ลชน�ดอ) น โดยที่�ข้�อมู�ลเหล�าน�/มู(กจะได�จากการบ(นที่$กรายละเอ�ยดในที่3ก ๆ คัร(/งที่�มู�ผู้�� เข้�าใช�บร�การใน web แต้�ละแห�ง

ก�รปัระย3กต้+ WEB MINING เพ�!อก�รบร-ก�ร WEB

ในการที่.าธ์3รก�จห�างร�าน บร�การส่(งข้องที่างไปรษณ์�ย# หร)อการที่.าธ์3รก�จแบบอ� เล กที่รอน�กส่# ป1จจ(ยที่�ส่.าคั(ญต้�อคัว้ามูส่.าเร จข้องธ์3รก�จคั)อ คัว้ามูเข้�าใจในต้(ว้ล�กคั�า ย�งร� �ข้�อมู�ลมูากที่.าให�เข้�าใจล�กคั�ามูากข้$/น โอกาส่ที่�จะที่.าธ์3รก�จให�ต้รงก(บคัว้ามูต้�องการข้องต้ลาดก จะมู�มูากข้$/นไปด�ว้ย

ข้�อมู�ลข้องล�กคั�าด(งกล�าว้มูาน�/ ส่ามูารถูว้�เคัราะห#ออกมูาใน 3 ล(กษณ์ะด(งต้�อไปน�/ 1.Demographics เป+นข้�อมู�ลเก�ยว้ก(บที่�อย�� หร)อส่ถูานที่�ข้องผู้�� ใช�ในข้ณ์ะที่�

เข้�าใช�บร�การ web ซึ่$งจะส่ามูารถูประมูว้ลเป+นส่ถู�ต้�บร�เว้ณ์ที่�อย��อาศ(ยข้องกล3�มูผู้�� ใช�ส่�ว้นมูากได�

2.Psychographics เป+นข้�อมู�ลด�านจ�ต้ว้�ที่ยา ซึ่$งแส่ดงถู$งคั�าน�ยมูในด�านต้�าง ๆ ข้องผู้�� ใช� โดยส่ามูารถูแบ�งกล3�มูผู้�� ใช�ต้ามูข้�อมู�ลการเข้�าใช�บร�การ web ที่(/งในแง�ข้องเว้ลาและเน)/ อหา

3.Technolographics เป+นข้�อมู�ลที่�แส่ดงถู$งระด(บคัว้ามูร� �และคัว้ามูส่นใจในเที่คัโนโลย�ด�าน ต้�างๆ ข้องผู้�� ใช� รว้มูถู$งเคัร) องคัอมูพี�ว้เต้อร#ที่�ต้�ดต้�อเข้�ามูาด�ว้ย ซึ่$งจะช�ว้ยในการพี(ฒนาส่�นคั�า และบร�การให�น�าส่นใจ

เมู) อน.าข้�อมู�ลที่�ว้� เคัราะห#ที่( /ง 3 ล(กษณ์ะมูาพี�จารณ์าจะเก�ดประโยชน#อย�างมูากในการศ$กษาพีฤต้�กรรมูโดยรว้มูข้องประชากร ซึ่$งจ.านว้นข้�อมู�ลที่�น.ามูาใช�ว้�เคัราะห#มู(กจะมู�จ.านว้นมูากและให�ผู้ลการว้�เคัราะห#ที่�มู�คัว้ามูแมู�นย.าส่�ง

WEB MINING ก�บก�รทำ��ธ์3รก-จึ E-COMMERCE

Data Mining เป+นกระบว้นการส่)บคั�นข้�อมู�ลอ(นเป+นประโยชน#ต้�อการด.าเน�นธ์3รก�จออกจากกองข้�อมู�ลข้นาดใหญ�ที่�จ(ดเก บอย��ในฐานข้�อมู�ลข้องแต้�ละองคั#กร

เป?าหมูายข้อง Data Mining คั)อ ที่.าอย�างไรถู$งจะเอาชนะคั��แข้�งที่างธ์3รก�จให�ได� ที่.าอย�างไรถู$งจะร� �ได�ว้�าประชากรกล3�มูไหนคั)อ ล�กคั�าเป?าหมูาย(Who) และประชากรกล3�มูน�/ต้�องการซึ่)/ออะไร (What) ซึ่)/อที่� ไหน (Where) ซึ่)/อเมู) อไหร� (When) และที่�ส่.าคั(ญที่�ส่3ดก คั)อ อะไรคั)อแรงข้(บเคัล) อนให�ล�กคั�าเป?าหมูายต้�องการส่�นคั�าที่�ว้�าน(/น (Why) ซึ่$งคั.าถูามูเหล�าน�/ เมู) อมูาผู้นว้กเข้�าก(บร�ปแบบการด.าเน�นธ์3รก�จย3คัด�จ�ต้อล ก ส่�งผู้ลให�เที่คัโนโลย� Data Mining กลายส่ภูาพีมูาเป+นเคัร)องมู)อการต้ลาดที่�ส่.าคั(ญ ข้นาดที่�ว้�า น(กธ์3รก�จรายใดไมู�ให�คัว้ามูส่.าคั(ญก(บมู(น ก อาจจะถู�กคั��แข้�งที่างการคั�าข้องต้นที่�/งห�างไปเลย

ก�รปัระย3กต้+ WEB MINING ทำ�งด้��นก�รต้ลั�ด้

บนอ-นเต้อร+เน2ต้

จ.านว้นและข้นาดข้�อมู�ลข้นาดใหญ�ถู�กผู้ล�ต้และข้ยายต้(ว้อย�างรว้ดเร ว้ การส่)บคั�นคัว้ามูร� �จะมู�คัว้ามูหมูายก ต้�อเมู) อฐานข้�อมู�ลที่� ใช�มู�ข้นาดใหญ�มูาก ป1จจ3บ(นมู�จ.านว้นและข้นาดข้�อมู�ลข้นาดใหญ�ที่�ข้ยายต้(ว้อย�างรว้ดเร ว้ โดยผู้�านที่าง Internet ดาว้เที่�ยมู และแหล�งผู้ล�ต้ข้�อมู�ล อ) น ๆ เช�น เคัร)องอ�านบาร#โคั�ด , เคัรด�ต้การ#ด , อ�คัอมูเมู�ร#ซึ่

ข้�อมู�ลถู�กจ(ดเก บเพี) อน.าไปส่ร�างระบบการส่น(บส่น3นการต้(ดส่�นใจ ( Decision Support System) เพี) อเป+นการง�ายต้�อการน.าข้�อมู�ลมูาใช�ในการว้�เคัราะห#เพี) อการต้(ดส่�นใจ ส่�ว้นมูากข้�อมู�ลจะถู�กจ(ดเก บแยกมูาจากระบบปฏิ�บ(ต้�การ ( Operational System ) โดยจ(ดอย��ในร�ปข้องคัล(งหร)อเหมู)องข้�อมู�ล ( Data Warehouse ) ซึ่$งเป+นการง�ายต้�อการน.าเอาไปใช�ในการส่)บคั�นคัว้ามูร� �

ปั�จึจึ�ยทำ !ทำ��ให�ก�รทำ��เหมู�องข้�อมูลัเปั5นทำ ! ได้�ร�บคว�มูน-ยมู

ระบบ computer ส่มูรรถูนะส่�งมู�ราคัาต้.าลง เที่คัน�คั Data Mining ประกอบไปด�ว้ย Algorithm ที่�มู�คัว้ามูซึ่(บซึ่�อนและคัว้ามูต้�องการการคั.านว้ณ์ส่�ง จ$งจ.าเป+นต้�องใช�งานก(บระบบ computer ส่มูรรถูนะส่�ง ป1จจ3บ(นระบบ computer ส่มูรรถูนะส่�งมู�ราคัาต้.าลง พีร�อมูด�ว้ยเร�มูมู�เที่คัโนโลย�ที่�น.าเคัร)อง microcomputer จ.านว้นมูากมูาเช) อมูต้�อก(นโดยเคัร)อข้�ายคัว้ามูเร ว้ส่�ง(PC Cluster)ที่.าให�ได�ระบบ computer ส่มูรรถูนะส่�งในราคัาต้.า

การแข้�งข้(นส่�งในด�านอ3ต้ส่าหกรรมูและการคั�า เน) องจากป1จจ3บ(นมู�การแข้�งข้(นอย�างส่�งในด�านอ3ต้ส่าหกรรมูและการคั�า มู�การผู้ล�ต้ข้�อมู�ลไว้�อย�างมูากมูายแต้�ไมู�ได�น.ามูาใช�ให�เก�ดประโยชน# จ$งเป+นการจ.าเป+นอย�างย�งที่�ต้�องคัว้บคั3มูและส่)บคั�นคัว้ามูร� �ที่�ถู�กซึ่�อนอย��ในฐานข้�อมู�ลคัว้ามูร� �ที่� ได�ร(บส่ามูารถูน.าไปว้�เคัราะห#เพี) อการต้(ดส่�นใจในการจ(ดการในระบบต้�าง ๆ ซึ่$งจะเห นได�ว้�าคัว้ามูร� �เหล�าน�/ถู)อว้�าเป+นผู้ล�ต้ผู้ลอ�กช�/นหน$งเลยที่�เด�ยว้

ปั�จึจึ�ยทำ !ทำ��ให�ก�รทำ��เหมู�องข้�อมูลัเปั5นทำ ! ได้�ร�บคว�มูน-ยมู

ก.าหนดล(กษณ์ะประจ.าเป?าหมูายให�เป+นล(กษณ์ะประจ.าส่3ดที่�ายบางข้(/นต้อนใช�ว้�ธ์�ส่ร�างต้�นไมู�การต้(ดส่�นใจต้�องการล(กษณ์ะ

ประจ.าที่�มู�คั�าไมู�ต้�อเน) องเที่�าน(/น ด(งน(/น เราจ.าเป+นต้�องเปล�ยนล(กษณ์ะประจ.าที่�มู�คั�าต้�อเน) องให�เป+นล(กษณ์ะประจ.าที่�มู�คั�าไมู�ต้�อเน) อง

- ในกรณ์�ที่�มู�ระเบ�ยนน�อย เราอาจใช�k-fold cross validation หร)อleave-one-out

- ในกรณ์�ที่�มู�ระเบ�ยนมูากพีอเราคัว้รแบ�ง ก(นระเบ�ยนบางส่�ว้นเป+น Validation, Test data และที่� เหล)อน.ามูาใช�เป+น Training data ส่(ดส่�ว้นที่� ใช�อาจเป+น 3/10, 3/10ก(บ4/10

ก�รเต้ร ยมูแฟ้7มูข้�อมูลั

โปัรแกรมู WEKA (Waikato Environment for Knowledge Analysis)

เร�มูพี(ฒนาต้(/งแต้�ปB 1997 โดยมูหาว้�ที่ยาล(ย Waikato ประเที่ศน�ว้ซึ่�แลนด# เป+นซึ่อฟัต้#แว้ร#ประเภูที่ free ware โปรแกรมู Weka พี(ฒนามูาจากภูาษาจาว้าที่(/งหมูด ซึ่$งเข้�ยนมูาเพี) อเน�นงานที่างด�านการเร�ยนร� �ด�ว้ยเคัร)อง (Machine Learning) และการที่.าเหมู)องข้�อมู�ล (Data Mining) โปรแกรมูจะประกอบไปด�ว้ยโมูด�ลย�อย ๆ ส่.าหร(บใช�ในการจ(ดการข้�อมู�ลและเป+นโปรแกรมูที่�ส่ามูารถูใช� Graphic User Interface (GUI) และใช�คั�าส่�งในการให�ซึ่อฟัต้#แว้ร#ประมูว้ลผู้ล ส่ามูารถูร(นได�หลายระบบปฏิ�บ(ต้�การ มู�เคัร)องมู)อที่� ใช�ที่.างานในด�านการที่.า data mining ที่�รว้บรว้มูแนว้คั�ดอ(ลกอร�ที่$มู มูากมูายซึ่$งอ(ลกอร�ที่$มู ส่ามูารถูเล)อกใช�งานโดยต้รงได�จาก 2 ที่างคั)อจากช3ดเคัร)องมู)อที่�มู�อ(ลกอร�ที่$มู มูาให�หร)อเล)อกใช�จากอ(ลกอร�ที่$มูที่� ได�เข้�ยนเป+น โปรแกรมูลงไปเป+นช3ดเคัร)องมู)อเพี�มูเต้�มูและช3ดเคัร)องมู)อมู�ฟั1งก#ช(น ส่.าหร(บการที่.างานร�ว้มูก(บข้�อมู�ล ได�แก� Pre-Processing, Classification

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

ข้�อด้ - เป+นซึ่อฟัต้#แว้ร#เส่ร�ที่�ส่ามูารถูดาว้น#โหลดได�ฟัร�- ส่ามูารถูที่.างานได�ที่3ก ระบบปฏิ�บ(ต้�การ- เช) อมูต้�อ SQL Database โดยใช�Java Database Connectivity- มู�การเต้ร�ยมูข้�อมู�ล และเที่คัน�คัในการส่ร�างแบบจ.าลองที่�คัรอบคัล3มู- มู�ล(กษณ์ะที่�ง�ายต้�อการใช�งานเน) องจากใช�

ข้�อเส ยย(งไมู�แน�ใจแต้�จะว้(ดคั3ณ์ภูาพีข้องว้�ธ์�ก(บ accuracy ที่�ได�

มูากกว้�า เพีราะในที่างปฏิ�บ(ต้�จร�ง บางข้�อมู�ลใช�ว้�ธ์� Apriori จะให�คัว้ามูเที่�ยงต้รงส่�งกว้�าใช� FP-Tree บางข้�อมู�ล ใช� ว้�ธ์� FP-tree ก จะให�คัว้ามูเที่�ยงต้รงส่�งกว้�า Apriori ด(งน(/น ในที่างปฏิ�บ(ต้�ต้�องเอา Model ที่�ได�มูา Evaluated เพี) อ เล)อก ว้�ธ์�ที่� เหมูาะส่มู

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

โปัรแกรมู Orange Canvas

เป+นแหล�งที่�มูาข้องการส่ร�างภูาพีเปCดและว้�เคัราะห#ข้�อมู�ลส่.าหร(บมู)อใหมู�และผู้��เช�ยว้ชาญการที่.าเหมู)องข้�อมู�ลผู้�านที่างภูาพีเข้�ยนโปรแกรมูหร)อง� หลามูส่คัร�ปต้# ส่�ว้นประกอบส่.าหร(บการเร�ยนร� �เคัร)อง Add-ons ส่.าหร(บช�ว้ส่ารส่นเที่ศและการเหมู)องแร�ข้�อคัว้ามู เต้ มูไปด�ว้ยคั3ณ์ส่มูบ(ต้�ส่.าหร(บการว้�เคัราะห#ข้�อมู�ล

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

ข้�อด้ – ที่.าให�การเช)อมูต้�อง�ายย�งข้$/น – ที่.าให�การว้�เคัราะห#ข้�อมู�ลส่.าหร(บมู)อใหมู�ได�ง�ายข้$/น

ข้�อเส ย – ถู�าเช)อมูต้�อไมู�ด�อาจที่.าให�การเช)อมูต้�อผู้�ดพีลาด

ได�

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

โปัรแกรมู MATLABเป+นโปรแกรมูคัอมูพี�ว้เต้อร#ส่มูรรถูนะส่�ง เพี) อใช�ในการคั.านว้ณ์

ที่างเที่คัน�คั MATLABได�รว้มูการคั.านว้ณ์ การเข้�ยนโปรแกรมูและการแส่ดงผู้ลรว้มูก(นอย��ในต้(ว้โปรแกรมูเด�ยว้ได�อย�างมู�ประส่�ที่ธ์�ภูาพี และอย��ในล(กษณ์ะที่�ง�ายต้�อการใช�งาน นอกจากน�/ล(กษณ์ะข้องการเข้�ยนส่มูการในโปรแกรมูก จะเหมู)อนการเข้�ยนส่มูการคัณ์�ต้ศาส่ต้ร# งานที่(ว้ไปที่� ใช� MATLAB เช�น การคั.านว้ณ์ที่(ว้ไปการส่ร�างแบบจ.าลองและการที่ดส่อบแบบจ.าลอง การว้�เคัราะห#ข้�อมู�ล การแส่ดงผู้ลในร�ปกราฟั การที่.างานข้อง MATLAB จะที่.างานได�ที่(/งในล(กษณ์ะข้องการต้�ดต้�อโดยต้รง(Interactive)คั)อการเข้�ยนคั.าส่(งเข้�าไปที่�ละคั.าส่(ง เพี) อให� MATLAB ประมูว้ลผู้ล หร)อส่ามูารถูที่�จะรว้บรว้มูช3ดคั.าส่(งเป+นโปรแกรมูก ได� ข้�อส่.าคั(ญอย�างหน$งข้อง MATLAB ก คั)อข้�อมู�ลที่3กต้(ว้จะถู�กเก บในล(กษณ์ะข้อง arrayคั)อในแต้�ละต้(ว้แปรจะได�ร(บการแบ�งเป+นส่�ว้นย�อยเล กๆข้$/น ซึ่$งการใช�ต้(ว้แปรเป+น array ในMATLABไมู�จ.าเป+นที่�จะต้�องจอง dimension เหมู)อนก(บการเข้�ยนโปรแกรมูในภูาษาข้(/นต้.าที่(ว้ไป ซึ่$งที่.าให�ส่ามูารถูที่�จะแก�ป1ญหาข้องต้(ว้แปรที่�อย��ในล(กษณ์ะข้อง matrix และ vector ได�โดยง�าย

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

ข้�อเส ยคั)อฟั1งก#ช(นที่�น.ามูาใช�งานมู�น�อยที่.าให�เข้�ยน

โปรแกรมูที่�มู�คัว้ามูซึ่(บซึ่�อนได�ไมู�ด�เที่�าที่�คัว้รเพีราะมู�ประส่�ที่ธ์�ภูาพีและคัว้ามูเร ว้ในการประมูว้ลผู้ลต้.า

ข้�อด้ -มู�ฟั1งก#ช(นคัณ์�ต้ศาส่ต้ร#ให�เล)อกใช�ในการคั.านว้ณ์มูากมูาย-Algorithm พี(ฒนาได�ง�าย ส่ามูารถูแก�ไข้ป1ญหาที่างด�านคัณ์�ต้ศาส่ต้ร#ที่�มู�คัว้ามูซึ่(บซึ่�อนได�ง�าย -มู�โคัรงส่ร�างแบบจ.าลอง (Simulink) ที่�ส่ามูารถูน.าไปส่ร�างบล อกไดอะแกรมูเพี) อใช�ที่ดส่อบ และประเมู�นผู้ลระบบ Dynamic ต้�างๆ ก�อนน.าไปใช�งานจร�ง-ส่ามูารถูว้�เคัราะห#และต้รว้จส่อบข้�อมู�ลได�ง�ายและรว้ดเร ว้-น.าไปใช�งานในที่างด�ว้นกราฟัCกที่(/งในด�านการแส่ดงภูาพีต้(/งแต้�ส่องมู�ต้�และส่ามูมู�ต้� ต้ลอดจนส่ามูารถูน.าภูาพีมูาต้�อก(น และเก บไว้�เพี) อที่�จะส่ร�างเป+นภูาพีเคัล) อนไหว้ได�อ�กด�ว้ย-ประย3กต้#ใช�ในการส่ร�างร�ปแบบ Graphical User Interface ได�โดยการเล)อกใช� object และเมูน�ต้�างๆ โดย MATLAB จะมู�เคัร)องมู)อให�เล)อกใช� เช�น เมูน� รายการ ป3Dมูกด และ fields object ต้�างๆ เพี) อให�ผู้�� ใช�ส่ามูารถูเล)อกน.าไปใช�ในการที่.างานปฏิ�ส่(มูพี(นธ์#ก(นระหว้�างผู้�� ใช�ก(บเคัร)องคัอมูพี�ว้เต้อร#ได�-ที่.าการประมูว้ลผู้ลร�ว้มูก(บโปรแกรมูอ) นได� เช�น Fortran, Borland C/C++, Microsoft Visual C++ - MATLAB เป+นระบบ interactive ซึ่$งข้�อมู�ลพี)/ นฐานเป+นอาร#เรย#ที่� ไมู�ต้�องการมู�ต้� ที่.าให� MATLAB ส่ามูที่.าการแก�ป1ญหาที่างเที่คัน�คัต้�างๆ ได�มูากใช�เว้ลาในการประมูว้ลผู้ลน�อย และด�กว้�าโปรแกรมูภูาษา C และ Fortran

SOFTWARE ทำ !ใช้�ทำ��เหมู�องข้�อมูลั

ธ์3รก�จคั�าปล�กส่ามูารถูใช�งาน Data Mining ในการพี�จารณ์าหากลย3ที่ธ์#ให�เป+นที่�ส่นใจก(บผู้��บร�โภูคัในร�ปแบบต้�าง ๆ เช�น ที่�ว้�างในช(/นว้างข้องจะจ(ดการอย�างไรถู$งจะเพี�มูยอดข้ายได� เช�นที่� Midas ซึ่$งเป+นผู้��แที่นจ.าหน�ายอะไหล�ส่.าหร(บอ3ต้ส่าหกรรมูรถูยนต้# งานที่�ต้�องที่.าคั)อการจ(ดการก(บข้�อมู�ลที่� ได�ร(บจากส่าข้าที่(/งหมูด ซึ่$งจะต้�องที่.าการรว้บรว้มูและว้�เคัราะห#อย�างที่(นที่�ว้งที่�

ก�จการโที่รคัมูนาคัมู เช�นที่� Bouygues Telecom ได�น.ามูาใช�ต้รว้จส่อบการโกงโดยว้�เคัราะห#ร�ปแบบการใช�งานข้องส่มูาช�กล�กข้�ายในการใช�งานโที่รศ(พีที่# เช�น คัาบเว้ลาที่� ใช�จ3ดหมูายปลายที่าง คัว้ามูถู�ที่� ใช� ฯลฯ และคัาดการณ์#ข้�อบกพีร�องที่�เป+นไปได�ในการช.าระเง�น เที่คัน�คัน�/ย(งได�ถู�กน.ามูาใช�ก(บล�กคั�าโที่รศ(พีที่#เคัล) อนที่�ซึ่$งระบบส่ามูารถูต้รว้จส่อบได�ว้�าที่� ใดที่� เส่�ยงที่�จะส่�ญเส่�ยล�กคั�าส่�งในการแข้�งข้(น France Telecom ได�คั�นหาว้�ธ์�รว้มูกล3�มูผู้�� ใช�ให�เป+นหน$งเด�ยว้ด�ว้ยการส่ร�างแรงด$งด�ดในเร)องคั�าใช�จ�ายและพี(ฒนาเร)องคัว้ามูจงร(กภู(กด�ต้�อต้(ว้ส่�นคั�า

ก�รปัระย3กต้+ใช้�ง�นก�รทำ��เหมู�องข้�อมูลั

การว้�เคัราะห#ผู้ล�ต้ภู(ณ์ฑ์# เก บรว้บรว้มูล(กษณ์ะและราคัาข้องผู้ล�ต้ภู(ณ์ฑ์#ที่(/งหมูดส่ร�างโมูเดลด�ว้ยเที่คัน�คั Data Mining และใช�โมูเดลในการที่.านายราคัาผู้ล�ต้ภู(ณ์ฑ์#ต้(ว้อ) น ๆ

การว้�เคัราะห#บ(ต้รเคัรด�ต้- ช�ว้ยบร�ษ(ที่เคัรด�ต้การ#ดต้(ดส่�นใจในการที่�จะให�เคัรด�ต้การ#ดก(บล�กคั�า

หร)อไมู�- แบ�งประเภูที่ข้องล�กคั�าว้�ามู�คัว้ามูเส่�ยงในเร)องเคัรด�ต้ ต้.า ปานกลาง

หร)อส่�ง- ป?องก(นป1ญหาเร)องการที่3จร�ต้บ(ต้รเคัรด�ต้

การว้�เคัราะห#ล�กคั�า- ช�ว้ยแบ�งกล3�มูและว้�เคัราะห#ล�กคั�าเพี) อที่�จะผู้ล�ต้และเส่นอส่�นคั�าได�

ต้รงต้ามูกล3�มูเป?าหมูายแต้�ละกล3�มู- ที่.านายว้�าล�กคั�าคันใดจะเล�กใช�บร�การจากบร�ษ(ที่ภูายใน 6 เด)อนหน�า

ก�รปัระย3กต้+ใช้�ง�นก�รทำ��เหมู�องข้�อมูลั

1. นายนนธ์�ร(ฐ แบแซึ่ 5614130222. นายกะร(ต้ บ3ญรมูย# 5614130313. น.ส่.ส่3ว้ภู(ที่ร ต้Gะผู้(ด 5614130324. นายณ์(ฐว้3ฒ� ก(นที่า 5614130415. นายว้�บ�ลพีรรณ์ อ�นต้Gะ 561413051

ส่าข้าเที่คัโนโลย�ส่ารส่นเที่ศส่.าน(กว้�ชาเที่คัโนโลย�ส่ารส่นเที่ศ

จึ�ด้ทำ��โด้ย