ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์...

15
363 The Journal of KMUTNB., Vol. 23, No. 2, May. - Aug. 2013 วารสารวิชาการพระจอมเกล้าพระนครเหนือ ปีท23 ฉบับที2 พ.ค. - ส.ค. 2556 1 นักศึกษา สาขาวิชาเทคโนโลยีสารสนเทศ สำานักวิชาเทคโนโลยีสังคม มหาวิทยาลัยเทคโนโลยีสุรนารี 2 อาจารย์ สาขาวิชาเทคโนโลยีสารสนเทศ สำานักวิชาเทคโนโลยีสังคม มหาวิทยาลัยเทคโนโลยีสุรนารี * ผู ้นิพนธ์ประสานงาน โทรศัพท์ 0-4422-4309 อีเมล: [email protected] รับเมื่อ 30 ธันวาคม 2553 ตอบรับเมื่อ 31 ตุลาคม 2555 ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์คลุมเครือ พิชญสินี กิจวัฒนาถาวร 1 ธรา อั่งสกุล 2 และ จิติมนต์ อั่งสกุล 2 * จัดเก็บความรู้ และตัวแปลภาษามาช่วยในการวิเคราะห์ เชิงความหมาย รวมทั้งพัฒนาวิธีการคำานวณระดับคะแนน ความพึงพอใจของนักท่องเที่ยว โดยนำาตรรกศาสตร์ คลุมเครือมาใช้ ผลการทดลองพบว่า ระบบที่นำาเสนอ มีค่าความถูกต้องของการสกัดความรู้เท่ากับ 90.15% ค่าความแม่นยำาเท่ากับ 100% ค่าความระลึก เท่ากับ 75.12% และค่าระดับคะแนนของคำาวิจารณ์ โดยรวมแตกต่างจากที่นักท่องเที่ยวกำาหนดเท่ากับ 0.06 คะแนน คำาสำาคัญ: การสกัดความรู้ บทวิจารณ์ออนไลน์ ตรรกศาสตร์คลุมเครือ บทคัดย่อ ปัจจุบัน วิธีการที่นักท่องเที่ยวนิยมนำามาใช้ใน การเลือกสถานที่พักประกอบการท่องเที่ยวให้ได้ตรงกับ ความต้องการมากที่สุดคือ การวิเคราะห์ข้อมูลจากบท วิจารณ์ออนไลน์ของนักท่องเที่ยวที่เคยไปมาแล้วเพื่อ นำามาใช้ประกอบการตัดสินใจ แต่ข้อเสียของการนำาวิธีนีมาใช้คือ นักท่องเที่ยวจะต้องอ่านบทวิจารณ์ทั้งหมด ซึ่งมีเป็นจำานวนมาก บทความนี้จึงได้ออกแบบและพัฒนา ระบบสกัดความรู้แบบอัตโนมัติจากบทวิจารณ์โรงแรม ออนไลน์ของนักท่องเที่ยว โดยมุ่งเน้นที่การวิเคราะห์ ความหมายของบทวิจารณ์ของนักท่องเที่ยวเกี่ยวกับที่พัก โดยนำาเอาออนโทโลยีมาใช้เป็นฐานความรู้ในการสกัดและ

Upload: others

Post on 16-Oct-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

363

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

1 นกศกษา สาขาวชาเทคโนโลยสารสนเทศ สำานกวชาเทคโนโลยสงคม มหาวทยาลยเทคโนโลยสรนาร2 อาจารย สาขาวชาเทคโนโลยสารสนเทศ สำานกวชาเทคโนโลยสงคม มหาวทยาลยเทคโนโลยสรนาร* ผนพนธประสานงาน โทรศพท 0-4422-4309 อเมล: [email protected]

รบเมอ 30 ธนวาคม 2553 ตอบรบเมอ 31 ตลาคม 2555

ระบบสกดความรจากบทวจารณโรงแรมออนไลนโดยใชตรรกศาสตรคลมเครอ

พชญสน กจวฒนาถาวร1 ธรา องสกล2 และ จตมนต องสกล2*

จดเกบความร และตวแปลภาษามาชวยในการวเคราะหเชงความหมาย รวมทงพฒนาวธการคำานวณระดบคะแนนความพงพอใจของนกทองเทยว โดยนำาตรรกศาสตรคลมเครอมาใช ผลการทดลองพบวา ระบบทนำาเสนอ มคาความถกตองของการสกดความรเทากบ 90.15% คาความแมนยำาเทากบ 100% คาความระลกเทากบ 75.12% และคาระดบคะแนนของคำาวจารณ โดยรวมแตกตางจากทนกทองเทยวกำาหนดเทากบ 0.06 คะแนน

คำาสำาคญ: การสกดความร บทวจารณออนไลน ตรรกศาสตรคลมเครอ

บทคดยอ

ปจจบน วธการทนกทองเทยวนยมนำามาใชในการเลอกสถานทพกประกอบการทองเทยวใหไดตรงกบ ความตองการมากทสดคอ การวเคราะหขอมลจากบทวจารณออนไลนของนกทองเทยวทเคยไปมาแลวเพอ นำามาใชประกอบการตดสนใจ แตขอเสยของการนำาวธน มาใชคอ นกทองเทยวจะตองอานบทวจารณทงหมด ซงมเปนจำานวนมาก บทความนจงไดออกแบบและพฒนาระบบสกดความรแบบอตโนมตจากบทวจารณโรงแรมออนไลนของนกทองเทยว โดยมงเนนทการวเคราะห ความหมายของบทวจารณของนกทองเทยวเกยวกบทพก โดยนำาเอาออนโทโลยมาใชเปนฐานความรในการสกดและ

Page 2: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

364

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

1 Student, School of Information Technology, Institute of Social Technology, Suranaree University of Technology.2 Lecture, School of Information Technology, Institute of Social Technology, Suranaree University of

Technology.* Corresponding Author, Tel. 0-4422-4309, E-mail: [email protected]

Received 30 December 2010; Accepted 31 October 2012

A Knowledge Extraction System from Online Hotel Reviews Using Fuzzy Logic

Pichayasinee Kitwattanataworn1 Thara Angskun2 and Jitimon Angskun2*

AbstractCurrently, the most common method that

tourists use in selecting the accommodations to conform to their preferences is a data analysis from online reviews of experienced tourists to support the decision. Unfortunately, tourists must read enormous reviews in order to select their preferred accommodations. This paper designs and develops an automatic knowledge extraction system from online hotel reviews of tourists. The proposed system focuses on a semantic analysis from hotel reviews using ontology as the knowledge base

for knowledge extraction and storing, and the parser to solve the semantic analysis problem. In addition, we propose a calculation approach for a tourist satisfaction level using fuzzy logic. The experimental results indicate that the proposed system achieveswith 90.15% of accuracy, 100% of precision, 75.12% of recall and 0.06 review points that are different from the points specified by tourists.

Keyword: Knowledge Extraction, Online Reviews, Fuzzy Logic

Page 3: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

365

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

1. บทนำาในปจจบน การพฒนาทางดานเทคโนโลยสารสนเทศ

และการสอสารมความเจรญกาวหนาเปนอยางมาก สงผล ใหอนเทอรเนตไดเขามามบทบาทในชวตประจำาวนของ ผคนมากยงขน โดยทวโลกมผใชงานอนเทอรเนตสงถงประมาณ 1,966 ลานคน (คดเปนรอยละ 28.7 ของประชากรทงโลก) ในขณะทประเทศไทยมผใชงานอนเทอรเนตถงประมาณ 17.5 ลานคน [1] จากจำานวนการใชงานอนเทอรเนตทสงมากดงกลาว ไดสงผลใหการดำาเนนกจกรรมทางธรกจแบบดงเดมเปลยนรปแบบไปเปนธรกจอเลกทรอนกส (E-business) มากขน

ธรกจการทองเทยวนบเปนธรกจหลกอยางหนงของประเทศไทย ซงปจจบนการดำาเนนการขององคกรตางๆ ทมสวนเกยวของกบธรกจนไดมการปรบเปลยนองคกรของตนเองไปสธรกจอเลกทรอนกสมากยงขน เพอเปนแรงจงใจใหนกทองเทยวมาซอสนคาหรอบรการของตน และอำานวยความสะดวกแกนกทองเทยวในการบรการจองโรงแรมทพก จองรถ หรอจองตวเครองบน ตลอดจน ชวยใหนกทองเทยวสามารถสบคนขอมลดานการทองเทยว เพอนำามาประกอบการตดสนใจเลอกแหลงทองเทยว ไดตรงกบความตองการ ซงแนวโนมดงกลาวไดสอดคลองกบผลการศกษาขององคการสงเสรมการทองเทยวโลก (World Tourism Organization: WTO) ทพบวาปจจยสำาคญทสงผลใหการทองเทยวโลกเพมสงขน คอ ระบบขอมลขาวสารททนสมยและกาวหนา เนองจากเมอ นกทองเทยวมโอกาสรบทราบขอมลขาวสารดานการทองเทยว มากขน จะทำาใหมความสนใจและมนใจในการเดนทางเพมมากขนตามไปดวย [2]

อยางไรกตาม ถงแมวาการจดเกบขอมลตางๆ จากนกทองเทยวจะมการปฏบตกนอยแลวอยางกวางขวางในโลกธรกจอเลกทรอนกส แตการจะนำาขอมลเหลานนมาใชประโยชนกลบเปนเรองทยงยากและตองใชเวลานาน เนองจากขอมลทจดเกบไวนนเปนขอมลดบทยงไมไดผานการคดกรอง ประมวลผล หรอสกด เพอใหไดความรทสามารถนำาไปใชประกอบการตดสนใจไดทนท ตวอยางเชน เวบไซตสำาหรบการทองเทยวทมการจดเกบ

บทวจารณเกยวกบโรงแรมหรอทพกของนกทองเทยวทเคยไปมาแลว เพอเปนขอมลใหกบนกทองเทยวคนอนๆ ซงยงไมมความตองการทชดเจนวาจะไปทองเทยวทใด และตองการคนหาขอมลเพอนำาไปใชประกอบการวางแผนทองเทยวของตน เวบไซตประเภทนจะใหเพยงขอมลอนดบความนยมของโรงแรมหรอทพก โดยรวมทนกทองเทยว คนอนไดเคยแสดงความคดเหนดวยวธการลงคะแนนเทานน หากนกทองเทยวคนใดตองการรายละเอยดเพมเตมจะตองตามอานในทกๆ ความคดเหนหรอทกๆ บทวจารณเอง แลวจงวเคราะหหรอตดสนใจวาโรงแรมหรอทพกนนควรไปหรอไม อกทงเนองจากเวบไซตเปนแบบตายตว ขอมลทจดเกบไวยงไมไดผานการคดกรอง ทำาใหขอมลทไดยงไมละเอยดเพยงพอสำาหรบความตองการของนกทองเทยว

จากการทบทวนวรรณกรรมทศกษาเกยวกบ บทวจารณออนไลนพบวา งานวจยสวนใหญเปนการจำาแนกบทวจารณใหอยในหมวดหมทตองการแบบอตโนมต ตวอยางเชน การสรางขนตอนวธอยางงายในการแยกประเภท คำาวจารณวามความหมายเชงแนะนำาหรอไม โดยการพยากรณจากการคำานวณคาเฉลยของกลมคำาคณศพทหรอคำากรยาวเศษณ [3] การจำาแนกขอความแบบอตโนมตโดยนำาวธมาตรฐานในการคำานวณความหมายจากตำาแหนงของคำาคณศพทในขอความมาประยกตใช [4] และการวเคราะหบทวจารณทางดานดนตร และพฒนาระบบทมกลไกในการกำาจดอคตตลอดจนการบรรยายท ไมเกยวของกบดนตรของผวจารณ โดยการเรยนร จากบทวจารณจำานวนมาก [5]

นอกจากนยงมงานวจยทศกษาเกยวกบการสกด ความรจากบทวจารณออนไลน ตวอยางเชน การพฒนาระบบจดอนดบสนคาจากคณลกษณะทปรากฏในบทวจารณ โดยมกระบวนการระบประเภทและแปลความหมายของประโยค รวมทงการสรางกราฟเพอเทยบเคยงคณภาพของสนคาตางรนหรอตางผผลต แลวนำาไปคำานวณระดบคะแนนเพอจดอนดบ [6] การพฒนาระบบสกดความรจากบทวจารณสนคา โดยมงเนนการคนหาคณลกษณะของสนคาและนำาคณลกษณะทไดมาใชคำานวณหาระดบ

Page 4: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

366

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

คะแนน อกทงมการนำาเทคนคตรรกศาสตรคลมเครอ มาใชในการจำาแนกและคำานวณหาระดบความเปนขอความขยะในแตละบทวจารณ [7] และการสกดความรจาก บทวจารณโดยการสรปสาระสำาคญและนำาเสนอทงใน ดานบวกและลบใหกบลกคา ดวยวธการทำาเหมองขอมลและการประมวลผลภาษาธรรมชาต [8]

จากการทบทวนวรรณกรรมขางตนจะเหนไดวาลกคาไมสามารถทราบถงจำานวนคำาวจารณตางๆ อยางละเอยดวามผทแสดงความคดเหนทงดานบวกและดานลบในแตละเรองจำานวนเทาใด ซงในการจดลำาดบความสำาคญนน จำานวนของการแสดงความคดเหนนบวามผลอยางมาก ตอการจดลำาดบความสำาคญหรอการตดสนใจเลอกสนคาและบรการของลกคา [9] ดงนน งานวจยนจงนำาเสนอระบบสกดความรจากบทวจารณออนไลนของนกทองเทยวซงมการแสดงจำานวนความคดเหนของแตละเรองอยางละเอยด และนำาเอาเทคนคตางๆ ทมอยในปจจบนเขามาประยกตใช เชน ออนโทโลย มาใชเปนฐานความรในการวเคราะหคำาศพท การสกดและจดเกบความร นอกจากนยงนำาตวแปลภาษามาชวยในการวเคราะหเชงโครงสรางและเชงความหมาย รวมทงพฒนาวธการคำานวณระดบคะแนนความพงพอใจโดยนำาตรรกศาสตรคลมเครอมาใช เพอใหไดมาซงผลลพธทมความใกลเคยงกบความพงพอใจของนกทองเทยวมากทสด

2. กรอบการทำางานของระบบในการพฒนาระบบสกดความรแบบอตโนมตจากบท

วจารณโรงแรมออนไลน มงเนนการพฒนาขนตอนวธในการประมวลความหมายอยางถกตองจากบทวจารณภาษาองกฤษของนกทองเทยวทไดไปแหลงทองเทยวมาแลว โดยการสกดเอาสวนสำาคญของบทวจารณมาเปนความร ทเกบอยในฐานความรของระบบ และเมอนกทองเทยวคนใหมเขามาคนหาขอมล ระบบจะสบคนความรทเกบอยในฐานความรนนไปแสดงผล โดยกรอบการทำางานของระบบสกดความรจากบทวจารณโรงแรมออนไลน แสดงดง รปท 1 อนประกอบดวย 5 สวน ไดแก สวนปฏสมพนธกบผใช ฐานความร ตวแปลภาษา ตวสกดความร และ

สวนอธบายความร โดยสามารถอธบายการทำางานในแตละสวนดงตอไปน [10]

2.1 สวนปฏสมพนธกบผใชเปนสวนโตตอบกบผใชหรอนกทองเทยวซงใชระบบ

ผานทางเวบเบราวเซอร

2.2 ฐานความร เปนสวนทใชเกบขอมลทเปนประโยชนตอการสกด

ความรแบบอตโนมต ตลอดจนความรทสกดได ซงประกอบดวย 4 สวนหลก ดงน

2.2.1 ออนโทโลยดานการทองเทยว ไดปรบปรง จากออนโทโลยทมอยในปจจบน [11] โดยการนำาบทวจารณของนกทองเทยวจำานวน 400 บทวจารณมาวเคราะหหาคำาสำาคญ (Feature Selection) ทอยในขอบเขตเรองโรงแรมหรอทพก โดยใชวธการวดคานำาหนกของคำาตามขนตอนวธของรอคชโอ (Rocchio: TF-IDF Weighting) [12] จากนนจงนำาคำาสำาคญทไดมาเพมเตมลงในออน โทโลยดงกลาว ทงนโครงสรางของออนโทโลยดาน การทองเทยวทปรบปรงแลวประกอบดวยคลาส (Class) จำานวน 10 คลาส และมคณสมบต (Properties) ทสำาคญ

รปท 1 กรอบการทำางานของระบบสกดความรจากบทวจารณโรงแรมออนไลน

รปท 1 กรอบการทางานของระบบสกดความรจากบท

วจารณโรงแรมออนไลน

บทวจารณ HTTP Request HTTP

Response

สวนสกดความรแบบอตโนมต

ตววเคราะห คาศพท

ตววเคราะหเชงความหมาย ตวสกดความร

ตวแปลภาษา

สวนปฏสมพนธกบผใช

ความร

ผใช/นกทองเทยว

ฐานความร ตววเคราะหเชงโครงสราง

สวนอธบาย

คาคน รายละเอยด ของโรงแรม

Page 5: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

367

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

ตอการสกดความรรวมทงสน 76 คณสมบต ดงแสดงตวอยางของออนโทโลยบางสวนไวในรปท 2

จากตวอยางโครงสรางของออนโทโลยดานการทองเทยว ในรปท 2 จะเหนไดวาคลาสโรงแรม ประกอบดวยคลาสยอย คอ หองพก หองนำา ทำาเลทตง การบรการ และความคมคา และในแตละคลาสประกอบดวยคณสมบตตางๆ เชน คลาสหองพก ประกอบดวยคณสมบตคอ เครองปรบอากาศ ผาปเตยง และเครองโทรทศน และคลาสการจดอนดบ ประกอบดวยคณสมบตคอ ดมาก ด ปานกลาง แย และแยมาก โดยคลาสการจดอนดบนจะถกนำามาใชในการจดเกบระดบคะแนนความพงพอใจของนกทองเทยวเกยวกบโรงแรม ซงคำานวณไดจากตวสกดความรทจะกลาวตอไปในหวขอ 2.4

2.2.2 คลงคำาเหมอน เปนแหลงรวบรวมคำาตางๆ ทมความหมายเหมอนกน แตเขยนตางกน โดยมการกำาหนดคำาทเปนตวแทนของกลมคำาเหมอนแตละกลม เพอใชในการแปลงคำาศพทใหเปนคำาเดยวกนทงหมด

2.2.3 คลงคำาศพท เปนแหลงรวบรวมคำาศพททมการกำาหนดระดบคะแนนของคำาไวโดยผเชยวชาญ ดานภาษา และคะแนนแตละระดบจะแสดงถงความ พงพอใจทแตกตางกน ไดแก ระดบคะแนนท 1 หมายถง แยมาก (Terrible) ระดบคะแนนท 2 หมายถง แย (Poor) ระดบคะแนนท 3 หมายถง ปานกลาง (Average) ระดบคะแนนท 4 หมายถง ด (Good) และระดบคะแนนท 5 หมายถง ดมาก (Excellent) คลงคำาศพทประกอบดวยกลมคำาศพท 3 ประเภทดงน

1) กลมคำาคณศพท (adj.) เปนกลมคำาทแสดงการต-ชม ซงมการกำาหนดระดบคะแนนของแตละคำาไวตายตวโดยการยนยนจากผเชยวชาญดานภาษา เชน “Excellent” = 5, “Effective” = 4, “Moderate” = 3 และ “Unfriendly” = 2, “Awful” = 1 เปนตน

2) กลมคำากรยาวเศษณ (adv.) เปนกลมคำาแสดงการขยายความต-ชมไมวาจะเปนแงบวกหรอลบ ซงมการกำาหนดอตราการเพม-ลดระดบคะแนนไว ทงน เมอนำาคำากลมนไปประมวลผลจะทำาใหระดบคะแนนทสกดไดมผลลพธไปในทางเดยวกน กลาวคอ หากผใชวจารณใน

แงด ระดบคะแนนทไดกจะยงเพมขน ตวอยางกลมคำากรยาวเศษณทไดกำาหนดอตราการเพม-ลดระดบคะแนนไว เชน “Very” = +1, “So” = +1, “Extremely” = +1 และ “Most” = + 2 เปนตน

3) กลมคำากรยาวเศษณแบบพเศษ (sadv.) เปน กลมคำาแสดงการขยายความต-ชมทงแงบวกและลบ ซงมการกำาหนดอตราการเพม-ลดระดบคะแนนไวเชนเดยวกบกลมคำากรยาวเศษณ แตแตกตางกนตรงทเมอนำาคำากลมนไปประมวลผลจะทำาใหระดบคะแนนทสกดไดมผลลพธไปในทางตรงกนขาม กลาวคอ หากผใชวจารณในแงด ระดบคะแนนทสกดไดกจะถกลดทอนลง ตวอยางกลมคำากรยาวเศษณทไดกำาหนดอตราการเพม-ลดระดบคะแนนไว เชน “Most” = + 1, “So” = + 1, Extremely” = + 1 และ “Most” = + 2 เปนตน

รปท 2 โครงสรางของออนโทโลยดานการทองเทยว

Page 6: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

368

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

ทงน ระดบคะแนนของคำาศพททง 3 ประเภทจะถกนำาไปใชในตวสกดความร ซงจะกลาวตอไปในหวขอ 2.4

2.2.4 กฎไวยากรณไมพงบรบท (Context Free Grammar) เปนกลมของกฎไวยากรณทเขยนขนโดยแสดงเปนสญลกษณทางภาษา [13] เพอใชสำาหรบตรวจสอบไวยากรณของประโยคคำาวจารณในขนตอนการแปลภาษา

2.3 ตวแปลภาษา เปนสวนสำาคญของระบบททำาใหทราบกลมคำาสำาคญ

ทใชในการวเคราะหความหมายทงหมด สามารถแบงการทำางานออกเปน 3 สวน ดงตอไปน

2.3.1 ตววเคราะหคำาศพท (Lexical Analyzer) ทำาหนาทในการตดคำาตามชองวาง และแปลงคำาศพทใหอยในรปแบบทเหมาะสมสำาหรบการสกดความร โดยเปรยบเทยบ กบคลงคำาเหมอนทอยในฐานความร

2.3.2 ตววเคราะหเชงโครงสราง (Syntactic Analyzer) ทำาหนาทวเคราะหหาความเกยวของสมพนธระหวางคำาในประโยคตามทฤษฎไวยากรณไมพงบรบท

2.3.3 ตววเคราะหเชงความหมาย (Semantic Analyzer) ทำาหนาทวเคราะหความหมายของคำาทไดจากตววเคราะหเชงโครงสราง โดยการคนหาระดบคะแนนของคำาคณศพทและคำากรยาวเศษณจากคลงคำาศพท

2.4 ตวสกดความร เปนการคำานวณระดบคะแนนตามคำาคณศพทและ

คำากรยาวเศษณทปรากฏในประโยคคำาวจารณ แบงการคำานวณออกเปน 2 ระดบ ดงน

2.4.1 การคำานวณระดบคะแนนเฉพาะเรอง เปนการคำานวณคาคะแนนความพงพอใจเฉพาะในเรองทคำานาม (Noun) แสดงถง โดยระบบจะพจารณาคาระดบคะแนนของกลมคำาคณศพทตามทระบไวในคลงคำาศพท เมอทราบแลวจงพจารณาตอไปวามกลมคำากรยาวเศษณทเกยวของหรอไม ถามจะตองปรบระดบคะแนนของเรองนนใหม ทงน คาของระดบคะแนนเฉพาะเรองทคำานวณไดจะถกจดเกบลงในออนโทโลยโดยจำาแนกตามเรองหรอคณสมบตของโรงแรมทวจารณ เพอรอนำาไปแปลความหมายตามฟงกชน

สมาชกของตรรกศาสตรคลมเครอในขนตอนการคำานวณระดบคะแนนในภาพรวมตอไป ตวอยางการคำานวณระดบคะแนนของเครองปรบอากาศ (Air Condition) ทไดจากประโยคคำาวจารณ “The air conditioning was almost very effective.” แสดงดงรปท 3

2.4.2 การคำานวณระดบคะแนนในภาพรวม ระดบคะแนนเฉพาะเรองทคำานวณไดจากขนตอนทผานมาจะ ถกนำามาเปนขอมลนำาเขาในระบบวนจฉยแบบฟซซ (Fuzzy Inference System) เพอคำานวณระดบคะแนนในภาพรวม โดยระดบคะแนนในภาพรวมนนจะแบงเปนลำาดบชนตามโครงสรางของออนโทโลยดงทกลาวไปแลว โดยระดบคะแนนในภาพรวมของลำาดบชนลางจะถกนำาไปใชเปนขอมลนำาเขาในระบบวนจฉยแบบฟซซในลำาดบชนบนถดขนไปเรอยๆ จนกลายเปนระดบคะแนนในภาพรวมของทงโรงแรม ดงตวอยางทแสดงในรปท 4 ซงเปน การหาระดบคะแนนในภาพรวมของทงโรงแรม (Hotel Rating)

รปท 4 ตวอยางการพจารณาระดบคะแนนในชนกอนหนา เพอคำานวณหาระดบคะแนนในภาพรวมของทงโรงแรม

รปท 3 ตวอยางการคำานวณระดบคะแนนเฉพาะเรอง

รปท 3 ตวอยางการคานวณระดบคะแนนเฉพาะเรอง

AirCondition (noun) effective (adj.) = 4 very (adv.) = +1 almost (sadv.) = -1 --------------------------- Rating = (4+1) -1 = 4

รปท 4 ตวอยางการพจารณาระดบคะแนนในชนกอน

หนา เพอคานวณหาระดบคะแนนในภาพรวมของทงโรงแรม

Page 7: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

369

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

โดยพจารณาจากระดบคะแนนในภาพรวมของชนกอนหนา เชน หองพก (Room) และทำาเลทตง (Location) เปนตน

• ทงน ระบบวนจฉยแบบฟซซทนำามาใชในการคำานวณระดบคะแนนในภาพรวมนน มสวนประกอบพนฐาน ทสำาคญอย 4 สวน ดงน

• สวนฟซซฟเคชน (Fuzzification) เปนการนำาเอาคาของระดบคะแนนเฉพาะเรองมาแปลงใหเปนคาแบบฟซซ (Fuzzy Values) ซงกระบวนการนตองมการ กำาหนดฟซซเซตสำาหรบคณสมบตของโรงแรมทมอยใน ออนโทโลยทง 76 คณสมบต ซงฟซซเซตของแตละคณสมบตไดกำาหนดรปแบบของระดบคาความเปนสมาชก (Degree of Membership) แบบฟงกชนสามเหลยม (Triangular Membership Function) ซงประกอบดวยพารามเตอร 3 คา ไดแก {a, b, c} ดงสมการท 1 [14]

(1)

ฟงกชนสามเหลยมนไดถกนำามาใชแบงกลมสมาชกของตวแปรระดบคะแนน (Rating) ออกเปน 5 กลมสมาชก ไดแก แยมาก (Terrible) แย (Poor) ปานกลาง (Average) ด (Good) และดมาก (Excellent) โดยกำาหนดคาพารามเตอรในแตละฟงกชนสมาชกแตกตางกน อาท การแบงกลมสมาชกตวแปรทมคะแนนอยในระดบแย (Poor) กำาหนดคาพารามเตอรให a=1, b=2 และ c=3 เปนตน ทงน การแบงกลมสมาชกของตวแปรระดบคะแนน แสดงดงรปท 5

• สวนฐานกฎฟซซ (Fuzzy Rule Base) ประกอบดวยกฎฟซซตางๆ ทใชในการอนมานจากเหตไปสผลลพธ นนกคอ หากนกทองเทยววจารณเกยวกบคณสมบตตางๆ ของโรงแรม จะอนมานหรอสรประดบคะแนนในภาพรวมของโรงแรมได ซงนยมเขยนแสดงความสมพนธอยในรปของ ถา-แลว (If-Then) อาท “If Location=Good Then Hotel=Good”

ในการคำานวณระดบคะแนนในภาพรวมโดยใช

ตรรกศาสตรคลมเครอน ผวจยไดสรางกฎขนมาจำานวน ทงสน 395 กฎ แบงเปนกฎของฟซซเซตเรองหองนำา 40 กฎ หองพก 135 กฎ การบรการ 25 กฎ และภาพรวม ของทงโรงแรม 195 กฎ ซงกฎของฟซซเซตแตละเรองน จะมการใหคานำาหนกของแตละกฎทแตกตางกนไป โดยการกำาหนดนำาหนกของแตละกฎจะเปนไปตามแนวคดทวา “คณสมบตของโรงแรมทกำ�หนดในแตละกฎนน

สอดคลองกบระดบคะแนนในภ�พรวมของทงโรงแรม

ม�กนอยเพยงไร” ตวอยางเชน เมอนกทองเทยววจารณวาโรงแรมนมทำาเลทตงด (คดเปนระดบ 4 คะแนน) แตคะแนนในภาพรวมของบทวจารณถกกำาหนดวาโรงแรมน ไดเพยงระดบท 1 คอแยมาก แสดงวาคณสมบตเรองทำาเลทตงสอดคลองกบระดบคะแนนในภาพรวมของทงโรงแรมนอยมาก คานำาหนกของกฎเรองทำาเลทตงจงควรกำาหนดใหเหมาะสม ในทนคานำาหนกของกฎจะกำาหนดใหมคา 3 คา คอ 0.1, 0.5 และ 1 ซงคานำาหนกมาก (เทากบ 1) หมายถง การวจารณในเรองนนสอดคลองกบระดบคะแนนในภาพรวมมาก คานำาหนกปานกลาง (เทากบ 0.5) หมายถง การวจารณในเรองนนสอดคลองกบระดบคะแนนในภาพรวมปานกลาง และคานำาหนกนอย (เทากบ 0.1) หมายถง การวจารณในเรองนนสอดคลองกบระดบคะแนนในภาพรวมนอย

โดยการพจารณาวาคณสมบตตางๆ สอดคลองกบระดบคะแนนในภาพรวมของทงโรงแรมมากนอยเพยงไร จะไดมาจากการวเคราะหการใหคะแนนของกลมตวอยาง

รปท 5 การแบงกลมสมาชกตวแปรระดบคะแนน

รปท 5 การแบงกลมสมาชกตวแปรระดบคะแนน

Page 8: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

370

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

ซงกคอบทวจารณทสมเกบมาจากเวบไซต TripAdvisor.com จำานวน 100 บทวจารณ โดยมระดบความพงพอใจในภาพรวมของทงโรงแรมตามทนกทองเทยวใหคะแนนแตกตางกน 5 ระดบคะแนน จำานวนระดบคะแนนละ 20 บทวจารณ โดยพจารณาวา คะแนนเฉลยในเรอง ตางๆ ทนกทองเทยวกำาหนดใหในแตละระดบ มความใกลเคยงกบคะแนนในภาพรวมของทงโรงแรม กระดบ

ในตารางท 1 เปนขอมลการใหคะแนนของนกทองเทยว จากกลมตวอยางบทวจารณ ในเรองทำาเลทตง พบวา ม 3 บทวจารณทกลาวถงทำาเลทตงของโรงแรมระดบท 1 โดยนกทองเทยวใหคะแนนในภาพรวมของทงโรงแรมแยมาก (ระดบท 1) แตวจารณวาโรงแรมนนมทำาเลท ตงด (โดยเฉลย 3 บทวจารณไดระดบคะแนนเฉพาะเรองทำาเลทตง 4 คะแนน) เปนตน

ตารางท 1 ตวอยางการใหคะแนนของนกทองเทยวในเรองทำาเลทตง จากกลมตวอยางบทวจารณ

ระดบคะแนนในภาพรวมของทงโรงแรม

ระดบคะแนนเรองทำาเลทตง

ระดบท 1 พบการวจารณ 3 ครง(คะแนนเฉลย 4 คะแนน)

ระดบท 2 พบการวจารณ 6 ครง(คะแนนเฉลย 4 คะแนน)

ระดบท 3 พบการวจารณ 10 ครง(คะแนนเฉลย 4.4 คะแนน)

ระดบท 4 พบการวจารณ 13 ครง(คะแนนเฉลย 4.31 คะแนน)

ระดบท 5 พบการวจารณ 7 ครง(คะแนนเฉลย 4.57 คะแนน)

จากตารางท 1 แสดงใหเหนวา ผใชใหคะแนนในเรองทำาเลทตงมความใกลเคยงกบคะแนนในภาพรวมของทงโรงแรมจำานวน 2 ระดบ (คอ ระดบ 4 และระดบ 5) แตในระดบ 1, 2 และ 3 มความแตกตางกบการวจารณเรองทำาเลทตง ตามเกณฑความใกลเคยงทกำาหนดไวในตารางท 2

ตารางท 2 เกณฑการพจารณาความใกลเคยงระหวางระดบคะแนนในเรองตางๆ กบระดบคะแนนในภาพรวมของทงโรงแรม

เกณฑความใกลเคยง

คะแนนเฉลย 1.00-1.99 กำาหนดวาใหใกลกบระดบท 1

คะแนนเฉลย 1.01-2.99 กำาหนดวาใหใกลกบระดบท 2

คะแนนเฉลย 2.01-3.99 กำาหนดวาใหใกลกบระดบท 3

คะแนนเฉลย 3.01-4.99 กำาหนดวาใหใกลกบระดบท 4

คะแนนเฉลย 4.01-5.00 กำาหนดวาใหใกลกบระดบท 5

จากการพจารณาวา คะแนนเฉลยในเรองตางๆ มความใกลเคยงกบคะแนนในภาพรวมของทงโรงแรมกระดบ จะนำามาคำานวณเปนรอยละความนาจะเปนของการวจารณเรองนนๆ วาสอดคลองกบระดบคะแนนในภาพรวมของทงโรงแรมเทาใด ซงจากการวเคราะหเรองทำาเลทตงจะไดวามคาความนาจะเปนเพยง 40% (2/5*100) เนองจาก มความใกลเคยงเพยง 2 ระดบจาก 5 ระดบ

จากนนจงนำาคารอยละความนาจะเปนดงกลาว มาแปลงเปนคานำาหนกของกฎตามเกณฑทแสดงในตารางท 3

ตารางท 3 เกณฑการพจารณาคานำาหนกจากรอยละความนาจะเปนทการวจารณเฉพาะเรองหนงๆ จะสงผลตอระดบคะแนนในภาพรวม

รอยละความนาจะเปน คานำาหนกของกฎ

มากกวาหรอเทากบ 80% 1

มากกวาหรอเทากบ 50% 0.5

นอยกวา 50% 0.1

ในตารางท 4 เปนตวอยางของกฎตรรกศาสตรคลมเครอ 13 กฎจากทงหมด 395 กฎ ซงสงเกตเหนวาแตละกฎมตวแปรนำาเขาเพยงตวแปรเดยว เนองจากการวจยนไดสรางกฎโดยแยกพจารณาการสอดคลองกบระดบคะแนนในภาพรวมของทงโรงแรมเปนเรองๆ ทำาใหแตละเรองมคานำาหนกของกฎเฉพาะของตนเอง และอาจไมเทากบเรองอนๆ ดงนน จงไดสรางกฎแตละกฎใน

Page 9: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

371

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

รปท 7 ตวอยางการคานวณระดบคะแนนในภาพรวม

ของเรองหองพก เมอคะแนนเรองเครองปรบ อากาศเปน 4 คะแนน และเรองผาปเตยงเปน 2 คะแนน

ลกษณะทมตวแปรนำาเขาเพยงตวแปรเดยว เพอใหกฎ ทไดมความเหมาะสมตอการใชงานดานการวเคราะห บทวจารณมากทสด

ตารางท 4 ตวอยางกฎตรรกศาสตรคลมเครอทใชในการคำานวณระดบคะแนนในภาพรวม

Rules If Then Weightกฎทใชคำานวณคะแนนในภาพรวมของโรงแรม

1 Room = Average Hotel = Average 1

2 Room = Good Hotel = Good 1

3 Service = Poor Hotel = Poor 1

4 Bathroom = Average Hotel = Average 1

5 Value = Excellent Hotel = Excellent 0.5

6 Location = Excellent Hotel = Excellent 0.1กฎทใชคำานวณคะแนนในรายละเอยดของโรงแรม

7 AirCondition = Good Room = Good 1

8 Bedsheet = Bad Room = Bad 0.5

9 TVSet = Average Room = Average 0.1

10 Employee = Poor Service = Poor 0.5

11 Reception = Excellent Service = Excellent 0.1

12 Bathtub = Terrible Bathroom = Terrible 0.5

13 Toilet = Good Bathroom = Good 0.1

• สวนกลไกการอนมาน (Inference Engine) เปนสวนทใชวนจฉยเพอตดสนใจระดบคะแนนในภาพรวมตามกฎทมอยแบบลำาดบชน ซงจากกฎและนำาหนกทไดในฐานกฎฟซซจะนำามาใชเปนเกณฑการคำานวณระดบคะแนนในภาพรวม โดยพจารณาระดบคะแนนของทกเรองในชนกอนหนาเปนขอมลนำาเขา และระดบคะแนนในภาพรวมเปนขอมลผลลพธ โดยในลำาดบชนแรกกลไกการอนมานจะพจารณาระดบคะแนนในภาพรวมจากกฎของฟซซเซตในกลมเรองหองนำา หองพก และการบรการกอน จากนนจงนำาระดบคะแนนในภาพรวมทไดจากลำาดบชนแรกนมาหาคาคะแนนในภาพรวมของทงโรงแรมตอไป

ในกลไกการอนมาน หากคะแนนทเปนขอมลนำาเขามการเปลยนแปลง คะแนนของขอมลผลลพธกจะเปลยนตามไปดวย ทงน การเปลยนแปลงจะเกดขนมากหรอนอยขนอยกบนำาหนกของกฎทเกยวของกบขอมลผลลพธนน

ตวอยางเชน การคำานวณหาระดบคะแนนในภาพรวมของหองพกทพจารณาจากขอมลนำาเขา คอคะแนนของเครองปรบอากาศ (AirCondition) จำานวน 4 คะแนน และ ผาปเตยง (Bedsheet) จำานวน 2 คะแนน เมอนำามาอนมานจะไปเรยกใชกฎท 7 และกฎท 8 ดงแสดงใน รปท 6 จะเหนไดวากฎท 7 “If AirCondition = Good Then Room = Good” มคานำาหนกเทากบ 1 ทำาใหระดบ ความเปนสมาชกของ “Room=Good” มคาสงสด ดงแสดง ในภาพดานขวาของรปท 6 ในขณะทกฎท 8 “If Bedsheet = Bad Then Room = Bad” มคานำาหนกเทากบ 0.5 ทำาให ระดบความเปนสมาชกของ “Room=Bad” มคาเพยงครงหนง เปนตน

• สวนดฟซซฟเคชน (Defuzzification) เปนสวนท รวมผลลพธทไดจากการทำางานของกฎตางๆ และแปลงใหเปนระดบคะแนนในภาพรวม โดยในงานวจยนเลอกใชวธเซนทรอยด (Centroid of Area Method: COA) [15] ในการคำานวณระดบคะแนนในภาพรวม ยกตวอยาง การคำานวณระดบคะแนนในภาพรวมของเรองหองพก จากการพจารณาจากคะแนนของเครองปรบอากาศจำานวน 4 คะแนน และผาปเตยงจำานวน 2 คะแนน จะไดผลลพธคอ หองพกมระดบคะแนนเทากบ 3.14 คะแนน จากการรวมผลลพธของกฎท 7 และกฎท 8 ดงแสดงในรปท 7

รปท 6 ตวอยางการอนมานคาผลลพธ เมอคานำาหนกของกฎเปน 1 และ 0.5

รปท 6 ตวอยางการอนมานคาผลลพธ เมอคานาหนก

ของกฎเปน 1 และ 0.5

รปท 7 ตวอยางการคำานวณระดบคะแนนในภาพรวมของเรองหองพก เมอคะแนนเรองเครองปรบ อากาศเปน 4 คะแนน และเรองผาปเตยงเปน 2 คะแนน

Page 10: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

372

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

ทงน เมอนำาระดบคะแนนในเรองหองพกจำานวน 3.14 คะแนน มาคำานวณหาระดบคะแนนในภาพรวมของทงโรงแรม โดยพจารณาจากคะแนนของการบรการจำานวน 2 คะแนน และเรองทำาเลทตงจำานวน 5 คะแนนรวมดวย จะไดผลลพธเปนคะแนนในภาพรวมของทงโรงแรมมคา 2.78 คะแนน ดงแสดงในรปท 8 ทงน จะสงเกตเหนวาระดบคะแนนในเรองทำาเลทตงสอดคลองกบคะแนนในภาพรวมของทงโรงแรมนอยมาก เนองจากคานำาหนกของกฎในเรองนมคาเพยง 0.1 ตามกฎท 6 ในตารางท 4 ซงแตกตางจากกฎท 1-3 ทมคานำาหนกของกฎสงสดคอ 1

2.5 สวนอธบายความร เปนการแปลงความรทอยในฐานความรใหอยใน

รปแบบทผใชสามารถเขาใจไดงายและชดเจนมากยงขน โดยความรของระบบจะแสดงเปนกราฟตนไมของโรงแรมแหงหนงตามรายละเอยดของโรงแรมทนกทองเทยวไดแสดงความคดเหนไว และแบงตามหมวดหมทไดกำาหนด เชน ทำาเลทตง การบรการ รายละเอยดของการบรการ หองพก และรายละเอยดของทพก เปนตน โดยการแบงหมวดหมดงกลาวไดมาจากงานวจยทไดศกษาความ พงพอใจของนกทองเทยว [16]-[19] นอกจากน กราฟตนไม ยงแสดงระดบคะแนนและจำานวนคำาวจารณของเรองตางๆ ทสกดไดอยางเปนลำาดบชน โดยระบบจะแสดงผลระดบคะแนนโดยรวมเปนรปดาวในจำานวนทแตกตางกนตามเศษทศนยม ซงหากเศษทศนยมมคาอยในชวง 0.00-0.24 จะแสดงรปดาวจำานวนเทากบจำานวนเตมของระดบคะแนน

ทคำานวณได หากเศษทศนยมมคาอยในชวง 0.25-0.74 จะแสดงรปดาวจำานวนเทากบจำานวนเตมของระดบคะแนนทคำานวณได และเพมรปดาวอกครงดวง และหากเศษทศนยมมคาอยในชวง 0.75-0.99 จะแสดงรปดาวจำานวนเพมขน 1 ดวงจากจำานวนเตมของระดบคะแนนทคำานวณได ตวอยางการแสดงผลระดบคะแนนโดยรวมเปน รปดาว เมอจำานวนเตมของระดบคะแนนทงโรงแรมเทากบ 4 คะแนนแสดงดงตารางท 5

ตารางท 5 ตวอยางการแสดงผลระดบคะแนนเปนรปดาว เมอจำานวนเตมของระดบคะแนนทงโรงแรมเทากบ 4 คะแนน

เศษทศนยม จำานวนรปดาวทแสดง

4.00-4.24 4.25-4.74 4.75-4.99

จากรปท 9 ไดแสดงรายละเอยดของโรงแรมแหงหนงวาเปนโรงแรม 3 ดาว (ระดบคะแนน 2.78) และมการวจารณของผทเคยไปมาแลวทงหมด 255 คำาวจารณ โดยระดบคะแนน 2.78 นนเกดจากการแสดงความคดเหนในดานตางๆ ไดแก 1) ทำาเลทตง 5 คะแนน จาก 100

รปท 9 ตวอยางการแสดงผลความรทสกดได

1=Terrible 2=Poor 3=Average 4=Good 5=Excellent

รปท 9 ตวอยางการแสดงผลความรทสกดได

รปท 8 ตวอยางการคำานวณระดบคะแนนในภาพรวมของทงโรงแรม เมอคะแนนเรองหองพกเปน 3.14 คะแนน เรองการบรการเปน 2 คะแนน และเรองทำาเลทตงเปน 5 คะแนน

รปท 8 ตวอยางการคานวณระดบคะแนนในภาพรวม

ของทงโรงแรม เมอคะแนนเรองหองพกเปน 3.14 คะแนน เรองการบรการเปน 2 คะแนน และเรองทาเลทต งเปน 5 คะแนน

Page 11: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

373

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

คำาวจารณ 2) การบรการ 2 คะแนน จาก 100 คำาวจารณ และ 3) หองพก 3.14 คะแนน จาก 55 คำาวจารณ ซงการ อธบายดวยกราฟเพอแสดงรายละเอยดของโรงแรมน จะเปนประโยชนอยางยงตอการตดสนใจเลอกโรงแรมใหตรงกบความตองการของนกทองเทยวไดมากทสด

3. การทดสอบระบบ3.1 สภาพแวดลอมในการทดสอบระบบ

ในการประเมนความถกตองของการสกดความร ขอมลทนำามาทดสอบจะเปนคนละชดกบขอมลทนำามาใชในการสรางขนตอนวธในการสกดความร โดยผวจยไดสมเกบบทวจารณจำานวน 100 บทวจารณ จากโรงแรมจำานวน 5 โรงแรมซงอยในระดบความพงพอใจตามท ผใชใหคะแนนตางกน 5 ระดบ (ระดบท 1-5) จำานวนระดบละ 20 บทวจารณ จากเวบไซต TripAdvisor.com

โดยทวไป งานวจยทางดานการสบคนสารสนเทศ (Information Retrieval) จะจำาแนกขอมลออกเปน 4 กลมเพอใชในการประเมนผล แตในทนไดนำามาประยกตใชกบการสกดสารสนเทศ ซงจะมประเภทของขอมลทใชเพอประเมนผลดงแสดงในตารางท 6 อนไดแก ขอมลทสามารถสกดไดและมความเกยวของ (True Positive: TP) ขอมลทสามารถสกดไดแตไมมความเกยวของ (False Positive: FP) ขอมลทไมสามารถสกดไดและไมมความเกยวของ (True Negative: TN) และขอมลทไมสามารถสกดไดแตมความเกยวของ (False Negative: FN) [20]

ตารางท 6 ขอมล 4 ประเภททแตกตางกนตามความ เกยวของและการสกดได

ขอมลท

มความเกยวของ (+)ขอมลท

ไมมความเกยวของ (-)

ขอมลท

สกดได (+)TP FP

ขอมลท

สกดไมได (-)FN TN

ในการทดสอบความรทสกดไดจากระบบ ผลการ

ทดสอบจะพจารณาถงคามาตรฐานทวไปทใชในการประเมน

ความถกตองของการสกดสารสนเทศ รวมทงพจารณาถงระดบคะแนนในภาพรวมของทงโรงแรมทระบบสกดได การทดสอบแบงออกเปน 3 ประเดน ไดแก

ประเดนท 1 การทดสอบความถกตองในการสกดความรแบบอตโนมตทไดพฒนาขนมา โดยใชวธวด คามาตรฐานในการประเมนความถกตอง 3 คา ไดแก คาความถกตอง (Accuracy) คาความแมนยำา (Precision) และคาความระลก (Recall) โดยมสตรดงสมการท 2, 3 และ 4 ตามลำาดบ [20] ซงวตถประสงคของการทดสอบในประเดนนคอเพอประเมนความถกตองของขนตอนวธการสกดความรทไดพฒนาขน

(2)

(3)

(4)

ประเดนท 2 การทดสอบความใกลเคยงของระดบคะแนนในภาพรวมของทงโรงแรมทระบบสกดไดกบท นกทองเทยวกำาหนด กรณ ระบบนำาเทคนคตรรกศาสตรคลมเครอมาใชในการคำานวณระดบคะแนน ซงวตถประสงคของการทดสอบในประเดนนคอเพอเปรยบเทยบความใกลเคยงของระดบคะแนนในภาพรวมของทงโรงแรมทระบบคำานวณได โดยใชระดบคะแนนทนกทองเทยวหรอผใชกำาหนดไวเปนเปาหมายในการวดความถกตองของระดบคะแนน

ประเดนท 3 การเปรยบเทยบระดบคะแนนทระบบ สกดได กรณ ใชตรรกศาสตรคลมเครอและไมใชตรรกศาสตรคลมเครอในการคำานวณระดบคะแนน ซงวตถประสงค ของการทดสอบในประเดนนคอเพอเปรยบเทยบความ ใกลเคยงของระดบคะแนนในภาพรวมของทงโรงแรมทระบบคำานวณได ระหวางกรณใชและไมใชเทคนคตรรกศาสตรคลมเครอ โดยนำาระดบคะแนนทนกทองเทยวหรอผใชกำาหนดไวมาเปนเปาหมายในการวดความถกตองของระดบคะแนน

Page 12: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

374

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

สำาหรบกระบวนการคำานวณระดบคะแนนในภาพรวมของระบบโดยใชเทคนคตรรกศาสตรคลมเครอจะดำาเนนการดงทไดกลาวมาแลวในหวขอท 2.4.2 แตสำาหรบกระบวนการคำานวณระดบคะแนนในภาพรวมของระบบโดยไมใชตรรกศาสตรคลมเครอจะใชวธการหาคาเฉลยของระดบคะแนนเฉพาะเรองทกเรองทนกทองเทยววจารณ ดงสมการท 5

(5)

โดยท Overall Score หมายถงระดบคะแนนในภาพรวมของทงโรงแรม Scorei หมายถงระดบคะแนนในเรองวจารณท i และ n หมายถงจำานวนเรองทงหมดทวจารณ

3.2 ผลการทดสอบและการอภปรายผลจากการจำาลองสภาพแวดลอมเพอทดสอบระบบ

สามารถอภปรายผลโดยแยกเปนประเดนดงทกลาวมาแลว ดงน

ประเดนท 1 การทดสอบความถกตองโดยวธวดคามาตรฐานในการประเมน สามารถจำาแนกขอมลผลการทดสอบออกเปน 4 กลม ดงปรากฏในตารางท 7

ตารางท 7 จำานวนขอมลทนำามาใชในการประเมนผล

ระดบขอมลทใชประเมนผล

TP FP FN TN

1 21 0 13 78

2 41 0 8 83

3 34 0 11 46

4 38 0 15 52

5 20 0 4 54

โดยรวม 154 0 51 313

จากจำานวนขอมลขางตนสามารถนำามาคำานวณคา

มาตรฐานในการวดความถกตองไดดงรปท 10 ซงอธบายไดวาระบบทนำาเสนอมคาความถกตองของการสกดความร

เทากบ 90.15% คาความแมนยำาเทากบ 100% และคาความระลกเทากบ 75.12% โดยสาเหตททำาใหคาความแมนยำา (Precision) ของทกระดบความพงพอใจมคาเทากบ 100% เสมอ เนองจากการศกษาครงนไดสกดความร โดยใชออนโทโลยทมจำานวนคำาศพทคงทและมความ เกยวของเฉพาะกบเรองโรงแรมเทานน ดงนน ขอมลทไมมความเกยวของกบเรองดงกลาวจงไมถกสกดออกมา ทำาใหคา FP ในทกระดบเปน 0 สวนสาเหตทคาความระลกในระดบความพงพอใจท 1 มคานอยทสด เนองจาก ในบทวจารณระดบท 1 นน ผใชสวนใหญจะวจารณในลกษณะบรรยายหลายประโยคมากกวาการกลาวถงเรองทไมพอใจโดยตรงเพยงประโยคเดยว ทำาใหกระบวนการสกดความรททำาทละประโยคดงทนำาเสนอในงานวจยน ไมสามารถสกดไดอยางถกตอง เมอเปรยบเทยบกบบทวจารณในระดบความพงพอใจอนๆ ทผใชมกจะวจารณอยางตรงไปตรงมา จงทำาใหการสกดทละประโยคมความถกตองมากกวา [21]

ประเดนท 2 การทดสอบความใกลเคยงของ

ระดบคะแนนทระบบสกดไดกบระดบคะแนนท

นกทองเทยวกำาหนด กรณ นำาเทคนคตรรกศาสตร

คลมเครอมาใชในการคำานวณระดบคะแนน สามารถอธบายไดวา ระดบคะแนนเฉลยทระบบสกดไดกบระดบคะแนนทผใชกำาหนดมความแตกตางกน 0.06 คะแนน

รปท 10 แผนภมสรปผลคามาตรฐานในการประเมน

ความถกตองของการสกดความร

88.39 93.94 87.91 85.71 94.87 90.15100 100 100 100 100 100

61.7683.67 75.56 71.70

83.33 75.12

0.0020.0040.0060.0080.00100.00

คาความ

ถกตอ

ง (%)

ระดบความพงพอใจ

Accuracy Precision Recall

รปท 10 แผนภมสรปผลคามาตรฐานในการประเมน ความถกตองของการสกดความร

Page 13: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

375

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

(3.06-3.00) ในขณะทเมอพจารณาแยกตามกลมระดบ คำาวจารณพบวา ระดบความพงพอใจท 3 มคาแตกตางนอยทสด 0.01 คะแนน (2.99-3.00) และระดบความพงพอใจท 1 มคาแตกตางมากทสดคอ 0.64 คะแนน (1.64-1.00) ดงแสดงในรปท 11

สำาหรบสาเหตททำาใหระดบความพงพอใจท 1 มคาคะแนนแตกตางจากทผใชกำาหนดมากทสด นอกจากจะเนองมาจากเหตผลประการเดยวกบทกลาวมาแลวในประเดนท 1 ยงเกดจากการทระดบคะแนนของคำาศพทในฐานความรทระบบนำามาใชคำานวณเปนคะแนนเฉพาะเรองนน เปนระดบคะแนนทไดจากการยนยนของผเชยวชาญดานภาษา ซงในความเปนจรงแลว ผใชงานแตละคนอาจใชคำาศพทในการแสดงความคดเหนทไมสอดคลองกบระดบคะแนนทไดจากการยนยนของผเชยวชาญ จงทำาให ระดบคะแนนทระบบสกดไดมความแตกตางจากทผใชกำาหนด ดงจะเหนไดชดเจนในระดบความพงพอใจท 1 น ซงพบวาระดบคะแนนเฉพาะเรองสวนใหญทระบบคำานวณ ไดมคาเทากบ 2 คะแนน อนมความหมายใกลเคยงกบ ระดบคะแนนเทากบ 1 ดงนน เมอนำาคะแนนทงหมดมา คำานวณรวมกน จงทำาใหคาระดบคะแนนทไดมแนวโนม เขาใกล 2 คะแนนมากกวา 1 คะแนน ดวยเหตน ระดบคะแนนทระบบสกดไดจงมความแตกตางจากทผใชกำาหนดมาก

ประเดนท 3 การเปรยบเทยบระดบคะแนน

ทระบบสกดได กรณ ใชตรรกศาสตรคลมเครอและ

ไมใชตรรกศาสตรคลมเครอในการคำานวณระดบ

คะแนน จากรปท 11 สามารถอธบายไดวา ระดบคะแนนเฉลยทระบบสกดไดในกรณไมใชตรรกศาสตรคลมเครอ ในการคำานวณระดบคะแนน กบระดบคะแนนทผใช กำาหนดมความแตกตางกน 0.14 คะแนน (3.14-3.00) ซงเมอเปรยบเทยบกบกรณนำาเทคนคตรรกศาสตร คลมเครอมาใชจะเหนไดวาระดบคะแนนกรณไมใชตรรกศาสตรคลมเครอมความแตกตางกบความพงพอใจของนกทองเทยวมากกวา นอกจากน เมอพจารณาแยกตามกลมระดบคำาวจารณพบวา ระดบความพงพอใจท 3 มคาแตกตางนอยทสดคอ 0.19 คะแนน (3.19-3.00) และ

รปท 11 แผนภมสรปผลคาระดบคะแนนทระบบสกดไดกบระดบคะแนนทผใชกำาหนด

ระดบความพงพอใจท 1 มคาแตกตางมากทสดคอ 0.69 คะแนน (1.69-1.00) เชนเดยวกบกรณนำาเทคนคตรรกศาสตรคลมเครอมาใช ทงน เมอนำาทงสองกรณ มาเปรยบเทยบกนโดยพจารณาแยกตามกลมระดบ คำาวจารณ สามารถอธบายไดวากรณนำาเทคนคตรรกศาสตรคลมเครอมาใชทำาใหไดระดบคะแนนทมความใกลเคยงกบความพงพอใจของผใชมากกวากรณไมใชเทคนคตรรกศาสตรคลมเครอ ดงจะเหนไดจากระดบความพงพอใจ ท 1-3 และ 5 (0.64-0.69, 0.54-0.56, 0.01-0.19 และ 0.47-0.5 ตามลำาดบ)

สำาหรบสาเหตททำาใหระดบ 4 ในกรณนำาตรรกศาสตรคลมเครอมาใชมคาคะแนน 3.61 แตกตางจากความพงพอใจ ของนกทองเทยว 0.39 คะแนน ซงมากกวากรณไมนำาเทคนคตรรกศาสตรคลมเครอมาใชทมคาคะแนน 3.74 และแตกตางเพยง 0.26 คะแนน เนองมาจากคำาวจารณสวนใหญในระดบนเปนคำาวจารณในเรองทำาเลทตง ซงผวจยไดกำาหนดคานำาหนกของกฎตรรกศาสตร คลมเครอทใชในการคำานวณระดบคะแนนไวเปนจำานวนนอย ดงแสดงในกฎท 6 ของตารางท 4 จงทำาใหการวจารณถงเรองทำาเลทตงสอดคลองกบระดบคะแนนในภาพรวมนอยมาก แตในขณะทการวจารณทพบในระดบนกลาวถงทำาเลทตงเปนจำานวนมาก ดวยเหตน เมอคำานวณคะแนนในภาพรวมจงทำาใหระดบความพงพอใจท 4 กรณ

รปท 11 แผนภมสรปผลคาระดบคะแนนทระบบสกดได

กบระดบคะแนนทผใชกาหนด

1.642.54

2.993.61

4.53

3.06

1.692.56

3.193.74

4.50

3.14

0

1

2

3

4

5

คาระด

บคะแน

นทระบ

บสกด

ได (คะ

แนน)

ระดบความพงพอใจ

ใชตรรกศาสตรคลมเครอ ไมใชตรรกศาสตรคลมเครอ

Page 14: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

376

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013

นำาเทคนคตรรกศาสตรคลมเครอมาใชมคาคะแนนแตกตางจากความพงพอใจของนกทองเทยวมากกวากรณไมนำาเทคนคตรรกศาสตรคลมเครอมาใช

จากการทดสอบเปรยบเทยบคาระดบคะแนนทระบบสกดไดในประเดนท 2 และ 3 ดงกลาวขางตน สามารถสรปไดวา การนำาเทคนคตรรกศาสตรคลมเครอมาใชในการคำานวณ ทำาใหไดผลลพธทใกลเคยงกบนกทองเทยวหรอผใชกำาหนดมากกวาวธการแบบดงเดมทไมนำาเทคนคตรรกศาสตรคลมเครอมาใช ซงถอวาเปนวธการทเหมาะสม และสอดรบกบวตถประสงคของงานวจยทางดานการประมวลผลภาษาธรรมชาต ทงน เนองจากการคำานวณโดยใชเทคนคตรรกศาสตรคลมเครอไดมการกำาหนด คานำาหนกทเหมาะสมใหกบแตละกฎของคณสมบตของโรงแรม ทำาใหระดบคะแนนในภาพรวมทคำานวณไดมความสอดคลองใกลเคยงกบทนกทองเทยวหรอผใชกำาหนดมากทสด

4. สรปงานวจยนไดพฒนาระบบสกดความรแบบอตโนมต

จากบทวจารณออนไลนของนกทองเทยว โดยนำาตรรกศาสตรคลมเครอมาใชในการคำานวณระดบคะแนนจากบทวจารณของผใช เพอใหผลลพธมความใกลเคยงกบความพงพอใจของนกทองเทยวมากทสด ในการพฒนาระบบนน ผวจยไดสรางเวบไซตเพอจดเกบบทวจารณในฐานขอมล พรอมทงประมวลผลทไดจากการสกดความรใหอยในรปแบบทผใชสามารถนำาความรเหลานนไปใชประกอบการตดสนใจไดทนท ผลการทดสอบพบวา ระบบทนำาเสนอมคาความถกตองของการสกดความรเทากบ 90.15% คาความแมนยำาเทากบ 100% คาความระลกเทากบ 75.12% และคาระดบคะแนนของคำาวจารณโดยรวมแตกตางจากทนกทองเทยวกำาหนดเทากบ 0.06 คะแนน

สำาหรบแนวทางในการพฒนางานวจยตอไปใน อนาคต จะเหนไดวาในการสกดความรแบบอตโนมตนน จำาเปนตองบำารงรกษาฐานความรใหมความสมบรณและเปนปจจบนอยเสมอ เพอนำามาประกอบการพฒนาระบบใหผลลพธมความถกตองมากทสด เชน การเพมเตม

คำาศพทใหมากขน ทงในสวนของคำาทมความหมายเหมอนกนแตเขยนตางกน คำาคณศพท คำากรยาวเศษณ รวมทงออนโทโลย และไวยากรณทใชในทฤษฎไวยากรณ ไมพงบรบท เนองจากขอมลเหลานลวนเปนแหลงทรพยากรความรทสงผลตอการคำานวณระดบคะแนนและการสกดความรทงสน

ระบบสกดความรแบบอตโนมตทนำาเสนอนจะมประโยชนอยางยง หากผประกอบการธรกจอเลกทรอนกสนำาไปประยกตใชเกบและวเคราะหความคดเหนของ นกทองเทยวเกยวกบสนคาและบรการ แลวนำาขอมล เหลานนมาพฒนาสนคาหรอบรการของตนเองให ตอบสนองความตองการของนกทองเทยวใหมากทสด นอกจากนระบบจะชวยใหนกทองเทยวสามารถนำาความรในเรองทสกดไปใชประกอบการตดสนใจไดอยางสะดวกและรวดเรวอกดวย

เอกสารอางอง

[1] M. G. Miniwatts. (2010, Dec. 7). World Internet Usage and Population Statistics. [Online]. Available : http://www.internetworldstats. com/stats3.htm

[2] World Tourism Organization, Yearbook of Tourism Statistics: Data 2001-2005 the 59th Edition, Madrid: WTO, 2007, pp. 8-9.

[3] P.D. Turney, “Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews,” in Proc. the 40th Annual Meeting of the Association for Computational Linguistics, 2002, pp. 417-424.

[4] M. Taboada and J. Grieve, “Analyzing Appraisal Automatically,” in Proc. the AAAI Spring Symposium, 2004, pp. 158-161.

[5] B. Whitman and D. Ellis, “Automatic Record Reviews,” in Proc. the 5th International Society for Music Information Retrieval, 2004, pp. 470-477.

Page 15: ระบบสกัดความรู้จากบทวิจารณ์โรงแรมออนไลน์โดยใช้ตรรกศาสตร์ ... · tourist

377

The Journal of KMUTNB., Vol . 23, No. 2 , May. - Aug. 2013วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 23 ฉบบท 2 พ.ค. - ส.ค. 2556

[6] K. Zhang, R. Narayanan, and A. Choudhary, “Voice of the Customers: Mining Online Customer Reviews for Product Feature-Based Ranking,” in Proc. the 3rd conference on Online social networks (WOSN’10), 2010, pp. 11.

[7] V. Ramkumar, S. Rajasekar, and S. Swamynathan, “Scoring Products from Reviews through Application of Fuzzy Techniques,” Expert Systems with Applications, vol. 37(10), pp. 6862-6867, Oct. 2010.

[8] M. Hu and B. Liu, “Mining and Summarizing Customer Reviews,” in Proc. the 2004 ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2004, pp. 168-177.

[9] T.L. Saaty, Fundamentals of Decision Making and Prority Theory with the Analytic Hierarchy Process. (2nd edition), Pittsburgh, PA: RWS, 2006, pp. 4-5.

[10] P. Kitwatthanathawon., T. Angskun, and J. Angskun, “An Automatic Knowledge Extraction System from Traveler Reviews,” in Proc. the 2nd ECTI-Conference on Application Research and Development, 2010, pp. 349-354 (in Thai).

[11] K. Siorpaes, K. Prantner, and D. Bachlechner. (2009, Jan.15). “Class Hierarchy for the e-Tourism Ontology Version 8.” [Online]. Available : http://e-tourism.deri.at/ont/.

[12] G. Salton and C. Buckley, “Term Weighting Approaches in Automatic Text Retrieval,” Information Processing and Management, vol. 24(5), pp. 513-523, 1988.

[13] J. Fry, Linguistics 165 Class Lecture, Topic: “Context-Free Grammars for English,” San José State University, Spring 2004.

[14] H.T. Nguyen and E.A. Walker, A First Course in Fuzzy Logic (2nd ed.), Boca Raton, FL: Chapman & Hall, 2000. pp. 56.

[15] J.-S. R. Jang, C.-T. Sun, and E. Mizutani, Neuro- Fuzzy and Soft Computing: A computational approach to learning and machine intelligence, Upper Saddle River, NJ: Prentice Hall, 1997, pp. 75.

[16] T-K. Hsu, Y-F. Tsai, and H-H Wu, “The Preference Analysis for Tourist Choice of Destination: A Case Study of Taiwan,” Tourism Management, vol. 30(2), pp. 288–297, April 2009.

[17] M.F. Cracolici and P. Nijkamp, “The Attractiveness and Competitiveness of Tourist Destinations: A Study of Southern Italian Regions,” Tourism Management, vol. 30(3), pp. 336–344, June 2009.

[18] C. G-Q. Chi and H. Qu, “Examining the Structural Relationships of Destination Image, Tourist Satisfaction and Destination Loyalty: An Integrated Approach,” Tourism Management, vol. 29(4), pp. 624-636, August 2008.

[19] I. R. Del Bosque and H. San Martin, “Tourist Satisfaction: A Cognitive-Affective Model,” Annals of Tourism Research, vol. 35(2), pp. 551–573, April 2008.

[20] D. Miao, Q. Duan, H. Zhang, and N. Jiao, “Rough Set Based Hybrid Algorithm for Text Classification,” Expert Systems with Applications, vol. 36(5), pp. 9168–9174, July 2009.

[21] P. Kitwatthanathawon, “The Development of an Automatic Knowledge Extraction System from Online Customer Reviews,” Master Thesis, School of Information Technology, Suranaree University of Technology, 2009 (in Thai).