12-วิไลพร final vol 3-2010 · 2011. 9. 22. ·...

10
514 วารสารวิชาการพระจอมเกล้าพระนครเหนือ ปีท20 ฉบับที3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010 รับเมื่อ 20 พฤศจิกายน 2552 ตอบรับเมื่อ 9 กรกฎาคม 2553 นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์ The Innovation of Multiple Relations Information Retrieval วิไลพร เลิศมหาเกียรติ 1 และ อนิราช มิ่งขวัญ 2 * 1 นักศึกษา ภาควิชาเทคโนโลยีสารสนเทศ คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้า พระนครเหนือ 2 ผู้ช่วยศาสตราจารย์ ภาควิชาเทคโนโลยีสารสนเทศ คณะเทคโนโลยีและการจัดการอุตสาหกรรม มหาวิทยาลัย เทคโนโลยีพระจอมเกล้าพระนครเหนือ * ผู้นิพนธ์ประสานงาน โทรศัพท์ 0-3721-7300 ต่อ 7077 E-mail: [email protected] บทคัดย่อ การพัฒนาอย่างรวดเร็วของเทคโนโลยีมีส่วนช่วย เพิ่มประสิทธิภาพของการค้นคืนสารสนเทศแต่ผู้ใช้ ยังคงต้องเผชิญกับข้อมูลปริมาณมหาศาลทั้งที่ตรงและ ไม่ตรงความต้องการ ในงานวิจัยนี้มุ่งที่นำเทคโนโลยี มาผสมผสานกับกรอบความรู้ในการจัดหมู่สารสนเทศ ของห้องสมุดมาพัฒนาเป็นเทคนิคการจัดหมู่ทศนิยมดิวอีแบบสหความสัมพันธ์ (Dewey Decimals Classification Multiple Relations – DDC-MR) การวิเคราะห์หมวดหมูแบบสหความสัมพันธ์เป็นแนวทางในการพัฒนาระบบ การค้นคืน ด้วยการนำกรอบความรู้การจัดหมู่ทศนิยม ดิวอี้มาใช้เป็นเครื่องมือในการแสดงความสัมพันธ์ของ สัดส่วนเนื้อหาของวัสดุสารสนเทศ นอกจากนี้รูปแบบทีพัฒนาขึ้นยังแสดงผลการค้นคืนที่มีความชัดเจนของ เนื้อหา และสามารถแสดงปริมาณเนื้อหาสารสนเทศใน แต่ละหมวดหมู่ที่มีอยู่จริงในห้องสมุด คำสำคัญ: การค้นคืนสารสนเทศ การจัดหมู่ทศนิยม ดิวอี้ การจัดหมู่ทศนิยมดิวอี้แบบสหความ สัมพันธ์ Abstract Rapid evolution of technology increases the efficiency of information retrieval, but users continue to face enormous amounts of results, both relevant and irrelevant with their need. In this research, we purpose to combine technology with knowledge of information classification scheme in library to develop technique Dewey Decimals Classification Multiple Relational (DDC-MR). Analysis multiple relationship is a way in the development of retrieval systems by using a framework of Dewey decimals classification scheme as a tool for presentation the relationship of the proportion of information. In addition, the development model would be showing the retrieval in the clarity of content and can display the amount of reality information of all categories in the library. Keywords: Information Retrieval, Dewey Decimals Classification, Dewey Decimals Classification Multiple Relations

Upload: others

Post on 29-Apr-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

514

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

แผนภมควบคมโดยการสมตวอยางแบบกลมลำดบ

รบเมอ 20 พฤศจกายน 2552 ตอบรบเมอ 9 กรกฎาคม 2553

นวตกรรมการคนคนสารสนเทศแบบสหความสมพนธ

The Innovation of Multiple Relations Information Retrieval

วไลพร เลศมหาเกยรต1 และ อนราช มงขวญ2*

1 นกศกษา ภาควชาเทคโนโลยสารสนเทศ คณะเทคโนโลยสารสนเทศ มหาวทยาลยเทคโนโลยพระจอมเกลา

พระนครเหนอ 2 ผชวยศาสตราจารย ภาควชาเทคโนโลยสารสนเทศ คณะเทคโนโลยและการจดการอตสาหกรรม มหาวทยาลย

เทคโนโลยพระจอมเกลาพระนครเหนอ * ผนพนธประสานงาน โทรศพท 0-3721-7300 ตอ 7077 E-mail: [email protected]

บทคดยอ การพฒนาอยางรวดเรวของเทคโนโลยมสวนชวย

เพมประสทธภาพของการคนคนสารสนเทศแตผใช ยงคงตองเผชญกบขอมลปรมาณมหาศาลทงทตรงและไมตรงความตองการ ในงานวจยนมงทนำเทคโนโลย มาผสมผสานกบกรอบความรในการจดหมสารสนเทศของหองสมดมาพฒนาเปนเทคนคการจดหมทศนยมดวอแบบสหความสมพนธ (Dewey Decimals Classification

Multiple Relations – DDC-MR) การวเคราะหหมวดหมแบบสหความสมพนธเปนแนวทางในการพฒนาระบบการคนคน ดวยการนำกรอบความรการจดหมทศนยมดวอมาใชเปนเครองมอในการแสดงความสมพนธของสดสวนเนอหาของวสดสารสนเทศ นอกจากนรปแบบทพฒนาขนยงแสดงผลการคนคนทมความชดเจนของเนอหา และสามารถแสดงปรมาณเนอหาสารสนเทศในแตละหมวดหมทมอยจรงในหองสมด

คำสำคญ: การคนคนสารสนเทศ การจดหมทศนยม

ดวอ การจดหมทศนยมดวอแบบสหความสมพนธ

Abstract

Rapid evolution of technology increases the

efficiency of information retrieval, but users continue

to face enormous amounts of results, both relevant

and irrelevant with their need. In this research, we

purpose to combine technology with knowledge of

information classification scheme in library to

develop technique Dewey Decimals Classification

Multiple Relational (DDC-MR). Analysis multiple

relationship is a way in the development of retrieval

systems by using a framework of Dewey decimals

classification scheme as a tool for presentation the

relationship of the proportion of information. In addition,

the development model would be showing the retrieval

in the clarity of content and can display the amount

of reality information of all categories in the library.

Keywords: Information Retrieval, Dewey Decimals

Classif ication, Dewey Decimals

Classification Multiple Relations

Page 2: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

515

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

แผนภมควบคมโดยการสมตวอยางแบบกลมลำดบ

1. บทนำ ในยคสงคมสารสนเทศปรมาณสารสนเทศทเพมขน

จำนวนมาก มเนอหาสารสนเทศทหลากหลาย มการ บรณาการ และมลกษณะเปนสาขาวชามากขน และไดถกบนทกในรปแบบทแตกตางกน มไดจำกดเพยง รปแบบหนงสอเทานน หากรวมถงวสดสารสนเทศหลากหลายรปแบบทเปนความรซงไดมการบนทกไวเพอใชในการตดสนใจ สงผลใหการกำหนดหมวดหมใหครอบคลมเนอหาทำไดยากขน แมวาจะมการกำหนด หวเรองเพอใหผใชเขาถงขอมล แตคำศพททใชกำหนดหวเรองสวนใหญเปนคำศพทควบคมทผใชทวไปไม คนเคย นอกจากนยงพบวาการคนคนสารสนเทศมไดมขอบเขตเพยงการมองหาสงใดสงหนงวาอยทใดเทานน แตรวมถงการประมวลความรทไดบนทกไว เนองจาก ผ ใชมความตองการสารสนเทศในระดบทลกถงตวเนอหาและขอมลทถกประมวลไวเพอการตดสนใจ

ปจจบนไดมการปรบระบบการคนคนสารสนเทศ ซงแตเดมดำเนนการโดยมนษยผมความเชยวชาญ ในการกำหนดหมวดหมเนอหาสารสนเทศปรบเปลยนเปนการนำเทคโนโลยมาชวยเพอความรวดเรวและ ความแมนยำในการคนคน เนองจากการวเคราะหหมวดหมโดยมนษยตองใชเวลา โดยเฉพาะในปจจบนหนงสอ และสอตางๆ เพมปรมาณอยางรวดเรวทำใหหองสมดหลายแหงประสบปญหาจดหมวดหมไมทนปรมาณหนงสอทเขามาในหองสมด (Back Log) และหองสมดจำนวนมากขาดบคลากรทมประสบการณและความชำนาญการ [1] ดงนนการปรบเปลยนกระบวนการทำงานใหทนกบปรมาณสารสนสนเทศทเพมขนอยางมหาศาลจงเปนสงจำเปนเพอสงถายสารสนเทศเหลานนไปยงผใชทมความตองการสารสนเทศในระดบลกกวาเดม ตลอดจนแกปญหาทกอใหเกดความรำคาญตอผใชทงในดานขนตอนการเขาถงสารสนเทศ และการคนคนวสดสารสนเทศทดทสดเพอนำเสนอผใช [2] ตลอดจนคนหาสารสนเทศทเกยวของเสนอแนะตอผใช เพอใหสามารถคนหาขอมลตอไปได [3]

ปจจบนมความพยายามพฒนาดานการคนคน

สารสนเทศอยางตอเนอง โดยสวนใหญเนประสทธภาพของกระบวนในการจดเกบ ความรวดเรวในการคนคน และนำเสนอผลการคนคนตามปรมาณการเรยกใช (Ranking) แตยงคงพบวามปจจยหลายประการท สงผลกระทบตอการเพมประสทธภาพของการคนคนสารสนเทศทตรงความตองการของผใช

ประการแรก ผใชสวนใหญนยมคนคนดวยการใชคำคน ซงมผใชอกจำนวนไมนอยทขาดความชำนาญในการใชคำคน มกจะใชคำคนทคอนขางสนโดยพมพเพยง 1-2 คำในการคนหาในแตละครง [4] - [6] ประกอบกบอลกอรทมในการใชคำคน ยงไมเออตอภาษาธรรมชาต (Natural Language) สงผลใหระบบสวนใหญนำเสนอผลการคนคนปรมาณมากทงทตรงความตองการและไมตรงความตองการของผใช

ประการทสองกระบวนการคนคนสวนใหญเนนการนำคำสำคญในสวนคำคนของผใช (Query) ไปเปรยบเทยบและคนหาคำสำคญในเอกสาร (Keywords

in Documents) เพอหาเอกสารทเกยวของ แลวนำแสดงผลคนคนเปนรายการสารสนเทศทมความเกยวของ ใหกบผใช ซงรายการเอกสารผลลพธทไดนนแมจะตรงกบคำคนของผใช แตมผลลพธจำนวนมากทมเนอหาทไมตรงตามความตองการของผใช

ประการทสามผลลพธทไดจากการคนคนซงมปรมาณมากทผใชยงคงตองเผชญ สงผลผใชตองสญเสยเวลาในการคดเลอกเอกสารทตรงความตองการ ซง ผใชเครองมอสบคนสวนใหญจะดเอกสารจากผลการ คนคนไมเกน 5 รายการในสวนทระบบคนคนให [5], [7]

ทำใหสารสนเทศจำนวนมากทไมถกเปดอาน และทำใหผใชไมพบสารสนเทศทมคณคา ซงนบเปนความสญเปลาทางสารสนเทศ

ประการสดทาย การจดหมวดหมของสารสนเทศสวนใหญ นยมใชผเชยวชาญในการวเคราะหสารสนเทศเพอนำมาสรางเปนกรอบความรทนำมาใชในการจดหมวดหมของเอกสาร หรอเวบไซต ตามกลมเนอหา เปนการจดหมวดหมขอมลใหอยเพยงหมวดหมใดหมวดเดยว และผใชตองเลอกขอมลตามเสนทางหมวดหม

Page 3: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

516

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

ขอมลตามวจารณญาณของผจด ทำใหเกดมาตรฐานทแตกตางกนในการจดหมวดหม [8] - [11]

จากทกลาวมาขางตนอาจพออนมานไดวาการคนคนสารสนเทศในปจจบน ยงตอบสนองตอผใชไดไมเตมความตองการ ซงอาจมผลมาจากการขาดการนำระบบการคดกรองสารสนเทศดวยองคความรทเปนมาตรฐานเดยวกน หรอเปนทรจกกนอยางแพรหลายทงในสวนของผใชและในสวนของผวเคราะหจดเกบสารสนเทศ และการมคดกรองจดกลมคำคนของผใชกอนดวยกรอบมาตรฐานความรเดยวกนมาพฒนากระบวนการคนคน นอกจากนพบวากระบวนการคนคนตางๆ ทมอยยงมไดเจาะลกไปถงในเรองคนคนตามสดสวนความสมพนธของเนอหาในเอกสาร และการคนคนคนขอมลหลายภาษาจากการใชคำคนดวยภาษาเดยว

ในงานวจยนมวตถประสงคเพอนำกรอบองคความรทเปนมาตรฐานสากลซงเปนทรจกกนทงในหมนกวเคราะหและผใชสารสนเทศมาใชในการคนคน และเพอใหเออตอการนำไปใชในแหลงสารสนเทศท เปนหองสมด หรอศนยสารสนเทศทมประสทธภาพเพมขน จงไดนำ กรอบมาตรฐานความรของการจดหมทศนยมดวอ (Dewey

Decimals Classification - DDC) ทนยมใชในหองสมดและเปนทคนเคยทวไป [12] มาพฒนาเปนเทคนค การจดหมทศนยมดวอแบบสหความสมพนธ (DDC-

MR) เพอใชในการจดหมวดหมของคำสำคญ ทงในสวนของเอกสาร และในสวนคำคนของผใช (Query) จากนนจงนำมาเปรยบเทยบความคลายคลง ซงจะกลาวรายละเอยดในตอนท 2 และ 3 สำหรบสวนท 4 จะอธบายประโยชนของระบบ และอภปรายผลในสวนท 5

2. การคนคนสารสนเทศ (Information Retrieval)

การคนคนสารสนเทศ (IR) เปนกระบวนการทเกยวของกบการคนหาและนำสารสนเทศสงคนใหแก ผใชอยางถกตองและรวดเรว โดยผานระบบการคนคนสารสนเทศซงมความเกยวเนองกบกระบวนการจดเกบขอมล รปแบบการแทนขอมล และกระบวนการเขาถงขอมล แหลงสารสนเทศขนาดใหญอยางเชน หองสมด

ศนยสารสนเทศ และอนเทอรเนต ตางมระบบการคนคนสารสนเทศทมคณลกษณะเฉพาะตนเพอชวยใหผใชไดรบสารสนเทศทตรงความตองการ และมการพฒนาประสทธภาพอยางตอเนอง

2.1 การคนคนสารสนเทศในหองสมด

หองสมดและศนยสารสนเทศมสารสนเทศสวนใหญเปนสงตพมพและวสดทมลกษณะทางกายภาพทจบตองได กระบวนการในการจดเกบจงเนนใหผใชสามารถเขาถงตววสด และพจารณาสงตพมพและวสดสารสนเทศไดดวยตนเอง สงผลใหรปแบบการแทนขอมลจงเปนการกำหนดสญลกษณเพอใชในการสอสารระหวางผจดเกบและผใชใหทราบถงตำแหนงทตงของทรพยากรสารสนเทศในหองสมดและศนยสารสนเทศกระบวนการจดเกบขอมล รปแบบการแทนขอมลสารสนเทศในหองสมดดำเนนงานโดยผเชยวชาญ ซงเนนวธการวเคราะหจากเนอหาและรปแบบของหนงสอเปนหลก แลวกำหนดสญลกษณใหหนงสอแตเลม ใหอยในกลมหรอหมวดหมใดเพยงหมวดเดยวพรอมหวเรอง เพอใชบอกตำแหนง ทตงของหนงสอในหองสมดใหกบผใช การดำเนนงานทำดวยระบบมอทงหมด เปนงานทซบซอนยงยาก และตองใชเวลา มคาใชจายสงและเกดความลาชา เพราะตองอาศยบรรณารกษซ งอาจมทกษะและ ความเชยวชาญจากประสบการณทแตกตางกน สงผลให การกำหนดหมวดหมในแตละแหงมความแตกตางกนได แมจะใชระบบและคมอเลมเดยวกน สวนกระบวนการ ในการเขาถงนน หองสมดนยมจดทำเครองมอชวยคนในรปแบบบตรรายการ และเครองมอชวยคน IPAC

(Internet Public Access Catalog) ซงมชองทาง ในการคนไดทงการพมพคำสำคญและการเลอกหวขอ ทระบบจดเตรยมให แตขนตอนในการเขาถงขอมลนน มหลายขนตอนและบอยครงทผใชตองเผชญกบขอความ “ไมพบขอมลทตองการ” ผใชตองทำการสบคนใหมดวยคำคนอนไปจนกวาจะไดขอมลทคาดวาจะใชเพราะขอมลทคนคนไดนนจะเปนเพยงขอมลบรรณานกรม หรอ Metadata เทานน ผใชตองสมเลอกจากชอเรอง

Page 4: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

517

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

เพอไปหยบหนงสอมาเปดดวามเนอหาทตรงความตองการหรอไม จนมผกลาววาพวกเขาสามารถคนพบเนอหาสารสนเทศทตองการไดเพราะความบงเอญ [2]

2.2 การคนคนสารสนเทศบนอนเทอรเนต

อนเทอรเนตมงเนนการเขาถงเนอหาสารสนเทศเปนสำคญ โดยผใชไมจำเปนตองรหรอเขาใจกระบวนการในการจดเกบและรปแบบการแทนขอมล เนองจากระบบการคนคนใหความสำคญกบการคนคนเอกสารทตรงกบความตองการของผใชมากทสด โดยผานกระบวนการเปรยบเทยบคำสำคญ (Keywords Matching) ระหวางคำสำคญของเอกสารและคำคนของผใชระบบ การคนคนสารสนเทศในอนเทอรเนตทนยมใชในปจจบน คอ ระบบเครองมอสบคน (Search Engine System) ซงเปนกระบวนการในการคนหาสารสนเทศทตองการจากกลมของเอกสาร (Collections) โดยจะรบคำคนของผใช (Query) แลวนำไปคนหาจากกลมของเอกสารและคนคนเปนรายการของเอกสารทสมพนธกบคำคน ซงการทำงานของระบบการคนคนสารสนเทศจะประกอบดวยการรวบรวมขอมล การสรางตวแทนของเอกสาร การเกบขอมล และวธการคนหาสารสนเทศ ซงใหความสำคญกบการทำดชนคำคน ดวยเทคนคตางๆ ของกระบวนการคนคนสารสนเทศ การจดเรยงลาดบของเอกสาร (Ranking)

ตามความคลายคลงของเอกสารกบขอความทตองการคนหา ซงเปนกระบวนการทเนนการใชเครองจกรกล (Machine) เพอเพมประสทธภาพในการเขาถงขอมลเนอหาสารสนเทศไดรวดเรวมากขน แตการจดทำดชนคำคนโดยเครองกล สงผลใหผใชตองเผชญกบขอมลปรมาณมหาศาลทงทตรงความตองการและไมตรงความตองการ [7], [13]

3. การคนคนสารสนเทศแบบสหความสมพนธ

จากความตองการพฒนาการคนคนสารสนเทศในรปแบบสหความสมพนธ (Multiple Relations) เพอใหสามารถแสดงเนอหาของสารสนเทศไดหลายหมวดหมใหกบผใช ในงานวจยนจงไดนำกระบวนการคนคน

สารสนเทศของเครองมอสบคน (Search Engine) มาประยกตกบกรอบความรการจดหมทศนยมดวอ (DDC)

ซงเปนระบบมาตรฐานทบรรณารกษใชในการจดหมวดหมสารสนเทศในหองสมด มการจดเนอหาตามกรอบ องคความรแบบลำดบชน (Hierarchical Classification)

และกำหนดสญลกษณเปนตวเลขทเปนลำดบขนอยางชดเจน [12], [14] ซงเออตอการนำมาใชในการพฒนาแบบแผนการจดหมทศนยมดวอแบบสหความสมพนธ ทมงเนนใหมการวเคราะหสดสวนความสมพนธ และ การกำหนดสญลกษณใหเนอหาสำคญทกประเดนทปรากฏในหนงสอและคำคนของผใช [15] ซงกระบวนการคนคนแบบสหความสมพนธทพฒนาขนไดแบงงานออกเปน 3

สวนคอ สวนการพฒนาเครองมอการจดหมระบบทศนยมดวอแบบสหความสมพนธ สวนกระบวนการจดหมหนงสอแบบสหความสมพนธ และสวนของกระบวนการ คนคนสารสนเทศแบบสหความสมพนธดงรปท 1

3.1 การพฒนาเครองมอการจดหมทศนยมดวอแบบสหความสมพนธ

เปนขนตอนการสรางรปแบบการแทนขอมลและ

รปท 1 แสดงขนตอนการพฒนาการคนคนแบบสห-

ความสมพนธ

Page 5: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

518

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

เครองมอ เพอใชเปนตนแบบของการจดหมแบบสห-ความสมพนธ โดยนำคำสำคญและเลขสญลกษณจากคมอการจดหมระบบทศนยมดวอ Version 22 ของ OCLC [12] ไปสรางฐานขอมลดชน สำหรบใชวเคราะหหมวดหมทสมพนธ ดวยวธการใชตวเลขสญลกษณในหมวดหมของการจดหมทศนยมดวอแทนเนอหาของแตละคำสำคญ ดงนนในเครองมอตนแบบ DDC-MR ทสรางขนจะกำหนดวา แตละคำสำคญมเลขสญลกษณตามเนอหาทเกยวของอะไรไดบาง แตละคำสำคญสามารถมเลขสญลกษณไดหลายตว

3.2 พฒนากระบวนการจดหมทศนยมดวอแบบสห-ความสมพนธ

เปนสวนของกระบวนการสรางตวแทนขอมลและจดเกบขอมล ซงในขนตอนนเปนการหาสดสวนของหมวดหมของเนอหาสารสนเทศของหนงสอ เพอสราง ฐานขอมลเนอหนงสอแบบสหความสมพนธ โดย วธการนำเนอหาหนงสอ 3 สวน คอสวนชอเรอง สวนสารบญ และสวนดชนทายเลมของ E-book หรอใชวธการสแกนจาก Textbook เพอนำมาสกดหาคำสำคญของหนงสอ ทกคำสำคญทปรากฏในหนงสอทง 3 สวนจะถกนำไปจดหมดวย DDC-MR Version 0.1 [16]

เพอหาคาความถของคำและวลในหนงสอทมความสมพนธกบเลขสญลกษณกรอบความรการจดหมทศนยมดวอในแตละลำดบชนคอ ลำดบชนท 3 เรยกวาหม (Division) ลำดบชนท 2 เรยกวาหมวดยอย (Sub Class) และลำดบชนท 1 เรยกวาหมวด (Class)

จากนนรวมคาความสมพนธของทกเลขสญลกษณในแตละลำดบชนทปรากฏ ในรปแบบคาความถ คาความถในแตละหมวดหมจะถกนำมาคำนวณเปนคา รอยละ (Percentage) เพอจดเกบไวในฐานขอมล ดงตารางท 1

จากตารางท 1 แสดงใหเหนรปแบบขอมลของหนงสอแตละเลมทจดเกบในฐานขอมล ทถกจดเกบในรปแบบสดสวนสหความสมพนธของเนอหาของหนงสอ (Books DDC-MR) เปนคารอยละของแตละสญลกษณ

ในลำดบชนท 3 ซงมทงหมด 1000 สญลกษณ เพอใชสำหรบการเปรยบเทยบความคลายคลงกบคำคนของ ผใช สวนคารอยละของแตละสญลกษณในลำดบชนท 2 และ 1 ซงเกดจากการรวมคาสดสวนในลำดบชนท 3 จะถกจดเกบไวเพอใชสำหรบการแสดงผลการคนคนใหกบผใช ตารางท 1 แสดงคาสดสวนรอยละความสมพนธของ

เนอหาหนงสอในแตละลำดบชน

ลำดบชนท 3 ลำดบชนท 2 ลำดบชนท 1

(Level 3) (Level 2) (Level 1)

สญลกษณ รอยละ สญลกษณ รอยละ สญลกษณ รอยละ

000 0.0067 000 2.2499 000 6.1129

001 0.3620 010 0.3316 100 2.3034

002 0.0000 020 2.5032 200 2.3956

003 0.1356 060 0.4212 300 17.7901

004 0.6013 070 0.1996 400 0.7942

005 0.8867 090 0.4073 500 22.3153

006 0.2577 100 0.0372 600 32.5901

007 0.0000 110 0.0879 700 12.2854

…. … …. … 800 0.3687

999 0.0000 990 0.0842 900 3.0445

รวม 100 รวม 100 รวม 100

3.3 พฒนากระบวนการคนคนสารสนเทศแบบสห-ความสมพนธ

เปนขนตอนการเขาถงสารสนเทศของผใช โดยนำคำคนของผใช (Query) มาจดหมแบบสหความสมพนธดวย DDC-MR Version 0.1 เพอหาสดสวนความสมพนธในแตละหมวด ในลำดบชนท 3 (Query DDC-MR) เปนคารอยละเชนเดยวกบหนงสอ จากนนจงนำมา เปรยบเทยบความคลายคลงของสดสวนความสมพนธของหนงสอทจดเกบไวในฐานขอมล โดยวธการเปรยบเทยบจากระดบความคลายคลงของคาสมประสทธสหสมพนธแบบเพยรสนดวยสมการ [17]

Page 6: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

519

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

คาสมประสทธสหสมพนธของคำสำคญในหนงสอและคำคนของผใช

x = คาสดสวนความสมพนธของคำคนของผใช y = คาสดสวนความสมพนธของคำสำคญใน

หนงสอ n = จำนวนหมวดหมความสมพนธตามระบบ

ทศนยมดวอ การคนคนสารสนเทศแบบสหความสมพนธจะ

ทำใหเนอหาในทกหมวดหมของหนงสอทกเลม ถกนำมาเปรยบเทยบกบคำคนดวยเลขสญลกษณของการจดหมทศนยมดวอ และนำเสนอรายการผลลพธของการคนคนสารสนเทศตามลำดบความคลายคลงของสดสวนเนอหา พรอมทงนำเสนอผลการคนคนหนงสอและปรมาณ สารสนเทศทมความสมพนธกบคำคนของผใช ตามโครงสรางของระบบทศนยมดวอ และสามารถเสนอแนะคำคนอนทมความเกยวของกบเนอหา ดงรปท 2 และ รปท 3

จากรปท 2 แสดงผลหนาจอแรกของผลลพธจากคำคน “Food Safety” ใน 3 สวนหลกคอ สวนท 1

แสดงรายชอพรอมปกหนงสอทมความสมพนธกบ คำคนมากทสด 5 เลม เพอใหผใชสามารถเลอกคลกด รายละเอยดของเลมทตองการได สวนท 2 แสดงปรมาณสารสนเทศตามระบบทศนยมดวอวาคำคน “Food Safety” มความสมพนธกบหมวด 300 (สงคมศาสตร) มากทสด รองลงมาคอ หมวด 600 (เทคโนโลย) และหมวด 500 (วทยาศาสตร) สวนท 3 แสดงใหผใชเหนวา “Food

Safety” มคำคนอนทมความสมพนธซงสามารถใชสบคนไดอก เชน “Food Hygiene” “Food Hazards”

“Vegetable Food Poisoning” เปนตน จากรปท 3 แสดงผลลพธจากการคลกเลอก

หนงสอเลมแรก ใหเหนรายละเอยดของเนอหาหนงสอ ซงพบวา เนอหาสวนใหญในหนงสอนเนนเรองความปลอดภยของอาหารทเกยวกบเทคโนโลยรอยละ 43.90

และสงคมศาสตรรอยละ 40.24 ในขณะเดยวกนจะแสดงปรมาณความสมพนธกบหมวดอนๆ ซงผใชสามารถใชคำของแตละหมวดยอยไปใชในการสบคนตอไปได

4. ประโยชนของการคนคนสารสนเทศดวยการจดหมหนงสอแบบสหความสมพนธ

เทคนคการจดหมแบบสหความสมพนธ (DDC-

MR) จะทำใหการวเคราะหหนงสอตามสดสวนเนอหาเพอจดเกบในฐานขอมล ในขณะเดยวกนกวเคราะหคำคนของผใชตามสดสวนของความสมพนธกบเนอหา ซงจะยงประโยชนตอการคนคนสารสนเทศในหลายประการคอ

4.1 ทำใหสามารถแสดงผลสารสนเทศทเคยมอง ไมเหน (Representation Unseen Information)

ดวยเทคนคการจดหมทศนยมดวอแบบสหความ

รปท 2 แสดงการคนคนสารสนเทศแบบสหความสมพนธหนาแรก

รปท 3 แสดงการคนคนสารสนเทศแบบสหความสมพนธ หนาสอง

Page 7: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

520

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

สมพนธ จะปรบเปลยนการวเคราะหหมวดหมหนงสอจากหมวดหมเดยว (One Class Collection) เปนการว เคราะหหมวดหมหนงสอแบบสหความสมพนธ (Multiple Classes Collection) โดยจดเกบเนอหา สารสนเทศทกเร องทปรากฏในหนงสอแบบสห- ความสมพนธภายใตกรอบหมวดหมระบบทศนยมดวอ ทำใหสามารถนำกลบออกมาเปนเนอหาสารสนเทศท นำเสนอตอผใชในรปแบบความสมพนธทชดเจนขนวาหนงสอหรอเอกสารหนงๆ มความสมพนธกบเรองใดบางในปรมาณเทาใดและมรปแบบความสมพนธอยางไร ดงรปท 4 ผ ใชจะทราบวาหนงสอเลมนนอกจากม เนอหาเกยวกบการจดการองคความรทเนนเนอหาดาน การบรหารจดการ (658.4) แลวยงมเนอหาอนทเกยวกบสารสนเทศ (025.04) สงคมศาสตร (372.7 และ 338.96)

และปรชญา (121) ตามลำดบ รวมทงสามารถนำเสนอเอกสารทมรปแบบมต

ความสมพนธของเนอหาทตรงกนหรอมความคลายคลงกบรปแบบมตความสมพนธของคำคนของผใช นอกจากน ยงสามารถชวยแกปญหาการกำหนดหมวดหมแตกตางกนของหองสมดไดเพราะการจำกดใหมเลขหมเดยวนนตองอาศยการตความและตดสนใจของบรรณารกษ ในกรณทหนงสอมเนอหามากกวา 2 - 3 เรองขนไป บรรณารกษหองสมดบางแหงมกพจารณาตามจำนวนหนาของเนอหาหนงสอทมมาก หรอเนอหาแรกของหนงสอเลมนน บางแหงพจารณาตามความตองการของผใชสวนใหญ หรอวตถประสงคของสถาบนทเปนทตงของหองสมด ในขณะเดยวกนจะชวยในการแสดงปรมาณสารสนเทศทมในหองสมดไดอยางเทยงตรง กวาเดมซงเคยใชวธการจดใหหนงสออย ในหมวดเบดเตลด (000) สำหรบหนงสอทมหลายเรองและ แตละเรองไมมเนอหาสอดคลองกน หรอจดใหอยใน เลขหมวดหลกทครอบคลมเนอหาทงหมดสำหรบหนงสอทมเนอหาหลายเรองทเปนไปในทศทางเดยวกน เชน หนงสอเกยวกบวทย (621.384) โทรทศน (621.388) ไมโครเวฟ (621.3813) โทรศพท (621.387)

บรรณารกษจะกำหนดใหเปนเลขหม 621.38

4.2 เอออำนวยตอการคนคนสารสนเทศไดหลากหลายภาษา (One Language Query Access Multilingualism

Information)

เนองจากระบบทศนยมดวอเปนระบบมาตรฐาน สากลซงใชตวเลขเปนสญลกษณแทนเนอหาทมการใชในหองสมดทวโลกและมการแปลเปนภาษาตางๆ มากกวา 30 ภาษา สงผลใหหนงสอทมเนอหาเหมอนกน ไมวาจะเขยนดวยภาษาใดจะไดสญลกษณตวเลขทเหมอนกน ดงนนการใชตวเลขสญลกษณในระบบดวอในการคนคนจะทำใหไดเอกสารทมเนอหาเดยวกนในหลากหลายภาษา

4.3 เอออำนวยตอการใชคำคนคนสารสนเทศดวยสญลกษณเลขหมหนงสอ (Query with Classification

Number)

ระบบจดหมทศนยมดวอเปนระบบมาตรฐานทนยมใชในหองสมดมานานนบรอยป และยงคงเปนทนยมใชในหองสมดโรงเรยนและหองสมดประชาชน ทวโลก ประกอบกบการใชตวเลขเปนสญลกษณทำใหงายตอการจดจำ ผใชคนเคยกบการใชหองสมดจำนวนไมนอยททราบสญลกษณหมวดหมทตนตองการ และเดนไปสำรวจหนงสอทชนวางแทนการใชเครองมอสบคนทหองสมดเตรยมไวบรการ ดงนนเครองมอ การคนคนสารสนเทศแบบสหความสมพนธอยบน พนฐานของระบบทศนยมดวอ จงสามารถใชตวเลข

รปท 4 แสดงสดสวนความสมพนธของหนงสอในแตละหมวดหม

Page 8: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

521

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

สญลกษณเปนคำคนได และจะทำใหผใชทราบวายงมหนงสอเลมอนทมเนอหาเกยวของแตถกกำหนดใหไปอยทชนหนงสอของหมวดหมอน

4.4 ชวยในการคนคนสารสนเทศถงระดบเนอหา (Partial Content Retrieval)

เทคนคการคนคนสารสนเทศแบบสหความสมพนธ จะเพมประสทธภาพการเขาถงเนอหาไดมากขน โดยการวเคราะหเนอหาทเกยวของจากหนงสอในแตละบท ดงนนนอกจากจะแสดงหนงสอทมเนอหาทเกยวของแลว ยงสามารถเลอกดงเนอหาเฉพาะบททเกยวของมานำเสนอไดดวย ทำใหผใชเหนโครงสรางของสดสวนเนอหาในหนงสอซงจะชวยใหตดสนใจไดงายขนกอนทจะไปเลอกหยบหนงสอทชน หรอ Download เนอหาตอนนน 4.5 การแนะนำคำคนอนทเกยวของ (Recommenced

Group of Content)

เทคนคการคนคนสารสนเทศแบบสหความสมพนธ พฒนาจากกรอบองคความรทเปนมาตรฐานทรวบรวมคำสำคญในศาสตรแตละแขนงทมความสมพนธกน จงสามารถทจะดงคำคนอนๆ ทมความสมพนธกบ คำคนแรกของผใชมานำเสนอ ทำใหผใชไมตองเสยเวลาในการคดเดาคำคนใหมไปเรอยๆ เนองจากบางคำคนเปนคำเกาทผใชทราบแตลม บางคำคนเปนคำคนใหม ทผใชไมทราบมากอนวาเกยวของกบเรองทตนตองการการแนะนำคำคนจะทำใหผใชประหยดเวลาและไมเกดความรำคาญใจในการสบคนขอมลและงายตอการเขาถงสารสนเทศทตรงความตองการ 5. สรปและขอเสนอแนะ

เทคนคการคนคนสารสนเทศดวยการวเคราะหหมวดหมหนงสอแบบสหความสมพนธ (DDC-MR) เปนตนแบบทพฒนาขนเพอเพมประสทธภาพในการ เขาถงและคนคนสารสนเทศในหองสมด ซงจะมผลกระทบตอการดำเนนของหองสมดในปจจบน ซงผวจย

เชอวาการนำเทคนคการคนคนสารสนเทศดวยการวเคราะหหมวดหมหนงสอแบบสหความสมพนธ จะมาชวยงานของบรรณารกษดานการวเคราะหหมวดหมหนงสอและจะยงประโยชนตอผใชของหองสมด ดงน

5.1 ดานการวเคราะหหมวดหมหนงสอ

การใชเทคนคการจดหมหนงสอแบบสหความสมพนธดวย DDC-MR จะชวยแบงเบาภาระงาน และเวลาในการทำงานของบรรณารกษดวยการกำหนดเลขหมหนงสอตามเนอหาทพบในตวเลมหนงสอทงหมดโดยไมตองจำกดหมวดหมเดยว พรอมทงสามารถแสดงสดสวนตามกลมเนอหาไดตามความเปนจรง ทำใหสามารถทจะรายงานสถานภาพปรมาณสารสนเทศทมอยแทจรงในหองสมดไดดวย แมนวาบรรณารกษไดรบการยกยองวาเปนผมความเชยวชาญในการกำหนดหมวดหมเนอหาสารสนเทศและมความสามารถในการจดทำดชนไดดกวาเทคโนโลย แตกเปนทยอมรบวาเทคโนโลยคอมพวเตอรนนมประสทธภาพดานการประเมนผลทรวดเรวและแมนยำกวามนษย [2] แตการจะพฒนาบรรณารกษใหมทกษะและความเชยวชาญ เทากนนนเปนเรองทตองใชเวลาในการสงสมประสบการณ และตองลงทนเปนระยะยาวซงจะไมทนการกบปรมาณสารสนเทศทเพมขนอยางรวดเรว ดงนนการพฒนาเทคนคการจดหมแบบสหความสมพนธ ซงเปนการนำเทคโนโลยเครองจกรกลมาชวยประมวลผลขอมลทมปรมาณมากโดยวเคราะหคำสำคญ จากชอเรอง สารบญและดชน และใชการควบคมคำศพทดวยโปรแกรมจะชวยแกปญหาการกำหนดคำสำคญและการกำหนดหมวดหมทแตกตางกนของแตละเอกสาร เพราะบรรณารกษจะเหนสดสวนความสมพนธของแตละหมวดหมไดชดเจนขน และไมตองจำกดใหเหลอเพยงหมวดหมเดยว

5.2 ดานการคนคนหนงสอ กระบวนการคนคนสารสนเทศดวยการวเคราะห

หมวดหมหนงสอแบบสหความสมพนธ (DDC-MR) ทพฒนาขนมไดเขามาแทนทการคนคนสารสนเทศดวย

Page 9: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

522

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

เครองมอคนคน IPAC ในหองสมด หรอการคนคนดวย Search Engine บน WWW แตเปนเครองมอคนคนอกตวหนงทมาเสรมประสทธภาพเพอการคนคนสารสนเทศของหองสมดทเนนการปรบเปลยนรปแบบการคนคนหนงสอเลมทเกยวของ (IR Books) เปนการคนคนเนอหาสารสนเทศทมความสมพนธ (IR Content) เพอใหผใชไดเลอกใชสารสนเทศทมคณคาตรงกบความตองการ โดยทไมตองไปเอาหนงสอจำนวนมากจากชนหนงสอ เพอมาเปดพจารณาเนอหาวาเลมใดมความเกยวของกบความตองการมากทสด และการจดทำดชนควบคมคำศพทดวยโปรแกรมสำหรบระบบคนคนแบบสห- ความสมพนธ (DDC-MR) จะทำใหการสบคนเอกสาร มความรวดเรวยงขน และเพมประสทธผลดานความ ถกตองแมนยำ โดยผใชไมตองเผชญปญหาผลลพธ “ไมพบสารสนเทศทตรงกบคำคน” เพราะระบบจะ คดเลอกเอกสารทมความเกยวของมาให พรอมกบแนะนำคำคนอนทมความเกยวของตามกรอบมาตรฐานของระบบทศนยมดวอใหดวย นอกจากนการแสดงผลการคนคนโดยการนำกราฟกมาใชในการแสดงผลจะเปนรปแบบใหมของเครองมอสบคน ทมความสวยงามตนตาตนใจและเราความสนใจ ตลอดจนมการแสดงผลการจดกลมของเอกสารทมความคลายคลงกน ซงจะทำใหผ ใชมองเหนระดบความสมพนธของเอกสาร ทเกยวของไดดขนทงในระดบโครงขายและละเอยดถงในเนอหา ทงยงสามารถจดลำดบขนตอนในการนำเสนอทชดเจนขน [18], [19]

เอกสารอางอง [1] ศภางคลกษณ จระสวสดพงศ และยวด มโนมยทธ

กาญจน, “การปรบกระบวนงานการจดระบบและการจดเกบทรพยากรสารสนเทศโดยใชกระบวนการ KM: สำนกวทยบรการ มหาวทยาลยขอนแกน,”

วารสารหองสมด, ฉบบท 52, หนา 31-44,

มกราคม-มถนายน 2551.

[2] R. Baeza-Yates and B. Ribeiro-Neto, Modern

Information Retrieval. New York: Addison-

Wesley, 2005.

[3] K. Markey, “Forty years of classification

online: final chapter or future unlimited?”

Cataloging and Classification Quarterly, vol. 42,

pp. 1-63. 2006.

[4] N. Ross and D. Wolfram, “End user searching

on the internet: An analysis of term pair topics

submitted to the Excite search engine,” Journal

of the American Society for Information

Science, vol. 51, pp. 949-958, 2000.

[5] B. J. Jansen and A. Spink, “How are we

searching the world wide web? A comparison

of nine search engine transaction logs,”

Information Processing and Management, vol. 42,

pp. 248-263, 2006.

[6] รตรตน มหาทรพย และจนทมา เขยวแกว ,

“การประเมนความสามารถในการทำงานของระบบหองสมดอตโนมตนวสาร และความพงพอใจใน การสบคนรายการออนไลนระบบนวสารของผใชบรการของสำนกหอสมดกลาง มหาวทยาลยหอการคาไทย,” วารสารวจยสมาคมหองสมดแหงประเทศไทย, ปท 1, หนา 19 – 31, กรกฎาคม-ธนวาคม 2551.

[7] D. T. Hawkins, “Conference circuit: The eighth

search engine meeting,” Information Today,

vol. 20, June 2003.

[8] C. Peery, A. M. Wei Wang, and T. D. Nguyen,

“Multi-dimensional search for personal

information management systems,” in

EDBT’08, Nantes, France, 2008.

[9] C. Huang, Y. Tian, Z. Zhou, and T. Huang,

“Towards multi-granularity multi-facet E-book

retrieval,” in WWW ‘07: Proceedings of the

16th international conference on World Wide

Web, ACM 2007.

[10] R. Prabowo. “Ontology-based automatic

Page 10: 12-วิไลพร final vol 3-2010 · 2011. 9. 22. · นวัตกรรมการค้นคืนสารสนเทศแบบสหความสัมพันธ์

523

วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 20 ฉบบท 3 ก.ย. - ธ.ค. 2553 The Journal of KMUTNB., Vol. 20, No. 3, Sep. - Dec. 2010

classification for the web pages: Design,

implementation and evaluation,” in Proceedings

of the 3rd International Conference on Web

Information Systems Engineering, 2002, pp. 182-191.

[11] K. Golub, “Automated subject classification of

textual web documents,” Journal of Documentation,

vol. 62, 2006.

[12] M. Dewey, Dewey decimal classification and

relative index, 21st ed. Albany, New York:

OCLC Forest Press, 2003.

[13] E. Nowick, “A model search engine based on

cluster analysis of user search terms,” Library

Philosophy and Practice (e-journal), vol. 7,

pp. 1-6, 2005,

[14] E. Svenonius, “An ideal classification for an

on-line catalog,” in Proceedings from the

Conference in Classification Theory in the

Computer Age, Albany, New York, 1988.

[15] วไลพร เลศมหาเกยรต และอนราช มงขวญ,

“การคนคนสารสนเทศตามการจดหม ระบบทศนยมดวอแบบสหความสมพนธ,” ในการประชมทางวชาการระดบชาตดานคอมพวเตอรและ

เทคโนโลยสารสนเทศ ครงท 3 (NCCIT 08), มหาวทยาลยราชภฎมหาสารคาม จ งหวดมหาสารคาม, 2551.

[16] วไลพร เลศมหาเกยรต และอนราช มงขวญ,

“การประเมนตวแทนขอมลของเนอหาหนงสอสำหรบการประมวลผลการจดหมวดหมทศนยมดวอแบบสหความสมพนธ,” ในการประชมทางวชาการระดบชาตดานคอมพวเตอรและเทคโนโลย สารสนเทศ ครงท 4 (NCCIT 09), มหาวทยาลยเทคโนโลยพระจอมเกลาพระนครเหนอ กรงเทพฯ, 2552.

[17] D. E. Hinkle, Applied Statistics for the Behavioral

Sciences, Wiersma, W. Boston: Houghton Mifflin,

1998.

[18] B. Leporini, P. Andronico, and M. Buzzi,

“Designing search engine user interfaces for

the visually impaired,” ACM SIGCAPH

Newsletter, vol. 18, pp.17-18, June 2003.

[19] วไลพร เลศมหาเกยรต, ภรวตร คมภรภาพพฒน, และอนราช มงขวญ, “รปแบบการแสดงผลการคนคนของเครองมอการสบคนสารนเทศบนอนเทอรเนต,” วารสารวชาการพระจอมเกลาพระนครเหนอ , ปท 18, หนา 89-98, มกราคม-เมษายน 2551.