nectec e-magazine vol.4

17
»ÃШÓà´×͹ àÁÉÒ¹ 2554

Upload: nectec

Post on 28-May-2015

743 views

Category:

Technology


2 download

DESCRIPTION

Vaja is a Thai text-to-speech software developed by Human Language Technology Laboratory (HLT). Vaja has been extensively researched and developed since 1997. The most recent version Vaja 6.0 utilizes the latest speech synthesis technique HTS which uses a statistical model called Hidden Markov to produce synthesized sound. This technique helps eliminate the problem of uneven sound that occurred in the previous versions. The new synthesis technique together with a prosody prediction module which predicts phrase boundaries and the duration of each phone make the synthesized speech sounds more natural and increase users’ satisfaction. Furthermore, Vaja 6.0 is able to synthesize all Thai words since it has a text analysis module which can generate the pronunciation of every word even the one not found in a dictionary.

TRANSCRIPT

Page 1: NECTEC E-magazine Vol.4

»ÃШÓà ×͹ àÁÉÒ¹ 2554

Page 2: NECTEC E-magazine Vol.4
Page 3: NECTEC E-magazine Vol.4

Editor‘s Talk

ธรกจบรการ Services Sector นบวามบทบาทสำคญตอเศรษฐกจของประเทศไทยเปน อยางมาก (จากขอมลธรกจบรการhttp://service.thaitrade.com) มสดสวนรอยละ 47.74 ของ ผลตภณฑมวลรวมในประเทศไทย (Gross Domestic Product-GDP) คดเปนมลคา 3.73 ลานบาท สาขาบรการทมบทบาทมากทสดไดแกสาขาคาสงคาปลกสาขาโรงแรมและภตตาคารสาขาการศกษาสาขาการเงนการธนาคารสาขากอสรางการคาสงหารมทรพยสาขาบรการสขภาพเปนตนศนยเทคโน โลยอเลกทรอนกสและคอมพวเตอรแหงชาต หรอเนคเทค องคกรหลกของประเทศดานการวจยและ พฒนาเทคโนโลยอเลกทรอนกสและคอมพวเตอร มเปาหมายทจะนำผลงานวจยพฒนาของศนยฯ มา ตอบสนองการพฒนาธรกจบรการในรปแบบ Smart Service โดยตวอยางของผลงานทเหนเปน รปธรรมในการนำเทคโนโลยของเนคเทคไปตอยอดในรปแบบตางๆ อาท วาจา เวอรชน 6.0 ไดเรม ปรากฏใหสาธารณชนไดนำไปประโยชนแลว

ทผานมามหนวยงานภาครฐและภาคเอกชนนำ “วาจา เวอรชน 6.0” ไปใหบรการใน องคกรของตนในรปแบบทหลากหลาย อาท คณะแพทยศาสตร จฬาลงกรณมหาวทยาลยใชระบบ ตดตามดแลผปวยเบาหวานผานโทรศพทมอถอโดยผปวยและแพทยสามารถกำหนดเวลาในการตดตาม ผลการรกษาและการดแลสขภาพตนเอง, โรงพยาบาลเทศบาลเชยงใหมนำไปประกอบใชในระบบเรยก ควผปวยในโรงพยาบาลดวยการขานชอนามสกล, มหาวทยาลยรามคำแหง นำไปใชในการสราง e-Learning content สำหรบการเรยนการสอน, โรงพยาบาลศรราช นำไปใชในการชวยใหผปวยทมปญหาในการออกเสยง สามารถสอสารกบผคนไดดวยการใชเสยงสงเคราะหทเรยก ชอวา ICUTalk, สถาบนเทคโนโลยนานาชาตสรนธร ใชเปนซอฟตแวรททำงานบนเครองโทรศพทมอถอแบบ Windows Mobile เพอใชสรางเสยงสงเคราะหจากขอความตางๆ บนเครอง เชน อานอเมลแสดงเสยงตวเลขปมกด เรยกชอวา pTalk ปจจบนถกบรรจอยในเครองโทรศพมอถอทมหาวทยาลย ธรรมศาสตร จดสรรไวสำหรบอำนวยความสะดวกในการใชชวตของนกศกษาทบกพรองทางสายตาเปนตน

วาจา เวอรชน 6.0 มคณสมบตอยางไร การออกแบบใหมสถาปตยซอฟตแวรทม API ทนำไปตอยอดในการประยกตใชงานไดอยางหลากหลาย ตอบสนองกบ Technology Trend และBusinessTrendทจะเกดในอนาคตทงCloudComputing,WebServiceและX-as-a-Services ทกคำถามทเกดขนทานสามารถตดตามคำตอบเหลานไดในสารเนคเทคฉบบน

บรรณาธการ

Page 4: NECTEC E-magazine Vol.4

2 ประจำเดอน เมษายน 2554

Contents

Interviewดร. ชย วฒววฒนชยระบบสงเคราะหเสยงพดภาษาไทย วาจา 6.0 3

Showcaseวาจา ระบบสงเคราะหเสยงพดภาษาไทยคณภาพสง 6

Tech Trendเทคโนโลยสงเคราะหเสยงพด Text - to - speech systhesis สำหรบ VAJATM 6.0 12

Page 5: NECTEC E-magazine Vol.4

3การสงเคราะหเสยงพดดวย VAJA 6.0

Interview

วาจา เปนระบบสงเคราะหเสยงพดภาษาไทยพฒนาโดย หองปฏบตการวจยเทคโนโลยเสยง (Language and Semantic Technology Laboratory) หรอเรยกยอๆ วา LST ซงมผลงานวจยและพฒนาเทคโนโลยทเกยวของกบ ภาษาของมนษยในรปแบบเสยงและภาษาเขยนทเราใชใน การตดตอสอสารของมนษยทำใหการประมวลผลภาษามความนาสนใจ และผลลพธจาการวจยนสามารถนำไป ประยกตใชในงานตางๆ ไดอยางกวางขวางอยางเชน ลด ชองวางในการสอสารตางภาษาและเพมประสทธภาพใน การเขาถงขอมลขาวสารไดอยางทวถง

กวาจะมาเปนผลงานวจยในเวอรชนลาสด6.0ทมการเปด

ตวไปอยางเปนทางการแลวนนเสนทางการพฒนาของวาจาเรมตนจาก

เรามความเกงทางดานเทคโนโลยทเกยวของกบภาษา เราจงพฒนา

ซอฟตแวรสงเคราะหเสยงพดภาษาไทยขนมาวาจาเวอรชน2.0เปน

รนแรกทเปดตวเมอป 2543 ประสบความสำเรจในระดบหนง ซง

พสจนใหเหนความเปนไปไดในการใชคอมพวเตอรอานขอความใดๆใน

ภาษาไทยได แตเสยงยงคลายหนยนต ไมเปนทนยมเทาใดนก จงได

มการพฒนาตออก4ปตอมาจงเปดตววาจาเวอรชน3.0ผลการวจย

ใหเสยงสงเคราะหเปนธรรมชาตเปนมากขน แตกยงพบปญหาความ

ผดพลาดของการวเคราะหคำอาน แมจะพยายามปรบปรงระบบเปน

เวอรชน 5.0 ในป 2551 แลวกตาม แตกยงคงไมไดรบความสนใจ

บทสมภาษณ ดร.ชย วฒววฒนชย หวหนาหองปฏบตการวจยเทคโนโลยเสยง

ระบบสงเคราะหเสยงพดภาษาไทย วาจา เวอรชน 6.0

Page 6: NECTEC E-magazine Vol.4

4 ประจำเดอน เมษายน 2554

เทาทควร จนกระทงลาสดในป 2553 เนคเทคประสบความสำเรจในการพฒนา “วาจา

เวอรชน6.0”อยางมาก

ความสำเรจของเวอรชนลาสดน ทบอกกบตวเองวา “เราทำมนไดแลว” กคอ

ทมเราทมเท พฒนาการทำงานกนอยางหนก วเคราะห สงเคราะห แกขอผดพลาด

ทเกดขน และพฒนาใหดกวาเดม จากการออกเสยงแขงกระดางคลายหนยนต เสยง

กระตกบรเวณรอยตอของหนวยเสยงใน“วาจา เวอรชน6.0” เราใชเทคโนโลยใหมทบบ

อดฐานขอมลเสยงขนาดใหญเปนแบบจำลองทางสถตในการสงเคราะหเสยง แบบจำลอง

นจะสามารถผลตเสยงไดราบเรยบไมเกดการสะดดเหมอนเวอรชนกอนๆ อกทงสามารถ

ปรบคาตางๆในเนอเสยงเชนเสยงสงตำเสยงสนยาวไดสะดวกขนมากดวยทำใหคณภาพ

เสยงทไดมความเปนธรรมชาตใกลเคยงกบเสยงพดของมนษย

มการทดสอบหรอนำไปใชงานจากหนวยงานทงรฐและเอกชน ในหลายรปแบบ

ทงทตดตอเขามาขอใชจากสอทเผยแพรออกไป และเปนความรวมมอในหนวยงานรฐฯ

ดวยกนปจจบนยงเปนการบรการฟรในทกรปแบบ

ดร.ชยวฒววฒนชยกลาววาขณะนพรอมแลวทจะเปดตลาดบรการแกผทสนใจ

เตมตว ผมตองบอกกอนวา สมยกอนมทมดานนนอย ปจจบนเรามนกวจยทมความร

ความเชยวชาญ กลบมาจากตางประเทศ กลบมาชวยกนสรางงานวจยและพฒนามากขน

ตอนนพรอมเปดเตมรปแบบเพราะมพนธมตรทางการวจยชวยสนบสนนและเดนไปพรอมๆ

กบเรา โจทยจากการวจยมาจากทานทนำไปใชงานการตอยอดงานวจยในอนาคต เราจะ

พฒนาใหมการใส expressiveness ทจะทำใหเวลาอานแสดงอารมณ ความรสกจะ

มการอานแบบbilingualสวนนทำเสรจแลวและ13ปของวาจาเราพบวาสวทช.ยค

ใหมกำลงถายทอดเทคโนโลยออกสตลาดซงจะมผลงานหลายชนออกตามมา“ดใจทงาน

วจยเปนประโยชนตอ สงคม”ครบ

“เราทำมนไดแลว”

กคอ ทมเราทมเท

พฒนาการทำงาน

กนอยางหนก

วเคราะห

สงเคราะห

แกขอผดพลาด

ใหดกวาเดม

4 ประจำเดอน เมษายน 2554

Page 7: NECTEC E-magazine Vol.4

5การสงเคราะหเสยงพดดวย VAJA 6.0

ผศ.ดร.นายแพทย วโรจน เจยมจรสรงษ ผชวยคณะบดฝายสรางเสรมสขภาพ โรงพยาบาลจฬา

เลาวา “ปจจบนมโรคเรอรงทเกดมากขน ผทไดรบการ

รกษาตองไดรบการดแลอยางตอเนอง ทก 3 เดอน

ตองมการนดหมายวาจาถกนำมาชวยในเรองการตดตาม

ในการดแลผปวยผานโทรศพทอตโนมต ปจจบนมผใช

ประมาณรอยกวาคนภายในระยะเวลาไมกเดอน”

“ ม.ราม เปนตลาดวชา มผเรยน

หลากหลายตงแตpre-degreeตำกวา

อดมศกษา จนถงอาวโส มผเรยนจาก

หลายแหงทวโลก มใหดาวนโหลดฟร ท

ได เขามาใชงานวาจากเพราะเราเหน

จากการแถลงขาวจงไดตดตอมาขอใชซง

เนคเทคกยนดใหเราใชปจจบนทำหนงสอ

เสยงไปไดแลวกวา 30 เลม” คณณฐกจ

สนธย ตวแทนศนยบรการเทคโนโลยสาร

สนเทศมหาวทยาลยรามคำแหงกลาว

คณมรกต กลธรรมโยธน กรรมการบรษทอนเทอรเนต

ประเทศไทย จำกด (มหาชน) ผใหบรการ internet provider

ไดนำไปใชเสรมสรางความแขงแกรง สรางความมนใจในธรกจ

บรการหรอนำไปสรางมลคาอนๆเชนระบบการอานขาวจากสอ

สงพมพทงออฟไลนและออนไลนเปนควาามสามารถทมอยหลาก

หลายซงนบเปนนวตกรรมทสรางผลกระทบในเชงธรกจ

ทศนะจากผใช Vaja 6.0

5การสงเคราะหเสยงพดดวย VAJA 6.0

Page 8: NECTEC E-magazine Vol.4

6 ประจำเดอน เมษายน 2554

Showcase

วาจา (VAJATM) เปนระบบสงเคราะหเสยงพดภาษาไทย ของเนคเทค ซงใชระยะเวลา บนเสนทางการพฒนาทยาวนานกวา 10 ป จนมาถงเวอรชนลาสด 6.0 ถอเปนความสำเรจ สำหรบวงการวจยและพฒนาทางดานภาษาทมผนำไปใชงานแลวสรางมลคาและโอกาสให เชงธรกจ

“วาจา เวอรชน 6.0” ประกอบดวยสวนวเคราะหขอความ (Text analyzer) มระบบแบงคำอตโนมตท

ไดรบการพฒนาลาสด สามารถสรางเสยงพดไดครอบคลมคำในภาษาไทย เนองจากมสวนวเคราะหคำอานทสามารถ

วเคราะหไดแมแตคำทไมปรากฏในพจนานกรมสวนทำนายสทสมพนธ(Prosodyprediction)ทชวยในการวเคราะห

ขอบเขตของวล และการทำนายความยาวของหนวยเสยง ทำใหเสยงสงเคราะหมความเปนธรรมชาตดงเชนเสยง

พดของคน

คณสมบตเดนของวาจา เวอรชน 6.0

1. สรางเสยงไดราบเรยบไมเกดการสะดดดวย การใชแบบจำลองเสยงทางสถต 2.คณภาพเสยงไดคะแนน3.7จากคะแนนเตม5 จากผฟงกลมตวอยาง 3.วเคราะหคำอานของขอความภาษาไทยได ถกตองเกน90% 4.มพจนานกรมสำหรบวเคราะหคำอานภาษา องกฤษจำนวน10,000คำ 5.สามารถเพมคำและคำอานทตองการได

ระบบสงเคราะหเสยงพดภาษาไทยคณภาพสง

“วาจา”

Page 9: NECTEC E-magazine Vol.4

7การสงเคราะหเสยงพดดวย VAJA 6.0

ดวยคณสมบตของวาจาเวอรชนน จงมการเปด

บรการใหทดลองใชในสองรปแบบ คอ ผานเวบเซอรวส และ

การนำซอฟตแวรไปตดตงเอง เปน stand alone หรอ

เรยกวา วาจา 6.0 Home Edition ภายใตชอ “เจรจา”

(jRaja)เปดใหทดลองใชไดฟรสำหรบการใชงานสวนตวสำหรบ

ผทตองการฟงกชนการทำงานขนสง เชน การเรยกใชงานผาน

API การใชงานผานเวบบรการ การเพมคำเฉพาะ เชน ชอ

บคคลพรอมทงกำหนดคำอานไดอยางอสระเพอใหซอฟตแวร

สามารถแปลงขอความเปนเสยงพดไดตรงกบความตองการ

ของผใช

บรการสาธารณะ

นอกจากนวาจายงมแอปพลเคชนทเปดเปนบรการ สาธารณะดวย คอ VIS ระบบบรการขอมลขาวสารดวยเสยงพด ซงไดแก บรการตอบรบโทรศพทอตโนมตสำหรบ รายงานขอมลจราจรหรอTVISระบบบรการอานขาวอตโนมต ผานเวบไซตและโทรศพท หรอ NVIS, PostVoice บรการโพสตเสยงพดบนsocialnetworkเชนfacebook,twitter

เปนตน

บรการทมาจากระบบสงเคราะหเสยงพด (vaja 6.0) เปนระบบประยกตทสรางขนเปนบรการ

สาธารณะใหผใชภายนอกไดทดสอบใชงาน ไดแก

การดแลของ Intelligent Transporta-

tionAssociationThailand(ITSThai-

land)นำขอมลสภาพจราจรมาสรปความ

ตอบกลบใหผใชฟงดวยเสยงสงเคราะห

TVIS ไดรบความสนใจจาก

ภาครฐและเอกชนหลงจากใหบรการมา

ระยะหนง โดยเฉพาะอยางยงไดมการ

พฒนาตามคำรองขอเพอใชเปนชองทาง

หนงทประชาชนจะเขาถงขาวสารใน

สถานการณฉกเฉน เชน ใชในการให

ขอมลสภาพจราจรยานราชประสงคใน

ชวงการชมนมทางการเมองเมอเดอนเมษายน 2553 และใช

ในการใหขอมลขาวสารตางๆ ทเกยวของกบสถานการณ

นำทวมใหญในเดอนตลาคม2553

ระบบตอบรบอตโนมตสำหรบการรายงานสภาพจราจร (TVIS)

เปนบรการตอบรบโทรศพทอตโนมตสำหรบรายงาน

ขอมลสภาพจราจร โดยใหผใชโทรหมายเลข 02-565-7007

และพดชอถนนทตองการทราบขอมล ระบบจะแปลงเสยง

พดเปนขอความอตโนมตและไปดงขอมลมาจาก http://

traffic.thai.net ซงเปนบรการขอมลสภาพจราจรภายใต

1) TVIS: Traffic Voice Information Service

Page 10: NECTEC E-magazine Vol.4

8 ประจำเดอน เมษายน 2554

นอกเหนอจากการใหบรการผานทาง IVR แลว NVIS

ยงถกพฒนาใหทำงานไดในอกหลายรปแบบเชน เปนซอฟตแวร

สำเรจรปทตดตงบนเครองคอมพวเตอรพซ ซงจะรบขอมลเสยง

จากเครองแมขายอานขาวใหผใชคอมพวเตอรฟงไดตลอดเวลา

และ Real-time ระบบ NVIS ยงใหบรการผาน Web client

ทสามารถทำงานไดบน Browser ทสนบสนน Flash ดงนน

การเรยกใชงานบนโทรศพทมอถอประเภท Android ทม

Browserดงกลาวกสามารถทำไดนอกจากนเนคเทคยงอยระหวาง

การพฒนาNVIS เปนMobileApplicationบน iPhoneซง

จะเพมความสะดวกสบายในการรบฟงขาวสารผานเครอขาย

อนเทอรเนตบนโทรศพทมอถอ

3) POSTVOICE: Social Network Voice Posting Service

เปนบรการสำหรบผใชในกลมSocialNetworkประเภทFacebookและ

Twitter สงเสยงได รบฟงขอความทเขามาแทนการอานขอความ จะเปนประโยชน

ในการตดตามขอมลในบางสถานการณอานไดไมสะดวกนก นอกจากนในการโพสต

ขอความดวยการพมพในหลายสถานการณกทำไดยากเชนในระหวางขบรถระบบ

ประยกตใหมลาสดทเนคเทคไดทดสอบพฒนาขนชอวา POSTVOICE เปนบรการ

โพสตเสยงพดบน Facebookหรอ Twitter ของผใช ซงวธการโพสตเสยงทำได 2

แบบคอ

ก.พมพขอความบนเวบไซตของPOSTVOICEและระบบจะแปลงขอความ

เปนเสยงพดดวยวาจาเวอรชน6.0นำลงกของไฟลเสยงทไดไปโพสตบนFacebook

หรอTwitterอตโนมต

2) NVIS: News Voice Information Service

เปนระบบอานขาวอตโนมต ทใชระบบสงเคราะหเสยงพด

วาจา เวอรชน6.0มคณภาพเสยงดเพยงพอสำหรบการอาน

ขอมลขาวสารใดๆ NVIS จงเปนนวตกรรมทเนคเทคสรางขน

เพอเพมชองทางในการรบขาวสารแบบ Real-time นอกเหนอ

ไปจากการอานขาวผานอนเทอรเนต หรอรบขาวผาน SMS

บนโทรศพทมอถอNVISเปนระบบอตโนมตทรบRSSfeed

ขอความขาวสน จากแหลงขาวตางๆ เชน MCOT ASTV

TPBSและCH7มาแปลงเปนเสยงพดใหบรการผใชทโทรศพท

เขามาทางหมายเลข 02-565-7008 ผใชสามารถเลอกแหลง

ขาวทตองการ เลอกหมวดขาวทแบงไวแลวตามชนดของ

Feedขาวทไดรบมาและรบฟงเสยงอานขาวสนนนๆได

Page 11: NECTEC E-magazine Vol.4

9การสงเคราะหเสยงพดดวย VAJA 6.0

ข.โทรเขามาทหมายเลข02-524-9222และพดขอความ

ทตองการโพสตระบบจะนำไฟลเสยงทบนทกไดไปโพสตบน

FacebookหรอTwitterของผใชโดยอตโนมตการโพสตขอความ

เสยงผาน IVR ในรปแบบทสองน สามารถประยกตใชในสถาน-

การณฉกเฉนทผใชอาจไมสามารถเชอมตออนเทอรเนตแตยง

สามารถใชเครอขายโทรศพทได ระบบ POSTVOICE เปดให

ทดสอบใชงานเปนบรการสาธารณะ

ISAY เปนบรการพนฐานสำหรบการสงเคราะหเสยงพดภาษาไทย

ดวยวาจา เวอรชน 6.0 โดยผใชสามารถพมพขอความใดๆ และกดปมเพอ

แปลงขอความเปนเสยงพดสงทเพมเตมพเศษคอในกรณทผใชพมพขอความ

เปนภาษาอนๆทไมใชภาษาไทยระบบจะสามารถตรวจสอบไดวาเปนภาษาใด

และนำไปแปลเปนขอความภาษาไทยดวยGoogleTranslateแลวสงเคราะห

เสยงพดภาษาไทยของขอความทแปลมาได ชวยใหผใชทเปนชาวตางชาต

สามารถสอสารกบคนไทยได ในกรณทระบบไมสามารถตรวจสอบไดวาเปน

ภาษาใดหรอGoogleTranslateไมรองรบภาษานนๆจะไมสามารถแปลและ

ไมมเอาตพตเสยงภาษาไทยเกดขน

นอกจากน ยงมผลตภณฑขางเคยงทตอบสนอง

การใชงานจรงอกเปนซอฟตแวรสำหรบแปลงเสยงพดเปน

เปนขอความ หรอทเรยกวา “iSpeech” และ ระบบ

ตอบรบโทรศพท หรอ “IAGENT” หรอทเรยกวา Call

center ระบบนเปนนวตกรรมทมมลคา ตอบสนองความ

ตองการของผใชไดหลากหลาย

ภาพการทำงานของ ISAY

4) ISAY: Text-to-Thai Speech Translation Service

Page 12: NECTEC E-magazine Vol.4

10 ประจำเดอน เมษายน 2554

ในระยะ 1 ปทผานมา มผสนใจทงจากภาครฐและ

เอกชน เขามาตดตอเพอนำระบบไปทดสอบใชงาน ตลอดจน

นำไปพฒนาตอยอด เปนระบบบรการในหลายดานตวอยาง

การนำไปใชงาน ไดแก

ดานการแพทยและสาธารณสข

โรงพยาบาลจฬาลงกรณ สภากาชาดไทย รวมกบเนคเทค

พฒนาระบบตดตามดแลผปวยเบาหวานผานโทรศพทมอถอ เปน

ลกษณะการนำไปใชเปนระบบตดตามดแลผปวย โดยผปวยและแพทย

สามารถกำหนดเวลาในการตดตามผลการรกษาและการดแลสขภาพ

ตนเอง เมอถงเวลาทกำหนด ระบบจะโทรออกไปยงผปวยเพอให

ผปวยตอบแบบสอบถามดวยการกดปม พรอมทงแนะนำการดแล

ตนเองทเหมาะสม เนอหาคำถามและคำตอบจะออกแบบไวโดยคณะ

แพทย เมอไดผลการตอบแบบสอบถาม ระบบจะสรปผลแสดงตอ

แพทยประจำผปวยนนรวมทงแจงเตอนโดยทนทหากพบปญหารนแรง

ในขณะทชดคำถามอาจมการเปลยนแปลงไดตามลกษณะผปวยและ

ตามระยะเวลาทแตกตางกน การใชระบบสงเคราะหเสยงพด วาจา

เวอรชน 6.0 จะชวยลดภาระในการสรางระบบอตโนมตได ปจจบน

ระบบนอยระหวางการทดสอบกบผปวยอาสาสมคร

ผงการทำงานของระบบตดตามดแลผปวยเบาหวาน

ผานโทรศพทมอถอ

นอกจากนโรงพยาบาลเทศบาลเชยงใหม ไดนำระบบ

สงเคราะหเสยงพด วาจา เวอรชน 6.0 ไปประกอบใชในระบบเรยก

ควผปวยในโรงพยาบาล ชวยใหสามารถเรยกควดวยการขานชอ-

นามสกลเพมเตมจากเพยงประกาศหมายเลขควเทานนระบบประยกต

การนำไปใชงาน

พดวาจาเวอรชน6.0ปจจบน

ซอฟตแวร pTalk ถกบรรจ

อยในเครองโทรศพทมอถอ

ทมหาวทยาลยธรรมศาสตร

จดสรรไวสำหรบอำนวยความ

สะดวกในการใช ช ว ตของ

นกศกษาทบกพรองทางสายตา

นกำลงไดรบความสนใจจากสำนกงานสาธาณสขเชยงใหมเพอ

นำไปขยายใชงานในอกหลายโรงพยาบาลในภาคเหนอ

ดานการศกษา มหาวทยาลยรามคำแหงนำ วาจา เวอรชน 6.0 ไป

ใชในการสรางเนอหาe-Learningสำหรบการเรยนการสอน

ดานคนพการ เปนเครองมอทชวยอำนวยความสะดวกสำหรบ ผดอยโอกาส โดยเฉพาะผพการทางสายตารวมถงผบกพรอง ทางการเรยนร (LearningDisability, LD) ซงมความจำเปน ตองใชเสยงชวยในการตดตอสอสาร วาจา เวอรชน 6.0 ถกนำไปใชประกอบในซอฟตแวรประยกตจำนวนหนง ไดแกโปรแกรมคนหาคำศพทไทย โปรแกรมชวยสะกดคำไทย ซง นอกจากจะแสดงรายการคำบนหนาจอแลวยงแสดงเสยงอาน คำศพทดวยชวยใหผบกพรองทางการเรยนรสามารถเขาใจคำศพทไดดขนรายละเอยดเพมเตมดไดทhttp://www.ldtha-icommunity.com

ICU Talkเปนโปรแกรมคอมพวเตอรทชวยใหผปวย ทมปญหาในการออกเสยง สามารถสอสารกบผคนไดดวยการ ใชเสยงสงเคราะหทไดจากวาจาทประกอบอยในโปรแกรม ปจจบนไดทดสอบใชงานอยทโรงพยาบาลศรราช

pTalk ซอฟตแวรททำงานบนเครองโทรศพทมอถอ แบบ Windows Mobile ใชสรางเสยงสงเคราะหจาก ขอความตางๆบนเครองเชนอานอเมลแสดงเสยงตวเลขปมกดเปนตน pTalk เปนความรวมมอระหวางเนคเทคกบสถาบน เทคโนโลยนานาชาตสรนธรมหาวทยาลยธรรมศาสตร โดยใช

องคความรและทรพยากรบางสวนจากระบบสงเคราะหเสยง

Page 13: NECTEC E-magazine Vol.4

11การสงเคราะหเสยงพดดวย VAJA 6.0

ดานโทรคมนาคม

ตลาดทางดานโทรคมนาคมเปนตลาดใหญทสดของ

การใชงานระบบสงเคราะหเสยงพด คอใชในระบบ IVR หรอ

Call center เพอใหขอมลทมเปลยนแปลง Real-time อยเสมอ

ศนยประชมแหงชาตสรกต ไดนำซอฟตแวรไปใชในการรายงาน

สภาพจราจร รวมทงใหขอมลการแสดงทมในศนยฯ นอกจากน

เนคเทคไดนำมาใชในระบบตอบรบโทรศพทอตโนมต (NECTEC

Call Center) ทหมายเลข 02-524-9200 เพอใหขอมลงานวจย

และพฒนาตลอดจนขอมลองคกร

ดานสอสารมวลชนและดานบรการขอมลขาวสารสาธารณะ

ประโยชนอกประการหนงของระบบสงเคราะหเสยงพด

คอ การใหขอมลขาวสารดวยเสยงพด ตวอยางการนำไปใชงาน

ไดแก หนงสอพมพผจดการออนไลน และเดอะเนชน ไดเคย

ทดสอบเชอมตอWebserviceเพอเรยกใชบรการวาจา6.0โดยสง

เนอหาขาวทแสดงบนเวบไซตมาแปลงเปนเสยงพดใหผใชสามารถ

คลกเพอรบฟงขาวได นอกจากน กรมสรรพากรไดประยกตใชใน

ลกษณะเดยวกน คอนอกจากใหขอมลขาวตางๆ ของกรมดวย

ขอความแลวยงมคลปเสยงใหผใชสามารถกดเพอฟงแทนการอานได

ตดตอ/ปรกษา

ฝายพฒนาธรกจและทอดเทคโนโลยศนยเทคโนโลย

อเลกทรอนกสและคอมพวเตอรแหงชาต(เนคเทค)

NECTEC CallCenter 02-524-9200 ตดตอ

โดยตรงไดท คณสธาทพย เกรยงโรจนกล โทร :

02-564-6900 ตอ 2348 คณจราภา ศรไสย ตอ

2334 หรอรายละเอยดงานวจยไดท : http://

www.hlt.nectec.or.th, http://vaja.nectec.

or.th

Page 14: NECTEC E-magazine Vol.4

12 ประจำเดอน เมษายน 2554

TechTrend

เทคโนโลยสงเคราะหเสยงพดText-to-speech synthesisสำหรบ VAJATM 6.0

sawasdee

เทคโนโลยสงเคราะหเสยงพด เปนเทคโนโลยทสามารถ

สรางเสยงคำพดใดๆ ไดตามความตองการ ซงในการใชงานสวนใหญ

จะตองใชงานรวมกบเทคโนโลยดานการประมวลผลภาษา (Lan-

guage Processing Technology) ทำใหไดเทคโนโลยสงเคราะห

เสยงจากขอความ (Text-to-Speech Synthesis: TTS) ซงเปน

เทคโนโลยประเภทปญญาประดษฐ ทชวยแปลงขอความอนพตเปน

เสยงพดหรอเสยงอานไดโดยอตโนมต สามารถนำไปประยกตใชกบ

ขอความภาษาไทย เพอหาวธอานขอความแลวแปลงขอความจาก

ตวหนงสอภาษาไทยใหเปนเสยงพดภาษาไทย ซอฟตแวรสงเคราะห

เสยงพดภาษาไทยคณภาพสงสามารถสงเคราะหเสยงพดภาษาไทย

ไดทกคำ เนองจากมสวนวเคราะหคำอานทสามารถวเคราะหได

แมแตคำทไมเคยปรากฏในพจนานกรม นอกจากนผใชสามารถเพม

คำเฉพาะเชนชอบคคล พรอมทงกำหนดคำอานไดอยางอสระ เพอ

ใหซอฟตแวรสามารถแปลงขอความมาเปนเสยงพดไดตรงกบความ

ตองการของผใช นอกจากนยงสามารถสรางเปนซอฟตแวรไลบราร

ทสะดวกสำหรบผนำไปพฒนาตอ

Page 15: NECTEC E-magazine Vol.4

13การสงเคราะหเสยงพดดวย VAJA 6.0

VajaจงเปนการนำเทคโนโลยใหมของTTSทสามารถสงเคราหเสยงไดคลายมนษยยงขนกวาเวอรชนเดมอยางชดเจน ทำใหการคนควาวจยและ พฒนาเทคโนโลยทเกยวของกบภาษาของมนษยในรปแบบเสยงและภาษาเขยน มความสำคญสำหรบการตดตอสอสารของมนษย การประมวลผลภาษาจงม ความนาสนใจอยางยงและผลลพธของการวจยและพฒนานจะสามารถประยก

ตใชในงานตางๆ ไดอยางกวางขวางชวยลดชองวางในการสอสารตางภาษาและ

เพมประสทธภาพในการเขาถงขอมลขาวสารไดอยางทวถงและเทาเทยมการวจย

และพฒนาวทยาการสำหรบการประมวลผลเฉพาะสำหรบภาษาไทย

เทคโนโลยสำหรบ VAJATM 6.0

เทคโนโลยประมวลผลเสยงพด (Speech Processing Technology)

เปนเทคโนโลยซงเกยวกบภาษาในรป

แบบของเสยง ไดแก การรจำเสยงพดภาษาไทย

การสงเคราะหเสยงพดภาษาไทย ซงมจด

มงหมายเนนการทำวจยพนฐานเพอนำไปตอ

ยอดในการพฒนานวตกรรมตางๆในเชงพาณชย

เชนโปรแกรมอานอเมล(MailTalk)เวบบรการ

ขอมลสอสารโดยใชเสยงพด(VIEW)

เทคโนโลยโครงสรางพนฐานสารสนเทศอจฉรยะ (Intelligent Information Infrastructure Technology)

เปนเทคโนโลยดานการวจยและพฒนา

เทคนครวมถงระบบตางๆ ทเกยวของกบเทคโนโลย

สารสนเทศตงแตระบบการจดการฐานขอมล(Data-

baseManagementSystem)ระบบสบคนขอมล

(Information Retrieval System) ไปจนถงการ

วเคราะหฐานขอมลขนาดใหญ (Data Mining)

รวมทงการวจยเพอหาเทคนคตางๆทจะทำใหระบบ

สารสนเทศมความอจฉรยะมากยงขนเชนโครงสราง

สารสนเทศเชงความหมาย (Ontology) และ

การประมวลผลสารสนเทศเชงกราฟก (Information

Visualization)

ทรพยากรภาษาและเครองมอ(Language Resources and Tools)

เปนเทคโนโลยเพอวจยและพฒนาทรพยากร ภาษาทจำเปนสำหรบการวจยและพฒนาเครองมอ

พนฐานตลอดจนเครองมอประยกตทางการประมวล

ผลภาษาและเสยงพด ผลการวจยไดแก คลงขอมล

เสยงพด คลงขอความทไดรบการกำกบอยางเปน

ระบบ และเครองมอพนฐาน เชน ระบบแบงคำ

ภาษาไทย

นอกจากเทคโนโลยท ใชกบวาจาแลว

ยงจำเปนตองมเทคโนโลยอนๆ รวมในการพฒนา

ดวยไดแก

เทคโนโลยประมวลผลขอความ (Text Processing

Technology)

เปนเทคโนโลยเพอวจยและพฒนาการแปลภาษา

เขยนอตโนมตในระดบคำและขอความใหมความถกตองสง

สามารถใชงานไดกบการแปลหลายภาษา ซงเปนการผสม

ผสานวธการแปลในรปแบบตางๆกนทงการใชกฎไวยากรณ

ตวอยาง และสถต นอกจากนยงรวมถงวธการวดประสทธ-

ภาพของระบบแปลภาษา

Page 16: NECTEC E-magazine Vol.4

14 ประจำเดอน เมษายน 2554

1) ระบบรจำเสยงพด “ไอสปช” (ISPEECH)

ไอสปชเปนซอฟตแวรสำหรบแปลงเสยงพดเปน

ขอความ ปจจบนม 2 เวอรชนคอ เวอรชน W 1.5

รองรบเสยงพดคำโดด โดยผใชสามารถสรางชดคำศพทท

ตองการใหระบบรจำไดงายมความถกตองของการรจำเกน

กวา 90%ภายใตสภาวะแวดลอมการใชงานแบบสำนกงาน

และจำนวนคำศพทประมาณ 100 คำ เวอรชน R1.0

รองรบเสยงพดตอเนองเปนประโยค โดยผใชตองกำหนด

ไวยากรณของประโยคทผใชสามารถพดไดเพอความสะดวก

ในการสรางระบบรจำเสยงพดไอสปชถกพฒนาใหบรการ

ทงในเวอรชน Stand-alone และ Web service เชน

เดยวกบระบบวาจาเวอรชน6.0

2) ระบบตอบรบโทรศพท “ไอเอเจนต” (IAGENT)

ประโยชนของการประยกตใชเทคโนโลยสงเคราะหเสยงพด ไดแก

สามารถนำเทคโนโลยสงเคราะหเสยงพดมาแปลงขาวสารอเลกทรอนกสทมปรมาณมากและมการปรบเปลยนตลอดเวลาเชน การสงขาวสารผานขอความเสยง (voicemessage) การรายงานขาวการวเคราะหหน มาเปนเสยงพด เพอใหผรบ ขาวสารไดรบขาวทนทโดยสะดวก

สามารถเผยแพรขาวสารผานเครอขายพนฐานทมอยแลวเชนเครอขายโทรศพทบานโทรศพทมอถอและอนเทอรเนตซงการเผยแพรทางเสยงเปนวธการพนฐานทเขาถงไดทกเครอขายโดยไมตองการอปกรณเพมเตม

ผรบขาวสารสามารถรบขาวสารโดยไมตองละจากกจกรรมททำอย โดยเฉพาะอยางยงในกรณทผรบอยในภาวะทกอใหเกดอนตรายไดเชนขณะขบขรถยนต

สามารถประยกตใชกบอปกรณสอสารอนๆ เชน ผใชบรการสามารถสงขอมลโดยโทรสาร ในขณะทผรบปลายทางสามารถ รบฟงขอความบนเอกสารโดยโทรศพททวไป

การเพมโอกาสใหคนพการเชนโปรแกรมอานขอมลเพอคนตาบอดหรออปกรณชวยพดแทนคนใบ

ใชเทคโนโลยสงเคราะหเสยงพดและเทคโน-

โลยรจำเสยงพด คอระบบตอบรบโทรศพท (Inter-

active Voice Response, IVR) หรอทเรยกวา

คอลลเซนเตอร(Callcenter)มการพฒนาระบบIVR

พนฐานตอยอดมาจากOpen-sourceAsteriskโดย

เพมเตมคณสมบตในการเชอมตอกบวาจาเวอรชน6.0

และ ไอสปช การใชงานในหลายสถานการณม

ความตองการตงระบบอยางเรงดวนเชนตงระบบตอบ

รบโทรศพทในการบรหารจดการภยพบต ไอเอเจนต

จงถกพฒนาในรปแบบเวบ และม User interface

ทสะดวกอยางยงในการสราง และแกไขเนอหาคำถาม

คำตอบทจะแสดงในระบบตวอยางหนาจอการทำงานของ IVR Agent 1.0

Page 17: NECTEC E-magazine Vol.4

e-Magazine Contact Email : [email protected]