แค๊ปช่าภาษาไทย thai captcha · 2012. 7. 10. ·...

101
แค๊ปช่าภาษาไทย THAI CAPTCHA เกษรินทร์ ชาวเกวียน Ketsarin Chawgien วิทยานิพนธ์ฉบับนี เป็นส่วนหนึ งของการศึกษา ตามหลักสูตรวิทยาศาสตรมหาบัณฑิต สาขาเทคโนโลยีสารสนเทศ คณะวิทยาการและเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีมหานคร ปีการศึกษา 2554

Upload: others

Post on 31-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

แคปชาภาษาไทย

THAI CAPTCHA

เกษรนทร ชาวเกวยน Ketsarin Chawgien

วทยานพนธฉบบน เปนสวนหน'งของการศกษา ตามหลกสตรวทยาศาสตรมหาบณฑต

สาขาเทคโนโลยสารสนเทศ คณะวทยาการและเทคโนโลยสารสนเทศ

มหาวทยาลยเทคโนโลยมหานคร ปการศกษา 2554

Page 2: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

I

หวขอวทยานพนธ แคปชาภาษาไทย

นกศกษา นางสาวเกษรนทร ชาวเกวยน รหสนกศกษา 5317670022 ปรญญา วทยาศาสตรมหาบณฑต สาขาวชา เทคโนโลยสารสนเทศ ปการศกษา 2554 อาจารยผควบคมวทยานพนธ ดร.วรพล ลลาเกยรตสกล

บทคดยอ

เวบไซตตางๆ ในปจจบน ท4เปดโอกาสใหผใชสามารถสงขอมลไปยงเคร4องแมขายได เชนเวบไซตท4มการสมครสมาชกหรอเวบไซตท4มเวบบอรด เปนตน เวบไซตเหลาน<มกตกเปนเปาหมายของการโจมตโดยการใชบอท เพ4อสรางขอมลท4ผควบคมบอท ตองการไปยงเคร4องแมขายของเวบไซตน <นๆ ซ4งอาจจะเปนการโพสตขอความขายของหรอการสมครสมาชกปลอมเปนตน จากการสารวจพบวาบอทท4โจมตตามเวบไซตตางๆ มาจากการภายนอกประเทศไทยเปนหลก

วทยานพนธน<จงนาเสนอเทคนคของการสรางแคปชาโดยใชตวอกษรภาษาไทยและเพ4อขยายความสามารถของแคปชาจงสรางตวเลอกโดยการเพ4มตวอกษรภาษาองกฤษ เพ4อท4จะแบงแยกผใชท4เปนมนษยและผใชท4เปนบอทออกจากกน นอกจากน <นยงมการใสการทางานทางคณตศาสตรอยางงาย เชน การบวก,การลบ,การคณ และใสการรบกวนโดยการสมสรางจดและสมสรางเสน รวมถงการหมนเปล4ยนทศทางของขอความตวอกษร เพ4อเพ4มประสทธภาพของแคปชาท4ไดจดทาข<น

ผลการดาเนนงานในวทยานพนธแสดงถงการวเคราะหการใชโปรแกรมโอซอาร สาหรบการสรางแคปชาภาษาไทย และการใชโปรแกรมโอซอารในการแปลความหมายของแคปชาท4ไดจดทาข<น ซ4งพบวาโปรแกรมโอซอาร ท4นามาทดสอบไมสามารถแปลความหมายของแคปชาได

Page 3: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

II

Project Title Thai CAPTCHA

Student Miss. Ketsarin Chawgien Student ID 5317670022 Degree Master of Science Major Information Technology Year 2011 Thesis Advisor Woraphon Lilakiatsakun

Abstract

Currently, there are many websites that allow users to upload information to their servers such as member registration forms, webboard and etc. These websites are targeted by bots to create bogus information, i .e. sales or fake member registration, manipulated by bot-master. By surveying, we found that bots attacking on several websites always come from places outside Thailand.

As a result, this thesis proposes the new technique to construct CAPTCHA by using Thai characters. However, to extend capabilit ies of the CAPTCHA, English characters are also used. In addition, simple mathematic functions such as plus, minus, multiply are deployed while dots and lines are randomly inserted as background noise including the rotation of the characters to enhance efficiency. The results show analysis of OCRs on proposed CAPTCHA to construct Thai CAPTCHA and also show that they cannot translate the proposed CAPTCHA.

Page 4: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

III

กตตกรรมประกาศ

วทยานพนธฉบบน<สามารถสาเรจไดตามความมงหมาย ซ4งไดร บความกรณาจากอาจารยท4ปรกษาวทยานพนธ ดร.วรพล ลลาเกยรตสกล ท4ไดเสนอแนะแนวทางในการดาเนนการวจย รวบรวมแกไข และตรวจสอบขอผดผลาดในระหวางการจดทา รวมท <งขอขอบคณคณาจารยทกๆทานท4ไดใหความชวยเหลอในเร4องขอมลตางๆ ในงานวจยฉบบน<

สดทายน<ขาพเจาขอกราบขอบพระคณบดา มารดา และบาทหลวงอนสรณ พงษสวสด k ผซ4งใหการสนบสนนและใหกาลงใจสาหรบการศกษาในคร <งน< รวมถงเพ4อนๆ รนพ4 และบคคลท4มไดกลาวถง ขอขอบคณ ท4คอยใหความชวยเหลอและใหกาลงใจเสมอมา

เกษรนทร ชาวเกวยน

Page 5: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

IV

สารบญ

หนา บทคดยอภาษาไทย ............................................................................................................ I บทคดยอภาษาองกฤษ ...................................................................................................... II กตตกรรมประกาศ ............................................................................................................ III สารบญ............................................................................................................................. IV สารบญตาราง ................................................................................................................... VI สารบญรป ........................................................................................................................ IX บทท4 1 บทนา.................................................................................................................... 1

1.1 ความเปนมา ................................................................................................... 1 1.2 ความสาคญของปญหา .................................................................................... 2 1.3 วตถประสงคของงานวจย ................................................................................ 2 1.4 ขอบเขตของโครงการ ...................................................................................... 2 1.5 ประโยชนท4คาดวาจะไดรบ ............................................................................. 3 1.6 วธการท4นาเสนอ ............................................................................................. 3 1.7 โครงสรางของวทยานพนธ .............................................................................. 3

บทท4 2 ทฤษฎและงานอ4นๆท4เก4ยวของ............................................................................... 5

2.1 แคปชา (CAPTCHA) ...................................................................................... 5 2.2 บอท(BOT) ..................................................................................................... 7 2.3 โอซอาร(OCR) ................................................................................................ 7 2.3.1 โครงสรางประเภทโอซอาร .................................................................... 8 2.3.2 โครงสรางระบบโอซอาร ...................................................................... 11 2.4 งานวจยท4เก4ยวของ ....................................................................................... 14 2.5 สรปทายบท .................................................................................................. 16

บทท4 3 วธการท4นาเสนอ .................................................................................................. 17

3.1 องคประกอบของแคปชา ............................................................................... 17 3.2 ข <นตอนการทางานของแคปชาท4นาเสนอ ....................................................... 22 3.3 สรปทายบท .................................................................................................. 25

Page 6: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

V

สารบญ (ตอ)

หนา บทท4 4 การทดลอง .......................................................................................................... 26

4.1 สภาพแวดลอมของการทดลององคประกอบของแคปชา ................................. 26 4.1.1 ขอมล พยญชนะ ตวอกษรท <งหมดท4ทาการทดลอง………………....26

4.1.2 วธการคานวณผลการทดลอง………………………...……………....27

4.1.3 การทดลองผลการดาเนนการระหวางแคปชาภาษาไทยกบ โปรแกรม ArnThai ......................................................................... 28 4.1.4 การทดลองผลการดาเนนการระหวางแคปชาภาษาองกฤษกบ โปรแกรม FreeOCR .................................................................... 45 4.1.5 การทดลองผลการดาเนนการระหวางแคปชาภาษาองกฤษกบ โปรแกรม Softi FreeOCR ........................................................... 62 4.2 สภาพแวดลอมการของการทดลองโปรแกรมแคปชา ในกรณเลอกเปนภาษา ไทย….…………………………………………………………………………....78

4.2.1 การทดลองผลการทางานโดยการปอนผลลพธท4ผดผลาด……..…...78

4.2.2 การทดลองผลการทางานโดยการปอนผลลพธท4ถกตอง…………...79

4.3 สภาพแวดลอมการของการทดลองโปรแกรมแคปชา ในกรณเลอกเปนภาษา องกฤษ…...……………………………………………………………….....…...80

4.3.1 การทดลองผลการทางานโดยการปอนผลลพธท4ผดผลาด……..…...81

4.3.2 การทดลองผลการทางานโดยการปอนผลลพธท4ถกตอง……….……82

4.4 การเพ4มการรบกวนโดยการปรบสตวอกษรและสของการรบกวนบนพ<นหลง… 83 4.5 การเปรยบเทยบแคปชาท4สรางข<นกบแคปชาท4ใชท 4วไป………………………..83

4.5.1 การเปรยบเทยบแคปชาท4เปนภาษาไทย…………………………….84

4.5.2 การเปรยบเทยบแคปชาท4เปนภาษาองกฤษ…..……………………..85

4.6 สรปทายบท .................................................................................................. 87

บทท4 5 สรปผลกการทดลองและงานในอนาคต ................................................................. 88 5.1 สรปผลการทดลอง ........................................................................................ 88 5.2 แนวทางในการศกษาในอนาคต ..................................................................... 90

เอกสารอางอง.................................................................................................................. 91 ภาคผนวก ....................................................................................................................... 92

Page 7: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

VI

สารบญตาราง

ตารางทB หนา 4.1 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาไทยแบบท4 1 กบโปรแกรม ArnThai ................................................................................................................... 28 4.2 สรปผลการสมสรางจดบนพ<นหลงในชวง 0%-20% ภาษาไทย .................................. 29 4.3 สรปผลการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย .............................. 31 4.4 สรปผลการสมสรางจดบนพ<นหลง 5%และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย ............................................................................................. 32 4.5 สรปผลการสมสรางจดบนพ<นหลง10% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย ............................................................................................. 33 4.6 สรปผลการสมสรางจดบนพ<นหลง 15% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย ............................................................................................. 34 4.7 สรปผลการสมสรางจดบนพ<นหลง 20%และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย…………………………………………………………………..35 4.8 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาไทยแบบท4 2 กบ โปรแกรม ArnThai ................................................................................................................ 36 4.9 สรปผลการสมสรางจดบนพ<นหลง 5%-20% ภาษาไทย ............................................ 38 4.10 สรปผลการสมสรางเสนบนพ<นหลง 0%-20% ภาษาไทย ........................................... 39 4.11 สรปผลการสมสรางจดบนพ<นหลง 5%และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาไทย ............................................................................................. 40 4.12 สรปผลการสมสรางจดบนพ<นหลง 10% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย. ........................................................................................... 41 4.13 สรปผลการสมสรางจดบนพ<นหลง 15% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย…………………………………………………………………..42 4.14 สรปผลการสมสรางจดบนพ<นหลง 20%และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาไทย ............................................................................................ 43 4.15 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท4 1กบโปรแกรม โปรแกรม FreeOCR .............................................................................................. 45 4.16 สรปผลการสมสรางจดบนพ<นหลง 5%-20% ภาษาองกฤษแบบท4 1กบโปรแกรม FreeOCR .............................................................................................................. 46 4.17 สรปผลการสมสรางเสนบนพ<นหลง 0%-20% ของพ<นท4 ภาษาองกฤษแบบท4 1 กบ โปรแกรม FreeOCR .............................................................................................. 48

Page 8: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

VII

สารบญตาราง(ตอ)

ตารางทB หนา 4.18 สรปผลการสมสรางจดบนพ<นหลง 5% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม FreeCR ........................................ 49 4.19 สรปผลการสมสรางจดบนพ<นหลง 10% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม FreeOCR ..................................... 50 4.20 สรปผลการสมสรางจดบนพ<นหลง 15% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาองกฤษแบบท4 1กบโปรแกรม FreeOCR ................................. ….51 4.21 สรปผลการสมสรางจดบนพ<นหลง 20% และการสมสรางเสนบนพ<นหลงในชวง 0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม FreeOCR…………………………..52 4.22 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR .............................................................................................................. 54 4.23 สรปผลการสมสรางจดบนพ<นหลง 5%-20% ภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR……………………………………………………………………………….55 4.24 สรปผลการสมสรางเสนบนพ<นหลง 0%-20% ของพ<นท4 ภาษาองกฤษแบบท4 2 กบ โปรแกรม FreeOCR…………………………………………………………………… 56 4.25 สรปผลการสมสรางจดบนพ<นหลง 5% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR…………………………57 4.26 สรปผลการสมสรางจดบนพ<นหลง 10% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR………………………….58 4.27 สรปผลการสมสรางจดบนพ<นหลง 15% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR………………………….59 4.28 สรปผลการสมสรางจดบนพ<นหลง 20% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR………………………….60 4.29 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท4 2 กบโปรแกรม FreeOCR .........................……………………………………………………………..62 4.30 สรปผลการสมสรางจดบนพ<นหลง 0%-20% ภาษาองกฤษแบบท4 1 กบโปรแกรม Softi FreeOCR…………………………………………………………………………63 4.31 สรปผลการสมสรางเสนบนพ<นหลง 0%-20% ภาษาองกฤษแบบท4 1 กบโปรแกรม Softi FreeOCR ..................................................................................................... 64 4.32 สรปผลการสมสรางจดบนพ<นหลง 5% และการสมสรางเสนบนพ<นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม Softi FreeOCR…………………...65

Page 9: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

VIII

สารบญตาราง(ตอ)

ตารางทB หนา 4.33 สรปผลการสมสรางจดบนพ<นหลง 10% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม Softi FreeOCR…………………...66 4.34 สรปผลการสมสรางจดบนพ<นหลง 15% และการสมสรางเสนบนพ<นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม Softi FreeOCR…………………….67 4.35 สรปผลการสมสรางจดบนพ<นหลง 20% และการสมสรางเสนบนพ<นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท4 1 กบโปรแกรม Softi FreeOCR…………………….68 4.36 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR ................. ...................................................................................70 4.37 สรปผลการสมสรางจดบนพ<นหลง 0%-20% ภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR………………………...………………………………………………..71 4.38 สรปผลการสมสรางเสนบนพ<นหลง 0%-20% ภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR……………………………………………………………………….…72 4.39 สรปผลการสมสรางจดบนพ<นหลง 5% และการสมสรางเสนบนพ<นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR…………………….73 4.40 สรปผลการสมสรางจดบนพ<นหลง 10% และการสมสรางเสนบนพ<นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR…………………….74 4.41 สรปผลการสมสรางจดบนพ<นหลง 15% และการสมสรางเสนบนพ<นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR…………………….75 4.42 สรปผลการสมสรางจดบนพ<นหลง 20% และการสมสรางเสนบนพ<นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท4 2 กบโปรแกรม Softi FreeOCR…………………….76 4.43 ตารางการเปรยบเทยบแคปชาท4เปนภาษาไทย………………………..……………….84 4.44 ตารางการเปรยบเทยบแคปชาท4เปนภาษาไทย………………………..……………….85

Page 10: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

IX

สารบญรป

รปทB หนา 2.1 ตวอยางของโปรแกรม reCAPTCHA .......................................................................... 5 2.2 ตวอยาง แคปชา โดย GZ-GIMPY ............................................................................. 6 2.3 โครงสรางของประเภทโอซอาร ................................................................................... 8 2.4 อปกรณรจาแบบออนไลน ........................................................................................... 9 2.5 ตวอกษรท4มสวนเช4อมตดกนและขาดจากกน .............................................................. 9 2.6 โครงสรางท 4วไปของระบบโอซอาร ........................................................................... 10 2.7 โครงสรางของโครงขายประสาทเทยม ...................................................................... 13 2.8 ตวอยางโปรแกรมการใชขอความตวอกษรและภาพ .................................................. 15 2.9 ตวอยางโปรแกรมโดยการใชเสยงและภาพ ............................................................... 16 3.1 องคประกอบของแคปชาท4นาเสนอ ........................................................................... 17 3.2 ตวอกษรแบบท4 1 ภาษาไทย .................................................................................. 18 3.3 ตวอกษรแบบท4 1 ภาษาองกฤษ .............................................................................. 18 3.4 ตวอกษรแบบท4 2 ภาษาไทย .................................................................................. 18 3.5 ตวอกษรแบบท4 2 ภาษาองกฤษ .............................................................................. 18 3.6 การแบงพ<นท4ในแนวระนาบ ...................................................................................... 20 3.7 ไมมการหมน 0 องศา .............................................................................................. 20 3.8 การหมนตวอกษรท4 -15 องศา .................................................................................. 20 3.9 การหมนตวอกษรท4 15 องศา ................................................................................... 21 3.10 การหมนตวอกษรท4 -30 องศา .................................................................................. 21 3.11 การหมนตวอกษรท4 30 องศา .................................................................................. 21 3.12 การหมนตวอกษรท4 -45 องศา .................................................................................. 21 3.13 การหมนตวอกษรท4 45 องศา ................................................................................... 21 3.14 การหมนตวอกษรท4 -60 องศา .................................................................................. 21 3.15 การหมนตวอกษรท4 60 องศา .................................................................................. 21 3.16 การหมนตวอกษรท4 -75 องศา ................................................................................. 21 3.17 การหมนตวอกษรท4 75 องศา ................................................................................... 21 3.18 โฟลวชารตการทางานของ แคปชา ท4นาเสนอ .......................................................... 22 3.19 โฟลวชารตกระบวนการทางานของโปแกรมท4นาเสนอ .............................................. 24 4.1 ตวอยางหนาจอโปรแกรม ArnThai ท4มการใสแคปชาภาษาไทย................................ 28 4.2 ตวอยางหนาจอโปรแกรม FreeOCR ท4มการใสแคปชาภาษาองกฤษ………………...45

Page 11: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

X

สารบญรป (ตอ)

รปทB หนา 4.3 ตวอยางหนาจอโปรแกรม Softi FreeOCR ท4มการใสแคปชาภาษาองกฤษ ............... 62 4.4 หนาจอแสดงผล Thai CAPTCHA ท4นาเสนอ ............................................................ 78 4.5 (ก) หนาจอการปอนขอมลท4ผดพลาด ....................................................................... 79 4.5 (ข) หนาจอผลลพธการปอนขอมลท4ผดพลาด ............................................................ 79 4.6 (ก) หนาจอการปอนขอมลท4ถกตอง .......................................................................... 80 4.6 (ข) หนาจอผลลพธการปอนขอมลท4ถกตอง............................................................... 80 4.7 หนาจอแสดงผล English CAPTCHA ท4นาเสนอ ....................................................... 81 4.8 (ก) หนาจอการปอนขอมลท4ผดพลาด ....................................................................... 81 4.8 (ข) หนาจอผลลพธการปอนขอมลท4ผดพลาด ............................................................ 82 4.9 (ก) หนาจอการปอนขอมลท4ถกตอง .......................................................................... 82 4.9 (ข) หนาจอผลลพธการปอนขอมลท4ถกตอง .............................................................. 83 4.10 การเพ4มการรบกวนโดยการปรบสใหใกลเคยงกน .................................................... 83

Page 12: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

1

บทท� 1

บทนา

1. 1 ความเปนมา ในปจจบน การทางานในรปแบบเวบไซดไดมสวนสาคญในการดาเนนธรกจ ขอมลสวนตวตางๆจาเปนตองไดรบการปกปองจากเจาของเวบไซดหรอผดแลระบบ ท +งน+กยงมผไมหวงดตองการนาขอมลเหลาน +นมาเพ.อหวงผลประโยชน มการนาวธการเพ.อลวงความลบขอมลสวนตวตางๆมากมาย เชน ฟชช.ง(phishing) , บอท(bot) , สปายแวร(spyware) , เมลแวร(malware) เปนตน

เวบไซดตางๆจะมการใหผใชทาการกรอกขอมลเพ.อสงไปยงเคร.องแมขาย เพ.อประมวลผล หรอจดเกบตอไปและมความพยายามท.จะหาวธการท.ผใชไมตองทาการสรางขอมลเอง โดยการสรางโปรแกรมท.ทาการสรางขอมลเหลาน+ข +นมาเอง โดยท.ผใชไมตองกรอกขอมลเอง โปรแกรมลกษณะน+เรยกวา บอท โดยปกตแลว บอท ถกใชแพรหลายในหลายๆเร.อง เชนการชวยคนหาขอมลตางๆของเวบไซตกเก+ล [1] การใชบอทเพ.อชวยเลนเกม แตปญหาท.เกดข+นสวนใหญกคอการใชบอทเพ.อปลอมตวในการสมครสมาชกทางเวบตางๆ หรอ การใชบอทสรางขอมลบนเวบบอรด หรอ เวบบลอกเพ.อลอลวงใหเช.อมโยงไปยงเวบไซตท.ผควบคมบอทตองการ ซ.งจะทาใหเกดความเสยหายในกรณท.นาขอมลไปใชในทางท.ไมถกตอง

จากปญหาท.ไดกลาว จงทาใหตองหาวธปองกนบอทท.บางคร +งอาจทาใหเกดความเสยหาย ซ.งเปนภยคกคามท.ตวเราเองสามารถควบคมได แตเพราะเน.องดวยระบบคอมพวเตอรไมสามารถวเคราะหขอมลจรงเทจไดเองอตโนมต จงจาเปนตองหาวธสรางข +นตอนการตรวจสอบ เพราะฉน +นจงนามาซ.งความคดท.วาใหมนษยชวยในการตดสนใจ เพ.อเพ.มมาตรการปองกนปญหาในระบบสบคนหาหรอปอนขอมลอตโนมต ซ.งวธการดงกลาวบอทไมสามารถดาเนนการดวยตวเองได ดงน +นจงไดพฒนากลไกลเพ.อปองกนการทางานบอท ส.งท.ถกพฒนาคอ แคปชา(CAPTCHA) มาจาก Completely Automated Public Turing Computer and Humans Apart แปลใหเขาใจงายๆ กคอ กลไกอตโนมตท.ใชทดสอบเพ.อใหทราบวา มนษย หรอ บอท กาลงดาเนนกจกรรมน +น ๆ สรปแลวกคอ มนเปนการทดสอบการตอบสนองโดยใชทดสอบกบระบบคอมพวเตอร เพ.อตดสนใจวา ผใชหรอผท.กาลงตดตอกบเวบเซฟเวอร เปนมนษยหรอไม [3] ซ.ง แคปชาจะตองอาศยมนษยและตวอกษรเพ.อยนยนตวตนอกคร +ง และเวบไซตตางๆเชน Google, Ebay เปนตน ไดนาไปใชงานอยางแพรหลาย อยางไรกตามงานวจยเก.ยวกบระบบปองกนหลายงาน [4] ไดแสดงถงจดออนของเทคนคตางๆบน แคปชา ท.มการใชงานอยในขณะน+ ดงน +นในน+จงนาเสนอแนวการคดสรางแคปชา ภาษาไทยเพ.อ

Page 13: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

2

ปองกนการโจมตจากบอทตางๆท.ใชภาษาสากล โดยจากเวบไซดท .วไปไดนาระบบปองกนการโจมตของ บอทแตกตางกนออกไป แตท.ไมแตกตางคอภาษาท.ใชยงคงเดมคอ A-Z,0-9 และเน.องดวยบอทมการพฒนาอยางตอเน.อง ทาใหมความสามารถอานภาษาท.ผดเพ+ยนไดมากข+น เราจงตองมการพฒนาแคปชาเพ.อใหสามารถปองกนบอทดวยเชนกน 1.2 ความสาคญของปญหา ปจจบนบอทจากตางประเทศท.มอยแพรหลายไดแพร เขา มาโจมตเครอขายภายในประเทศไทยมากมายทาใหเกดความเสยหายเปนจานวนมาก การโจมตของบอทจากตางประเทศท.ทาใหเกดความความเสยหายตอเวบไซต ท +งยงทาใหเกดความราคาญในรปแบบตางๆเชน เวบโฆษณาเชญชวนหรอ ปอบอพท.จาเปนตองตอบสนอง เหลาน+เปนเพยงสวนนอย มบอทจานวนมากท.มความสามารถในการแอบแฝงเขาไปในเวบไซต โดยจากสรางไอดปลอม หรอ ดกจบขอมลผานการสมครสมาชกบนเวบไซต แตเวบไซตเองกมความสามารถในการปองกนในระดบหน.ง น .นคอการใหสมาชกเวบไซตไดแสดงตวตนวาบคคลเหลาน +นมอยจรงน .นเอง แตท +งน+ท +งน +น ในเม.อมการปองกนมากข+น การโจมตกมมากข+นดวย มการพฒนาบอทใหมความสามารถในการรองรบภาษามนษยไดมากข+นภาษาสากลท.ใชกนโดยท .วไปเร.มมจดบกพรองบอทเร.มขยายความสามารถอานวเคราะหภาษาสากลท.ผดเพ+ยนไดมากข+น จงเปนท.มาของการพฒนาแคปชารปแบบภาษาทองถ.นคอ แคปชาภาษาไทย เพ.อยากตอการวเคราะหตวอกษรของ บอทจากตางประเทศทางผวจยไดพจารณาแลว ปญหาท.เกดของแคปชา มอยดงตอไปน+

1. เม.อบอทคอมพวเตอรวเคราะหไดดข +น การสรางส.งรบกวนของตวอกษรกตองมมากข+น การอานดวยสายตามนษยกตองอานไดยากข+นดวยเชนกน

2. บอทโดยท .วไปน +นอานและเขยนดวยตวอกษรสากล มความสามารถสงในการวเคราะห เพราะเน.องดวยภาษาสากลใชกนไดท .วโลก มผพฒนาบอทตวอกษรสากลท .วโลกดวยน .นเอง

1.3 วตถประสงคของงานวจย 1.3.1 เพ.อศกษาใหเขาใจหลกการและเทคนคตางๆบนของแคปชา 1.3.2 เพ.อพฒนาแคปชาใหสามารถปองกนจากบอทของตางประเทศ 1.3.3 เพ.อศกษาขอด – ขอเสยของเทคนคตางๆ ของแคปชา

1.4 ขอบเขตของโครงการ

ส.งท.จะดาเนนการในโครงการมดงตอไปน+ 1.4.1 สามารถพฒนาแคปชาปองกนการโจมตจากบอทของตางประเทศได

Page 14: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

3

1.4.2 สามารถพฒนาใหมนษยใชงานไดงายโดยใชความรทองถ.น

1.5 ประโยชนท�คาดวาจะไดรบ 1.5.1 ทาใหทราบถงเทคนคตางๆ ของแคปชา 1.5.2 ทาใหสามารถปองกนการโจมตจากบอทของตางประเทศได 1.5.3 ทาใหทราบถงขอด ขอเสยของแคปชา

1.6 วธการท�นาเสนอ จากปญหาท.กลาวมาจงเสนอ แคปชาท.เปนภาษาไทยโดยการใชความรทองถ.นและเน.องจากวาการสรางตวอกษรภาษาไทยเพยงอยางเดยวอาจจะสามารถใชโปรแกรมโอซอาร ท.มการเผยแพรอานได [10] จงไดมการเพ.มสวนการคานวณทางคณตศาสตรและเพ.มสวนการรบกวนในโครงสรางการทางานของ แคปชา ท.จะนาเสนอ และยงขยายความสามารถของแคปชา ใหผใชท.ไมใชคนไทยสามารถใชได โดยการเพ.มตวเลอกท.เปนภาษาองกฤษเขาไปในโปรแกรม โครงสรางของแคปชาท.นาเสนอจะประกอบไปดวย 4 สวน คอ

1. สวนการสรางขอมลท.เปนภาษาไทยหรอภาษาองกฤษ 2. สวนการคานวณทางคณตศาสตร 3. สวนสรางการหมนตวอกษร 4. สวนเพ.มสวนการรบกวนพ+นหลง

สวนท.เปนภาษาไทย และ สวนท.เปนภาษาองกฤษ จะทาการสมคาตวเลขข+นมา 2 ตว และทาการแปลตวเลขใหเปนตวอกษร หลงจากน +นกจะทาการเพ.มสวนการคานวนทางคณตศาสตรคอ บวก ลบ คณ เพ.มการหมนเปล.ยนทศทางของตวอกษร เพ.มสวนการรบกวนพ+นหลงโดยสวนการคานวณพ+นหลงเราจะทาการสมสรางจดและการสมสรางเสนเพ.อใหไดการรบกวนพ+นหลงไมซ+ากนทาใหยากตอการอานของโปรแกรมโอซอารท.มอยในปจจบน และหลงจากน +นกจะเกบผลลพธท.ทาการบวก ,การลบ,การคณ กนไปเทยบกบคาตอบท.ถกตอง

ซ.งจากทาวธการท.จะนาเสนออาจจะทาให โปรแกรมโอซอาร อานไดยากข+น ซ.งน +นกแสดงวาเวบไซตท.นาแคปชาภาษาไทยน+จะมความปลอดภยจากบอทตางประเทศเพ.มมากข+น 1.7 โครงสรางของวทยานพนธ

การจดวางเน+อหาโครงสรางของบทความน+จะเปนลาดบดงตอไปน+ บทท. 2 ทฤษฎและงานอ.นๆท.เก.ยวของ

ประกอบไปดวยการอธบายคาศพท อาทเชน ความหมาย ประโยชน และโครงสรางของ แคปชา หรอ บอท ,โอซอาร รวมถงอธบายทฤษฏตางๆ ท.เก.ยวของกบวทยานพนธน+

Page 15: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

4

บทท. 3 วธการท.นาเสนอ แนวคดท.เสนอคอ การสรางแคปชาภาษาไทย และเพ.อขยายความสามารถของ

แคปชาภาษาไทยสสากล น +นคอผใชท.ไมใชคนไทยกสามารถใชได จงมตวเลอกใหสามารถเปล.ยนเปนภาษาองกฤษไดดวยเชนกนและยงมการเพ.มแนวคดโดยการใชหลกการทางคณตศาสตรและเพ.มการรบกวนพ+นหลงเพ.อใหยากตอการโจมตจากบอท บทท. 4 การทดลอง ในบทน+จะแสดงผลการทดสอบของแคปชาท.ทาการสรางข+นกบโปรแกรมโอซอารท.มอยในปจจบนวาประสทธภาพ ความสามารถเปนอยางไร บทท. 5 สรปผลและงานในอนาคต

ทาการสรปผลการทดลองของแคปชาท.สรางข+นรวมถงส.งท.จะพฒนาในอนาคต

Page 16: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

5

บทท� 2

ทฤษฎและงานอ�นๆท�เก�ยวของ

2.1 แคปชา (CAPTCHA[3]) แคปชา คอการทดสอบเพ�อเขาสระบบคอมพวเตอรแบบโตตอบชนดหน�ง เพ�อทดสอบวาผใชงานเปนมนษยจรงหรอไม (วาไมใชบอทหรอโปรแกรมอตโนมต) คาวา CAPTCHA ยอมาจาก Completely Automated Public Turing Test to tell Computers and Humans Apart ซ�งเปนเทคนคท�ใชแยกผใชท�เปนมนษยออกจากผใชท�เปนเคร�องคอมพวเตอร โดยใชวธการทดสอบ Reverse Turing ตวอยางของการใช แคปชา โดยการใหผใชทาการอานคาขอความท�สามารถเขาใจไดงายแตเคร�องคอมพวเตอรเขาใจไดยาก เชน การอานขอมลตวอกษรตางๆท�อยในลกษณะบดเบNยวและมการรบกวน ดงรปท� 2.1

รปท� 2.1 ตวอยางของโปรแกรม reCAPTCHA [5]

ระบบแคปชาเก�ยวของกบคอมพวเตอรเคร�องหน�งซ�งเปนเคร�องแมขาย จะถามผใชงานดวยการทดสอบอยางหน�งท�สรางขNนมา และผใชจาเปนตองตอบใหถกตองเพ�อใหสามารถเขาสระบบได แตคอมพวเตอรเองน Nนไมสามารถแกปญหาท�ตวมนเองสรางขNนได สามารถตรวจไดแควาถกหรอผดตามท�ระบไวตอนตนเทาน Nน ระบบแคปชา โดยท �วไปจะใหผใชตอบคาถามดวยการกดแปนตวอกษรตามท�ปรากฏในรปภาพท�บดเบNยว บางคร Nงอาจมการเพ�มจด แถบส หรอเสนหงกงอลงในรปภาพน Nน เพ�อวตถประสงคในการหลกเล�ยงการตรวจจบของโปรแกรมประเภทโอซอาร ซ�งอาจแกปญหาท�ทดสอบไดโดยอตโนมต แคปชา อาจใชในการตอบกลบฟอร �มหรอเวบบอรดสาธารณะท �วไปตามอนเทอรเนต ท NงนNเพ�อปองกนบอทหรอโปรแกรมอตโนมตทาการสงขอความไมพงประสงค เชน สแปมหรอโฆษณาตวอยางประโยชนท�ไดรบจาก แคปชา พอสรปไดดงนN

• ปองกนการเขยนความคดเหนบน Blog จาก สแปม โดยกอนท�จะมการยอมรบความคดเหนจะตองผานการทดสอบกอน

• ปองกนการลงทะเบยนบนเวบไซต โดยกอนท�จะมการลงทะเบยนไดจะตองผานการทดสอบกอน

Page 17: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

6

• ปองกนอเมลแอดเดรส จากการคนหาโดยผท�เปน Spammerจะทาการคนหาอ เมลแอดเดรส ท�มการโพสตบนเวบโดยไมมการเขารหสไว แคปชา สามารถปองกนไดโดยผท�จะอานขอมลอเมลแอดเดรสไดจะตองผานการทดสอบกอน

• ปองกนการทา Online Polls ในการลงคะแนนแตละคร Nงผท�ผานการทดสอบโดย แคปชา จงจะสามารถลงคะแนนได

ตวอยางของโปรแกรมท�ใชสรางแคปชา ท�มการนาไปใชงานไดแก reCAPTCHA, SQUIGL-PIX, ESP-PIX และ GZ-GIMPY

รปท� 2.2 ตวอยาง แคปชา โดย GZ-GIMPY

Page 18: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

7

รปท� 2.2 ตวอยาง แคปชา โดย GZ-GIMPY(ตอ)

จากรปท� 2.2 เปนรปตวอยางแคปชาท�ไดถกสรางมาจากโปรแกรม GZ-GIMPY ซ�ง

แคปชาท�สรางออกจะมหลายแบบ

2.2 บอท (BOT) บอท หรอ อนเทอรเนตบอท (Internet bot) คอโปรแกรมอตโนมตสาหรบทาหนาท�อยาง

ใดอยางหน�งบนอนเทอรเนต ซ�งบอทยอมาจากคาวาโรบอท (robot) แปลวาหนยนตบอทท�นยมใชในอนเทอรเนต สาหรบการเกบขอมลจากเวบเพจ เรยก เวบครอวเลอร (web crawler) หรอ สไปเดอร (spider) ทาหนาท�เกบขอมลของเวบน Nนมาทาการวเคราะห เชน กเกลบอท(GoogleBot) เกบขอมลจากเวบตางๆ แลวมาทาดชนของเวบเพ�อใชในเสรชเอนจน

บอทในโออารซหรอในเมสเซนเจอร เปนโปรแกรมอตโนมตท�ตอบคาถามของผใชตางๆ โดยบอทประเภทนNจะนาคาถามของผใชมาประมวลผลตามเง�อนไขและเม�อพบคาตอบท�นาจะเก�ยวของจะสงคาตอบกลบไป หรอถาไมพบคาตอบจะสงขอความวา ไมเขาใจในคาถามใหถามคาถามใหม บอทประเภทนNสามารถตอบคาถามไดหลายประเภท รวมถงการคนหา ท�อย เบอรโทรศพท รายงานสภาพภมอากาศปจจบน ผลการแขงขนกฬา เปนตน

เกมบอทเปนโปรแกรมอตโนมตท�ทาหนาท�ในเกม โดยประพฤตตวเหมอนผเลนคนอ�น โดยในบางคร Nงทางผจดทาเกมจดไว เพ�อไวชวยเหลอหรอตอบคาถามผใชท �วไป และในบางคร NงผใชเองจะใชบอทประเภทนN เลนเกมแทนตวผเลนเอง โดยใหคอมพวเตอรประมวลผลและผใชเฝาดบอทเลนเกมแทน

2.3 โอซอาร (OCR )

โอซอาร (OCR [2,11]) มาจากคาวา Optical Character Recognition คอ กระบวนการทางกลไกหรอทางอเลกทรอนกสเพ�อแปลภาพของขอความจากการเขยนหรอจากการพมพ ไปเปนขอความท�สามารถแกไขไดโดยเคร�องคอมพวเตอร การจบภาพอาจทาโดยเคร�องสแกนเนอร กลองดจทล หรอ การแปลงไฟลภาพเอกสาร ใหเปนไฟลขอความโดยอตโนมต ทาใหไมตองเสยเวลาพมพงาน

Page 19: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

8

ประโยชนท�ไดรบจากการใชโปรแกรม โอซอาร • ประหยดพNนท�จดเกบขอมล เน�องจากไฟลขอความมขนาดเลกกวาไฟลภาพมาก • สะดวกในการปรบแตงและแกไขเอกสาร เน�องจากไฟลขอความสามารถปรบแตงและ

แกไขไดงายกวาไฟลภาพ

2.3.1 โครงสรางประเภทโอซอาร

รปท� 2.3 โครงสรางของประเภท โอซอาร

จากรปท� 2.3 โครงสรางของประเภทโอซอาร สามารถแบงไดเปนกลมๆตามลกษณะ หรอแหลงท�มาของตวอกษร ไดดงนN

การรจาตวอกษรแบบออนไลน (On-line Character Recognition) 1. การรจาตวอกษรแบบออฟไลน (Off-line Character Recognition) 2.1 ตวอกษรโดด (Single Character)

2.1.1 การรจาตวพมพแบบฟอนตเฉพาะ (Printed Fixed-Font Character Recognition)

2.1.2 การรจาลายมอเขยนแบบตวโดด (Isolated Handprint Character Recognition (ICR))

2.2 การรจาลายมอแบบเขยนตอเน�อง (Script recognition)

Optical Character Recognition

(OCR)

2.Off-Line Character

Recognition

1.On-Line Character

Recognition

2.1 Single Character

2.2. Script Recognition

2.1.1 Printed or Fixed-Font

Character Recognition 2.1.2 Handwritten Character

Recognition

Page 20: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

9

1. การรจาตวอกษรแบบออนไลน (On-line Character Recognition) วธการอนพตขอมลของกลมนN ไดมาจากดจไทเซอร หรอปากกาอเลกทรอนกส หรอ ทสสกรน ท�ใชกบเคร�องคอมพวเตอรมอถอ สวนการวเคราะหตวอกษร จะทาในขณะท�มการลากเสน เพ�อเขยนตวอกษร (ออนไลน) ถาจะเทยบความยากงาย กบการรจาลายมอเขยนแบบออฟไลน กลมนNจะงายกวา เพราะจะไดขอมลเพ�มเตมเก�ยวกบทศทาง และลาดบการลากเสนมาชวยดวย โอซอารกลมนNมกมาพรอมกบอปกรณการเขยน ท�มการกาหนดพNนท�ใหอนพตขอมล โดยสวนใหญมกตองเขยนทละตวอกษร โดยมรหสพเศษเพ�อใชในการเขยนตวอกษรแตละตว ความกาวหนาของเทคโนโลยโอซอาร มผลเปนอยางมากตอการเจรญเตบโตของธรกจในวงการเคร�องคอมพวเตอรมอถอ ท�เปนคอมพวเตอรขนาดเลก ซ�งตองอาศยการใสอนพตจากปากกาอเลกทรอนกสแทนคยบอรด ดงรปท� 2.4

รปท� 2.4อปกรณรจาแบบออนไลน

2. การรจาตวอกษรแบบออฟไลน (Off-line Character Recognition) อนพตของระบบเปนภาพของตวอกษร ท�ไดจากเคร�องสแกน อาจจะเปนตวอกษรแบบพมพ หรอแบบเขยน และอาจเปนตวอกษรแบบเด�ยวๆ หรอตดกนเปนกลมตวอกษร ซ�งจาแนกไดดงนN 2.1.ตวอกษรโดด (Single Character) อนพตของระบบเปนภาพของตวอกษรท�เปนตวเด�ยวๆ ไมไดเช�อมตดกบ อกษรตวอ�น ในกลมนN สามารถแบงยอยออกเปน 2 กลม ไดแก 2.1.1 การรจาตวพมพแบบฟอนตเฉพาะ (Printed Fixed-Font Character Recognition) เปนกลมของโปรแกรมท�ใชไดกบตวอกษรประเภทตวพมพท�มการกาหนดกลมของ ฟอนต ซ�งถอวาอยในระดบงายท�สดในดานการพฒนาเทคนคในการทางานของโปรแกรมถง กระน Nนกตาม โปรแกรมในกลมนNกยงประสบกบปญหาท�เกดจากเอกสารคณภาพต�าซ�งจะ สงผลใหไดภาพท�เปรอะเปNอน ทาใหภาพตวอกษรตดกน หรอขาดออกจากกน เหลานN เปน ตวการสาคญ ท�ทาใหอตราความถกตองของโปรแกรมลดลง ดงตวอยางรปท� 2.5

รปท� 2.5 ตวอกษรท�มสวนเช�อมตดกนและขาดจากกน

Page 21: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

10

2.1.2 การรจาลายมอเขยนแบบตวโดด(Isolated Handprint Character Recognition (ICR)) ตวอกษรของกลมนNเปนลายมอเขยนท�มกจะถกกาหนดใหเขยนในกรอบท�จดไว โดย เขยนทละตวแยกออกจากกน ตวอยางงานท�เขาขายกลมนNไดแก โปรแกรมโอซอารท�ใชแยก จดหมายจากรหสไปรษณย ซ�งเปนตวเลขจากลายมอเขยน เปนตน การรจาลายมอเขยน เปนเร�องยากมาก เพราะตวอกษรแตละตว ท�เขยนโดยคนแตละคนมความหลากหลายมาก ถงแมบางคร Nงจะเปนการเขยนโดยคนๆ เดยว การเขยนแตละคร Nงกยงแตกตางกน ดงน Nน โปรแกรมพวกจงมขอกาหนดบางอยาง เชน สามารถอานไดเฉพาะตวเลข หรอสามารถ อานลายมอของคนท�ไดลองเขยนตวอกษรตวอยางใหโปรแกรมรจกกอนเทาน Nน 2.2 การรจาลายมอแบบเขยนตอเน�อง (Script recognition) กลมนNไดโจทยในระดบท�ยากท�สดในจานวนตระกลโอซอารท Nงหลาย เพราะตวอกษรท� โปรแกรมจะตองอานเปนตวอกษรท�เปนลายมอเขยน โดยไมมขอกาหนดใดๆ ผเขยน สามารถเขยนไดตามธรรมชาตอยางตอเน�อง ดงน Nนตวอกษรท�ไดอาจมเสนท�ลากเช�อมตว อกษรหลายๆ ตวใหตดกน และประกอบกบความแตกตางอยางมากของลายมอของคน แตละคน โปรแกรมในกลมนNบางทเรยกวาการรจาลายมอเขยนแบบอสระ (freestyle handwriting recognition) ถงแมจะมผลตภณฑโอซอารกลมนNออกสตลาดบางแลว แตหวขอ นNกยงคงตองการการวจยเพ�มเตมอก 2.3.2 โครงสรางระบบโอซอาร รปท� 2.6 โครงสรางท �วไปของระบบโอซอาร

จากรปท� 2.6 โครงสรางของระบบโอซอารโดยท �วๆ ไปประกอบไปดวยข Nนตอนการทางานหลก 3 ข Nน ซ�งในแตละข NนตอนประกอบดวยรายละเอยดดงตอไปนN 1. ขบวนการประมวลผลข Nนตน (Pre-Processing) 1.1 การกรองขอมลแทรกซอน (Noise Filtering) 1.2. การปรบแตงขอมล (Normalization) 1.3 การตดแบงพNนท�ใชงาน (Cropping) 1.4 การสกดลกษณะสาคญ (Feature Extraction) 2. การรจา (Recognition) 2.1 วธทางการเขาครปแบบ (Template Matching) 2.2 วธทางสถต (Statistical Approach) 2.3 วธการวเคราะหทางโครงสราง (Structural Analysis) 2.4 วธทางโครงขายประสาทเทยม (Neural Network) 3. ขบวนการประมวลผลข Nนปลาย (Post-Processing)

Pre-Processing Recognition Post-Processing

Page 22: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

11

1. ขบวนการประมวลผลข Nนตน (Pre-Processing) ในการทางานของโปรแกรมโอซอารน Nน กอนท�โปรแกรมจะสามารถบอกไดวารปภาพท�สงเขาไปประกอบดวยตวอกษรอะไรบาง จาเปนจะตองผานข Nนตอนท�สาคญหลายข Nน ข NนตอนดงกลาวนNมกถกเรยกรวมกนวา กระบวนการประมวลผลข Nนตน (Pre-Processing) ซ�งเปนข Nนตอนในการปรบแตงและจดเตรยมขอมลใหเหมาะสมกบข Nนตอนการรจาตอไป ข NนตอนเหลานNมความสาคญตอประสทธภาพโดยรวมของระบบ เพราะหากมความผดพลาดเกดขNนในสวนนN กจะสงผลกระทบไปยงสวนถดไปของระบบดวย ข NนตอนการประมวลผลเบNองตนในโปรแกรมโอซอารท�สาคญ ไดแก 1.1 การกรองขอมลแทรกซอน (Noise Filtering) การกรองขอมลแทรกซอนมจดประสงคเพ�อลดทอนสวนของรปภาพท�เปนส�งแปลกปลอมอนไมพงประสงคออกไป โดยขอมลแทรกซอนท�เกดขNนสวนใหญมกจะมาจากคณภาพของเอกสารตนฉบบท�นามาทาการอาน ซ�งเปนตนเหตสาคญท�ทาใหความถกตองของโปรแกรมลดลง จงจาเปนท�จะตองจดการกบสวนเกนเหลานNออกไปใหไดมากท�สดเทาท�จะเปนไปได แตเรายงไมมวธการใดท�รบรองไดวาสามารถจดการกบขอมลแทรกซอนได โดยสมบรณ ดงน NนสวนการรจาของโอซอารกจะตองมความทนทานตอการแทรกซอนเหลานNไดพอสมควร 1.2 การปรบแตงขอมล (Normalization) การปรบแตงขอมลเปนการปรบภาพตวอกษรใหอยในรปแบบท�ระบบตองการเพ�อนาไปใชในข Nนตอไป ตวอยางการปรบแตงขอมลในโปรแกรมโอซอารท �วๆ ไป อาทเชน การปรบขนาดรปตวอกษร, การปรบตวอกษรท�เอยงใหตรง, การแปลงรปสหรอเกรยสเกลใหเปนขาวดา หรอในทางกลบกน การแปลงรปขาวดาใหเปนสหรอเกรยสเกล เปนตน 1.3 การตดแบงพNนท�ใชงาน (Cropping) การตดแบงพNนท�เปนการตดแยกเอาเฉพาะรปตวอกษรออกมาจากภาพ เพ�อสงใหข Nนตอนการรจาในการระบวารปตวอกษรน Nนเปนรหสอกษรอะไร หลกการพอสงเขปท�ใชสาหรบการตดรปตวอกษรโดยท �วไปจะใชพNนท�สขาว (สพNน) รอบรปเปนตวกาหนดขอบเขตในการตด ในข NนตอนนNมกจะประสบปญหาท�สงผลกระทบตออตราความถกตองของระบบโดยรวมอยสองปญหา ปญหาแรกคอปญหาตวตด เกดจากรปของตวอกษรต NงแตสองตวขNนไปมสวนท�เช�อมตดกน ทาใหไมสามารถแยกตวอกษรออกจากกนโดยใชพNนท�สขาวรอบๆ ได จาเปนตองหาอลกอรธมพเศษมาชวยในการแยกตวอกษรออกจากกน สวนปญหาท�สองในทางตรงกนขาม เปนปญหาตวขาดท�รปตวอกษรหน�งๆ ถกแยกออกเปนสวนๆ ทาใหเวลาตดตวอกษรจากตวเดยวจะไดเปนสองตว ซ�งกตองหาวธการเฉพาะสาหรบมาจดการอกเชนกนx 1.4 การสกดลกษณะสาคญ (Feature Extraction) การสกดลกษณะสาคญเปนอกขบวนการหน�งท�สาคญมาก ตาราสวนใหญจะแยกสวนนNออกจากการประมวลผลข Nนตน คอจะอยระหวางข Nนตอนการประมวลผลข Nนตนกบข Nนตอนการรจา แตในท�นNขอรวมไวในตอนเดยวกน การสกดลกษณะสาคญเปนการดงเอาโครงสรางพNนฐานท�สาคญ

Page 23: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

12

ของตวอกษรน Nนออกมา โดยโครงสรางพNนฐานท�วาจะตองมการกาหนดไวกอนวาจะมอะไรบาง มการนยามอยางไร ตวอยางเชน สาหรบภาษาไทยเราอาจกาหนดวาตวอกษรภาษาไทยท NงหมดประกอบดวยโครงสรางพNนฐานคอ เสนตรง (แนวต Nง/นอน) เสนเอยง หว (วงกลม) สวนโคง สวนเวา จดแตกก�ง จดตด เปนตน เม�อเราสามารถแยกเอาองคประกอบของตวอกษรแตละตวออกมาไดแลว จากน Nนเรากนาเสนอรปภาพของตวอกษรน NนในรปแบบของรายการขององคประกอบพNนฐานตางๆ แทน ซ�งจะถกสงตอเปนอนพตสาหรบข Nนตอนการรจาตอไป 2. การรจา (Recognition) ข NนตอนนNถอเปนหวใจของระบบ เพราะเปนสวนท�จะตดสนวารปตวอกษรท�สงเขาไปเปนรหสตวอกษรอะไร เชนเดยวกบสวนอ�นๆ ท�มวธการหลากหลายซ�งนามาใชเพ�อใหไดผลการทางานท�ดท�สด เทคนคใหมๆ ไดถกพฒนาขNนมาอยางตอเน�องเพ�อรองรบกบปญหาท�เกดจากเอกสารท�มความสลบซบซอนมากขNน อยางไรกตามเราพอท�จะจดแบงเทคนคเหลานNออกเปนกลมตามแนวทางหลกท�ใชในการแกปญหา ถงแมบอยคร Nงท�พบวามความคาบเก�ยวกนของเทคนคท�นามาใชระหวางกลมท�วานN ท NงนNเพราะแตละแนวทางกมขอดขอเสยท�แตกตางกน จงมความพยายามท�จะรวมเอาเทคนคเหลานNมาใชรวมกนเพ�อเพ�มความสามารถของระบบเทาท�จะเปนไปได ดงน Nนการแบงกลมในท�นN เปนการแบงท�เนนความชดเจนในแงของขอบเขตทางทฤษฎเปนหลก โดยแนวทางการรจาสามารถแบงออกไดเปน 4 กลม ดงนN 2.1 วธทางการเขาครปแบบ (Template Matching) วธการเขาครปแบบเปนวธการแรกๆ ท�มาใชในการรจาตวอกษร หลกการโดยท �วไปคอ จะตองมรปแบบ (template) ท�สรางขNนมาสาหรบอานตวอกษร โดยมการกาหนดตาแหนงสาคญท�สามารถใชแยกแยะความแตกตางระหวางตวอกษรแตละตว เวลาทางานกใหนารปภาพท�ตองการอานไปทาบบนแบบเพ�อวดความคลายคลงกนของภาพกบตวแบบ จากน Nนกระบวาเปนรหสตวอกษรอะไร โดยใชคาผานระดบหรอวธการบางอยางในการตดสน วธการนNจะคอนขางออนไหวตอขอมลแทรกซอน ขนาด และการเอยงของตวอกษร จงจาเปนตองมข Nนตอนการปรบแตงขอมลท�ด นอกจากน Nนข Nนตอนการเปรยบเทยบกไมใชวาสามารถเทยบกนแบบจดตอจดได เพราะในทางปฏบตตวอกษรท�สงเขาสามารถมความแปรปรวนไดหลายรปแบบ ดงน Nนวธการเทยบกตองมประสทธภาพเพยงพอท�จะรองรบกบปญหาดงกลาวได 2.2 วธทางสถต (Statistical Approach) วธทางสถตเปนวธการท�ใชหลกการทางสถต โดยนาคาความนาจะเปนหรอฟงกชนการแจกแจงความนาจะเปนมาใชในการตดสนใจ รปภาพอนพตท�ไดมาจากข Nนตอนการสกดลกษณะสาคญ จะถกสงเขาไปในสวนการรจาเฉพาะของแตละตวอกษร ซ�งไดผลลพธออกมาเปนคาความนาจะเปนท�อนพตเปนตวอกษรใด เม�ออนพตไดผานสวนการรจาครบทกตวแลว กนาเอาผลลพธท�ไดท Nงหมดมาเปรยบเทยบกนวาไดคาความนาจะเปนของตวอกษรใดมากท�สด ผลลพธจะออกเปนตวอกษรน Nน 2.3 วธการวเคราะหทางโครงสราง (Structural Analysis)

Page 24: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

13

วธการวเคราะหทางโครงสรางคอการวเคราะหโครงสรางตวอกษร โดยถอวาตวอกษรทกตวประกอบดวยองคประกอบพNนฐาน ซ�งไดมาจากการสกดลกษณะสาคญ เชนเดยวกนกบวธการทางสถต ตางกนตรงท�ลกษณะสาคญ ท�สงมาใหกบข NนตอนการรจาแบบการวเคราะหทางโครงสรางนN มกจะใชเปนช�อหรอคาท�บอกวาลกษณะโครงสรางสาคญน Nนเปนอะไร เชน เสนตรง วงกลม เปนตน แทนท�จะเปนคาจานวนจรง ในข Nนตอนการรจาลกษณะสาคญท Nงหลายท�ประกอบเปนตวอกษรน Nน จะถกสงเขาไปใหกบสวนท�ตรวจวเคราะหกฎการเขยนตวอกษร เชน ฟอรมอลแกรมมาแมชชน (formal grammar machine) โครงสรางกราฟ หรอโครงสรางตนไมเปนตน เพ�อระบวาเปนตวอะไร ซ�งจะตดสนโดยการดท�รปแบบการเช�อมตอขององคประกอบตางๆ เขาเปนตวอกษรน Nน วธการนNมขอดตรงท�มความยดหยนตอความหลากหลายของตวอกษรคอนขางมาก อยางไรกตามอตราความถกตองของวธนNขNนอยกบการสรางกฎและการวเคราะหกฎท�มประสทธภาพ ซ�งเปนสวนท�สาคญท�สดของวธการนN 2.4 วธทางโครงขายประสาทเทยม (Neural Network)

รปท� 2.7 โครงสรางของโครงขายประสาทเทยม

จากรปท� 2.7 เปนวธทางโครงขายประสาทเทยมเปนแนวทางใหมท�ไดรบความนยมอยางมากในชวงหลง เน�องจากประสทธภาพในดานการรจาแบบ ซ�งถกนาไปใชในงานหลายๆ ดาน รวมท Nงโอซอารดวย โครงขายประสาทเทยมเปนเทคนคท�พยายามเรยนแบบการทางานของสมองมนษย ท�มโครงขายเช�อมตอกนของหนวยความจายอยๆ จานวนมากท�สะสมความรเอาไว ความรเหลานNจะไดจากการฝกสอนไวกอน เชนการสอนใหรจกตวอกษร “ก” ถง “ฮ” โดยการสงภาพตวอกษรเหลานNเขาไป พรอมกบบอกวามคาเปนรหสตวอกษรอะไร โครงขายประสาทเทยมจะเรยนรถงรปแบบตวอกษรท�หลากหลายของตวอกษรตวน Nน เพ�อวาเวลาทางานจรงจะไดมความสามารถพอท�จะรบมอกบภาพตวอกษรในหลายๆ รปแบบ ส�งท�สอนใหกบโครงขายประสาทเทยมไมจาเปนตองเปนรปของตวอกษรอยางท�เราเหนกนกได อนพตท�สงใหมกจะผานข Nนตอนการสกดลกษณะสาคญ และกระบวนการประมวลผลเบNองตนอ�นๆ กอนเสมอ 3.ขบวนการประมวลผลข Nนปลาย (Post-Processing) หลงจากท�ผานข Nนตอนการรจาแลว รปตวอกษรท�ถกสงเขาไปจะไดผลลพธออกมาเปน

Page 25: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

14

รหสตวอกษร ซ�งกไมไดหมายความวาเอาทพตท�ไดมาจะถกตองท Nงหมด ไมมผลตภณฑโอซอารตวใด ไมวาจะเปนภาษาใดกตามท�รบรองความถกตอง 100 % ดงน Nนเพ�อเพ�มความถกตองใหแกโปรแกรมจงไดมการเสรมสวนการตรวจสอบและแกไขขอความเขามา โปรแกรมสวนนNมกจะทางานเก�ยวกบการตรวจสอบความถกตองของการสะกดคาและไวยากรณภาษา โดยมกจะใชพจนานกรมมาชวยในการตรวจสอบคาผด ซ�งอาจแกไขใหโดยอตโนมตหรอแสดงเคร�องหมายบางอยางเพ�อบอกใหผใชทราบวาคาดงกลาวอาจไมถกตอง ซ�งผใชอาจแกหรอไมแกกข Nนกบการตดสนใจของผใชเอง นอกเหนอไปจากการตรวจสอบความถกตองระดบคาแลว บางโปรแกรมยงมความสามารถตรวจสอบไวยากรณในระดบประโยคไดดวยสวนขบวนการประมวลผลข Nนปลายในโปรแกรมโอซอารเปนสวนท�มความสาคญมาก ลาพงแตความสามารถของสวนการรจาน Nนไมสามารถไปถงระดบท�ผใชยอมรบได (ซ�งท�ตองการจรงๆ คอ 100%) ดงน NนสวนนN สามารถเพ�มอตราความถกตองใหแกโปรแกรมได โดยเฉพาะในสวนท�นอกเหนอจากความสามารถของสวนการรจา เชน ตวอกษรท�เปรอะเปNอนมากๆ หรอตวอกษรท�ตดหรอขาด เปนตน ตวอยางโปรแกรมโอซอารท�ถกใชงานในปจจบน คอ Adobe Acrobat Pro x v10, ABBYY FineReader 10 ,SimpleOCR ,FreeOCR เปนตน 2.4 งานวจยท�เก�ยวของ

Luis von Ahn และคณะ[3] นาเสนอวธการ ในการแบงแยกการทางานระหวางมนษยและเคร�องคอมพวเตอรโดยใชวธการนาขอมลตวอกษรมาทาใหเกดการผดเพNยนและมการรบกวน เพ�อใหผใชงานท�มใชมนษยไมสามารถตความจากขอความเหลาน Nนได

อยางไรกตามกมงานวจย โดย Mori และ Malik [6] ไดแสดงวธการแกปญหาของ แคปชา โดยใชโปรแกรม EZYGimpy (92% สาเรจ) and Gimpy (33% สาเรจ) ตอมา Kumar Chellapilla และคณะ [7] ไดพบวา วธการท� แคปชา ใชภาพตวอกษรสามารถแกปญหาไดงายโดยการใช การเรยนรของเคร�อง (Machine Learning) และไดนาเสนอวา แคปชา จะมประสทธภาพท�ดข Nน ถาการเรยนรดวยเคร�องไมสามารถแบงสวนของตวอกษรได อยางไรกตาม ตวอกษรหรอขอมลท�นามาแสดงกอาจถกรบกวนทาใหผใชท�เปนมนษยอานไดยากเชนกน

ตอมา Hassan และ Mohammad [8] ผลงานวจยช�อ Localized Captcha for Illiterate People ไดนาเสนอวธ แคปชาใหม โดยการแสดงขอความเปนคาถามบนหนา และแสดงภาพวตถบางอยางบนหนาจอและขอใหผใชคลกภาพท�ถกตอง ดงรปท� 2.8

Page 26: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

15

รปท� 2.8 ตวอยางโปรแกรมการใชขอความตวอกษรและภาพ

จากรปท� 2.8 ตวอยางโปรแกรมการใชขอความตวอกษรและภาพ แสดงใหเหนขอไดเปรยบของวธนNดงตอไปนN - ไมมฐานขอมล ใชงานงายและใชเวลานอยท�จะผาน ในขณะท�ไมรบกวนผใช - ไมตองใชแปนพมพ ดงน Nนจงใชกบอปกรณขนาดเลกได เชน PDA, โทรศพทมอถอ - วธการนNใชภาษา PHP ดาเนนงานท Nงหมด เน�องจาก PHP เปนโอเพนซอรสท�รจก

กนดและแพลตฟอรมภาษาอสระและสวนมากของเวบโฮสตNงบรษท ท�สนบสนนมนดงน NนวธการนNสามารถนาไปรวมไดอยางงายดายไปยงเวบไซตท�สามารถใชไดกบคาใชจายต�า

- มนสามารถนามาใชโดยทกเพศทกวยแมกระท �งเดก - เราสามารถเปล�ยนความยากงายของวธการนNตามสถานการณไดขอจากด ขอเสย - ยงพฒนาได แค 7 ภาษา - การแสดงผลอาจ ชา เพราะเปนรปภาพ - การคนหาของวตถจะซบซอนมากขNนและยากขNนสาหรบคอมพวเตอร แตการ

ดาเนนงานเหลานNกจะทาใหยากย�งขNนสาหรบผใชท�เปนมนษยดวยเชนกน และอกผลงานวจย ของ Hassan และ Mohammad [12] ช�อวา Multilingual แคปชา

ไดเสนอเทคนคคลายกบเทคนคแรกคอการสมภาพขNนมาแสดงบนหนาจอและขอใหผใชคลกรปภาพท�ถกตอง แตเปล�ยนจากการต Nงคาถามแบบขอความตวอกษร เปนการต Nงคาถามแบบไฟลเสยง ลกษณะการทางานจะทาการขอใหผใชคลกท�ภาพของวตถท�แสดงใหถกตอง โดยฟงคาถามจากการเลนไฟลเสยงท�บนทกไว(เปนคาพดของมนษย)ดงรปท� 2.9

Page 27: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

16

รปท� 2.9 ตวอยางโปรแกรมโดยการใชเสยงและภาพ จากรปท� 2.9 ทาใหเหนประโยชนหลกของวธนNคอการประยกตใชสาหรบ เดกผสงอาย

คนท�ไมรหนงสอและมความยากลาบากในการอานและการเขยนกสามารถใชไดและยงครอบคลมไปถงกลมของคนพการท�มปญหาในเคล�อนไหวชา แตขอเสยของวจยนNคอจะใชสาหรบพNนท�ใด หรอ ประเทศใดประเทศหน�งเทาน Nนยงไมสามารถครอบคลมหมดทกภาษา และเปนรปภาพอาจจะทาใหบางคร Nงแสดงผลทางหนาจอชา

จากงานวจยท Nงหมดท�กลาวขางตนกมท Nงขอดและขอเส ยตางกน แตอยางไรกตาม แคปชาท�ผลตออกมากเพ�อปองกนการโจมตจากบอทของแตละพNนท�น Nนๆ งานวจยท�จะนาเสนอกเชนเดยวกน เทคนคใหมท�นาเสนอคอแคปซา ภาษาไทย ท�นาความรพ Nนฐานท �วไปมาปรบใชและเพ�มสวนการคานวณทางคณตศาสตร ซ�งจะกลาวถงในบทถดไป

2.5 สรปทายบท แคปชา คอเทคนคท�ใชแยกผใชท�เปนมนษยออกจากผใชท�เปนเคร�องคอมพวเตอร เพ�อปองกนการลงทะเบยนบนเวบไซต ปองกนขอมลสวนตวตางๆ จาก spammer ปจจบน แคปชา มการพฒนาเทคนคใหม หลายรปแบบ เชน เปนรปภาพตวษร การต Nงคาถามและตอบเปนรปภาพหรอตอบเปนตวอกษร ,การใชเสยง (Audio Captcha) เปนตน แตอยางไรกตามกยงมขอเสยอยบาง อาทเชน ถาเปนรปภาพ บางคร Nงอาจจะแสดงผลชา หรอถาเปนอกษรกจะอาจถกรบกวนทาใหมนษยอานยาก และเทคนคใหมท�จะนาเสนอคอ แคปชา ท�เปนภาษาไทยและสามารถเลอกเปนภาษาองกฤษได เน�องจากวาการสรางตวอกษรภาษาเพยงอยางเดยวอาจจะสามารถใชโปรแกรม โอซอาร ท�มการเผยแพรอานได จงไดมการเพ�มสวนการคานวณทางคณตศาสตรและเพ�มสวนการรบกวนในโครงสรางการทางานของ แคปชา ท�นาเสนอ

Page 28: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

17

บทท� 3

วธการนาเสนอ

เน�องจากปญหาท�บอทตางประเทศไดเขามาโจมตเวบไซตโดยการปลอมแปลงไอดผใชเพ�อเขาไปทาใหเกดความเสยหายมากตอเวบไซตของประเทศไทย จากเหตการณดงกลาวขางตนจงตองหาวธการในการปองกนบอทใหเกดความเสยหายนอยลง จงเกดวธการในการปองกนท�เรยกวา ”แคปชา “ แคปชา คอ การทดสอบเพ�อเขาสระบบคอมพวเตอรแบบโตตอบชนดหน�ง เพ�อใชแยกแยะวาผใชงานเปนมนษยจรงหรอบอทท�มาจากคอมพวเตอร

ดงน 7นในบทน7 จะเสนอการสรางแคปชา โดยใชตวอกษรภาษาไทยและยงเพ�มภาษาองกฤษเพ�อขยายขอบเขตสาหรบคนท�อานภาษาไทยไมไดแตอานภาษาองกฤษไดซ�งเปนเปนภาษาสากลใชกนท �วโลก อกท 7งการสรางแคปชายงเพ�มสวนการคานวณทางคณตศาสตรเพ�อใหมความซบซอนมากข7นและการเพ�มสวนการรบกวนทางโครงสราง เพ�อทาใหโปรแกรม โอซอารท�มการเผยแพรท �วไป [10] อานไดยากย�งข 7น 3.1 องคประกอบของแคปชา รปท� 3.1 องคประกอบของแคปชา ท�นาเสนอ

จากรปท� 3.1 องคประกอบของการทางานของแคปชาประกอบไปดวย 4 สวนคอ 1.สวนของการสรางขอมลเปนภาษาไทยและภาษาองกฤษ 2.สวนของการคานวณทางคณตศาสตร

สวนสรางขอมลภาษาไทยและ

ภาษาองกฤษ

สวนสรางการหมนตวอกษร สวนสรางการรบกวนพ7นหลง

สวนคานวณทางคณตศาสตร

องคประกอบของแคปชา

Page 29: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

18

3.สวนสรางการหมนตวอกษร 4.สวนสรางการรบกวนพ7นหลง ซ�งในแตละสวนจะอธบายดงตอไปน7 • สวนสรางขอมลภาษาไทยหรอภาษาองกฤษ ทาโดยการสมตวเลข จาก 1-10

จานวน 2 คร 7ง หลงจากน 7นกจะแปลงเปนตวอกษรภาษาไทยหรอภาษาองกฤษ โดยการเลอกของผใช และจะนาขอมลมาทดสอบดงตอไปน7 1. รปแบบของตวอกษรภาษาม 2 ลกษณะ ดงน7

ตวอกษรแบบท� 1 เปนตวอกษรท�นยมในการส�อสารท �วไปโดยตวอกษรในลกษณะน7 มกพบเหนในส�อส�งพมพ ไมวาจะเปน หนงสอ หนงสอพมพ นตยสารโปสเตอร และเวบไซต ซ�งถาเปนเวบไซตจะเปนแบบตองการส�อสารเพ�อใหเขาใจงาย จงใชตวอกษรท�มลกษณะแบบท� 1 ยกตวอยางเชน AngsanaUPC AnganaNew Cordia New Browallia New และในบทน7จะใช Tahoma มาทดลองดงรปท� 3.2 ตวอกษรแบบท� 1 ภาษาไทย และรปท� 3.3 ตวอกษรแบบท� 1 ภาษาองกฤษ

รปท� 3.2 ตวอกษรแบบท� 1 ภาษาไทย

รปท� 3.3 ตวอกษรแบบท� 1 ภาษาองกฤษ

ตวอกษรแบบท� 2 เปนตวอกษรไมคอยนยมใชเปนทางในการส�อสารท �วไปโดยตวอกษรในลกษณะน7 เปนตวอกษรนอกจากใชส�อความหมายตรงตามตวอกษรแลว ยงสามารถแสดงอารมณของผใชหรอส�อถงความเปนมาของตวอกษร มกไมพบเหนในส�อท �วไป แตมนษยเขาสามารถเขาใจความไดดทางผวจยจงคดวาโปรแกรมโอซอารนาจะเขาใจไดยาก จงใชตวอกษรท�มลกษณะแบบท� 2 คอ BLK-POHCHANG ดงรปท� 3.4 ตวอกษรแบบ 2 ภาษาไทยและรปท� 3.5 ตวอกษรแบบ 2 ภาษาองกฤษ

รปท� 3.4 ตวอกษรแบบท� 2 ภาษาไทย

รปท� 3.5 ตวอกษรแบบท� 2 ภาษาองกฤษ

Page 30: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

19

รปแบบตวอกษรแบบท� 1 เปนรปแบบตวอกษรท�ใชกนเปนทางการและรปแบบแบบท� 2 เปนรปไมเปนทางการ ท 7งสวนการสรางภาษาไทยและภาษาองกฤษจะใชรปแบบเหมอนกนและใชขนาดตวอกษร 14 เพ�อจะไดทาใหพ7นท�ท�แสดงขอความในโปรแกรมแคปชาไมใหญจนเกนไปและจะทาการทดสอบในบทถดไป 2. ขอมลตวอกษรท 7งหมดท�จะทาการทดลอง

พยญชนะไทย 44 ตว ก ข ฃ ค ฅ ฆ ง

จ ฉ ช ซ ฌ ญ ฎ ฏ ฐ ฑ ฒ ณ ด ต ถ ท ธ น บ ป ผ ฝ พ ฟ ภ ม ย ร

ล ว ศ ษ ส ห ฬ อ ฮ

สระในภาษาไทย32ตว

อะ อา อ อ อ ออ อ

อ เอะ เอ แอะ แอ โอะ โอ เอาะ ออ เออะ เออ เอยะ เอย เออะ

เออ อวะ อว อา ใอ ไอ เอา ฤ ฤา ฦ ฦา

พยญชนะองกฤษ ตวใหญ และ ตวเลก

a b c d e f g

h I j k l m n o p q r s t u v w x y z

A B C D E F G

H I J K L M N O P Q R S T U V W X Y Z

Page 31: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

20

ตวเลขอาราบก

• สวนคานวณผลทางคณตศาสตร ในสวนน7เม�อมการสมตวเลข ข7นมา 2 คร 7งแลวกจะทาการสมวธการคานวณข7นมาระหวาง 2 ตวเลขท�สมข7นมา ซ�งไดนาเสนอวธการคานวณแบบการบวก (+) การลบ (-) และการคณ (* ) เทาน 7น ซ�งจะสมตวกระทาข7นมาเพยงหน� งการกระทาหลงจากน 7นจะแปลงใหเปนขอความภาษาไทยหรอภาษาองกฤษตามท�ผใชเลอกข7นมา เพ�อใหยากตอการเดาของโปรแกรมโอซอาร

• สวนสรางการหมนตวอกษร ซ�งเปนสวนสาคญของการสราง แคปชา ใหมการเปล�ยนแปลงทศทางของตวอกษร ซ�งถาแบง Quadrant(การแบงพ7นท�ในแนวระนาบโดยแกน x และ แกน y) จะแบงได 4 Quadrant ตามหลกคณตศาสตร ดงรปท� 3.6

รปท� 3.6 การแบงพ7นในแนวระนาบ จากรปท� 3.6 ในสวนสรางการหมนตวอกษรจะใช Quadrant ท� 1 และ

Quadrant ท� 4 เพ�อไมใหเปนอปสรรคในการมองเหนของมนษยมากเกนไป โดยเราจะทาการสมหมนตวอกษรแตละองศา ท 7งหมด 11 แบบ เร�มต 7งแต 0 องศา,-15 องศา ,15 องศา, -30 องศา, 30 องศา, -45 องศา, 45 องศา, -60 องศา ,60 องศา, -75 องศา, 75 องศา ดงตวอยางรปท� 3.7 ถง รปท� 3.17

รปท� 3.7 ไมมการหมน 0 องศา รปท� 3.8 การหมนตวอกษรท� -15 องศา

0 1 2 3 4 5 6

7 8 9

y

x

Quadrant ท� 1

Quadrant ท� 4

Quadrant ท� 2

Quadrant ท� 3

Page 32: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

21

รปท� 3.9 การหมนตวอกษรท� 15 องศา รปท� 3.10 การหมนตวอกษรท� -30 องศา

รปท� 3.11 การหมนตวอกษรท� 30 องศา รปท� 3.12 การหมนตวอกษรท� -45 องศา

รปท� 3.13 การหมนตวอกษรท� 45 องศา รปท� 3.14 การหมนตวอกษรท� -60 องศา

รปท� 3.15 การหมนตวอกษรท� 60 องศา รปท� 3.16 การหมนตวอกษรท� -75 องศา

รปท� 3.17 การหมนตวอกษรท� 75 องศา

• สวนสรางการรบกวนพ0นหลง ซ�งเปนสวนสาคญของการสราง แคปชา สามารถท�จะสมสรางจดบนพ7นหลงและสมสรางเสนบนภาพพ7นหลงข7นมาได หลงจากน 7นกจะทาการสมสรางเสน ข7นท�ละ 5 % ต 7งแต 0% ถง 20% และจะทาการสมสรางจดต 7งแต 5% ถง 20% ข7นมาตามท�กาหนด หลงจากน 7นกจะทาการแปลงขอมลท 7งหมดเปนรปภาพ

Page 33: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

22

รปท� 3.18 โฟลวชารตการทางานของ แคปชา ท�นาเสนอ

3.2 ข 0นตอนการทางานของ แคปชา ท�นาเสนอ จากรปท� 3.18 โดยโปรแกรมจะทางานดงน7

ข 7นตอน 1 ทาการสมคาข 7นมาเพ�อเลอกหมายเลข 1-10 จานวน 2 คาคอคาแรกท�สม ข7นมาจะเปนตวต 7งและคาท�สองท�สมข7นมาจะเปนตวกระทา ตวอยางเชน สมคาแรกเปนตวต 7งไดคา 6 สมคาท�สองจะเปนตวกระทาไดคาเปน 2 และ สมสญลกษณทางคณตศาสตรเปนการลบ(-) จะแสดงผลเทากบ 6 – 2 ผลลพธท�ไดคอ 4

Page 34: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

23

ข 7นตอน 2 เม�อทาการสมตวเลขข7นมาหลงจากน 7นกจะทาการแปลงขอมลตวเลขใหเปน ภาษาไทย จากการสมจะไดคาตวเลขข7นมาและระบบจะสงคาเขาไปยง ฟงชนกและฟงชนกจะนาคาจากตวแปรเปรยบเทยบกบขอมลท�ถกกาหนด ไวในฟงชนก ถาตรงกนกจะแสดงขอความ ออกทางหนาจอ เชน เม�อทา การสมตวเลข ได ผลลพธคอ 1 ขอความท� แสดงคอ “ หน�ง” หรอถาผใช เลอกเปนภาษาองกฤษถาสมตวเลขไดหมายเลข 1 จะแสดงขอความ ”one” แทนหมายเลข

ข 7นตอน 3 ทาการสมสญลกษณทางคณตศาสตร (+, -, * )หลงจากน 7นจะแปลง สญลกษณให เปนตวอกษรภาษาไทย คอ การ ใสคาวา “บวก”, “ลบ”,”คณ”

หรอเปนตวอกษรภาษาองกฤษ คอ ” plus” ,”minus”,”multiply ” ระหวาง ตวเลขท�สมข7นมาท 7ง 2 ตวเลข ข 7นตอน 4 ทาการหมนตวอกษรในทศทางตางๆ โดยระบบจะทาการสมองศาท�ได

กาหนดไวข7นมา 11 แบบดงน7 (0,-15,15,-30,30,-45,45,-60,60,-75,75) ซ�ง แตละการสมจะทาการสมมาเพยงแบบเดยวและหลงจากน 7นจะทาการใสการ รบกวนโดยการสมเสนบนพ7นหลง ระบบจะทาการสมต 7งแต 0% ถง 20% ของพ7นหลงและจะทาการใสการรบกวนโดยการสมจดบนพ7นหลงระบบจะทา การสมต 7งแต 5% ถง 20% ตามท�ไดกาหนด

ข 7นตอน 5 จะทาการจดเกบเพ�อคานวณเปรยบเทยบกบคาตอบภายหลง จากน 7นแปลง คาตวเลขเปนตวอกษรภาษาไทยหรอเปนตวอกษรองกฤษ ตามท�ผใช เลอกใชและเปล�ยนขอมลท 7งหมดใหอยในรปแบบของไฟลภาพ และเม�อม การสงขอมลคาตอบกจะทาการตรวจสอบคาตอบท�ไดรบและ เปรยบเทยบกบ ผลลพธท�เกดจากการคานวณ

Page 35: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

24

รปท� 3.19 โฟลวชารตกระบวนการทางานของโปแกรมท�นาเสนอ

จากรปท� 3.19 โฟลวชารตกระบวนการทางานของโปแกรมท�นาเสนอ เม�อโปรแกรม

ไดรบขอมลท�เปนตวเลขกจะกจะทาการนาขอมลท�ไดรบไปตรวจกบคาตอบท�เกบไววาถกตองหรอไม ถาไมถกตองกจะแสดงผลผดพลาดโดยแจงเปนขอความแตถาคาตอบถกตองกจะแสดงผลท�ถกตองโดนแจงขอความหรอสามารถเขาระบบได

Page 36: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

25

3.3 สรปทายบท การเสนอโครงสราง แคปชา มองคประกอบของการทางานประกอบไปดวย 4 สวนคอ สวนของการสรางขอมลเปนภาษาไทยและภาษาองกฤษ สวนของการคานวณทางคณตศาสตร สวนสรางการหมนตวอกษรและ สวนสรางการรบกวนพ7นหลงและข 7นตอนการทางานโดยรวม ซ�งในบทตอไปจะเปนการทดสอบการใชงาน แคปชา ซ�งในแตละข 7นตอนวามการทางานหรอทดสอบอยางไรพรอมท 7งการอธบายโดยมภาพตวอยางในบทถดไป

Page 37: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

26

บทท� 4

การทดลอง

จากบททผานมาไดทาการวเคราะหและออกแบบโปรแกรม เพอนาไปดาเนนการพฒนาโปรแกรมแคปชาภาษาไทยใหสามารถปองกนบอทได สวนในบทน.จะกลาวถงการทดลองเพอตรวจสอบการทางานขององคประกอบตางๆ เชน การสมสรางจด การสมสรางเสน การหมนเปลยนทศทางองศาของตวอกษรและการทดลองทางานแคปชาทสมบรณแลวและแสดงผลทไดจากการดาเนนการทดลองกบโปรแกรมโอซอารทมอยในปจจบน 4.1 สภาพแวดลอมของการทดลององคประกอบของแคปชา การทดลองในงานวจยน.จะแบงเปน 4 ลกษณะดงตอไปน. • ทาโดยการสรางขอมลรปตวอกษรแบบตางๆ จากน .นทาการเพมคาการรบกวนโดยใสจด

หรอ การใสเสนบนพ.นหลง แลวทาการวดความแมนยาของการอานขอมลของโอซอาร โดยใชโปรแกรม Arnthai , โปรแกรม Softi FreeOCR และโปรแกรม Simple OCR เพอทจะไดทราบถงผลกระทบทเกดจากการรบกวนแบบตางๆวามผลอยางไรกบการอานคาของโปรแกรมโอซอาร

• ทาโดยการสรางขอมลรปตวอกษรแบบตางๆ จากน .นทาการสมทศทางการหมนของตวอกษร เพอจะไดทราบผลกระทบทเกดจากการหมนเปลยนทศทางแบบตางๆวามผลอยางไรกบการอานคาของโปรแกรมโอซอาร

• ทาโดยเปลยนรปแบบตวอกษรแบบตางๆ เพอจะไดทราบผลกระทบอยางไรกบการอานคาของโปรแกรมโอซอาร

• ทาโดยการสรางแคปชาทมการทางานทสมบรณแลว ทดลองปอนคาเพอทดสอบ แคปชา

4.1.1 ขอมล พยญชนะ ตวอกษรท &งหมดท�ทาการทดลอง

การทดสอบทาโดยการตดต .งโปรแกรมสรางแคปชาบนเครองคอมพวเตอร เพอสรางไฟลรปภาพของตวอกษร หลงจากน .นนาไฟลรปทได นาเขาไปอานโดยโปรแกรมโอซอาร ทชอวา Arnthai [10] ซงเปนโปรแกรมทมการเผยแพรและอนญาตใหใชงานได ซงตวอกษรแบบท 1 จะใชตวอกษร Tahoma และตวอกษรแบบท 2 ใชตวอกษร BLK-POHCHANG

1. รปแบบของตวอกษรทใชในการทดลอง

ตวอกษรภาษาไทย แบบท 1

Page 38: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

27

ตวอกษรภาษาองกฤษ แบบท 1

ตวอกษรภาษาไทย แบบท 2

ตวอกษรภาษาองกฤษ แบบท 2

2. ขอมลตวอกษรท .งหมดทจะทาการทดลอง • พยญชนะไทย 44 ตว คอ ก – ฮ • สระในภาษาไทย 32 ตว เชน อะ อา เอะ เอ เปนตน • ตวเลขไทย และ เลขอาราบก คอ 0 - 9

3. รปแบบการหมนตวอกษรท .งหมดดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

4.1.2 วธการคานวณผลการทดลอง วธการคานวณผลน. จะใชคานวณผลการดาเนนการระหวางขอมลทนามาทดลองกบ

โปรแกรมโอซอารท .งหมด การคานวณโดยการสรางการรบกวนแบบสมสรางจดและการสรางการสมสรางเสนบนพ.นหลง กรณการสมสรางเสนรบกวนบนพ.นหลงของพ.นทท .งหมด จะทาการเพมข.นทละ 5% ต .งแต 0% ถง 20% ของพ.นท จะทาการแบงชวงเปอรเซนตทคานวณจากพ.นทท .งหมดและจะใชพ.นทแสดงผลท .งหมด กวาง x ยาว = พ.นทท .งหมดเปนพกเซล คอ 90 x 140= 12600 พกเซล และแบงแตละชวง คดเปนเปอรเซนตท .งหมด 4 ชวง ดงน. ชวงทหนงจะใชพ.นทสรางการรบกวน เรมต .งแต 0% - 5% ของพ.นทท .งหมด คอ ระหวาง 0 – 630 พกเซลของพ.นทท .งหมด โดยคานวณจาก (จานวนเปอรเซนตทตองการ x จานวนพ.นทท .งหมด)/100 = จะไดจานวนพกเซลทใชสรางการรบกวน เชน (5 x 12600)/100 = 630 พกเซล เปนตน ชวงทสองต .งแต 6%-10% ของพ.นทท .งหมด คอ ระหวาง 631 – 1260 พกเซลของพ.นทท .งหมด ชวงทสามต .งแต 11%-15% ของพ.นทท .งหมด คอ ระหวาง 1261 – 1890 พกเซลของพ.นทท .งหมดและชวงทส ต .งแต 16%-20% ของพ.นทท .งหมด คอ ระหวาง 1891 – 2520 พกเซลของพ.นทท .งหมด และจะทาการสรางสวนการรบกวนโดยใชพ.นทในแตละชวงทแบงขางตน ทดลองกบแตละตวของขอมลทนามาทดลองโดยในแตละตวขอมลจะทาการสม 10 คร .งตอตวขอมล 1 ตว เชน พยญชนะ ก จะแสดงบนพ.นท ทกาหนดเพยงตวเดยวและทาการสมสรางการรบกวนบนพ.นทในชวงระหวาง 0%-5% ทาการสมท .งหมด 10 คร .ง เปนตน หลงจากน .นกจะคานวณออกมาเปนเปอรเซนตทอานถกตอง หรอ จานวนทอานผด โดยเฉลยรวมท .งหมดในแตละชวง วธการ

Page 39: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

28

คานวณ เชน จานวนพยญชนะ 44 ตว ทดสอบอานทละตวกบโปรแกรม Arnthai โปรแกรมโอซอารน.สามารถอานไดถกตอง 369 ตวอกษรจากพยญชนะท 44 x 10 (จานวนทสมการรบกวนในแตละชวง) = 440 ทาการคานวณเปนเปอรเซนตโดยรวม คอ ((จานวนตวอกษรทอานถกตอง x 100 ) / จานวนตวพยญชนะท .งหมด) / จานวนทการสมท .งหมด = จานวนเปอรเซนตโดยรวมทอานถกตองท .งหมด เชน ((369 x 100)/44)/10 = 84 เปอรเซนต ในการหาจานวนทอานผดกคดเชนเดยวกน ดงตวอยางตารางท 4.2 เปนตน 4.1.3 การทดลองผลการดาเนนการระหวางแคปชาภาษาไทยกบโปรแกรม ArnThai ในข .นตอนน.จะทาการทดลองแคปชาภาษาไทย ท .ง 2 แบบตวอกษรดงทกลาวมาขางตนกบโปรแกรม ArnThai ดงรปท 4.1

รปท� 4.1 ตวอยางหนาจอโปรแกรม ArnThai ทมการใสแคปชาภาษาไทย

4.1.3.1. การทดลองการอานขอมลตวอกษรภาษาไทยแบบท� 1 กบโปรแกรม ArnThai ตารางท� 4.1 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาไทยแบบท 1 กบโปรแกรม ArnThai โดยไมมการรบกวนใดๆ องศาของการหมนตวอกษรดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

การทดลอง0 องศา

อานถกตอง %

15 องศาอาน

ถกตอง %

30 องศาอาน

ถกตอง %

45 องศาอาน

ถกตอง %

60 องศาอาน

ถกตอง %

75 องศาอาน

ถกตอง %

- 15 องศาอาน

ถกตอง %

- 30 องศาอาน

ถกตอง %

- 45 องศาอาน

ถกตอง %

- 60 องศาอาน

ถกตอง %

- 75 องศาอาน

ถกตอง %

ตวพยญชนะ 84 61 5 0 0 0 61 5 0 0 0

ตวสระ 63 18 3 0 0 0 18 3 0 0 0

ตวเลขอาราบก 100 60 20 10 10 10 60 20 10 10 10

Page 40: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

29

จากตารางท 4.1 ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรมโอซอาร สามารถอานพยญชนะโดยไมมการหมนเอยงไดถกตอง 84% สามารถอานตวสระไดถกตอง 63% และสามารถอานตวเลขอาราบกไดถกตอง 100% สามารถอานพยญชนะ ท 15,-15 องศา ไดถกตอง 61% สามารถอานตวสระไดถกตอง 18% สามารถอานพยญชนะท 30 ,-30 องศาไดถกตอง 5% สามารถอานตวสระไดถกตอง 3% และสามารอานตวเลขอาราบกไดถกตอง 20% และไมสามารถอานพยญชนะตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร ผลการดาเนนการระหวาง แคปชาภาษาไทยแบบท� 1 กบ โปรแกรม ArnThai

จากตารางดงตอไปน.จะทาการสมสรางจดบนพ.นหลงและสมสรางเสนบนพ.นหลงเพมข.นทละ 5% ต .งแต 0% ถง 20% ของพ.นท และจะแสดงเปนเปอรเซนตโดยจะทาการสม 10 คร .งของแตละตวอกษรบนแคปชาทมการสรางการรบกวน เพอใหทราบวาโปรแกรมโอซอารน.สามารถอานถก-ผด โดยเฉลยกเปอรเซนต จะมวธการคานวณผลในหวขอท 4.1.2 และจะทาการสรปในแตละกรณทเหมาะดงตอไปน.

ตารางท� 4.2 สรปผลการสมสรางจดบนพ.นหลงในชวง 5%-20% ภาษาไทย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวนท�

อานผด %ตวอยางรป

1. ไมมการสมจดและสมเสนของพ.นหลง

ตวพยญชนะ 44 369 84 16

ตวสระ 32 201 63 36

ตวเลขอาราบก 10 100 100 0

2. การสมจด 5% ของพ.นหลง

ตวพยญชนะ 44 290 66 34

ตวสระ 32 70 22 78

ตวเลขอาราบก 10 100 100 0

3. การสมจด 10% ของพ.นหลง

ตวพยญชนะ 44 171 39 61

ตวสระ 32 38 12 88

ตวเลขอาราบก 10 60 60 40

4. การสมจด 15% ของพ.นหลง

ตวพยญชนะ 44 101 23 77

ตวสระ 32 19 6 94

ตวเลขอาราบก 10 6 60 40

5. การสมจด 20% ของพ.นหลง

ตวพยญชนะ 44 39 9 91

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 3 30 70

Page 41: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

30

จากตารางท 4.2 สรปผลการสมสรางจดบนพ.นหลงในชวง 5% - 20% ของพ.นทแสดงผลใหเหนวาการทดลองในกรณ ดงตอไปน.

- กรณทไมมการสรางสวนรบกวนบนพ.นหลงและแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตองถง 84 % สามารถอานตวสระไดถกตอง 63 % และสามารถอานตวเลขอาราบกไดถกตอง 100 %

- การสมสรางจดบนพ.นหลง 5% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 66% สามารถอานตวสระไดถกตอง 22% และสามารถอานตวเลขอาราบกไดถกตอง 100%

- การสมสรางจดบนพ.นหลง 10% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 39% สามารถอานตวสระไดถกตอง 12% และสามารถอานตวเลขอาราบกไดถกตอง 60%

- การสมสรางจดบนพ.นหลง 15% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 23% สามารถอานตวสระไดถกตอง 6% และสามารถอานตวเลขอาราบกไดถกตอง 60%

- การสมสรางจดบนพ.นหลง 20% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 9% และสามารถอานตวเลขอาราบกไดถกตอง 30% และมรายละเอยดอนๆดงตารางท 4.2

ดงน .นจงพอสรปไดวา เมอไดทาการสมเพมจดมากข.น ยงทาใหโปรแกรมโอซอาร อานตวอกษรยากมากข.น และยงทาใหมนษยอานยากข.นดวยเชนกน ดงน .นจงศกษาตวอยางมาเทาทมนษยสามารถอานเขาใจไดงายและโปรแกรมอานไดยากทสด ซงในกรณการสมสรางจดบนพ.นหลงอยางเดยวยงทาใหโปรแกรมโอซอารสามารถอานได จงเสนอการทดลองโดยการสมสรางเสน ในตารางท 4.3

Page 42: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

31

ตารางท� 4.3 สรปผลการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาไทย จากตารางท 4.3 สรปผลการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ของพ.นท

แสดงผลใหเหนวา ชวงการสมสรางเสนบนพ.นหลงท 0% - 5% ของพ.นทแสดงใหเหนวาโปรแกรมโอซอารสามารถอานตวพยญชนะไดถกตองโดยเฉลยจากการสมท .งหมด 10 คร .ง ประมาณ 6 % สามารถอานตวสระโดยเฉลย ประมาณ 1 % และสามารถอานตวเลขอาราบกโดยเฉลย ประมาณ 2 % แตไมสามารถอาน ตวพยญชนะ ตวสระ ตวเลขอาราบกในการทดลองกรณอนๆไดเลย รายละเอยดอนๆ ดงตารางท 4.3

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวนท�

อานผด %ตวอยางรป

1. การสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 24 6 94

ตวสระ 32 5 1 99

ตวเลขอาราบก 10 2 2 98

2. การสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 43: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

32

ตารางท� 4.4 สรปผลการสมสรางจดบนพ.นหลง 5%และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาไทย

จากตารางท 4.4 สรปผลการสมสรางจดบนพ.นหลง 5%และการสมสรางเสนบนพ.นหลง

ในชวง 0% - 20% ภาษาไทย แสดงผลใหเหนวาโปรแกรมโอซอารสามารถอานตวพยญชนะไดถกตองโดยเฉลยจากการสมท .งหมด 10 คร .ง ประมาณ 1 % ซงนอยมาก และไมสามารถอานตวสระและตวเลขอาราบกไดและไมสามารถอาน ตวพยญชนะ ตวสระ ตวเลขอาราบกในการทดลองกรณอน ๆ ไดดวยเชนกน

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�

อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง %

จานวนท�

อานผด %ตวอยางรป

1. การสมจด 5 % และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 4 1 99

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 5 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 5 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 5 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 44: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

33

ตารางท� 4.5 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาไทย

จากตารางท 4.5 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาไทย แสดงผลใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวนท�อาน

ถกตอง %

จานวนท�

อานผด %ตวอยางรป

1. การสมจด 10% และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 10 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100 ตวเลขอาราบก 20 0 0 100

4. การสมจด 10 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

Page 45: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

34

ตารางท� 4.6 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาไทย

จากตารางท 4.6 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาไทย แสดงผลใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 15 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 15 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 46: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

35

ตารางท� 4.7 สรปผลการสมสรางจดบนพ.นหลง 20%และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาไทย

จากตารางท 4.7 สรปผลการสมสรางจดบนพ.นหลง 20%และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ภาษาไทย แสดงผลใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย สรปผลการดาเนนการระหวาง แคปชาภาษาไทยแบบท� 1 กบ โปรแกรม ArnThai จากผลการทดลองทกลาวมาขางตนทาใหสรปภาพรวมของผลการทดลองได 8 กรณดงน.

กรณท 1 คอ จากสรปไดวา กรณทไมมการสรางสวนรบกวนพ.น สามารถอานตวพยญชนะภาษาไทยไดอานถกตองมากทสดไดถง 84% น นกหมายความวาแคปชาการใชขอความโดยไมมการรบกวนใดๆ ยงไมปลอดภยเสยงตอการแฮกไดงายดงน .น จงจะตองหาวธเพอใหโปรแกรมโอซอารน.อานไดยาก

กรณท 2 คอการหมนเปลยนทศทางของตวอกษรโดยการทาการเพมองศาข.นทละ15 องศาดรายละเอยดในตารางท 4.1 และจะคอยๆลดเปอรเซนตการอานทถกตองลดลงจนไมสามารถอานพยญชนะตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอาน

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวนท�

อานผด %ตวอยางรป

1. การสมจด 20% และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 20 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100 ตวเลขอาราบก 10 0 0 100

3. การสมจด 20 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100 ตวเลขอาราบก 20 0 0 100

4. การสมจด 20 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 47: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

36

ตวเลขอาราบกไดทกการหมนของตวอกษร แสดงใหเหนวาการหมนเปลยนทศทางสงผลใหโปรแกรมโอซอารอานขอมลไดยากข.น

กรณท 3 คอการสมสรางจดบนพ.นหลงอยางเดยว ในระหวาง 0%–20% ของพ.นท โดยการเพมข.นทละ 5% จนถง 20% แสดงใหเหนวา การสมสรางจดบนพ.นหลงอยางเดยวทาใหโปรแกรม Arnthai ยงสามารถอานพยญชนะไดดและการเพมจดพ.นหลงมากข.นกยงสงผลใหเปนอปสรรคในการมองเหนของมนษยมากข.นดวยเชนกน รายละเอยดอนๆ ดงตารางท 4.2 ดงน .นกรณน.จะยงไมปลอดภย จงทาการเพมการรบกวนเปนการสมสรางเสนในกรณท 4 กรณท 4 คอการสมสรางเสนบนพ.นหลงอยางเดยวท 0%–20% ของพ.นท โดยการเพมข.นทละ 5% มการแบงท .งหมด 4 ชวง แสดงใหเหนวา ชวงทหนง 0% - 5% ในการสมจานวน 10 คร .งของตวอกษร โดยเฉลยแลวโปรแกรมสามารถอานพยญชนะไดถกตอง 6% สามารถอานสระได 1 % และมรายละเอยดอนๆ ดงตารางท 4.3 ทาใหโปรแกรม Arnthai ไมสามารถอานตวพยญชนะภาษาไทย ตวสระ ตวเลขอาราบกไดเลย แตเพอความปลอดภยมากข.นจะทางานทดลองสมท .งจดและท .งเสนพรอมๆ กน และเพอหาจดทมนษยสามารถมองเหนไดชดเจนและโปรแกรมโอซอารน.อานไดยาก กรณท 5 คอการสมสรางจดบนพ.นหลงท 5% และการสมสรางเสนบนพ.นหลง ในชวง 0%–20% ของพ.นท แสดงใหเหนวาไมสามารถอานพยญชนะภาษาไทยไดถกตองเลย กรณท 6 คอการสมสรางจดบนพ.นหลงท 10 % และสมพ.นหลงในชวง 0%–20% พ.นท ไมสามารถอานพยญชนะภาษาไทยไดถกตองเลยและแคปชา ทสรางข.นในกรณน. มนษยยงสามารถทจะอานไดคอยขางชดเจน

กรณท 7 คอการสมสรางจดบนพ.นหลงท 15% และการสมสรางเสนบนพ.นหลงท 0%–20% ของพ.นทไมสามารถอานพยญชนะภาษาไทยไดถกตอง และยงเปนอปสรรคในการมองเหนของมนษย

กรณท 8 คอ การสมสรางจดบนพ.นหลงท 20% และการสมสรางเสนบนพ.นหลงท 0%–20% ของพ.นท ไมสามารถอานพยญชนะภาษาไทยไดถกตองเลย และยงเปนอปสรรคในการมองเหนของมนษย

จากการศกษาในการทดลองท .งหมด 8 กรณ โดยการใชโปรแกรม Arnthai ในการอาน แคปชากรณทเปนภาษาไทยแสดงใหเหนวากรณการสมจดบนพ.นหลงหรอการสมสรางเสนบนพ.นหลงอยางเดยวยงทาใหโปแกรมโอซอารน.สามารถอานไดถกตองและถงแมในบางชวงจากท .งหมดทแบงไว 4 ชวงทกลาวมาขางตน จะสามารถอานขอมลไมถกตองแตกยงเปนอปสรรคตอการมองเหนของมนษย จงทาการสมสรางท .งจดและสมสรางท .งเสนไปพรอมกน รวมถงการหมนตวอกษรในแตละองศาทกาหนด เพอพจารณาหาในจดทโปรแกรมโอซอารอานไดยากมากทสดและเปนอปสรรคกบมนษยนอยทสด ดงน .นจากการทดลองท .งหมดจงสรปไดวา กรณการสมสรางจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงท11% - 15% ของพ.นทเปนกรณทสามารถยอมได

Page 48: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

37

4.1.3.2. การทดลองการอานขอมลตวอกษรภาษาไทยแบบท� 2 กบโปรแกรม ArnThai ตารางท� 4.8 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาไทยแบบท 2 กบโปรแกรม ArnThai โดยไมมการรบกวนใด องศาของการหมนตวอกษรดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

การทดลอง0 องศา

อานถกตอง %

15 องศาอาน

ถกตอง %

30 องศาอาน

ถกตอง %

45 องศาอาน

ถกตอง %

60 องศาอาน

ถกตอง %

75 องศาอาน

ถกตอง %

- 15 องศาอาน

ถกตอง %

- 30 องศาอาน

ถกตอง %

- 45 องศาอาน

ถกตอง %

- 60 องศาอาน

ถกตอง %

-75 องศาอาน

ถกตอง %

ตวพยญชนะ 30 2 0 0 0 0 2 0 0 0 0

ตวสระ 9 9 0 0 0 0 9 0 0 0 0

ตวเลขอาราบก 20 10 10 10 10 10 10 10 10 10 10

จากตารางท 4.8 ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรมโอซอาร สามารถอานพยญชนะโดยไมมการหมนเอยงไดถกตอง 30% สามารถอานตวสระไดถกตอง 9% และสามารถอานตวเลขอาราบกไดถกตอง 20% สามารถอานพยญชนะ ท 15,-15 องศา ไดถกตอง 2% สามารถอานตวสระไดถกตอง 10% และไมสามารถอานพยญชนะ ตวสระไดเลยต .งแต 30 องศาและ - 30 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษรซงแสดงใหเหนวาการหมนสงผลตอการอานของโปรแกรมโอซอารดวยเชนกน

ผลการดาเนนการระหวาง แคปชาภาษาไทยแบบท� 2 กบ โปรแกรม ArnThai จากตารางดงตอไปน.จะทาการสมสรางจดบนพ.นหลงและสมสรางเสนบนพ.นหลงเพมข.น

ทละ 5% ต .งแต 0% ถง 20% ของพ.นท และจะแสดงเปนเปอรเซนตโดยจะทาการสม 10 คร .งของแตละตวอกษรบนแคปชาทมการสรางการรบกวน เพอใหทราบวาโปรแกรมโอซอารน.สามารถอานถก-ผด โดยเฉลยกเปอรเซนต จะมวธการคานวณในหวขอท 4.1.2 และจะทาการสรปในแตละกรณทเหมาะดงตอไปน.

Page 49: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

38

ตารางท� 4.9 สรปผลการสมสรางจดบนพ.นหลง 5%-20% ภาษาไทย จากตารางท 4.9 สรปผลการสมสรางจดบนพ.นหลงในชวง 5% - 20% ของพ.นท แสดง

ใหเหนวาการทดลองในแตละกรณ มรายละเอยดดงน. - กรณทไมมการสรางสวนรบกวนพ.นและแสดงใหเหนวาสามารถอานพยญชนะไทย

ไดถกตองถง 30% สามารถอานตวสระไดถกตอง 19% และสามารถอานตวเลขอาราบกไดถกตอง 20%

- การสมสรางจดบนพ.นหลง 5% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 23% สามารถอานตวสระไดถกตอง 13% และสามารถอานตวเลขอาราบกไดถกตอง 20%

- การสมสรางจดบนพ.นหลง 10% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 9% สามารถอานตวเลขอาราบกไดถกตอง 20% และไมสามารถอานสระไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. ไมมการสมจดและสมเสนของพ.นหลง ตวพยญชนะ 44 132 30 70

ตวสระ 32 61 19 81

ตวเลขอาราบก 10 20 20 80

2. การสมจด 5% ของพ.นหลง

ตวพยญชนะ 44 101 23 77

ตวสระ 32 42 13 87

ตวเลขอาราบก 10 20 20 80

3. การสมจด 10% ของพ.นหลง

ตวพยญชนะ 44 40 9 91

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 2 20 80

4. การสมจด 15% ของพ.นหลง

ตวพยญชนะ 44 39 7 93

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 20 20 80

5. การสมจด 20% ของพ.นหลง

ตวพยญชนะ 44 22 5 95

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 10 10 90

Page 50: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

39

- การสมสรางจดบนพ.นหลง 15% ของพ.นท และแสดงใหเหนวาสามารถอานพยญชนะไทยไดถกตอง 7% สามารถอานตวเลขอาราบกไดถกตอง 20% และไมสามารถอานสระไดเลย

- การสมสรางจดบนพ.นหลง 20% ของพ.นท และแสดงใหเหนวาสามารถอาน - พยญชนะไทยไดถกตอง 5% และสามารถอานตวเลขอาราบกไดถกตอง 10% - และรายละเอยดอนๆ ดงในตารางท 4.9

ตารางท� 4.10 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ภาษาไทย จากตารางท 4.10 สรปผลการสมสรางเสนบนพ.นหลงในชวง 0% - 20 % ของพ.นทและ

แสดงใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 51: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

40

ตารางท� 4.11 สรปผลการสมสรางจดบนพ.นหลง 5%และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาไทย

จากตารางท 4.11 สรปผลการสมสรางจดบนพ.นหลง 5%และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ของพ.นท แสดงใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 5 % และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

2. การสมจด 5 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

3. การสมจด 5 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

4. การสมจด 5 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

Page 52: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

41

ตารางท� 4.12 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาไทย

จากตารางท 4.12 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ของพ.นทแสดงใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง %

จานวนท�

อานผด %ตวอยางรป

1. การสมจด 10% และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

2. การสมจด 10 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

3. การสมจด 10 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

4. การสมจด 10 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

Page 53: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

42

ตารางท� 4.13 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาไทย

จากตารางท 4.13 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ของพ.นทแสดงใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง %

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

2. การสมจด 15 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

3. การสมจด 15 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

4. การสมจด 15 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

Page 54: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

43

ตารางท� 4.14 สรปผลการสมสรางจดบนพ.นหลง 20%และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาไทย

จากตารางท 4.14 สรปผลการสมสรางจดบนพ.นหลง 20%และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ของพ.นท แสดงใหเหนวาไมมการทดลองในกรณใดสามารถอานพยญชนะ ตวสระและตวเลขอาราบกไดเลย

สรปผลการดาเนนการระหวาง แคปชาภาษาไทยแบบท� 2 และ โปรแกรม ArnThai จากผลการทดลองทกลาวมาขางตนทาใหสรปภาพรวมของผลการทดลองได 8 กรณดงน.

กรณท 1 คอ จากสรปไดวา กรณทไมมการสรางสวนรบกวนพ.น สามารถอานพยญชนะภาษาไทยไดถกตอง 30% ดงตารางท 4.9 น นกหมายความวาแคปชาทสรางข.นโดยไมมการสรางการรบกวนน.ไมปลอดภยเสยงตอการแฮกไดงาย ดงน .นจงตองหาวธเพอใหโปรแกรมโอซอารน.อานไดยาก

กรณท 2 คอการหมนเปลยนทศทางตวอกษร ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรม โอซอาร ไมสามารถอานขอมล ต .งแต 30 องศาและ - 30 องศา ข.นไป แตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษรซงแสดงใหเหนวาการหมนสงผลตอการอานของโปรแกรมโอซอารดวยเชนกน

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 20% และการสมเสน 0% - 5% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

2. การสมจด 20 % และการสมเสน 6%-10% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

3. การสมจด 20 % และการสมเสน 11%-15% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

4. การสมจด 20 % และการสมเสน 16% - 20% ของพ.นหลง

ตวพยญชนะ 44 0 0 100

ตวสระ 32 0 0 100

ตวเลขอาราบก 20 0 0 100

Page 55: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

44

กรณท 3 คอการสมสรางจดบนพ.นหลงอยางเดยวท 0% – 20% ของพ.นท แสดงใหเหนวา การสมสรางจดบนพ.นหลงอยางเดยวทาใหโปรแกรม Arnthai สามารถอานพยญชนะภาษาไทยและตวเลขไดในทกกรณ รายละเอยดอน ๆ ดงตารางท 4.9 และการเพมการรบกวนโดยการสรางจดบนพ.นหลงข.นตามชวงทกาหนดกยงทาใหมอปสรรคในการมองเหนของมนษยมากข.นดวยเชนกน กรณท 4 คอการสมสรางเสนบนพ.นหลงอยางเดยวท 0%–20% ของพ.นท แสดงใหเหนวา การสมสรางเสนบนพ.นหลงอยางเดยวท .งหมด 4 ชวง ทาใหโปรแกรม Arnthai ไมสามารถอานตวพยญชนะภาษาไทย ตวสระ ตวเลขอาราบกไดเลย แตเพอความปลอดภยมากข.นจะทางานทดลองสมท .งจดและท .งเสนพรอมๆ กน และเพอหาจดทมนษยสามารถมองเหนไดชดเจนและโปรแกรม โอซอาร น.อานไดยาก กรณท 5 คอการสมสรางจดบนพ.นหลงท 5% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ของพ.นท ไมสามารถอานพยญชนะภาษาไทยไดถกตองเลย กรณท 6 คอการสมสรางจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20 % พ.นท ไมสามารถอานพยญชนะภาษาไทยไดถกตองเลย และแคปชาทสรางข.นในกรณน. มนษยยงสามารถทจะอานไดคอยขางชดเจน

กรณท 7 คอการสมสรางจดบนพ.นหลงท 15% และการสมสรางเสนบนพ.นหลงท 0% - 20 % ของพ.นทไมสามารถอานพยญชนะภาษาไทยไดถกตองเลย และยงเปนอปสรรคในการมองเหนของมนษย

กรณท 8 คอการสมสรางจดบนพ.นหลงท 20% และการสมสรางเสนบนพ.นหลงท 0% - 20 %ของพ.นท ไมสามารถอานพยญชนะภาษาไทยไดถกตองเลย และยงเปนอปสรรคในการมองเหนของมนษย

ดงน .นจากผลการทดลองท .งหมด 8 กรณ โดยการใชโปรแกรม Arnthai ในการอาน แคปชา กรณทเปนภาษาไทยทาใหสรปไดวา กรณการสมสรางจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงท11% - 15% ของพ.นท เปนผลการทดลองทยอมไดโดยพจารณาจากการการมองไดชดเจนของมนษยนอยทสดและยากตอการอานของโปรแกรมโอซอารน.มากทสด

Page 56: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

45

4.1.4 การทดลองผลการดาเนนการระหวางแคปชาภาษาองกฤษและโปรแกรม FeeOCR ในข .นตอนน.จะทาการทดลองแคปชาภาษาไทย ท .ง 2 แบบตวอกษรดงทกลาวมาขางตนกบ

โปรแกรม FreeOCR ดงรปท 4.2

รปท� 4.2 ตวอยางหนาจอโปรแกรม FreeOCR ทมการใสแคปชา ภาษาองกฤษ

4.1.4.1 การทดลองการอานขอมลตวอกษรภาษาองกฤษแบบท� 1 กบโปรแกรม FreeOCR ตารางท� 4.15 ผลการอานขอมลตวอกษรภาษาองกฤษโดยการหมนตวอกษรแบบท 1 กบโปรแกรม FreeOCRโดยไมมการรบกวนใด องศาของการหมนตวอกษรดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

การทดลอง0 องศา

อานถกตอง %

15 องศาอาน

ถกตอง %

30 องศาอาน

ถกตอง %

45 องศาอาน

ถกตอง %

60 องศาอาน

ถกตอง %

75 องศาอาน

ถกตอง %

- 15 องศาอาน

ถกตอง %

- 30 องศาอาน

ถกตอง %

- 45 องศาอาน

ถกตอง %

- 60 องศาอาน

ถกตอง %

- 75 องศาอาน

ถกตอง %

ภาษาองกฤษตวใหญ 96 32 5 0 0 0 32 5 0 0 0

ภาษาองกฤษตวเลก 58 30 5 0 0 0 30 5 0 0 0

ตวเลขอาราบก 100 100 20 10 10 10 100 20 10 10 10

จากตารางท 4.15 ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรมโอซอาร สามารถอานภาษาองกฤษตวใหญโดยไมมการหมนเอยงไดถกตอง 96% สามารถอานภาษาองกฤษตวเลกไดถกตอง 58% และสามารถอานตวเลขอาราบกไดถกตอง 100 % สามารถอานภาษาองกฤษตวใหญท 15 องศา -15 องศา ได

Page 57: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

46

ถกตอง 32 % สามารถอานภาษาองกฤษตวเลกไดถกตอง 30% และสามารถอานตวเลขอาราบกไดถกตอง 100% สามารถอานภาษาองกฤษตวใหญท 30,-30 องศา ไดถกตอง 5 % สามารถอานภาษาองกฤษตวเลกไดถกตอง 5% และสามารถอานตวเลขอาราบกไดถกตอง 20% และไมสามารถอานพยญชนะ ตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร

ผลการดาเนนการระหวางแคปชาภาษาองกฤษแบบท� 1กบ โปรแกรม FreeOCR จากตารางดงตอไปน.จะทาการสมสรางจดและสมสรางเสนบนพ.นหลงเพมข.นทละ 5%

ต .งแต 0% ถง 20% ของพ.นท และจะแสดงเปอรเซนตโดยจะทาการสม 10 คร .งในของแตละตวอกษรบนแคปชาทมการสรางการรบกวน เพอใหทราบวาโปรแกรมโอซอารน.สามารถอานถก-ผดโดยเฉลยกเปอรเซนต วธการคานวณจากหวขอท 4.1.2 และจะทาการสรปในแตละกรณทเหมาะดงตอไปน.

ตารางท� 4.16 สรปผลการสมสรางจดบนพ.นหลง 5%-20% ภาษาองกฤษแบบท 1กบโปรแกรม FreeOCR

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อาน

ผด %

ตวอยางรป

1. ไมมการสมจดและสมเสนของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 250 96 4

อกษรภาษาองกฤษตวเลก 26 39 15 85

ตวเลขอาราบก 10 100 100 0

2. การสมจด 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 161 62 38

อกษรภาษาองกฤษตวเลก 26 70 27 73

ตวเลขอาราบก 10 50 50 50

3. การสมจด 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 49 19 81

อกษรภาษาองกฤษตวเลก 26 10 4 96

ตวเลขอาราบก 10 30 30 70

4. การสมจด 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 31 12 88

อกษรภาษาองกฤษตวเลก 26 21 8 92

ตวเลขอาราบก 10 10 10 90

5. การสมจด 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 21 8 92

อกษรภาษาองกฤษตวเลก 26 10 4 96

ตวเลขอาราบก 10 1 10 90

Page 58: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

47

จากตารางท 4.16 สรปผลการสมสรางจดบนพ.นหลง 5%-20% และไมมสงรบกวนบน พ.นหลง ทาใหสามารถแสดงผลใหเหนวาการทดลองในกรณ - การไมมสงรบกวนบนพ.นหลง สามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง

96% และ สามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 58% และสามารถอานเลขอาราบกไดถกตอง 96% และแสดงใหเหนควรใชตวอกษรภาษาองกฤษตวเลกเพราะโปรแกรมอานถกตองไดเปอรเซนนอยกวาตวอกษรตวใหญ

- การสมสรางจดบนพ.นหลงชวง 0% - 5% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง 62% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 27% และสามารถอานเลขอาราบกไดถกตอง 50%

- การสมสรางจดบนพ.นหลง 6% - 10% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง 19% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 4% และสามารถอานเลขอาราบกไดถกตอง 30%

- การสมสรางจดบนพ.นหลง 11% - 15% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตองได 12% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 8% และสามารถอานเลขอาราบกไดถกตอง 10%

- การสมสรางจดบนพ.นหลง 16% - 20% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตองได 8% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 4% และสามารถอานเลขอาราบกไดถกตอง 10% และรายละเอยดอนๆ ดงในตารางท 4.16

Page 59: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

48

ตารางท� 4.17 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ของพ.นท ภาษาองกฤษแบบท 1

กบโปรแกรม FreeOCR จากตารางท 4.17 สรปผลการสมสรางเสนบนพ.นหลง ในชวง 0%-20% ของพ.นท และ

แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน. - ไมมกรณใดๆทโปรแกรม โอซอาร น.สามารถอานตวอกษรภาษาองกฤษตวใหญและ

ตวเลก รวมถงตวเลขอาราบกไดเลย และมรายละเอยดอน ๆ ดงตารางท 4.17

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อาน

ผด %

ตวอยางรป

1. การสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 100

3. การสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 60: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

49

ตารางท� 4.18 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม FreeOCR

จากตารางท 4.18 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรม โอซอาร น. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวเลก รวมถงตวเลขอาราบกไดเลย และมรายละเอยดอน ๆ ดงตารางท 4.18

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 5% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 5% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 5% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 5% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 61: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

50

ตารางท� 4.19 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม FreeOCR

จากตารางท 4.19 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน. - ไมมกรณใดๆทโปรแกรมโอซอาร น.สามารถอานตวอกษรภาษาองกฤษตวใหญและ

ตวเลก รวมถงตวเลขอาราบกไดเลย และมรายละเอยดอน ๆ ดงตารางท 4.19

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 10% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 10% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 10% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 62: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

51

ตารางท� 4.20 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาองกฤษแบบท 1กบโปรแกรม FreeOCR

จากตารางท 4.20 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ของภาษาองกฤษ ของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอาร น. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวเลก รวมถงตวเลขอาราบกไดเลย และมรายละเอยดอน ๆ ดงตารางท 4.20

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษรท�

อานถกตอง

ท &งหมด 10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 15% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 15% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 63: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

52

ตารางท� 4.21 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.นหลงในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม FreeOCR

จากตารางท 4.21 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน. - ไมมกรณใดๆทโปรแกรม โอซอาร น. สามารถอานตวอกษรภาษาองกฤษตวใหญ

และตวเลก รวมถงตวเลขอาราบกไดเลย และมรายละเอยดอน ๆ ดงตารางท 4.21 สรปผลการดาเนนการระหวาง แคปชาภาษาองกฤษแบบท� 1 กบ โปรแกรม FreeOCR

กรณท 1 คอ จากตารางสรปไดวา กรณทไมมการสรางสวนรบกวนพ.น สามารถอานภาษาองกฤษตวใหญไดถกตอง 96% และ สามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตองได 58% และสามารถอานตวเลขอาราบกได 100 % จากผลการทดลองแสดงใหเหนวา ควรใชตวอกษรตวเลก และการสรางแคปชาแบบไมมมการรบกวนใด ไมปลอดภยเสยงตอการแฮกไดงายดงน .นจงตองหาวธเพอใหโปรแกรม โอซอารน.อานไดยาก

กรณท 2 ในกรณทมการหมนเปลยนทศทางของตวอกษรโดยการทาการเพมองศาข.นทละ15 องศาดรายละเอยดในตารางท 4.15 และจะคอยๆลดเปอรเซนตการอานทถกตองลดลงจนไมสามารถอานพยญชนะตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถ

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�

อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อาน

ผด %

ตวอยางรป

1. การสมจด 20% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 20% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 20% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 20% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 64: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

53

อานตวเลขอาราบกไดทกการหมนของตวอกษร แสดงใหเหนวาการหมนเปลยนทศทางสงผลใหโปรแกรมโอซอารอานขอมลไดยากข.น

กรณท 3 คอการสมสรางจดบนพ.นหลงอยางเดยว ในระหวาง 0%–20% ของพ.นท โดยการเพมข.นทละ 5% จนถง 20% แสดงใหเหนวา การสมสรางจดบนพ.นหลงอยางเดยวทาใหโปรแกรม FreeOCR ยงสามารถอานตวขอมลทนามาทดลองได และการเพมจดพ.นหลงข.นเรอยๆกยงสงผลใหเปนอปสรรคในการมองเหนของมนษยข.นเรอยๆ ดวยเชนกน รายละเอยดอนๆ ดงตารางท 4.16 ดงน .นกรณจะยงไมปลอดภย กรณท 4 คอ การสมสรางเสนบนพ.นหลงอยางเดยวท 0%–20% ของพ.นท แสดงใหเหนวา การสมสรางเสนบนพ.นหลงอยางเดยวท .ง 4 ชวงตามทกาหนด ทาใหโปรแกรมโอซอารไมสามารถอานขอมลทนามาทดลองไดในบางกรณ ดงตารางท 4.17 แตเพอความปลอดภยมากข.นจะทางานทดลองสมท .งจดและท .งเสนพรอมๆ กน และเพอหาจดทมนษยสามารถมองเหนไดชดเจนและโปรแกรมโอซอารน.อานไดยาก กรณท 5 การสมสรางจดบนพ.นหลงท 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20 % ของพ.นท ไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลย กรณท 6 การสมสรางจดบนพ.นหลงท 10 % และสมบนพ.นหลงในชวง 0% - 20 % พ.นท ไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลย และแคปชาทสรางข.นในกรณน. มนษยยงสามารถทจะอานไดคอยขางชดเจน

กรณท 7 คอ การสมสรางจดบนพ.นหลงท 15% และการสมสรางเสนบนพ.นหลงท 0% - 20 % ของพ.นทไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลย และยงเปนอปสรรคในการมองเหนของมนษย

กรณท 8 คอ การสมสรางจดบนพ.นหลงท 20% และการสมสรางเสนบนพ.นหลงท 0% - 20 % ของพ.นท ไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลย และยงเปนอปสรรคในการมองเหนของมนษย

ดงน .นจากการศกษาในการทดลอง ท .งหมด 8 กรณ โดยการใชโปรแกรม FreeOCR ในการอาน แคปชา ทสรางข.นในกรณทเปนภาษาองกฤษทาใหพอสรปไดวา ควรใชภาษาองกฤษตวเลก เพราะทาใหโปรแกรมโอซอารน.อานถกตองไดนอยกวาภาษาองกฤษตวใหญ และควรใชการจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงท 11%-15% ดงตวอยางตารางท 4.19 โดยพจารณาจากอปสรรคในการมองเหนของมนษยนอยทสดและโปรแกรม FreeOCR น.อานไดยากทสด

Page 65: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

54

4.1.4.2 การทดลองอานขอมลตวอกษรภาษาองกฤษแบบท� 2 กบโปรแกรม FreeOCR ตารางท� 4.22 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR โดยไมมการรบกวนใด องศาของการหมนตวอกษรดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

การทดลอง0 องศา

อานถกตอง %

15 องศาอาน

ถกตอง %

30 องศาอาน

ถกตอง %

45 องศาอาน

ถกตอง %

60 องศาอาน

ถกตอง %

75 องศาอาน

ถกตอง %

- 15 องศาอาน

ถกตอง %

- 30 องศาอาน

ถกตอง %

- 45 องศาอาน

ถกตอง %

- 60 องศาอาน

ถกตอง %

- 75 องศาอาน

ถกตอง %

ภาษาองกฤษตวใหญ 27 15 3 0 0 0 15 3 0 0 0

ภาษาองกฤษตวเลก 23 13 2 0 0 0 13 2 0 0 0

ตวเลขอาราบก 90 40 20 10 10 10 40 20 10 10 10

จากตารางท 4.22 ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรมโอซอาร สามารถอานภาษาองกฤษตวใหญโดยไมมการหมนเอยงไดถกตอง 27% สามารถอานภาษาองกฤษตวเลกไดถกตอง 23% และสามารถอานตวเลขอาราบกไดถกตอง 90 % สามารถอานภาษาองกฤษตวใหญท 15,-15 องศา ไดถกตอง 15% สามารถอานภาษาองกฤษตวเลกไดถกตอง 13% และสามารถอานตวเลขอาราบกไดถกตอง 40% สามารถอานภาษาองกฤษตวใหญท 30,-30 องศา ไดถกตอง 3% สามารถอานภาษาองกฤษตวเลกไดถกตอง 2% และสามารถอานตวเลขอาราบกไดถกตอง 20 % และไมสามารถอานพยญชนะ ตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร ผลการดาเนนการระหวางแคปชาภาษาองกฤษแบบท� 2 กบโปรแกรม FreeOCR

จากตารางดงตอไปน.จะทาการสมสรางจดและสมสรางเสนบนพ.นหลงเพมข.นทละ 5% ต .งแต 0% ถง 20% ของพ.นท และจะแสดงเปนเปอรเซนต โดยจะทาการสม 10 คร .งของแตละตวอกษรบนแคปชาทมการสรางการรบกวนบนพ.นหลง เพอใหทราบวาโปรแกรมโอซอารน.สามารถอานถก-ผด โดยเฉลยกเปอรเซนต วธการคานวณในหวขอท 4.1.2 และจะทาการสรปในแตละกรณทเหมาะดงตอไปน.

Page 66: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

55

ตารางท� 4.23 สรปผลการสมสรางจดบนพ.นหลง 5%-20% ภาษาองกฤษแบบท 2 กบ โปรแกรม FreeOCR

จากตารางท 4.23 สรปผลการสมสรางจดบนพ.นหลง 5%-20% ภาษาองกฤษแบบท 2

กบโปรแกรม FreeOCR และไมมสงรบกวนบนพ.นหลง แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- การไมมสงรบกวนบนพ.นหลง สามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง27% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 23% และสามารถอานเลขอาราบกไดถกตอง 90% และแสดงใหเหนควรใชตวอกษรภาษาองกฤษตวเลกเพราะโปรแกรมอานถกตองไดนอยกวาตวอกษรภาษาองกฤษตวใหญ

- การสมสรางจดบนพ.นหลงชวง 0% - 5% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง 4% และไมสามารถอานตวอกษรภาษา องกฤษตวเลกและตวเลขอาราบกไดถกตองเลย

- การสมสรางจดบนพ.นหลงชวง 6% -10% , 11% - 15% และ 16% - 20% ของพ.นท ไมสามารถอานตวอกษรภาษาองกฤษตวใหญและอกษรภาษาองกฤษตวเลกและตวเลขอาราบกไดถกตองเลยและรายละเอยดอนๆ ดงในตารางท 4.23

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. ไมมการสมจดและสมเสนของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 70 27 73

อกษรภาษาองกฤษตวเลก 26 60 23 77 ตวเลขอาราบก 10 90 90 10

2. การสมจด 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 10 38 62

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

5. การสมจด 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 67: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

56

ตารางท� 4.24 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ของพ.นท ภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR

จากตารางท 4.24 สรปผลการสมสรางเสนบนพ.นหลง 0%-20%ของพ.นท ภาษาองกฤษ

แบบท 2 กบโปรแกรม FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน. - ไมมกรณใดๆทโปรแกรมโอซอาร น. สามารถอานตวอกษรภาษาองกฤษตวใหญและ

ตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลย และมรายละเอยดอน ๆ ดงตารางท 4.24

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 68: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

57

ตารางท� 4.25 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR

จากตารางท 4.25 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอาร น.สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.25

การทดลอง

จานวน

ตวอกษร

ท �งหมด

จานวน

ตวอกษรท�อาน

ถกตองท �งหมด

10 คร �ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 5% และสมเสน 0%- 5% ของพ�นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 5% และสมเสน 6% - 10% ของพ�นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 5% และสมเสน 11% - 15% ของพ�นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 5% และสมเสน 16% - 20% ของพ�นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 69: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

58

ตารางท� 4.26 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR

จากตารางท 4.26 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% บนพ.นหลง ของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.26

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 10 % และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 10 % และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10 % และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 10% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 70: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

59

ตารางท� 4.27 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR

จากตารางท 4.27 สรปไดวา การสมสรางเสนบนพ.นหลงในชวง 0% - 20% และสม

สรางจด 15% บนพ.นหลงของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.27

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�

อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 15% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 15% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 71: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

60

ตารางท� 4.28 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม FreeOCR

จากตารางท 4.28 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ของพ.นท แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน. - ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและ

ตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.28

สรปผลการการดาเนนระหวางแคปชาภาษาองกฤษแบบท� 2 กบ โปรแกรม FreeOCR

กรณท 1 คอจากตารางสรปไดวา กรณทไมมการสรางสวนรบกวนพ.น สามารถอานภาษาองกฤษตวใหญไดถกตอง 27% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตองได 23% และสามารถอานตวเลขอาราบกได 90 % จากผลการทดลองแสดงใหเหนวาควรใชตวอกษรตวเลก และการสรางแคปชาแบบไมมมการรบกวนใดๆ ไมปลอดภยเสยงตอการแฮกไดงาย

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 20% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 20% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 20% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 20% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100 ตวเลขอาราบก 10 0 0 100

Page 72: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

61

กรณท 2 คอการหมนเปลยนทศทางของตวอกษรโดยการทาการเพมองศาข.นทละ15 องศาดรายละเอยดในตารางท 4.22 และจะคอยๆลดเปอรเซนตการอานทถกตองลดลงจนไมสามารถอานพยญชนะตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร แสดงใหเหนวาการหมนเปลยนทศทางสงผลใหโปรแกรมโอซอารอานขอมลไดยากข.น

กรณท 3 คอการสมสรางจดบนพ.นหลงอยางเดยว ในระหวาง 5%–20% ของพ.นท โดยการเพมข.นทละ 5% จนถง 20% แสดงใหเหนวา การสมสรางจดบนพ.นหลงอยางเดยวทาใหโปรแกรม FreeOCR ยงสามารถอานพยญชนะไดและการเพมจดบนพ.นหลงมากข.นยงสงผลใหเปนอปสรรคในการมองเหนของมนษยมากข.น ดวยเชนกน รายละเอยดอนๆ ดงตารางท 4.23 ดงน .นกรณการสมสรางจดบนพ.นหลงอยางเดยวยงไมปลอดภย กรณท 4 คอการสมสรางเสนบนพ.นหลงอยางเดยวท 0%–20% ของพ.นท แสดงใหเหนวา การสมสรางเสนบนพ.นหลงอยางเดยว ทาใหโปรแกรมโอซอารไมสามารถอานขอมลทนามาทดลองไดในบางกรณ ดงตารางท 4.24 แตเพอความปลอดภยมากข.นจะทางานทดลองสมท .งจดและท .งเสนพรอมๆ กน และเพอหาจดทมนษยสามารถมองเหนไดชดเจนและโปรแกรมโอซอารน.อานไดยาก กรณท 5 คอการสมสรางจดบนพ.นหลงท 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ของพ.นท ไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลย กรณท 6 คอการสมสรางจดบนพ.นหลงท 10 % และสมบนพ.นหลงในชวง 0% - 20% พ.นท ไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลยและแคปชา ทสรางข.นในกรณน. มนษยยงสามารถทจะอานไดคอยขางชดเจน กรณท 7 คอการสมสรางจดบนพ.นหลงท 15% และการสมสรางเสนบนพ.นหลงทในชวง 0% - 20 % ของพ.นทไมสามารถอานขอมลท .งหมดทนามาทดลองไดถกตองเลยและยงเปนอปสรรคในการมองเหนของมนษย

กรณท 8 คอการสมสรางจดบนพ.นหลงท 20% และการสมสรางเสนบนพ.นหลงทในชวง 0% - 20 % ของพ.นทแสดงใหเหนวา ไมมกรณใดทสามารถอานขอมลท .งหมดทนามาทดลองไดเลย ดงน .นจากผลการทดลองท .งหมด 8 กรณ โดยการใชโปรแกรม FreeOCR ในการอาน แคปชา ทสรางข.นในกรณทเปนภาษาองกฤษทาใหพอสรปไดวา ควรใชภาษาองกฤษตวเลก เพราะทาใหโปรแกรมโอซอารน.อานถกตองไดนอยกวาภาษาองกฤษตวใหญ และควรใชการจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงท 11%-15% ดงตารางท 4.26 เพอสรางการรบกวนในแคปชาทสรางข.นเพราะจะทาใหโปรแกรม FreeOCR น.อานไดยากและยงเปนอปสรรคในการมองเหนของมนษยนอยทสด

Page 73: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

62

4.1.5 การทดลองผลการดาเนนการระหวางแคปชาและโปรแกรม Softi FreeOCR ในข .นตอนน.จะทาการทดลองแคปชาภาษาไทย ท .ง 2 แบบตวอกษรดงทกลาวมาขางตนกบ

โปรแกรม Softi FreeOCR ดงรปท 4.3

รปท 4.3 ตวอยางหนาจอโปรแกรม Softi FreeOCR ทมการใส แคปชาภาษาองกฤษ

4.1.5.1 การทดลองอานขอมลตวอกษรภาษาองกฤษแบบท� 1 กบโปรแกรม Softi FreeOCR ตารางท� 4.29 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR โดยไมมการรบกวนใด องศาของการหมนตวอกษรดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

การทดลอง0 องศา

อานถกตอง %

15 องศาอาน

ถกตอง %

30 องศาอาน

ถกตอง %

45 องศาอาน

ถกตอง %

60 องศาอาน

ถกตอง %

75 องศาอาน

ถกตอง %

- 15 องศาอาน

ถกตอง %

- 30 องศาอาน

ถกตอง %

- 45 องศาอาน

ถกตอง %

- 60 องศาอาน

ถกตอง %

- 75 องศาอาน

ถกตอง %

ภาษาองกฤษตวใหญ 100 32 5 0 0 0 32 5 0 0 0

ภาษาองกฤษตวเลก 62 30 5 0 0 0 30 5 0 0 0

ตวเลขอาราบก 100 100 20 10 10 10 100 20 10 10 10

จากตารางท 4.29 ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรมโอซอารน. สามารถอานภาษาองกฤษตวใหญโดยไมมการหมนเอยงไดถกตอง 100% สามารถอานภาษาองกฤษตวเลกไดถกตอง 62% และสามารถอานตวเลขอาราบกไดถกตอง 100 % สามารถอานภาษาองกฤษตวใหญท 15 องศา,-15 องศา ได

Page 74: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

63

ถกตอง 32 % สามารถอานภาษาองกฤษตวเลกไดถกตอง 30% และสามารถอานตวเลขอาราบกไดถกตอง 100 % สามารถอานภาษาองกฤษตวใหญท 30 องศา,-30 องศา ไดถกตอง 5% สามารถอานภาษาองกฤษตวเลกไดถกตอง 5% และสามารถอานตวเลขอาราบกไดถกตอง 20% และไมสามารถอานพยญชนะ ตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร

ผลการดาเนนการระหวางแคปชาภาษาองกฤษแบบท� 1 และ โปรแกรม Softi FreeOCR จากตารางดงตอไปน.จะทาการสมสรางจดและสมสรางเสนบนพ.นหลงเพมข.นทละ 5%

ต .งแต 0% ถง 20% ของพ.นท และจะแสดงเปนเปอรเซนต โดยจะทาการสม 10 คร .งของแตละตวอกษรบนแคปชาทมการสรางการรบกวน เพอใหทราบวาโปรแกรมโอซอารน.สามารถอาน ถก-ผด โดยเฉลยกเปอรเซนต วธการคานวณในหวขอท 4.1.2 และจะทาการสรปในแตละกรณทเหมาะดงตอไปน.

ตารางท� 4.30 สรปผลการสมสรางจดบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 1 กบ โปรแกรม Softi FreeOCR

จากตารางท 4.30 สรปผลการสมสรางจดบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR และไมมสงรบกวนบนพ.นหลง แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อาน

ผด %

ตวอยางรป

1. ไมมการสมจดและสมเสนของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 260 100 0

อกษรภาษาองกฤษตวเลก 26 161 62 38

ตวเลขอาราบก 10 100 100 0

2. การสมจด 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 161 62 38

อกษรภาษาองกฤษตวเลก 26 70 27 73

ตวเลขอาราบก 10 50 50 50

3. การสมจด 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 49 19 81

อกษรภาษาองกฤษตวเลก 26 31 12 88

ตวเลขอาราบก 10 30 30 70

4. การสมจด 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 21 8 92

อกษรภาษาองกฤษตวเลก 26 10 4 96

ตวเลขอาราบก 10 10 10 90

5. การสมจด 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100 ตวเลขอาราบก 10 0 0 100

Page 75: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

64

- การไมมสงรบกวนบนพ.นหลง สามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง100% และ สามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 62% และสามารถอานเลขอาราบกไดถกตอง 100% และแสดงใหเหนควรใชตวอกษรภาษาองกฤษตวเลกเพราะโปรแกรมอานถกตองไดเปอรเซนนอยกวาตวอกษรตวใหญ

- การสมสรางจดบนพ.นหลง 5% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง 62% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 27% และสามารถอานเลขอาราบกไดถกตอง 50%

- การสมสรางจดบนพ.นหลง 10% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง 19% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 4% และสามารถอานเลขอาราบกไดถกตอง 30%

- การสมสรางจดบนพ.นหลง 15% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตองได 8% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 12% และสามารถอานเลขอาราบกไดถกตอง 10%

- การสมสรางจดบนพ.นหลง 20% ของพ.นท และแสดงใหเหนวาไมสามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลกไดเลย แตสามารถอานเลขอาราบกไดถกตอง 20% และรายละเอยดอนๆ ดงในตารางท 4.30

ตารางท� 4.31 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อาน

ผด %

ตวอยางรป

1. การสมเสน 0%- 5% ของพ.นหลง อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 100

3. การสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 76: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

65

จากตารางท 4.31 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรม โอซอาร น. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.31

ตารางท� 4.32 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR

จากตารางท 4.32 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.32

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 5% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 5% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 5% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 5% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 77: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

66

ตารางท� 4.33 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR

จากตารางท 4.33 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.33

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 10% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 10% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 10% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 78: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

67

ตารางท� 4.34 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR

จากตารางท 4.34 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.น

หลงในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.34

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�

อานถกตอง

ท &งหมด 10 คร &ง

จานวนท�

อาน

ถกตอง %

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 15% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 15% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 79: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

68

ตารางท� 4.35 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR

จากตารางท 4.35 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาองกฤษแบบท 1 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.35

สรปผลการดาเนนการระหวาง แคปชาภาษาองกฤษแบบท� 1 กบ โปรแกรม Softi FreeOCR

กรณท 1 คอ จากตารางสรปไดวา กรณทไมมการสรางสวนรบกวนพ.น สามารถอานภาษาองกฤษตวใหญไดถกตอง 100% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตองได 62% และสามารถอานตวเลขอาราบกได 100 % จากผลการทดลองแสดงใหเหนวา ควรใชตวอกษรภาษาองกฤษตวเลกดกวาตวอกษรภาษาองกฤษตวใหญและการสรางแคปชาแบบทไม

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 20% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 20% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 20% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 20% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100 ตวเลขอาราบก 10 0 0 100

Page 80: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

69

มการรบกวนใดๆ ทาใหไมปลอดภยเสยงตอการแฮกไดงายดงน .นจงตองหาวธเพอใหโปรแกรมโอซอารน.อานไดยาก

กรณท 2 คอการหมนเปลยนทศทางของตวอกษรโดยการทาการเพมองศาข.นทละ15 องศาดรายละเอยดในตารางท 4.29 และจะคอยๆลดเปอรเซนตการอานทถกตองลดลงจนไมสามารถอานพยญชนะตวสระไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร แสดงใหเหนวาการหมนเปลยนทศทางสงผลใหโปรแกรมโอซอารอานขอมลไดยากข.น

กรณท 3 คอการสมสรางจดบนพ.นหลงอยางเดยว ในระหวาง 0%–20% ของพ.นท โดยการเพมข.นทละ 5% จนถง 20% แสดงใหเหนวา การสมสรางจดบนพ.นหลงอยางเดยวทาใหโปรแกรม FreeOCR ยงสามารถอานพยญชนะไดและการเพมจดพ.นหลงมากข.น กสงผลใหเปนอปสรรคในการมองเหนของมนษยมากข.น ดวยเชนกน รายละเอยดอนๆ ดงตารางท 4.30 ดงน .นกรณจะยงไมปลอดภย กรณท 4 คอการสมสรางเสนบนพ.นหลงอยางเดยวท 0%–20% ของพ.นท แสดงใหเหนวา การสมสรางเสนบนพ.นหลงอยางเดยวท .ง 4 ชวงตามทกาหนด ทาใหโปรแกรมโอซอารไมสามารถอานขอมลทนามาทดลองไดในบางกรณ ดงตารางท 4.31 แตเพอความปลอดภยมากข.นจะทางานทดลองสมท .งจดและท .งเสนพรอมๆ กน และเพอหาจดทมนษยสามารถมองเหนไดชดเจนและโปรแกรมโอซอารน.อานไดยาก กรณท 5 คอการสมสรางจดบนพ.นหลงท 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20 % ของพ.นท ไมสามารถอานขอมลตวอกษรทนามาทดลองไดถกตองเลย กรณท 6 คอการสมสรางจดบนพ.นหลงท 10 % และสมพ.นหลงในชวง 0% - 20% พ.นท ไมสามารถอานขอมลตวอกษรทนามาทดลองและแคปชาทสรางข.นในกรณน. มนษยยงสามารถทจะอานไดคอยขางชดเจน กรณท 7 คอการสมสรางจดบนพ.นหลงท 15% และการสมสรางเสนบนพ.นหลงท 0% - 20% ของพ.นทไมสามารถอานขอมลตวอกษรทนามาทดลองไดถกตองเลย แตกยงเปนอปสรรคตอการมองเหนของมนษย

กรณท 8 คอการสมสรางจดบนพ.นหลงท 20% และการสมสรางเสนบนพ.นหลงท 0% - 20% ของพ.นทแสดงใหเหนวา ขอมลตวอกษรทนามาทดลองไดถกตองเลย แตกยงเปนอปสรรคตอการมองเหนของมนษย

ดงน .นจากการศกษาในการทดลองท .งหมด 8 กรณ โดยการใชโปรแกรม Softi FreeOCR ในการอาน แคปชา ทสรางข.นในกรณทเปนภาษาองกฤษทาใหพอสรปไดวา ควรใชภาษาองกฤษตวเลก เพราะทาใหโปรแกรมโอซอารน.อานถกตองไดนอยกวาภาษาองกฤษตวใหญ และควรใชการสมสรางจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงท 11%-15% ดงตวอยางตารางท 4.33 เพอสรางการรบกวนในแคปชา จะทาใหโปรแกรม Softi FreeOCR น.อานไมไดและยงเปนอปสรรคในการมองเหนของมนษยนอยทสด

Page 81: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

70

4.1.5.2. การทดลองอานขอมลตวอกษรภาษาองกฤษแบบท� 2 กบโปรแกรม Softi FreeOCR ตารางท� 4.36 ผลการอานขอมลตวอกษรโดยการหมนตวอกษรภาษาองกฤษแบบท 2 กบโปรแกรม Softi OCR โดยไมมการรบกวนใด องศาของการหมนตวอกษรดงน. (0,-15,15,-30,30,-45,45,-60,60,-75,75)

การทดลอง0 องศา

อานถกตอง %

15 องศาอาน

ถกตอง %

30 องศาอาน

ถกตอง %

45 องศาอาน

ถกตอง %

60 องศาอาน

ถกตอง %

75 องศาอาน

ถกตอง %

- 15 องศาอาน

ถกตอง %

- 30 องศาอาน

ถกตอง %

- 45 องศาอาน

ถกตอง %

- 60 องศาอาน

ถกตอง %

- 75 องศาอาน

ถกตอง %

ภาษาองกฤษตวใหญ 35 5 0 0 0 0 5 0 0 0 0

ภาษาองกฤษตวเลก 31 5 0 0 0 0 5 0 0 0 0

ตวเลขอาราบก 50 10 10 10 10 10 10 10 10 10 10

จากตารางท 4.36 ทาใหสรปไดวาการหมนทศทางของตวอกษรโดยทาการเพมองศาข.นทละ15 องศา ปรากฏวาโปรแกรม โอซอาร สามารถอานภาษาองกฤษตวใหญโดยไมมการหมนเอยงไดถกตอง 35% สามารถอานภาษาองกฤษตวเลกไดถกตอง 31% และสามารถอานตวเลขอาราบกไดถกตอง 50% สามารถอานภาษาองกฤษตวใหญท 15 องศา -15 องศา ไดถกตอง 5% สามารถอานภาษาองกฤษตวเลกไดถกตอง 5% และสามารถอานตวเลขอาราบกไดถกตอง 10 % และไมสามารถอานพยญชนะ ตวสระไดเลยต .งแต 30 องศาและ - 30 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร ผลการดาเนนการระหวางแคปชาภาษาองกฤษแบบท� 2 กบ โปรแกรม Softi FreeOCR

จากตารางดงตอไปน.จะทาการสมสรางจดและสมสรางเสนบนพ.นหลงเพมข.นทละ 0% ต .งแต 0% ถง 20% ของพ.นท และจะแสดงเปนเปอรเซนต โดยจะทาการสม 10 คร .งของแตละตวอกษรบนแคปชาทมการสรางการรบกวน เพอใหทราบวาโปรแกรมโอซอารน.สามารถอาน ถก-ผด โดยเฉลยกเปอรเซนต วธการคานวณในหวขอท 4.1.2 และจะทาการสรปในแตละกรณทเหมาะดงตอไปน.

Page 82: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

71

ตารางท� 4.37 สรปผลการสมสรางจดบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 2 กบ โปรแกรม Softi FreeOCR

จากตารางท 4.37 สรปผลการสมสรางจดบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR และไมมสงรบกวนบนพ.นหลง แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- การไมมสงรบกวนบนพ.นหลง สามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง35% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 31% และสามารถอานเลขอาราบกไดถกตอง 50% และแสดงใหเหนควรใชตวอกษรภาษาองกฤษตวเลกเพราะโปรแกรมอานถกตองไดเปอรเซนตนอยกวาตวอกษรภาษาองกฤษตวใหญ

- การสมสรางจดบนพ.นหลงชวง 0% - 5% ของพ.นท และแสดงใหเหนวาสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตอง 8% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตอง 4 % และตวเลขอาราบกไดถกตองเลย

- การสมสรางจดบนพ.นหลง 6% - 10% , 11% - 15% , 16% - 20% ของพ.นท ไมสามารถอานตวอกษรภาษาองกฤษตวใหญและอกษรภาษาองกฤษตวเลกและตวเลขอาราบกไดถกตองเลยและรายละเอยดอนๆ ดงในตารางท 4.37

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวนท�

อานผด %ตวอยางรป

1. ไมมการสมจดและสมเสนของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 91 35 65

อกษรภาษาองกฤษตวเลก 26 81 31 69

ตวเลขอาราบก 10 50 50 50

2. การสมจด 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 21 8 92

อกษรภาษาองกฤษตวเลก 26 10 4 96

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

5. การสมจด 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 83: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

72

ตารางท� 4.38 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR

จากตารางท 4.38 สรปผลการสมสรางเสนบนพ.นหลง 0%-20% ภาษาองกฤษแบบท 2

กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน. - ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและ

ตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.38

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 84: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

73

ตารางท� 4.39 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR

จากตารางท 4.39 สรปผลการสมสรางจดบนพ.นหลง 5% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน.สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.39

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 15% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 15% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 85: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

74

ตารางท� 4.40 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR

จากตารางท 4.40 สรปผลการสมสรางจดบนพ.นหลง 10% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยด อน ๆ ดงตารางท 4.40

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 10 % และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 10 % และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 10 % และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 10% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 86: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

75

ตารางท� 4.41 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR

จากตารางท 4.41 สรปผลการสมสรางจดบนพ.นหลง 15% และการสมสรางเสนบนพ.น

หลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรมโอซอารน. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.41

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวนตวอกษร

ท�อานถกตอง

ท &งหมด 10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 15% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 15% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 15% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 15% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

Page 87: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

76

ตารางท� 4.42 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.นหลง ในชวง

0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR

จากตารางท 4.42 สรปผลการสมสรางจดบนพ.นหลง 20% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20% ภาษาองกฤษแบบท 2 กบโปรแกรม Softi FreeOCR แสดงผลใหเหนวาในแตละกรณการทดลองมรายละเอยดดงน.

- ไมมกรณใดๆทโปรแกรม โอซอาร น. สามารถอานตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลก รวมถงตวเลขอาราบกไดเลยและมรายละเอยดอน ๆ ดงตารางท 4.42

สรปผลการอานขอมลระหวาง แคปชาภาษาองกฤษแบบท� 2 และ โปรแกรม Softi FreeOCR

กรณท 1 คอ จากตารางสรปไดวา กรณทไมมการสรางสวนรบกวนพ.น สามารถอานภาษาองกฤษตวใหญไดถกตอง 31% และสามารถอานตวอกษรภาษาองกฤษตวเลกไดถกตองได 35% และสามารถอานตวเลขอาราบกได 50 % น .นกหมายความวา แคปชา แบบน.ไมปลอดภยเสยงตอการแฮกไดงายดงน .นจงตองหาวธเพอใหโปรแกรม โอซอาร น.อานไดยาก

การทดลอง

จานวน

ตวอกษร

ท &งหมด

จานวน

ตวอกษรท�อาน

ถกตองท &งหมด

10 คร &ง

จานวน

ท�อาน

ถกตอง

%

จานวน

ท�อานผด

%

ตวอยางรป

1. การสมจด 20% และสมเสน 0%- 5% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

2. การสมจด 20% และสมเสน 6% - 10% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

3. การสมจด 20% และสมเสน 11% - 15% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100

ตวเลขอาราบก 10 0 0 100

4. การสมจด 20% และสมเสน 16% - 20% ของพ.นหลง

อกษรภาษาองกฤษตวใหญ 26 0 0 100

อกษรภาษาองกฤษตวเลก 26 0 0 100 ตวเลขอาราบก 10 0 0 100

Page 88: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

77

กรณท 2 คอการหมนเปลยนทศทางตวอกษร โดยการทาการเพมองศาข.นทละ15 องศาดรายละเอยดในตารางท 4.36 และจะคอยๆลดเปอรเซนตการอานทถกตองลดลงจนไมสามารถอานขอมลทนามาทดลองไดเลยต .งแต 45 องศาและ - 45 องศา ข.นไปแตกยงสามารถอานตวเลขอาราบกไดทกการหมนของตวอกษร แสดงใหเหนวาการหมนเปลยนทศทางสงผลใหโปรแกรมโอซอารอานขอมลไดยากข.น

กรณท 3 คอ การสมสรางจดบนพ.นหลงอยางเดยวท 0% – 20 % ของพ.นท โดยการการสมสรางจดบนพ.นหลงข.นทละ 5% ของพ.นท แสดงใหทราบวาโปรแกรมโอซอารสามารถอานตวอกษรภาษาองกฤษตวใหญไดถกตองมากกวาตวอกษรภาษาองกฤษตวเลกและตวเลขอาราบกไดถกตองเลย รายละเอยดอนๆดงรป 4.37 ซงแสดงใหเหนวาการสมสรางจดอยางเดยวจงยงไมปลอดภย กรณท 4 คอการสมสรางเสนบนพ.นหลงอยางเดยวท 0%–20% ของพ.นท แสดงใหเหนวา การสมสรางเสนบนพ.นหลงอยางเดยวท .ง 4 ชวงตามทกาหนด ทาใหโปรแกรมโอซอารไมสามารถอานขอมลทนามาทดลองไดในบางกรณ ดงตารางท 4.38 แตเพอความปลอดภยมากข.นจะทางานทดลองสมท .งจดและท .งเสนพรอมๆ กน และเพอหาจดทมนษยสามารถมองเหนไดชดเจนและโปรแกรมโอซอารน.อานไดยาก กรณท 5 การสมสรางจดบนพ.นหลงท 5% และการสมสรางเสนบนพ.นหลง ในชวง 0% - 20 % ของพ.นท ไมสามารถอานขอมลทนามาทดลองไดถกตองเลย กรณท 6 การสมสรางจดบนพ.นหลงท 10% และสมพ.นหลงในชวง 0% - 20% พ.นท ไมสามารถอานขอมลทนามาทดลองไดถกตองเลยและแคปชา ทสรางข.นในกรณน. มนษยยงสามารถทจะอานไดคอยขางชดเจน กรณท 7 คอ การสมสรางจดบนพ.นหลงท 15% และการสมสรางเสนบนพ.นหลงท 0% - 20% ของพ.นท ไมสามารถอานขอมลทนามาทดลองไดถกตองเลย แตกยงเปนอปสรรคในการมองเหนของมนษย

กรณท 8 คอ การสมสรางจดบนพ.นหลงท 20% และการสมสรางเสนบนพ.นหลงท 0% - 20 %ของพ.นทแสดงใหเหนวา ไมสามารถอานขอมลทนามาทดลองไดถกตองเลย แตกยงเปนอปสรรคในการมองเหนของมนษย

ดงน .นจากการศกษาในการทดลอง ท .งหมด 8 กรณ โดยการใชโปรแกรม FreeOCR ในการอานแคปชาทสรางข.นในกรณทเปนภาษาองกฤษทาใหพอสรปไดวา ควรใชภาษาองกฤษตวเลก เพราะทาใหโปรแกรมโอซอารน.อานถกตองไดนอยกวาภาษาองกฤษตวใหญ และควรใชการสมจดบนพ.นหลงท 10% และการสมสรางเสนบนพ.นหลงท 11%-15% ดงตวอยางตารางท 4.40 เพอสรางการรบกวนในแคปชาและจะทาใหโปรแกรม FreeOCR น.อานไมไดและยงเปนอปสรรคในการมองเหนของมนษยนอยทสด

Page 89: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

78

4.2 สภาพแวดลอมการของการทดลองโปรแกรมแคปชา ในกรณเลอกเปนภาษาไทย การทดลองสราง Thai CAPCHA โดยเลอกใชคณสมบตการสรางตวอกษรดงตอไปน. • ใชการรบกวนแบบจด 10% • ใชรบกวนแบบเสน 11% - 15% • ใชการสมทศทางตามทกาหนด(0,-15,15,-30,30,-45,45,-60,60,-75,75) • สรางฟงกชนการคานวณทางคณตศาสตร

การทดสอบทาโดยการใสรหสโปรแกรม PHP ดวยวธการทนาเสนอในบทท 3 เขาไปในสวนของการลอกอนดงรปท 4.4

รปท� 4.4 หนาจอแสดงผล Thai CAPTCHA ทนาเสนอ

4.2.1 การทดลองผลการทางานโดยการปอนผลลพธท�ผดพลาด

ทาการปอนคาขอมลโดยปอนผลลพธทผด จากตวอยางการทางานดงรปท 4.4 (ก) หนาจอจะแสดงขอความ หก บวก แปด ผลลพธทถกตองคอคา 14 แตทาการปอนคา เปน 11

Page 90: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

79

รปท� 4.5 (ก) หนาจอการปอนขอมลทผดพลาด

ผลลพธทไดในกรณทการปอนคาตอบผดพลาดจะแสดงดงรปท 4.5 (ข)

รปท� 4.5 (ข) หนาจอผลลพธการปอนขอมลทผดพลาด

4.2.2 การทดลองผลการทางานโดยการปอนผลลพธท�ถกตอง

ทาการปอนคาขอมลโดยปอนผลลพธทถกตอง จากตวอยางการทางานดงรปท 4.6(ก) หนาจอจะแสดงขอความ หก บวกแปด ผลลพธทถกตองคอคา 14

Page 91: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

80

รปท� 4.6 (ก) หนาจอการปอนขอมลทถกตอง

ผลลพธทไดในกรณทการปอนคาตอบทถกตองจะแสดงดงรปท 4.6 (ข)

รปท� 4.6 (ข) หนาจอผลลพธการปอนขอมลทถกตอง

4.3 สภาพแวดลอมการของการทดลอง ในกรณเลอกเปน ภาษาองกฤษ การทดลองสราง Thai CAPCHA โดยเลอกใชคณสมบตการสรางตวอกษรดงตอไปน. • ใชการรบกวนสมสรางจด 10% • ใชรบกวนแบบเสน 11% - 15% • ใชการสมทศทางตามทกาหนด (0,-15,15,-30,30,-45,45,-60,60,-75,75) • สรางฟงกชนการคานวณทางคณตศาสตร

การทดสอบทาโดยการใสรหสโปรแกรม PHP ดวยวธการทนาเสนอในบทท 3 เขาไปในสวน ของการลอกอนดงรปท 4.7

Page 92: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

81

รปท� 4.7 หนาจอแสดงผล English CAPTCHA ทนาเสนอ

4.3.1 การทดลองผลการทางานโดยการปอนผลลพธท�ผดพลาด

ทาการปอนคาขอมลโดยปอนผลลพธทผด จากตวอยางการทางานดงรปท 4.8 (ก) หนาจอจะแสดงขอความ two multiply nine หมายถงสองคณเกา ผลลพธทถกตองคอคา 18 แตทาการปอนคา เปน 11

รปท� 4.8 (ก) หนาจอการปอนขอมลทผดพลาด

Page 93: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

82

ผลลพธทไดในกรณทการปอนคาตอบผดพลาดจะแสดงดงรปท 4.8 (ข)

รปท� 4.8 (ข) หนาจอผลลพธการปอนขอมลทผดพลาด

4.3.2 การทดลองผลการทางานโดยการปอนผลลพธท�ถกตอง

ทาการปอนคาขอมลโดยปอนผลลพธทถกตอง จากตวอยางการทางานดงรปท 4.9(ก) หนาจอจะแสดงขอความ two multiply nine หมายถงสองคณเกา ผลลพธทถกตองคอคา 18

รปท� 4.9 (ก) หนาจอการปอนขอมลทถกตอง

Page 94: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

83

ผลลพธทไดในกรณทการปอนคาตอบทถกตองจะแสดงดงรปท 4.9 (ข)

รปท� 4.9(ข) หนาจอผลลพธการปอนขอมลทถกตอง 4.4 การเพ�มการรบกวนโดยการปรบสตวอกษรและสของการรบกวนบนพ&นหลง

รปท 4.10 การเพมการรบกวนโดยการปรบสใหใกลเคยงกน

จากรปท 4.10 การเพมการรบกวนโดยการปรบสใหใกลเคยงกน โดยการปรบสตวอกษรและปรบสของการสมสรางจดและการสมสรางเสนบนพ.นหลง จะทาใหแยกตวอกษรออกมาไดยากข.นและเพมประสทธภาพมากข.น 4.5 การเปรยบเทยบแคปชาท�สรางข&นกบแคปชาท�ใชท �วไป

ปจจบนแคปชามการใชเทคนคทหลากหลายแตกตางกนไป แตอยางไรกตามตองคานกถงการใชงานตองใหงายตอผใชและความปลอดภยจากการโจมตของบอท ดงน .นทางผวจยจงไดแบงตามเทคนคตางๆ ทเปนคณสมบตของแคปชาได 8 เทคนคพ.นฐาน

1. อานได หมายถงการทมนษยมองเหนไดชดเจนและสามารถอานขอความไดและเปนขอความทมนษยเคยเหนมากอน

2. มความหมาย หมายถง แคปชาทสมสรางข.นมาจะตองเปนคาทมความหมายและปรากฎอยใสรายการคาศพทของพจนานกรมการทมนษยอานแลวเขาใจและมความหมาย

3. เสนเชอม หมายถง การสมสรางเสนลากเสนผานขอความตวอกษรในแคปชาเพอสรางการรบกวนใหโปรแกรมโอซอาร ทาใหไมสามารถแบงตวอกษรไดงาย

Page 95: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

84

4. การหมน หมายถงการหมนตวอกษรในทศทางทกาหนดและองศาทสมข.นเพอสรางการรบกวนใหโปรแกรมโอซอารเดาทศทางตาแหนงทหลากหลายทาใหอานไดยากข.น

5. การบดรป หมายถง การบดเบอนรปรางตวอกษรและภาพในลกษณะโคงงอ เชนการบดภาพใหงอคลายกบรปงเล.อย เพอสรางการรบกวนใหโปรแกรมโอซอารอานไดยากข.น

6. หลายฟอนต หมายถง การสมรปแบบฟอนตตวอกษรใหมความหลากหลายเพอใหโปรแกรมโอซอารแบงตวอกษรไดยาก

7. ภาพพ.นหลง หมายถง การเตมภาพพ.นหลงดวยลวดลายและสเปนภาพทไมเปลยนแปลงและการสมสรางภาพพ.นหลงดวยลวดลายหรอสตางๆทสมข.นมาใหหลากหลายและนามาผสมกบภาพตวอกษรตนฉบบเดมเพอสรางการรบกวนใหโปรแกรมโอซอาร แบงแยกตวอกษรไดยาก

8. ลกษณะพเศษ หมายถง การทแคปชามการเพมลกษณะเดนแตกตางเชน การเพมการคานวณคณตศาสตร การต .งคาถามทคนเคยและสรางภาพตวอกษรประกอบใหเลอกคาตอบทถกตอง เปนตน เพอใหมความปลอดภยมากข.นแตอยางไรกตามกตองคานวณถงการใชงานไมใหใชงายสาหรบผใช

4.5.1 การเปรยบเทยบแคปชาท�เปนภาษาไทย ตารางท� 4.43 ตารางการเปรยบเทยบแคปชาทเปนภาษาไทย โดยจะทาการเลอกแคปชาภาษาไทยทใชท วไปมาเปรยบเทยบกนแคปชาทสรางข.นดงน.

เทคนคท�ใช

อานไ

มควา

มหมา

เสนเ

ช�อม

การห

มน

การบ

ดรป

หลาย

ฟอนต

ภาพพ

&นหลง

ลกษณ

ะพเศ

รปท� 1.

���� ���� ���� ���� - - ���� ����

รปท� 2.

���� - - - ���� ���� -

Page 96: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

85

เทคนคท�ใช

อานไ

มควา

มหมา

เสนเ

ช�อม

การห

มน

การบ

ดรป

หลาย

ฟอนต

ภาพพ

&นหลง

ลกษณ

ะพเศ

รปท� 3.

���� ���� ���� - - - -

รปท� 4.

���� - - - - - -

รปท� 5.

���� ���� - ���� - - ���� -

จากตารางจะเปรยบเทยบแคปชาทเปนภาษาไทยท .งหมด 5 แบบและทางผวจยไดแบง

ตามเทคนคตางๆได 8 เทคนคพ.นฐาน แสดงใหเหนวารปท 1 เปนแคปชาทสรางข.นมาจากการวเคราะหมคณสมบตมากกวา

แคปชาภาษาไทยอนๆทนามาทดสอบ

4.5.2 การเปรยบเทยบแคปชาท�เปนภาษาองกฤษ ตารางท� 4.44 ตารางการเปรยบเทยบแคปชาทเปนภาษาองกฤษ โดยจะทาการเลอกแคปชาภาษาองกฤษทใชท วไปมาเปรยบเทยบกนแคปชาทสรางข.นดงน.

เทคนคท�ใช

อานไ

มควา

มหมา

เสนเ

ช�อม

การห

มน

การบ

ดรป

หลาย

ฟอนต

ภาพพ

&นหลง

ลกษณ

ะพเศ

รปท� 1.

���� ���� ���� ���� - - ���� ����

Page 97: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

86

เทคนคท�ใช

อานไ

มควา

มหมา

เสนเ

ช�อม

การห

มน

การบ

ดรป

หลาย

ฟอนต

ภาพพ

&นหลง

ลกษณ

ะพเศ

รปท� 2.

- - - - ���� ���� -

รปท� 3.

���� - - - ���� - - -

รปท� 4.

���� - ���� - ���� - - -

รปท� 5.

���� ���� - - - - ���� -

รปท� 6.

- ���� - - ���� - ����

รปท� 7.

���� - - ���� - ���� - -

รปท� 8.

���� ���� ���� ���� ���� ���� ���� -

รปท� 9.

���� - ���� - ���� - ���� -

รปท� 10.

���� ���� - - - - ���� -

Page 98: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

87

จากตารางจะเปรยบเทยบแคปชาทเปนภาษาองกฤษท .งหมด 10 แบบและทางผวจยไดแบงตามเทคนคตางๆได 8 เทคนคพ.นฐาน แสดงใหเหนวารปท 1 เปนแคปชาทสรางข.นมาจากการวเคราะหมคณสมบตอนดบท 2 รองจากแคปชารปท 8 ซงกยงมขอแตกตางกนทแคปชาทสรางข.นสามารถมองไดชดเจนกวาแคปชารปทแปดบางคร .งของการสมและยงเพมความปลอดภยอกข .นโดยการใชความรทองถนท วไปคอ บวก ลบ คณ เขามาชวยเสรมใหมความยากตอการแฮกของบอทมากข.น 4.6 สรปทายบท

จากการทดลองโปรแกรมแคปชาภาษาไทยกบโปรแกรมโอซอาร ทมอยในปจจบน โดยจะมการสรางการรบกวนบนพ.นหลงโดยการสมสรางเสนบนพ.นหลงและการสมสรางเสนบนพ.นหลงรวมถงการหมนตวอกษรทาใหพอสรปไดวา

กรณท แคปชาเปนภาษาไทยจากการทดลองนาตวอกษรแบบท 1 ซงเปนตวอกษรแบบทางการทใชท วไปและตวอกษรแบบท 2 เปนตวอกษรแบบไมเปนทางการดงรปทแสดงตวอยางขางตน แสดงใหเหนวาตวอกษรแบบท 2 ทาใหโปรแกรม ArnThai อานไดยากกวาตวอกษรแบบท 1 ดงน .นจงควรใชตวอกษรแบบท 2 และไดทาการทดลองกบโปรแกรม ArnThai ทาให ทราบวาการสมสรางจดเพยงอยางเดยวยงทาใหโปรแกรมอาน แคปชา ภาษาไทยไดงาย ซงยงทาใหแคปชาทสรางข.น ยงไมปลอดภยจากการโจมต ดงน .นจงมการเพมการสมสรางเสนและการหมนเพอเปลยนทศทางของตวอกษรและเพอใหปลอดภยมากข.น จงเลอกเปอรเซนตของการสมสรางจด การสมสรางเสน สมองศาการหมน ในจดทมนษยสามารถมองเหนไดชดเจนและยากตอการเดาของโปแกรม โอซอาร มากทสด คอ การสมสรางจดท 10% และการสมสรางเสนท 11%-15%

กรณท แคปชาเปนภาษาองกฤษทาการทดลองตวอกษรแบบท 1 และตวอกษรแบบท 2 กบโปรแกรม FreeOCR และ Softi FreeOCR ทาใหทราบ ความแตกตางของตวอกษรภาษาองกฤษตวใหญและตวอกษรภาษาองกฤษตวเลกมความตางกน และสรปไดวาควรใชตวอกษรภาษาองกฤษตวเลก และควรใชตวอกษรแบบท 2 เพราะทาใหโปรแกรมน.อานไดยากทสด ถงแมวาการสมสรางจดเพยงอยางเดยวในตวอกษรแบบท 1 การสมสรางจดท 20% ของพ.นทจะทาใหโปรแกรมโอซอาร ยงสามารถอานแคปชาทสรางข.นได แตกยงเปนอปสรรคในการมองเหนของมนษยจงการสมสรางเสนบนพ.นหลงพรอมกน รวมถงเปลยนทศทางของตวอกษรตามทกาหนดและในตวอกษรแบบท 2 ทาใหโปรแกรมโอซอารอานไดยากมากกวาตวอกษรแบบท 1 แตถงอยางไรกตามจะพจารณาในจดทมนษยสามารถมองเหนไดชดเจนและยากตอการอานของโปแกรมโอซอารมากทสด คอ การสมสรางจดท 10% และการสมสรางเสนท 11%-15% จะทาใหแคปชาทสรางข.นปลอดภยจากการโจมตเชนกนเมอพจารณาจากผลการทดลอง

Page 99: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

88

บทท� 5

สรปผลและงานในอนาคต

สาหรบในบทน�จะกลาวถงบทสรปผลและการพฒนาแคปชาภาษาไทยและแนวทางในการศกษาในอนาคต

5.1 สรปและวเคราะหผล

จากการทดลองโปรแกรมแคปชาภาษาไทย กบโปรแกรมโอซอารท-มอยในปจจบน ในสวนของโปรแกรมแคปชาภาษาไทย ไดทาการสรางการรบกวนท-พ�นหลง โดยการสมสรางจดท-พ�นหลงและสมสรางท-เสนพ�นหลงเพ-มข�นตามลาดบท-กาหนด รวมถงการเปล-ยนทศทางของตวอกษรในแตละกรณท-เราศกษาใสลงไปในพ�นหลงและทาการสมการคานวณทางคณตศาสตร คอ บวก (+), ลบ (-), คณ (*) ระหวางตวเลขท-สมข�นมา 2 จานวน สรปไดดงน�

จากผลการทดลองไดทาการทดลองกรณศกษาโดยไดเลอกตวอกษรมา 2 แบบ คอ ตวอกษรแบบท- 1 เปนตวอกษรท-นยมใชในส-อส-งพมพกนท -วไปท-เปนทางการ ตวอกษรแบบท- 2 เปนตวอกษรท-นยมใชในส-อตางๆ ท-ไมเปนทางการ และไดนามาทดลองท �งหมด 8 กรณดงน�

กรณท- 1 กรณท-ไมมการสรางสวนรบกวนพ�นหลง จากการทดลองของตวอกษรแบบ ท- 1 แสดงใหเหนวาโปรแกรมโอซอาร กรณแคปชาภาษาไทยสามารถอานตวพยญชนะภาษาไทยไดถกตองไดมากถง 84% และสามารถอานตวอกษรแบบท- 2 พยญชนะภาษาไทยไดถกตอง 30% กรณแคปชาเปนภาษาองกฤษเม-อทดสอบกบโปรแกรมโอซอารท �ง 2 โปรแกรม คอ FreeOCR และSofti FreeOCR แสดงใหเหนวา ตวอกษรแบบท- 2 ทาใหโปรแกรมอานไดยากมากท-สด น -นกพอจะสรปไดวาควรจะใชตวอกษรแบบท- 2 และในสวนของการแสดงขอความโดยไมมการรบกวนใดๆ ยงไมปลอดภยเส-ยงตอการแฮกไดงาย

กรณท- 2 การหมนเปล-ยนทศทางของตวอกษร โดยจะเลอกใชองศาใน quadrant ท- 1 และ quadrant ท- 4 ดงท-กลาวมาในบทท- 3 เพ-อใหไมเปนอปสรรคตอการมองเหนกบมนษยมากนก โดยใชองศาในการหมนดงน� 0 องศา 15 องศา -15 องศา 30 องศา -30 องศา 45 องศา -45 องศา 60 องศา -60 องศา 70 องศา -75 องศา แสดงใหเหนวา กรณแคปชาภาษาไทยตวอกษรแบบท- 1 หลงจากการทดลองทาใหทราบวาโปรแกรมโอซอาร Arnthai ทาใหไมสามารถอานพยญชนะ ตวสระไดเลยต �งแต 45 องศาและ - 45 องศาข�นไป แตตวอกษรแบบท- 2 ไมสามารถอานพยญชนะ ตวสระไดเลยต �งแต 30 องศาและ - 30 องศา ข�นไป และกรณแคปชาท-เลอกเปนภาษาองกฤษ ทาใหไมสามารถอานตวอกษรภาษาองกฤษท �งตวใหญและตวเลกไดเลย ต �งแต 45 องศาและ - 45 องศาข�นไปเลย ของท �ง 2 แบบตวอกษรและท �งสองโปรแกรมโอซอาร

กรณท- 3 การสมสรางจดบนพ�นหลงอยางเดยวท- 0% – 20% ของพ�นท- จากผลการทดลองกาหนดเปน 4 ชวงท-กลาวมาในบทท- 3 กรณแคปชาเปนภาษาไทย ทาการทดลองอานกบโปรแกรม Arnthai และกรณแคปชาท-เลอกเปนภาษาองกฤษทดลองอานกบโปรแกรม

Page 100: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

89

FreeOCR และ Softi OCR แสดงผลใหเหนวาโปรแกรมโอซอารสามารถอานตวอกษรในแบบท- 2 ไดยากกวาผลจากการทดลองของตวอกษรแบบท- 1 ของท �งแคปชาภาษาไทยและแคปชาท-เลอกเปนภาษาองกฤษ แสดงวาตวอกษรแบบท- 2 มความปลอดภยการถกแฮกไดมากวาตวอกษรแบบท- 1 เม-อพจารณาในจดท-เปนอปสรรคในการมองเหนของมนษยนอยท-สดและโปรแกรมโอซอารอานไดยากท-สด จะสรปไดวา ควรใชการรบกวนการสมสรางจด 10% เหมาะสมท-สด แตถงอยางไรกตามโปรแกรมโอซอารกยงอานได จงยงตองหาการรบกวนอ-นเขามาชวยเสรมคอ ดงในกรณท- 4

กรณท- 4 คอ การสมสรางเสนบนพ�นหลงอยางเดยวท- 0%–20% ของพ�นท- จากผลการทดลองท-นาขอมลอานกบโปรแกรมโอซอาร กรณแคปชาเปนภาษาไทย แสดงใหเหนวา ตวอกษรแบบท- 1โดยเฉล-ยแลวโปรแกรมสามารถอานขอมลไดในกรณการสมสรางเสนในชวง 0% - 5% แตตวอกษรแบบท- 2 ไมสามารถอานไดทกชวงกรณการสมสรางเสน และ กรณแคปชาท-เลอกเปนภาษาองกฤษเม-อทาการทดลองอานกบโปรแกรมโอซอาร แสดงใหเหนวาโปรแกรมไมสามารถอานขอมลท-นามาทดลองไดเลยทกชวงกรณของการสมสรางเสน ดงน �นจงสรปไดวาควรใชตวอกษรแบบท- 2 และควรใชการรบกวนการสมสรางเสนในชวง 11% -15% เหมาะสมท-สด โดยพจารณาในจดท-เปนอปสรรคในการมองเหนของมนษยนอยท-สด แตเพ-อความปลอดภยมากย-งข�น จงจะทาการทดลองสมท �งจดและท �งเสนพรอมๆ กน เพ-อทาใหโปรแกรมโอซอารท-มการพฒนาอยตลอดในปจจบนอานไดยากท-สดหรอการแฮกจากบคคลท-ประสงคไมดไดยากย-งข�น ดงในกรณท- 5 กรณท- 5 ถงกรณท- 8 มการสมสรางจดเพ-มข�นท-ละ 5% ถง 20% ตามลาดบ คอ การสมสรางจดบนพ�นหลงท- 5% 10% 15% 20% เพ-มข�นตามลาดบไปพรอมกบการสมสรางเสนบนพ�นหลง ในชวง 0%–20% ของพ�นท- ของท �งแคปชาภาษาไทยและแคปชาท-เลอกเปนภาษาองกฤษและท �งตวอกษรแบบท- 1 และตวอกษรแบบท- 2 หลงจากทาการทดลองกบโปรแกรมโอซอารท-นามาทดลอง แสดงใหเหนวาไมสามารถอานขอมลท-นามาทดลองไดถกตองเลย

ดงน �นจงสรปภาพรวมท �งหมด 8 กรณท-นามาทดลองไดวา หลงจากไดทาการทดลองกบโปรแกรมโอซอารแลว ท �งกรณแคปชาเปนภาษาไทยและกรณแคปชาเปนภาษาองกฤษ แสดงใหเหนวา ควรใชตวอกษรแบบท- 2 และควรใชการสมสรางเสนท- 10% พรอมกบการสมสรางเสนท- 11%-15% บนพ�นหลงของพ�นท- รวมถงควรใชการสมองศาท �งหมด 11 แบบตามท-กาหนด เพ-อทาใหตวอกษรหรอขอความ มการหมนเปล-ยนทศทางไมหยดน-งซ-งจะทาใหโปรแกรมโอซอารเดาทศทางไดยากข�น จากผลสรปท-กลาวมาไดพจารณาในจดท-ยากตอการอานของโปรแกรม โอซอารมากท-สดและเปนอปสรรคในการมองเหนของมนษยนอยท-สด ซ-งน �นกเปนผลท-จะทาใหแคปชาปลอดภยจากการโจมตจากบอทตางประเทศมากข�น

Page 101: แค๊ปช่าภาษาไทย THAI CAPTCHA · 2012. 7. 10. · ส่วนสร้างการหมุนตัวอักษร ส่วนสร้างการรบกวนพื7นหลัง

90

ถงอยางไรกตาม แคปชาภาษาไทยและแคปชาท-เปนภาษาองกฤษกยงตองทาการศกษาเพ-มเตมอกตอไป 5.2 แนวทางในการศกษาในอนาคต

ศกษาและทาความเขาใจเน�อหารายละเอยดท-มาสนบสนนงานวจยเพ-มเตมในสวนท-ยงไมสมบรณ เชน ทาใหตวอกษรบดเบ�ยว หรอเพ-มไฟลเสยงใหมนษยสามารถเลอกฟงได หรอหาโปรแกรมโอซอารมาทดสอบใหมากข�น เพ-อนามาวเคราะหผลการออกแบบพฒนาแคปชา ใหมคณภาพ มความนาเช-อถอ มความปลอดภยจากการโจมตจากบอทใหไดมากท-สดและยงตองทาใหมนษยสามารถเขาใจและใชงานไดงายท-สด