abbyy finereader engine product brief - thai
TRANSCRIPT
• ส า ม า ร ถ เ พม พ น ค ว า ม ฉ ล า ด ใ ห ก บโปรแกรมประยกตในงานดานการรจ�าขอมล และการแปลงรปแบบของไฟลเอกสาร • สามารถควบคมไดอยางสมบรณ ส�าหรบการตงคาใหกบงานประมวลผลเอกสาร และผลลพธสดทายตางๆ ทไดจากรจ�าขอมล • การเขาถงองคประกอบตางๆในเอกสารผาน “API” งาย และประหยดเวลาในการพฒนาระบบ • รองรบงานประมวลผลแบบหลายแกนได ซงสามารถน�ามาบรณาการกบระบบงานขนาดใหญๆทตอง รบภาระปรมาณมากๆ • สวนประกอบเกยวกบสวนตดตอผ ใช งานทตระเตรยมไวให สามารถน� ามาใช ภายในโซลชนของผ พฒนาไดโดยงาย • การใหความสนบสนนทางดานเทคนคทผานการรบรองโดยวศวกรของ ABBYY
we digitize document to valuable informationN2N SOLUTION PROVIDER
ABBYY Finereader Engineชดพฒนาซอฟตแวรทครอบคลมงานดานการรจ�าขอมล และ การแปลงเอกสาร
FineReader Engine คอ ชดพฒนาซอฟตแวรทท�างานไดทงบนระบบปฏบตการไมโครซอฟตวนโดว ลนกซ หรอ ยนกซ ใชเพอบรณาการความสามารถดานการรจ�าไดหลากหลายภาษา และเทคโนโลยตางๆเพองานแปลงไฟลเอกสาร รวมกบโปรแกรมประยกตตางๆ ทตองการความสามารถเหลานใหเปนคณสมบตหนงภายในโปรแกรมของตนเอง ชดเครองมอและค�าสงทางดานซอฟตแวรทมอยภายในชดพฒนาซอฟตแวรตวน ไดอ�านวยความสะดวกใหกบนกพฒนาโปรแกรมในการน�าเอาความสามารถหลก ส�าคญๆของ ABBYY มาใชงานได ไมวาจะเปน การรจ�าอกษรบนเอกสารภาพ หรอ การรจ�าลายมอบนเอกสารภาพ หรอ การรจ�ากรอบรบเครองหมายถก หรอการรจ�าขอมลรหสแทงทงแบบ 1 มต และ 2มต และ ความสามารถดานการสรางไฟลประเภท PDF ดวยเทคโนโลยตางๆ เปนตน FineReader Engine เปนโซลชนทใชส�าหรบการสรางระบบทตองการความถกตองทสง มความสามารถดานขยายระบบ การรจ�าขอมลทมประสทธภาพ และ การแปลงขอมล และนคอโซลชนการแปลงขอมลขาวสารทดทสด
ยนหยนมาก ไดผลลพธท แมนย�า และ ตนทนประสทธผล
โครงสรางทยนหยนรองรบการขยายเพมFineReader Engine ไดรวบรวมกลมของคณสมบตความสามารถดานการรจ�าทใหคณภาพสง ความเรวในการแปลงและรจ�าขอมลทมประสทธภาพ และเครองมออ�านวยความสะดวกในดานการพฒนาซอฟตแวรตางๆ เขาไวภายในชดพฒนาซอฟตแวรตวเดยว
มความยนหยนเพยงพอตอโปรแกรมประยกตไมวาจะเปนประเภทใด F ineReader Eng ine สามารถน� าไปใช ใน • โปรแกรมประยกตเพอการจดเกบ และประมวลผลเอกสาร• ระบบควบคม และตรวจสอบความถกตอง• ระบบการแปลงสภาพของเอกสารตางๆ• โปรแกรมประยกตดานงานประมวลผลขอมลทมาจากอปกรณแฟกซ• การสรางเนอหา และโปรแกรมเพอการบรหารจดการ• โปรแกรมประยกตเพองานจดการหองจดหมายดจตอล• โปรแกรมเพอการจดเรยงชดเอกสาร• ระบบการตพมพเอกสารผานทางเวบ• โปรแกรมประยกตเพอการจดเกบเอกสารภายในเครอขายทองถน• โซลชนเพอการตดเนอความจากสอดจตอล• ระบบการอาน และเลนไฟลเสยงอตโนมต
ผผลตหนงเดยวทมพรอมทกเทคโนโลยABBYY สงมอบเทคโนโลยทหลากหลายและครบถวนสมรณส�าหรบงานแปลงเอกสาร และการพฒนาโซลชนเพอจบขอมลภายในเอกสารอเลกทรอนกส ดวยความสามารถของชดพฒนาซอฟตแวรจาก ABBYY ผพฒนาโปรแกรมไมจ�าเปนตองไปเสาะหา หรอ ใชชดพฒนาซอฟตแวรจากแหลงอนๆใหวนวาย ยงยาก เพยงเพอทจะใหรองรบงานทมความหลากหลายในโซลชนทตนก�าลงจะพฒนาขนมา
มความสามารถเพยงพอไมวาขนาดของโปรแกรมประยกตจะเปนแบบไหนABBYY Engine สามารถถกน�ามาสรางเปนโปรแกรมประยกตใหรองรบกบงานขนาดเลก หรอขนาดใหญ มความสลบซบซอนมากหรอนอย จากเพยงแคโปรแกรมประยกตทท�างานบนเครองลกขาย ไปสการท�างานบนเครองแมขายประสทธภาพสง หรอโครงการขนาดใหญทตองท�างานกบเอกสารระดบลานๆแผน ดวยการสนบสนนการประมวลผลแบบหลายแกนทมมากบชด
งายตอการน�าไปใชงาน FineReader Engine น�าเสนอวธการหรอขนตอนทจะไปเรยกใชงาน “สวนตดตอทางดานโปรแกรม หรอ แกนเทคโนโลยหลก ในชดพฒนาซอฟตแวร” น ให เปนไปอยางงายดาย ดวยวธการคยกนผาน COM โดยใชโปรแกรมภาษาตางๆ ซงนยมใชกนอยางแพรหลาย อาทเชน C/C++, Visual Basic และ Visual Studio.NET (VB.NET และ C#.NET) ซงเปนประโยชนตอผพฒนาโปรแกรมทไมจ�าเปนตองไปเรยนรโปรแกรมภาษาทตนเองไมคนเคย
ตนทนประสทธผล
การลงทนทม นคง และความยนหยนสง
ดวยโครงสรางแบบเปนโมดล และโครงสรางราคาทหลากหลาย ท�าใหผพฒนาโปรแกรมสามารถเลอกใชงานเฉพาะคณสมบตทตนเอง หรอลกคาในอนาคตสนใจ ในขณะเดยวกนหากวาเกดความตองการเพมเตมขนในอนาคต กสามารถเลอกเพมเตมคณสมบตเหลานนภายหลงได ไมจ�าเปนตองจดซอทกคณสมบตในครงเดยว และนคอความมประสทธผลในการลงทนในมมมองของผพฒนาระบบ
ภาพรวมของผลตภณฑ • เ ปนผลตภณฑทร วบรวมเทคโนโลยคณภาพสงส�าหรบงานร จ� าขอมลจ� าพวก OCR, ICR, OMR, บารโคด 1และ 2มต • ร อ ง ร บ ก า ร ร จ� า ภ า ษ า ไ ด ม า ก ก ว า 1 9 0 ภ า ษ า ส� า ห ร บ ข อ ม ล แ บ บ O C R และ 113 ภาษาส�าหรบขอมลแบบ ICR • เทคโนโลยการรจ� าเอกสารเอกสาร ทถกน� ามาประมวลผลใหกบทกหนาภายในเอกสาร เพอใหไดขอมลเชงตรรกะวาขอมลใดคอ อกษร รปภาพ หรอตาราง ในแตละหนาเอกสาร ท�าใหมนใจไดวาผลลพธทไดออกมามลกษณะใกลเคยงกบตนฉบบ • เทคโนโลยการร จ� าทมาใหมส� าห รบภาษาจน ญป น เกาหล และ ไทย และภ า ษ า อ น ๆ อ ก ใ น แ ถ บ ท ว ป ย โ ร ป • รองรบการน�าขอมลออกไปใหอยในรปแบบของไฟลทหลากหลาย เชน ไฟลขอความธรรมดา XML ไปจนถงไฟลประเภททใช อยใน MS OFFICE (2003/2007/2010) เปนตน • รองรบการสรางขอมลใหอยในรปแบบของ PDF , PDF/A และ MRC PDF
ประโยชนตอผพฒนาโปรแกรม
ineReader Engine คออะไรF
พฒนาซอฟตแวร และไลเซนตทเปนแบบเครอขายซงปรบเปลยนไดตามความตองการ ท�าใหคณมนใจได วาการพฒนาระบบทตองการความยนหยน และความซบซอน ABBYY พรอมเสมอ
ดวยการพฒนาเทคโนโลยตางๆใหมความเหมาะสมและเกดขนอยางตอเนองเสมอมาของ ABBYY การรองรบหลายแพลตฟอรมของ ABBYY FineReader Engine ท�าใหผพฒนาระบบสามารถขยายตลาดของตนเองไปยงระบบปฏบตการตางๆ ทโปรแกรมประยกตหรอโซลชนทไดพฒนาขนสามารถท�างานรวมกนได เชน ระบบปฏบตการจากคายไมโครซอฟต ลนกซ ฟรบเอสด เมคอนทอช และอกมาก
การวเคราะหโครงสรางเอกสารอจฉรยะ เทคโนโลยเฉพาะของ ABBYY
ทละข นทละตอนกบการรจ�าขอมลและคณสมบตการแปลง
we digitize document to valuable informationN2N SOLUTION PROVIDER
FineReader Engine สามารถเรยกเอกสารหรอรปภาพจากแหลงตางๆเหลาน • น�าเขาจากดสกหรอหนวยความจ�าโดยตรง • สแกนภาพผานทางตวขบแบบ TWAIN• น�าเขาจากกลองดจตอล• เปดไฟล PDF
FineReader Enging แปลงไฟลเอกสารใหเปนไฟล PDF ไดหลากหลายรปแบบอยางแมนย�า ตว SDK สามารถทจะเขาถงขอมลทบรรจอยภายในไฟล PDF ได อาทเชน ขอมลเสรมตางๆ ขอมลโครงสรางของฟอนต ขอมลเมตาเดตา และ เนอความภายในเอกสาร
หลงจากทหนาเอกสารไดถกน�าเขามาแลว FineRead-er Engine จะมตวเลอกดานการประมวลผลภาพให เลอก เพอทจะเตรยมความพรอมใหกบเอกสารภาพเหลานนกอน เพอทจะน�าสงผลลพธทดทสดทไดหลงจากการ OCR อาทเชน
• การท�าความสะอาดกบขอมลรบกวน และขอมลขยะทอยในหนาเอกสาร• การปรบปรงคณภาพของไฟลภาพทมาจากกลองดจตอลใหเหมาะสมทสด เชน การปรบความคมชดให กบเสนโคงบนตวอกษรในเอกสารภาพ เปนตน• แยกเอกสารออกเปน 2 หนา กรณสแกนหนาหนงสอ• การเรยกใชงานอลกอรทมทแตกตาง เพอปรบความเอยงของเอกสารใหรองรบไดถง 20 องศา• การปรบปรงดานการแปลงเอกสารใหอยในโหมดขาวด�าทฉลาดขนกวาเดม คอยงคงรกษาเนอความโดยเฉพาะขอมลอกษรทยงคงอยครบถวนสมบรณ
ผพฒนาโปรแกรมสามารถเขาถงขอมลภายใน ซงเปนผลลพธตางๆทไดหลงจากผานขนตอนท 4 ไดทงหมด FineReader Engine ไดเตรยมขอมลพนฐาน อยางเชน พกดตางๆของตวอกษร และยงสามารถเรยกใช งานขอมลขนสงเหลานไดอกดวย• ขอมลรปแบบฟอนต และลกษณะของฟอนต• สมมตฐานตางๆของการรจ�า ค�าและตวอกษร
ขาวสารเหลานสามารถเขาถงโดยผานทาง API หรอน�าออกไปอยในรปของ XML ซงสามารน�ามาใชสรางงานตรวจสอบอตโนมตได เพอใหงายกบผใชงานทตองเขามาท�าการตรวจสอบ และแกไขขอมล ตว AB-BYY FineReader ยงมองคประกอบเกยวกบหนาตางตดตอผใชงาน ใหไวใชงาน ซงจะท�าใหขอมลผลลพธทไดจากการวเคราะห และอกขระทไมมนใจถกน�ามาแสดงผานองคประกอบเหลานไดเพอเปลยนขอมลให ถกตองตามล�าดบของหนาเอกสารภายในชดเอกสาร องคประกอบเกยวกบหนาตางตดตอผใชงานทมให ใชงานมดงน• สวนทใชตดตอกบเครองสแกนเนอร• สวนทใชแสดงขอมลองคประกอบของเอกสาร• สวนทใชแสดงขอมลเอกสารภาพ• สวนทใชเพมเตม แกไขขอมลตวอกษร และประโยค• สวนทใชตรวจสอบความถกตองของตวอกษร และประโยค
ข นท1 เอกสารขาเขา
ข นท 2 การท�างานกบรปภาพข นตน
ข นท 3 วเคราะหโครงสรางเอกสารพนทหรอบรเวณของขอมลทจะถกรจ�าจะถกก�าหนดในขนตอนน ผพฒนาโปรแกรมสามารถเลอกใชโหมดการวเคราะหโครงสรางเอกสารอตโนมตทแตกตางกนได 3 แบบ - แบบท 1 สนใจขอความในเอกสารทงหมด ไมวาขอความนนๆ จะอยเปนสวนหนงของรปภาพ หรออยในผงภาพการไหลขอมล หรอกราฟตางๆ - แบบท 2 แบงพนทตามชนดขอมลเชน พนทเฉพาะขอความ เฉพาะตาราง เฉพาะบารโคด และ รปภาพตางๆ - แบบท 3 การสรางพนทขอมลโดยมอ มกจะใชบอยกรณทตองการอานขอมลเฉพาะบรเวณทสนใจเทานน
ข นท 4 การรจ�าขอมล
หลงจากทก�าหนดพนทใหกบองคประกอบขอมลในหนาเอกสารเสรจแลว ตวอกษร และประโยคตางๆจะถกรจ�า ซง ABBYY SDK รองรบการท�า OCR ใหกบขอมลอกษรไดมากกวา 190 ภาษา และมากกวา 110 ภาษาหากขอมลเปนลกษณะลายมอเขยน มนมควาสามารถทหลากหลายเพอการท�างานกบรปแบบตางๆของฟอนตและองคประกอบตางๆ • ฟอนตมาตรฐาน เปนรปแบบฟอนตทมใชงานทวๆไปในส�านกงาน นตยาสาร หรอ หนงสอพมพ เปนตน• ฟอนตทสรางมาจากเครองพมพหวเขม หรอเครองพมพดด• ฟอนตชนดพเศษ เชน OCR-A, OCR-B, MICR (E13B) และ CMC7 มกจะเปนฟอนตทปรากฎตาม
เชคธนาคาร• ฟอนตตามลกษณะลายมอเขยน• กรอบรบเครองหมายถกผด เชน กระดาษค�าตอบ• บารโคดแบบ 1มต และ 2 มต
ข นท 5 การตรวจสอบและการปฏสมพนธของผใชงาน
ข นท 6 น�าสงออก/เอกสารขาออกFineReader Engine มวธการน�าขอมลออกไปใหอยในรปแบบไฟลไดหลากหลายแบบ อาทเชน
• ไฟลทบรรจเฉพาะขอความตวอกษร ไมมรปแบบฟอนตหรอเคาโครงเอกสารตดออกไปดวย กคอไฟล TXT,CSV,DBF เปนตน• ไฟลสามารถเกบโครงสรางเอกสาร รวมถงรปแบบทแตกตางกนไปตามระดบของเคาโครงเอกสาร กคอไฟล XML• ไฟลทยอมใหท�าเรยกใช และ การแกไขไดโดยตรง เชน HTML, RTF, DOC(X), XLS(X) และ PPT(X)• สงขอมลออกไปอยในรปแบบของ Open Office คอไฟลนามสกล ODT*• สรางเปนไฟล PDF ลกษณะตางๆได เชน PDF, PDF/A และ MRC PDF• ใชงานไดโดยตรงกบโซลชนกระบวนการทางธรกจ และ ระบบจดเกบขอมล• สรางเปนหนงสออเลกทรอนกสนามสกล .epub และ .FB2
ความตองการระบบ• PC with x86-compatible processor (1 GHz or high-er).• Operating System: Microsoft®Windows 7, Microsoft®Windows Server®2008, Windows Vista®, Windows Server®2003, Windows®XP, Windows 2000, and 64-bit versions of Windows Server®2008,Windows Vista®, Windows Server 2003,Windows XP• Memory:- for processing one-page documents minimum 400 MB RAM, recommended 1 GB RAM- for processing multi-page documents minimum 1 GB RAM, recommended 1,5 GB RAM.• Hard disk space: 800 MB for library installation and 100 MB for program operation plus additional 15Mb for every processing page of a multi-page document.• 100% TWAIN-compatible scanner, digitalcamera, or fax modem
OCR Multilingual OCR 199 languages (including Latin, Greek, Cyrillic alphabets, Chinese, Japanese and Korean), thereof 55 languages with dictionary sup-port.
Text TypesNormal, Matrix, Typewriter, OCR-A, OCR-B, CMC7, MICR, Fraktur/Gothic, mixed text type support processing with auto detection on a word-level.
ICROn digits, digits combined with letters of one lan-guage, and digits combined with letters of several languages, even if fields contain both upper and lower case letters. Separates field content from borders andframes. 91 languages, 22 with morphology, field-special dictionaries; 22 handwritten styles including English, American, German, French and Russian.
BarcodesIncluding processing of barcodes that are damaged or printed at any angle and fast barcode extraction, more than 16 most popular 1D industrial types, 2D PDF 417, Aztec, Data Matrix, QR Code. Check mark (OMR)Simple, grouped, model check marks, marks with “corrections” made by hand. Input Formats:BMP, PCX, DCX, JPEG, JPEG 2000, PNG, GIF, TIFF, DjVu, PDFs (Version 1.6 or earlier). Output FormatsDOC, DOCX, ODT*, XLS, XLSX, PPT, PPTX, CSV, TXT, XML, EPUB*, FB2*, searchable PDFs, PDF/A, compressed MRC PDF/As, BMP, PCX, DCX, JPEG, JPEG 2000, PNG, TIFF, image snippets. DevelopmentFineReader Engine API supports the COM stand-ard and can be easily used in Microsoft Visual Studio.NET (VB.NET, C#); Microsoft Visual Basic 5.0, 6.0; Microsoft Visual C++ 4.x and above; VB Script, and other scripting languages; Borland Delphi 2.0 and above; Any other development environment that supports COM and ActiveX ob-jects correctly. Further information online: www.ABBYY.com
N2N SOLUTION PROVIDER 1350/196-197 อาคารไทยรงคทาวเวอร ชน12 ถนนพฒนาการ แขวง/เขต สวนหลวง กรงเทพฯ 10250 โทร: 0-2713-7847-8แฟกซ: 0-2713-7849อเมล: [email protected]