design and implementation of intelligent optical … ·...

10
興大工程學刊 第二十三卷 第三期 Journal of Engineering, National Chung Hsing University, Vol. 23, No. 3, pp. 145-154 145 智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路 李慶鴻 1,* 劉欣宜 2 李仲凱 2 摘 要 本文以函數鏈結類神經網路(functional-link-based neural network, FLNN)設計智慧型字元辨識器, 辨識系統包括字元特徵值擷取與FLNN分類器。函數鏈結類神經網路以函數鏈結擴充為基底,且擁有抗雜訊 和容失真的特性,在隱藏層節點個數較少的情況下,也能擁有很好的效能。本文提出重心距離特徵值和同心 圓面積特徵值,其皆具有旋轉不變性以及抗雜訊的特性,適用於理想及旋轉、具雜訊字元之分類。在分類理 想字元,辨識正確率為100% ;分類非理想字元(具字元位置及大小、具雜訊和旋轉角度之誤差),辨識正確率 94% ~ 100% ;而對於不同字型之分類(Arial Times New Roman ),辨識正確率亦維持80%以上,這些實驗 均可說明所設計字元辨識器之可行性與性能。 關鍵詞: 字元辨識、特徵抽取、類神經網路、影像處理。 DESIGN AND IMPLEMENTATION OF INTELLIGENT OPTICAL CHARACTER RECOGNITION SYSTEM BY FUNCTIONAL-LINK NEURAL NETWORK Ching-Hung Lee 1,* Hsin-Yi Liu 2 Chung-Kai Lee 2 ABSTRACT In this study, a functional-link-based neural network (FLNN) is adopted to develop an optical character recognition (OCR) system. The proposed OCR system contains the feature extraction and the FLNN classifier. The OCR system is valid for recognizing the capital letters and Arabic numerals. The proposed feature extraction technique includes the distance between each black pixel and concentric circles feature. They have the properties of rotation and noise invariant. In addition, the proposed FLNN with the expanded functional-basis has the properties of anti-noise and distortion characteristics. Finally, some experimental results are introduced to illustrate the performance and effectiveness of the proposed feature extraction and FLNN classifier. The proposed system performs 100% accuracy for actual characters and at least 94% even the characters has variations of location, size, rotation, and noisy. For different fonts (Arial and Time New Roman), the proposed system almost perform well and has 80% accuracy. Key words: optical character recognition, feature extraction, neural network, image processing. 1 國立中興大學機械工程學系副教授;Department of Mechanical Engineering, National Chung Hsing University, Taichung 402, Taiwan, R.O.C. 2 元智大學電機工程學系大學生;Department of Electrical Engineering, Yuan Ze University, Taoyuan 320, Taiwan, R.O.C. * Corresponding author, E-mail: [email protected]

Upload: others

Post on 06-Jan-2020

20 views

Category:

Documents


0 download

TRANSCRIPT

  • 興大工程學刊 第二十三卷 第三期Journal of Engineering, National Chung Hsing University, Vol. 23, No. 3, pp. 145-154 145

    智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路

    李慶鴻1,* 劉欣宜2 李仲凱2

    摘 要

    本文以函數鏈結類神經網路(functional-link-based neural network, FLNN)設計智慧型字元辨識器,辨識系統包括字元特徵值擷取與FLNN分類器。函數鏈結類神經網路以函數鏈結擴充為基底,且擁有抗雜訊和容失真的特性,在隱藏層節點個數較少的情況下,也能擁有很好的效能。本文提出重心距離特徵值和同心

    圓面積特徵值,其皆具有旋轉不變性以及抗雜訊的特性,適用於理想及旋轉、具雜訊字元之分類。在分類理

    想字元,辨識正確率為100%;分類非理想字元(具字元位置及大小、具雜訊和旋轉角度之誤差),辨識正確率94% ~ 100%;而對於不同字型之分類(Arial與Times New Roman),辨識正確率亦維持80%以上,這些實驗均可說明所設計字元辨識器之可行性與性能。

    關鍵詞:字元辨識、特徵抽取、類神經網路、影像處理。

    DESIGN AND IMPLEMENTATION OF INTELLIGENT OPTICAL CHARACTER RECOGNITION SYSTEM BY FUNCTIONAL-LINK

    NEURAL NETWORK

    Ching-Hung Lee1,* Hsin-Yi Liu2 Chung-Kai Lee2

    ABSTRACTIn this study, a functional-link-based neural network (FLNN) is adopted to develop an optical character

    recognition (OCR) system. The proposed OCR system contains the feature extraction and the FLNN classifier. The OCR system is valid for recognizing the capital letters and Arabic numerals. The proposed feature extraction technique includes the distance between each black pixel and concentric circles feature. They have the properties of rotation and noise invariant. In addition, the proposed FLNN with the expanded functional-basis has the properties of anti-noise and distortion characteristics. Finally, some experimental results are introduced to illustrate the performance and effectiveness of the proposed feature extraction and FLNN classifier. The proposed system performs 100% accuracy for actual characters and at least 94% even the characters has variations of location, size, rotation, and noisy. For different fonts (Arial and Time New Roman), the proposed system almost perform well and has 80% accuracy.

    Key words: optical character recognition, feature extraction, neural network, image processing.

    1 國立中興大學機械工程學系副教授;Department of Mechanical Engineering, National Chung Hsing University, Taichung 402, Taiwan, R.O.C.2 元智大學電機工程學系大學生;Department of Electrical Engineering, Yuan Ze University, Taoyuan 320, Taiwan, R.O.C.* Corresponding author, E-mail: [email protected]

  • 146 智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路

    一、前 言

    近幾年來,由於電腦的快速發展,使得許多難

    以解決的複雜問題,均可靠著電腦的精密快速運算

    來解決。像是影像處理、辨識等的研究與發展等,

    都已有重大的突破與改進,因此,一般傳統的機器

    辨識系統已經不能滿足大眾需求。而在影像處理、

    語音辨認以及決策處理上,往往人類的表現會遠遠

    地超越最高速的電腦,這是因為人腦的記憶方式是

    屬於聯想式,具有學習及創新能力。所以吾人設計

    之智慧型字元辨識器,可模仿人類神經網路的能力

    快速且準確的辨識字元。在字元辨識系統中,包括

    字元特徵值擷取與類神經網路分類器兩部分。

    字元辨識(Opt ical Character Recognit ion , OCR)是在電腦興起後,為了加速文字資料處理的速度,而興起的一種技術 [1][2]。在文獻 [2]中,詳細介紹過去幾十年內,字元辨識系統的研究、開發

    和歷史發展。在近年來,字元辨識更廣泛地運用在

    學術和商業領域中,諸如:手寫文字辨識之應用舉

    凡智慧型手機上的手寫辨識、身份證字號辨識等,

    影像辨識應用於電子道路收費系統、道路監視系統

    和停車場管理之車牌辨識,都是字元辨識常見之應

    用 [3-10]。使用類神經網路擁有許多具學習能力、平行

    運算……等優點 [11-20],且於近年來被成功應用在物件辨識、系統控制、分類、信號處理……等,因

    此使用類神經網路作為分類器已經有一段相當的

    歷史;文獻 [13]中,一個簡易的類神經網路被用來分辨數字;文獻 [14]使用數種類神經網路應用於樣型識別。由此可知,使用類神經網路應用於分類問

    題為常見、有效且性能優異之方法。本文所使用的

    於字元辨識之資料筆數、輸入、輸出個數較多,若

    使用一般類神經網路則需較多隱藏層節點個數或

    多隱藏層,計算量大且訓練時間長。因此,吾人使

    用具類神經網路抗雜訊和容失真的特性且能在高

    維度的輸入空間中提供良好的函數映射能力之函

    數鏈結類神經網路(functional-link-based neural network, FLNN)[15-18]作為本字元辨識系統之分類器。

    本文是結合影像前處理、擷取特徵值與函數

    鏈結類神經網路設計一具抗雜訊、旋轉特性之智慧

    型字元辨識系統。系統在接收影像後,首先是做影

    像前處理,擷取有用的資訊,稱為該字元影像的特

    徵值。本文提出之兩個新的特徵值為重心距離特徵

    值和同心圓面積特徵值,皆具有旋轉不變性以及

    抗雜訊的特性,適用於理想及旋轉、具雜訊之字元 [21]。接著建立字元資料庫,進而訓練以一個函數鏈結類神經網路設計智慧型字元辨識器之分類器,

    使其能在隱藏層節點個數較少下,亦能擁有很好

    的效能。最後,實驗部分本文分類字元為大寫英文

    字母和阿拉伯數字,在位置變異、大小及具雜訊之

    字元,均能有100%正確率;如處理任何旋轉角度字元,正確率仍高達94.4%;倘若辨識不同字型時,亦能擁有82%辨識成功率。由上述結果可知,本系統分別針對理想與非理想字元(具字元任何位置及大

    小、具雜訊和旋轉角度之誤差)進行實驗辨識時,

    均能有效辨識。此外,吾人使用MATLAB製作了一個基於函數鏈結類神經網路之字元辨識GUI介面實現本文所提出之方法。

    二、類神經網路架構

    本文選用函數鏈結類神經網路作為此字元

    辨識系統的分類器,此網路為一個四層的類神經

    網路,是在倒傳遞類神經網路(back-propagat ion neural networks, NN)的基礎上再加上函數鍵結(functional-link)基底之隱藏層 [15-18],透過系統輸入值之函數延展,增加系統的近似能力進而降

    低隱藏層之個數與計算。以下說明函數鏈結類神經

    網路之架構和學習。

    2.1 函數鏈結類神經網路架構

    函數鏈結類神經網路架構如圖1所示,包含函數鏈結部分和四層架構:第一層為輸入層,第二層

    為隱藏層,第三層為函數鏈結隱藏層,第四層則為

    輸出層。

    2.1.1 函數鏈結基底(Functional-link basis)函數鏈結部分在本文採用三多項式,三角多項

    式包含一個子集的正交正弦和餘弦,表示如下:

    q = [ 1 2 3... N] = [x1(k)sin(πx1(k))cos(πx1(k))... xm(k)sin(πxm(k))cos(πxm(k))]' q = 1, 2, …, N, N = 3 × m.

    (1)

    每個節點的輸入輸出運算如下:

  • 興大工程學刊 第二十三卷 第三期 147

    (2)

    (k) = 1/(1 + exp - ( _nej(k))),

    j = 1, 2, ..., P (3)

    其中 為函數鏈結部分之連結權重值;

    為節點的激發閥值。如公式(3)節點輸入經雙曲函數(sigmoid funct ion)激活函數計算得到節點輸出值 ,本文以上標 ( f )標明函數鏈結基底輸出,該值

    將應用於第三層之函數鏈結隱藏層計算。

    2.1.2 網路架構(Network Structure)下面將透過網路之傳遞順序介紹網路之運算

    與連結,如圖1在此考慮一個具有m個輸入O個輸出的函數鏈結類神經網路,其中上標 ( j)代表第 j層,而下標 i代表第i個節點(或神經元),k則代表第k次的學習。

    第一層(輸入層):單純將輸入值傳遞至第二

    層輸入輸出表示為:

    (4)

    i = 1, 2, ..., m (5)

    其中xi(k)為輸入變數,本文為選定之字元特徵值。

    第二層(隱藏層)隱藏層節點輸入與輸出運算

    如下:

    (6)

    j = 1,2, ...,P

    (7)

    其中 為介於輸入層和隱藏層間連結權重

    值; 為隱藏節點的閥值。同函數鏈結部分,該輸

    入經雙彎曲函數運算求得輸出值 。

    第三層(函數鏈結隱藏層):此層是將函數鏈

    結基底之輸出與第二層輸出相乘,因此節點輸出

    為:

    (8)

    第四層(輸出層):輸出層的運算為:

    (9)

    l = 1, 2, ..., O

    (10)

    圖1 函數鏈結類神經網路架構圖

  • 148 智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路

    其中 連結權重值; 為輸出層節點的閥值;最

    後yl為函數鏈結類神經路輸出。如上述,函數鏈結類神經網路之可調參數為:

    W = [W(h)θ (h)W( y)θ ( y)W( f )θ ( f )]T。

    2.2 函數鏈結類神經網路之學習演算法

    本文使用倒傳遞演算法(Back Propagat ion, BP)(或稱梯度坡降法)訓練函數鏈結類神經網路,倒傳遞演算法使用梯度坡降法將誤差函數最小

    化,以下簡介倒傳遞演算的推導,首先定義誤函數

    如下 [11][19-20]:

    (11)

    其中el(k) = ydl - yl為期望輸出與實際輸出誤差;k學習數。參數更新則為:

    (12)

    其中W為網路參數;η為學習率。

    三、影像前處理及特徵值擷取

    近年來,隨著科技的進步,對於機器的智能要

    求越來越高。隨著電腦科技進步,吾人可將影像轉

    化成數位矩陣,即可在電腦進行影像處理,而影像

    處理常應用於字元辨識、車牌辨識、物件辨識,辨

    識之成功與否在於擷取影像中的特徵值。本節將介

    紹字元影像前處理以及所提出之重心距離與同心

    圓面積特徵值擷取。

    3.1 字元影像前處

    每個字元影像都具有不同之特徵,如對稱性、

    大小、角度……等。本文中影像將執行前處理取得

    字元特徵值,影像前處理系統架構圖如圖2所示,取得字元影像經濾波、切割、尺寸標準化,再行擷取

    重心距離、同心圓面積資訊,獲得之資料或數據就

    稱該影像的特徵值。以下說明前處理架構。

    3.1.1 影像擷取、中間值濾波擷取影像經過理轉成二元二維矩陣,再使用中

    間值濾波器去除雜訊。在此使用3 × 3大小的遮罩器,其輸出值為遮罩內所有數值的中位數

    3.1.2 影像切割、尺寸標準化由影像找出(右上、右下、左上、左下)四個端

    點,切出字元邊緣,再將字元影像標準化,以縱軸

    為基準一律調成60 pix,橫軸亦按比例調整。使用此基準值,經實驗原因如下:

    (1) 尺寸縮小後,會造成字元影像失真,因此特徵值就會有些微改變。

    (2) 60 pix為影像失真但仍可正確辨識出類別的臨界值。

    3.2 特徵值擷取

    仰賴科技的進步,影像經過處理後,即可得到

    影像之數位矩陣,而從數位矩陣中找出吾人需要

    的特徵,就稱為此為此影像之特徵值。一個字元具

    有多種特性,一般常見的特徵像是對稱性、像素大

    小、面積分布、形狀等。而本文探討理想、旋轉及具

    雜訊之字元影像,吾人提出之重心距離和同心圓面

    積特徵值,皆具有旋轉不變性以及抗雜訊之特性。

    此外,因使用類神經網路實現辨識器,雖然待分類

    字元與理想字元這兩者特徵會有少許誤差,但仍可

    成功分類。接著,吾人將介紹提出之重心距離和同

    圖2 影像前處理系統架構圖

  • 興大工程學刊 第二十三卷 第三期 149

    心圓面積特徵值之擷取步驟。

    3.2.1 重心距離特徵值首先定義字元重心為字元之中心點,吾人利用

    字元各像素與重心的距離,來做特徵值。以計算一

    個M × N的矩陣的重心為:矩陣含有像素總數:P,字元重心(Xav, Yav)表示為:

    (13)

    (14)

    像素到重心的距離如下:

    (15)

    因字元不同,造成每個字元都有不同數量的

    Lij,因此要進行正規化處理,即可取得字元之重心距離特徵值。

    取得重心距離特徵值步驟如下:

    (1) 重心距離遞減排序將各字元像素到重心的距離依遞減排序。

    (2) 重心距離量化將排序後之重心距離等分為三十等分,其平

    均值做為代表值,再行正規化,使數值介於0 ~ 1之間,參數以Rnk表示。

    (3) 重心距離量化值差異化將步驟2所得正規資料取鄰差值,即可得到29

    筆重心距離的正規化數值,以Xnk表示:

    k = 1, 2, ..., 29 (16)

    (4) 修正重心距離(網路訓練輸入值正化)獲得29筆重心距離特徵值,發現其值大多介於

    0 ~ 0.1之間,為得到有效之網路訓練,吾人將29筆重心距離,皆乘以10倍,便可得到重心距離特徵值介於0 ~ 1之間。

    3.2.2 同心圓面積特徵值除了重心距離外,面積分布也可辨別字元之特

    性,不同於將面積以水平或垂直來分等分,而是以

    重心為圓心來計算面積,此做法可以避免旋轉而有

    水平和垂直的失真。因此,吾人以重心為圓心,向外

    擴張,分成任何等分,並且計算個別面積占字元總

    像素的比例,最後,就可以得到字元同心圓面積特

    徵值。而因同心圓面積是以重心為圓心,以需計算

    出每個像素點到重心的距離,在此直接使用已算出

    之Lij。取得同心圓面積特徵值步驟下:

    (1) 分配同心圓面積找出Lij中的最大距離,即離中心最遠的像素,

    將該距離分成4等分。

    (2) 計算同心圓面積分布並正規化把這四等分的像素個數都算出來後再除以總

    像素值,即可得到四筆同心圓特徵值。示意圖如圖3所示

    因此本文使用之特徵值有29個重心距離特徵值和4個同心圓特徵值。

    四、智慧型字元辨識系統架構

    在本論文中,吾人使用函數鏈結類神經網路建

    構的字元辨識系統去辨識的26個大寫英文字母和0 ~ 9的阿拉伯數字。以下將說明字元辨識系統的架構及其步驟。

    4.1 字元辨識系

    本論文的字元辨識系統主要由資料庫建立、訓

    練和分類組成。如前節所述輸入資料庫字元的影

    像,經過影像前處理並擷取特徵值,而特徵值由29個重心距離特徵值和4個同心圓特徵值組成,因此

    圖3 同心圓面積特徵值示意圖,以字型Arial字元A為例

  • 150 智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路

    一個字元共有33的特徵值,並建立資料庫。接著利用資料庫訓練分類器,求得網路最佳權重值,並儲

    存權重向量。最後,即可輸入待分類字元的影像,

    待分類字元影像亦需經前處理、特徵值擷取,將字

    元特徵值輸入辨識器即辨識出字元所屬的類別。以

    下簡介建立資料庫、訓練分類器和分類。

    4.1.1 建立資料類神經網路訓練前,必先建立足夠與代表性之

    學習樣本庫資料庫。本文選擇Arial或Times New Roman建立學習樣本資料庫。建構資料庫步驟如第三節所述,如圖4說明。

    4.1.2 訓練分類器在訓練分類器這個階段,使用函數鏈結類神經

    網路作為字元辨識系統之分類器。在執行分類前,

    函數鏈結類神經網路需經訓練使其具有分類之功

    能。訓練分類器架構圖,如圖5所示。在圖5中,網路之輸入為33個字元特徵值,輸出以二位元標示,總分類字元計有46種,因此輸出個數為6,以字元A為例輸出正確即為000001。函數鏈結類神經網路訓練以第二節所述之倒傳遞演算法學習,直到特定的

    學習次數或達到特定的誤差範圍內。

    4.1.3 分類在此分類階段,吾人將待分類字元影像輸入到

    字元識別系統之中,經過影像前處理取得33個特徵值,經過已訓練好的智慧型分類器,即可辨識出字

    元所屬類別,如圖6所示。

    五、實驗結果與討論

    本文利用MATLAB製作GUI介面方便實驗之執行與驗證,介面如圖7所示。此介面具有建立資料庫、訓練分類器以及分類共三個功能。介面操作步

    驟說明如下:

    步驟1:建立字元資料庫,可選擇Arial或Times New Romn(內涵英文A ~ Z及數字0 ~ 9)。

    步驟2:選擇使用網路分類器與網路構(隱藏層節點數),並決定學習率和訓練次數,最後進

    行訓練。訓練完成後,得到訓練時間、訓練誤差值

    (Mean Squared Error, MSE)、正確率,由以上數值判斷訓練是否成功。如訓練失敗可適當調整隱藏

    層節點個數、學習率或訓練次數,至正確率達100為止。

    圖4 建立資料庫系統架構圖

    圖5 訓練分類器系統架構圖

    �圖6 分類階段架構圖

  • 興大工程學刊 第二十三卷 第三期 151

    步驟3:當訓練完後,即可進行分類。分類可選擇單一字型或兩種不同字型。在分類單一字型中,

    可選擇要分類Arial字型或是Times New Roman字型。當決定好要分類哪種類型後,就可以選擇任意

    字元進行辨識。以分類旋轉+30度Arial字型字元A為例,結果顯示在介面上,如圖7所示。

    5.1 網路間結果比較

    在本實驗中,吾人比較類神經路(NN)和函數鏈結類神經路(FLNN)之隱藏層節點個數對分類性能之影響。網路學習次數設定為700次,固定學習率為3,以MSE、分類百分比和正確率做為性能指標,並比較隱藏層節點個數。結果如表1所示。如表1看出,隱藏層節點個數的多寡影響類神經網路的分類準確度及效率。亦可發現當隱藏層節點個數

    為10時,FLN N的正確率即可達到100%,而N N則需到隱藏層節點個數為14時,正確率才能到100%。觀察得知,雖然類神經網路具有抗雜訊和容失真之

    特性,適用於本系統之實現,但當NN隱藏層節點個數較少時,訓練結果與性能較FLN N差。本文使用的函數鏈結類神經網路是在類神經網路的基礎上

    再加上函數鍵結基底,所以當FLNN隱藏層節點個數較少時,訓練結果較NN佳。

    5.2 分類測試結果

    吾人探討分類任何位置及大小、雜訊、旋轉、

    和不同字型的辨識正確率。

    5.2.1 實驗1:分類任何位置以及大小字元在此選擇字元影像在任何位置且大小皆不同,

    如圖8所示,吾人會透過執行影像切割和尺寸標準化等前處理得到標準字元影像,如此可節省記憶體

    空間並加快運算速度,也可得到標準化之字元影

    像,而實驗測試影像為任意位置的大寫英文A ~ Z、阿拉伯數字0 ~ 9共36個,表2為任何位置及大小字元影像的實驗結果。

    5.2.2 實驗2:分類加入雜訊字元在抗雜訊測試,主要驗證提出之特徵值與類神

    經網路之「抗雜訊的特性」。實驗加入雜訊於字元

    圖7 字元辨識GUI介面實現

    �表1 NN和FLNN隱藏層節點個數比較

    隱藏層

    節點數網路

    平均

    MSE值百分比

    正確率

    (%)

    8FLNN 0.0284 35/36 97.22NN 0.0732 30/36 83.33

    10FLNN 0.0049 36/36 100NN 0.0328 35/36 97.22

    12FLNN 0.0020 36/36 100NN 0.0282 35/36 97.22

    14FLNN 0.0016 36/36 100NN 0.0015 36/36 100

  • 152 智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路

    影像,實驗樣本為大寫英文A ~ Z、阿拉伯數字0 ~ 9,並隨機將雜訊加在其中,如圖9所示,共有36樣本數,實驗結果如表2所示。

    5.2.3 實驗3:分類任何旋轉角度字元旋轉測試部分,主要驗證提出重心距離特徵和

    同心圓面積特徵之「旋轉不變性」特性,辨識的字

    元為大寫英文A ~ Z、阿拉伯數字0 ~ 9。為了證明能辦別任何角度,吾人以0、30、60、90、120、150、180、210、240、270、300、330度共2個旋轉角度為測試樣本,所以實驗數為36 × 12= 432個,如圖10所示。實驗結果記錄如表2所示。

    5.2.4 實驗4:分類不同字型字元在不同字型的探討中,吾人用常見之A r ia l和

    Times New Roman兩種字型做比較探討,以字元A為例M不同字型如圖11所示。實驗樣本數為Arial和Times New Roman大寫英文A ~ Z、阿拉伯數字0 ~ 9,共有72筆樣本數,表2為實驗結果。

    5.2.5 實驗討論由表2可知,在任何位置及大小或雜訊的字元,

    本文提出之智慧型字元辨識器均可順利識(正確率

    100%);在任意角度辨識中,由表2中,正確率亦可達94.4%;其中錯誤率最高的是Arial中的數字6與9以及字元N與H。Arial數字6與9,在原本標準圖形下,可以辨識成功,一旦旋轉之後,相似度非常高,

    而重心距離特徵值和同心圓面積特徵值亦極為相

    似。除此之外,字元N與H也的分類效果很差,圖12為標準字元N和H之特徵值圖形,兩者的特徵值差

    相差不大,在標準字元N和H都均可順利辨識;如為旋轉字元N或H,則常失敗,因為同一個字元,旋轉後的特徵值圖形也會有差異,在此條件下分辨並不

    易。針對上述問題吾人提供其他方法:

    (1) 可適度增加有效之特徵值,期能使任意角度辨識之正確率達到100%。

    (2) 從分類結果得知,系統在分類標準字元下都可以10 0%辨識成功。因此在影像前處理時,將此字元旋轉至與標準字元同角度。如此便可

    得到字元旋轉資訊,任意角度辨識率應可達到

    100%。在實際應用上,字元辨識多使用於車牌辨識

    中,車牌因地面傾斜和照相機拍攝角度等外界因素

    所造成車牌歪斜旋轉的幅度並不會大於30度,因此,在小角度的辨識中,如5度、10度,此實驗的辨識率則可達到百分百,如表3所示。

    根據實驗結果與討論,歸納以下幾點結論:

    (1) 利用M ATLA B軟體製作一GUI介面來實現系統成果。

    (2) 當網路隱藏層節點個數較少時,FLN N訓練結果較NN佳。

    (3) 吾人使用的特徵值在處理不同位置、大小以及加雜訊字元影像都可以100%順利辨識。

    (4) 在分類隨機小角度(-10 ~ 10)之旋轉字元時,辨識率為100%。由此可知,此智慧型字元辨識系統應可應用於車牌辨識系統中。

    圖8 英文字元A ~ E不同大小位置

    表2 分類實驗結果

    字元分類

    樣本類型平均MSE值 百分比 正確率(%)

    任何位置

    以及大小0.0024 36/36 100

    加入雜訊 0.0024 36/36 100任何旋轉

    角度0.0024 408/432 94.4

    不同字型 0.0023 59/72 82

    圖9 英文字元A ~ F雜訊

    圖10 A旋轉30、60、150、210、300度

    圖11 不同字型之字元A:(a) Arial,(b) Times New Roman

  • 興大工程學刊 第二十三卷 第三期 153

    六、結論與未來發展

    在本論文中,設計使用提出之同心圓與重心距

    離特徵值利用函數鏈結類神經網路實現智慧型字元

    辨識系統分類大寫英文字母和阿拉伯數字。經實驗

    提出同心圓與重心距離特徵值其擁有旋轉不變性

    以及抗雜訊特性;此外以函數鏈結擴充為基底且擁

    有抗雜訊和容失真的特性之函數鏈結類神經網路

    作為分類器,並以MATLAB製作實驗之GUI介面。由實驗結果可知,當網路隱藏層節點個數較

    少時,函數鏈結類神經網路訓練結果較類神經網

    路佳。在分類測試結果中,不同位置、大小以及加

    雜訊字元影像都可以100%順利辨識;分類任意旋轉角度,辨識率達94.4%,因某些字元在大角(30度以上)旋轉之特徵值極為相近,所以無法百分百辨

    識。因在分類隨機小角(-10 ~ 10)之旋轉字元時,可10 0%辨識,由此可知,本文可應用於車牌辨識 系統。

    參考文獻

    1. Mani, N. and Sr in ivasan, B., “Appl icat ion of A r t i f i c i a l Ne u r a l Ne t wor k Mo d el fo r Optical Character Recognit ion,” 1997 IEEE Internat ional Conference on Systems, Man and Cybernetics, Vol. 3, pp. 2517-2520 (1997).

    2. Mor i , S . , Sue n , C.Y. a nd Ya ma mot o, K . ,

    “His tor ica l Rev iew of OCR Resea rch and Development,” Proceedings of the IEEE, Vol. 80, No. 7, pp. 1029-1058 (1992).

    3. Comelli, P., Ferragina, P., Granieri, M.N. and Stabile, F., “Opt ical Recognit ion of Motor Vehicle License Plates,” IEEE Transactions on Vehicular Technology, Vol. 44, No. 4, pp. 790-799 (1995).

    4. Par isi , R., Di Claudio, E.D., Lucarel l i , G. and Orlandi, G., “Car Plate Recognit ion by Neu ra l Net works and I mage P rocessi ng,” P r o c e e d i n g s o f t h e I E E E I n t e r n a t i o n a l Symposium on Circuits and Systems, Vol. 3, pp. 195-198 (1998).

    5. Shafait , F., Daniel , K. and Thomas, B.M., “Performance Evaluation and Benchmarking of S i x Pa ge S eg m e n t a t io n A lgo r i t h m s ,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, No. 6, pp. 941-954 (2008).

    6. Chang, S.L., Chen, L.S., Chung, Y.C. and C h e n , S .W. , “A u t o m a t i c L i c e n s e P l a t e Recognition,” IEEE Transactions Intelligent Transportation Systems, Vol. 5, No. 1, pp. 42-53 (2005).

    7. LeCun,Y., Bottou, L., Bengio, Y. and Haffner, P. , “G r a d ient-ba sed Lea r n i ng Appl ied t o Document Recognition,” Proceedings of the

    圖12 Arial標準字元H與N特徵值圖形

    表3 隨機小角度旋轉實驗結果

    字元分類樣本類型 平均MSE值 百分比 正確率(%)小角度的隨機旋轉 0.0024 36/36 100

  • 154 智慧型字元辨識系統設計與實現:使用基於函數鏈結類神經網路

    IEEE, Vol. 86, No. 11, pp. 2278-2324 (1998). 8. M a h m o u d , S . , “ R e c o g n i t i o n o f Wr i t e r-

    i ndependent Of f-l i ne Handw r it t en A rabic ( I nd ian) Nu mera ls Usi ng Hidden Ma rkov Models,” Signal Processing, Vol. 88, No. 4, pp. 844-857 (2008).

    9. Morns, I.P. and Dlay, S.S., “The DSFPN: A New Neural Network and Circuit Simulation for Opt ical Character Recognit ion ,” IEEE Transactions on Signal Processing, Vol. 51, No. 12, pp. 3198-3209 (2003).

    10. Anagnostopoulos, C.N.E., Anagnostopoulos, I.E., Loumos, V. and Kayafas, E., “A License Plate-Recognit ion Algorithm for Intelligent Transpor tat ion System Applicat ions,” IEEE Tr a n s a c t i o n I n t e l l i g e n t Tr a n s p o r t a t i o n Systems, Vol. 7, No. 3, pp. 377-392 (2006).

    11. Li n , C.T. a nd L ee , C.S .G., Ne ura l Fu z z y S y s t e m s: A N e u r o - F u z z y S y n e r g i s m t o Intelligent Systems, Prentice Hall, Englewood Cliff, New Jersey, pp. 205-221 (1996).

    12. Lee, C.H. and Chang, S.K., “Exper imental Implementation of Nonlinear TORA System and Robust Adaptive Backstepping Controller Design,” Neural Computing and Applications, Vol. 21, No. 4, pp. 785-800 (2012).

    13. Fukushima, K., “A Neural Network for Visual Pattern Recognition,” Computer, Vol. 21, No. 3, pp. 65-75 (1988).

    14. Lippmann, R.P., “Pattern Classif ication Using Neu r a l Ne t work ,” IEEE Communica t ion s Magazine, Vol. 27, No. 11, pp. 47-50 (1989).

    15. C he n , C . H . , L i n , C . J . a nd L i n , C .T. , “A Functional-link-based Neural Fuzzy Network f o r N o n l i n e a r S y s t e m C o n t r o l ,” I E E E Transactions on Fuzzy Systems, Vol. 16, No. 5, pp. 1362-1378 (2008).

    16. Pa t r a , J.C. a nd Pa l , R .N. , “A Fu nc t iona l Link Artif icial Neural Network for Adaptive Channel Equalizat ion,” Signal Processing, Vol. 43, No. 2, pp. 181-195 (1995).

    17. Zhao, H. and Zhang, J., “Funct ional Lin k Neural Network Cascaded with Chebyshev Orthogonal Polynomial for Nonlinear Channel Equal izat ion,” Signal Processing, Vol. 88, No. 8, pp. 1946-1957 (2008).

    18. Z h a o , H . a n d Z h a n g , J . , “A d a p t i v e l y

    Combined FIR and Functional Link Artif icial Neu r a l Ne t work E qu a l i ze r fo r Non l i nea r Communication Channel,” IEEE Transactions on Neural Network , Vol. 20, No. 4, pp. 665-674 (2009).

    19. Horikawa, S., Furuhashi, T. and Uchikawa, Y. , “ O n F u z z y M o d e l i n g U s i n g F u z z y Neural Networks with the Back-Propagation Algor ithm,” IEEE Transact ions on Neural Networks, Vol. 3, No. 5, pp. 801-806 (1992).

    20. L e e , C . H . a n d Pa n , H .Y. , “ Pe r fo r m a n c e Enhancement for Neural Fuzzy Systems Using Asymmetr ic Membership Functions,” Fuzzy Sets and Systems, Vol. 160, No. 7, pp. 949-971 (2009).

    21. K e , J .W. , “ T h e A p p l i c a t i o n o f N e u r a l Network in Character Image Recognitions,” Master’s Thesis, Department of Mechanical Eng ineer ing, Souther n Taiwan Universit y of Science and Technology, Tainan, Taiwan (2007).

    Manuscript Received: Jun. 8, 2012 Revision Received: Jun. 29, 2012 and Accepted: Jul. 2, 2012