應用倒傳遞類神經網路於pm10 預測之研究application of back

20
341 應用倒傳遞類神經網路於 PM 10 預測之研究 黃隆明 (1) 古緯中 (2) 本研究以倒傳遞類神經網路進行 PM 10 濃度之預測,為提升其預測力,除了以線西空氣品 質監測站之氣象參數與環境監測參數作為輸入變數之外,並增加梧棲氣象站之氣象參數作為輔 助之輸入變數;而在輸入倒傳遞類神經網路前,先進行正規化及數據篩選,而後經由訓練與測 試,可獲得內部參數之設定值,當隱藏層單元數為 17 個、訓練次數為 35,000 次、學習速率為 0.9 與動量修正係數為 0.1 時,所得之預測值最佳。接著再進行變數之篩選,得到最佳輸入變數 之組合為前一日 PM 10 、濕度、風速、風向、日照時數、全天空輻射、降雨量與氣壓等八項; 又於敏感度分析中發現,影響模式敏感度之主要因子為前一日 PM 10 值。研究結果顯示,輸入 變數經由篩選後,不但可提升預測值與實際值之相關性,亦可提升對極端值之預測能力,且不 影響 PM 10 季節性夏低冬高之分佈趨勢。 (關鍵詞:倒傳遞類神經網路、PM 10 、最佳輸入變數組合) Application of Back-Propagation Neural Network on the Prediction of PM 10 Long-Ming Huang (1) Wei-Jhong Gu (2) Associate Professor (1) , Graduate Student (2) , Department of Soil and Water Conservation, National Chung-Hsing University, Taichung, Taiwan, R.O.C. ABSTRACT This study used back-propagation neural network to predict the concentration of PM 10 . For improving the prediction, meteorological parameters and environmental monitoring parameters from the Siansi air quality station were taken as input variables, and also used meteorological parameters from Wuqi weather station to be supporting input variables. Before setting parameters in the model, the data should be normalized and screened, and the results of setting parameters which could obtain the best prediction through training and testing were as follows: the number of hidden neurons and training times were 17 and 35,000 respectively, the learning rate (1)國立中興大學水土保持學系副教授(通訊作者 e-mail[email protected]) (2)國立中興大學水土保持學系研究生

Upload: hadieu

Post on 06-Feb-2017

232 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

341

應用倒傳遞類神經網路於 PM10預測之研究

黃隆明(1) 古緯中(2)

摘 要

本研究以倒傳遞類神經網路進行 PM10 濃度之預測,為提升其預測力,除了以線西空氣品

質監測站之氣象參數與環境監測參數作為輸入變數之外,並增加梧棲氣象站之氣象參數作為輔

助之輸入變數;而在輸入倒傳遞類神經網路前,先進行正規化及數據篩選,而後經由訓練與測

試,可獲得內部參數之設定值,當隱藏層單元數為 17 個、訓練次數為 35,000 次、學習速率為

0.9與動量修正係數為 0.1時,所得之預測值最佳。接著再進行變數之篩選,得到最佳輸入變數

之組合為前一日 PM10、濕度、風速、風向、日照時數、全天空輻射、降雨量與氣壓等八項;

又於敏感度分析中發現,影響模式敏感度之主要因子為前一日 PM10 值。研究結果顯示,輸入

變數經由篩選後,不但可提升預測值與實際值之相關性,亦可提升對極端值之預測能力,且不

影響 PM10季節性夏低冬高之分佈趨勢。

(關鍵詞:倒傳遞類神經網路、PM10、最佳輸入變數組合)

Application of Back-Propagation Neural Network on the

Prediction of PM10

Long-Ming Huang(1)

Wei-Jhong Gu(2)

Associate Professor(1)

, Graduate Student(2)

, Department of Soil and Water Conservation, National

Chung-Hsing University, Taichung, Taiwan, R.O.C.

ABSTRACT

This study used back-propagation neural network to predict the concentration of

PM10. For improving the prediction, meteorological parameters and environmental

monitoring parameters from the Siansi air quality station were taken as input

variables, and also used meteorological parameters from Wuqi weather station to be

supporting input variables. Before setting parameters in the model, the data should

be normalized and screened, and the results of setting parameters which could obtain

the best prediction through training and testing were as follows: the number of

hidden neurons and training times were 17 and 35,000 respectively, the learning rate

(1)國立中興大學水土保持學系副教授(通訊作者 e-mail:[email protected])

(2)國立中興大學水土保持學系研究生

Page 2: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

342

was 0.9, and the momentum modified coefficient was 0.1. The next step was

screening variables, and the results showed that the optimum input variables

included PM10 of the previous day, humidity, wind velocity, wind direction, sunshine

hours, surface radiation, rainfall, and atmospheric pressure. The sensitivity analysis

showed that PM10 of the previous day was the main factor which affected the

sensitivity of the model. The result of this study showed that after sieving variables,

it could surely improve the correlation between predictions and actual observed

values and the prediction of extreme values. Also, it didn’t affect the concentration

of PM10 which trended lower in summer and higher in winter.

(Keywords:Back-propagation neural network, PM10, The optimum input variables )

前言

台灣沿海地區及河川出海口之飛砂揚塵

日趨惡化,進而影響空氣及居住品質,其中

又以粒徑小於 10 μm 以下之懸浮粒子(簡稱

PM10)對人體健康之影響較為顯著。

PM10 又稱浮游塵,主要來自地面揚塵、

河川裸露砂地、工程開發、工業與車輛排放

之廢氣及反應性空氣汙染物等,因粒徑微小

易懸浮與飄散於大氣中,若該粒子附著其它

汙染物或有害物質後,進入人體肺部之深處

進而影響健康,而根據環保署網站於 PM10

對我國之影響特性中指出,PM10若受大陸高

壓冷氣團影響,其傳輸距離最遠可達東部花

蓮、台東及南部恆春等地區。

為預測 PM10濃度,本研究以揚塵較為嚴

重之烏溪流域為試區,並選取位於彰濱工業

區旁及季風來臨時最前線之線西空氣品質監

測站,作為本研究資料來源之測站。

由於溫度可直接反應出一地區之季節性

差異及光化學之效應,且氣溫越高越易促進

光化作用進而增加 PM10之濃度;但若高濃度

PM10值皆發生於溫度較低之冬春兩季時,反

而使PM10與溫度呈現負相關(林斌龍,1990;

江世民,1999)。為求提升預測能力,應一併

採納全天空輻射、日照時數與雲量等亦會影

響溫度高低之重要因子(林逸塵,2002; 王

炎秋,2006; 談珮華等,2008)。而上述之

氣象參數亦會間接影響降雨與相對濕度之值,

且若於兩者皆增高時,懸浮微粒之粒徑亦隨

著增加,造成沉降速度增快,將有助於降低

PM10之濃度值(林斌龍等,1990;鄭淑燕等,

1991; Monn et al. ,1995; Lam et al. ,1998;

Tsuang et al.,1999; Smith et al. ,2001;郭石

柱,2009;林孟希,2010)。

一般正常情況下,當氣壓型態發生變化

時,會間接影響地面風速之大小並改變風向,

進而影響 PM10 之傳送速度與擴散方向(莊秉

潔,1993;Monn et al.,1995;詹俊南,1996;

程萬里等,2000;Smith et al. ,2001;江勝偉,

2007)。而於眾多研究中除了氣壓、風速與風

向會影響 PM10之擴散與累積能力外,前段時

間之 PM10濃度值亦具有累積作用,即殘餘之

馬可夫效應(係指由過去一段期間系統所呈

現之狀態,以推測未來系統各期之狀態及發

生之可能性),因此,若將此參數納入模式中,

可大幅增進模式之推估能力 (Perez et

Page 3: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

343

al. ,2002;林逸塵,2002;蔡盛行,2011)。

綜合上述所示,本研究應用倒傳遞類神

經網路 (Back-Propagation Neural Network,

BPNN) 作為預測 PM10之方法,為提升預測

能力,除了以線西空氣品質監測站之氣象參

數(溫度、降雨量、相對濕度、風速及風向)

與環境監測參數(PM10 及 PM2.5)作為輸入變

數之外,並增加梧棲氣象站之氣象參數(全天

空輻射、日照時數、雲量及氣壓)作為輔助之

輸入變數;先以倒傳遞類神經網路進行內部

設定之測試,並於訓練及測試後,探討模式

預測 PM10 濃度時之最佳輸入變數組合與敏

感度之分析,本研究之流程如圖 1所示。

因 PM10 對於人體之健康會產生重大之

影響,若能於其濃度值增高之前,加以預測

並提供有效之資訊,將可於懸浮微粒來臨前,

進行防範及準備工作,研究之成果亦可提供

後續研擬防範 PM10措施之相關依據。

文獻回顧

一、倒傳遞類神經網路之探討

類神經網路(Artificial Neural Network)係

指模仿生物神經網路之系統,其定義為一種

計算系統,包括軟體與硬體,並使用大量簡

單且相連之人工神經元來模仿生物神經網路

之能力,而人工神經元是生物神經元的簡單

模擬,它從外界環境或者其它人工神經元取

得資訊後,加以非常簡單之運算,輸出結果

至外界環境或其它人工神經元 (葉怡成,

2003)。

(一)倒傳遞類神經網路之基本架構

倒傳遞類神經網路模式是目前類神經網

路學習模式中,最具代表性且應用最普遍之

模式,基本原理為使用最陡坡降法之觀念,

將誤差函數予以最小化,倒傳遞類神經網路

之架構如圖 2 所示,而架構之功能分述如下

(葉怡成,2001):

1.輸入層:

用以表現網路之輸入變數,處理單元之

數目依問題複雜程度而定。

2.隱藏層:

用以表現輸入處理單元間之交互影響作

用,其處理單元數目,經常以試驗方式決定。

3. 輸出層:

用以表現網路之輸出變數,處理單元之

數目與輸入層相同,依問題之複雜性而定。

(二)倒傳遞類神經網路之應用

1. T. Slini et al. (2006)於希臘的塞薩洛尼基應

用倒傳遞類神經網路進行 PM10 預測之研

究,結果顯示輸入層與輸出層神經元個數

分別為 9 個及 1 個,隱藏層神經元個數為

20 個,有良好預測能力。

2. Mei Huang et al. (2006)於中國北部以倒傳

遞類神經網路與逐步迴歸兩模式,進行

PM10預測之研究,結果顯示倒傳遞類神經

網路預測較逐步迴歸為佳。

3. 高全興(1997)以倒傳遞類神經網路預測雲

林斗六、崙背及台西等測站之短期空氣汙

染,由於空氣品質資料本身包含極高不確

定性,應用傳統的預測模式有其限制與困

難,類神經網路對於非線性空氣品質識別

效能良好,可建立良好之空氣品質預測模

式。

Page 4: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

344

林逸塵(2002)於高雄都會區以倒傳遞類

神經網路進行懸浮微粒濃度之預測,預測結

果之全數列模式(即不分季模式)較為良好。

圖 1 研究流程圖

Figure 1 The process of the investigation

圖 2 倒傳遞類神經網路之架構圖

Figure 2 The structure of back-propagation

neural network

材料與方法

一、試區概況

本研究係以台灣中部烏溪流域之線西空

氣品質監測站(以下簡稱為線西空品站)作為

資料來源之測站,其位於彰濱工業區東方及

烏溪下游出海口南方,為季風來臨時最前線

之測站;採用之氣象監測項目包括溫度 (˚C)、

降雨量 (mm/day)、濕度 (%)、風向 (360°)

及風速 (m/s)等五項,以及環境監測參數

PM10 (μg/m3)及 PM2.5 (μg/m

3)等兩項。而為提

升模式之預測能力,於線西空品站附近,增

選一地理位置與氣候條件最為接近之梧棲氣

象站,採用之氣象監測項目包括全天空輻射

(MJ/m2)、日照時數 (hr)、氣壓 (hPa)及雲量

(11 th)等四項,藉以彌補線西空品站氣象監測

項目之不足,兩測站之距離約 14.5公里,如

圖 3所示。

文獻回顧

BPNN 變數資料之蒐集(97年至100年之氣象資料)

正規化

理論依據

溫度

降雨

相對溼度

風向

風速

當日PM10

網路內部參數之設定程序1.隱藏層單元個數2.訓練次數3.學習速率4.動量修正係數

測站選定

氣象因子(輸入變數)

推估因子(輸出變數)

全天空輻射

網路輸入及輸出變數資料之前處理

訓練與測試之資料

數據篩選

結果與討論

最佳輸入變數組合之篩選

日照時數

前日PM10

前日PM2.5

氣壓

雲量

訓練資料(95至98年之氣象資料)

測試資料(99年之氣象資料)

模式之敏感度分析

X1

Y1X2

X3

Xn

.

.

.

.

.

.

.

隱藏層

.

.

Yn

輸入層 輸出層

Page 5: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

345

圖 3 測站位置圖

Figure 3 The location of station

二、資料數據來源及分析

(一)資料數據之蒐集

由文獻歸納之結果得知,影響 PM10濃度

值之氣象參數包括當日之溫度、降雨量、相

對濕度、風向、風速、全天空輻射、日照時

數、氣壓及雲量等九項,以及環境監測參數

包括前一日之 PM10 與前一日之 PM2.5 等兩

項,總計共十一項參數作為類神經網路之輸

入變數,而輸出變數為當日之 PM10濃度值。

本研究係以民國 95 年至 98 年作為類神

經網路之訓練資料,而以民國 99 年作為類神

經網路之驗證及測試資料,至於資料之篩選

係以參數蒐集完整度較高且於前一日可預測

之數值為基準。

(二)資料數據之分析

本研究於輸入變數至類神經網路前,以

SPSS軟體分析民國 95年至 99年各項氣象參

數與當日 PM10濃度值之相關性,如表 1所示,

由表 1得知,包括溫度、降雨量、相對濕度、

風向、日照時數、氣壓、雲量、前一日 PM10

濃度值及前一日 PM2.5 濃度值等九項皆與當

日 PM10濃度值呈現顯著相關,惟風速及全天

空輻射等兩項與當日 PM10 濃度值呈現較無

相關之現象;又由風花圖繪製得知,於線西

空品站大多以東北風與南南西風為主,如圖

4 所示。

綜合上述可知,共計有七項之氣象參數

及兩項之環境監測參數與當日 PM10 濃度值

之相關性較低。但由文獻回顧可知,其皆為

影響 PM10濃度值之重要變數因子,因此,本

階段暫不刪除任何變數,皆輸入至類神經網

路後,於後續章節再以最佳輸入變數組合之

分析進行探討。

三、類神經網路之建構

(一)類神經網路內部參數設定之程序

本研究係以皮托公司開發之類神經軟體

NeuroSolutions 6 進行模式之演算,需設定之

參數包括輸入層、輸出層、隱藏層層數、隱

藏層單元個數、訓練次數、門檻值、學習速

率、動量修正係數及學習函數等九項,其中

隱藏層單元個數、訓練次數、學習速率與動

量修正係數之設定皆以試誤法進行調整。

1.氣象參數

(溫度、降雨、濕度、

風向及風速)

2.環境監測參數

(PM10及PM2.5)

1.氣象參數

(全天空輻射、日照時數、

氣壓及雲量)中央氣象局梧棲氣象站

彰化縣線西空氣品質監測站

Page 6: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

346

圖 4 民國 95 年至 99年之風花圖

Figure 4 The wind rose of 2006 to 2010

1. 輸入層與輸出層:

輸入層與輸出層之單元數係分別為輸入

變數(本研究為 11 項)與輸出變數(本研究為 1

項)之個數。

2. 隱藏層層數:

係參考前人研究,取一至兩層有最好之

收斂效果 (葉怡成,2003),而根據林逸塵

(2002)與蔡盛行(2011)研究結果顯示,於預測

PM10時取一層隱藏層即有較佳之預測成果,

因此本研究之隱藏層以一層為基準。

3. 隱藏層單元個數:

單元個數之決定,至今尚無一定之原則,

須以試誤法求得個數,但亦可以經驗法則作

為參考,如下所述(葉怡成,2001):

(1)平均法:隱藏層單元個數=(輸入層單元數+

輸出層單元數)/2。

(2)總和法:隱藏層單元個數=(輸入層單元數×

輸出層單元數)0.5。

(3)加倍法:隱藏層單元個數=(輸入層單元數+

輸出層單元數)×2。

因此本研究之隱藏層單元個數由最小 1

個單元數測試至加倍法之 24 個單元數(即輸

入變數 11 個與輸出變數 1 個兩者總和之兩

倍)。

4. 門檻值與訓練次數:

兩者皆為類神經網路訓練終止之條件,

且若達到其一之條件,即立刻停止訓練。本

研究設定均方差(MSE)之門檻值為 10-6,訓

練次數由 5,000 次測試至 40,000 次,其間隔

以 5,000 次為單位。

5. 學習速率:

學習速率之調整係依據前後兩筆網路輸

出資料之誤差值,進而修正步幅,一般學習

速率介於 0 至 1 之間,本研究則由 0.1 測試

至 1,並以 0.1為間隔單位。

6. 動量修正係數:

動量修正係數之調整係依據前後兩筆資

料之訓練結果改變量大小,進而調整連結加

權值,其功能類似微調類神經網路系統之效

能,使網路效能最佳化,其值通常介於 0.1

至 0.5 之間,本研究亦採用此範圍做調整,

其間隔設定以 0.1為單位。

7. 學習函數:

模式以函數進行預測時採用雙彎曲函數

(Sigmoid Function)可消除不可微分點,其值

域介於 0 至 1之間。

(二) 類神經網路之資料前處理

本研究以 95 年至 99 年之數據進行探討

與分析,刪除測站因資訊雜亂而無法測得之

有效數值後,訓練資料之筆數共計 1418 筆;

而測試資料之筆數,因 99年數據皆較完整,

無須刪除任何數據,共計 365 筆數據。

Page 7: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

347

雙彎曲函數值域介於 0 至 1 之間,為配

合倒傳遞類神經網路之函數,故將各數據進

行正規化處理,使數值介於 0 至 1 之間,正

規 化 之 公 式 如 (1) 式 所 示 。

S =L−Lmin

Lmax−Lmin (1)

式中:

S:正規化數據。

L:實際數據。

Lmin:原始數據之極小值。

Lmax:原始數據之極大值。

(三) 模式之前向式篩選

前向式篩選係將需探討之變數(或參數)

個別輸入至模式內,依模式個別輸出結

果之評估指標加以判斷再選取最佳之

值,於下次輸入類神經網路時保留該變

數(或參數),並配合其它變數(或參數)一

併輸入至模式,以便進行篩選,重覆此

步驟直至所有變數(或參數)皆篩選完畢。

1. 模式之參數設定:

為使模式預測更為準確,其類神經網路

參數之設定,係根據上述,進行參數最佳化

之篩選。因類神經網路每次輸出值皆不相同,

故本研究之隱藏層單元數、訓練次數及學習

速率以進行 10次重複試驗後再取平均值,而

動量修正係數為微調類神經網路之功能,為

求於參數設定完成後,能取得一組 PM10之預

測值並與實際值進行比較分析,故於動量修

正係數階段,只進行 1 次重複試驗。

2. 最佳輸入變數組合之篩選:

若輸入過多之變數,於學習訓練上將較

費時且易受雜訊之干擾,因此,本研究以前

向式篩選進行最佳輸入變數組合之探討,並

篩選出模式內最佳之輸入變數組合,期能減

少模式訓練時間及提升準確度。

3. 參數敏感度之分析:

本研究以敏感度分析,藉以瞭解各項輸

入參數之改變量對於模式之影響程度,將單

一輸入變數值之強度調整為最大值與最小

值,分別輸入至類神經網路後,其兩者之輸

出結果平均值之相差絕對值,即為對模式之

敏感度,其公式如(2)式所示:

敏感度 = |Ui+ − Ui

−| (2)

式中:

Ui+:輸入最大值後,網路輸出之平均值。

Ui−:輸入最小值後,網路輸出之平均值。

(四) 評估之指標

本研究係以下列二種之誤差指標評估模

式之準確性,其定義及分述如下:

1. 均方誤差(Mean Square Error, MSE):

均方誤差定義為實際值與預測值之相差

統計量,以判斷網路訓練結果之好壞及收斂

與否,一般均方誤差越小表示網路訓練結果

越佳,其公式如下所示:

MSE=∑ ∑ (𝑑𝑖𝑗−𝑦𝑖𝑗)

2𝑁𝑖=0

𝑃𝑗=0

N×P (3)

式中:

P:預測值之個數。

N:實際值之個數。

yij:於處理單元 j 之範例 i之網路預測

值。

dij:於處理單元 j 之範例 i之實際值。

Page 8: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

348

表1 氣象參數與PM10濃度值之相關性分析

Table 1 Correlation analysis of meteorological parameters and the concentration of PM10

項目

民國

當日 PM10濃度值之 Pearson 相關性

資料

筆數

溫度

(˚C)

降雨量

(mm/day)

相對溼度

(%)

風向

(360°)

風速

(m/s)

全天空輻射

(MJ/m2)

日照時數

(hr)

氣壓

(hPa)

雲量

(11 th)

前一日之

PM10濃度

值(μg/m3)

前一日之

PM2.5濃度

值(μg/m3)

95 年 365 -0.204** -0.289** -0.297** -0.190** -0.140** 0.098 0.205** 0.282**

-0.358**

0.655**

0.602**

96 年 365 -0.355** -0.238** -0.380** -0.334** 0.04 0.032 0.240** 0.401**

-0.429**

0.656**

0.632**

97 年 366 -0.278** -0.179** -0.317** -0.300** -0.067 -0.007 0.156** 0.286**

-0.284**

0.719**

0.684**

98 年 365 -0.239** -0.229** -0.286** -0.165** -0.075 0.009 0.164** 0.258**

0.313**

0.592**

0.606**

99 年 365 -0.234** -0.187** -0.247** -0.147** -0.096 -0.024 0.114* 0.252**

-0.232**

0.659**

0.575**

註:**表達1 %顯著水準;*表達5 %顯著水準。

Page 9: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

349

2. 相關係數(Correlation Coefficient, r):

相關係數能顯示區間尺度或比例尺度

內,兩變數線性關係之方向與強度,其若為

正值,表示正相關;反之,則為負相關,其

公式如下所示:

r

=

∑ (xi-xi̅)(di-di̅)i

N

√∑ (xi-xi̅)2

i

N√∑ (di-di̅)

2

i

N

(4)

式中:

xi:第 i 個樣本之實際值。

xi̅:實際值之平均值。

di:第 i 個模式推算值。

di̅:推算值之平均值。

N:樣本數。

結果與討論

一、模式之參數設定─試誤法

(一) 隱藏層單元個數

設定之隱藏層單元數如表 2 所示,以第

17 個單元數呈現較佳之結果,因訓練之相關

係數(簡稱 train-r)與測試之相關係數(簡稱

test-r)約為 0.6950 與 0.6257,於各隱藏層單元

個數中為最大值,而 MSE 約為 0.0055 亦為

所有單元個數中之最小值,表示實際值與預

測值之誤差相對於其它隱藏層單元數小,故

選取 17個單元數,作為本研究隱藏層之單元

數。

表 2 網路於設定隱藏層單元個數之結果

Table 2 The number of hidden neurons

隱藏層

單元數 train-MSE train-r test-r

1 0.0094 0.2953 0.1795

2 0.0080 0.6495 0.6115

3 0.0088 0.4550 0.3782

4 0.0080 0.4885 0.3402

5 0.0077 0.5536 0.4047

6 0.0077 0.5318 0.4157

7 0.0078 0.5477 0.4173

8 0.0072 0.6495 0.5945

9 0.0068 0.6626 0.6154

10 0.0068 0.6034 0.5073

11 0.0059 0.6675 0.5910

12 0.0073 0.5714 0.4243

13 0.0061 0.6610 0.5995

14 0.0070 0.5994 0.5396

15 0.0072 0.6338 0.5656

16 0.0057 0.6817 0.6105

17 0.0055 0.6950 0.6257

18 0.0063 0.6145 0.5458

19 0.0063 0.6419 0.5532

20 0.0059 0.6459 0.5652

21 0.0061 0.6360 0.5345

22 0.0059 0.6529 0.5589

23 0.0058 0.6647 0.5850

24 0.0061 0.6426 0.5746

Page 10: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

350

(二) 網路訓練次數

網路訓練次數之設定如表 3 所示,由表

3 可知,MSE 於 20,000 次至 40,000 次之間漸

趨穩定,而 train-r 與 test-r 於 35,000 次時皆

達最高值,分別為 0.7195 與 0.6701,故選取

35,000 次作為本研究之訓練次數。

(三) 學習速率

觀察表 4 網路於設定學習速率之結果

可知,MSE 於學習速率 0.1 至 1.0 間漸趨穩

定,而訓練時之最佳學習速率為 1.0,其 train-r

約為 0.7301,但測試結果卻以學習速率為 0.9

時之 test-r 約為 0.6748 最佳,由於本研究主

要目的在於預測,故選取學習速率 0.9 作為

設定之值。

(四) 動量修正係數

動量修正係數之結果如表 5 所示,MSE

於 0.1至 0.5 間漸趨穩定狀態,雖於 0.4 時其

train-r 約為 0.7348 呈現較高值,但測試結果

卻以修正係數 0.1時之 test-r約為 0.6729最佳,

由於本研究主要目的在於預測,故選取動量

修正係數為 0.1作為設定之值。

(五) 篩選前之模式

綜合上述各項參數之設定值,並彙整如

下所示:隱藏層單元數為 17 個、訓練次數為

35,000 次、學習速率為 0.9 與動量修正係數

為 0.1。於網路皆設定完畢後,其未篩選模式

之訓練散佈圖與趨勢圖,如圖 5與圖 6所示,

由圖 5得知 PM10濃度值之訓練結果良好,其

train-r 約為 0.7285,達 1 %顯著水準,表示預

測值與實際值具有極顯著相關,又由圖 6 得

知,預測值於季節變化之趨勢學習效果亦良

好,在四年之訓練資料皆顯示 PM10濃度有夏

季低與冬季高之趨勢,符合線西空品站實際

之情況。

表 3 網路於設定訓練次數之結果

Table 3 The number of training times

訓練

次數

train-MSE train-r test-r

5000 0.0071 0.6823 0.6008

10000 0.0055 0.6950 0.6256

15000 0.0057 0.6693 0.5961

20000 0.0050 0.6969 0.6310

25000 0.0049 0.7093 0.6569

30000 0.0048 0.7129 0.6591

35000 0.0047 0.7195 0.6701

40000 0.0047 0.7178 0.6646

表 4 網路於設定學習速率之結果

Table 4 The result of learning rate

學習

速率

train-MSE train-r test-r

0.1 0.0047 0.7194 0.6700

0.2 0.0047 0.7228 0.6687

0.3 0.0046 0.7261 0.6630

0.4 0.0046 0.7262 0.6648

0.5 0.0046 0.7246 0.6729

0.6 0.0046 0.7257 0.6732

0.7 0.0046 0.7247 0.6744

0.8 0.0046 0.7284 0.6732

0.9 0.0046 0.7295 0.6748

1.0 0.0045 0.7301 0.6734

Page 11: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

351

表 5 網路於設定動量修正係數之結果

Table 5 The result of the momentum modified

coefficient

動量修

正係數

train-MSE train-r test-r

0.1 0.0046 0.7285 0.6729

0.2 0.0046 0.7285 0.6700

0.3 0.0045 0.7336 0.6697

0.4 0.0045 0.7348 0.6650

0.5 0.0045 0.7320 0.6692

至於未篩選模式之測試散佈圖與趨勢

圖,如圖 7 與圖 8所示,PM10濃度值之測試

由圖 7顯示結果良好,其 test-r 約為 0.6729,

且達 1 %顯著水準,即預測值與實際值具有

極顯著相關,惟第 80 筆資料其當日實際之

PM10濃度值約為 492.57 μg/m3,但預測值卻

僅有 73.57 μg/m3,兩者間差距甚多;而於第

81筆資料之實際值與預測值分別約為 488.42

μg/m3與 214.81 μg/m

3,雖然仍有相對較大

之誤差,但其預測明顯較第 80 筆資料佳,觀

察網路輸入之參數,可發現第 80 筆資料之前

一日 (即第 79 筆資料 )之 PM10 濃度僅有

79.33μg/m3,而次日(即第 80 筆資料)之 PM10

濃度卻高達 492.57 μg/m3,前後兩天之濃度

值差距甚大;而第 81 筆資料因前一日(即第

80 筆資料)PM10 濃度與當日之 PM10 濃度相

近,故預測值提升至 214.81 μg/m3較接近實

際值,因此,前一日 PM10濃度可能為影響預

測準確度之重要因子。整體而言,

圖 5 篩選前之訓練散佈圖

Figure 5 The distribution of training data before screening

y = 0.5214x + 29.105r=0.7285**

0

50

100

150

200

250

0 50 100 150 200 250 300

PM

10(

μg/m

3 )預測值

PM10(μg/m3)實際值

Page 12: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

352

圖 6 篩選前之訓練趨勢圖

Figure 6 The run chart of training data before screening

圖 7 篩選前之測試散佈圖

Figure 7 The distribution of testing data before screening

0

50

100

150

200

250

300

350

0 150 300 450 600 750 900 1050 1200 1350 1500

PM

10(

μg/

m3 )

資料筆數

實際值 預測值 r =0.7285**

y = 0.3707x + 37.109r=0.6729**

0

50

100

150

200

250

300

0 50 100 150 200 250 300 350 400 450 500

PM

10(

μg/m

3 )預測值

PM10(μg/m3)實際值

第 80筆(492.57,73.57)

第 81筆(488.42,214.81)

Page 13: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

353

圖 8 篩選前之測試趨勢圖

Figure 8 The run chart of testing data before screening

類神經網路若要預測完全準確,其先天條件

為輸入變數或輸出變數間有一明顯之規律變

化,因此,若於 PM10濃度值突增或突減時,

將導致類神經網路無法立即反應,產生誤差

值較大之情形。又由圖 8 得知,測試之預測

值與實際值兩者間變化呈現相同之趨勢。

二、最佳輸入變數組合之篩選

本研究模式係以前向式之方式,篩選出

最佳輸入變數之組合,其結果如表 6 所示,

由表 6 得知,第十組於訓練階段之相關係數

(train-r)呈現較高值,約為 0.7285,但測試階

段之相關係數(test-r)卻是以第八組呈現較高

值,約為 0.6870,由於本研究主要目的在於

預測,故選取最佳輸入變數之組合為第八之

模式,其輸入變數包括前一日 PM10、濕度、

風速、風向、日照時數、全天空輻射、降雨

量及氣壓等八項。由表 6 亦得知,模式經篩

選後之第八組與第十組,分別於測試階段之

相關係數,皆比未篩選時(即第十一組)之模式

相對提升,表示若於輸入類神經網路前,進

行變數篩選之工作,將有助於提升預測能力

之準確性。

本研究最佳輸入變數組合為第八組,於

篩選後之訓練散佈圖與趨勢圖,如圖 9 與圖

10 所示,由圖 9 可知 PM10濃度值之訓練結

果良好,達 1 %顯著水準,即預測值與實際

值具有極顯著相關,又由圖 10 得知,預測值

與實際值對季節性變化皆呈現夏低冬高之趨

勢。至於變數篩選後之測試散佈圖與趨勢圖

如圖 11 與圖 12 所示,觀察圖 11 得知 PM10

濃度值之測試結果良好,達 1 %顯著水準,

即預測值與實際值呈現極顯著相關,而觀察

圖 12 可發現測試時之預測值與實際值兩者

間亦有相同變化之趨勢。惟於第 80 筆與 81

筆資料時亦產生與篩選前相同之情形,由於

類神經網路之預測值,受前一日實測值之影

響很大,若前一日與當日實測值差異很大時,

網路則無法立即反應,前一日 PM10濃度可能

亦為其主要影響因子。但由表 7 篩選變數前

後之模式對於兩極端值之分析比較中,可觀

察出第 80 筆資料於當日實際之 PM10濃度值

0

100

200

300

400

500

600

0 50 100 150 200 250 300 350 400

PM

10(

μg/

m3 )

資料筆數

實際值 預測值 r =0.6729**

第 80筆

第 81筆

Page 14: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

354

約為 492.57 μg/m3,篩選前後之模式預測值

分別為 73.57 μg/m3與 76.22 μg/m

3,與實際

值之誤差降低 0.5 %。而資料點第 81筆資料

時,當日實際之 PM10 濃度值約為 488.42

μg/m3,其篩選變數前後之模式預測值分別

為 214.81 μg/m3與 248.81 μg/m

3,與實際值

之誤差顯著降低 7 %,顯示藉由篩選變數之

動作,兩資料點之預測力皆有提昇之趨勢,

另外比較篩選前後模式之相關係數,分別為

0.6729 與 0.6870,更證明篩選之動作確實有

增加整體模式實際值與預測值相關性之效果

表 6 輸入變數篩選之結果

Table 6 The result of screening input parameters

別 輸入變數類別 train-MSE train-r test-r

1 前一日 PM10 0.0062 0.6644 0.6544

2 前一日 PM10、濕度 0.0052 0.6826 0.6636

3 前一日 PM10、濕度、風速 0.0050 0.6951 0.6730

4 前一日 PM10、濕度、風速、風向 0.0048 0.7107 0.6792

5 前一日 PM10、濕度、風速、風向、日照時數 0.0048 0.7158 0.6812

6 前一日 PM10、濕度、風速、風向、日照時數、全天空輻射 0.0048 0.7129 0.6841

7 前一日 PM10、濕度、風速、風向、日照時數、全天空輻射、降雨 0.0047 0.7221 0.6840

8 前一日 PM10、濕度、風速、風向、日照時數、全天空輻射、降雨、氣壓 0.0047 0.7179 0.6870

9 前一日 PM10、濕度、風速、風向、日照時數、全天空輻射、降雨、氣壓

、溫度 0.0046 0.7251 0.6830

10 前一日 PM10、濕度、風速、風向、日照時數、全天空輻射、降雨、氣壓

、溫度、雲量 0.0046 0.7285 0.6780

11 前一日 PM10、濕度、風速、風向、日照時數、全天空輻射、降雨、氣壓

、溫度、雲量、前一日 PM2.5 0.0046 0.7285 0.6729

由表 1分析氣象參數與當日 PM10濃度值

之相關性中得知,風速及全天空輻射與當日

PM10濃度值皆呈較無相關之現象,但經由最

佳輸入變數組合之篩選後,卻有風速與全天

空輻射等兩項,因此,若於類神經網路演算

前,以 Pearson 之相關性分析後,呈現較無相

關時,勿直接刪除變數,可輸入至類神經網

路後再行判斷,避免變數間因顯著性較低,

產生誤刪變數之情形,進而影響模式之準

度。

三、參數敏感度之分析

敏感度之分析彙整如表 8所示,由表 8得知,

各項輸入變數對當日 PM10濃度值之影響,依

序為前一日 PM10、前一日 PM2.5、相對溼度、

風速、雲量、氣壓、溫度、日照時數、風向、

降雨量及全天空輻射。而前一日 PM10對於預

測之影響最大,敏感度達 0.1949,其次為前

一日 PM2.5之 0.1000,而降雨量與全天空輻射

於預測之敏感度影響最低,其敏感度分別為

0.0191 與 0.0171,由此可知,於預測 PM10

濃度時,受前期效應之影響較高(即前一日之

PM10),亦印證前述之篩選前與篩選後,可能

受前一日 PM10濃度之影響,產生實際極端值

與預測值誤差之假設;而該地區空氣中之懸

浮微粒亦普遍受到前一日之延續作用,當細

微粒活動頻繁時,其與相對濕度皆會嚴重影

響預測當日 PM10之濃度。

Page 15: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

355

表 7 篩選前後極端值分析預測之結果

Table 7 Analysis of correlation coefficient and extreme values before and after screening

資料筆數

極端值之項目

資料筆數第 80 筆 資料筆數第 81 筆

篩選前 篩選後 篩選前 篩選後

相關係數 0.6729 0.6870 0.6729 0.6870

實際值 492.57 488.42

預測值 73.57 76.22 214.81 248.81

誤差值 419 416.35 273.61 239.61

篩選前後之誤差(%) 85 % 84.5 % 56 % 49 %

註:表中除相關係數為無單位,其餘各項數據之單位皆為 μg/m3

圖 9 篩選後之訓練散佈圖

Figure 9 The distribution of training data after screening

y = 0.5074x + 30.017r=0.7179**

0

50

100

150

200

250

0 50 100 150 200 250 300

PM

10(

μg/m

3 )預測值

PM10(μg/m3)實際值

Page 16: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

356

圖 10 篩選後之訓練趨勢圖

Figure 10 The run chart of training data after screening

圖 11 篩選後之測試散佈圖

Figure 11 The distribution of testing data after screening

0

50

100

150

200

250

300

350

0 150 300 450 600 750 900 1050 1200 1350 1500

PM

10(

μg/

m3 )

資料筆數

實際值 預測值 r =0.7179**

y = 0.3897x + 34.612r=0.6870**

0

50

100

150

200

250

300

0 50 100 150 200 250 300 350 400 450 500

PM

10(

μg/m

3 )預測值

PM10(μg/m3)實際值

第 80筆(492.57,76.22)

第 81筆(488.42,248.81)

Page 17: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

357

圖 12 篩選後之測試趨勢圖

Figure 12 The run chart of testing data after screening

結論

綜合本研究結果可得結論如下:

一、本研究以試誤法並配合均方誤差與相關

係數之判定,獲得類神經網路內部參數

之設定,結果當隱藏層單元數為 17個、

訓練次數為 35,000 次、學習速率為 0.9

與動量修正係數為 0.1 時,所得之預測

值最佳。

二、篩選過後之最佳輸入變數組合為前一日

PM10、濕度、風速、風向、日照時數、

全天空輻射、降雨量及氣壓等八項。

三、PM10濃度之預測值與實際值於變數篩選

前後,皆呈現季節性夏低冬高之相同趨

勢。

四、經由前向式篩選輸入變數後,不但可提

升整體預測值與實際值之相關性,亦可

提升對極端值之預測能力。

表 8 網路敏感度之分析

Table 8 Sensitivity analysis

敏感度

項目 U

+ U

- |U

+-U

-| 順序

前一日

PM10 0.5815 0.3866 0.1949 1

前一日

PM2.5 0.2627 0.1627 0.1000 2

相對溼度 0.1601 0.2160 0.0559 3

風速 0.1536 0.1972 0.0436 4

雲量 0.1518 0.1900 0.0382 5

氣壓 0.1929 0.1675 0.0254 6

溫度 0.1751 0.1984 0.0233 7

日照時數 0.1834 0.2067 0.0233 8

風向 0.1678 0.1894 0.0215 9

降雨量 0.1576 0.1767 0.0191 10

全天空

輻射 0.1879 0.1708 0.0171 11

0

100

200

300

400

500

600

0 50 100 150 200 250 300 350 400

PM

10(

μg/

m3 )

資料筆數

實際值 預測值 r =0.6870**

第 81筆

第 80筆

Page 18: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

358

五、變數篩選前後之模式預測結果皆顯示實

際極端值與預測值誤差較大之現象,由

敏感度分析得知前一日 PM10 濃度值為

影響預測能力之重要因子,因此,若於

連續之時間序列中 PM10 濃度值發生突

增或突減情形時,將導致模式無法立即

反應,易產生極端值之誤差。

最佳輸入變數組合之篩選,除可降低網

路複雜性及提升準確率,亦可避免變數間因

顯著性較低,產生誤刪變數之情形,進而影

響模式整體之準確度。本研究成果可提供爾

後相關研究之依據。

參考文獻

1. 王炎秋(2006),「應用類神經網路及時間

序列預測台南地區空氣品質- PM10」,立

德管理學院資源環境研究所碩士論

文。

2. 江勝偉(2007),「氣象因子與大氣懸浮微

粒含碳量變異關聯性研究」,國立成功

大學環境工程學系碩士論文。

3. 江世民(1999),「台北地區臭氧及懸浮微

粒型態與其他污染物及氣象條件之分

析比較」,第十六屆空氣污染控制技術

研討會。

4. 林斌龍、李崇德(1990),「台北地區 PM10

濃度與氣象因子之多變量統計分析」,

第七屆空氣污染控制技術研討會。

5. 林逸塵(2002),「類神經網路應用於空氣

品質預測之研究」,國立中山大學環境

工程研究所碩士論文。

6. 林孟希(2010),「大氣粒狀物粒徑分佈影

響因子分析研究」 ,國立高雄第一科

技大學環境與安全衛生工程系碩士論

文。

7. 高全興(1997),「類神經網路於空氣品質

短期預測之研究」,國立雲林科技大學

環境與安全工程研究所碩士論文。

8. 莊秉潔(1993),「地表層擴散係數、風速、

雨量及混合層高對台北都會早上八時

懸浮微粒濃度之影響」,中國環境工程

學刊,第三卷,第二期。

9. 郭石柱(2009),「揚塵懸浮微粒 PM10與

氣象因子相關性分析-以台東縣關山鎮

空氣品質監測站為例」,國立中興大學

水土保持學系所碩士論文。

10. 程萬里、黃怡嘉(2000),「中部地區臭氧

及懸浮微粒與氣象因子之相關研究」,

第十七屆空氣污染控制技術研討會。

11. 詹俊南(1996),「台灣地區 PM10汙染特

性分析」,國立台灣大學環境工程研究

所碩士論文。

12. 葉怡成(2003),「類神經網路模式應用與

實作」,儒林圖書公司,修訂八版。

13. 葉怡成(2001),「應用類神經網路」,儒

林圖書公司,修訂三版。

14. 談珮華、周佳、梁靜宜、吳柏霖(2008),

「台北都會區的假期效應」,大氣科學,

第三十六期第三號,第 197-215頁。

15. 蔡盛行(2011),「倒傳遞類神經網路於懸

浮微粒量預測與防制工法之研究」,國

Page 19: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

黃隆明、古緯中:應用倒傳遞類神經網路於 PM10預測之研究

359

立嘉義大學土木與水資源工程學系研

究所碩士論文。

16. 鄭淑燕、望熙榮、鄭曼婷(1991),「台中

地區空氣品質分析」,第八屆空氣污染

控制技術研討會。

17. Huang Mei, Peng Gongbing, Zhang

Jiashen and Zhang Shihuang (2006),

“Application of artificial neural networks

to the prediction of dust storms in

Northwest China,” Global and Planetary

Change, Volume 52, Issue 1-4, 216-224.

18. Lam, K. C. and S. Cheng (1998), “A

synoptic climatological approach to

forecast concentrations of sulfur dioxide

and nitrogen oxides in Hong Kong,”

Environmental Pollution, Vol.101:

183-191.

19. Monn, C.H., O. Braendli, G. Schaeppi,

CH. Schindler, U. Ackermann, PH.

Leuenberger and T. Sapldia (1995),

“Particulate matter < 10 μm (PM10) and

total suspended particulates (TSP) in

urban, rural and alpine air in Switzerland,”

Atmospheric Environment,Vol.30, Issue

9,1529.

20. Perez, P. and J. Reyes (2002), “Prediction

of Maximum of 24-h Average of PM10

Concentration 30 h in Advance in

Santiago, Chile,” Atmospheric

Environment 36: 4555-4561.

21. Smith, Steve, F. Trevor Stribley, Peter

Milligan and Ben Barratt (2001), “Factors

influencing measurements of PM10 during

1995-1997 in London,” Atmospheric

Environment, Vol.35: 4651-4662.

22. Slini, T., A. Kaprara, K. Karatzas and N.

Moussiopoulos (2006), “PM10 forecasting

for Thessaloniki, Greece,” Environmental

Modelling and Software, 21: 559-565.

23. Tsuang B.J. and C.P. Chao (1999)

“Application of circuit model for Taipei

City PM10 simulation,” Atmospheric

Environment, Vol.33: 1789-1

101年 06月 05 日收稿

101年 06月 07 日修改

101年 06月 11日接受

Page 20: 應用倒傳遞類神經網路於PM10 預測之研究Application of Back

水土保持學報44(4) : 341 – 360 (2012)

Journal of Soil and Water Conservation , 44 (4) : 341 – 360 (2012)

360