集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019...

18
2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble Learning Model for Wafer Classification in Semiconductor Etching Process 摘要 近年來物聯網、工業 4.0、大數據分析、智慧製造蓬勃發展,加速了故障預測與健 康管理的普及。在半導體的產業中,任何的故障造成生產線突然停線所造成的所失,都 是難以估計的,故本研究的問題是對蝕刻製程晶圓之分類進行研究。因此本研究目的是 利用集成學習模型(Ensemble learning model)組合多個弱監督模型得到一個更好更全面的 強監督模型,對分類預測結果表現的比較,本研究使用深度學習多層感知器與機器學習 隨機森林做為弱監督模型。採用源自 Eigenvector Research, Inc 德州儀器公司之設備編號 SEMTECH J-88 專案的公開數據集,資料中含有 129 個晶圓資料,由 108 個正常的晶圓 21 個異常的晶圓組成,經由隨機森林與多層感知器分類之後,運用集成方法結合兩 種分類器,以減少 Variable bias ,提升準確度,使用分類的評判標準 TPR FPR AUC 最後集成學習方法之 TPR FPR AUC 值分別為 99.43%1.35%99.79%皆優於 Moyne et al.(2017)提到的 Whole Trace StatsManual WindowingSemi-automated FD TPRFPRAUC關鍵字:隨機森林(Random forest)、多層感知器(Multilayer perceptron)、集成學習 模型(Ensemble method)

Upload: others

Post on 26-Oct-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

集成學習模型於半導體之蝕刻製程晶圓分類研究

Ensemble Learning Model for Wafer Classification

in Semiconductor Etching Process

摘要

近年來物聯網、工業 4.0、大數據分析、智慧製造蓬勃發展,加速了故障預測與健

康管理的普及。在半導體的產業中,任何的故障造成生產線突然停線所造成的所失,都

是難以估計的,故本研究的問題是對蝕刻製程晶圓之分類進行研究。因此本研究目的是

利用集成學習模型(Ensemble learning model)組合多個弱監督模型得到一個更好更全面的

強監督模型,對分類預測結果表現的比較,本研究使用深度學習多層感知器與機器學習

隨機森林做為弱監督模型。採用源自 Eigenvector Research, Inc 德州儀器公司之設備編號

SEMTECH J-88 專案的公開數據集,資料中含有 129 個晶圓資料,由 108 個正常的晶圓

和 21 個異常的晶圓組成,經由隨機森林與多層感知器分類之後,運用集成方法結合兩

種分類器,以減少 Variable 和 bias,提升準確度,使用分類的評判標準 TPR、FPR、AUC,

最後集成學習方法之 TPR、FPR、AUC 值分別為 99.43%、1.35%、99.79%皆優於 Moyne

et al.(2017)提到的 Whole Trace Stats、Manual Windowing、Semi-automated FD 之 TPR、

FPR、AUC。

關鍵字:隨機森林(Random forest)、多層感知器(Multilayer perceptron)、集成學習

模型(Ensemble method)

Page 2: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

壹、 緒論

一、研究動機

科普雜誌(2017)中提到半導體之研發與製造技術發展快速,過去 20 多年來,全球半

導體產業幾乎都是依照摩爾定律,即積體電路上可容納的電晶體,目前在一顆積體電路

中已經可以容納上億顆數量之電晶體,根據摩爾定律(Moore's law)發展,電晶體的數量

約每隔 2 年或 18 個月便會隨之成長一倍的規則,在相同面積大小的晶片之內,半導體

產品之壽命週期縮短,電路寬度縮小級單位面積密度呈倍數成長,使得晶圓在製造過程

中需要高標準生產環境和昂貴且精密之機台設備配合,因此提升半導體產品之良率,進

而降低製造成本是廠商所追求的目標。

故本研究係希望透過機器學習與深度學習方式針對半導體蝕刻製程的過去資料做

分析,並對其正常產品和異常產品進行分類預測,若有異常發生時,系統立即發出警訊

並對產品與機台採取適當應變措施,避免異常產品的持續發生。

二、研究問題與目的

由於半導體製造過程愈趨複雜,傳統檢驗控制方式已無法滿足製程需求,故各大半

導體製造廠投入龐大的資源開發新的監控系統;而先進製程控制技術已經被應用在製程

監控系統上。本研究的問題是對蝕刻製程晶圓之分類進行研究。因此本研究主要目的是

透過集成學習方法透過深度學習多層感知器與機器學習隨機森林兩者弱監督模型,對分

類預測結果表現的比較。

三、研究範圍與限制

本研究限制用於二元分類或是多元分類的資料。預測方法是以機器學習與深度學

習為主。

貳、 文獻探討

一、半導體產業

產業價值鏈資訊平台(2018)提到半導體產業鏈主要分為三種:上游、中游、下游,上

游負責 IC 設計和 IP 設計,中游負責相關生產製程檢測設備、晶圓製造、IC 製造、光罩、

化學品等等,下游負責 IC 封裝測試、相關生產製程檢測設備、零組件(如基板、導線架)、

IC 模組、IC 通路等。IC 設計公司在產品設計完成後,委託專業代工晶圓廠或 IDM 廠

(半導體整合型廠是從封裝、製造、IC 設計、測試到最終銷售都一手包辦)製作成晶圓之

半成品,經過前端的測試,再轉交封裝廠進行封裝及切割,最後由測試廠進行後端的測

試,測試後之成品則經由銷售管道售予系統廠裝配生產成為系統產品。

Page 3: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

台灣半導體產業在製造與封測技術仍領先全球下,預估 2019 年表現可望與全球同

步或優於全球。面對未來市場發展趨勢,隨著 5G、AI 人工智慧、高效能運算、車用等

相關新興半導體應用,帶動從雲端到邊緣端所需要的各類 AI 加速與協同晶片紛紛被提

出,使得未來新架構的晶片發展趨勢,將影響著半導體產業發展方向與半導體應用區塊

的轉移。

由於感測器技術的進步和物聯網的普及,因此各產業應用大數據分析所帶來的成

本節約預計到 2020 年將達到 5000 億美元。而其中的一個重點領域,預測性維護和健

康管理(Prognostic and Health Management, PHM),可以將維護成本降低多達 30%,設

備停機時間降低多達 70%。圖 1 顯示了預測性維修和健康監測系統面臨的挑戰 (Chao

et al. (2018))。

圖 1 預測性維修和健康監測系統中面臨的挑戰 Chao et al. (2018)

二、數據不平衡

Kim et al.(2016)提出了基於採樣方法的 SMOTE(合成少數過採樣技術)來解決數據

不平衡問題,該方法通過對少數類失敗進行過採樣來解決通過與失敗之間的不平衡。Tan

et al.(2018)開發了一種集成自適應人工神經網絡(ANN)和模糊邏輯系統的混合方法,

用於解決類不平衡問題。特別地,基於自適應共振理論(ART)的監督學習 ANN 與基

於 TagakiSugenoKang 的模糊推理機制相結合,以學習和檢測從半導體公司收集的真實

大的高度不平衡數據集的缺陷。

三、分類的方法

傳統方法是使用統計模型進行異常檢測,現今大數據、人工智慧、物聯網快速發展

後,都使用機器學習和深度學習運用在異常檢測與分類上,並經由合適的數學模型預測

出理論上未來的可能,以利於管理決策者能在充分的證據下做出理性的判斷。接著將介

紹本研究文獻探討之分類的方法。

Gupta et al.(2002)提出了一種創新的特徵選擇算法,稱為智能光束搜索(SBS),它與

基於支持向量機(SVM)的分類器一起用於自動缺陷分類。Han et al. (2008)提出了利用基

Page 4: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

於主成分分析的支持向量機算法進行終點檢測,用於半導體蝕刻製程。An et al.(2009)引

入了一種相對較新的機器學習技術-支持向量機(SVM)來對產量進行分類。Baly and Hajj

(2012)使用支持向量機(SVM)進行早期晶圓分類。

Zhang and Zulkernine(2006)隨機森林相似距離可用於無監督環境中以捕獲半導體製

造過程中的異常。Puggini et al. (2015)提出了一種基於隨機森林的無監督方法,可以從半

導體蝕刻過程中觀察到的化學特徵中識別出有缺陷的晶圓。使用模擬範例和實際工業數

據集來評估該方法。結果顯示出兩個研究中的錯誤晶圓的正確分類。

Deng and Runger (2013)提出的引導規則化隨機森林(GRRF)使用基於完整訓練數據

的 RF 的重要性分數來補充本地節點中的信息增益。Deng (2013)提出了用於特徵選擇的

引導隨機森林(GRF)。類似於一種稱為引導規則化隨機森林的特徵選擇方法(GRR),GRF

是使用普通 RF 的重要性分數構建的。GRRF 中的樹是按順序構建的,高度相關並且不

允許並行計算,而 GRF 中的樹是獨立構建的並且可以並行實現。Uddin and Uddiny (2015)

提出了引導隨機森林可以選擇緊湊特徵子集,同時保持識別準確性。還應用隨機森林分

類器來評估特徵選擇方法的有效性,並證明具有由引導隨機森林選擇的特徵子集的隨機

森林比由其他特徵選擇方法選擇的特徵子集執行得更好。

Zhao et al. (2017)提出了基於加權子空間隨機森林算法的隨機森林算法,一種新的可

變加權方法用於可變子空間選擇,代替傳統的隨機變量採樣方法。這種新方法在構建高

維數據模型時特別有用,通常由數千個變量組成。並行計算用於利用多核機器和機器集

群,在相當短的時間內從高維數據構建隨機森林模型。並經常提高分類性能,特別是對

於高維數據進行分類。

Sumsion et al. (2018)提出了使用高光譜和 LiDAR 觀測在像素級對樹種和屬進行了

分類。比較了在廣泛的研究應用中廣泛實施的三種算法:支持向量機,隨機森林和多層

感知器。在像素級,多層感知器算法在訓練數據上以高精度對物種(92.7%)或屬種(95.9

%)進行分類,SVM 和 RF 算法的屬種分類分別達到 91.1%和 93.5%,物種分類的分類

準確率分別為 85.8%和 86.8%,並且比其他兩種算法表現更好。

Kohavi(1998)提出混淆矩陣,當獲得數據時,在數據預處理,預處理和結論之後,

要做的第一步是將它提供給一個表現好的模型,如何能夠衡量模型的有效性。更好的效

果,更好的性能。這就是混淆矩陣成為人們關注的焦點。混淆矩陣是機器學習分類的性

能測量。它是機器學習分類問題的性能測量,其中輸出可以是兩個或更多個類。它是一

個包含預測值和實際值的 4種不同組合的表,進行最後預測分類最主要的工作就是績效

指標的評斷,常見分類績效指標的主要幾種方法如表 1,其中本研究使用 TP、FP、AUC

為主要績效指標。

Page 5: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

表 1 混淆矩陣

Confusion Matrix Real

Positive Negative

Predict

Positive True Positives(TP) False Positives(FP)

Negative False Negatives(FN) True Negatives(TN)

真正類率(True Positive Rate, TPR),又稱為靈敏度(sensitivity),又稱為召回率(recall):即

正樣本預測結果數除正樣本實際數

TPR =𝑇𝑃

𝑇𝑃+𝐹𝑁

假負類率(False Negative Rate , FNR):即被預測為負的正樣本結果數除正樣本實際數

FNR =𝐹𝑁

𝑇𝑃+𝐹𝑁

假正類率(False Positive Rate , FPR):即被預測為正的負樣本結果數除負樣本實際數

FPR =𝐹𝑃

𝐹𝑃+𝑇𝑁

真負類率(True Negative Rate , TNR),又稱為特指度(specificity):即負樣本預測結果數除

負樣本實際數

TNR =𝑇𝑁

𝑇𝑁+𝐹𝑃

ROC 曲線選的兩個指標是:

1.真正類率(true positive rate,TPR),計算公式為TPR =𝑇𝑃

𝑇𝑃+𝐹𝑁

2.假正類率(1-specificity=FPR),計算公式為FPR =𝐹𝑃

𝐹𝑃+𝑇𝑁

Hanley and McNeil (1982)提到的 AUC (Area Under Curve)被定義為 ROC 曲線下的面

積,顯然這個面積的數值不會大於 1。又由於 ROC 曲線一般都處於 y=x 這條直線的上

方,所以 AUC 的取值範圍在 0.5 和 1 之間。使用 AUC 值作為評價標準是因為很多時候

ROC 曲線並不能清晰的說明哪個分類器的效果更好,而作為一個數值,對應 AUC 更大

的分類器效果更好。本研究整理對檢測與分類方法之相關文獻整理如表 2。

Page 6: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

表 2 半導體蝕刻製程晶圓分類方法之相關文獻

Gupta et al. (2002)

Han et al. (2008)

An et al. (2009)

Baly and Hajj (2012)

Sumsion et al. (2018)

SVM

Zhang and Zulkernine (2006)

Puggini et al. (2015)

Sumsion et al. (2018)

Random Forest

Deng (2013)

Uddin and Uddiny (2015) GRF

Zhao et al. (2017) WSRF

Sumsion et al. (2018) MLP

參、 研究方法

一、合成少數過採樣技術

SMOTE(Synthetic Minority Oversampling Technique),合成少數類過取樣技術,它

是基於隨機過取樣演算法的一種改進方案,由於隨機過取樣採取簡單複製樣本的策略

來增加少數類樣本,這樣容易產生模型過擬合的問題,即使得模型學習到的資訊過於

特別(Specific)而不夠泛化(General),SMOTE 演算法的基本思想是對少數類樣本進行分

析並根據少數類樣本人工合成新樣本新增到資料集中,演算法流程如下。

(1)對於少數類中每一個樣本 x,以歐氏距離為標準計算它到少數類樣本集中所有樣本

的距離,得到其 k 近鄰。

(2)根據樣本不平衡比例設定一個取樣比例以確定取樣倍率 N,對於每一個少數類樣本

x,從其 k 近鄰中隨機選擇若干個樣本,假設選擇的近鄰為 xn。

(3)對於每一個隨機選出的近鄰 xn,分別與原樣本按照如下的公式 3.1 構建新的樣本。

𝑥𝑛𝑒𝑤 = 𝑥 + 𝑟𝑎𝑛𝑑(0,1) × (�̃� − 𝑥) (3.1)

二、集成學習方法

集成學習是一種方法,我們訓練多個機器學習模型並將它們的預測結合起來以獲得

更好的準確性,並減少模型預測的變化。

Page 7: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

本研究基於採用多層感知器算法和隨機森林之集成方法來分類正常與異常晶圓,分

類之方法是將訓練資料建立分類模型,分類模型對另一部分未知類別的測試資料進行預

測。透過用真正類率和假正類率算出接收器工作特性曲線下的面積作為目標函數,最後

得到組合模型,公式如 3.2:

𝑓𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑𝑣𝑎𝑙𝑢𝑒 = 𝑤1 ∗ 𝑓𝑚𝑙𝑝 + 𝑤2 ∗ 𝑓𝑟𝑓 (3.2)

𝑓𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑是最終預測值,𝑓𝑚𝑙𝑝是多層感知器算法的預測值,𝑓𝑟𝑓是隨機森林算法的預

測值,𝑤1是多層感知器算法的權重,𝑤2隨機森林算法的權重,其中𝑤1 + 𝑤2 = 1,本研

究𝑤1、𝑤2為各 0.5。

本研究所使用之集成方法的步驟如下:

(一) 資料取得並資料整理後,使用 SMOTE 將不平衡數據過採樣至數據平衡,然後再將

資料標準化。

(二) 將資料切分為 50%訓練資料,50%為測試資料。

(三) 分 別 訓 練 兩 個 分 類 模 型 , 一 個 為 隨 機 森 林 模 型 , 在 R 中 使 用

randomForest(detection~.,data=train,ntree=ntree,mtry=mtry,importance=TRUE),其中

ntree、mtry 參數,透過尋找 OOB 為最小值之最佳參數後,預測 50%測試資料分類

機率值,另一個模型為多層感知器,在 R 中使用 MLP 模型後,預測 50%測試資料

分類機率值,MLP 模型如圖 2。

(四) 用集成方法(Ensemble)以減少 variable 和 bias,並提升準確度,利用公式 3.1 算出集

成方法機率值(隨機森林預測機率值與多層感知器預測機率值權重相同),機率值

>=0.5 判定為正常,機率值<=0.5 判定為異常。

(五) 計算出 AUC、TPR、FPR

(六) (一)至(五)步驟為一次 iteration,故本研究為驗證可信度,執行 100 次 iteration,並

求出衡量指標之平均,得到本研究之結果。

圖 2 MLP 模型

Page 8: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

本研究所使用之集成學習方法的流程圖如圖 3 所示:

圖 3 集成學習方法流程圖

三、隨機森林

本研究採用 Breiman (2001)所提出的 RF 進行分類預測,隨機森林(Random Forest,

RF)是以決策樹(Decision Tree, DT)分類為基礎,將許多不同決策樹的結果進行投票,選

擇出最佳的分類決策樹。將資料隨機抽取 50%為訓練資料,在 R 程式語言中有一套件軟

體 ramdomForest,ramdomForest 中為 mtry 以及 ntree 為重要參數,因此本研究設定 ntree

為 1 到 500,mtry 設為 1 到 19,並在 mtry 以及 ntree 中尋找 OOB 為最小解之 mtry 和

ntree,透過尋找最佳解之 mtry 以及 ntree 後,套入 randomForest 模型中得到最適模型與

其他 50%為測試資料進行預測,並得出預測機率值。隨機森林流程圖如 4。

Page 9: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

圖 4 隨機森林流程圖

四、多層感知器

本研究採用 Rosenblatt (1958)年提出的原始感知器模型的變體進行分類預測,多層

感知器(Multilayer Perceptron, MLP)是一種前向結構的人工神經網絡,映射一組輸入向量

到一組輸出向量。一種被稱為反向傳播算法的監督學習方法常被用來訓練 MLP。MLP

是感知器的推廣,克服了感知器不能對線性不可分數據進行識別的弱點。

將資料隨機抽取 50%為訓練資料,在 R 程式語言中有一套件軟體 Keras,輸入層為

全部變數維度 19 個神經元,本研究設 7 層隱藏層,為避免過度擬合,因此在每一層中

設定 dropout 為 0.25,batch_size 為 512,輸出層為 1 個神經元,激活函數為 sigmoid 二

元分類,套入 Keras-mlp 模型中得到最適模型與其他 50%為測試資料進行預測,並得到

預測機率值。多層感知器流程圖如圖 5。

圖 5 多層感知器流程圖

Page 10: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

進行最後預測分類最主要的工作就是績效指標的評斷,常見分類績效指標的主要幾

種方法如表 1,其中本研究使用 TP、FP、AUC 為本研究之主要績效指標。

肆、 案例分析

一、半導體蝕刻製程

本研究資料來源源自 Eigenvector Research, Inc 從蝕刻器獲取的公開數據集,該公司

數據從德州儀器公司(Texas Instruments Inc.)設備編號 SEMTECH J-88 之專案的市售

Lam9600 電漿體蝕刻工具上的鋁堆疊蝕刻製程中收集。半導體蝕刻製程的重點是鋁之導

線的蝕刻製程,製程目標是用電感耦合的 BCL3 / CL2電漿體蝕刻氧化鈦(TiN)/鋁(Al)-0.5

%,銅(Cu) / TiN /氧化(oxide)疊層。製造過程的標準配方包括一系列六個步驟。前兩個

步驟用於壓力穩定和氣流。步驟 3 是短時電漿體點火過程。步驟 4 和步驟 5 是蝕刻過程

中的兩個主要步驟。步驟 4 是蝕刻 Al 層以終止於 Al 端點,步驟 5 用作下面的 TiN 和

oxide 層的過蝕刻。步驟 6 使腔室排氣。穩定化步驟之後是三個蝕刻區域:TiN,Al 和

oxide 蝕刻。在本案例研究中,僅考慮步驟 4 和 5 中的數據,因為它們包含更多有用的

過程信息。

二、資料介紹

半導體蝕刻製程數據集包括 129 個晶圓資料,由 108 個正常的晶圓和 21 個異常的

晶圓組成。來自一系列三個實驗(編號 29,31,33),並且通過改變 TCP 功率,RF功率,壓

力,Cl2或 BCl3流速故意地誘導了 21 個異常晶圓,如表 4。由於批次持續時間不等,這

三個實驗相隔幾週運行,來自不同實驗的數據具有不同的平均值和稍微不同的協調結構。

原始資料包含 21 個量測和控制的變數,例如室內壓力、RF 功率、TCP 功率、Cl2或 BCl3

流速等。在這 21 個製程變數中,選取 19 為重要相關的變數進行製程監控,如表 5 所示。

Page 11: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

表 4 半導體蝕刻製程失效型態

Wafer number Faulty Type Wafer number Faulty Type

1 TCP+50 12 RF+8

2 RF-12 13 BCl3-5

3 RF+10 14 Pr+2

4 Pr+3 15 TCP-20

5 TCP+10 16 TCP-15

6 BCl3+5 17 Cl2-10

7 Pr-2 18 RF-12

8 Cl2-5 19 BCl3+10

9 He chuck 20 Pr+1

10 TCP+30 21 TCP+20

11 Cl2+5

表 5 半導體蝕刻製程變數

No. Variables No. Variables

1 BCl3 Flow 11 RF Power

2 Cl2 Flow 12 RF Impedance

3 RF Bottom Power 13 TCP Tuner

4 RF Bottom Rf1 Power 14 TCP Phase Error

5 Endpoint A detector 15 TCP Impedance

6 Helium Pressure 16 TCP Top Power

7 Chamber Pressure 17 TCP Rf1 Power

8 RF Tuner 18 TCP Load

9 RF Load 19 Vat Value

10 RF Phase Error

將從半導體蝕刻製程的資料集中選取資料,在 129 筆正常資料和異常資料中,將三

維度的資料轉為二維度,目標變數為正常和異常二元分類,129 筆正常資料和異常資料

中包含了 12705 筆資料中,正常樣本為 10666 筆,異常為 2039 筆,因此先透過 SMOTE

將正常樣本減少至 6353 筆,異常樣本提升至 6352 筆,之後隨機選取 50%筆資料中做為

訓練資料,其餘 50%筆資料中做為測試資料,並進行分類,本研究為了增加準確性和說

服力,並透過連續重複抽樣 100 次資料後,並利用各種機器學習與深度學習計算出 100

次平均之 True Positive、False Positive 以及 AUC。

Page 12: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

三、隨機森林

本研究第 3.3 節提到之 RF 模型進行分類預測,圖 6 為 RF 之 ROC 圖。

圖 6 RF 之 ROC 圖

透過迭代 100 次資料後,並計算出 100 次之 True Positive、False Positive 以及 AUC。

如表 6 所示:

表 6 100 次之 True Positive、False Positive 以及 AUC

Page 13: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

四、多層感知器

本研究採用第 3.4 節提到之 MLP,圖 7 為 MLP 之 ROC 曲線。

圖 7. MLP 之 ROC 曲線

透過迭代 100 次資料後,並計算出 100 次之 True Positive、False Positive 以及 AUC。

如表 7 所示:

表 7. 100 次之 True Positive、False Positive 以及 AUC

Page 14: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

表 8 各分類方法之 FPR、TPR、AUC 之比較(平均數和標準差)

Measure

Method FPR (%) TPR (%) AUC (%)

RF 1.34(0.179) 97.69(0.680) 99.38(0.195)

MLP 1.62(0.220) 99.38(0.430) 99.61(0.228)

五、集成學習方法

由表 8 可看出多層感知器在 TPR 表現上較為優異,隨機森林在 FPR 表現上較為優

異,因此本研究建立一種多層感知器與隨機森林之集成方法進行分類預測,首先將資料

隨機抽取 50%為訓練資料分別進行多層感知器和隨機森林分類預測,最後將兩種演算法

在權重上設定各為一半(W1=0.5、W2=0.5)算出預測值,再將 50%為測試資料與多層感知

器與隨機森林組合模型進行衡量指標,並計算出本研究使用之 AUC、TPR、FPR,圖 8

為 Ensemble 之 ROC 曲線。

圖 8 Ensemble 之 ROC 曲線

透過迭代 100 次資料後,並計算出 100 次之 True Positive、False Positive 以及 AUC。

如表 9 所示:

表 9 100 次之 True Positive、False Positive 以及 AUC

Page 15: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

最後集成方法做分類預測得到的 TPR、FPR、AUC 與表 8 去進行比較。最後於表 10

將本研究之集成方法與 Moyne et al.(2017)提到的 TPR、FPR、AUC 去做比較,亦顯示多

層感知器與隨機森林組合模型在評判標準皆優於其他方法。

表 10 預測結果之 TP、FP、AUC 比較

Method/Rate FP (%) TP (%) AUC (%)

Whole Trace Stats 15 65 87.69

Manual Windowing 12 85 95.19

Semi-automated FD 8 95 98.46

RF 1.34(0.179) 97.69(0.680) 99.38(0.195)

MLP 1.62(0.220) 99.38(0.430) 99.61(0.228)

Ensemble (MLP-RF) 1.35(0.200) 99.43(0.335) 99.79(0.101)

Page 16: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

伍、結論

在上一章節中,各種機器學習和深度學習方法在半導體蝕刻製程異常檢測與分類中

就分別得到了不錯的結果。本研究集成學習方法(多層感知器與隨機森林模型)之 TPR、

FPR、AUC 值分別為 99.43%(0.335%)、1.35%(0.2%)、99.79%(0.101%)。與 Moyne et al.(2017)

提到的 TPR、FPR、AUC 做比較,分別為 Whole Trace Stats、Manual Windowing、Semi-

automated FD 之 TPR:65%、85%、95%、FPR:15%、12%、8%、AUC:87.69%、95.19%、

98.46%。

本研究透過集成學習方法(多層感知器與機器學習分類方法)提升了 TPR、降低了

FPR 與提升 AUC,TPR 為實際是正常的,機器判斷為異常的,會增加人事成本,FPR 為

實際是異常的,機器判斷為正常的,會使得生產成本、報廢品、重工成本增加,以避免

浪費後續生產的成本,且本數據正常的遠多於異常,使用準確度為本研究之衡量指標沒

有公信力,所以使用 AUC 作為一個重要衡量指標。因此未來希望可以收集到更大量更

多元的資料,並利用即時監控方式異常檢測與分類,另外最近深度學習蓬勃發展,尚有

很大的空間與潛力發展。未來亦可結合圖形辨識方法更加貼近真實情況,最後可以在製

程檢驗上更有效率、更有準確度。

最後本研究認為智慧製造、大數據、物聯網、互聯網、工業 4.0 的快速發展皆與工

業工程有關,跨部門的溝通結合各行業之領域專家一同解決問題,並可利用人工智慧方

式來執行與預測分析。

Page 17: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

參考文獻

Eigenvector Research, Inc,1999。網址:https://eigenvector.com/resources/data-sets/。搜尋

時間:2018-08-12

科普雜誌,2017。網址:https://kopu.chat/2017/03/24/ic-terms/。搜尋時間:2019-04-25

產業價值鏈資訊平台,2019。網址:https://ic.tpex.org.tw/introduce.php?ic=D000。搜尋時

間:2019-05-01

An, D., Ko, H. H., Gulambar, T., Kim, J., Baek, J. G., & Kim, S. S. 2009. A semiconductor

yields prediction using stepwise support vector machine. In 2009 IEEE International

Symposium on Assembly and Manufacturing (pp. 130-136).

Breiman, L. 2001. Random forests. Machine Learning, 45(1), 5-32.

Baly, R., & Hajj, H. 2012. Wafer classification using support vector machines. IEEE

Transactions on Semiconductor Manufacturing, 25(3), 373-383.

Chao, J., Di, Y., Moyne, J., Iskandar, J., Hao, H., Schulze, B., Armacost, M., Lee, J., 2018

Extensible framework for pattern recognition-augmented feature extraction (PRAFE) in

robust prognostics and health monitoring. In Preparation for Submission to IEEE Trans.

Semicond. Manuf.

Deng, H. 2013. Guided random forest in the RRF package. arXiv preprint arXiv:1306.0237.

Deng, H., & Runger, G. 2013. Gene selection with guided regularized random forest. Pattern

Recognition, 46(12), 3483-3489.

Gupta, P., Doermann, D., & DeMenthon, D. 2002. Beam search for feature selection in

automatic SVM defect classification. In Object Recognition Supported by User Interaction

for Service Robots (Vol. 2, pp. 212-215).

Hanley, J. A., & McNeil, B. J. 1982. The meaning and use of the area under a receiver operating

characteristic (ROC) curve. Radiology, 143(1), 29-36.

Han, K., Kim, S., Park, K. J., Yoon, E. S., & Chae, H. 2008. Principal component analysis based

support vector machine for the end point detection of the metal etch process. IFAC

Proceedings Volumes, 41(2), 4560-4565.

Kohavi, R. 1998. Glossary of terms. Special issue on applications of machine learning and the

knowledge discovery process, 30(271), 127-132.

Moyne, J., & Iskandar, J. 2017. Big data analytics for smart manufacturing: Case studies in

semiconductor manufacturing. Processes, 5(3), 39.

Puggini, L., Doyle, J., & McLoone, S. 2015. Fault detection using random forest similarity

distance. IFAC-PapersOnLine, 48(21), 583-588.

Rosenblatt, F. 1958. The perceptron: A theory of statistical separability in cognitive systems.

United States Department of Commerce.

Sumsion, G. R., Bradshaw, M. S., Hill, K. T., Pinto, L. D., & Piccolo, S. R. 2018. Remote

sensing tree classification with a multilayer perceptron. PeerJ, 7, e6101.

Uddin, M. T., & Uddiny, M. A. 2015. A guided random forest based feature selection approach

for activity recognition. In 2015 International Conference on Electrical Engineering and

Information Communication Technology (ICEEICT) (pp. 1-6).

Zhang, J., & Zulkernine, M. 2006. Anomaly based network intrusion detection with

unsupervised outlier detection. In 2006 IEEE International Conference on

Communications (Vol. 5, pp. 2388-2393).

Page 18: 集成學習模型於半導體之蝕刻製程晶圓分類研究 · 2019 富邦人壽管理博碩士論文獎 集成學習模型於半導體之蝕刻製程晶圓分類研究 Ensemble

2019 富邦人壽管理博碩士論文獎

Zhao, H., Williams, G. J., & Huang, J. Z. 2017. WSRF: an R package for classification with

scalable weighted subspace random forests. Journal of Statistical Software, 77, 1-30.