deepdocclassiﬁer: document classiﬁcation with deep convolutional...

DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional Neural Network \ : t` April 26, 2018 1/9

Upload: others

Post on 17-Jun-2020

4 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

DeepDocClassifier: Document Classificationwith Deep Convolutional Neural Network

발표자 :이상엽

April 26, 2018

1/9

Page 2: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

2/9

목표및특징

I 구조기반문서분류

I 기존방법보다더넓은범위를더정확히분류하기

I AlexNet의영향을많이받음

Page 3: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

3/9

사용한자료: Tobacco dataset

I 10종류(Ad, Email, Form, Letter, Memo, News, Note,Report, Resume, Scientific), 3482개의문서이미지

I 담배회사를둘러싼소송에서사용된자료

Page 4: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

4/9

전처리

I 해상도를 227×227로통일I 모든이미지에서 ImageNet데이터의평균을뺐음I 가중치의초기값은 ImageNet데이터로미리학습시킨모형에서가져옴(마지막단계제외)

I AlexNet을거의그대로I 데이터를늘릴때 PCA로 RGB값을상쇄시킨방법은쓰지않음I bias의초기값으로 1대신 0.1을이용

Page 5: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

5/9

구조

단계 필터크기 필터수 maxpoolconv 1 & pool 1 11×11×3(4) 96 3×3(2)conv 2 & pool 2 5×5×48 256 3×3(2)conv 3 3×3×256 384conv 4 3×3×192 384conv 5 & pool 3 3×3×192 256 3×3(2)

I 각 pooling에앞서정규화시행, fc 6, 7에서 dropout(0.5)사용I 모든 conv, fc단계에서활성함수로 ReLU사용

Page 6: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

5/9

구조

Page 7: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

6/9

모수및초모수

I 배치크기가 10인 SGDI 학습률은 0.0001,모멘텀은 0.9, weight decay는 0.0005로고정

I 가중치의초기값은 ImageNet데이터로미리학습시킨값을이용함(마지막단계제외)

Page 8: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

7/9

학습과정

I 학습및검증에는각문서종류당최소 20개,최대 100개의자료를사용

I 각종류당 80%는학습, 20%는검증에이용I 학습및검증에사용되는자료개수를임의로변화시켜 100회의학습을시행

Page 9: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

8/9

결과

각문서종류당 100개를학습및검증에이용했을때

Page 10: DeepDocClassiﬁer: Document Classiﬁcation with Deep Convolutional …stat.snu.ac.kr/idea/seminar/20180426/deepdoc.pdf · 2018-04-27 · DeepDocClassiﬁer: Document Classiﬁcation

9/9

결과

[2] Le Kang. Jayant Kumar, P eng Y e, Yi Li, and David Doermann, "Convolutional Neural Networks for DocumentImage Classification," in ICPR, 2014.[7] S. Chen, Y. He, J. Sun, and S. Naoi, "Structured document classification by matching local salient features," inICPR, Nov 2012, pp. 653-656.

Classiﬁcation en présence d’outliers (données aberrantes ... · outliers 15.6% 15.8%68.6% Qualité de classiﬁcation équivalente qu’avec 3 classes F. Langrognet Rmixmod

Classiﬁcation of some groups of order pqr Adam Burley

Classiﬁcation of Partial Differential Equations and ... · Classiﬁcation of Partial Differential Equations and Canonical Forms A. Salih DepartmentofAerospaceEngineering IndianInstituteofSpaceScienceandTechnology,Thiruvananthapuram

Classiﬁcation faiblement supervisée : arbre de décision

PubTeX output 2000.01.25:0901 - psc.ky.gov · ACL (Account Classification) Identifies the marketing classification of business accounts. ... number to number to indicate that the

solation thermique à température ambiante. Classiﬁcation des isolants

ANNUAL REPORT 2017 DEPARTMENT OF LABOUR INSPECTION ...file/Annual_Report_2017.pdf · z:\annual report\etisiaekthesi\2017\english\20180426-etisiaekthesi2017_final.docx annual report

Classiﬁcation des moyens de production d'énergie

27 ??.?.61 ????????????????? ?.??? ?? 2561 20180426 · 2.2 ส่วนเนื้อความ 17 2.2.1 บทที่1 บทนํา 17 2.2.2 บทที่2 ทบทวนวรรณกรรม

Machine Learning, Neural and Statistical Classiﬁcation

บริษัท อมตะ คอร์ปอเรชัน จ ากัด (มหาชน) วันอังคารที่24 ...amata.listedcompany.com/misc/presentation/20180426... ·

Détection et classiﬁcation One-Class de défauts sur des