베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년...

87
tH $l| t'\, l 0x DP Jae-seong Yoo Introduction of Bayesian Network tH $l tH $l tH $lX \ On My MS Thesis Abstract of My master’s thesis Bayesian Network Structure Learning The Comparison Methodology Simulation Real Datasets Synthetic Data According to Topologies Discussion For Contest at Statistics Korea Abstract of My Paper for Contest ˜¥pExpanded Rhombus 2011D ˜¥pX lp Y pt0 ¤ $ m'X Jt 2 m'X Jt 3 |8X tH $l| t'\, l 0x DP 2011D ˜¥p| \'X Jae-seong Yoo Ph.D Candidate of Software at Korea University September 3, 2015

Upload: jae-seong-yoo

Post on 13-Apr-2017

1.025 views

Category:

Science


1 download

TRANSCRIPT

Page 1: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크를 이용한,가구 실태에 따른 지출 형태 비교 분석

2011년 가계동향조사를 활용하여

Jae-seong Yoo

Ph.D Candidate of Software at Korea University

September 3, 2015

Page 2: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

* 통계청 통계개발원, 제13회 대학원생 논문공모 우수상 수상작

Page 3: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

OutlineIntroduction of Bayesian Network베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한 유형

On My MS ThesisAbstract of My master’s thesisBayesian Network Structure LearningThe Comparison MethodologySimulation

Real DatasetsSynthetic Data According to Topologies

Discussion

For Contest at Statistics KoreaAbstract of My Paper for Contest가계동향조사

Expanded Rhombus2011년 가계동향조사의 구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2지출 항목의 깊이가 3

논문의 결론

Page 4: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크A BN defines a unique joint probability distribution over X given by

PB(X1, · · · ,Xn) =n∏

i=1

PB(Xi |∏Xi

)

I A BN encodes the independence assumptions over the componentrandom variables of X .

I AN edge (j , i) in E represents a direct dependency of Xi from Xj .

I The set of all Bayesian networks with n variables is denotes by Bn.

Figure: P(A, B, C ,D, E) = P(A)P(B|A)P(C |A)P(D|B, C)P(E |D)

Page 5: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

I 베이지안 네트워크(Bayesian Network, 이하 BN)는 확률 값이 모인집합의 결합확률분포의 결정모델이다.

I 특정 분야의 영역지식을 확률적으로 표현하는 수단이다.

I 변수들 간의 확률적 의존 관계를 나타내는 그래프와, 각 변수별조건부 확률로 구성된다.

I 하나의 BN은 각 노드마다 하나의 조건부 확률 표(CPT; ConditionalProbability Table)를 갖는 비순환유향그래프(DAG; DirectedAcyclic Graph)로 정의할 수 있다.

I 노드와 노드를 연결하는 호(arc or edge)는 노드 사이의 관계를나타내며, 변수의 확률적인 인과관계로 네트워크를 구성하고 조건부확률 표(CPT)를 가지고 베이즈 정리를 이용하여 결과를 추론할 수있다.

P(A|B) =P(A,B)

P(B)

Page 6: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: Nodes

Page 7: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: Edges

Page 8: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: Edges = Directed (No Cycles!)

Page 9: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

일반적인 베이지안 네트워크는 베이즈 정리, 곱셈 규칙, 체인 규칙(chainrule)에 의하여 다음과 같은 식이 만들어진다.

P(A,B,C ,D,E) =∏i=1

P(xi |parenti )

I 여기서 x1, · · · , xn은 특정 데이터의 속성 집합I parenti )는 xi의 부모 노드들의 집합

Page 10: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: P(A,B,C ,D,E) =

Page 11: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: P(A,B,C ,D,E) = P(A)

Page 12: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: P(A,B,C ,D,E) = P(A)P(B|A)

Page 13: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: P(A,B,C ,D,E) = P(A)P(B|A)P(C |A)

Page 14: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: P(A,B,C ,D,E) = P(A)P(B|A)P(C |A)P(D|B,C)

Page 15: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크

Figure: P(A,B,C ,D,E) = P(A)P(B|A)P(C |A)P(D|B,C)P(E |D)

Page 16: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

S.L.Lauritzen and D.J.Spiegelhalter (1988)

Figure: 아시아 방문 여부, 흡연 여부와 폐질환과의 관계를 도식화한

베이지안 네트워크 모형

Page 17: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

S.L.Lauritzen and D.J.Spiegelhalter (1988)

Figure: 실제 데이터의 모습과, 이의 베이지안 네트워크 그래프 모형

Page 18: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

S.L.Lauritzen and D.J.Spiegelhalter (1988)Unit Test: 환자 1이 있는데, 그에 대한 정보가 아무것도 없다.P(T = 1),P(L = 1),P(B = 1)

결론: 결핵일 가능성은 약 1%, 폐암일 가능성은 약 5%, 기관지염이 있을

가능성은 약 46%

Page 19: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

S.L.Lauritzen and D.J.Spiegelhalter (1988)Question 1: 환자 2는 최근 아시아를 방문했고, 비흡연자이다.P(T = 1|A = 1, S = 0)

결론: 기관지염이 있을 가능성이 약 34%이다.

Page 20: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

S.L.Lauritzen and D.J.Spiegelhalter (1988)Question 2: 환자 3는 최근 아시아를 방문했고, 비흡연자이다. 호흡곤란도 겪지 않고 있지만, X-Ray 테스트 결과 양성 반응을 보였다.P(T = 1|A = 1, S = 0,D = 0,X = 1)

결론: 환자에게 결핵과 기관지염이 있을 가능성이 각각 약 33%이다.

Page 21: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크의 특징

장점

I 특정 분야의 영역 지식을 확률적으로 표현하는 대표적인 수단

I 변수들 간의 확률적 의존 관계를 나타내는 그래프와 각 변수별

조건부 확률로 구성

I 분류 클래스 노드의 사후 확률분포를 구해줌으로써 개체들에 대한

하나의 자동분류기로 이용 가능

I 샘플이 어떤 부류로 분류되었을 때, 왜 그런 결정이 내려졌는지해석 가능

단점

I 입력 값으로 수치형이 아닌 범주형을 사용

I 노드 수가 방대해지면 시간이 오래 소요될 수 있음

Page 22: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

다른 기법과의 비교 - 로지스틱 회귀분석

장점

I 다변량 분석으로 많이 쓰임

I 다변량 변수를 독립 변수로 하여 종속변수에 미치는 영향을 파악

가능

I 입력값으로 수치형과 범주형 모두 취급 가능

단점

I 샘플이 어떤 부류로 분류되었을 때 왜 그런 결정이 내려졌는지

해석하기가 어려움

I 분석 자료에 가장 적합한 모델을 선정하는 데 시간 투자가 필요

Page 23: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

다른 기법과의 비교 - 신경망

장점

I 분류문제 뿐만 아니라 예측, 평가, 합성, 제어 등의 다양한 분야에적용 가능

I 학습 능력을 갖추고 능력이 뛰어나고 구현이 쉬움

I 다층 퍼셉트론은 선형 분리가 불가능한 경우에도 높은 성능을

보여주는 한 단계 진보한 신경망

단점

I 샘플이 어떤 부류로 분류되었을 때 왜 그런 결정이 내려졌는지

이유를 분석하기가 어려움

I 입력값으로 수치형이 아닌 범주형을 사용

Page 24: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

다른 기법과의 비교 - 의사 결정 트리

장점

I 의사결정규칙을 도표화하여 관심 대상에 해당하는 집단을 몇 개의

소집단으로 분류하거나 예측을 수행하는 계량적 분석 방법

I 샘플이 어떤 부류로 분류되었을 때 왜 그런 결정이 내려졌는지 해석

가능

I 입력값으로 수치형, 범주형 모두 취급 가능

단점

I 반응변수가 수치형인 회귀모형에서는 그 예측력이 떨어짐

I 나무가 너무 깊은 경우에는 예측력이 저하되고, 해석이 쉽지 않음

I 가지가 많을 경우 새로운 자료에 적용할 때 예측 오차가 큼

Page 25: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크의 다양한 유형

I 나이브 베이지안 네트워크 (NBN)

가정의 단순함에도 불구하고 많은 연구를 통해 비교적 높은 분류

성능을 보여준다.

I 일반 베이지안 네트워크 (GBN)

클래스 노드조차 일반 속성 노드와의 차이를 두지 않고, 모든노드들 간의 상호의존도를 하나의 베이지안 네트워크로 표현한다.

I 트리-확장 나이브 베이지안 네트워크(TAN)

속성 노드들 간에도 상호의존도가 존재한다고 가정하고, 이러한속성 간 상호의존도를 하나의 일반 베이지안 네트워크 형태로 표현

가능하도록 NBN을 확장한 것이다.

I 동적 베이지안 네트워크 (DBN)

시계열 분석을 위해 현재 변수의 확률을 계산할 때, 이전 시점의정보를 함께 고려하는 베이지안 네트워크이다.

Page 26: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크의 다양한 유형

Page 27: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

베이지안 네트워크의 다양한 유형

Page 28: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

OutlineIntroduction of Bayesian Network베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한 유형

On My MS ThesisAbstract of My master’s thesisBayesian Network Structure LearningThe Comparison MethodologySimulation

Real DatasetsSynthetic Data According to Topologies

Discussion

For Contest at Statistics KoreaAbstract of My Paper for Contest가계동향조사

Expanded Rhombus2011년 가계동향조사의 구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2지출 항목의 깊이가 3

논문의 결론

Page 29: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Abstract of My master’s thesis

* Jae-seong Yoo, (2015),”A Study on Comparison of Bayesian Network Structure LearningAlgorithm for Selecting Appropriate Model”,M.S. thesis, Department of Statistics, Korea University, Seoul.

I 이 논문에서는, R의 bnlearn에서 제공하는 베이지안 네트워크 구조학습 알고리즘 간의 성능 비교를 시도하였다.

I 아래의 기준으로 알고리즘 간의 성능을 측정할 수 있다.

I 점수I 목표 네트워크와 학습된 네트워크 간의 비교

I 베이지안 네트워크 모형을 이용하여 synthetic data를 생성할 수있는 R 패키지 BNDataGenerator를 만들었다.

I Topology를 바탕으로 synthetic data를 만들어 각 알고리즘을 적합,data dependency를 피하고자 시도하였다.

Page 30: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Bayesian Network Structure LearningGiven a data T = {y1, · · · , yn} and a scoring function φ, the problem aBayesian network is to find a Bayesian network B ∈ Bn that maximizesthe value φ(B,T ).

Figure: A model before learn structure

Page 31: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Bayesian Network Structure Learning

Page 32: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Available Constraint-based Learning Algorithmsusing bnlearn

Grow-Shring (GS) based on Grow-Shrink Markov Blanket, the first(and simplest) Markov blanket detection algorithm usedin a structure learning algorithm.

Incremental Association (IAMB) based on the Markov blanketdetection algorithm of the same name, which is basedon a two-phase selection scheme (a forward selectionfollowed by an attempt to remove false positives).

Page 33: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Available Score-based Learning Algorithms usingbnlearn

Hill-Climbing (HC) a Hill-climbing greedy search on the space of thedirected graphs. The optimized implementation usedscore caching, score decomposability and scoreequivalence to reduce the number of duplicated tests.

Tabu Search (TABU) a modified Hill-climbing able to escape localoptima by selecting a network that minimally decreasesthe score function.

Page 34: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Available Hybrid Learning Algorithms usingbnlearn

Max-Min Hill-Climbing (MMHC) a hybrid algorithm which combinesthe Max-Min Parents and Children algorithm (torestrict the search space) and the Hill-Climbingalgorithm (to find the optimal network structure in therestricted space).

Restricted Maximization (RSMAX2) a more general implementaion ofthe Max-Min Hill-Climbing, which can use anycombination of constraint-based and score-basedalgorithms.

Page 35: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

The Number of Graphical Errors in the LearntScructure

In terms of the number of graphical errors in the learnt structure.

Page 36: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Network Scores

In all four cases, the higher the value of the metric, the better thenetwork.

BDe BDe(B,T ) = P(B,T ) =

P(B)×∏n

i=1

∏qij=1

(Γ(N′

ij )

Γ(Nij+N′ij )×∏ri

k=1

Γ(Nijk+N′ijk )

Γ(N′ijk

)

)φ(B|T ) = LL(B|T )− f (N)|B|,

Log-likelihoood(LL) If f (N) = 0, we have the LL score.

AIC If f (N) = 1, we have the AIC score.

BIC If f (N) = 12, we have the BIC score.

Page 37: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Asia Dataset

Description Small synthetic data set from Lauritzen andSpiegelhalter (1988) about lung diseases (tuberculosis,lung cancer or bronchitis) and visits to Asia.

Number of nodes 8

Number of arcs 8

Number of parameters 18

Source Lauritzen S, Spiegelhalter D (1988).

”Local Computation with Probabilities on GraphicalStructures and their Application to Expert Systems(with discussion)”.

Journal of the Royal Statistical Society: Series B(Statistical Methodology), 50(2), 157-224.

Page 38: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Asia Dataset

Page 39: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Insurance Dataset

Description Insurance is a network for evaluating car insurance risks.

Number of nodes 27

Number of arcs 52

Number of parameters 984

Source Binder J, Koller D, Russell S, Kanazawa K (1997).

”Adaptive Probabilistic Networks with HiddenVariables”.

Machine Learning, 29(2-3), 213-244.

Page 40: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Insurance Dataset

Page 41: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Alarm Dataset

Description The ALARM (”A Logical Alarm ReductionMechanism”) is a Bayesian network designed to providean alarm message system for patient monitoring.

Number of nodes 37

Number of arcs 46

Number of parameters 509

Source Beinlich I, Suermondt HJ, Chavez RM, Cooper GF(1989).

”The ALARM Monitoring System: A Case Study withTwo Probabilistic Inference Techniques for BeliefNetworks.”

In ”Proceedings of the 2nd European Conference onArtificial Intelligence in Medicine”, pp. 247-256.Springer-Verlag.

Page 42: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Alarm Dataset

Page 43: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

HailFinder Dataset

Description Hailfinder is a Bayesian network designed to forecastsevere summer hail in northeastern Colorado.

Number of nodes 56

Number of arcs 66

Number of parameters 2656

Source Abramson B, Brown J, Edwards W, Murphy A, WinklerRL (1996).

”Hailfinder: A Bayesian system for forecasting severeweather”.

International Journal of Forecasting, 12(1), 57-71.

Page 44: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

HailFinder Dataset

Page 45: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary

Page 46: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Varying Topologies and Number of Nodes

Eitel J. M. Lauria (2008)”An Information-Geometric Approach to Learning Bayesian NetworkTopologies from Data”,

Innovations in Bayesian Networks Studies in Computational Intelligence

Volume 156, pp 187-217

Page 47: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Prerequisite

I Cardinality was limited to two.

I The probability value, which is imparted optionally under U(0, 1)distribution.

I All experiments are repeated 100 times, and overall results arereported.

I Constraint-based Learning Algorithms often makes undirectedarcs. So, this has been excluded from comparison.

Page 48: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Collapse

Page 49: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Collapse (Score)

Page 50: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Collapse (Arcs)

Page 51: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary of Collapse

Page 52: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Line

Page 53: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Line (Score)

Page 54: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Line (Arcs)

Page 55: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary of Line

Page 56: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Star

Page 57: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Star (Score)

Page 58: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Star (Arcs)

Page 59: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary of Star

Page 60: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

PseudoLoop

Page 61: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

PseudoLoop (Score)

Page 62: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

PseudoLoop (Arcs)

Page 63: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary of PseudoLoop

Page 64: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Diamond

Page 65: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Diamond (Score)

Page 66: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Diamond (Arcs)

Page 67: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary of Diamond

Page 68: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Rhombus

Page 69: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Rhombus (Score)

Page 70: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Rhombus (Arcs)

Page 71: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Summary of Rhombus

Page 72: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Discussion

I If comparing by score, then TABU search shows goodperformance.

But comparing by ”What C is the lot?”, then HC shows goodperformance.

I Hybrid algorithm is too conservative.

Page 73: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

OutlineIntroduction of Bayesian Network베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한 유형

On My MS ThesisAbstract of My master’s thesisBayesian Network Structure LearningThe Comparison MethodologySimulation

Real DatasetsSynthetic Data According to Topologies

Discussion

For Contest at Statistics KoreaAbstract of My Paper for Contest가계동향조사

Expanded Rhombus2011년 가계동향조사의 구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2지출 항목의 깊이가 3

논문의 결론

Page 74: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Abstract of My Paper for Contest

I 가계동향조사 데이터를 이용하여 ”가구 실태에 따른 지출 형태 비교분석”

여기에서 수집되는 가구실태 관련 항목 32가지와, 지출 관련 항목550가지를 전부 고려하여야 한다.

이를 한꺼번에 고려하면서 분석하는 효과적인 방법으로 베이지안

네트워크 활용을 제안한다.

I 완전 탐색(ecxhaustive search)을 한다면 그만큼 큰 비용을 감수해야하므로, 이를 절약하기 위해 구조 학습 알고리즘을 사용한다.

I 위 분석에 맞는 synthetic model을 만들기 위한 적절한 토폴로지로본 논문에서는 exapnded rhombus 토폴로지를 새롭게 제시한다.

Page 75: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

가계동향조사

가계동향조사는 가구에 대한 수입, 지출 및 가구실태를 파악하여, 국민의소득과 소비 수준 변화 측정 및 분석 등에 필요한 자료를 제공하기 위해

매년 실시됨

목적

I 소비자 물가지수 작성에 필요한 가중치 기초 자료 제공

I 소득분배 수준측정 및 소득분배 개선 정책수립 기초자료 제공

I 국민소득 추계 등 경제/사회통계 작성에 필요한 기초자료 제공

I 주거이전비 산정, 취약계층 지원사업, 근로자 임금기준의 결정 등의기준 제공 등에 활용

Page 76: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

가계동향조사 - 자료 요약

Page 77: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Expanded Rhombus

Figure: 새롭게 제안한 Expanded Rhombus Topology

Page 78: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

Expanded Rhombus

Figure: Expanded Rhombus로부터 생성한 임의 데이터에알고리즘을 적용한 결과 비교 (Sample size = 10,000)

Page 79: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

데이터 전처리 및 모형 설정

I 베이지안 네트워크는 노드의 속성이 연속형일 때, 이를 이산화하는전처리 과정을 거쳐야 한다.

따라서 가계동향조사의 모든 연속형 데이터를 계급 구간을 나누어

그 구간을 하나의 변수로 치환하는 방법으로 이산화하였다.

이 방법은 Sturges’ formula를 이용하였다.

k = p1 + 3.3 log nq

I Synthetic Model은 Expanded Rhombus를 적용하되,

가구 실태에 관한 항목은 설명 변수,

지출 항목은 종속변수이다.

I 자식 노드은 지출 항목은 깊이가 2, 3인 경우를 각각 분석하였다.

Page 80: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 2인 경우

Figure: 임의로 선정한 부모 노드 항목과, 깊이가 2인 지출항목으로 만든 목표 네트워크 모형

Page 81: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 2인 경우

Figure: 임의로 선정한 부모 노드 항목과, 깊이가 2인 지출항목들로 선정하여 학습한 네트워크 모형

Page 82: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 2인 경우

Figure: Hill-Climbing으로 학습된 네트워크 모형의 확률 값

Page 83: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 2인 경우

Figure: Hill-Climbing으로 학습된 네트워크 모형의 확률 값 (cont’d)

Page 84: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 2인 경우

Figure: Hill-Climbing으로 학습된 네트워크 모형의 확률 값 (cont’d)

Page 85: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 2인 경우

Figure: 모든 가구 실태 항목이 부모 노드이고, 자식 노드는 깊이가2인 지출 항목들로 선정한 후, Hill-Climbing 알고리즘으로 학습한네트워크 모형

Page 86: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

지출 항목의 깊이가 3인 경우

Figure: 모든 가구 실태 항목이 부모 노드이고, 자식 노드는 깊이가3인 지출 항목들로 선정한 후, Hill-Climbing 알고리즘으로 학습한네트워크 모형

Page 87: 베이지안 네트워크를 이용한, 가구 실태에 따른 지출 형태 비교 분석: 2011년 가계동향조사를 활용하여

베이지안네트워크를 이용한,가구 실태에 따른지출 형태 비교 분석

Jae-seong Yoo

Introduction ofBayesian Network

베이지안 네트워크

베이지안 네트워크의 장점

베이지안 네트워크의 다양한

유형

On My MS Thesis

Abstract of Mymaster’s thesis

Bayesian NetworkStructure Learning

The ComparisonMethodology

Simulation

Real Datasets

Synthetic DataAccording toTopologies

Discussion

For Contest atStatistics Korea

Abstract of My Paperfor Contest

가계동향조사

Expanded Rhombus

2011년 가계동향조사의구조 학습

데이터 전처리 및 모형 설정

지출 항목의 깊이가 2

지출 항목의 깊이가 3

논문의 결론

논문의 결론

I 이처럼 많은 항목을 한꺼번에 고려하고자 할 때, BN 구조 학습을활용하는 것이 유리하다.

I 특히 BN은 그래프 모형이므로, 학습한 결과를 DAG 그래프로시각화여 항목간의 관계를 보기에도 좋음을 확인할 수 있었다.