chapter 5. x-11 - hannam universitywolfpack.hannam.ac.kr/lecture/ets/ets ch5 x11.pdf ·...

16
Chapter 5. X-11 123 Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring 이번 강의노트는 박유성/허명회 , 시계열자료분석 참고하였음. 정부통계에서 가장 많이 쓰이는 계절 조정 기법인 X-11 ARMA 방법이다. 1967미국 센서스국에서 개발한 X-11(이것은 이동 평균법, moving average기반으로 하여 초기, 지막 개를 사용할 없는 약점)기초로 한다. 1975캐나다 통계국은 이를 보완하여 ARMA 방법으로 과거치, 미래치를 추정하여 용한 X-11-ARMA 방법을 제안하였다. X-11-ARMA 방법은 이동계절변동 기법과 유사하다. 차이가 있다면 다음과 같다. } { t Y 구성요소로서 I C S T , , , 이외에 거래일 인자(trading day factor, t TD )추가되 었다. white noise 과정의 가정을 위배하는 불규칙 변동( t I )조정한다. ⑶단순이동평균법이 아니라 중복이동평균법을 사용한다. ) ( t t t t C T or C T + 추정을 위해 Henderson 가중이동평균법(weighted moving average)사용한다. ⑸이동 평균을 적용함으로써 발생하는 결측치에 의한 정보의 손실 방지를 위하여 계절 ARMA 모형을 이용한다. ⑹분해 기법을 3반복 적용하여 최종적으로 추세순환변동( ) ( t t t t C T or C T + ), 계절변동 ( t S ), 불규칙변동, 거래일 인자( t TD ) 구한다. 5.1 시계열 분해기법 시계열 자료는 주기(cycle), 추세(trend), 계절변동(seasonality), 그리고 불규칙성 (irregularity)으로 구성되어 있다. t t t t t I S T C Y + + + = 절에서는 시계열 자료를 분해 (decomposition)하는 기법에 대해 다루기로 한다. 추세, 주기, 불규칙성은 시간에 의존하지 않는 상수 효과가 있고, 계절 효과는 시간에 의존하여 느리게 변동하거나 상수일 유용 시계열 예측방법이다. Chapter 5. X-11

Upload: others

Post on 11-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 123

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

이번 강의노트는 박유성/허명회 저, 시계열자료분석 참고하였음.

정부통계에서 가장 많이 쓰이는 계절 조정 기법인 X-11 ARMA 방법이다. 1967년 미국

센서스국에서 개발한 X-11(이것은 이동 평균법, moving average을 기반으로 하여 초기, 마

지막 몇 개를 사용할 수 없는 약점)을 기초로 한다.

1975년 캐나다 통계국은 이를 보완하여 ARMA 방법으로 과거치, 미래치를 추정하여 사

용한 X-11-ARMA 방법을 제안하였다. X-11-ARMA 방법은 이동계절변동 기법과 유사하다.

차이가 있다면 다음과 같다.

⑴ }{ tY 의 구성요소로서 ICST ,,, 이외에 거래일 인자(trading day factor, tTD )가 추가되

었다.

⑵white noise 과정의 가정을 위배하는 불규칙 변동( tI )을 조정한다.

⑶단순이동평균법이 아니라 중복이동평균법을 사용한다.

⑷ ) ( tttt CTorCT + 추정을 위해 Henderson 가중이동평균법(weighted moving average)을

사용한다.

⑸이동 평균을 적용함으로써 발생하는 결측치에 의한 정보의 손실 방지를 위하여 계절

형 ARMA 모형을 이용한다.

⑹분해 기법을 3번 반복 적용하여 최종적으로 추세순환변동( ) ( tttt CTorCT + ), 계절변동

( tS ), 불규칙변동, 거래일 인자( tTD ) 구한다.

5.1 시계열 분해기법

시계열 자료는 주기(cycle), 추세(trend), 계절변동(seasonality), 그리고 불규칙성(irregularity)으로 구성되어 있다. ttttt ISTCY +++= 이 절에서는 시계열 자료를 분해

(decomposition)하는 기법에 대해 다루기로 한다. 추세, 주기, 불규칙성은 시간에 의존하지

않는 상수 효과가 있고, 계절 효과는 시간에 의존하여 느리게 변동하거나 상수일 때 유용

한 시계열 예측방법이다.

Chapter 5. X-11

Page 2: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 124

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

5.1.1 상수계절변동

아이스크림 판매량, 음료 판매량, 강수량처럼 계절 효과가 규칙적일 때 이를 상수계절변

동이라 한다. 상수계절변동에는 주기의 진폭이 일정한 경우와 달라지는 경우가 있다.

승법분해(multiplicative decomposition) 모형

계절변동이 규칙적이면서 주기의 폭이 커지거나 작아지는 경우 적합한 모형으로

ttttt ISCTY ×××=

(1) d 개항 이동평균법 ( d -term moving average)

d 가 홀수일 때 사용되는 이동평균으로 2/)1( −= dm 로 정의하고 d 개항 이동평균이다.

dYYYY

MA mttmtmtdt

+−−− +++++=

......1,

3개항 이동 평균을 구해보자.

3.159,3.152,133 3,43,33,2 === MAMAMA

(2)중심화된 d 개항 이동평균법 (centered d -term moving average)

d 가 짝수일 때 사용되는 이동평균으로 d 개항 이동평균이다.

2

//2/

)12/(

2/

)12/(1

,

∑∑−−=

+−−=

−+ +=

d

djjt

d

djjt

dt

dYdYCMA

Page 3: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 125

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

12개항 이동 평균을 구해보자.

04.273,96.269 12,812,7 == MAMAC

음료의 시간도표(앞 페이지)를 보면 계절성은 일정하나 주기의 폭은 증가하고 있음을 알 수 있다. 그러므로 ttttt ISCTY ×××= 모형을 고려할 수 있다. 먼저 tt CT × 추정치를 구하기 위하여 중심화된 12개항 이동평균을 시계열 자료 }{ tY 에 적용한다. 12,tCMA 는 계절

변동과 단기변동요인이 제거된 시계열 자료이다 (왜냐하면 1개년 평균이므로). 그러므로

12,tCMA 는 tt CT × 의 추정치이다. 즉 12,

^

ttt CMACT =×

tt

ttt CT

YIS

×=× 이므로 tt IS × 의 추정치는

12,t

t

CMAY

이다. 계절 요인 tS 을 구하기 위하

여 월별로 tt IS × 의 평균을 먼저 구하자. 이것이 12가 되도록 하여(이를 표준화라 한다)

이를 추정치로 한다. tt

itt

t ISIS

S ×××

=∑=

12

1

12ˆ 이다. 좀 더 정확하게 tT 을 추정하기 위하여

원 시계열 tY 에서 계절변동 tS 제거한 시계열을 t

tt

SY

d ˆ= 라 하자.

td 가 시간에 따라 증가하므로 tt etd ++= 10 ββ 에 의해 회귀계수를 추정하고 td 의 추정

치로 tT 으로 사용하자. tTt 71.572.227ˆ +=

이제 tt IC × 의 추정치를 구해보자. tt

t

STY

ˆˆ ×가 tt IC × 의 추정치이다. 이제 tC 의 추정치

를 구하기 위하여 tt

t

STY

ˆˆ ×의 3개항 이동평균을 구한다. (월별 자료나 분기별 자료의 경우

3개항 이동평균이면 tI 가 제외된다고 알려져 있다) 이를 tC 로 사용한다.

마지막으로 tI 의 추정치를 구해보자. t

ttt

CIC

I ˆˆ

^

= 이다. 미래 예측치를 구하려면 일반적으

로 1ˆˆ11 == ++ tt IC 로 놓고 구한다. 그러므로

42.216493.0)37*71.572.227(ˆˆˆˆ11371 =+=== +++ ttt STYY

가법분해(additive decomposition) 모형

계정변동이 상수이면서 시간에 의존하지 않고 주기의 폭이 일정할 경우 사용한다.

ttttt ISCTY +++=

Page 4: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 126

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

① tt CT + 추정치 구하기 위하여 원 시계열 tY 중심화된 d-개항(월별이면 12, 분기별이면

4 사용) 이동평균을 구한다.

② tt IS + 의 추정치로 dtt CMAY ,− 사용한다.

③ tS 의 추정치를 구하기 위하여 dtt CMAY ,− 의 계절별 평균 tS 을 구한 후 그 합이 0이

되도록 하여 추정치를 구한다. 즉 )/(ˆ1∑=

−=d

tttt dSSS

④ }ˆ{ tt SY − 을 구해 이를 종속변수 설명변수를 t로 하여 회귀분석하여 tT 구한다.

⑤ tt IC + 의 추정치는 }ˆˆ{ ttt STY −− 이다. 이 추정치에 3개항 이동평균을 구해 이를 tC의 추정치 tC 로 한다.

⑥마지막으로 ttttt CSTYI ˆˆˆˆ −−−= 구한다.

⑦미래 예측치를 구할 경우 0ˆˆ11 == ++ tt IC 으로 한다.

Page 5: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 127

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

Page 6: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 128

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

5.1.2 이동계절변동일 때 분해 기법

계절 변동이 시간에 의존하여 느리게 움직이는 경우 사용되는 시계열 자료 분해기법이

다. 즉 계절성이 시간에 의존함을 의미한다. 다음은 우리나라 석탄 생산량 데이터이다.

T=1인 경우 1985년 1분기, 2분기,… 이런 식이다. 마지막 데이터는 1991년 4분기 데이터

이다.

계절성이 증가하다가 감소하는 경향이 있으므로 승법모형을 고려하자. 분해 기법은 계절 성분 tS (느리게 변동)만 제외하고는 동일하다.

ttttt ISCTY ×××=

분해 절차를 정리하면 다음과 같다. 먼저 tt IS × 추정치를 구하기 위하여 원 시계열 자료 }{ tY 의 4개항(분기별 자료이므로) 이동평균을 적용하자. 이를 4,tCMA 라 하자. 그러면

tt IS × 의 추정치는 4,/ tt CMAY 가 된다. 1986년 예를 들어보자.

1986년 1분기: 17644, =tCMA , 2분기: 88.17804, =tCMA , 3분기 4.17734, =tCMA

4분기: 25.17624, =tCMA

그러므로 1986년 tt IS × 추정치는

1분기: 2959.11764/2286 = , 2분기: 6379.0 , 3분기: 0.4928, 4분기: 1.6087

Page 7: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 129

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

이제 tS 을 추정하기 위하여 분기별로 tt IS × 모형화를 시도하자. 왜냐하면 tt IS × 가 분

기별로 값이 다르기 때문이다. 분기별로 tt IS × 을 Time(t)의 일차식, 이차식, 혹은 삼차식

으로 추정한다.

2022.019.0903.0 ttIS tt −+=× (1분기), tIS tt 039.077.0 −=× (2분기) 추정할 때는 관계를

왜곡시키는 관측치는 제외하는 것이 좋다.이를 이용하여 1992년 1분기, 2분기 tt IS × 예측

치를 구하면 다음과 같다.

1분기: 0154.1)8(*022.0)8(*19.0903.0 288 =−+=× IS

2분기: 458.0)8(*039.077.088 =−=× IS

연도별 추정치의 합이 4(분기별 자료이므로)가 되도록 표준화시켜 표준화 계수로 사용한

다. 1992년 표준화 계수는 0049.1)465.1042.1458.00154.1/4 =+++ 이므로 1992년 tS 의 추

정치는

1분기: 0204.1)0049.1(*0154.1 = , 2분기: 46.0)10049(*458.0 =

이제 경향 tT 의 추정치를 구해보자. 원 시계열 tt SY ˆ/ 는 계절효과가 제거된 시계열 자료

이다. 이것을 시간 T에 함수로 추정해 보자. 일차식, 이차식, ,,,

2865.2078.7053.1411ˆ tTt −+= 이것을 추정치로 사용한다.

이제 tt IC × 의 추정치를 구해보자. (이전과 동일) tt

t

STY

ˆˆ ×가 tt IC × 의 추정치이다. 이제

tC 의 추정치를 구하기 위하여 tt

t

STY

ˆˆ ×의 3개항 이동평균을 구한다. (월별 자료나 분기별

자료의 경우 3개항 이동평균이면 tI 가 제외된다고 알려져 있다) 이를 tC 로 사용한다.

마지막으로 tI 의 추정치를 구해보자. t

ttt

CIC

I ˆˆ

^

= 이다. 미래 예측치를 구하려면 일반적으

로 1ˆˆ11 == ++ tt IC 로 놓고 구한다.

Page 8: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 130

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

5.2 X-11 ARMA

X-11 ARMA에 사용되는 이동평균법을 먼저 살펴보자.

(1)중심화된 d 개항 이동평균과 가중이동평균

중심화된 d개항 이동평균은 페이지 81과 동일하다. 가중이동평균은 5개항, 7개항 가중이

동평균이 X-11에 사용된다. 5개항 이동평균은 3x3 이동평균, 7개항 이동평균은 3x5 이동평

균이라고도 한다. 3x3 이동평균은 3개항의 이동평균을 취한 후 다시 이값에 대하여 이동평

균을 취한다. 3x5 이동평균은 3개항 이동평균을 취한 후 5개항 이동평균을 구한 것이다.

(2)핸더슨의 가중이동평균

핸더슨의 가중이동평균은 추세순환변동을 구하기 위하여 사용되는 가중이동평균법으로

이동계절변동 변화율(Moving Seasonality Ratio: MSR= SI / )에 따라 이동평균을 선택하는 방법이다. MSR=0~0.99 9개항 이동평균, MSR=1~3.49 13개항 이동평균, MSR=3.5 23개

항 이동평균을 사용한다.

(3)MSR에 의한 가중이동평균

계절변동을 구하기 위하여 사용되는 이동평균으로 MSR에 의해 가중이동평균의 항 수를

선택하고(MSR=0~1.49, 3개항 이동평균, MSR=1.5~2.49 5개항 가중이동평균, MSR=2.5~

6.99 7개항 가중이동평균, MSR=7이상 n개항 이동평균)

5.2.1 X-11 예제

X-11 ARMA 고려하는 모형은 승법, 가법 모형이 있다. (선택은 계절성의 진폭 변화 혹은

고정) 사전조정인자와 거래일 인자(가능하다면)를 구해 시계열을 조정한 후 조정된 시계열

자료에 ARMA 모형을 적용하여 1기 전후 시계열을 추정한다. 추정된 시계열과 조정된 시계열을 합쳐 이를 원 시계열( tO )이라 한다.

다음은 SAS/ETS에 있는 예제 프로그램이다.

Page 9: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 131

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

성분 추정 예제 프로그램 (분기별 데이터)

Page 10: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 132

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

Page 11: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 133

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

성분 추정 예제 프로그램 (월별 데이터)

Page 12: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 134

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

Page 13: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 135

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

Page 14: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 136

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

A :prior adjustments (optional)

B: preliminary estimates of irregular component weights and regression trading-day factors

C: final estimates of irregular component weights and regression trading-day factors

D: final estimates of seasonal, trend cycle, and irregular components

E: analytical tables

F: summary measures

G: charts

Table Description Notes

A1 original series M

A2 prior monthly adjustment factors M

A3 original series adjusted for prior monthly factors M

A4 prior trading-day adjustments M

A5 prior adjusted or original series M

A13 ARIMA forecasts

A14 ARIMA backcasts

A15 prior adjusted or original series extended by arima backcasts, forecasts

B1 prior adjusted or original series

B2 trend cycle

B3 unmodified seasonal-irregular (S-I) ratios

B4 replacement values for extreme S-I ratios

B5 seasonal factors

B6 seasonally adjusted series

Page 15: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 137

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

B7 trend cycle

B8 unmodified S-I ratios

B9 replacement values for extreme S-I ratios

B10 seasonal factors

B11 seasonally adjusted series

B13 irregular series

B14 extreme irregular values excluded from trading-day regression M

B15 preliminary trading-day regression M,P

B16 trading-day adjustment factors M

B17 preliminary weights for irregular components

B18 trading-day factors derived from combined daily weights M

B19 original series adjusted for trading-day and prior variation M

C1 original series modified by preliminary weights and adjusted for trading-day and prior variation

C2 trend cycle

C4 modified S-I ratios

C5 seasonal factors

C6 seasonally adjusted series

C7 trend cycle

C9 modified S-I ratios

C10 seasonal factors

C11 seasonally adjusted series

C13 irregular series

C14 extreme irregular values excluded from trading-day regression M

C15 final trading-day regression M,P

C16 final trading-day adjustment factors derived from regression coefficients M

C17 final weight for irregular components

C18 final trading-day factors derived from combined daily weights M

C19 original series adjusted for trading-day and prior variation M

D1 original series modified for final weights and adjusted for trading-day and prior variation

D2 trend cycle

D4 modified S-I ratios

Page 16: Chapter 5. X-11 - Hannam Universitywolfpack.hannam.ac.kr/lecture/ETS/ETS Ch5 X11.pdf · 2011-07-31 · 료 }{Yt 의 4개항(분기별 자료이므로) 이동평균을 적용하자

Chapter 5. X-11 ▼ 138

Prof. Sehyug Kwon, Dept. of Statistics, HANNAM University http://wolfpack.hannam.ac.kr @2007 Spring

D5 seasonal factors

D6 seasonally adjusted series

D7 trend cycle

D8 final unmodified S-I ratios

D9 final replacement values for extreme S-I ratios

D10 final seasonal factors

D11 final seasonally adjusted series

D12 final trend cycle

D13 final irregular series

E1 original series with outliers replaced

E2 modified seasonally adjusted series

E3 modified irregular series

E4 ratios of annual totals P

E5 percent changes in original series

E6 percent changes in final seasonally adjusted series

F1 MCD moving average

F2 summary measures P

G1 chart of final seasonally adjusted series and trend cycle P

G2 chart of S-I ratios with extremes, S-I ratios without extremes, and final seasonal factors

P

G3 chart of S-I ratios with extremes, S-I ratios without extremes, and final seasonal factors in calendar order

P

G4 chart of final irregular and final modified irregular series P