produksjonsprosessen: beste praksis for revisjon ved sesongjustering
DESCRIPTION
Beste praksis for revisjon ved sesongjustering - Implementering av delvis løpende korrigering (startet i SSB)TRANSCRIPT
1
Nordisk Statistikermøte Bergen i 14-16. august 2013
Tema 3: produksjonsprosessen
Beste praksis for revisjon ved
sesongjustering
- Implementering av delvis løpende
korrigering (startet i SSB)
Jørn Ivar Hamre ([email protected]),
Seksjon for arbeidsmarkedsstatistikk, SSB
Disposisjon
• Sesongjustering og revisjon
•Modellidentifisering i X-12-ARIMA, før og nå
• ESS anbefalingene for revisjon, og praksis i SSB
• Beste praksis med selvlaget SAS-makro og
standardprogram
• Diskusjon og oppsummering
Sesongjustering, hva og hvordan?
• Fjerne systematisk sesongvariasjon og kalendereffekter
• X12-ARIMA mye brukt; metode:
–Sesongkomponenten filtreres vekk med
glidende sentrerte gjennomsnitt
– Framskrivningsmodeller (ARIMA) for
symmetriske filter (i endene) og kalenderjustering
Revisjon
• Nye observasjoner og evt. reviderte rådata
• Revisjoner forvirrende
• Balansere presisjon og stabilitet
• Revisjon fra sesongjustering pga.
• ny framskrivningsmodell? (marginalt bedre, vipper?) • endret sesong- og/eller trendfilter
Bør framskrivningsmodeller re-identifiseres hver gang eller låses?
Om løpende eller faste valg i EUROSTATs
ESS retningslinjer for sesongjustering
A. Løpende korrigering: Reidentifisering og estimering hver
periode.
B. Fast korrigering: Identifisering og estimering kun årlig.
(Fremskrevne sesong- og kalenderfaktorer anvendes
gjennom året)
C. Delvis løpende korrigering, modeller identifiseres kun
årlig, men re-estimeres hver periode
Kommentarfelt:
A = bør unngås, B= akseptabelt og C = beste alternativ
Identifisering av framskrivningsmodeller
i X-12-ARIMA, før og nå
• Tidligere standard:
Enkleste OK blant få kandidater
• Fom. Versjon 0.3:
Beste blant svært mange
(TRAMO-identifisering i X-12-ARIMA)
• TRAMO-prosedyren endrer modellene oftere
(Langsrud, Notater 71/2012, SSB)
Korrigering og modellidentifisering i SSB
• ESS guiden: Løpernde korrigering frarådes, mens kontrollert fast korrigering akseptabelt.
• Målsetning i SSB om å implementere ESS guiden
• I SSB er også automatisk reidentifisering av ekstremverdier hver periode vanlig praksis (frarådes i ESS guiden)
Beste
(TRAMO
i X-12)
Enkleste
OK
Beste Enkleste
OK
Beste Enkleste
OK
SSB-statistikker med følgende unntak:
X
Pengemengde
(M0, M1 og M2) X
Kreditt-
indikatoren (K2) X
AKU X
Sykefraværs-
statistikkenX
A. Løpende B. Fast C. Delvis løpende
SAS-makro for hardkoding av spesifikasjoner
• Hardkoding tidkrevende
• Fant ingen ferdig program
• Selvlaget SAS-makro
– hardkoder modeller og filterlengder i nye spesifikasjoner
• Utgangspunkt
–Spesifikasjoner med automatiske valg og
–Sesongjustering i forkant gir tagget outputfil
• Håndterer mange filer, enklere årlig revisjon
Standardprogram for delvis løpende korrigering? • DEMETRA+ ferdig i 2012 på oppdrag fra EUROSTAT
• Fleksibelt verktøy for ESS anbefalingene
• Hardkoder mange spesifikasjoner, selv med ulike brukerspesifiserte variable
• Under vises menyen for delvis løpende korrigering, der parametre og
ekstremverdier siste år oppdateres
Oppsummering
• Se modellidentifiseringsprosedyre og type korrigering i
sammenheng (TRAMO + løpende korrigering frarådes)
• Delvis løpende korrigering krever automatiske
prosedyrer
• Ressurskrevende omlegging, mye igjen i SSB
• Standardløsning kanskje best (mer transparent)
Spørsmål?
SAS-makroen kan mailes
Takk for oppmerksomheten
Vedlegg - Sykefraværsstatistikken
Optimale valg via TRAMO-identifisering i
X-12-ARIMA pr. 4. kvartal 2011
g2011k4
serienavn
trans-
formasjon arima-modell
sesong-
filter
trend-
filter
Trend-
konstant
automatisk
identifiserte
endring av arima-
modell ved
løpende korrigering
legemeldt fravær menn log (0 1 1)(0 1 1) s3x5 5 2012K1
legemeldt fravær kvinner log (1 0 1)(0 1 1) s3x3 5 2012K1, 2012K3
avtalte dagsverk menn log (0 1 0)(0 1 1) s3x3 5 2013K1
avtalte dagsverk kvinner log (0 1 1)(0 1 1) s3x3 5 2012K1, 2013K1
egenmeldt fravær menn log (0 1 1)(0 1 1) s3x5 5
egenmeldt fravær kvinner log (0 0 0)(0 1 1) s3x9 5 Const LS2010.2 2012K2
Vedlegg AKU-modellidentifisering
serienavn
sesong-
filter
trend-
filter
trans-
formasjon arima
Trend-
konstant
ledige, 15-24 år s3x5 23 none (0 1 1)(0 1 1)
ledige, totalt s3x5 13 log (2 1 0)
ledige, 25-74 år s3x5 23 none (2 1 0)(1 0 0)
sysselsatte, 15-24 år s3x5 23 none (2 1 0)(0 1 1)
sysselsatte, 25-74 år s3x5 13 log (0 1 3)(1 0 0) const
sysselsatte, totalt s3x5 13 log (0 1 3)(1 0 0)
Utførte ukeverk, 15-24 år s3x5 13 none (0 1 1)(0 1 1)
Utførte ukeverk, menn 25-74 år s3x5 23 none (0 1 1)(0 1 1)
Utførte ukeverk, kvinner 25-74 år s3x5 23 none (0 1 1)(0 1 1)
Utførte ukeverk, totalt s3x5 23 none (0 1 1)(0 1 1)
AKU-kjøring med "TRAMO"-identifisering
automdl{maxorder=(3, ) maxdiff=(1 1) mixed=no} på data tom. 2013M3
3 ekstra ARIMA-modeller for AKU pga.
rotasjonsplanen (med intervju hver 3. måned)
Ons_lfs.mdl:
(0 1 1)(0 1 1) *
(0 1 2)(0 1 1) X
(2 1 0)(0 1 1) X
(0 2 2)(0 1 1) X
(0,1,[1,3])(0,1,1) X
(0,1,3)(0,1,1) X
(2 1 2)(0 1 1) X
(0,1,1)1(0,0,1)3(0,1,1)12
AKU-kjøring med pickmdl{file=ons_lfs.mdl method=first} på data tom. 2013M3
serienavn
sesong-
filter
trend-
filter
trans-
formasjon arima
ledige, 15-24 år s3x9 23 none (0,1,1)1(0,0,1)3(0,1,1)12
ledige, totalt s3x5 13 log (0 1 1)(0 1 1)
ledige, 25-74 år s3x5 13 none (2 1 0)(0 1 1)
sysselsatte, 15-24 år s3x9 23 none (0 1 2)(0 1 1)
sysselsatte, 25-74 år s3x5 13 log (0,1,3)(0,1,1)
sysselsatte, totalt s3x5 13 log (0 2 2)(0 1 1)
Utførte ukeverk, 15-24 år s3x5 13 none (0 1 1)(0 1 1)
Utførte ukeverk, menn 25-74 år s3x5 23 none (0 1 1)(0 1 1)
Utførte ukeverk, kvinner 25-74 år s3x5 23 none (0 1 1)(0 1 1)
Utførte ukeverk, totalt s3x5 23 none (0 1 1)(0 1 1)
Kjøring med pickmdl{file=ons_lfs.mdl method=best} på data tom. 2013M3
serienavn
sesong-
filter
trend-
filter
trans-
formasjon arima
ledige, 15-24 år s3x9 23 none (0,1,1)1(0,0,1)3(0,1,1)12
ledige, totalt s3x5 13 log (0 1 1)(0 1 1)
ledige, 25-74 år s3x5 13 none (2 1 0)(0 1 1)
sysselsatte, 15-24 år s3x5 23 none (0,1,1)1(0,0,1)3(0,1,1)12
sysselsatte, 25-74 år s3x5 13 log (2 1 2)(0 1 1)
sysselsatte, totalt s3x5 13 log (0,1,[1,3])(0,1,1)
Utførte ukeverk, 15-24 år s3x5 13 none (2 1 0)(0 1 1)
Utførte ukeverk, menn 25-74 år s3x5 23 none (0,1,3)(0,1,1)
Utførte ukeverk, kvinner 25-74 år s3x5 23 none (0,1,[1,3])(0,1,1)
Utførte ukeverk, totalt s3x5 23 none (0,1,[1,3])(0,1,1)