linkÖpings universitet - idaannha92/kurser/732g05/lab5.d… · web view(iii.b) skapa en variabel...

5
Lab 5 Tidsserieanalys I denna datorövning skall ni använda Minitab för att 1. bekanta er med data i tidsordning och dess speciella problematik 2. anpassa och tolka klassiska tidsseriemodeller, som tidsserieregression och komponentuppdelning Datamaterial Ni skall i denna datorövning använda ett datamaterial, som innehåller månadsvisa arbetslöshetsdata i Sverige mellan 1987 och 2002. Detta är exempel på en tidsserie av normallängd, som skall kunna innehålla de flesta komponenter, som tas upp i kursen. Ladda ner datamaterialet arblosa_87_02.xls från kurshemsidan. Ni kan (efter nedladdningen) öppna filen direkt i Minitab genom att välja FileOpen Worksheet… och i listan över filformat välja Excel. Klippa och klistra är också ett alternativ. Datamaterialet innehåller fyra kolumner och av rubrikerna bör det framgå vad de innehåller. Uppgifter: Grafisk bedömning: (i) Gör en så kallad tidsserieplot över de relativa arbetslöshetstalen, dvs kolumn C4. (Ni gör detta genom att välja StatTime SeriesTime Series Plot…) Försök att tolka diagrammet och utvecklingen av arbetslösheten under den observerade tidsperioden. (ii) Eftersom vi har har en kraftig uppgång av arbetslösheten i början av serien, blir analysen enklare om ni bara studerar den senare delen av serien (1994-2002). För detta, kopiera innehållet i C1-C4 till kolumnerna C5-C8 och radera åren 1987- 1993. Sätt nya lämpliga namn på dessa kolumner (de gamla kan inte användas eftersom Minitab inte tillåter att två kolumner har samma namn). Gör nu en ny tidsserieplot över relativ arbetslöshet under åren 1994-2002. Vad kan ni säga om säsongsvariation? trenden? 1

Upload: others

Post on 10-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Lab 5TidsserieanalysI denna datorövning skall ni använda Minitab för att

1. bekanta er med data i tidsordning och dess speciella problematik2. anpassa och tolka klassiska tidsseriemodeller, som tidsserieregression och

komponentuppdelning

Datamaterial

Ni skall i denna datorövning använda ett datamaterial, som innehåller månadsvisa arbetslöshetsdata i Sverige mellan 1987 och 2002. Detta är exempel på en tidsserie av normallängd, som skall kunna innehålla de flesta komponenter, som tas upp i kursen.

Ladda ner datamaterialet arblosa_87_02.xls från kurshemsidan. Ni kan (efter nedladdningen) öppna filen direkt i Minitab genom att välja FileOpen Worksheet… och i listan över filformat välja Excel. Klippa och klistra är också ett alternativ. Datamaterialet innehåller fyra kolumner och av rubrikerna bör det framgå vad de innehåller.

Uppgifter:

Grafisk bedömning:(i) Gör en så kallad tidsserieplot över de relativa arbetslöshetstalen, dvs kolumn

C4. (Ni gör detta genom att välja StatTime SeriesTime Series Plot…)Försök att tolka diagrammet och utvecklingen av arbetslösheten under den observerade tidsperioden.

(ii) Eftersom vi har har en kraftig uppgång av arbetslösheten i början av serien, blir analysen enklare om ni bara studerar den senare delen av serien (1994-2002). För detta, kopiera innehållet i C1-C4 till kolumnerna C5-C8 och radera åren 1987-1993. Sätt nya lämpliga namn på dessa kolumner (de gamla kan inte användas eftersom Minitab inte tillåter att två kolumner har samma namn).Gör nu en ny tidsserieplot över relativ arbetslöshet under åren 1994-2002.Vad kan ni säga om

säsongsvariation? trenden? övrig variation?

Tidsserieregression:(iii) Anpassa en modell för tidsserieregression till de relativa arbetslöshetstalen

1994-2002. För detta(iii.a) använd er av säsong-dummyvariabler (kolla anvisningar MINITAB för

regressionsanalys för att se hur man gör; observera också att detta sätt att skapa dummy-variabler fungerar bra bara om man har siffervärden för månaderna, om det istället skulle stå med text: januari, februari osv. så skulle dummy-variablerna vara ordnade efter alfabetet april, augusti,...). Ger kolumnerna lämpliga namn (t.ex. seas1, seas2,... eller januari, februari,...)

(iii.b) skapa en variabel som anger tiden, t.ex en kolumn, som innehåller värdena 1:108. (Det är ju 108 månader som ingår). Ni kan göra detta med Calc ->Make patterned data->Simple set of numbers.

(iii.c)Anpassa nu en regressionsmodell där den relativa arbetslösheten 1994-2002 förklaras av tiden och 11 säsongs-dummyvariabler. Gå även in under Options

1

och välj 'Durbin-Watson statistic'. Gå sedan in under Storage och klicka på 'fits', så att ni få de anpassade värdena på arbetsbladet.

(iv) Svara på följande frågor:1. Finns det en signifikant trend i datamaterialet?2. Är säsongmönstret signifikant och hur testar man det?3. Tolka de skattade säsongparametrarna för maj och juli på lämpligt sätt.4. Finns det någon seriell korrelation i residualerna? Det kan ni avgöra

genom att använda resultatet som ni fick för Durbin-Watson statistics.5. Är anpassningen bra? Använd förklaringsgraden, men notera även s.

(v) Konstuera ett diagram, där både originaldata och anpassade värden finns med.

StatTime SeriesTime Series Plot…) Simple OK Öppna menyn Multiple Graphs… och välj 'Overlay on the same graphs’

Studera graferna. Tycker ni att det anpassade regressionssambandet följer originaldata väl?

Klassisk komponentuppdelning:(vi) Anpassa en klassisk komponentuppdelning (Time series -> Decomposition).

Säsongslängden är ju 12 i vårt fall (12 månader) Välj en multiplikativ modell som innehåller både trend och

säsongskomponenter (trend plus seasonal). Försök tolka alla diagram som ni får upp.

(vii) Med hjälp av bilderna ovan, bedöm om: anpassningen blir bra det räcker med en trend- och en säsongskomponent eller om man borde

ha fler komponenter med i modellen. anpassningen blir bättre än med tidsserieregressionen. Måttet MSD kan

faktiskt jämföras med s ur tidsserieregressionen.

(viii) Om ni tittar på plotten med 'Seasonally Adj. and Detrended Data', så kan ni se det som finns kvar efter att man har tagit bort den linjära trenden och säsongsvariationen. Det finns alltså den cykliska och den oregelbundna komponenten kvar. Bedöm om det finns cyklisk variation i datamaterialet och om det är rimligt att det finns (eller inte finns).

(ix) Studera utskriften ni fick från MINITAB i sessions-fönstret. Hur ser den skattade trendlinjen ut? Vilka är de skattade säsongindexen?

Uppskattning av en cyklisk komponent:(x) Gör om anpassningen (alltså decomposition), men klicka också på Storage

för att spara trendlinjen (Trend line) och säsongskomponenterna (Seasonals).Under Graphs kan ni markera alternativet Do not display plot för att slippa alla plottar.

(xi) För att få trend- och säsongrensade värden skall ni nu dividera kolumnen med originaldata värde för värde med produkten av kolumnerna TREN1 och SEAS1. Det kan enkelt göras i ett kommando:

MTB > let c24=c8/(c22*c23)Om TREN1 och SEAS1 just ligger i kolumnerna C22 resp. C23Ge denna kolumn c24 förslagsvis namnet CLIR1.

2

(xii) Anpassa nu glidande medelvärden (Time series->Moving Average) till värdena i CLIR1 för att separera den cykliska och den oregelbundna komponenten. Använd 3-punkters.

- Spara de glidande medelvärden (Storage) och beräkna den oregelbundna variationen (slumpkomponenten)

irt = (cl ir)t / clt

MTB > let c26=c24/c25Om CLIR1 finns i C24 och de glidande medelvärdena AVER1 i C25

- Beräkna den autokorrelationen genom att konstruera en tidsförskuten variabel

MTB > lag c26 c27och beräkna korrelation mellan denna variabel och originalvariabeln MTB > corr c26 c27

- Notera den beräknade seriella korrelationen och standardavvikelsen.

(xiii) Multiplicera Trendskattningen (TREN1) med Säsongskomponent (SEAS1) och den slutliga skattningen för den cykliska komponenten i c25

(xiv) Plotta den nya kolumnen från (xiii). Det är de anpassade värdena från en modell med trend, säsong och cyklisk komponent. Ni kan göra på samma sätt som ovan för tidsserieregressionen (två plottar och 'overlay' för att få båda serierna in i samma graf) Tycker ni att ni har lyckats bättre med anpassningen här än i tidsserieregressionen?

(xv) Fundera vad som hade hänt om ni hade anpassat den klassiska komponentuppdelningen till hela tidsserien (alltså 1987-2002). Vilken komponent hade varit dominerande? Egentligen skulle man behöva en mer avancerad modell för att hantera en sådan serie. Längre bak i boken står det om interventioner, men vi kommer inte att gå igenom sådana modeller i denna kurs.

Spara arbetsbladet (datamaterialet). Ni behöver det till andra delen av tidsserielabben.

3