testy n á hodnosti

16
Testy n Testy n á á hodnosti hodnosti V analýze časových radov patrí ku dôležitým operáciám testovanie náhodnosti. Môže sa stať, že časový rad nevykazuje pri predbežnej analýze alebo grafickom znázornení výskyt žiadnej systematickej zložky, takže sa zdá, že je tvorený len reziduálnou zložkou. Vtedy je potrebné použiť objektívny štatistický test, ktorý by túto hypotézu potvrdil alebo vyvrátil. Takéto štatistické testy nazývame testy náhodnosti . Používajú sa aj po dekompozícii časových radov, keď musíme overiť, či sme už z časového radu eliminovali skutočne všetky systematické zložky, t. j. či reziduá po dekompozícii sú už len náhodné fluktuácie v tvare bieleho šumu. Vo všetkých testoch sa ako nulová hypotéza H 0 testuje, či pozorovania u 1 , ..., u n realizáciou navzájom nekorelovaných náhodných premenných s rovnakým spojitým rozdelením, ktoré nemusia mať nulovú strednú hodnotu (môže to teda byť biely šum kolísajúci okolo nenulovej úrovne). Pri zamietnutí nulovej hypotézy skúmaný časový rad nepovažujeme za biely šum. Ak však nulovú hypotézu nezamietneme, môžeme spravidla príslušný časový rad považovať za biely šum. Skúmajme teda stochastický proces U 1 , ..., U n s rovnakým spojitým rozdelením, ktorého jednou realizáciou je časový rad u 1 , ..., u n .

Upload: regis

Post on 04-Jan-2016

37 views

Category:

Documents


0 download

DESCRIPTION

Testy n á hodnosti. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Testy n á hodnosti

Testy nTesty nááhodnostihodnosti

V analýze časových radov patrí ku dôležitým operáciám testovanie náhodnosti. Môže sa stať, že časový rad nevykazuje pri predbežnej analýze alebo grafickom znázornení výskyt žiadnej systematickej zložky, takže sa zdá, že je tvorený len reziduálnou zložkou. Vtedy je potrebné použiť objektívny štatistický test, ktorý by túto hypotézu potvrdil alebo vyvrátil. Takéto štatistické testy nazývame testy náhodnosti. Používajú sa aj po dekompozícii časových radov, keď musíme overiť, či sme už z časového radu eliminovali skutočne všetky systematické zložky, t. j. či reziduá po dekompozícii sú už len náhodné fluktuácie v tvare bieleho šumu.

Vo všetkých testoch sa ako nulová hypotéza H0 testuje, či pozorovania

u1, ..., un sú realizáciou navzájom nekorelovaných náhodných premenných

s rovnakým spojitým rozdelením, ktoré nemusia mať nulovú strednú hodnotu (môže to teda byť biely šum kolísajúci okolo nenulovej úrovne). Pri zamietnutí nulovej hypotézy skúmaný časový rad nepovažujeme za biely šum. Ak však nulovú hypotézu nezamietneme, môžeme spravidla príslušný časový rad považovať za biely šum.

Skúmajme teda stochastický proces U1, ..., Un s rovnakým spojitým

rozdelením, ktorého jednou realizáciou je časový rad u1, ..., un.

Page 2: Testy n á hodnosti

Znamienkový testZnamienkový test

Tento test je založený na počte kladných prvých diferencií daného časového radu u1, ..., un, t. j. na počte bodov, v ktorých časový rad

rastie. Ak sú niektoré susedné hodnoty rovnaké, potom ich až na jednu z časového radu vynecháme. Je vhodný na potvrdenie, resp. vyvrátenie hypotézy, že daný časový rad obsahuje lineárny trend (teda systematický posun smerom nahor alebo nadol).

Definujme náhodnú premennú Pt predpisom:

t1t

t1t

uu0

uu1Pt =

Potom počet kladných prírastkov je náhodná premenná:

n

2ttPP =

Page 3: Testy n á hodnosti

Pretože pri platnosti nulovej hypotézy sú pre dve susedné hodnoty ut1 a  ut nerovnosti ut1 < ut a ut1 > ut rovnako pravdepo-dobné, Pt

nadobúda každú z hodnôt 0, 1 s pravdepodobnosťou 0.5 a teda platia rovnosti:

4

1

2

1 tt PD,PE

Zrejme platí:

E(P) = 2

1

2

nPE

n

tt

Ak sú U1, ..., Un nezávislé, potom sú Pt, Pt+k nezávislé pre k > 1. Pre

disperziu náhodnej premennej P teda platí:

12

12

2

1

21

nP,PcovPDPD

n

t

n

tttt

Page 4: Testy n á hodnosti

Wolfowitz odvodil, že P má asymptoticky normálne rozdelenie. Pre

dostatočne veľké n teda hypotézu H0 zamietame na hladine

významnosti , keď pre normovanú náhodnú premennú Z platí:

2/u

12

1n

2

1nP

Z

kde u(/2) je kritická hodnota N(0, 1).

Page 5: Testy n á hodnosti

Príklad:Príklad:

Pomocou znamienkového testu určite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.

1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt

1616151514141313121211111010998877665544332211tt

16

2

8t

tPP E(P) = 7.5 D(P) = 1.42

420421

578.

.

.Z

Pretože pre = 0.05 je u(/2) = 1.96, na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.

1.20.81.30.51.20.90.81.50.61.10.90.51.20.81.6uutt

1616151514141313121211111010998877665544332211tt

1100110011110011001111001100PPtt

Page 6: Testy n á hodnosti

V systéme Mathematica:V systéme Mathematica:

Aby sme zistili, koľkokrát je ut > ut – 1 , t. j. ut - ut – 1 > 0, budeme robiť rozdiely ut – ut - 1. Tieto dostaneme rozdielom dvoch časových radov, kde v prvom odstránime prvý člen a v druhom posledný člen. Potom zistíme znamienka rozdielov funkciou signum:

K = Sign[ Drop[u, 1] - Drop[u,-1] ]

Teraz zistíme, koľkokrát sa vo vektore K nachádza 1, ktorá odpovedá kladnej hodnote rozdielu ut - ut – 1 :

P = Count[ K, 1]

Nakoniec vypočítame strednú hodnotu, smerodajnú odchýlku a testovaciu štatistiku :

= (n – 1)/2; = Sqrt[ (n + 1)/12 ]; Z = Abs [ (P - )/ ]

Page 7: Testy n á hodnosti

TTestest zalo založženenýý na Spearmanovom koeficiente na Spearmanovom koeficiente

Nech q1, ..., qn označujú poradia hodnôt daného časového radu. Spearmanov koeficient poradovej korelácie počítame v tvare:

Pre n > 50 hypotézu H0 zamietame, ak

kde u(/2) je kritická hodnota N(0, 1).

Tento test sa tiež používa na zistenie, či daný časový rad obsahuje lineárny trend (teda systematický posun smerom nahor alebo nadol).

Page 8: Testy n á hodnosti

1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt

1616151514141313121211111010998877665544332211tt

1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt

1313661414221212885515153310109977111111441616qqtt

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Príklad:Príklad:

Pomocou testu Spearmanovho koeficientu určite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.

Pretože pre = 0.05 je u(/2) = 1.96, na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.

= 0. 0735

V systéme V systéme MathematicaMathematica::

q = Transpose[ Sort[ Table[{dáta[[ i ]], i}, {i, n}] ] ] [[2]]

= 1 - 6/(n*(n^2 - 1))*Sum[(i - q[[ i ]])^2, {i, n}]

*Sqrt[n - 1]

Page 9: Testy n á hodnosti

Test kritických hodnôtTest kritických hodnôt

Bod ut nazveme kritickým bodom, ak ut1 ut ut+1 (tzv. horný

kritický bod), resp. ut1 ut ut+1 (tzv. dolný kritický bod). Rovnaké

susedné hodnoty znova až na jednu z časového radu vynecháme. Test kritických hodnôt je vhodný pri podozrení, že v časovom rade sa vyskytujú zmeny periodického charakteru (t. j., že obsahuje sezónnu alebo cyklickú zložku). Definujme náhodnú premennú:

inak0

uuu alebo uuuM tttttt

t11111

Nech M je náhodná premenná, ktorá označuje celkový počet kritických bodov v časovom rade. Potom:

1

2

n

ttMM

Page 10: Testy n á hodnosti

Podrobné odvodenie všetkých vzťahov pre znamienkový test a test kritických hodnôt je v článku Komorník, Komorníková: Testy náhodnosti v analýze časových radov, ktorý vyšiel v zborníku konferencie PRASTAN 2001

Platí:

3

22

3

22

nnME

90

2916

nMD

Page 11: Testy n á hodnosti

Príklad:Príklad:

Pomocou testu kritických hodnôt určite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.

1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt

1616151514141313121211111010998877665544332211tt

15

2

11t

tMM E(M) = 9.33 D(M) = 2.52

051522

33911.

.

.Z

Pretože pre = 0.05 je u(/2) = 1.96 > 1.05, na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.

1.20.81.30.51.20.90.81.50.61.10.90.51.20.81.6uutt

1616151514141313121211111010998877665544332211tt

11111111001111111100111111MMtt

Page 12: Testy n á hodnosti

V systéme Mathematica:V systéme Mathematica:

Aby sme zistili počet kritických bodov, budeme robiť rozdiely

ut + 1 – ut. Tieto dostaneme rozdielom dvoch časových radov, kde v prvom odstránime prvý člen a v druhom posledný člen. Potom zistíme znamienka rozdielov funkciou signum:

K = Sign[ Drop[u, 1] - Drop[u,-1] ]

Teraz zistíme, koľkokrát sa zmenila 1 na –1 a naopak tým, že vynásobíme všetky vedľa seba ležiace hodnoty vo vektore K a potom zistíme počet –1.

M = Count[ Drop[K, 1] * Drop[K, -1], -1]

Page 13: Testy n á hodnosti

Mediánový testMediánový test

Najprv vypočítame výberový medián Me. V grafe časového radu to je priamka rovnobežná s časovou osou, ktorá má tú vlastnosť, že nad ňou aj pod ňou leží rovnaký počet pozorovaní. V ďalšom kroku vylúčime všetky pozorovania, ktoré ležia na tejto priamke (t. j. všetky pozorovania, ktorých hodnota je rovná mediánu). Ostatné pozorovania združíme do skupín tak, že všetky pozorovania v danej skupine ležia buď nad priamkou alebo pod ňou. Označme P počet týchto skupín a m celkový počet pozorovaní pod priamkou (alebo ekvivalentne nad priamkou).

Hypotézu H0 zamietame (pre m > 100), ak

2u1m21mm

1mP

kde u(/2) je kritická hodnota N(0, 1).

Page 14: Testy n á hodnosti

Príklad:Príklad:

Pomocou mediánového testu zistite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.

1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt

1616151514141313121211111010998877665544332211tt

Medián Me (ktorý sme v systéme Mathematica vypočítali príkazom Median[data]) je rovný 1. Na priamke neleží ani jeden bod; pod aj nad priamkou je teda 8 pozorovaní (m = 8).

2 4 6 8 10 12 14 16

0.25

0.5

0.75

1

1.25

1.5

Page 15: Testy n á hodnosti

Počet skupín P = 13. Napriek krátkemu časovému radu použijeme aproximáciu kritickej hodnoty

2 4 6 8 10 12 14 16

0.25

0.5

0.75

1

1.25

1.5

+ - + - - + + - + - - + - + - +

96.1138.018*2188

1813

Na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.

Page 16: Testy n á hodnosti

V systéme V systéme MathematicaMathematica::

Me = Median[data];

m = Length[ Select[data, # < Me& ] ];

s = Select[Table[Which[d[[i]]<Me,-1,d[[i]]>Me,1,True,0],{i,n}], # 0&];

P = Count[ Drop[s, -1] * Drop[s, 1], -1] + 1;

N[ Abs[ P - (m + 1)] / Sqrt[ m* (m - 1)* (2m - 1)] ]

Mediánový test je vhodný pri podozrení, že v časovom rade Mediánový test je vhodný pri podozrení, že v časovom rade sa vyskytujú zmeny sa vyskytujú zmeny periodickéhoperiodického charakteru. charakteru.