testy n á hodnosti
DESCRIPTION
Testy n á hodnosti. - PowerPoint PPT PresentationTRANSCRIPT
Testy nTesty nááhodnostihodnosti
V analýze časových radov patrí ku dôležitým operáciám testovanie náhodnosti. Môže sa stať, že časový rad nevykazuje pri predbežnej analýze alebo grafickom znázornení výskyt žiadnej systematickej zložky, takže sa zdá, že je tvorený len reziduálnou zložkou. Vtedy je potrebné použiť objektívny štatistický test, ktorý by túto hypotézu potvrdil alebo vyvrátil. Takéto štatistické testy nazývame testy náhodnosti. Používajú sa aj po dekompozícii časových radov, keď musíme overiť, či sme už z časového radu eliminovali skutočne všetky systematické zložky, t. j. či reziduá po dekompozícii sú už len náhodné fluktuácie v tvare bieleho šumu.
Vo všetkých testoch sa ako nulová hypotéza H0 testuje, či pozorovania
u1, ..., un sú realizáciou navzájom nekorelovaných náhodných premenných
s rovnakým spojitým rozdelením, ktoré nemusia mať nulovú strednú hodnotu (môže to teda byť biely šum kolísajúci okolo nenulovej úrovne). Pri zamietnutí nulovej hypotézy skúmaný časový rad nepovažujeme za biely šum. Ak však nulovú hypotézu nezamietneme, môžeme spravidla príslušný časový rad považovať za biely šum.
Skúmajme teda stochastický proces U1, ..., Un s rovnakým spojitým
rozdelením, ktorého jednou realizáciou je časový rad u1, ..., un.
Znamienkový testZnamienkový test
Tento test je založený na počte kladných prvých diferencií daného časového radu u1, ..., un, t. j. na počte bodov, v ktorých časový rad
rastie. Ak sú niektoré susedné hodnoty rovnaké, potom ich až na jednu z časového radu vynecháme. Je vhodný na potvrdenie, resp. vyvrátenie hypotézy, že daný časový rad obsahuje lineárny trend (teda systematický posun smerom nahor alebo nadol).
Definujme náhodnú premennú Pt predpisom:
t1t
t1t
uu0
uu1Pt =
Potom počet kladných prírastkov je náhodná premenná:
n
2ttPP =
Pretože pri platnosti nulovej hypotézy sú pre dve susedné hodnoty ut1 a ut nerovnosti ut1 < ut a ut1 > ut rovnako pravdepo-dobné, Pt
nadobúda každú z hodnôt 0, 1 s pravdepodobnosťou 0.5 a teda platia rovnosti:
4
1
2
1 tt PD,PE
Zrejme platí:
E(P) = 2
1
2
nPE
n
tt
Ak sú U1, ..., Un nezávislé, potom sú Pt, Pt+k nezávislé pre k > 1. Pre
disperziu náhodnej premennej P teda platí:
12
12
2
1
21
nP,PcovPDPD
n
t
n
tttt
Wolfowitz odvodil, že P má asymptoticky normálne rozdelenie. Pre
dostatočne veľké n teda hypotézu H0 zamietame na hladine
významnosti , keď pre normovanú náhodnú premennú Z platí:
2/u
12
1n
2
1nP
Z
kde u(/2) je kritická hodnota N(0, 1).
Príklad:Príklad:
Pomocou znamienkového testu určite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.
1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt
1616151514141313121211111010998877665544332211tt
16
2
8t
tPP E(P) = 7.5 D(P) = 1.42
420421
578.
.
.Z
Pretože pre = 0.05 je u(/2) = 1.96, na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.
1.20.81.30.51.20.90.81.50.61.10.90.51.20.81.6uutt
1616151514141313121211111010998877665544332211tt
1100110011110011001111001100PPtt
V systéme Mathematica:V systéme Mathematica:
Aby sme zistili, koľkokrát je ut > ut – 1 , t. j. ut - ut – 1 > 0, budeme robiť rozdiely ut – ut - 1. Tieto dostaneme rozdielom dvoch časových radov, kde v prvom odstránime prvý člen a v druhom posledný člen. Potom zistíme znamienka rozdielov funkciou signum:
K = Sign[ Drop[u, 1] - Drop[u,-1] ]
Teraz zistíme, koľkokrát sa vo vektore K nachádza 1, ktorá odpovedá kladnej hodnote rozdielu ut - ut – 1 :
P = Count[ K, 1]
Nakoniec vypočítame strednú hodnotu, smerodajnú odchýlku a testovaciu štatistiku :
= (n – 1)/2; = Sqrt[ (n + 1)/12 ]; Z = Abs [ (P - )/ ]
TTestest zalo založženenýý na Spearmanovom koeficiente na Spearmanovom koeficiente
Nech q1, ..., qn označujú poradia hodnôt daného časového radu. Spearmanov koeficient poradovej korelácie počítame v tvare:
Pre n > 50 hypotézu H0 zamietame, ak
kde u(/2) je kritická hodnota N(0, 1).
Tento test sa tiež používa na zistenie, či daný časový rad obsahuje lineárny trend (teda systematický posun smerom nahor alebo nadol).
1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt
1616151514141313121211111010998877665544332211tt
1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt
1313661414221212885515153310109977111111441616qqtt
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Príklad:Príklad:
Pomocou testu Spearmanovho koeficientu určite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.
Pretože pre = 0.05 je u(/2) = 1.96, na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.
= 0. 0735
V systéme V systéme MathematicaMathematica::
q = Transpose[ Sort[ Table[{dáta[[ i ]], i}, {i, n}] ] ] [[2]]
= 1 - 6/(n*(n^2 - 1))*Sum[(i - q[[ i ]])^2, {i, n}]
*Sqrt[n - 1]
Test kritických hodnôtTest kritických hodnôt
Bod ut nazveme kritickým bodom, ak ut1 ut ut+1 (tzv. horný
kritický bod), resp. ut1 ut ut+1 (tzv. dolný kritický bod). Rovnaké
susedné hodnoty znova až na jednu z časového radu vynecháme. Test kritických hodnôt je vhodný pri podozrení, že v časovom rade sa vyskytujú zmeny periodického charakteru (t. j., že obsahuje sezónnu alebo cyklickú zložku). Definujme náhodnú premennú:
inak0
uuu alebo uuuM tttttt
t11111
Nech M je náhodná premenná, ktorá označuje celkový počet kritických bodov v časovom rade. Potom:
1
2
n
ttMM
Podrobné odvodenie všetkých vzťahov pre znamienkový test a test kritických hodnôt je v článku Komorník, Komorníková: Testy náhodnosti v analýze časových radov, ktorý vyšiel v zborníku konferencie PRASTAN 2001
Platí:
3
22
3
22
nnME
90
2916
nMD
Príklad:Príklad:
Pomocou testu kritických hodnôt určite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.
1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt
1616151514141313121211111010998877665544332211tt
15
2
11t
tMM E(M) = 9.33 D(M) = 2.52
051522
33911.
.
.Z
Pretože pre = 0.05 je u(/2) = 1.96 > 1.05, na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.
1.20.81.30.51.20.90.81.50.61.10.90.51.20.81.6uutt
1616151514141313121211111010998877665544332211tt
11111111001111111100111111MMtt
V systéme Mathematica:V systéme Mathematica:
Aby sme zistili počet kritických bodov, budeme robiť rozdiely
ut + 1 – ut. Tieto dostaneme rozdielom dvoch časových radov, kde v prvom odstránime prvý člen a v druhom posledný člen. Potom zistíme znamienka rozdielov funkciou signum:
K = Sign[ Drop[u, 1] - Drop[u,-1] ]
Teraz zistíme, koľkokrát sa zmenila 1 na –1 a naopak tým, že vynásobíme všetky vedľa seba ležiace hodnoty vo vektore K a potom zistíme počet –1.
M = Count[ Drop[K, 1] * Drop[K, -1], -1]
Mediánový testMediánový test
Najprv vypočítame výberový medián Me. V grafe časového radu to je priamka rovnobežná s časovou osou, ktorá má tú vlastnosť, že nad ňou aj pod ňou leží rovnaký počet pozorovaní. V ďalšom kroku vylúčime všetky pozorovania, ktoré ležia na tejto priamke (t. j. všetky pozorovania, ktorých hodnota je rovná mediánu). Ostatné pozorovania združíme do skupín tak, že všetky pozorovania v danej skupine ležia buď nad priamkou alebo pod ňou. Označme P počet týchto skupín a m celkový počet pozorovaní pod priamkou (alebo ekvivalentne nad priamkou).
Hypotézu H0 zamietame (pre m > 100), ak
2u1m21mm
1mP
kde u(/2) je kritická hodnota N(0, 1).
Príklad:Príklad:
Pomocou mediánového testu zistite, či môžeme nasledovný časový rad považovať za realizáciu bieleho šumu.
1.20.81.30.51.20.90.81.50.61.11.10.90.51.20.81.6uutt
1616151514141313121211111010998877665544332211tt
Medián Me (ktorý sme v systéme Mathematica vypočítali príkazom Median[data]) je rovný 1. Na priamke neleží ani jeden bod; pod aj nad priamkou je teda 8 pozorovaní (m = 8).
2 4 6 8 10 12 14 16
0.25
0.5
0.75
1
1.25
1.5
Počet skupín P = 13. Napriek krátkemu časovému radu použijeme aproximáciu kritickej hodnoty
2 4 6 8 10 12 14 16
0.25
0.5
0.75
1
1.25
1.5
+ - + - - + + - + - - + - + - +
96.1138.018*2188
1813
Na 5% hladine významnosti nemôžeme zamietnuť H0 časový rad je realizácia navzájom nekorelovaných rovnako rozdelených náhodných premenných.
V systéme V systéme MathematicaMathematica::
Me = Median[data];
m = Length[ Select[data, # < Me& ] ];
s = Select[Table[Which[d[[i]]<Me,-1,d[[i]]>Me,1,True,0],{i,n}], # 0&];
P = Count[ Drop[s, -1] * Drop[s, 1], -1] + 1;
N[ Abs[ P - (m + 1)] / Sqrt[ m* (m - 1)* (2m - 1)] ]
Mediánový test je vhodný pri podozrení, že v časovom rade Mediánový test je vhodný pri podozrení, že v časovom rade sa vyskytujú zmeny sa vyskytujú zmeny periodickéhoperiodického charakteru. charakteru.