empirijski raspored opaŽanja · 2020. 3. 17. · testiranje hipoteza teorija grešaka geodetskih...
TRANSCRIPT
TESTIRANJE HIPOTEZA
Teorija grešaka geodetskih merenja
Prof. dr Branko Božić, dipl.geod.inž.
Građevinski fakultet – Odsek za geodeziju i geoinformatiku
Verzija 01.02.2019
SADRŽAJ
• GRUBA GREŠKA (OUTLIER)
• OSNOVNI POJMOVI O TESTIRANJU HIPOTEZA
• TESTIRANJE HIPOTEZE O PRIPADNOSTIPOJEDINOG ELEMENATA OSNOVNOM SKUPU
• TESTIRANJE HIPOTEZE O SREDNJOJ VREDNOSTI POPULACIJE
• TESTIRANJE HIPOTEZE O VARIJANSI POPULACIJE
• TESTIRANJE HIPOTEZE O KOLIČNIKU DVE VARIJANSE ISTE POPULACIJE
• TESTIRANJE HIPOTEZA O HOMOGENOSTI SERIJA MERENJA
• TESTIRANJE HIPOTEZA O SAGLASNOSTI RASPOREDA SA PRETPOSTAVLJENIM RASPOREDOM
GRUBE GREŠKE U REZULTATIMA
MERENJA (OUTLIERS)
Opšta ideja:
1. Pretpostavka o vrsti raspodele
2. Sračunati parametre raspodele kojoj dati
uzorak pripada (ili su poznati)
3. Gruba greška je podatak sa malom
verovatnoćom pripadnosti datom uzorku
(npr. Odstupаnje u odnosu na srednju
vrednost vеće od 3 puta)
Osnovna pretpostavka:
1. Normalna raspodela
2. Značajno odstupanje u odnosu na
pretpostavljenu vrednost saglasno raspodeli
Moguće prisustvo grubih
grešaka
Podaci merenja
Prognozirane
granične
vrednosti merenja
Očekivane
vrednosti merenja
OSNOVNI POJMOVI O TESTIRANJU
HIPOTEZA
Nulta hipoteza
Alternativna hipoteza
Test statistika
Ho: E(x) =
Ha: E(x) >
n
x
x
n
i
i 1
Reon odbacivanja nulte hipoteze
ODLUKA, TIP GREŠKE I MOĆ TESTA
Mogućnosti Stvarno stanje
HO istinitoHO nije
istinito
Odluka
Odbacivananje
HO
Tip I Ispravna
odluka II
Ne odbacivanje
HO
Ispravna
odluka ITip II
Tip I – pogrešno odbacivanje
nulte hipoteze sa
verovatnoćom
Ispravna odluka I – ne
odbacivanje HO kada je ona
istinita, p = 1 -
Tip II –– pogrešno odbacivanje
HA kada je ona istinita, p =
Ispravna odluka II – ne
odbacivanje HA kada je ona
istinita, p = 1 -
Faktori od uticaja na moć testa:
1. i su u inverznom medjusobnom odnosu
2. Veće N = bolja moć testa
1
2
3
4
TESTIRANJE HIPOTEZA O PRIPADNOSTI
POJEDINOG ELEMENATA OSNOVNOM SKUPU
• Međukvartalni raspon
• Modifikovani Tomsonov Tau test
• Standardizacijom merenja – Z količnik
• Kriterijum Čebiševa
• Test raspona
• Test količnika varijansi
• Kriterijum Šuvenea
• Diksonov test
MEĐUKVARTALNI RASPON
• Nenumerička metoda
• Gruba greška = izvan intervala
• Konstanta k = 1.5 (Tukey predlog)
PRIMER:
12.4
12.712.8
12.913
13.5
13.717
12.78 Q1
12.95 Q2
13.55 Q3
0.78 IQR
1.50 k
11.61 Q1-k x IQR
14.71 Q3+k x IQR
17 > 14.71
ODLUKA:
Ho: U rezultatima merenja nema grubih grešaka
Ha: Rezultat merenja x=17 ne pripada datom skupu
Odbacuje se Ho, x=17 ne pripada
datom skupu, za k=1.5, p=99.3%
gde je i
MODIFIKOVANI TOMSONOV TAU TEST
• Sračunati test statistiku
𝛿 =𝑥𝑚𝑎𝑥−𝑥𝑠𝑟
𝑠
• Odluka: Ukoliko je 𝛿 > 𝑇, xmax ne
pripada datom skupu
• Odbacuje se testirani rezultat i
postupak se ponavlja sa sledećim
sumljivim rezultatom
• Proces se ponavlja do
zadovoljenja kriterijuma 𝛿 ≤ 𝑇
𝑻 =𝒏 − 𝟏 𝒕/𝟐
𝒏 𝒏 − 𝟐 + 𝒕/𝟐𝟐
Kritična
vrednost
studentove
raspodele za
n-2 stepeni
slobode i α/2
PRIMER:
X
12.4
12.6
12.7
12.9
13.1
15.3
Sumnjiv rezultat
𝛿 = 1.99
s=1.07
= 0.05
t/2 = 2.78, dvostrano
T = 1.66
𝛿 T
Zaključak: Odbacuje
se rezultat 15.3
STANDARDIZACIJA MERENJA – Z SCORE
• Normalna raspodela
• Parametarska metoda
• Transformacija
promenljive (scaling)
• Zα/2 iz tablica normalne
raspodele
E(Z) N(0,1)
Ho: E(Zi) = 0
Ha: E(Zi) ≠ 0
1 (68.2 %)
2
3
α/2
KRITERIJUM (TEOREMA) ČEBIŠEVA
• Kriterijum Čebiševa definiše interval raspodele vrednosti rezultata merenja (unutar k x od srednje vrednosti).
• 𝑃( 𝑋 − 𝜇 ≤ 𝑘𝜎) ≥ (1 −1
𝑘2)
• Npr. za k=2, dobija se ¾ ili 75% interval poverenja, ukoliko uzorak pripada populaciji normalne raspodele
• 𝑃( 𝑋 − 𝜇 ≥ 𝑘𝜎) ≤1
𝑘2 govori da se
najmanje 25% rezultata (za k =2) može naći izvan intervala dvostruke vrednosti standardnog odstupanja
k1 −
1
𝑘2 100 × (1 −1
𝑘2)
2 0.75 75 %
3 0.89 89 %
4 0.94 94 %
4.472 0.95 95 %
5 0.96 96 %
10 0.99 99 %
Neka je srednja vrednost promenljive neke
raspodele jednaka 50, a standardno odstupanje 5.
a) Kolika je verovatnoća da će slučajna
promenljiva biti između 40 i 60 ?
ODGOVOR: k = 2, ... 75%
b) Kolika je verovatnoća da će slučajna
promenljiva biti između 42.5 i 57.5 ?
ODGOVOR: k = 1.5, ... 56 %
TEST RASPONA
ww
G
1)www(PGn
6n
Primenjuje se za
3, 4, 5, 6, 7, 7, 8, 9, 9, 10, 11, 17 14317 nw
6.185.2229.5ˆ99.0 wwG
5.2ˆ
Raspon uzorka
Dozvoljen rasponOdgovarajući kvantil
raspodele raspona za zadati
nivo značajnosti
PRIMER:
Standardno odstupanje
raspona
Uzorak rezultata merenja
Novo značajnosti
ww
Wn
n
Standardizovani raspon merenja
Standardno odstupanje raspona merenja 𝜎= σ𝑥 2
TEST KOLIČNIKA VARIJANSI
2
2
2
1
s
sF
Ocena varijanse uzorka sa fn-1 = f1 stepeni slobode
Ocena varijanse uzoraka bez i-tog (simnjivog) rezultata sa fn-2 = f2 stepeni slobode
21 ,, ffFF Reon odbacivanja nulte hipoteze
Kvantil Fišerovog rasporeda za nivo značajnosti i broj stepeni slobode f1 i f2
H0: varijanse dva seta podataka su bliske, tj. razlika koja postoji između njih nije statistički značajna
F ˂ Fcr Ho: prihvata se
F ˃ Fcr Ho: odbacuje se
RB Merenja
1 12.3
2 12.4
3 12.6
4 12.8
5 12.9
6 15.1
PRIMER
s1 = 1.04
s2 = 0.25
F = 4.1
25.64,5,05.0 F
Excel funkcija F.INV(0.95,5,4)
REŠENJE:
ODLUKA: Prihvata se Ho
KRITERIJUM ŠUVENEA
Primenjuje se pri malom uzorku
Odstupanja sumnjivog rezultata od srednje vrednosti
n xi
1 6.45 -0.08 0.0064
2 6.62 +0.09 0.0081
3 6.47 -0.06 0.0036
4 6.57 +0.04 0.0016
5 6.62 +0.09 0.0081
6 6.50 -0.03 0.0009
7 6.71 +0.18 0.0324
8 6.43 -0.10 0.0100
9 6.58 +0.05 0.0025
10 6.49 -0.04 0.0016
11 6.60 +0-07 0.0049
12 6.50 -0.03 0.0009
13 6.56 +0.03 0.0009
14 6.48 -0.05 0.0025
91.58 0.0844
xxi 2
xxi
Primer
54614
5891.
.x
0806013
08440.
.s
123208060
180..
.
. Odbacuje se sumnjiv rezultat i
postupak se ponavlja sve dok se
ne isključe svi rezultati koji
odskaču
DIKSONOV Q TEST
Nxxx ...
21
1
12
xx
xxQ
N
1
1
xx
xxQ
N
NN
N(CL:90%)
(CL:95%) (CL:99%)
3 0.941 0.970 0.994
4 0.765 0.829 0.926
5 0.642 0.710 0.821
6 0.560 0.625 0.740
7 0.507 0.568 0.680
8 0.468 0.526 0.634
9 0.437 0.493 0.598
10 0.412 0.466 0.568
critQ crit
Q critQ PRIMER: 13.1
13.6
14.7
14.9
14.9
17.9
Qexp = (13.6 – 13.1)/(17.1 – 13.1) = 0.104
Qexp = (17.9 – 14.9)/(17.9 – 13.1) = 0.625
Primenjuje se na malim
uzorcima od 3 do 7
elemenata.
Q ˂ Qcr H0: prihvata se
Q ˃ Qcr H0: odbacuje se
UZORKOVANJE I RASPODELA
FREKVENCIJA
• Populacija od 20
elemenata
• 10 uzoraka po
četiri elementa
• sr iz populacije
iznosi 0.46
• sr iz uzoraka od
0.62 do 1.60
10.1
11.2
11.4
11.6
12.3
12.5
12.8
13.1
13.2
13.4
13.5
13.7
14.1
14.5
15.2
15.6
16.1
16.7
17.1
17.2
mi 13.77
sigma 2.04
N= 20
sigma sr 0.46
10.1 10.4 11.4 11.6 11.6 12.6 12.8 12.3 13.2 11.6
15.6 11.2 12.8 12.3 12.8 13.2 13.4 13.1 14.1 13.7
16.7 12.3 14.5 13.7 13.4 15.2 13.7 14.1 16.1 15.6
16.9 14.1 15.6 17.1 15.6 16.1 16.1 15.2 16.7 17.2
14.83 12.00 13.58 13.68 13.35 14.28 14.00 13.68 15.03 14.53
3.20 1.60 1.85 2.44 1.68 1.65 1.45 1.26 1.65 2.42
1.60 0.80 0.93 1.22 0.84 0.82 0.72 0.63 0.82 1.21
• Oceniti da li je
ocena srednje
vrednosti iz uzorka
saglasna ili da li
pripada populaciji
za koju smo
pretpostavili da
pripada
• A) Poznato
• B) Nepoznato
TESTIRANJE HIPOTEZE O SREDNJOJ
VREDNOSTI POPULACIJE - poznato
Nulta hipoteza može biti: jednostrana i dvostrana.
x:H0 Nulta hipoteza
n
xz
Test statistika
Tri slučaja:
x:H0
x:Ha
z
n
xzP1
Одлука: Ukoliko je zz odbacije se nulta hipoteza
2 x:H0
x:Ha
z
n
xzP Одлука: Ukoliko je
z z odbacije se nulta hipoteza
3 x:H0
x:Ha
1z
n
xzP 2/2/ Одлука: Ukoliko je / 2
z z
ili / 2z z
odbacije se
nulta hipoteza
x:Ha Alternativna hipoteza
OCENA SAGLASNOSTI SREDNJE VREDNOSTI
UZORKA SA OČEKIVANOM – poznato • Generisan je uzorak od N= 20
merenja koji pripada populaciji sa =3
=2 i = 0.45
• Iz uzorka xsr = 2.66
• Oceniti saglasnost ocene srednje
vrednosti uzorka sa očekivanom
vrednošću, za α=0.05
• Test hipoteze:
• Test statistika = - 0.76
• Odluka:
• Ukoliko je Z ≤ -1.96 ili Z ≥ 1.96,
odbacuje se HO
• Ukoliko je Z > -1.96 and Z < 1.96, ne
odbacuje se HO
1.01
4.11
0.10
0.89
2.09
2.83
5.93
3.52
4.08
3.48
0.74
-0.52
5.43
4.44
5.58
3.48
2.96
2.94
0.33
-0.17
Ho xsr = Nema značajnih uticaja
HA xsr Uticaj je značajan
Dvostrani test
Kvantil normalne
raspodele za α=0.05
(dvostrani)
OCENA SAGLASNOSTI SREDNJE VREDNOSTI
UZORKA SA OČEKIVANOM – nepoznato
• Umesto nepoznate
koristi se njena ocena iz
uzorka
𝑠2 =σ(𝑥 − ҧ𝑥)2
𝑛 − 1
𝑠 ҧ𝑥 =𝑠
𝑛
• Umesto Normalne koristi
se Studentova raspodela
s = 1.73sxsr= 0.48
= 0
= - 1.45
1. Očekivana vrednost parametra = 02. Uzorak je formiran kao slučajan
3. Pretpostavlja se da uzorak pripada
populaciji čija je raspodela normalna
Pretpostavke:
Donošenje odluke:
Odluka
Ho xsr = Nema značajnih uticaja
HA xsr Uticaj je značajan
Za t ≤ -2.17 ili t ≥ 2.17, odbacuje se HO.
Za t > -2.17 i t < 2.17, ne odbacuje se HO
0.56
-1.8
-1.53
-0.53
1.61
-4.87
-1.53
-1.15
0.23
-1.31
-1.03
1.74
0.55
=CONFIDENCE.T(0.05,A15,13) 1.046576=
=T.INV.2T(0.05,12) = 2.178813 x 0.48 = 1.046576- 2.17 2.17
X = - 0.697
- 0.697 – 1.05 < < - 0.697 + 1.05
– 1.75 < < 0.35
Kvantil studentove
raspodele za α=0.05
I f=12 stepeni
slobode (dvostrani)
p = 95%
OCENA SAGLASNOSTI SREDNJIH VREDNOSTI DVA
UZORKA ISTE POPULACIJE- nepoznato
ns
xt
Umesto , koristi se njena ocena s, odnosno z i z/2 zamenjuju se sa t i t /2 ,
gde je f = n-1 broj stepeni slobode
Za n > 30, t se zamenjuje sa z koji se uzima iz tablica normalnog rasporeda
Pretpostavimo dva međusobno nezavisna uzorka nejednakih dimenzija n1 i n2
normalne raspodele sa očekivanjima 1 i 2
Nulta hipoteza : 210 :H
Alternativne hipoteze: 21
21
21
2
2
21
2
1
21
nn
xxz
Test statistika – poznato
Test statistika – nepoznato
2121
2
22
2
11
21
n
1
n
1
2nn
s)1n(s)1n(
xxt
Reoni odbacivanja isti kao pri poznatom
)2nn(f 21
Broj stepeni slobode
Testiranje na saglasnost varijansi i srednjih
vrednosti dva uzorka - Excel
Uzorak 1 Uzorak 2
12.4 11.2
13.1 13.1
13.5 14.2
13.8 14.7
14.1 15.1
15.3 15.2
16.1 15.6
16.6 15.7
F-Test Two-Sample for Variances
Variable 1 Variable 2
Mean 14.3625 14.35
Variance 2.21125 2.328571
Observations 8 8
df 7 7
F 0.949617
P(F<=f) one-tail 0.473691
F Critical one-tail 0.264058
F test saglasnosti varijansi dva uzorka
t-Test: Two-Sample Assuming Equal Variances
Variable 1 Variable 2
Mean 14.3625 14.35
Variance 2.21125 2.328571
Observations 8 8
Pooled Variance 2.269910714
Hypothesized Mean Difference 0
df 14
t Stat 0.016593409
P(T<=t) one-tail 0.493497571
t Critical one-tail 1.761310136
P(T<=t) two-tail 0.986995142
t Critical two-tail 2.144786688
Test saglasnosti srednjih vrednosti dva uzorka jednakih varijansi
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Column 1 8 114.9 14.3625 2.21125
Column 2 8 114.8 14.35 2.328571
ANOVA
Source of VariationSS df MS F P-value F crit
Between Groups0.000625 1 0.000625 0.000275 0.986995 4.60011
Within Groups31.77875 14 2.269911
Total 31.77938 15
Test saglasnosti srednjih vrednosti dva uzorka
Data/Data Analysis/
Budući da je α (ili p) vrednost dvostranog
intervala = 2 x 0.47 = 0.94 > 0.05 prihvata
se hipoteza o jednakosti dve varijanse
Dvostrana p
vrednost veća
od 0.05,
prihvata se
nulta hipoteza o
jednakosti dva
uzorka
Dvostrana p
vrednost veća
od 0.05,
prihvata se
nulta hipoteza o
jednakosti dva
uzorka
TESTIRANJE HIPOTEZE O VARIJANSI
POPULACIJE
Koristi se 2 raspodela
TESTIRANJE HIPOTEZE O KOLIČNIKU
DVE VARIJANSE ISTE POPULACIJE
Vrednosti kvantila F и F/2 lociraju granice i /2 intervala F raspodele sa f1 stepeni
slobode u brojiocu i f2 u imeniocu
Kod obostranog testa, broj stepeni slobode brojioca odgovara numerički većoj vrednosti
varijanse uzorka
Koristi se Fišerov raspored
TESTIRANJE HIPOTEZA O
HOMOGENOSTI SERIJA MERENJA
• Testiranje homogenosti serija merenja
primenom Fišerove raspodele
• Testiranje homogenosti serija merenja
primenom Bartletovog testa
• Testiranje homogenosti serija merenja
primenom Levenovog testa
TESTIRANJE HIPOTEZA O
HOMOGENOSTI SERIJA MERENJA –
primenom F statistike
Neka je iz osnovnog skupa izdvojeno j=1,2,..., k uzoraka sa elemenatima121 jnjj
x,...,x,x
j - matematičko očekivanje obeležja X iz uzorka j
- matematičko očekivanje obeležja X iz iz svih uzorka
j - efekat j. tog uzorka
Važi pretpostavka:
k
j
j
1
0
Neka su:
jn
i
ji
j
jx
nx
1
1- Srednja vrednost pojedinog uzorka j
jn
j
jj
n
i
ji
k
j
xnn
xn
x111
11- Srednja vrednost svih uzoraka
k
j
jnn
1
jn
i
k
i
jjji
i,j
k
j
jji
i,j
k
j
jjjj
xnx)xx(B
xnxn)xx(nA
1 1
22
1
2
1
222
- Pomoćne veličine
(nezavisne međusobno)
1. Nulta hipoteza:
0210
k
...:H
2. Alternativna hipoteza:
0ia
:H
k,...,,j 21
- barem jedno
B
A
f
f
kn
/Bk
/A
F
1
2
2
2
1
3. Test statistika:
4. Donošenje odluke (α, f2=n-k, f1=k-1)
,f,fFF
21 Odbacuje H0
- Ukupan broj elemenata
2 raspored
2 raspored
Fišerov
raspored
TESTIRANJE HIPOTEZA O
HOMOGENOSTI SERIJA MERENJA–
ANOVA tabela (Fisherova raspodela)
Nulta hipoteza (jednakost srednjih vrednosti):
43210 :H
Alternativna hipoteza:
jia:H
1. Korak: Odrediti varijanse svakog uzorka
Test procedura:
2. Korak: Oceniti ukupnu varijansu iz varijansi po
uzorcima (unutrašnja varijansa)
4
1
4
1
2
2
1
1
i
i
i
ii
U
)n(
s)n(
s
3. Korak: Oceniti varijansu iz odstupanja između
uzoraka
)k(
)XX(
s i
**
i
I1
4
12
n
i
*
i
*
ii
*
i
XX
XnX
1
4. Korak: Definisanje test statistike
2
2
U
I
s
sF
21 f,f,FF odluka
Odbacuje H0
f2
f1
24072 .sU
633722 .sI
F= 8.28 Alfa = 0.00014
Funkcija FDIST (program Excel)
ODLUKA:?
154573010 .FF ,,.
TESTIRANJE HIPOTEZA O
HOMOGENOSTI SERIJA MERENJA–
Bartletov testBartletov test je osetljiv ukoliko elementi skupova ne pripadaju normalnom rasporedu
1. Nulta hipoteza (jednakost varijansi uzoraka):
22
2
2
10 k...:H
2. Alternativna hipoteza:
22
0 ji:H barem u jednom slučaju
3. Test statistika:
kNn)k(
)sln()n()sln()kN(
k
i i
k
i
iip
1
1
1
13
11
1
1
1
22
2
k
i
inN
1
- Ukupan broj elemenata svih uzorka
221
1i
i
ips)n(
kNs
- Zajednička varijansa celog uzorka
2
is - Varijansa pojedinog uzorka
k - Broj uzoraka
2
1
2
,k
Odluka
Odbacuje se nulta hipoteza
1. 2. 3. ... k
x11 x21 x31 .. .....
x12 x22 x32 ... ...
x13 x23 x33 ...
... ... ...
n1n2 n3
TESTIRANJE HIPOTEZA O
HOMOGENOSTI SERIJA MERENJA–
Levenov test
Levenov test predstavlja alternativu Bartletovom testu i koristi se najčešće u situacijama kada
merenja u uzorcima odstupaju od normalnosti.
2. Alternativna hipoteza:
k...:H
210
1. Nulta hipoteza:
jia:H u najmanje jednom slučaju
3. Test statistika
in
j
iij
k
i
k
i
ii
)zz()k(
)zz(n)kN(
W
1
2
1
1
2
1
iijijyyz
iijijy~yz
'
iijijyyz
iy - Srednja vrednost
iy~
i'y
- Medijana
- 10% zasečena
vrednost i-tog
uzorka
Srednja vrednost iz svih
uzoraka
Srednja vrednost od zij
i-tog uzorka
4. Odluka
kN,k,FW
1
Kritična vrednost
Fišerovog rasporeda
za k-1 i N-k stepeni
slobode i nivo
značajnosti Alfa
Odbacuje H0
TESTIRANJE HIPOTEZA O SAGLASNOSTI
RASPODELE SA PRETPOSTAVLJENOM
RASPODELOM
• Pirsonov Hi-kvadrat test
• Test Jestremskijeva
• Test Kolmogorova
• Test Kolmogorov- Smirnova
TESTIRANJE HIPOTEZA O SAGLASNOSTI
RASPODELE SA PRETPOSTAVLJENOM
RASPODELOM – Pirsonov test
nl,...,l,l
21 - Skup događaja slučajne promenljive X
'''
nf,...,f,f
21- Eksperimentalne frekvencije događaja
n,f,...,f,f
21- Teorijske frekvencije događaja
n
i i
i
'
n
n
'''
f
)ff(
f
)ff(...
f
)ff(
f
)ff(in
1
22
2
2
2
1
2
12 21 2
n
i i
'
i nf
f
1
2
2
n
i
n
i
i
' nffi
1 1
Pri velikom broju podataka merenja, radi lakše matematičke obrade podaci se razvrstavaju u grupe (razrede, klase).
Prema Fišeru, broj elemenata u klasi ne bi trebao biti manji od 5.
32 Nn - Optimalan broj klasa
Odluka:
22
,
Odbacuje se tvrdnja o saglasnosti eksperimentalnog
rasporeda sa pretpostavljenim teorijskim rasporedom
1 n - Broj stepeni slobode ukoliko su poznati parametri populacije
mn 1 - Broj stepeni slobode ukoliko nisu poznati parametri populacije
Pirsonov test - primer
Test procedura:
Osnovni skup promenljive ima funkciju raspodele
oblika F0(x;θ1,θ2,...θn) koja zavisi od r nezavisnih
promenljivih θ1,θ2,...θn.
Neka su x1,x2,...xn elementi uzorka koji pripada
osnovnom skupu, dok su a0<a1<…<ak granice intervala
I1, I2,…,Ik, a π1, π2,… πk su verovatnoće da vrednosti
slučajne promenljive X leže u intervalima I1, I2,…,Ik .
k
i i
i
'
n
)nf(i
1
2
2
2 raspodela sa k-1-m stepeni
slobode
2
1
2
,rk
Odluka:
Prihvata se hipoteza H0
Pirsonov test – primer, nastavak
Srednja
vrednost
Standardno
odstupanje
Granica
intervala
n =615
TESTIRANJE HIPOTEZA O SAGLASNOSTI
RASPODELE SA PRETPOSTAVLJENOM
RASPODELOM –Test Jestremskijeva
n
i
i
Npq
vJ
1
2
- Statistika Jestremskijeva
i
'
iiffv - Razlike eksperimentalnih i teorijskih frekvencija
n - Broj grupa
N - Ukupan broj elemenata iz svih grupa
p - Teorijska verovatnoća pojedine grupe
pq 1
nJI
Ukoliko
0 Značajna saglasnost sa
teorijskim rasporedom
Maksimalno dozvoljeno odstupanje:
4222 .nImax
Test Jestremskijeva - primer
n fi fi pi qi vi =fi-fi vi2 Npq v2/Npq
1 11 7.1 0.0157 0.9843 3.9 15.21 7.1 2.1
2 4 8.5 0.0186 0.9814 - 4.5 20.25 8.3 2.4
3 11 15.5 0.0338 ... ... ... 14.9 1.4
4 18 25.2 0.0551 23.8 2.2
5 28 36.9 0.0806 ... ...
6 51 48.4 0.1059
7 67 56.9 0.1246
8 65 60.1 0.1315
9 68 56.9 0.1246
10 44 48.4 0.1059
11 33 36.9 0.0806
12 30 25.2 0.0567
13 12 15.5 0.0338
14 8 8.5 0.0186
15 7 7.0 0.0000 1.0000 -0.0 0.01 0.00
457 457.0 1.0000 0.0000 - - 18.3
Pri merenju 457 uglova dobijeni rezultati su razvrstani u 15 klasa, zajedno sa eksperimentalnim frekfencijama njihove
pojave i teorijskim frekvencijama. Testirati date vrednosti na saglasnost sa očekivanim (normalnim) rasporedom.
J = 18.3
I = 18.3 – 15 = 3.3
Imax= 11.4
I < Imax
TESTIRANJE HIPOTEZA O SAGLASNOSTI
RASPODELE SA PRETPOSTAVLJENOM
RASPODELOM –Test Kolmogorova
nx,...,x,x
21 uzorak od n elemenata čija funkcija rasporeda glasi:
xxза,
xxxза,n
k
xxза,
)x(F
n
kkn
1
0
1
1
i koju treba uporediti sa teorijskom )x(F0
Neka je k broj elemenata manjih od vrednosti iz skupa x1,x2,...,xn
Funkcijan
k)x(F
n predstavlja novu slučajnu promenljivu
)x(F)x(FmaxDnn 0
- predstavlja meru odstupanja eksperimentalne od teorijske raspodele – parametar Kolmogorova
Nulta hipoteza: )x(F)x(F:H00
Alternativna hipoteza: )x(F)x(F:Ha 0
)dD(p
,nn
Odluka: Kvantil funkcije rasporeda koji se uzima iz tablica Kolmogorova
Za 100n
PRIMER 4.6.6.3-1
Test Kolmogorova - primer
TESTIRANJE HIPOTEZA O SAGLASNOSTI
RASPODELE SA PRETPOSTAVLJENOM
RASPODELOM –Test Kolmogorov-Smirnova
)x(G)x(F:H 0
Nulta hipoteza:
Dve funkcije raspodele
Alternativna hipoteza:
)x(G)x(F:Ha
Test statistiuka:
)x(G)x(FmaxDnmn,m
Odluka:
,n,mn,mdD
Kritične vrednosti određuju se iz tablica
Kolmogorov-Smirnova
nm
nmk
Tablice Kolmogorov-Smirnova