zadatak. 2 x ;x ;:::;xn 1 2 x4.5. testovi o parametru o•cekivanja na osnovi velikih uzoraka ovdje...
TRANSCRIPT
-
Zadatak. (χ2-test) Neka je X1, X2, . . . , Xn slučajniuzorak za X s normalnom populacijskom distribuci-jom N(µ, σ2) (oba parametra su nepoznata).Pokažite da je test omjera vjerodostojnosti za testi-ranje nul-hipoteze H0: σ
2 = σ20 u odnosu na
(a) jednostranu alternativu H1: σ2 < σ20;
(b) jednostranu alternativu H1: σ2 > σ20;
(c) dvostranu alternativu H1: σ2 6= σ20,
dan testnom statistikom
V =(n− 1)S2n
σ20.
1
-
Za sva tri navedena slučajeva odredite kritična po-
dručja u odnosu na testnu statistiku.
(σ20 > 0 je zadani broj)
2
-
4.5. Testovi o parametru očekivanja na osnovi
velikih uzoraka
Ovdje ne pretpostavljamo da X ima normalnu dis-
tribuciju (u populaciji), ali pretpostavljamo da je va-
rijanca σ2 = Var[X] konačna.
Konstrukcija testa se bazira na asimptotskoj nor-
malnosti od X za uzorke velike duljine (posljedica
CGT-a).
3
-
Primjer 4.5. (primjer 3.15)
Zanima nas postotak p · 100% pušača u populaciji18-godǐsnjih Britanaca. Na slučajan način odabran
je uzorak duljine n = 7383 iz te populacije. U uzorku
je bilo p̂ · 100% = 32.8% pušača.
Uz razinu značajnosti od 5% testirajte
H0 : p = 0.30H1 : p 6= 0.30.
4
-
X = Bernoullijeva varijabla koja indicira pušača
E[X] = p, Var[X] = p(1− p)Procjenitelj za p: relativna frekvencija pušača u uzorku,
p̂ = X
⇒ Testna statistika:
Z =p̂− 0.30√0.30 · 0.70 ·
√7383
5
-
Kritično područje (dvostrani test!):
ZH0≈ N(0,1) ⇒ P(|Z| ≥ z0.025) ≈ 0.05
z0.025 = (tablice) = 1.96 pa je kritično područje
〈−∞,−1.96] ∪ [1.96,+∞〉Vrijednost testne statistike Z:
z =0.328− 0.30√
0.21·√
7383 = 5.25 > 1.96.
Dakle, na razini značajnosti od 5% odbacujemo pret-
postavku da u populaciji 18-godǐsnjih Britanaca ima
30% pušača.
6
-
4.6 Usporedba očekivanja dviju normalno dis-
tribuiranih populacija (t-test)
Pretpostavimo da mjerimo (opažamo) isto stat. o-
bilježje X, ali u dvije različite populacije.
Nadalje, pretpostavljamo da
• u obje populacije X je normalno distribuiranavarijabla
• s jednakim (populacijskim) varijancama.
7
-
Neka su:
X1 = vrijednost varijable X na slučajno odabranoj
jedinki iz populacije 1
X2 = vrijednost varijable X na slučajno odabranoj
jedinki iz populacije 2.
Pretpostavke na X ⇒
X1 ∼ N(µ1, σ2), X2 ∼ N(µ2, σ2)
8
-
Neka su:
X11, X12, . . . , X1n1 sl. uzorak za X1 duljine n1X21, X22, . . . , X2n2 sl. uzorak za X2 duljine n2
i ta dva uzorka su (medusobno)nezavisna.
Označimo sa:
X1, S21 i X2, S
22
arit. sredine i uzoračke varijance uzoraka za X1 i X2(redom).
9
-
Želimo testirati (3 slučaja!):
(1) : (2) : (3) :
H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2H1 : µ1 > µ2 H1 : µ1 < µ2 H1 : µ1 6= µ2
10
-
U sva tri slučaja, testna statistika je jednaka:
T =X1 −X2
Sd· 1√
1n1
+ 1n2
H0∼ t(n1 + n2 − 2),
gdje je Sd procjenitelj (zajedničke) standardne devi-
jacije σ na osnovi oba uzorka:
Sd =
√√√√(n1 − 1)S21 + (n2 − 1)S22n1 + n2 − 2
(S2d je nepristrani procjenitelj varijance σ2)
Neka je α zadana razina značajnosti.
11
-
(1): (jednostrani test)
H0 : µ1 = µ2H1 : µ1 > µ2
P(T ≥ tα(n1 + n2 − 2) |H0) = α⇒ kritično područje:
[tα(n1 + n2 − 2),+∞〉
12
-
(2): (jednostrani test)
H0 : µ1 = µ2H1 : µ1 < µ2
P(T ≤ −tα(n1 + n2 − 2) |H0) = α⇒ kritično područje:
〈−∞,−tα(n1 + n2 − 2)]
13
-
(3): (dvostrani test)
H0 : µ1 = µ2H1 : µ1 6= µ2
P(|T | ≥ tα/2(n1 + n2 − 2) |H0) = α⇒ kritično područje:
〈−∞,−tα/2(n1 + n2 − 2)] ∪ [tα/2(n1 + n2 − 2),+∞〉
14
-
Zadatak. Pokažite da je navedeni t-test test omjera
vjerodostojnosti.
15
-
Primjer 4.6. Zanima nas da li nova vrsta prehranestoke značajno utječe na količinu proizvedenog mli-jeka. U tu svrhu na sl. način odabrano je 25 krava,a od njih 25, opet na sl. način odabrano je 13 kravakoje će biti podvrgnute novom režimu prehrane. Os-talih 12 krava hranit će se na uobičajeni (stari) način.Tijekom tri tjedna za svaku kravu mjeri se dnevniprinos mlijeka.
U tablici se za svaku kravu nalaze prosječni dnevniprinosi mlijeka za razdoblje od 3 tjedna.
tretman 44,44,56,46,47,38,58,53,49,35,46,30,41kontrola 35,47,55,29,40,39,32,41,42,57,51,39
16
-
Označimo:X1 = prosječni dnevni prinos mlijeka krave hranjenena novi načinX2 = prosječni dnevni prinos mlijeka krave hranjenena stari način.
Razumno je pretpostaviti da su X1 i X2 normalnodistribuirane s.v. Dodatno pretpostavljamo da su imvarijance jednake.
Želimo uz razinu značajnosti od 5% testirati je linovi način prehrane stoke s aspekta prinosa mlijekabolji od starog načina.
17
-
Neka su µ1 = E[X1] i µ2 = E[X2]. Želimo testirati:
H0 : µ1 ≤ µ2H1 : µ1 > µ2
H0 mijenjamo s jednostavnom hipotezom i testi-
ramo:
H0 : µ1 = µ2H1 : µ1 > µ2
Obzirom na pretpostavke, koristimo jednostrani t-
test.
18
-
Testna statistika:
T =X1 −X2
Sd· 1√
113 +
112
H0∼ t(23)
Kritično područje:
P(T ≥ t0.05(23) |H0) = 0.05 ⇒ [1.714,+∞〉
19
-
x̄1 = 45.15, s21 = 64.0, x̄2 = 42.25, s
22 = 76.4
⇒ sd =√√√√(n1 − 1)s21 + (n2 − 1)s22
n1 + n2 − 2=
=
√12 · 64.0 + 11 · 76.4
23=√
69.9 = 8.63
⇒ t = x̄1 − x̄2sd
1√113 +
112
=
=45.15− 42.25
8.63
√12 · 13
25= 0.84
20
-
Budući da se t = 0.84 ne nalazi u kritičnom po-
dručju, na osnovi opaženog uzorka i razine značajnosti
od 5% ne možemo zaključiti da nova metoda daje u
srednjem veći dnevni prinos milijeka od stare metode
prehrane stoke.
21
-
Primjer 4.8. (Spareni podaci)
Istražuje se da li odredena vrsta lijeka izaziva sma-
njenje krvnog tlaka. Uzorak se sastoji od 15 na
slučajan način odabranih studentica. U trenutku 0
izmjeren im je krvni tlak (X). Zatim su uzimale
redovnu dozu lijeka tijekom 6 mjeseci. Nakon 6
mjeseci ponovo im je izmjeren krvni tlak (Y ).
Da li lijek značajno (uz razinu značajnosti od 5%)
utječe na smanjenje krvnoga tlaka?
22
-
Podaci:
i 1 2 3 4 5 6 7 8xi 70 80 72 76 76 76 72 78yi 68 72 62 70 58 66 68 52
i 9 10 11 12 13 14 15xi 82 64 74 92 74 68 84yi 64 72 74 60 74 72 74
23
-
Pretpostavimo:
X = krvni tlak studentice u t = 0 ∼ N(µ0, σ20)Y = krvni tlak studentice u t = 6 ∼ N(µ6, σ26)
Testiramo:
H0 : µ0 ≤ µ6H1 : µ0 > µ6
H0 mijenjamo s jednostavnom hipotezom i testi-
ramo:
H0 : µ0 = µ6H1 : µ0 > µ6
24
-
Jesu li X i Y nezavisne s.v?
25
-
D := X − Y ∼ N(µ0 − µ6, σ2)Želimo testirati:
H0 : µ0 − µ6 = 0H1 : µ0 − µ6 > 0
što se svodi na t-test za jedan uzorak (poglavlje 4.4).
26
-
Izvedeni podaci:
i 1 2 3 4 5 6 7 8xi 70 80 72 76 76 76 72 78yi 68 72 62 70 58 66 68 52di 2 8 10 6 18 10 4 26
i 9 10 11 12 13 14 15xi 82 64 74 92 74 68 84yi 64 72 74 60 74 72 74di 18 -8 0 32 0 -4 10
27
-
d̄ = 8.8, s = 10.98 ⇒ t = d̄s·√
15 = 3.11
Kritično područje (α = 5%):
[t0.05(14),+∞〉 = [1.761,+∞〉Dakle, odbacujemo H0 u korist H1, tj. istraživani li-
jek značajno smanjuje krvni tlak na razini značajnosti
od 5%.
28
-
4.7 Usporedba varijanci normalno distribuiranih
populacija (F -test)
Ovdje opisujemo test hipoteze o jednakosti popu-
lacijskih varijanci dviju normalno distribuiranih vari-
jabli X1 i X2.
Koristimo iste oznake kao u 4.6 samo što sada pret-
postavljamo da je moguće da su populacijske vari-
jance različite:
σ21 = Var[X1], σ22 = Var[X2].
29
-
Želimo testirati osnovnu hipotezu
H0 : σ21 = σ
22
u odnosu na jednostrane alternative
H1 : σ21 > σ
22 ili H1 : σ
21 < σ
22
ili dvostranu alternativu
H1 : σ21 6= σ22.
30
-
Zadatak. Pokažite da je testna statistika testa om-
jera vjerodostojnosti za navedene hipoteze:
F =S21S22
.
Tada je
FH0∼ F (n1 − 1, n2 − 1).
31
-
Neka je α zadana razina značajnosti.
(1): (jednostrani test)
H0 : σ21 = σ
22
H1 : σ21 > σ
22
P(F ≥ fα(n1 − 1, n2 − 1) |H0) = α⇒ kritično područje:
[fα(n1 − 1, n2 − 1),+∞〉
32
-
(2): (jednostrani test)
H0 : σ21 = σ
22
H1 : σ21 < σ
22
P(F ≤ f1−α(n1 − 1, n2 − 1) |H0) = α⇒ kritično područje:
〈0, f1−α(n1 − 1, n2 − 1)]
33
-
(3): (dvostrani test)
H0 : σ21 = σ
22
H1 : σ21 6= σ22
P(F ≤ f1−α2(n1 − 1, n2 − 1) iliF ≥ fα
2(n1 − 1, n2 − 1) |H0) = α
⇒ kritično područje:
〈0, f1−α2(n1 − 1, n2 − 1)] ∪ [fα2(n1 − 1, n2 − 1),+∞〉
34
-
Vrijednosti fα(m1, m2) su tabelirane.
Vrijedi:
f1−α(m1, m2) =1
fα(m2, m1)
35
-
Primjer 4.8. (nastavak primjera 4.6)
Uz razinu značajnosti od 10% želimo testirati
H0 : σ21 = σ
22
H1 : σ21 6= σ22.
Iz zadanih uzoraka imamo
s21 = 64.0, s22 = 76.4
36
-
Vrijednost testne statistike F = S21/S22 je
f =s21s22
=64.0
76.4= 0.84.
Kritično područje:
〈0, f0.95(12,11)] ∪ [f0.05(12,11),+∞〉
f0.05(12,11) = (tablice) = 2.69
f0.95(12,11) =1
f0.05(11,12)= (tablice) =
1
2.72= 0.37
dakle, kritično područje je:
〈0,0.37] ∪ [2.69,+∞〉.37
-
Budući da f = 0.84 ne pripada kritičnom području,
ne odbacujemo hipotezu da su populacijske varijance
jednake na razini značajnosti od 10%.
38
-
4.8 Usporedba očekivanja na osnovi velikih uzo-
raka. Usporedba proporcija.
Promatramo dvije populacije.
Neka su:X1 s.v., model za prvu populacijuX2 s.v., model za drugu populaciju.
Pretpostavljamo da su populacijske varijance σ21 iσ22 konačne i općenito nepoznate. Želimo testiratihipoteze o nepoznatim parametrima populacijskihsrednjih vrijednosti µ1 i µ2.
39
-
Neka su:
X11, X12, . . . , X1n1 sl. uzorak za X1 duljine n1X21, X22, . . . , X2n2 sl. uzorak za X2 duljine n2
i ta dva uzorka su (medusobno)nezavisna.
Označimo sa:
X1, σ̂21 i X2, σ̂
22
arit. sredine i konzistentne procjenitelje populacijskihvarijanci na osnovi svakog uzorka posebno, za X1 iX2 (redom).
40
-
Želimo testirati (3 slučaja!):
(1) : (2) : (3) :
H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2H1 : µ1 > µ2 H1 : µ1 < µ2 H1 : µ1 6= µ2
41
-
Ako je H0 točna, prema CGT-u vrijedi
Z :=X1 −X2√
σ̂21n1
+σ̂22n2
D−→ N(0,1), min{n1, n2} → +∞.
Z je testna statistika. Kritično područje konstruira
se kao u t-testu, samo što su odgovarajuće kritične
vrijednosti jedinični normalni kvantili.
42
-
Važan primjer je usporedba proporcija.
Promatramo dvije populacije i neko bernoullijevsko
obilježje X.
Označimo sa:
X1 Bernoullijevu s.v. koja reprezentira X u pop.1,
X2 Bernoullijevu s.v. koja reprezentira X u pop.2,
a sa p1, p2 njihove parametre (vjerojatnosti uspjeha).
43
-
Želimo testirati osnovnu hipotezu
H0 : p1 = p2
u odnosu na (uobičajene) jednostrane alternative:
H1 : p1 > p2 ili H1 : p1 < p2
ili dvostranu alternativu
H1 : p1 6= p2.
44
-
Označimo sa p̂1, p̂2 procjenitelje od p1, p2 na os-
novi svakog uzorka posebno (uzorci su medusobno
nezavisni duljina n1 i n2), te sa
p̂ :=n1p̂1 + n2p̂2
n1 + n2
procjenitelj zajedničke vjerojatnosti uspjeha (na bazi
oba uzorka zajedno).
45
-
Testna statistika:
Z =p̂1 − p̂2√p̂(1− p̂)
· 1√1n1
+ 1n2
H0∼ asimptotskiN(0,1)
za velike n1 i n2 (tj., kada min{n1, n2} → ∞)
Kritična područja se odrede kao u slučaju t-testa,
jedino se umjesto tα(m) očitavaju zα vrijednosti iz
tablica za standardnu normalnu razdiobu.
46
-
Primjer 4.9. Želimo usporediti tradicionalnu (T) s
audio-vizualnom (AV) metodom učenja nekog stra-
nog jezika. U tu svrhu na sl. način odabrano je 250
učenika. 100 od njih je na sl. način odredeno da uče
jezik T-metodom, a preostalih 150 AV-metodom.
Na kraju tečaja svih 250 učenika pristupilo je istom
pismenom ispitu.
47
-
Podaci o broju prošlih i palih na ispitu nalazi se u
tablici:
T AV ukupnoprošli 63 107 170pali 37 43 80ukupno 100 150 250
Želimo uz razinu značajnosti od 5% testirati je li
AV-metoda uspješnija od T-metode.
48
-
Neka su:
p1 = omjer učenika koji prolaze ispit u populaciji
učenika koji su učili metodom T
p2 = omjer učenika koji prolaze ispit u populaciji
učenika koji su učili metodom AV.
Testiramo:
H0 : p1 ≥ p2H1 : p1 < p2
, odn.H0 : p1 = p2H1 : p1 < p2
49
-
Testna statistika:
Z =p̂1 − p̂2√p̂(1− p̂)
· 1√1
100 +1
150
Kritično područje: (zbog ZH0≈ N(0,1))
P(Z ≤ −z0.05 |H0) ≈ 0.05 ⇒ 〈−∞,−1.64]
50
-
Procjene:
p̂1 =63
100= 0.63, p̂2 =
107
150= 0.71, p̂ =
170
250= 0.68
Vrijednost testne statistike Z:
z =p̂1 − p̂2√p̂(1− p̂)
· 1√1
100 +1
150
=
=0.63− 0.71√0.68 · 0.32 ·
√150 · 100
250= −1.33
51
-
Budući da se z = −1.33 ne nalazi u kritičnom po-dručju, ne možemo na razini značajnosti od 5% i
opaženog uzorka tvrditi da je AV-metoda uspješnija
od tradicionalne.
52
-
4.9 Jednofaktorska analiza varijance (ANOVA)
Kada želimo usporediti (normalne) razdiobe neke
varijable u vǐse od dvije populacije, tada koristimo
ANOVA-u.
(ANOVA = Analysis of Variance)
(Za usporedbu dviju normalnih populacija koristimo
t-test iz 5.5)
53
-
Neka su
X11, X12, . . . , X1n1 s.u. za X1 ∼ N(µ1, σ2)X21, X22, . . . , X2n2 s.u. za X2 ∼ N(µ2, σ2)... ...Xk1, Xk2, . . . , Xknk s.u. za Xk ∼ N(µk, σ2)
k nezavisnih slučajnih uzoraka, svaki za normalno
distribuirano obilježje X reprezentirano sa X1 u po-
pulaciji 1, sa X2 u populaciji 2, itd., sa Xk u popu-
laciji k.
Uz normalnost svake populacije još pretpostavljamo
da su im populacijske varijance jednake.
54
-
Želimo testirati osnovnu hipotezu
H0 : µ1 = µ2 = . . . = µk
u odnosu na alternativu
H1 : postoje i, j ∈ {1,2, . . . , k} t.d. je µi 6= µj.
55
-
Testnu statistiku izračunamo postupno:
1. Za svaki uzorak posebno izračunamo arit. sredinu
i uzoračku varijancu:
Xi·, S2i·, i = 1,2, . . . , k.
2. Izračuna se n = n1 + · · · + nk i ukupna arit.sredina:
X =1
n
k∑
i=1
ni∑
j=1
Xij =1
n
k∑
i=1
niXi·
56
-
3. Zbroj kvadrata odstupanja srednjih vrijednosti
od ukupne arit. sredine (suma kvadrata zbog tret-
mana):
SST =k∑
i=1
ni(Xi· −X)2
4. Suma kvadrata pogrešaka:
SSE =k∑
i=1
ni∑
j=1
(Xij −Xi·)2 =k∑
i=1
(ni − 1)S2i·
57
-
5. Srednjekvadratno odstupanje medu uzorcima (zbogtretmana):
MST =SST
k − 1
6. Srednjekvadratna pogreška:
MSE =SSE
n− k
7. Testna statistika:
F =MST
MSE
H0∼ F (k − 1, n− k)
58
-
Dakle, ako je H0 istinita testna statistika F ima
Fisherovu F -distribuciju s parom stupnjeva slobode
(k − 1, n− k).
Ako H0 nije istinita hipoteza, onda očekujemo da
opažena vrijednost f statistike F bude velika.
⇒ Kritično područje (uz razinu značajnosti α):
[fα(k − 1, n− k),+∞〉
59
-
Cjelokupni račun se prikazuje u ANOVA-tablici:
broj zbroj srednjeizvor stupnjeva kvadrata kvadratno
varijabilnosti slobode odstupanja odstupanje F -stat.
zbog tretmana k − 1 SST MST Fsl. pogreška n− k SSE MSE —
ukupno n− 1 SS — —
SS :=k∑
i=1
ni∑
j=1
(Xij −X)2
Vrijedi sljedeći rastav varijance:
SS = SST + SSE
60
-
Primjer 4.10. U svrhu pobolǰsanja kvalitete AVmagnetskih vrpci, mjeri se efekt vrste premaza vrp-ce na kvalitetu reprodukcije zvuka. Promatrane sučetiri vrste premaza: A, B, C i D. Dobiveni su sljedećipodaci:
premaz podaciA 10, 15, 8, 12, 15B 14, 18, 21, 15C 17, 16, 14, 15, 17, 15, 18D 12, 15, 17, 15, 16, 15
Utječe li značajno (uz α = 5%) vrsta premaza vrpcena kvalitetu reprodukcije zvuka?
61
-
i ni x̄i· nix̄i· ni(x̄i· − x̄)2 (ni − 1)s2i·A 5 12 60 45 38B 4 17 68 16 30C 7 16 112 7 12D 6 15 80 0 15∑
22 − 330 68 94
n = 22, x̄ =330
22= 15, SST = 68, SSE = 94, k = 4
MST =68
4− 1 = 22.67, MSE =94
22− 4 = 5.22
f =22.67
5.22= 4.34
62
-
ANOVA-tablica:
broj zbroj srednjeizvor stupnjeva kvadrata kvadratno
varijabilnosti slobode odstupanja odstupanje F -stat.
zbog premaza 3 68 22.67 4.34sl. pogreška 18 94 5.22 —
ukupno 21 162 — —
f0.05(3,18) = (tablice) = 3.16
Budući da je f = 4.34 ≥ 3.16 uz razinu značajnostiod 5% odbacujemo pretpostavku da vrsta premaza
ne utječe na kvalitetu reprodukcije zvuka.
63