zadatak. 2 x ;x ;:::;xn 1 2 x4.5. testovi o parametru o•cekivanja na osnovi velikih uzoraka ovdje...

Zadatak. (χ2-test) Neka je X1, X2, . . . , Xn slučajniuzorak za X s normalnom populacijskom distribuci-jom N(µ, σ2) (oba parametra su nepoznata).Pokažite da je test omjera vjerodostojnosti za testi-ranje nul-hipoteze H0: σ

2 = σ20 u odnosu na

(a) jednostranu alternativu H1: σ2 < σ20;

(b) jednostranu alternativu H1: σ2 > σ20;

(c) dvostranu alternativu H1: σ2 6= σ20,

dan testnom statistikom

V =(n− 1)S2n

σ20.

1

Za sva tri navedena slučajeva odredite kritična po-

dručja u odnosu na testnu statistiku.

(σ20 > 0 je zadani broj)

2

4.5. Testovi o parametru očekivanja na osnovi

velikih uzoraka

Ovdje ne pretpostavljamo da X ima normalnu dis-

tribuciju (u populaciji), ali pretpostavljamo da je va-

rijanca σ2 = Var[X] konačna.

Konstrukcija testa se bazira na asimptotskoj nor-

malnosti od X za uzorke velike duljine (posljedica

CGT-a).

3

Primjer 4.5. (primjer 3.15)

Zanima nas postotak p · 100% pušača u populaciji18-godǐsnjih Britanaca. Na slučajan način odabran

je uzorak duljine n = 7383 iz te populacije. U uzorku

je bilo p̂ · 100% = 32.8% pušača.

Uz razinu značajnosti od 5% testirajte

H0 : p = 0.30H1 : p 6= 0.30.

4

X = Bernoullijeva varijabla koja indicira pušača

E[X] = p, Var[X] = p(1− p)Procjenitelj za p: relativna frekvencija pušača u uzorku,

p̂ = X

⇒ Testna statistika:

Z =p̂− 0.30√0.30 · 0.70 ·

√7383

5

Kritično područje (dvostrani test!):

ZH0≈ N(0,1) ⇒ P(|Z| ≥ z0.025) ≈ 0.05

z0.025 = (tablice) = 1.96 pa je kritično područje

〈−∞,−1.96] ∪ [1.96,+∞〉Vrijednost testne statistike Z:

z =0.328− 0.30√

0.21·√

7383 = 5.25 > 1.96.

Dakle, na razini značajnosti od 5% odbacujemo pret-

postavku da u populaciji 18-godǐsnjih Britanaca ima

30% pušača.

6

4.6 Usporedba očekivanja dviju normalno dis-

tribuiranih populacija (t-test)

Pretpostavimo da mjerimo (opažamo) isto stat. o-

bilježje X, ali u dvije različite populacije.

Nadalje, pretpostavljamo da

• u obje populacije X je normalno distribuiranavarijabla

• s jednakim (populacijskim) varijancama.

7

Neka su:

X1 = vrijednost varijable X na slučajno odabranoj

jedinki iz populacije 1

X2 = vrijednost varijable X na slučajno odabranoj

jedinki iz populacije 2.

Pretpostavke na X ⇒

X1 ∼ N(µ1, σ2), X2 ∼ N(µ2, σ2)

8

Neka su:

X11, X12, . . . , X1n1 sl. uzorak za X1 duljine n1X21, X22, . . . , X2n2 sl. uzorak za X2 duljine n2

i ta dva uzorka su (medusobno)nezavisna.

Označimo sa:

X1, S21 i X2, S

22

arit. sredine i uzoračke varijance uzoraka za X1 i X2(redom).

9

Želimo testirati (3 slučaja!):

(1) : (2) : (3) :

H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2H1 : µ1 > µ2 H1 : µ1 < µ2 H1 : µ1 6= µ2

10

U sva tri slučaja, testna statistika je jednaka:

T =X1 −X2

Sd· 1√

1n1

+ 1n2

H0∼ t(n1 + n2 − 2),

gdje je Sd procjenitelj (zajedničke) standardne devi-

jacije σ na osnovi oba uzorka:

Sd =

√√√√(n1 − 1)S21 + (n2 − 1)S22n1 + n2 − 2

(S2d je nepristrani procjenitelj varijance σ2)

Neka je α zadana razina značajnosti.

11

(1): (jednostrani test)

H0 : µ1 = µ2H1 : µ1 > µ2

P(T ≥ tα(n1 + n2 − 2) |H0) = α⇒ kritično područje:

[tα(n1 + n2 − 2),+∞〉

12


H0 : µ1 = µ2H1 : µ1 < µ2

P(T ≤ −tα(n1 + n2 − 2) |H0) = α⇒ kritično područje:

〈−∞,−tα(n1 + n2 − 2)]

13

(3): (dvostrani test)

H0 : µ1 = µ2H1 : µ1 6= µ2

P(|T | ≥ tα/2(n1 + n2 − 2) |H0) = α⇒ kritično područje:

〈−∞,−tα/2(n1 + n2 − 2)] ∪ [tα/2(n1 + n2 − 2),+∞〉

14

Zadatak. Pokažite da je navedeni t-test test omjera

vjerodostojnosti.

15

Primjer 4.6. Zanima nas da li nova vrsta prehranestoke značajno utječe na količinu proizvedenog mli-jeka. U tu svrhu na sl. način odabrano je 25 krava,a od njih 25, opet na sl. način odabrano je 13 kravakoje će biti podvrgnute novom režimu prehrane. Os-talih 12 krava hranit će se na uobičajeni (stari) način.Tijekom tri tjedna za svaku kravu mjeri se dnevniprinos mlijeka.

U tablici se za svaku kravu nalaze prosječni dnevniprinosi mlijeka za razdoblje od 3 tjedna.

tretman 44,44,56,46,47,38,58,53,49,35,46,30,41kontrola 35,47,55,29,40,39,32,41,42,57,51,39

16

Označimo:X1 = prosječni dnevni prinos mlijeka krave hranjenena novi načinX2 = prosječni dnevni prinos mlijeka krave hranjenena stari način.

Razumno je pretpostaviti da su X1 i X2 normalnodistribuirane s.v. Dodatno pretpostavljamo da su imvarijance jednake.

Želimo uz razinu značajnosti od 5% testirati je linovi način prehrane stoke s aspekta prinosa mlijekabolji od starog načina.

17

Neka su µ1 = E[X1] i µ2 = E[X2]. Želimo testirati:

H0 : µ1 ≤ µ2H1 : µ1 > µ2

H0 mijenjamo s jednostavnom hipotezom i testi-

ramo:

H0 : µ1 = µ2H1 : µ1 > µ2

Obzirom na pretpostavke, koristimo jednostrani t-

test.

18

Testna statistika:

T =X1 −X2

Sd· 1√

113 +

112

H0∼ t(23)

Kritično područje:

P(T ≥ t0.05(23) |H0) = 0.05 ⇒ [1.714,+∞〉

19

x̄1 = 45.15, s21 = 64.0, x̄2 = 42.25, s

22 = 76.4

⇒ sd =√√√√(n1 − 1)s21 + (n2 − 1)s22

n1 + n2 − 2=

=

√12 · 64.0 + 11 · 76.4

23=√

69.9 = 8.63

⇒ t = x̄1 − x̄2sd

1√113 +

112

=

=45.15− 42.25

8.63

√12 · 13

25= 0.84

20

Budući da se t = 0.84 ne nalazi u kritičnom po-

dručju, na osnovi opaženog uzorka i razine značajnosti

od 5% ne možemo zaključiti da nova metoda daje u

srednjem veći dnevni prinos milijeka od stare metode

prehrane stoke.

21

Primjer 4.8. (Spareni podaci)

Istražuje se da li odredena vrsta lijeka izaziva sma-

njenje krvnog tlaka. Uzorak se sastoji od 15 na

slučajan način odabranih studentica. U trenutku 0

izmjeren im je krvni tlak (X). Zatim su uzimale

redovnu dozu lijeka tijekom 6 mjeseci. Nakon 6

mjeseci ponovo im je izmjeren krvni tlak (Y ).

Da li lijek značajno (uz razinu značajnosti od 5%)

utječe na smanjenje krvnoga tlaka?

22

Podaci:

i 1 2 3 4 5 6 7 8xi 70 80 72 76 76 76 72 78yi 68 72 62 70 58 66 68 52

i 9 10 11 12 13 14 15xi 82 64 74 92 74 68 84yi 64 72 74 60 74 72 74

23

Pretpostavimo:

X = krvni tlak studentice u t = 0 ∼ N(µ0, σ20)Y = krvni tlak studentice u t = 6 ∼ N(µ6, σ26)

Testiramo:

H0 : µ0 ≤ µ6H1 : µ0 > µ6

H0 mijenjamo s jednostavnom hipotezom i testi-

ramo:

H0 : µ0 = µ6H1 : µ0 > µ6

24

Jesu li X i Y nezavisne s.v?

25

D := X − Y ∼ N(µ0 − µ6, σ2)Želimo testirati:

H0 : µ0 − µ6 = 0H1 : µ0 − µ6 > 0

što se svodi na t-test za jedan uzorak (poglavlje 4.4).

26

Izvedeni podaci:

i 1 2 3 4 5 6 7 8xi 70 80 72 76 76 76 72 78yi 68 72 62 70 58 66 68 52di 2 8 10 6 18 10 4 26

i 9 10 11 12 13 14 15xi 82 64 74 92 74 68 84yi 64 72 74 60 74 72 74di 18 -8 0 32 0 -4 10

27

d̄ = 8.8, s = 10.98 ⇒ t = d̄s·√

15 = 3.11

Kritično područje (α = 5%):

[t0.05(14),+∞〉 = [1.761,+∞〉Dakle, odbacujemo H0 u korist H1, tj. istraživani li-

jek značajno smanjuje krvni tlak na razini značajnosti

od 5%.

28

4.7 Usporedba varijanci normalno distribuiranih

populacija (F -test)

Ovdje opisujemo test hipoteze o jednakosti popu-

lacijskih varijanci dviju normalno distribuiranih vari-

jabli X1 i X2.

Koristimo iste oznake kao u 4.6 samo što sada pret-

postavljamo da je moguće da su populacijske vari-

jance različite:

σ21 = Var[X1], σ22 = Var[X2].

29

Želimo testirati osnovnu hipotezu

H0 : σ21 = σ

22

u odnosu na jednostrane alternative

H1 : σ21 > σ

22 ili H1 : σ

21 < σ

22

ili dvostranu alternativu

H1 : σ21 6= σ22.

30

Zadatak. Pokažite da je testna statistika testa om-

jera vjerodostojnosti za navedene hipoteze:

F =S21S22

.

Tada je

FH0∼ F (n1 − 1, n2 − 1).

31

Neka je α zadana razina značajnosti.


H0 : σ21 = σ

22

H1 : σ21 > σ

22

P(F ≥ fα(n1 − 1, n2 − 1) |H0) = α⇒ kritično područje:

[fα(n1 − 1, n2 − 1),+∞〉

32


H0 : σ21 = σ

22

H1 : σ21 < σ

22

P(F ≤ f1−α(n1 − 1, n2 − 1) |H0) = α⇒ kritično područje:

〈0, f1−α(n1 − 1, n2 − 1)]

33

(3): (dvostrani test)

H0 : σ21 = σ

22

H1 : σ21 6= σ22

P(F ≤ f1−α2(n1 − 1, n2 − 1) iliF ≥ fα

2(n1 − 1, n2 − 1) |H0) = α

⇒ kritično područje:

〈0, f1−α2(n1 − 1, n2 − 1)] ∪ [fα2(n1 − 1, n2 − 1),+∞〉

34

Vrijednosti fα(m1, m2) su tabelirane.

Vrijedi:

f1−α(m1, m2) =1

fα(m2, m1)

35

Primjer 4.8. (nastavak primjera 4.6)

Uz razinu značajnosti od 10% želimo testirati

H0 : σ21 = σ

22

H1 : σ21 6= σ22.

Iz zadanih uzoraka imamo

s21 = 64.0, s22 = 76.4

36

Vrijednost testne statistike F = S21/S22 je

f =s21s22

=64.0

76.4= 0.84.

Kritično područje:

〈0, f0.95(12,11)] ∪ [f0.05(12,11),+∞〉

f0.05(12,11) = (tablice) = 2.69

f0.95(12,11) =1

f0.05(11,12)= (tablice) =

1

2.72= 0.37

dakle, kritično područje je:

〈0,0.37] ∪ [2.69,+∞〉.37

Budući da f = 0.84 ne pripada kritičnom području,

ne odbacujemo hipotezu da su populacijske varijance

jednake na razini značajnosti od 10%.

38

4.8 Usporedba očekivanja na osnovi velikih uzo-

raka. Usporedba proporcija.

Promatramo dvije populacije.

Neka su:X1 s.v., model za prvu populacijuX2 s.v., model za drugu populaciju.

Pretpostavljamo da su populacijske varijance σ21 iσ22 konačne i općenito nepoznate. Želimo testiratihipoteze o nepoznatim parametrima populacijskihsrednjih vrijednosti µ1 i µ2.

39

Neka su:

X11, X12, . . . , X1n1 sl. uzorak za X1 duljine n1X21, X22, . . . , X2n2 sl. uzorak za X2 duljine n2

i ta dva uzorka su (medusobno)nezavisna.

Označimo sa:

X1, σ̂21 i X2, σ̂

22

arit. sredine i konzistentne procjenitelje populacijskihvarijanci na osnovi svakog uzorka posebno, za X1 iX2 (redom).

40

Želimo testirati (3 slučaja!):

(1) : (2) : (3) :

H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2H1 : µ1 > µ2 H1 : µ1 < µ2 H1 : µ1 6= µ2

41

Ako je H0 točna, prema CGT-u vrijedi

Z :=X1 −X2√

σ̂21n1

+σ̂22n2

D−→ N(0,1), min{n1, n2} → +∞.

Z je testna statistika. Kritično područje konstruira

se kao u t-testu, samo što su odgovarajuće kritične

vrijednosti jedinični normalni kvantili.

42

Važan primjer je usporedba proporcija.

Promatramo dvije populacije i neko bernoullijevsko

obilježje X.

Označimo sa:

X1 Bernoullijevu s.v. koja reprezentira X u pop.1,

X2 Bernoullijevu s.v. koja reprezentira X u pop.2,

a sa p1, p2 njihove parametre (vjerojatnosti uspjeha).

43


H0 : p1 = p2

u odnosu na (uobičajene) jednostrane alternative:

H1 : p1 > p2 ili H1 : p1 < p2

ili dvostranu alternativu

H1 : p1 6= p2.

44

Označimo sa p̂1, p̂2 procjenitelje od p1, p2 na os-

novi svakog uzorka posebno (uzorci su medusobno

nezavisni duljina n1 i n2), te sa

p̂ :=n1p̂1 + n2p̂2

n1 + n2

procjenitelj zajedničke vjerojatnosti uspjeha (na bazi

oba uzorka zajedno).

45

Testna statistika:

Z =p̂1 − p̂2√p̂(1− p̂)

· 1√1n1

+ 1n2

H0∼ asimptotskiN(0,1)

za velike n1 i n2 (tj., kada min{n1, n2} → ∞)

Kritična područja se odrede kao u slučaju t-testa,

jedino se umjesto tα(m) očitavaju zα vrijednosti iz

tablica za standardnu normalnu razdiobu.

46

Primjer 4.9. Želimo usporediti tradicionalnu (T) s

audio-vizualnom (AV) metodom učenja nekog stra-

nog jezika. U tu svrhu na sl. način odabrano je 250

učenika. 100 od njih je na sl. način odredeno da uče

jezik T-metodom, a preostalih 150 AV-metodom.

Na kraju tečaja svih 250 učenika pristupilo je istom

pismenom ispitu.

47

Podaci o broju prošlih i palih na ispitu nalazi se u

tablici:

T AV ukupnoprošli 63 107 170pali 37 43 80ukupno 100 150 250

Želimo uz razinu značajnosti od 5% testirati je li

AV-metoda uspješnija od T-metode.

48

Neka su:

p1 = omjer učenika koji prolaze ispit u populaciji

učenika koji su učili metodom T

p2 = omjer učenika koji prolaze ispit u populaciji

učenika koji su učili metodom AV.

Testiramo:

H0 : p1 ≥ p2H1 : p1 < p2

, odn.H0 : p1 = p2H1 : p1 < p2

49

Testna statistika:

Z =p̂1 − p̂2√p̂(1− p̂)

· 1√1

100 +1

150

Kritično područje: (zbog ZH0≈ N(0,1))

P(Z ≤ −z0.05 |H0) ≈ 0.05 ⇒ 〈−∞,−1.64]

50

Procjene:

p̂1 =63

100= 0.63, p̂2 =

107

150= 0.71, p̂ =

170

250= 0.68

Vrijednost testne statistike Z:

z =p̂1 − p̂2√p̂(1− p̂)

· 1√1

100 +1

150

=

=0.63− 0.71√0.68 · 0.32 ·

√150 · 100

250= −1.33

51

Budući da se z = −1.33 ne nalazi u kritičnom po-dručju, ne možemo na razini značajnosti od 5% i

opaženog uzorka tvrditi da je AV-metoda uspješnija

od tradicionalne.

52

4.9 Jednofaktorska analiza varijance (ANOVA)

Kada želimo usporediti (normalne) razdiobe neke

varijable u vǐse od dvije populacije, tada koristimo

ANOVA-u.

(ANOVA = Analysis of Variance)

(Za usporedbu dviju normalnih populacija koristimo

t-test iz 5.5)

53

Neka su

X11, X12, . . . , X1n1 s.u. za X1 ∼ N(µ1, σ2)X21, X22, . . . , X2n2 s.u. za X2 ∼ N(µ2, σ2)... ...Xk1, Xk2, . . . , Xknk s.u. za Xk ∼ N(µk, σ2)

k nezavisnih slučajnih uzoraka, svaki za normalno

distribuirano obilježje X reprezentirano sa X1 u po-

pulaciji 1, sa X2 u populaciji 2, itd., sa Xk u popu-

laciji k.

Uz normalnost svake populacije još pretpostavljamo

da su im populacijske varijance jednake.

54


H0 : µ1 = µ2 = . . . = µk

u odnosu na alternativu

H1 : postoje i, j ∈ {1,2, . . . , k} t.d. je µi 6= µj.

55

Testnu statistiku izračunamo postupno:

1. Za svaki uzorak posebno izračunamo arit. sredinu

i uzoračku varijancu:

Xi·, S2i·, i = 1,2, . . . , k.

2. Izračuna se n = n1 + · · · + nk i ukupna arit.sredina:

X =1

n

k∑

i=1

ni∑

j=1

Xij =1

n

k∑

i=1

niXi·

56

3. Zbroj kvadrata odstupanja srednjih vrijednosti

od ukupne arit. sredine (suma kvadrata zbog tret-

mana):

SST =k∑

i=1

ni(Xi· −X)2

4. Suma kvadrata pogrešaka:

SSE =k∑

i=1

ni∑

j=1

(Xij −Xi·)2 =k∑

i=1

(ni − 1)S2i·

57

5. Srednjekvadratno odstupanje medu uzorcima (zbogtretmana):

MST =SST

k − 1

6. Srednjekvadratna pogreška:

MSE =SSE

n− k

7. Testna statistika:

F =MST

MSE

H0∼ F (k − 1, n− k)

58

Dakle, ako je H0 istinita testna statistika F ima

Fisherovu F -distribuciju s parom stupnjeva slobode

(k − 1, n− k).

Ako H0 nije istinita hipoteza, onda očekujemo da

opažena vrijednost f statistike F bude velika.

⇒ Kritično područje (uz razinu značajnosti α):

[fα(k − 1, n− k),+∞〉

59

Cjelokupni račun se prikazuje u ANOVA-tablici:

broj zbroj srednjeizvor stupnjeva kvadrata kvadratno

varijabilnosti slobode odstupanja odstupanje F -stat.

zbog tretmana k − 1 SST MST Fsl. pogreška n− k SSE MSE —

ukupno n− 1 SS — —

SS :=k∑

i=1

ni∑

j=1

(Xij −X)2

Vrijedi sljedeći rastav varijance:

SS = SST + SSE

60

Primjer 4.10. U svrhu pobolǰsanja kvalitete AVmagnetskih vrpci, mjeri se efekt vrste premaza vrp-ce na kvalitetu reprodukcije zvuka. Promatrane sučetiri vrste premaza: A, B, C i D. Dobiveni su sljedećipodaci:

premaz podaciA 10, 15, 8, 12, 15B 14, 18, 21, 15C 17, 16, 14, 15, 17, 15, 18D 12, 15, 17, 15, 16, 15

Utječe li značajno (uz α = 5%) vrsta premaza vrpcena kvalitetu reprodukcije zvuka?

61

i ni x̄i· nix̄i· ni(x̄i· − x̄)2 (ni − 1)s2i·A 5 12 60 45 38B 4 17 68 16 30C 7 16 112 7 12D 6 15 80 0 15∑

22 − 330 68 94

n = 22, x̄ =330

22= 15, SST = 68, SSE = 94, k = 4

MST =68

4− 1 = 22.67, MSE =94

22− 4 = 5.22

f =22.67

5.22= 4.34

62

ANOVA-tablica:

broj zbroj srednjeizvor stupnjeva kvadrata kvadratno

varijabilnosti slobode odstupanja odstupanje F -stat.

zbog premaza 3 68 22.67 4.34sl. pogreška 18 94 5.22 —

ukupno 21 162 — —

f0.05(3,18) = (tablice) = 3.16

Budući da je f = 4.34 ≥ 3.16 uz razinu značajnostiod 5% odbacujemo pretpostavku da vrsta premaza

ne utječe na kvalitetu reprodukcije zvuka.

63

zadatak. 2 x ;x ;:::;xn 1 2 x4.5. testovi o parametru o•cekivanja na osnovi velikih uzoraka ovdje...

Documents