Statistik – 7. gang 1
9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data
H0 : Nul hypotese Formuleres som en ”ligheds” hændelse
H1 eller HA: Alternativ hypotese, der må accepteres hvis H0 forkastes
Trin 2: Vælg statistisk model Test statistik og sampling fordeling fastsættes (vælges under hensyntagen til H0 og H1) Trin 3: Vælg signifikansniveau
Beslutning: H0 er sand H0 er ikke sand Accepter H0 Korrekt beslutning Forkert beslutning
Type II fejl Forkast H0 Forkert beslutning
Type I fejl Korrekt beslutning
Statistik – 7. gang 2
Beslutning: H0 er sand H0 er ikke sand Accepter H0 Korrekt beslutning Forkert beslutning
Type II fejl Forkast H0 Forkert beslutning
Type I fejl Korrekt beslutning
Type I og II fejl er ikke uafhængige Normalt tages der mest hensyn til type I fejl! Signifikansniveau: α sandsynlighed for type I fejl
β sandsynlighed for type II fejl Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik – 7. gang 3
Trin 4: Indsaml data og beregn test statistik Udfra en stikprøve med n udfald beregnes test statistikken Trin 5: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)
Statistik – 7. gang 4
Området afhænger af:
- Formuleringen af H1 - Fordelingsfunktionen for test statistikken - Signifikans-niveauet
Trin 6: Konklusion H0 accepteres hvis værdien af test statistikken ligger indenfor det acceptable område H0 forkastes og derved accept af H1 hvis værdien af test statistikken ligger udenfor det acceptable område
Statistik – 7. gang 5
9.3.1 HYPOTESETEST AF MIDDELVÆRDIER – KENDT SPREDNING Eks: Test af stål trækstyrke: kan det konkluderes at forventningsværdien af trækstyrken er mindst 325 MPa ? - spredningen er kendt: 16=σ MPa 1. trin: Hypotese:
H0 : 3250 == μμ MPa H1 : 3250 =< μμ MPa
(eller H1 : 0μμ > ) (eller H1 : 0μμ ≠ )
Statistik – 7. gang 6
I dette tilfælde udføres en enkeltsidet test, små styrker betragtes som ”kritiske”: H0 accepteres hvis αZZ −> Hvis H0 accepteres kan det ikke afvises, at middeltrækstyrken er 325 MPa eller større. 2. trin: statistisk model
Fordeling af ),(N:n
X σμ
⇓
Test statistik: )1,0(N:/ n
XZσ
μ−=
Statistik – 7. gang 7
3. trin: Signifikansniveau α = 0.01 (1 % sandsynlighed for type I fejl, dvs. at H0 forkastes selvom den er sand) 4. trin:
Udfra n = 100 og 31911
=∑==
n
iix
nX :
75.3100/16325319
/−=
−=
−=
nXZσ
μ
Statistik – 7. gang 8
5. trin: Der benyttes en enkeltsidet test, idet kun små værdier af Z er kritiske!
75.3−=Z
326.2)99.0()1( 11 =Φ=−Φ= −− ααZ ⇒ 326.2−=− αZ 6. trin: H0 forkastes, dvs. styrken er ikke acceptabel
Statistik – 7. gang 9
EKSEMPEL 1
Er forventningsværdien af indholdet i en flaske = ¾ liter? 1. trin:
H0 : 4/30 == μμ liter H1 : 4/30 =≠ μμ liter
2. trin: Hvis σ antages kendt fås: (husk sidste gang)
),(N:n
X σμ
Derved introduceres test statistikken:
)1,0(N:/ n
XZσ
μ−=
Statistik – 7. gang 10
3. trin: Signifikansniveau α = 0.01 (1 % sandsynlighed for type I fejl, dvs. at H0 forkastes selvom den er sand) 4. trin:
Forsøgsresultater: n = 30 79.011
=∑==
n
iix
nX
Med 75.0=μ og 05.0=σ fås:
15.030/05.075.079.0
/=
−=
−=
nXZσ
μ
Statistik – 7. gang 11
5. trin: Der vælges en dobbeltsidet test, idet både små og store værdier af Z er kritiske!
15.0=Z
58.2)995.0()2/1( 112/ =Φ=−Φ= −− ααZ
6. trin: H0 accepteres, idet:
58.215.058.2
2/2/
<<−⇓
<<− αα ZZZ
Statistik – 7. gang 12
9.3.2 HYPOTESETEST AF MIDDELVÆRDIER – UKENDT SPREDNING 1. trin: Hypotese: H0 og H1 : formuleres som før 2. trin: statistisk model Middelværdi X og spredning S : stokastiske variabler ⇓
Test statistik: 1:/ −−
= ntnSXt μ (t-fordeling med n-1 frihedsgrader)
3. trin: Signifikansniveau: som før, typisk α = 0.01 4. trin: Indsaml data og beregn test statistik t
Statistik – 7. gang 13
5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)
6. trin: Konklusion accept område: H1 : 0μμ < forkast hvis )1(, −−< ntt α H1 : 0μμ > forkast hvis )1(, −> ntt α H1 : 0μμ ≠ forkast hvis )1(,2/ −−< ntt α eller )1(,2/ −> ntt α
Statistik – 7. gang 14
Statistik – 7. gang 15
EKSEMPEL 9.3 Koncentration af ilt: Er forventningsværdien af koncentrationen af ilt over grænseværdien på 3 per million ? 1. trin: Hypotese:
H0 : 30 == μμ per million H1 : 30 =< μμ per million
2. trin:
Test statistik: 1:/ −−
= ntnSXt μ (t-fordeling med n-1 frihedsgrader)
3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Givet: n = 5 X =2.8 S =0.32 ⇒
398.15/32.0
38.2/
−=−
=−
=nS
Xt μ
Statistik – 7. gang 16
5. trin: Enkeltsidet test
398.1−=t
132.2)15(, −=− −αt (tabel A-2) 6. trin: H0 accepteres, idet: -1.398 > -2.132
Statistik – 7. gang 17
9.3.3 HYPOTESETEST AF 2 MIDDELVÆRDIER – UKENDT SPREDNING Population 1: 1X : N( 1μ , 1σ ): 1n samples med middelværdi 1X og spredning 1S Population 2: 2X : N( 2μ , 2σ ): 2n samples med middelværdi 2X og spredning 2S 1. trin: Hypotese: H0: middelværdier af de 2 populationer er ens: 1μ = 2μ
H1: 1μ < 2μ eller H1: 1μ > 2μ eller H1: 1μ ≠ 2μ 2. trin: Test statistik:
2121
222
211
21
112
)1()1(nnnn
SnSnXXt
+−+
−+−−
= (t-fordeling med 1n + 2n -2 frihedsgrader)
3. trin: Signifikansniveau: som før, typisk α = 0.01
Statistik – 7. gang 18
4. trin: Indsaml data og beregn test statistik t 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes
6. trin: Konklusion accept område: H1 : 21 μμ < forkast hvis αtt −< H1 : 21 μμ > forkast hvis αtt > H1 : 21 μμ ≠ forkast hvis 2/αtt −< eller 2/αtt >
Statistik – 7. gang 19
EKSEMPEL 9-4 Udvikling af kvælstofindhold i én bæk - indhold før byudvikling: fμ - indhold efter byudvikling: eμ Er der sket en ændring? 1. trin: Hypotese: H0: middelværdier af de 2 populationer er ens: fμ = eμ
H1: fμ < eμ 2. trin: Test statistik:
2121
222
211
21
112
)1()1(nnnn
SnSnXXt
+−+
−+−−
= (t-fordeling med 1n + 2n -2 frihedsgrader)
3. trin: Signifikansniveau: α = 0.05
Statistik – 7. gang 20
4. trin: Data: Før: 1n = 11 1X =0.78 1S =0.36 Efter: 2n = 14 2X =1.37 2S =0.87 ⇒
141
111
2141187.0)114(36.0)111(
37.178.022
+−+
−+−−
=t = -2.104
5. trin: Definer forkastelsesområdet Enkeltsidet test
104.2−=t 714.1)21411(, −=− −+αt (tabel A-2) 6. trin: Konklusion Da -2.104 < -1.714 forkastes H0 ⇒ H1 accepteres
Dvs. kvælstodindholdet forøges efter byudvikling
Statistik – 7. gang 21
Alternativt: 3. trin: Signifikansniveau: α = 0.01
104.2−=t ⇒
)21411(, −+− αt =-2.500 (tabel A-2) ⇒ H0 accepteres ⇒ Dvs. kvælstodindholdet forøges ikke efter byudvikling med et signifikansniveau på 1% OBS: ( )sander selvom forkast 00 HHP=α dvs. α større ⇒ sværere at få hypotese accepteret
(lettere at få hypotese forkastet)
Statistik – 7. gang 22
9.4 HYPOTESETEST AF VARIANSER 1. trin: Hypotese: H0: ingen signifikant forskel mellem populationens varians 2σ
og en forud valgt værdi af variansen 20σ :
2σ = 20σ
H1: 2σ < 2
0σ eller H1: 2σ > 2
0σ eller H1: 2σ ≠ 2
0σ 2. trin: Test statistik: samplevarians: 2S : 2χ (chi-fordelt – tabel A-3)
test statistik: 20
22 )1(
σχ Sn −
= 2χ -fordelt med (n-1) frihedsgrader
3. trin: Signifikansniveau: som før, typisk α = 0.01
Statistik – 7. gang 23
4. trin: Indsaml data og beregn test statistik 2χ 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes
Statistik – 7. gang 24
6. trin: Konklusion accept område: H1 : 2σ < 2
0σ forkast hvis 2
)1(,12
−−< nαχχ H1 : 2σ > 2
0σ forkast hvis 2
)1(,2
−> nαχχ H1 : 2σ ≠ 2
0σ forkast hvis 2
)1(,2/12
−−< nαχχ eller 2)1(,2/
2−> nαχχ
Statistik – 7. gang 25
Statistik – 7. gang 26
EKSEMPEL 9-5 Variansen af betons trykstyrke bør ikke være for stor 1. trin: Hypotese: H0: varians = 2
0σ = 275.0 H1: 2σ > 2
0σ
3. trin: Signifikansniveau: α = 0.05 4. trin: Data:
n= 5 S =1.238 ⇒ 20
22 )1(
σχ Sn −
= = 84.1075.0
238.1)15(2
2
=−
5. trin: Definer forkastelsesområdet H1 : 2σ > 2
0σ forkast hvis 2)1(,
2−> nαχχ
2)1(, −nαχ =9.492 (tabel A-3)
6. trin: Konklusion Da 2
)1(,2
−> nαχχ forkastes hypotesen
Statistik – 7. gang 27
9.4.2 HYPOTESETEST AF 2 POPULATIONERS VARIANSER Varians af de 2 populationer: 2
1S og 22S ( 2
1S > 22S )
1. trin: Hypotese: H0: ingen signifikant forskel mellem populationernes varianser
21σ = 2
2σ H1: 2
1σ ≠ 22σ
2. trin:
test statistik: 22
21
SSF = F - fordelt med ( 1n -1) frihedsgrader i tæller
( 2n -1) frihedsgrader i nævner 3. trin: Signifikansniveau: typisk α = 0.01 4. trin: Indsaml data og beregn test statistik F 5. trin: Definer forkastelsesområdet H0 accepteres på signifikansniveau α hvis F < 1,1,2/ 21 −− nnFα 6. trin: Konklusion
Statistik – 7. gang 28
Statistik – 7. gang 29
EKSEMPEL 9-6 1. trin: Hypotese: H0: 2
1σ = 22σ
H1: 21σ ≠ 2
2σ 2. trin:
test statistik: 22
21
SSF =
3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Indsaml data og beregn test statistik F
1n =5 21S =3.807 2n =5 2
2S =6.423
test statistik: 22
21
SSF =
807.3423.6
= =1.687
5. trin: Definer forkastelsesområdet
1,1,2/ 21 −− nnFα =6.39 (tabel A-4) 6. trin: Konklusion Da F < 1,1,2/ 21 −− nnFα accepteres H0 på signifikansniveau α =5%
Statistik – 7. gang 30