statistiske test
Post on 23-Feb-2016
19 Views
Preview:
DESCRIPTION
TRANSCRIPT
Statistiske test
Efteråret 2010Jens Friis, AAU
Hjemmeside : http://ak.aau.dk/jfj
Kontinuerte fordelinger
Definition: TæthedsfunktionEn sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[hvor =1
dxxf )(
Definition: Kontinuert fordelingEn kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling,som har en sandsynlighedstæthedsfunktion f : funktionen
kaldes fordelingsfunktionen for en kontinuert fordeling på R
x
dttfxF )()(
Definition: middelværdi ,varians og spredningLad X være en stokastisk variabel med tæthedfunktion f(x)
Middelværdi : μ=E(X)=
Varians : σ2=E((X-μ)2)= Spredningen er σ
dxxxf )(
dxxfx )()( 2
Normalfordelingen er det klassiske eksempel på en kontinuert fordeling. Her er tæthedsfunktionen givet ved
2
2
2)(
22
1)(
x
exf
Middelværdien er μ og spredningen σ. Den stokastiske variabel med dennetæthedsfunktion siges at være N(μ, σ2) –fordelt.
Den normalfordelte stokastiske variabel, som har middelværdi0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt-hedsfunktion for φ , dvs. at
2
2
21)(
x
ex
Den tilsvarende fordelingsfunktion kaldes for Ф, dvs. at
xdttx )()(
Der gælder følgende :
)()()()(
abbUaPbXaP
Man kan derfor klare sig med kendskab til værdier af Ф, som ertabellagt og indlagt i de fleste computersystemer.
Undersøgelse af om et observationssæt kan betragtes somNormalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)
Man kunne også have indført normalfordelingen således :
Definition En stokastisk variabel U siges at være u-fordelt eller N(0 , 1) -fordelt,hvis tæthedsfunktionen for U er givet ved
2
2
21)(
x
ex
Sætning: E(U) = 0 og V(x) = 1
DefinitionEn stokastisk variabel X = μ + σU, hvor μ R og σ R+ , siges at væreN(μ , σ2 ) -fordelt
Sætning: E(X) = μ og V(X) = σ2
SætningDen N(μ , σ2 ) –fordelte stokastiske variabel X har tæthedsfunktionen
2
2
2)(
22
1)(
x
exf
Bevis:
2
2
2)(
211)(1)(')()(
)()()()(
x
exxxfx
xUPxUPxXPxF
Hvorfor er normalfordelingen interessent?
Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt.Mere præcist, så gælder den centrale grænseværdisætning : Lad X1, X2,……….Xn være indbyrdes uafhængige stokastiske variable, der følger samme
fordeling med middelværdi og spredning . Da er
n
X/
tilnærmelsesvis N(0,1) - fordelt
Man kan vise, at hvis X er b(n,p)-fordelt, er X tilnærmelsesvis normalfordelt N(µ, σ2 ) for n→ ∞ ,hvor µ = np og σ2 = np(1-p) .
Hvad var det nu lige binomialfordelingen er for noget ?
BinomialfordelingenEt basiseksperiment beskrives af et udfaldsrum E med to udfaldsucces (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p.Basiseksperimemtet gentages n gange uafhængigt af hinanden.Hvis X betegner antal succes i de n gentagelser gælder der
nqppqn
qX qnq .....2,1,0,)1()(P
Eks. 5 uafhængige kast med en terning. X er antal 6’ere.
5...2,1,0,)65()
61(
5)(P 5
q
qqX qq
q 0 1 2 3 4 5
P(X=q) 0,402 0,462 0,161 0,032 0,003 0,000
Se også SPSS: poisBin6indlagte.sav
Sætning: E(X)=np ; V(X)=np(1-p)
Heraf følger , at hvis X binomialfordelt b(n, p) er
tilnærmelsesvis N( 0, 1)-fordelt
Lad os nu endelig komme til χ2 -fordelingen.
DefinitionLad X1, X2, ……Xn er indbyrdes uafhængige N(0, 1) –fordelte stokastiskevariable. Summen siges at være χ2- fordelt med n frihedsgrader.
n
i 1
2iX
SætningEn stokastisk variabel, som er χ2- fordelt med n frihedsgrader, har tæthedsfunktionen , hvor 0,
2)2/(1)( 2
112/
2/
xex
nxf
xnn
0
1)( dxexr xr
)1(X
pnpnp
Antag at X ̴ b(p, n) ̴ ≈ N(0, 1) ̴ ≈ χ2 , f = 1 )1(
Xpnp
np
2)
)1(X(
pnpnp
Hvis man har en stikprøve, som er binomialfordelt (fx stikprøve med svarmulighederneja/nej kan man benytte et χ2 -test, hvis man ønsker at teste hypotesen Ho : p = p0 . Den alternative hypotese er H1 : p ≠ p0
Antal ja Antal nej ialtobserveret x n-x n
forventet np0 n(1-p0) n
)1()(
)1()()1)((
)1()1(()(
00
20
00
02
000
0
20
0
202
pnpnpx
pnppnpnxnpnpx
pnpnxn
npnpx
som tilnærmelsesvis er χ2 –fordelt med 1 frihedsgrad. Dvs reglen er, at man udregner
forventetforventetobserveret 2)(
Det er klart, at store værdier er kritiske for accept af hypotesen.
Accept af hypoteser
Man arbejder med et såkaldt signifikansniveau, som sædvanligvis er 5% eller 1%.Signifikansniveauet er sandsynligheden for at forkaste en rigtig hypotese. Man kan da begå to fejl :
type 1 : forkaste en rigtig hypotese
type 2: acceptere en hypotese selv om den er forkert
For at kunne bedømme et tests styrke skal man studere sandsynligheden for at begåfejl af type 2. Det er ofte ret kompliceret, og indgår normalt ikke i indledende statistik-kurser.
Eksempel på χ2 -test med 1 frihedsgradI en meningsmåling har man spurgt 1500 vælgere om de vil stemme på Socialdemokratiet, hvis der var valg nu. Resultatet blev Antal ja Antal nej Ialt465 1035 1500
Afviger dette resultat signifikant fra hypotesen, at 30% vil stemme på partiet?Formuleret mere matematisk: X betegner antal stemmer på partiet og modellen er,at X ̴ b(1500, p) og nulhypotesen er H0 : p = 1/3 . H1 : p ≠ 1/3Følgende tabel udregnes :
Antal ja Antal nej I altobserveret 465 1035 1500
forventet 500 1000 1500
675.31000
)10001035(500
)500465( 222
Da 95%’s fraktilen er 3,84 accepteres hypotesen på et signifikansniveau på 5% .
Multinomialfordelingen
X = (X1, X2, ……….Xk) siges, at være multinomialfordelt b(n,p1,p2….pk) ,hvis p1+p2+…..pk=1 og
kxk
xx
kkk ppp
xxxnxXxXxXP .......
!.......!!),....,( 21
2121
2211
, hvor x1+x2+…..xk=n
På samme måde som ved binomialfordelingen kan man se på et basiseksperimentsom gentages n gange uafhængigt af hinanden. I stedet for succes eller fiasko er der k svarmuligheder. Dvs. at X1 er antal svar på kategori 1 X2 ” - - - - - - - - - - - - - - ” 2 . . . . Xk ”- - - - - - - - - - - - - - -” k
Som ved binomialfordelingen kan man teste, at de enkelte sandsynlighedsparametre antager givne værdier, dvs. at modellen er
X=(X1, X2, ……….Xk) er multinomialfordelt b(n,p1,p2….pk) , og nulhypotesen er
H0 : p1 = p01, p2 = p02,……..pk = p0k og
H1 : p1 ≠ p01, p2 ≠ p02,……..pk ≠ p0k
Igen kan man lave et χ2 - test , her med k-1 frihedsgrader. Igen er det
forventetforventetobserveret 2)(
En tommelfingerregel er, at for at anvende testet skal alle forventede værdier være større end 5.
Eksempel :Mendel avlede bønner, som gav følgende udbytte
form\ farve gule grønne
Runde 315 108
kantede 101 32
Da de stammede fra en krydsning af dobbelte heterozygotiske bønner, skulleudbyttet være i forholdet 9 : 3 : 3 : 1.Som model kan anvendes en multinomialfordeling b(556, p1, p2, p3, p4) .Nulhypotesen er H0 :
161,
163,
163,
169
4321 pppp
Følgende tabel udregnes :
i 1 2 3 4 sumobserveret 315 101 108 32 556
forventet 312,75 104,25 104,25 34,75 556
Eksempel fortsat: χ2 – testet med 3 frihedsgrader udregnes :
470,075,34
)75,3432(75,104
)75,104108(75,104
)75,104101(75,312
)75,312315( 22222
Da 95%’s fraktilen er 7,81 accepteres hypotesen på et signifikansniveau på 5%.
Sammenligning af flere multinomialfordelinger eller test for uafhængighed
Model : X1 = (X11, X12, ……….X1k) ̴ b(n1,p11,p12….p1k) X2 = (X21, X22, ……….X2k) ̴ b(n2,p21,p22….p2k) . . Xm = (Xm1, Xm2, ……..Xm2) ̴ b(nm,pm1,pm2….pmk)
Nulpypotese :
H0 : p11 = p21 = ….. = pm1
p12 = p22 =….. = pm2
. . p1k = p2k = …. = pmk
H1 : forskellige pr. kategori
Som test anvendes igen : forventet
forventetobserveret 2)( som er χ2 –fordelt med f = (m-1)(k-1) frihedsgrader . Også her bør de forventede værdier være større end 5.
Lad os lige se på en kontingenstabel over de observerede :
i \ j 1 . . .
j . . .
k sum
1 x11 x1j x1k x1.
.
.
i xij xi.
.
.
m xm1 xmj xmk xm.
sum x.1 x.j x.k n=x..
Læg mærke til, at det forventede antal i celle (i,j) er nnx
nx
nx i..j
..j ix
Man udregner søjlefrekvens gange rækkefrekvens gange samlet antal,altså tester man uafhængighed af de to inddelingskreterier.
Eksempel : For mange år siden lavede Dansk Skakunion en læserundersøgelse for deresmedlemsblad. Man spurgte bl.a. om Hvad foretrækker du? (sæt kryds) 1. at partierne bringes adskilt fra referater og nyheder 2. at partierne bringes sammen med referater og nyheder 3. ved ikke.Spillerne blev inddelt i spillerstyrke og resultatet blev:
svar/styrke
1 2 3 sum
1 15 43 3 61
2 30 97 21 148
3 36 98 25 159
4 39 67 30 136
sum 120 305 79 504
Hvis man vil teste om svarene er uafhængig af spillerstyrke er de fælles skøn over p’erne
50479,
504305,
504120
321 ppp
Tabellen med de forventede kan udregnes :
svarstyrke
1 2 3 sum
1 14,524 36,915 9,562 61
2 35,238 89,563 23,198 148
3 37,857 96,220 24,923 159
4 32,387 82,302 21,317 136
sum 120 305 79 504
Idet 317,2150479136 .......... 915,36
50430561;524,14
50412061
Da χ2 = 14,98 og f=(4-1)(3-1)=6 og 95%’s fraktilen er 12,59 forkastes hypotesenmed et signifikansniveau på 5%
Eksempel : for en del år siden undersøgte man om flere gange straffede personerhavde en én-ægget eller to-ægget tvillinge bror/søster. Resultatet blev :
observeret kriminel ikke kriminel
sum
én ægget 10 3 13
to ægget 2 15 17
sum 12 18 30
H0 : fordelingen på kriminel/ikke kriminel ed den samme for én- og to ægget. De forventede bliver
forventet ikke kriminel
sum
én ægget 5,2 7,8 13
to ægget 6,8 10,2 17
sum 12 18 30
Χ2 = 13,02 , f = (2-1)(2-1) = 1 . Da 95%’s fraktilen er 3,84 forkastes hypotesenmed et signifikans på 5%. Da 99%’s fraktilen er 6,63 kan også forkaste på et signifikansniveau på 1%.
Hvorfor er der det antal frihedsgrader ?
Ved hjælp af den såkaldte spaltningssætning kan man vise :
Hvis X1, X2, X3 …….,Xn er N(0,1) - fordelte, og der k lineære bånd mellem demer χ2 – fordelt med n - k frihedsgrader
n
ii
1
2X
I tilfældet med en m x k tabel er der m∙k – k – m + 1 = (m – 1) (k – 1) frihedsgrader
Beviser for denne sætning ligger langt ud over gymnasieniveau.
Et sidste eksempel : rygning og apgar-tal : vha. SPSS
u-test ved normalfordelte observationer.
Lad X1, X2, ……Xn er indbyrdes uafhængige N(μ, σ2) - fordelt stokastiskevariable. Der gælder da, at
er N(μ, , σ2/n) – fordelt .
Har man derfor et observationssæt x1, x2, ……xn , som antages at væreN(μ, σ2) – fordelt, hvor σ2 er kendt, kan hypotesen
H0 : μ = μ0
med H1 : μ ≠ μ0
testes med teststørrelsen , som under H0 er N(0, 1) – fordelt.
Acceptområder er mellem fraktilen og fraktilen,hvor er signifikansniveauet.
n
n
ii
1
XX
n
xu2
0
2/ 2/1
Nu er det sjældent, at man kender variansen i et observationssæt. Der er der oftesttale om et approksimativt u-test.Eks. I en meningsmåling har man spurgt 1500 vælgere om de vil stemme på Socialdemokratiet, hvis der var valg nu. Resultatet blev
Antal ja Antal nej Ialt465 1035 1500
Afviger dette resultat signifikant fra hypotesen, at 30% vil stemme på partiet?Formuleret mere matematisk: X betegner antal stemmer på partiet og modellen er,at X ̴ b(1500, p) og nulhypotesen er H0 : p = 0,30 . H1 : p ≠ 0,30Vi ved at under H0 er
))30.01(30.01500,30,01500(N X er approksimativt - fordelt.Teststørrelsen udregnes
845,031515
)30.01(30,0150030,01500465
Da 97,5%’s fraktilen er 1,96 accepteres hypotesen på et signifikansniveau på 5%.
t-test ved normalfordelte observationer.
Lad X1, X2, ……Xn er indbyrdes uafhængige N(μ, σ2) - fordelt stokastiskevariable. Der gælder da, at
er N(μ, , σ2/n) – fordelt .
Har man derfor et observationssæt x1, x2, ……xn , som antages at væreN(μ, σ2) – fordelt, hvor σ2 er ukendt, skal både μ og σ2 estimeres.Har man et konkret observationssæt x1, x2, ……xn , er estimatet
for μ : og
for σ2 :
Laver man en tilsvarende teststørrelse som ved u-testet, har man følgende situation:
n
n
ii
1
XX
n
xx
n
ii
1
1
)( 2
2
n
xxs
i
Hypotesen H0 : μ = μ0
med H1 : μ ≠ μ0
ønskes testet.
Teststørrelsen bliver
ns
xt2
0
Det ses, at er en stokastisk variabel, og derfor er t ikke
normalfordelt. Man kan vise, at estimatoren (s2) for σ2 er σ2χ2 - fordelt med n-1 frihedsgrader.Testoren t følger en såkaldt t-fordeling med n-1 frihedsgrader. t-fordelingenkonvergere mod N(0, 1) – fordelingen for n gående mod uendelig. t-fordelingenstæthedsfunktion er også symmetrisk om 0. Ellers fungerer alt som ved u-testet.
1
)XX(1
2
n
n
ii
Eksempel: Ved produktion af piller har man målt nicotamid-indholdet i 20 piller.Indholdet skal være 25mg. Ved stikprøven på 20 piller fik man følgende resultater:
22,67 23,29 23,40 23,56 23,76 23,83 23,95 24,21 24,50 24,6424,87 25,05 25,35 25,73 25,79 25,80 26,11 26,97 25,36 27,11
Model : Xi ̴ N(μ, σ2) for i=1 til 20 er uafhængige stokastiske variable.
H0 : μ = 25 , H1 : μ ≠ 25Parametrene estimeres
= 24,799 ; s2 = 1,5187
Teststørrelsen bliver
x
737,0
205187,1
25797,24
t
Da 2,5%’s fraktilen er -2,093 for 19 frihedsgrader, accepters hypotesen.
Sammenligning af to normalfordelte obsevationsrækker.På 13 hunde har man målt ph-værdien i arterielt blod før og efter indåndingen af CO2.Ændrer indåndingen af CO2 ph-værdien?
Nr normal CO2 differens1 7,42 7,26 0,162 7,52 7,30 0,223 7,36 7,26 0,104 7,43 7,39 0,045 7,43 7,38 0,056 7,15 6,69 0,467 7,50 7,32 0,188 7,34 7,26 0,089 7,45 7,23 0,2210 7,42 7,06 0,3611 7,53 7,34 0,1912 7,48 7,28 0,2013 7,42 7,29 0,13
Model for differensen:
Xi er uafh. N(μ, σ2)- fordelt for i=1,2…13
H0 : μ = 0 ; H1 : μ ≠ 0
Estimater :
= 0,1838 s2 = 0,014176
Teststørrelsen udregnes
x
566,5
13014176,0
01838,0
t
Da 97,5%’s fraktilen er 2,179 for 12 frihedsgrader forkastes hypotesen. 99,5%’s fraktilen er 3,055 og hypotesen vil også blive forkastet på 1%’s signifikansniveau.
Lineær regressionAntag at Yi for i = 1 til n er uafhængige N(μi, σ2) -fordelte således at
)( .xxii
Man kan vise at estimaterne for parametrene er
)(
))(( ;
1.
1..
*.*
n
ii
n
iii
xx
xxyyy
2
1.*.
2* ))((
21
n
iii xxyy
n
Man kan også vise, at estimatoren for β er - fordelt.))(
,(N
1
2.
2
n
ii xx
Man kan derfor teste hypotesen H0 : β = β0 med teststørrelsen
n
ii xx
t
1
2.
2*
0*
)(
som er t-fordelt med n-2 frihedsgrader under H0 .
Hvis β0 = 0 tester man uafhængighed af x og y værdierne.
Eksempel : Man for 28 patienter målt kreatininindholdet i blodet før og efterdødens indtræden. Er der en sammenhæng? Dataene kan ses i en excelfil.Der er en pæn lineær sammenhæng og parametrene estimeres.
28
1
2.x
22*** 4285,1)(SSD ; 01200,0 ; 012,1 ; 024,1
ii xxs
Man vil gerne teste hypotesen H0 : β = 1
131,0
4285,101200,0
000,1012,1
t
som er t-fordelt med 26 frihedsgrader. Da 97,5%’s fraktilen er 2,056accepteres hypotesen.
Dataene er analyseret vha. SPSS : kreatinin.sav
top related