statistiske test

Statistiske test

Efteråret 2010Jens Friis, AAU

Hjemmeside : http://ak.aau.dk/jfj

Kontinuerte fordelinger

Definition: TæthedsfunktionEn sandsynlighedstæthedsfunktion på R er en integrabel funktion f : R→[0;∞[hvor =1

dxxf )(

Definition: Kontinuert fordelingEn kontinuert sandsynlighedsfordeling er en sandsynlighedsfordeling,som har en sandsynlighedstæthedsfunktion f : funktionen

kaldes fordelingsfunktionen for en kontinuert fordeling på R

dttfxF )()(

Definition: middelværdi ,varians og spredningLad X være en stokastisk variabel med tæthedfunktion f(x)

Middelværdi : μ=E(X)=

Varians : σ2=E((X-μ)2)= Spredningen er σ

dxxxf )(

dxxfx )()( 2

Normalfordelingen er det klassiske eksempel på en kontinuert fordeling. Her er tæthedsfunktionen givet ved

Middelværdien er μ og spredningen σ. Den stokastiske variabel med dennetæthedsfunktion siges at være N(μ, σ2) –fordelt.

Den normalfordelte stokastiske variabel, som har middelværdi0 og varians 1, kaldes sædvanligvis U, og den tilhørende tæt-hedsfunktion for φ , dvs. at

Den tilsvarende fordelingsfunktion kaldes for Ф, dvs. at

xdttx )()(

Der gælder følgende :

)()()()(

abbUaPbXaP

Man kan derfor klare sig med kendskab til værdier af Ф, som ertabellagt og indlagt i de fleste computersystemer.

Undersøgelse af om et observationssæt kan betragtes somNormalfordelt: Apgar- fødselsvægt (SPSS) eller BMI – Geogear (SPSS)

Man kunne også have indført normalfordelingen således :

Definition En stokastisk variabel U siges at være u-fordelt eller N(0 , 1) -fordelt,hvis tæthedsfunktionen for U er givet ved

Sætning: E(U) = 0 og V(x) = 1

DefinitionEn stokastisk variabel X = μ + σU, hvor μ R og σ R+ , siges at væreN(μ , σ2 ) -fordelt

Sætning: E(X) = μ og V(X) = σ2

SætningDen N(μ , σ2 ) –fordelte stokastiske variabel X har tæthedsfunktionen

Bevis:

211)(1)(')()(

)()()()(

exxxfx

xUPxUPxXPxF

Hvorfor er normalfordelingen interessent?

Ja, det er den, fordi gennemsnittet af næsten alle målinger tilnærmelsesvis er normalfordelt.Mere præcist, så gælder den centrale grænseværdisætning : Lad X1, X2,……….Xn være indbyrdes uafhængige stokastiske variable, der følger samme

fordeling med middelværdi og spredning . Da er

tilnærmelsesvis N(0,1) - fordelt

Man kan vise, at hvis X er b(n,p)-fordelt, er X tilnærmelsesvis normalfordelt N(µ, σ2 ) for n→ ∞ ,hvor µ = np og σ2 = np(1-p) .

Hvad var det nu lige binomialfordelingen er for noget ?

BinomialfordelingenEt basiseksperiment beskrives af et udfaldsrum E med to udfaldsucces (s) og fiasko (f), dvs. E={s,f}, hvor P(s)=p og P(f)=1-p.Basiseksperimemtet gentages n gange uafhængigt af hinanden.Hvis X betegner antal succes i de n gentagelser gælder der

nqppqn

qX qnq .....2,1,0,)1()(P

Eks. 5 uafhængige kast med en terning. X er antal 6’ere.

5...2,1,0,)65()

5)(P 5

qqX qq

q 0 1 2 3 4 5

P(X=q) 0,402 0,462 0,161 0,032 0,003 0,000

Se også SPSS: poisBin6indlagte.sav

Sætning: E(X)=np ; V(X)=np(1-p)

Heraf følger , at hvis X binomialfordelt b(n, p) er

tilnærmelsesvis N( 0, 1)-fordelt

Lad os nu endelig komme til χ2 -fordelingen.

DefinitionLad X1, X2, ……Xn er indbyrdes uafhængige N(0, 1) –fordelte stokastiskevariable. Summen siges at være χ2- fordelt med n frihedsgrader.

SætningEn stokastisk variabel, som er χ2- fordelt med n frihedsgrader, har tæthedsfunktionen , hvor 0,

2)2/(1)( 2

1)( dxexr xr

Antag at X ̴ b(p, n) ̴ ≈ N(0, 1) ̴ ≈ χ2 , f = 1 )1(

Hvis man har en stikprøve, som er binomialfordelt (fx stikprøve med svarmulighederneja/nej kan man benytte et χ2 -test, hvis man ønsker at teste hypotesen Ho : p = p0 . Den alternative hypotese er H1 : p ≠ p0

Antal ja Antal nej ialtobserveret x n-x n

forventet np0 n(1-p0) n

)1()()1)((

)1()1(()(

pnpnpx

pnppnpnxnpnpx

pnpnxn

som tilnærmelsesvis er χ2 –fordelt med 1 frihedsgrad. Dvs reglen er, at man udregner

forventetforventetobserveret 2)(

Det er klart, at store værdier er kritiske for accept af hypotesen.

Accept af hypoteser

Man arbejder med et såkaldt signifikansniveau, som sædvanligvis er 5% eller 1%.Signifikansniveauet er sandsynligheden for at forkaste en rigtig hypotese. Man kan da begå to fejl :

type 1 : forkaste en rigtig hypotese

type 2: acceptere en hypotese selv om den er forkert

For at kunne bedømme et tests styrke skal man studere sandsynligheden for at begåfejl af type 2. Det er ofte ret kompliceret, og indgår normalt ikke i indledende statistik-kurser.

Eksempel på χ2 -test med 1 frihedsgradI en meningsmåling har man spurgt 1500 vælgere om de vil stemme på Socialdemokratiet, hvis der var valg nu. Resultatet blev Antal ja Antal nej Ialt465 1035 1500

Afviger dette resultat signifikant fra hypotesen, at 30% vil stemme på partiet?Formuleret mere matematisk: X betegner antal stemmer på partiet og modellen er,at X ̴ b(1500, p) og nulhypotesen er H0 : p = 1/3 . H1 : p ≠ 1/3Følgende tabel udregnes :

Antal ja Antal nej I altobserveret 465 1035 1500

forventet 500 1000 1500

675.31000

)10001035(500

)500465( 222

Da 95%’s fraktilen er 3,84 accepteres hypotesen på et signifikansniveau på 5% .

Multinomialfordelingen

X = (X1, X2, ……….Xk) siges, at være multinomialfordelt b(n,p1,p2….pk) ,hvis p1+p2+…..pk=1 og

kkk ppp

xxxnxXxXxXP .......

!.......!!),....,( 21

, hvor x1+x2+…..xk=n

På samme måde som ved binomialfordelingen kan man se på et basiseksperimentsom gentages n gange uafhængigt af hinanden. I stedet for succes eller fiasko er der k svarmuligheder. Dvs. at X1 er antal svar på kategori 1 X2 ” - - - - - - - - - - - - - - ” 2 . . . . Xk ”- - - - - - - - - - - - - - -” k

Som ved binomialfordelingen kan man teste, at de enkelte sandsynlighedsparametre antager givne værdier, dvs. at modellen er

X=(X1, X2, ……….Xk) er multinomialfordelt b(n,p1,p2….pk) , og nulhypotesen er

H0 : p1 = p01, p2 = p02,……..pk = p0k og

H1 : p1 ≠ p01, p2 ≠ p02,……..pk ≠ p0k

Igen kan man lave et χ2 - test , her med k-1 frihedsgrader. Igen er det

forventetforventetobserveret 2)(

En tommelfingerregel er, at for at anvende testet skal alle forventede værdier være større end 5.

Eksempel :Mendel avlede bønner, som gav følgende udbytte

form\ farve gule grønne

Runde 315 108

kantede 101 32

Da de stammede fra en krydsning af dobbelte heterozygotiske bønner, skulleudbyttet være i forholdet 9 : 3 : 3 : 1.Som model kan anvendes en multinomialfordeling b(556, p1, p2, p3, p4) .Nulhypotesen er H0 :

4321 pppp

Følgende tabel udregnes :

i 1 2 3 4 sumobserveret 315 101 108 32 556

forventet 312,75 104,25 104,25 34,75 556

Eksempel fortsat: χ2 – testet med 3 frihedsgrader udregnes :

470,075,34

)75,3432(75,104

)75,104108(75,104

)75,104101(75,312

)75,312315( 22222

Da 95%’s fraktilen er 7,81 accepteres hypotesen på et signifikansniveau på 5%.

Sammenligning af flere multinomialfordelinger eller test for uafhængighed

Model : X1 = (X11, X12, ……….X1k) ̴ b(n1,p11,p12….p1k) X2 = (X21, X22, ……….X2k) ̴ b(n2,p21,p22….p2k) . . Xm = (Xm1, Xm2, ……..Xm2) ̴ b(nm,pm1,pm2….pmk)

Nulpypotese :

H0 : p11 = p21 = ….. = pm1

p12 = p22 =….. = pm2

. . p1k = p2k = …. = pmk

H1 : forskellige pr. kategori

Som test anvendes igen : forventet

forventetobserveret 2)( som er χ2 –fordelt med f = (m-1)(k-1) frihedsgrader . Også her bør de forventede værdier være større end 5.

Lad os lige se på en kontingenstabel over de observerede :

i \ j 1 . . .

j . . .

1 x11 x1j x1k x1.

i xij xi.

m xm1 xmj xmk xm.

sum x.1 x.j x.k n=x..

Læg mærke til, at det forventede antal i celle (i,j) er nnx

nx i..j

..j ix

Man udregner søjlefrekvens gange rækkefrekvens gange samlet antal,altså tester man uafhængighed af de to inddelingskreterier.

Eksempel : For mange år siden lavede Dansk Skakunion en læserundersøgelse for deresmedlemsblad. Man spurgte bl.a. om Hvad foretrækker du? (sæt kryds) 1. at partierne bringes adskilt fra referater og nyheder 2. at partierne bringes sammen med referater og nyheder 3. ved ikke.Spillerne blev inddelt i spillerstyrke og resultatet blev:

svar/styrke

1 2 3 sum

1 15 43 3 61

2 30 97 21 148

3 36 98 25 159

4 39 67 30 136

sum 120 305 79 504

Hvis man vil teste om svarene er uafhængig af spillerstyrke er de fælles skøn over p’erne

50479,

504305,

504120

321 ppp

Tabellen med de forventede kan udregnes :

svarstyrke

1 2 3 sum

1 14,524 36,915 9,562 61

2 35,238 89,563 23,198 148

3 37,857 96,220 24,923 159

4 32,387 82,302 21,317 136

sum 120 305 79 504

Idet 317,2150479136 .......... 915,36

50430561;524,14

50412061

Da χ2 = 14,98 og f=(4-1)(3-1)=6 og 95%’s fraktilen er 12,59 forkastes hypotesenmed et signifikansniveau på 5%

Eksempel : for en del år siden undersøgte man om flere gange straffede personerhavde en én-ægget eller to-ægget tvillinge bror/søster. Resultatet blev :

observeret kriminel ikke kriminel

én ægget 10 3 13

to ægget 2 15 17

sum 12 18 30

H0 : fordelingen på kriminel/ikke kriminel ed den samme for én- og to ægget. De forventede bliver

forventet ikke kriminel

én ægget 5,2 7,8 13

to ægget 6,8 10,2 17

sum 12 18 30

Χ2 = 13,02 , f = (2-1)(2-1) = 1 . Da 95%’s fraktilen er 3,84 forkastes hypotesenmed et signifikans på 5%. Da 99%’s fraktilen er 6,63 kan også forkaste på et signifikansniveau på 1%.

Hvorfor er der det antal frihedsgrader ?

Ved hjælp af den såkaldte spaltningssætning kan man vise :

Hvis X1, X2, X3 …….,Xn er N(0,1) - fordelte, og der k lineære bånd mellem demer χ2 – fordelt med n - k frihedsgrader

I tilfældet med en m x k tabel er der m∙k – k – m + 1 = (m – 1) (k – 1) frihedsgrader

Beviser for denne sætning ligger langt ud over gymnasieniveau.

Et sidste eksempel : rygning og apgar-tal : vha. SPSS

u-test ved normalfordelte observationer.

Lad X1, X2, ……Xn er indbyrdes uafhængige N(μ, σ2) - fordelt stokastiskevariable. Der gælder da, at

er N(μ, , σ2/n) – fordelt .

Har man derfor et observationssæt x1, x2, ……xn , som antages at væreN(μ, σ2) – fordelt, hvor σ2 er kendt, kan hypotesen

H0 : μ = μ0

med H1 : μ ≠ μ0

testes med teststørrelsen , som under H0 er N(0, 1) – fordelt.

Acceptområder er mellem fraktilen og fraktilen,hvor er signifikansniveauet.

2/ 2/1

Nu er det sjældent, at man kender variansen i et observationssæt. Der er der oftesttale om et approksimativt u-test.Eks. I en meningsmåling har man spurgt 1500 vælgere om de vil stemme på Socialdemokratiet, hvis der var valg nu. Resultatet blev

Antal ja Antal nej Ialt465 1035 1500

Afviger dette resultat signifikant fra hypotesen, at 30% vil stemme på partiet?Formuleret mere matematisk: X betegner antal stemmer på partiet og modellen er,at X ̴ b(1500, p) og nulhypotesen er H0 : p = 0,30 . H1 : p ≠ 0,30Vi ved at under H0 er

))30.01(30.01500,30,01500(N X er approksimativt - fordelt.Teststørrelsen udregnes

845,031515

)30.01(30,0150030,01500465

Da 97,5%’s fraktilen er 1,96 accepteres hypotesen på et signifikansniveau på 5%.

t-test ved normalfordelte observationer.

Lad X1, X2, ……Xn er indbyrdes uafhængige N(μ, σ2) - fordelt stokastiskevariable. Der gælder da, at

er N(μ, , σ2/n) – fordelt .

Har man derfor et observationssæt x1, x2, ……xn , som antages at væreN(μ, σ2) – fordelt, hvor σ2 er ukendt, skal både μ og σ2 estimeres.Har man et konkret observationssæt x1, x2, ……xn , er estimatet

for μ : og

for σ2 :

Laver man en tilsvarende teststørrelse som ved u-testet, har man følgende situation:

Hypotesen H0 : μ = μ0

med H1 : μ ≠ μ0

ønskes testet.

Teststørrelsen bliver

Det ses, at er en stokastisk variabel, og derfor er t ikke

normalfordelt. Man kan vise, at estimatoren (s2) for σ2 er σ2χ2 - fordelt med n-1 frihedsgrader.Testoren t følger en såkaldt t-fordeling med n-1 frihedsgrader. t-fordelingenkonvergere mod N(0, 1) – fordelingen for n gående mod uendelig. t-fordelingenstæthedsfunktion er også symmetrisk om 0. Ellers fungerer alt som ved u-testet.

Eksempel: Ved produktion af piller har man målt nicotamid-indholdet i 20 piller.Indholdet skal være 25mg. Ved stikprøven på 20 piller fik man følgende resultater:

22,67 23,29 23,40 23,56 23,76 23,83 23,95 24,21 24,50 24,6424,87 25,05 25,35 25,73 25,79 25,80 26,11 26,97 25,36 27,11

Model : Xi ̴ N(μ, σ2) for i=1 til 20 er uafhængige stokastiske variable.

H0 : μ = 25 , H1 : μ ≠ 25Parametrene estimeres

= 24,799 ; s2 = 1,5187

Teststørrelsen bliver

205187,1

25797,24

Da 2,5%’s fraktilen er -2,093 for 19 frihedsgrader, accepters hypotesen.

Sammenligning af to normalfordelte obsevationsrækker.På 13 hunde har man målt ph-værdien i arterielt blod før og efter indåndingen af CO2.Ændrer indåndingen af CO2 ph-værdien?

Nr normal CO2 differens1 7,42 7,26 0,162 7,52 7,30 0,223 7,36 7,26 0,104 7,43 7,39 0,045 7,43 7,38 0,056 7,15 6,69 0,467 7,50 7,32 0,188 7,34 7,26 0,089 7,45 7,23 0,2210 7,42 7,06 0,3611 7,53 7,34 0,1912 7,48 7,28 0,2013 7,42 7,29 0,13

Model for differensen:

Xi er uafh. N(μ, σ2)- fordelt for i=1,2…13

H0 : μ = 0 ; H1 : μ ≠ 0

Estimater :

= 0,1838 s2 = 0,014176

Teststørrelsen udregnes

13014176,0

01838,0

Da 97,5%’s fraktilen er 2,179 for 12 frihedsgrader forkastes hypotesen. 99,5%’s fraktilen er 3,055 og hypotesen vil også blive forkastet på 1%’s signifikansniveau.

Lineær regressionAntag at Yi for i = 1 til n er uafhængige N(μi, σ2) -fordelte således at

)( .xxii

Man kan vise at estimaterne for parametrene er

))(( ;

2* ))((

iii xxyy

Man kan også vise, at estimatoren for β er - fordelt.))(

Man kan derfor teste hypotesen H0 : β = β0 med teststørrelsen

som er t-fordelt med n-2 frihedsgrader under H0 .

Hvis β0 = 0 tester man uafhængighed af x og y værdierne.

Eksempel : Man for 28 patienter målt kreatininindholdet i blodet før og efterdødens indtræden. Er der en sammenhæng? Dataene kan ses i en excelfil.Der er en pæn lineær sammenhæng og parametrene estimeres.

22*** 4285,1)(SSD ; 01200,0 ; 012,1 ; 024,1

ii xxs

Man vil gerne teste hypotesen H0 : β = 1

4285,101200,0

000,1012,1

som er t-fordelt med 26 frihedsgrader. Da 97,5%’s fraktilen er 2,056accepteres hypotesen.

Dataene er analyseret vha. SPSS : kreatinin.sav

statistiske test

Documents

教育部大學校院校務資料庫 · 2012-10-03 ·...

2001/21 rapporter reports - ssb · rapporter i denne serien...

læringsutbyttebeskrivelser og emnematriser for ... ·...

aei.pitt.eduaei.pitt.edu/69632/1/social-social_protection_expenditure_and... ·...

test · test · test · test · test · test · test ·...

vejledning til prøve med selvvalgt problemstilling i...

university of...

test elo test

statistiske grundbegreber - matematik og statistik ·...

befolkning og valg statistiske efterretninger

vurdering af usikkerhed i forbindelse med statistiske...

forklaring af kvantitative og statistiske begreber til...

forklaring af kvantitative og statistiske begreber til...

test test test

statistiske oversikter 1958 · 2011-12-14 · norges...

Αλφαβητάριο - greek123student’s name: _____...

statistiske meddelelser,

statistik – ordliste og symboler – generelle statistiske...

test test test test

test document test