statistik – lektion 2

Post on 17-Jan-2016

60 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Statistik – Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition. Population Populationsstørrelse N Populationsmiddelværdi μ Populationsvarians σ 2. Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi - PowerPoint PPT Presentation

TRANSCRIPT

Statistik – Lektion 2

Uafhængighed

Stokastiske Variable

Sandsynlighedsfordeling

Middelværdi og Varians for Stok. Var.

Repetition

StikprøveStikprøvestørrelse nStikprøvemiddelværdi Stikprøvevarians s2

PopulationPopulationsstørrelse NPopulationsmiddelværdi μPopulationsvarians σ2

Sandsynligheder

x

Hændelser

SA

SA

S

Hændelse

hændelse Simpel

Udfaldsrum

)(/)()|()()()()(

)(1)(

1)(1)(0

BPBAPBAPBAPBPAPBAP

APAP

SPAP

Simultan og marginal sandsynlighed

Fælles fond bedst B1

Fælles fond dårligst B1

Total

God skole A1 P(A1∩B1) =0.11 0.29 P(A1) = 0.40

Dårlig skole A2 0.06 0.54 0.60

Total 0.17 0.83 P(A)=P(B)=1.00

Simultan sandsynlighed er sandsynligheden for at en eller flere hændelser indtræffer simultant, fx P(A1∩B1)Marginale sandsynligheder beregnes ved at summere over rækker og søjler Holdning til fælles fond B

Sko

le B

Uafhængighed To hændelser er uafhængige hvis:

Lige meget hvilken kombination af hændelser vi vælger, skal uafhængigheden gælde. Hvis bare en kombination viser afhængighed, er hændelserne afhængige.

P(A)P(B)B) P(ALigeledes

P(B)A)|P(Bog

P(A)B)|P(A

Uafhængighed Eksempel: Er der uafhængighed mellem om en fælles

fond er god eller dårlig og om manageren kom fra en god eller dårlig skole?

Fælles fond bedst B1

Fælles fond dårligst B2

Total

God skole A1 0.11 0.29 0.40

Dårlig skole A2 0.06 0.54 0.60

Total 0.17 0.83 1.00

Holdning til fælles fond B

Sko

le B

Check fx om P(B1|A1) = P(B1) el. P(A2∩B2)= P(A2)P(B2)

Lov om Total Sandsynlighed Lov om total sandsynlighed:

I ord: Sandsynligheden for A er lig sandsynligheden for A og B plus sandsynligheden for A og B’s kompliment.

)BP(AB)P(AP(A)

AB

_B

Eksempel – Lov om Totalsandsynlighed Kortspil – find sandsynligheden for at trække et billedkort, A: Det må være sandsynligheden for at trække en billedkort i Hjerter

(H), Spar (S), Ruder (R) eller Klør (K): P(A)=P(A∩H) + P(A∩S) + P(A∩R) + P(A∩K)

= 3/52 + 3/52 + 3/52 + 3/52 = 12/52

Hjerter Spar Ruder Klør

A

A∩H A∩S A∩R A∩K

Bayes’ sætning

P B AP A B

P A

P A B

P A B P A B

P AB P B

P AB P B P AB P B

( )( )

( )

( )

( ) ( )

( ) ( )

( ) ( ) ( ) ( )

Bemærk: Vi har ”vendt” de betingede sandsynligheder!

Bayes’ sætning – Eksempel 2-10 En test for en sjælden sygdom, der rammer 0,1% af

befolkningen (P(I)=0,001), er upræcis. Lad i det følgende:

Sandsynligheden for at testen er positiv når man er syg:

Sandsynligheden for at testen er positiv, når man er rask:

Hvad er så sandsynligheden for at man er syg, givet at testen var positiv?

92.)( IZP

test negativ og test positiv

syg ikke og syg

ZZ

II

04.0)( IZP

)( ZIP

Betragt de forskellig mulige ordninger af drenge (B) og piger (G) i fire fødsler. Der er 2*2*2*2=24 = 16 muligheder og udfaldsrummet er:

BBBB BGBB GBBB GGBB BBBG BGBG GBBG GGBGBBGB BGGB GBGB GGGBBBGG BGGG GBGG GGGG

Hvis pige og dreng er lige sandsynlige, [P(G) = P(B) = 1/2], og kønnet af hvert barn er uafhængig af kønnet på det foregående barn, så er sandsynligheden for hver af disse 16 muligheder:(1/2)(1/2)(1/2)(1/2) = 1/16.

Stokastisk Variabel: Et eksempel

Tæl antallet af piger i hver af de fire fødsler:

BBBB (0) BGBB (1) GBBB (1) GGBB (2)BBBG (1) BGBG (2) GBBG (2) GGBG (3)BBGB (1) BGGB (2) GBGB (2) GGGB (3)BBGG (2) BGGG (3) GBGG (3) GGGG (4)

Bemærk at:• hvert mulig udfald tildeles en enkelt værdi• værdierne, der tildeles varierer over de forskellige udfald

Antallet af piger er en stokastisk variabel:

En stokastisk variabel , X, er en funktion, der tildeler en enkelt, men variabel værdi til hvert element i udfaldsrummet.

Eksempel - fortsat

Eksempel - fortsat

BBBB BGBB GBBB

BBBG BBGB

GGBB GBBG BGBG

BGGB GBGB BBGG BGGG GBGG

GGGB GGBG

GGGG

0

1

2

3

4

XX

Udfalds rumPunkter på den reelle linie

Stokastisk variabel En stokastisk variabel X er en funktion defineret på S

(udfaldsrummet), der antager værdier på R (reelle tal)

I eksperimenter knyttes en talværdi til hvert udfald:

Stokastiske variable kan enten være diskrete eller kontinuerte. Diskrete: Antager et endeligt antal værdier Kontinuerte: Antager værdier i en mængde af reelle tal

X: S R

S

oi

RX(oi)

X

0

Eksempler på diskrete og kontinuerte variable

EksperimentEksperiment Stokastisk variabelStokastisk variabel TypeType

Kast med terning Antal øjne Diskret

Kast med 2 terninger Sum af antal øjne Diskret

Familie i Danmark Antal børn Diskret

Familie i Danmark Indkomst Kontinuert

Kvinder i Danmark Højde Kontinuert

Baby Fødselsvægt Kontinuert

Resten af denne forelæsning ser vi på diskrete stokastiske variable

Eksempel: Den stokastisk variabel X = 3 når de følgende fire hændelser BGGG, GBGG, GGBG, eller GGGB forekommer,

P(X = 3) = P(BGGG) + P(GBGG) + P(GGBG) + P(GGGB) = 4/16

Sandsynligheds fordelingen af en stokastisk variabel er en tabel, der opskriver alle de mulige værdier af en stokastisk variabel og deres tilknyttede sandsynligheder.

x P(x)For eksemplet: 0 1/16

1 4/162 6/163 4/164 1/16

16/16=1

Eksempel - fortsat

Eksempel - fortsat

Number of Girls, X

Pro

bability

, P(X

)

43210

0.4

0.3

0.2

0.1

0.0

1/ 16

4/ 16

6/ 16

4/ 16

1/ 16

Probability Distribution of the Number of Girls in Four Births

Number of Girls, X

Pro

bability

, P(X

)

43210

0.4

0.3

0.2

0.1

0.0

1/ 16

4/ 16

6/ 16

4/ 16

1/ 16

Probability Distribution of the Number of Girls in Four Births

Sandsynligheds fordeling

x.af værdier alle for 0)( .1 xP

Definition: Lad X:S→R være en diskret stokastisk variabel.

P(X=x) = P(x) er en sandsynligheds-fordeling (-funktion) for X, hvis:

1)( 2. xallexP

Kumulativ fordelingsfunktion

xi

iPxXPxF )( )()(

Den kumulative fordelingsfunktion, F(x), for en diskret stokastisk variabel X er:

x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.00

x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.0043210

1 .0

0 .9

0 .8

0 .7

0 .6

0 .5

0 .4

0 .3

0 .2

0 .1

0 .0

x

F(x

)

Kumulative fordelingsfunktions for antallet af piger ved 4 fødsler:

16

4

Eksempel - fortsat

16/1416/116150331

16111651112

16/1122

/)F()F()XP(

//)F()P(X

)F()P(Xx P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.00

x P(x) F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 16/16

1.00

Middelværdi Middelværdien af en diskret stokastisk variabel X er

givet ved:

Dvs. summen af værdien gange sandsynligheden for værdien – et vægtet gennemsnit.

Bemærk! Middelværdi kaldes også den forventede værdi.

x

xxPXE )()(

Middelværdi - Eksempelx P(x) xP(x)0 1/161 4/162 6/163 4/164 1/16

16/16=1

Eksempel: X er antal øjne ved terningkast. Dvs. P(X=1) = P(X=2) = … = P(X=6) =1/6.Middelværdien er da:

5,36

1654321

6

1)()(

6

1

6

1

xx

xxxPXE

Variansen er den vægtede gennemsnitlige kvadrerede afvigelse af værdierne af en stokastisk variabel fra gennemsnittet.

Standard afvigelsen er kvadratroden af variansen:

Varians

2

222

222

)()()]([)(

)()(])[()(

xx

x

xxPxPxXEXE

xPxXEXV

)()( XVXSD

Varians - eksempelx x2 P(x) x2P(x) xP(x)0 0 1/16 0 01 1 4/16 4/16 4/16 2 4 6/16 24/16 12/163 9 4/16 36/16 12/164 16 1/16 16/16 4/16

1 80/16 32/16

)()()]([)()(

2

2222

xx

xxPxPxXEXEXV

Chebyshevs Sætning For en stokastisk variabel X med middelværdi μ

og varians σ2 og ethvert tal k>1 gælder:

Ex: k=2:

Dvs. at med mindst 75% sandsynligheden er X mindre end to standardafvigelser fra μ.

211)|(| kkXP

43)2|(| XP

Regneregler for middelværdi og varians

)()(

)()(2 xVabaXV

bXaEbaXE

Regneregler for en lineær funktion af X:

x

xPxhXhE )()())((

Hvis X er en diskret stokastisk variabel, da er middelværdien for en funktion h(X) givet ved

Regneregler for middelværdi og varians

)()()()(

)()()()(

22112211

2121

kkkk

kk

XEaXEaXEaXaXaXaE

XEXEXEXXXE

Middelværdien af en linearkombination af stokastiske variable X1,X2,…,Xk.

)()()()(

)()()()(2

2221

212211

2121

kkkk

kk

XVaXVaXVaXaXaXaV

XVXVXVXXXV

Hvis X1,X2,…,Xk er indbyrdes uafhængige, så:

top related