stikprøvefordelinger og konfidensintervaller
DESCRIPTION
Stikprøvefordelinger og konfidensintervaller. Stikprøvefordelingen for middelværdi Den Centrale Grænseværdi Sætning Egenskaber Ved Estimatore Konfidensintervaller t-fordelingen. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/1.jpg)
Stikprøvefordelinger og konfidensintervaller
Stikprøvefordelingen for middelværdiDen Centrale Grænseværdi SætningEgenskaber Ved EstimatoreKonfidensintervallert-fordelingen
![Page 2: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/2.jpg)
• En estimatorestimator af en populations parameter er en stikprøve statistik, der bruges til at estimere populations parameteren.
• Et estimatestimat a af en parameter er en bestemt numerisk værdi af en stikprøve statistik.
• Et punkt-estimatpunkt-estimat er en enkelt værdi, der bruges som et estimat for en populations parameter.
• Et interval-estimat interval-estimat er et interval, der bruges som et estimat for en populations parameter.
En populations parameterpopulations parameter er et numerisk mål for en opsummerende karakteristik af populationen.
Estimator og estimat En stikprøve statistik stikprøve statistik er et
numerisk mål for en opsummerende karakteristik af stikprøven.
fx x fx
Eksempel: er en estimator for . er et (punkt) estimat af .
X
x
![Page 3: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/3.jpg)
XX
XXX
XX
XXX
XXX
XXX
XX
Populations middelværdi ()
Stikprøve
Frekvens fordeling af populationen
Stikprøve gennemsnit ( )
Populations fordeling, stikprøve, populations middelværdi og stikprøve gennemsnit.
X
er selv en stokastisk variabel, der følger en fordeling.
X
][XE
n
i ixn 1
1
![Page 4: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/4.jpg)
Stikprøve-fordeling Antag X1,X2,…,Xn er en uafhængig stikprøve, hvor μX=E[X] og
σ2X=V[X] er populationens middelværdi og varians.
Stikprøve-middelværdien er
Den forventede værdi af stikprøve-middelværdien er lig med populations-middelværdien
Variansen af stikprøve middelværdien er lig med populations variansen divideret med stikprøve-størrelsen
XXXE )(
nXV X
X
22)(
n
i iXn
X1
1
![Page 5: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/5.jpg)
Stikprøve-fordeling – Normalfordelt stikprøve
Hvis X normal fordelt, så er normalfordelt:
Hvilken fordeling følger , hvis stikprøven ikke er normalfordelt…?
X
n
NX XX
2
,~
X
![Page 6: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/6.jpg)
Uniform population af heltal fra 1 til 8:
X P(X) XP(X) X2 P(X)X2
1 0.125 0.125 1 0.1252 2 0.125 0.250 4 0.53 0.125 0.375 9 1.1254 0.125 0.500 16 2.05 0.125 0.625 25 3.1256 0.125 0.750 36 4.57 0.125 0.875 49 6.1258 0.125 1.000 64 8.0 1.000 4.500 25.5
V(X) = E[X2] - (E[X])2 = 25.5-4.52 = 5.25
X P(X) XP(X) X2 P(X)X2
1 0.125 0.125 1 0.1252 2 0.125 0.250 4 0.53 0.125 0.375 9 1.1254 0.125 0.500 16 2.05 0.125 0.625 25 3.1256 0.125 0.750 36 4.57 0.125 0.875 49 6.1258 0.125 1.000 64 8.0 1.000 4.500 25.5
V(X) = E[X2] - (E[X])2 = 25.5-4.52 = 5.25
87654321
0.2
0.1
0.0
X
P(X
)
Uniform Distribution (1,8)
E(X) = E(X) = = 4.5 = 4.5V(X) = V(X) = 22 = 5.25 = 5.25SD(X) = SD(X) = = 2.2913 = 2.2913
Stikprøve fordelinger
![Page 7: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/7.jpg)
Stikprøve fordelinger Der er 8*8 = 64 forskellige
men lige sandsynlige stikprøver af 2 tal, man kan tage (med tilbagelægning) fra en uniform population af heltallene fra 1 til 8:
Hver af disse stikprøver har et gennemsnit. For eksempel er gennemsnittet af (1,4) lig 2.5 og gennemsnittet af (8,4) er 6.0.
Stikprøve gennemsnit 1 2 3 4 5 6 7 8 1 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 2 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 3 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 4 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 6 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0
Stikprøver af 2 tal fra Uniform (1,8) 1 2 3 4 5 6 7 8 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 5 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 6 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 7 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 8 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8
![Page 8: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/8.jpg)
Stikprøve fordelingen
Sandsynligheds fordelingen af stikprøve middelværdien kaldes stikprøve fordelingen af stikprøve middelværdienstikprøve fordelingen af stikprøve middelværdien.
8.07.57.06.56.05.55.04.54.03.53.02.52.01.51.0
0.10
0.05
0.00
X
P(X
)
Stikpøve fordeling X P(X) XP(X) X-X (X-X)2 P(X)(X-X)2
1.0 0.015625 0.015625 -3.5 12.25 0.1914061.5 0.031250 0.046875 -3.0 9.00 0.2812502.0 0.046875 0.093750 -2.5 6.25 0.2929692.5 0.062500 0.156250 -2.0 4.00 0.2500003.0 0.078125 0.234375 -1.5 2.25 0.1757813.5 0.093750 0.328125 -1.0 1.00 0.0937504.0 0.109375 0.437500 -0.5 0.25 0.0273444.5 0.125000 0.562500 0.0 0.00 0.0000005.0 0.109375 0.546875 0.5 0.25 0.0273445.5 0.093750 0.515625 1.0 1.00 0.0937506.0 0.078125 0.468750 1.5 2.25 0.1757816.5 0.062500 0.406250 2.0 4.00 0.2500007.0 0.046875 0.328125 2.5 6.25 0.2929697.5 0.031250 0.234375 3.0 9.00 0.2812508.0 0.015625 0.125000 3.5 12.25 0.191406
1.000000 4.500000 2.625000
Stikprøve fordelinger
2
25,5625,2)(
5,4)(2
nXV
XE
![Page 9: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/9.jpg)
• Ved at sammenligne populations-fordelingen og stikprøve-fordelingen af middelværdien, ser man at:Stikprøve-fordelingen er
mere klokkeformet og den er symmetrisk.
Begge har samme middelværdi.
Stikprøve fordelingen er mere kompakt, med en mindre varians.
• Ved at sammenligne populations-fordelingen og stikprøve-fordelingen af middelværdien, ser man at:Stikprøve-fordelingen er
mere klokkeformet og den er symmetrisk.
Begge har samme middelværdi.
Stikprøve fordelingen er mere kompakt, med en mindre varians.
X
Stikprøvefordeling af middelværdien
8.07.57.06.56.05.55.04.54.03.53.02.52.01.51.0
0.10
0.05
0.00
X
P(X
)
Stikpøve-fordeling
87654321
0.2
0.1
0.0
X
P(X
)
Uniform Distribution (1,8)
![Page 10: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/10.jpg)
Den centrale grænseværdi sætning (CLT) Stikprøve fordelingen af middelværdien af en stikprøve
taget fra en vilkårlig population er approksimativ normal fordelt for tilstrækkelig store n.
I andre ord: Hvis X1,…,Xn er en uafhængig stikprøve fra en vilkårlig population, så gælder
hvis n er stor nok. Jo større n er, jo tættere er stikprøve middelværdien
på at følge en normal-fordeling. I praksis er n>30 I praksis er n>30 noknok.
n
NX2
,~
![Page 11: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/11.jpg)
Eksempler: Stikprøvefordelingen forNormal Uniform Skewed
Population
n = 2
n = 30
XXXX
General
X
![Page 12: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/12.jpg)
Summeopgave
Gennemsnitsløn et år efter endt cand.oecon uddannelsen: 30.000kr/md
Hvad er sandsynligheden for at 25 tilfældigt udvalgte cand.oecon’er har en gennemsnitsløn på mindre end 29.000kr/md? Antag, at standard afvigelsen er kendt og er 2.500kr/md.
![Page 13: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/13.jpg)
• Populations andelenPopulations andelen er andelen af ”succeser” i populationen:
• Stikprøve andelen Stikprøve andelen er andelen af succeser i stikprøven:
Stikprøve andelen er et estimatestimat af populations andelen p.
Populations og stikprøve andele
n
xp ˆ
N
Xp
![Page 14: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/14.jpg)
Populations og stikprøve andele - fortsat
• Den tilsvarende estimatorestimator er
Hvor X følger en binomial fordeling med antals parameter n og sandsynligshedparameter p, dvs. X~B(n,p).
n
XP ˆ
Eksempel: n=10 og p=0.40
Da X~B(5,0.4) kan vi slå op i Tabel 1 side 773 for den kumulerede binomialfordeling:
55.05.0ˆ
XP
n
XPPP
834.05 XP
![Page 15: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/15.jpg)
Populations og stikprøve andele - fortsat
Genkald at X = X1+…+Xn , hvor Xi er et Bernoulli forsøg, hvor sandsynligheden for succes er P(Xi=1)=p.
Derfor E[Xi]=p og V[Xi]=p(1-p). Ifølge CLT har vi (approksimativt):
Approksimationen er god, hvis bådebåde np og n(1-p) er større end 5.
n
pppN
n
XP
1,~ˆ
Eksempel: n=10 og p=0.40 (her er approksimationen ikke god)
74.065.0/)1(
5.0
/)1(
ˆ5.0ˆ
ZPnpp
p
npp
pPPPP
![Page 16: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/16.jpg)
En central (unbiased) central (unbiased) estimator rammer i gennemsnit målet.
En ikke-central (biased)ikke-central (biased) estimator rammer i gennemsnit ikke målet.
{
Bias
Central og ikke-central estimator
![Page 17: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/17.jpg)
En estimator er effektiveffektiv hvis den har en relativ lille varians (og standard afvigelse).
En estimator er effektiveffektiv hvis den har en relativ lille varians (og standard afvigelse).
En effektiveffektiv estimator er, gennemsnitlig set, tættest på parameteren, der estimeres.
En ineffektiv ineffektiv estimator er, gennemsnitlig set, længere væk fra parameteren, der estimeres.
Effektiv estimator
![Page 18: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/18.jpg)
En estimator er konsistentkonsistent hvis sandsynligheden for at ligge tæt på den parameter, den estimerer, stiger, når størrelsen på stikprøven stiger.
En estimator er konsistentkonsistent hvis sandsynligheden for at ligge tæt på den parameter, den estimerer, stiger, når størrelsen på stikprøven stiger.
n = 100n = 10
KonsistensKonsistens
Konsistent og sufficient estimator
![Page 19: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/19.jpg)
Estimatorerne
Alle de gennemgåede estimatorer er ”de bedste” i ovenfor nævnte forstand.
Se på estimatet for variansen:
Hvorfor divideres med n-1 og ikke med n? Fordi ellers er den ikke en central estimator. Desuden handler det også om antallet af frihedsgrader…
1
)(1
2
2
n
xxs
n
ii
01
n
i i xxBemærk:
![Page 20: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/20.jpg)
Konfidens intervaller
Konfidens intervaller for:Konfidens interval for middelværdi, varians kendtKonfidens interval for middelværdi, varians ukendt
![Page 21: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/21.jpg)
Konfidens intervaller
Et punkt-estimatpunkt-estimat estimerer værdien af en ukendt populations parameter ved en enkelt værdi. Fx: Middelhøjden blandt oecon studernde .
Et konfidens intervalkonfidens interval er et interval, der estimerer værdien af en ukendt populations parameter. Kaldes også et interval estimatinterval estimat. Sammen med intervallet gives et mål for, hvor sikker man er på, at den sande populations parameter ligger i intervallet. Dette mål kaldes for konfidens niveauetkonfidens niveauet.
Et punkt estimat indeholder ikke meget information om den faktiske værdi af μ – fx hvor sikkert er vores punkt estimat?
Et interval estimat indeholder flere informationer, for eksempel: Vi er 95% sikre på, at intervallet [164,8 ; 180,7] indeholde den sande
middelværdi μ. Eller vi er 90% sikre på, at intervallet [166,1 ; 179,3] indeholder den
sande middelværdi μ.
73,172x
![Page 22: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/22.jpg)
Konfidensinterval for middelværdien - når X er normal-fordelt eller stikprøven er stor Da gælder følgende:
En 95% konfidensinterval for middelværdikonfidensinterval for middelværdi
95.096.196.1
95.096.196.1
nX
nXP
nX
nP
95.096.196.1
95.096.196.1
nX
nXP
nX
nP
),(~2
nNX
nx
96.1
nx
96.1 Bemærk at estimatoren er
er ersattet med estimatet .xX
![Page 23: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/23.jpg)
Mellemregninger….
95.096,196.1
95.096,196.1
95.096,196.1
95.096,1/
96.1
)(
)1,0(95.0)96,196.1(2
nX
nXP
nX
nP
nX
nP
n
XP
n
σμ,~NX
Z ~NZP
:at gælder Da
hvor ,
95.096,196.1
95.096,196.1
95.096,196.1
95.096,1/
96.1
)(
)1,0(95.0)96,196.1(2
nX
nXP
nX
nP
nX
nP
n
XP
n
σμ,~NX
Z ~NZP
:at gælder Da
hvor ,
0,0250,025
0,95
![Page 24: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/24.jpg)
Konfidens interval for middelværdi
Approksimativt 95% af stikprøve middelværdierne kan forventes at falde indenfor intervallet
Omvendt, cirka 2.5% kan forventes at være under og 2.5% kan forventes at være over . Så 5% kan forventes at være udenfor intervallet. .
Approksimativt 95% af stikprøve middelværdierne kan forventes at falde indenfor intervallet
Omvendt, cirka 2.5% kan forventes at være under og 2.5% kan forventes at være over . Så 5% kan forventes at være udenfor intervallet. .
196 196. , .n n
196.n
196.n
0.4
0.3
0.2
0.1
0.0x
f(x)
Sampling Distribution of the Mean
xx
x
x
x
x
x
x
2.5%
95%
2.5%
196.
n 196.
n
x
2.5% falder over intervallet
2.5% falder nedenfor intervallet
95% falder indenfor intervallet
![Page 25: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/25.jpg)
Approksimativt 95% af intervallerne omring stikprøve middelværdien kan forventes at indeholde den faktiske værdi af populations middelværdien, .
*5% af sådanne intervaller omkring stikprøve middelværdien kan forventes ikkeikke at inkludere den faktiske værdi af populations middelværdien.
Approksimativt 95% af intervallerne omring stikprøve middelværdien kan forventes at indeholde den faktiske værdi af populations middelværdien, .
*5% af sådanne intervaller omkring stikprøve middelværdien kan forventes ikkeikke at inkludere den faktiske værdi af populations middelværdien.
x xx
nx 96.1
0.4
0.3
0.2
0.1
0.0x
f(x)
Sampling Distribution of the Mean
x
x
x
x
x
x
x
x
2.5%
95%
2.5%
196.
n 196.
n
x
xx*
*
Konfidens interval for middelværdi
![Page 26: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/26.jpg)
Et (1-)100% konfidens interval for Vi definerer som den z-værdi, hvor sandsynligheden for at Z er
højere end denne værdi, er . Kaldes også fraktilen eller den
kritiske værdi.
(1-α)100% kaldes konfidens-niveauet.
2
z2
P z z
P z z
P z z z
2
2
2 2
1( )
100% konfidens interval:543210-1-2-3-4-5
0.4
0.3
0.2
0.1
0.0
Z
f(z)
Stand ard Norm al
z2
( )1
z2
2
2
fordeling
2
nzx
2
![Page 27: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/27.jpg)
0.99 0.005 2.576
0.98 0.010 2.326
0.95 0.025 1.960
0.90 0.050 1.645
0.80 0.100 1.282
( )1 2
z2
Kritiske værdier for z og konfidens-niveauer
543210-1-2-3-4-5
0.4
0.3
0.2
0.1
0.0
Z
f(z)
Stand ard Norm al Distrib ution
z2
( )1
z2
2
2
![Page 28: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/28.jpg)
![Page 29: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/29.jpg)
Når man tager stikprøver fra den samme population og bruger den samme
stikprøve størrelse, så jo højere et konfidens-niveau, jo bredere et
konfidens-interval.
Når man tager stikprøver fra den samme population og bruger den samme
stikprøve størrelse, så jo højere et konfidens-niveau, jo bredere et
konfidens-interval.
543210-1-2-3-4-5
0.4
0.3
0.2
0.1
0.0
Z
f(z)
Stand ard Nor m al Dis tri buti on
nx
28.1
:interval konfidens 80%
543210-1-2-3-4-5
0.4
0.3
0.2
0.1
0.0
Z
f(z)
Stand ard Nor m al Distri buti on
nx
96.1
:interval konfidens 95%
Konfidens niveau og bredden af konfidens-intervallet
![Page 30: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/30.jpg)
Stikprøvestørrelsen og bredden af konfidens-intervallet
Når man tager stikprøver fra den samme population og bruger det
samme konfidens niveau, så jo større stikprøvestørrelse, n, jo
smallere et konfidens interval.
Når man tager stikprøver fra den samme population og bruger det
samme konfidens niveau, så jo større stikprøvestørrelse, n, jo
smallere et konfidens interval.
0 .9
0 .8
0 .7
0 .6
0 .5
0 .4
0 .3
0 .2
0 .1
0 .0
x
f(x)
S am p ling D is trib utio n o f the M e an
95% konfidensinterval: n = 40
0 .4
0 .3
0 .2
0 .1
0 .0
x
f(x)
S am p ling D is trib utio n o f the M e an
95% konfidensinterval: n = 20
![Page 31: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/31.jpg)
Eksempel på tavlen
![Page 32: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/32.jpg)
Hvis populations standard afvigelsen, σ, er ukendt, erstat σ med stikprøve standard afvigelsen, s. Hvis populationen er normal, så er: t-fordelt med (n-1) frihedsgrader (degrees of freedom).
• t fordelingen er klokkeformet og symmetrisk og defineret ved antal frihedsgrader (df).
• Middelværdien er altid lig 0.
• Variansen af t er større end 1, men går mod 1, når antallet af frihedsgrader vokser.
• t fordelingen er fladere og har tykkere haler en standard normal fordelingen.
• t fordelingen går mod standard normal fordelingen nå antallet af frihedsgrader vokser.
nsXt/
Standard normal
t, df=20
t, df=10
Student’s t fordeling
![Page 33: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/33.jpg)
Et (1-)100% konfidens interval for når er ukendt (og man antager en normalfordelt population):
hvor er værdien i t fordelingen med n-1 frihedsgraders, hvor
sandsynligheden for at t er højere end denne værdi, er .
Et (1-)100% konfidens interval for når er ukendt (og man antager en normalfordelt population):
hvor er værdien i t fordelingen med n-1 frihedsgraders, hvor
sandsynligheden for at t er højere end denne værdi, er .
t2
2
Konfidens interval for når er ukendt - t fordelingen
n
stx
2
![Page 34: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/34.jpg)
df t0.100 t0.050 t0.025 t0.010 t0.005
--- ----- ----- ------ ------ ------ 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845 21 1.323 1.721 2.080 2.518 2.831 22 1.321 1.717 2.074 2.508 2.819 23 1.319 1.714 2.069 2.500 2.807 24 1.318 1.711 2.064 2.492 2.797 25 1.316 1.708 2.060 2.485 2.787 26 1.315 1.706 2.056 2.479 2.779 27 1.314 1.703 2.052 2.473 2.771 28 1.313 1.701 2.048 2.467 2.763 29 1.311 1.699 2.045 2.462 2.756 30 1.310 1.697 2.042 2.457 2.750 40 1.303 1.684 2.021 2.423 2.704 60 1.296 1.671 2.000 2.390 2.660120 1.289 1.658 1.980 2.358 2.617
1.282 1.645 1.960 2.326 2.576
0
0 .4
0 .3
0 .2
0 .1
0 .0
t
f(t)
t D is trib utio n: d f= 1 0
Areal = 0.10
}
Areal = 0.10
}
Areal = 0.025
}Arela = 0.025
}1.372-1.3722.228-2.228
For store frihedsgrader kan t fordelingen approksimeres ved en standard normal fordeling.
For store frihedsgrader kan t fordelingen approksimeres ved en standard normal fordeling.
t Fordelingen
![Page 35: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/35.jpg)
En aktie analytiker vil estimere den gennemsnitlige gevinst på en bestemt aktie. En stikprøve på 15 dage giver en gennemsnitlig gevinst på og en standard afvigelse på s = 3.5%. Antag en normal population og giv et 95% konfidens interval for den gennemsnitlige gevinst på denne aktie.
En aktie analytiker vil estimere den gennemsnitlige gevinst på en bestemt aktie. En stikprøve på 15 dage giver en gennemsnitlig gevinst på og en standard afvigelse på s = 3.5%. Antag en normal population og giv et 95% konfidens interval for den gennemsnitlige gevinst på denne aktie.
Den kritiske værdi af t for df = (n -1) = (15 -1) = 14 og et højre halet areal på α/2 = 0.025 er:
Konfidens intervallet er:
t0 025 2.145.
x tsn
0 025
10 37 2.1453515
10 37 1948 4312.31
.
..
. .. ,
Eksempel 6-2
%37.10x
df t0.100 t0.050 t0.025 t0.010 t0.005
--- ----- ----- ------ ------ ------ 1 3.078 6.314 12.706 31.821 63.657 . . . . . . . . . . . . . . . . . . 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 . . . . . . . . . . . . . . . . . .
![Page 36: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/36.jpg)
5. end størreer og bådenår nok,stor er stikprøveEn
.ˆ værdi,estimerede
den bruges ukendt,er andelen populationNår .hvor ,=)ˆV(
og =)ˆE( med fordelt, normal tivapproksima ˆer så stor,er størrelsenstikprøve Hvis .ˆ andelen, stikprøveer , andelen, spopulation afn Estimatore
qnpn
p
p)-(1=qn
pqp
ppppp
Konfidens interval for populations andelen, p, for store stikprøver
.p̂-1=q̂ og , ),størrelsen (stikprøve forsøg afantallet meddivideret ,,stikprøven ier succes' afantallet med liger ,p̂ andelen, stikprøvehvor
givet veder andelen, spopulationfor interval konfidens )100%-(1Et
ˆˆ
2
ˆ
nx
: p,
nqp
αzp
![Page 37: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/37.jpg)
Hvor stor en andel har udenlandske firmaer af det amerikanske marked for et eller andet produkt. En stikprøve på 100 forbrugere udtages og 34 af disse bruger det udenlandske produkt; resten bruger det amerikanske produkt. Giv et 95% konfidensinterval for andelen af brugere af udenlandske produkter.
Hvor stor en andel har udenlandske firmaer af det amerikanske marked for et eller andet produkt. En stikprøve på 100 forbrugere udtages og 34 af disse bruger det udenlandske produkt; resten bruger det amerikanske produkt. Giv et 95% konfidensinterval for andelen af brugere af udenlandske produkter.
4328.0,2472.00928.034.0
)04737.0)(96.1(34.0100
)66.0)(34.0(96.134.0
ˆˆˆ
2
n
qpzp
Eksempel 6-4
![Page 38: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/38.jpg)
Konfidens interval for populations variansen: Chi i anden (2) fordelingen Stikprøve variansen, s², er en central estimator for populations
variansen σ². Konfidens intervaller for populations variansen baseres på 2
fordelingen. 2 fordelingen er sandsynligheds fordelingen for en sum af
uafhængige kvadrerede standard normal fordelte stokastiske variable.
Middelværdien er lig med antallet af frihedsgraden, E(X)=df Variansen er lig med to gange antallet af frihedsgrader, V(X)=2df
![Page 39: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/39.jpg)
En 2 fordelt stokastisk variabel kan ikke være negativ, så den er begrænset af 0 til venstre.
Fordelingen er højre skæv. Fordelingen går mod normal
fordelingen, når antallet af frihedsgrader vokser.
100500
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
2
f(2
)
Chi-Square D istribution: d f=10 , df=30, df=50
df = 10
df = 30
df = 50
der.frihedsgra 1)-(n med fordelt
:variabel estokastisk den er så fordeling, normal en fra taget er stikprøven Hvis
2
2
2
2)1( sn
der.frihedsgra 1)-(n med fordelt
:variabel estokastisk den er så fordeling, normal en fra taget er stikprøven Hvis
2
2
2
2)1( sn
2 fordelingen
![Page 40: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/40.jpg)
Areal i højre hale
.995 .990 .975 .950 .900 .100 .050 .025 .010 .005
Areal i venstre hale
df .005 .010 .025 .050 .100 .900 .950 .975 .990 .995
1 0.0000393 0.000157 0.000982 0.000393 0.0158 2.71 3.84 5.02 6.63 7.88 2 0.0100 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60 3 0.0717 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84 4 0.207 0.297 0.484 0.711 1.06 7.78 9.49 11.14 13.28 14.86 5 0.412 0.554 0.831 1.15 1.61 9.24 11.07 12.83 15.09 16.75 6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55 7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95 9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.5910 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.1911 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.7612 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.3013 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.8214 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.3215 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.8016 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.2717 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.7218 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.1619 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.5820 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.0021 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.4022 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.8023 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.1824 9.89 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.5625 10.52 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.9326 11.16 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.2927 11.81 12.88 14.57 16.15 18.11 36.74 40.11 43.19 46.96 49.6528 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67
Sandsynligheder i 2 fordelingen
![Page 41: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/41.jpg)
Et (1-)100% konfidens interval for populations variansen * (hvis populationen er normal fordelt) er givet som:
hvor er fraktilen i 2 fordelingen og er fraktilen.
( ),( )n s n s
1 12
2
2
2
12
2
2
2 1
2
2
2
12
Bemærk: Fordi 2 fordelingen er skæv, er konfidens-intervallet for populations-variansen ikke symmetrisk.
Bemærk: Fordi 2 fordelingen er skæv, er konfidens-intervallet for populations-variansen ikke symmetrisk.
Konfidens interval for populations variansen
![Page 42: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/42.jpg)
En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige indhold er forskellig fra hvad det skal være, kan maskinen justeres. Hvis variansen er for høj, skal maskinen sendes til reparation. En stikprøve på 30 kander giver et varians estimat på s2 = 18,540. Giv et 95% konfidens interval for populations variansen, 2.
En maskine fylder kaffekander (med kaffe ;-) Hvis det gennemsnitlige indhold er forskellig fra hvad det skal være, kan maskinen justeres. Hvis variansen er for høj, skal maskinen sendes til reparation. En stikprøve på 30 kander giver et varians estimat på s2 = 18,540. Giv et 95% konfidens interval for populations variansen, 2.
33604,117650.16
18540)130(,
7.45
18540)130()1(,
)1(2
21
2
2
2
2
snsn 33604,11765
0.16
18540)130(,
7.45
18540)130()1(,
)1(2
21
2
2
2
2
snsn
Eksempel 6-5
![Page 43: Stikprøvefordelinger og konfidensintervaller](https://reader030.vdocuments.pub/reader030/viewer/2022032804/56812ac4550346895d8e9745/html5/thumbnails/43.jpg)
706050403020100
0.06
0.05
0.04
0.03
0.02
0.01
0.00
2
f (2
)
Chi-Square Distribution: df = 29
0.0250.025
0.95
0 975
2 16 05. . 0 025
2 4572. .
Eksempel
Areal i højre hale
df .995 .990 .975 .950 .900 .100 .050 .025 .010 .005
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.9929 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.3430 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67