2. hét

24
2. hét Mintavételes eljárások Becslés

Upload: osgood

Post on 04-Jan-2016

35 views

Category:

Documents


2 download

DESCRIPTION

2. hét. Mintavételes eljárások Becslés. Teljes sokaság vizsgálata. Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat. Jellemezzük a tanulócsoport hallgatóit, mint sokaságot az ösztöndíjuk alapján!. Általános jelölések: sokaság-minta. Mintából való következtetés. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 2. hét

2. hét

Mintavételes eljárások

Becslés

Page 2: 2. hét

Teljes sokaság vizsgálata

Egy tanulócsoport hallgatóinak ösztöndíjaira vonatkozó adatokat

Hallgató sorszáma

Ösztöndíj értéke (Ft)

1 70002 95003 130004 100005 80006 90007 120008 11000

Jellemezzük a tanulócsoport hallgatóit, mint sokaságot az ösztöndíjuk alapján!

Ft

N

i 5,99378

110001200090008000100001300095007000

N

X=X 1

i

Ft

XN

i 122,18788

)5,993711000(...)5,99379500()5,99377000(

N

X=

2221

2

i

Page 3: 2. hét

Általános jelölések: sokaság-minta

Megnevezés Alapsokaságban Mintában

Sokaság elemszáma N n

Az i-edik egyed ismérvértéke Xi xi

Az ismérvértékek átlaga

Az ismérvértékek szórása

N

X

=X

N

ii

1

n

x

=x

n

ii

1

N

XX

=

N

i

2

i

1

1-n

xx

=s

n

i

2i

1

Page 4: 2. hét

Mintából való következtetés

Hipotézisvizsgálat

Becslés:

A sokaság bizonyos jellemzőinek, paraméterének közelítő megállapításával foglalkozik .

Hipotézisvizsgálat:

A sokaságra vonatkozó valamely állítás helyességét ellenőrzi.

Becslés

Page 5: 2. hét

STATISZTIKAI BECSLÉS

Page 6: 2. hét

Alapfogalmak

Becslőfüggvény : egy olyan statisztika, ami valamely sokasági jellemző mintából történő közelítő meghatározását szolgálja.

PontbecslésA becslőfüggvény mintából számított konkrét értéke

IntervallumbecslésAdott megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása

Sokasági jellemző (paraméter): Konfidencia-intervallum egy x1, x2, ….xn mintából:

Meg kell határoznunk a becslő függvénynek azt a és értékeit, melyekre teljesül, hogy π valószínűséggel közrefogják a sokasági paramétert.

Standard hibaA becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása.

)ˆˆPr( fa

a f

Page 7: 2. hét

Becslő függvényekkel szemben támasztott követelményekTorzítatlanság: Torzítatlannak nevezzük a becslő függvényt, ha a várható értéke egyenlő a paraméterrel, ellenkező esetben a becslő függvény torzított.

A továbbiakban a következők becslő függvényeket fogjuk alkalmazni:Mintaátlag (a sokasági várható érték torzítatlan becslő függvénye).A mintabeli relatív gyakoriság (a sokasági megoszlási viszonyszám (valószínűség) torzítatlan becslése).A korrigált tapasztalati szórásnégyzetet (a sokasági szórásnégyzet torzítatlan becslő függvénye.)

Hatásosság: két becslő függvény közül azt tekintjük hatásosabbnak, amelynek kisebb a szórása (standard hibája).

Konzisztencia: a mintanagyság növelésével a becslés nagy valószínűséggel a sokasági paraméter felé, a becslő függvény szórása pedig a nulla felé tart. Ezért nagy minta használata esetén elfogadható az olyan konzisztens becslés is, amely nem torzítatlan.

Page 8: 2. hét

A becslési eljárás lépései

A becslés célja és a sokaságra vonatkozó mintán kívüli információk ismeretében megválasztjuk az alkalmazandó becslő formulát.

Meghatározzuk a mintaátlagot. Megfelelő módon kiszámítjuk a standard hibát. Az elvárt megbízhatósági szintnek megfelelően

meghatározzuk a megbízhatósági együttható értékét az eloszlástáblázatok segítségével.

Meghatározzuk a konfidencia intervallumot.

Page 9: 2. hét

Várható érték intervallum becslése

Alapesetei: Normális eloszlású sokaság, melynek szórása ismert. Normális eloszlású sokaság, melynek szórása nem ismert.

Ha a sokaság nem tekinthető normális eloszlásúnak:

Ebben az esetben a központi határeloszlás már említett tételére támaszkodva azt mondhatjuk, hogy ha kellően nagy méretű mintát vizsgálunk, akkor a változó közelíti a normális eloszlást. Amennyiben kis minta áll rendelkezésre az elemzéshez, úgy egyéni sajátosságokat figyelembe vevő módszereket kell alkalmaznunk.

Page 10: 2. hét

Várható érték becslése

Becslőfüggvény: a mintaátlag

i

ii

f

xfx

n

xx

i

A konfidencia intervallum meghatározása függ:

az x változó alapsokasági eloszlásától ismert-e az alapsokaság szórása a minta nagyságától

Page 11: 2. hét

1.) sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges

2.) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, nagy minta

3.) sokaság eloszlása normális, nem ismert a sokasági szórás, n < 100

σ z x μ x π

s z x μ xπ

s t x μ xπ

x μ x

Page 12: 2. hét

Ahol:

a becslőfüggvény mintából számított konkrét értéke

standard normális eloszlású valószínűségi változó

a mintaátlag standard hibája ( a mintaátlagok szórása)

=n-1 szabadságfokú Student-eloszlású valószínűségi változó

A Student-féle t eloszlás a szabadságfok növelésével a normálishoz tart.

z

x

t

Page 13: 2. hét

Várható érték intervallum becslése

Lépései: A sokaság a vizsgált változó alapján normális eloszlású, a

minta elemszám tetszőleges és a szórását is ismerjük valamilyen korábbi felmérésből.

A várható érték pontbecsléséből kell kiindulnunk. A mintaátlagot standardizáljuk, azaz a következő képlet

alapján transzformáljuk:

Adott π megbízhatósági szint mellett egy normális eloszlású, ismert szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:

x

-x=Z

xzx

Page 14: 2. hét

Mintapélda – várható érték

Nettó töltősúly (g) Üvegek száma (db)1440 - 1460 101461 - 1480 401481 - 1500 1801501 - 1520 501521 - 1540 20

Összesen 300

g

f

xf

=xr

ii

r

iii

1492300

153020...147040145010

1

1

863,050000

3001

300

151

N

n

n=x

Egy élelmiszer-feldolgozó vállalat adatai (N=50.000):

98,0z

z=2,32

xzx 863,032,21492

A sokasági szórás ismeretében (σ=15g) a standard hiba

Page 15: 2. hét

z (z)0,0 0,0000,1 0,0800,2 0,1590,3 0,2360,4 0,3110,5 0,3830,6 0,4520,7 0,5160,8 0,5760,9 0,6321,0 0,6831,1 0,7291,2 0,7701,3 0,8061,4 0,8391,5 0,8661,6 0,890

1,65 0,901,7 0,9111,8 0,9281,9 0,943

1,96 0,952,0 0,955

2,06 0,962,1 0,964

2,17 0,972,2 0,9722,3 0,979

2,32 0,982,4 0,9842,5 0,988

2,58 0,992,6 0,9912,7 0,9932,8 0,9952,9 0,9963,0 0,997

3,30 0,999

Page 16: 2. hét

Várható érték intervallum becslése

Lépései: A sokaság a vizsgált változó alapján normális eloszlású, a minta

elemszám 100 egyednél nagyobb és a szórását nem ismerjük. A várható érték pontbecsléséből kell kiindulnunk. A mintaátlagot standardizáljuk, azaz a következő képlet alapján

transzformáljuk:

Adott π megbízhatósági szint mellett egy normális eloszlású, ismeretlen szórású sokaság várható értékének intervalluma a következő formula segítségével becsülhető:

x

-x=Z

s

xz sx

Page 17: 2. hét

Mintapélda – várható érték

Nettó töltősúly (g) Üvegek száma (db)1440 - 1460 101461 - 1480 401481 - 1500 1801501 - 1520 501521 - 1540 20

Összesen 300

958,050000

3001

300

641,161

n=x

N

nss

Egy élelmiszer-feldolgozó vállalat adatai

95,0z

z=1,96

xz sx 958,096,11492

A mintabeli szórás és a standard hiba meghatározása

gx 1492

16,641g

f

xxf

sr

ii

r

i

2ii

1300

1492153020...14921470401492145010

1

222

1

1

Page 18: 2. hét

Valószínűség vagy arány becslése

Becslőfüggvény: mintabeli relatív gyakoriság

n

kp

A relatív gyakoriság valószínűség-eloszlása a binomiális típusból származtatható. Nagy mintából számított relatív gyakoriság eloszlása közelítőleg normálisnak tekinthető

Feltétel: nagy minta

Page 19: 2. hét

)Pr( pp szpPszp

N

n

n

qps p 1

ahol: p – mintabeli relatív gyakoriság q=1-p

Konfidencia-intervallum

Page 20: 2. hét

Mintapélda – arány

Nettó töltősúly (g) Üvegek száma (db)1440 - 1460 101461 - 1480 401481 - 1500 1801501 - 1520 501521 - 1540 20

Összesen 300

Egy élelmiszer-feldolgozó vállalat adatai (N=50.000):

95,0z

z=1,96

psp z 0215,096,11667,0

Határozzuk meg 95%-os megbízhatóság mellett, hogy a gép áltat megtöltött üvegek közül hány százalék nem haladja meg az 1480 grammot!

1667,0300

50

n

kpMintabeli arány meghatározása:

0215,0300

8333,01667,0

n

qp=s pStandard hiba meghatározása:

95%-os megbízhatósággal a 1480 grammnál kisebb súlyú üvegek aránya legalább 12,465 és legfeljebb 20,88%

Page 21: 2. hét

Szórásnégyzet, szórás becslése

Jellemzői: A szórás pontbecslésére általában a korrigált tapasztalati szórást,

mint torzítatlan becslő függvényt használjuk. A minta normális eloszlású sokaságból származik. Nincs semmiféle korlátozás a minta nagyságára nézve. Becslőfüggvény:

975,02025,020

Pr

2

2

2/

22

)2/1(

22 s1-ns1-nPr

Page 22: 2. hét

Mintapélda – szórás becslése

PontszámDolgozatok száma (db)

0 - 20 821 - 40 2641 - 60 3761 - 80 2381 - 100 6Összesen 100

Egy egyetemen dolgozatírás után a hallgatók által elért pontszámok alakulását vizsgáltuk 100 elemű véletlen kiválasztással gyűjtött minta alapján.

pontx 6,48100

906...3026108

ponts 549,201100

)6,4890(6...)6,4810(8 22

2,746,1292

22 20,5491-10020,5491-100

74,2396,17

39,56356,322 2

Page 23: 2. hét

χ2

Df 0,005 0,01 0,025 0,05 0,10 0,25 0,50 0,75 0,90 0,95 0,975 0,99 0,995

1 0,0000 0,0002 0,0010 0,039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88

2 0,0100 0,0201 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,63 0,072 0,115 0,216 0,352 0,584 1,21 2,37 4,11 6,25 7,81 9,35 11,3 12,84 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,95 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,1 12,8 15,1 16,76 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,57 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,38 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,09 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6

10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,211 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,812 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,313 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,814 4,07 4,66 5,63 6,57 7,79 10,2 13,3 17,1 21,1 23,7 26,1 29,1 31,315 4,60 5,23 6,26 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,816 5,14 5,81 6,91 7,96 9,31 11,9 15,3 19,4 23,5 26,3 28,8 32,0 34,317 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 33,4 35,718 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6 26,0 28,9 31,5 34,8 37,219 6,84 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2 38,620 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,021 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,422 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,3 42,823 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,224 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,2 36,4 39,4 43,0 45,625 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,926 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,327 11,8 12,9 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,628 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,029 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,330 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,740 20,7 22,2 24,4 26,5 29,1 33,7 39,3 45,6 51,8 55,8 59,3 63,7 66,850 28,0 29,7 32,4 34,8 37,7 42,9 49,3 56,3 63,2 67,5 71,4 76,2 79,5 60 35,5 37,5 40,5 43,2 46,5 52,3 59,3 67,0 74,4 79,1 83,3 88,4 92,0 70 43,3 45,4 48,8 51,7 55,3 61,7 69,3 77,6 85,5 90,5 95,0 100,4 104,280 51,2 53,5 57,2 60,4 64,3 71,1 79,3 88,1 96,6 101,9 106,6 112,3 116,390 59,2 61,8 65,6 69,1 73,3 80,6 89,3 98,6 107,6 113,1 118,1 124,1 128,3

100 67,3 70,1 74,2 77,9 82,4 90,1 99,3 109,1 118,5 124,3 129,6 135,8 140,2

Page 24: 2. hét

KÖSZÖNÖM A FIGYELMET!