tÁrsadalomstatisztika vi. mintavÉtel előadó: prof. dr. besenyei lajos

Post on 19-Jan-2016

49 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

TÁRSADALOMSTATISZTIKA VI. MINTAVÉTEL Előadó: Prof. Dr. Besenyei Lajos. A sokaság egy részének kiválasztását mintavételnek , a sokaság így kiválasztott részét mintának nevezzük. Alapkövetelmény: a sokaság helyes definiálása. Mintavételi keret. - PowerPoint PPT Presentation

TRANSCRIPT

TÁRSADALOMSTATISZTIKA VI.

MINTAVÉTEL

Előadó: Prof. Dr. Besenyei Lajos

A sokaság egy részének kiválasztását mintavételnek, a sokaság így kiválasztott részét mintának nevezzük.

Alapkövetelmény: a sokaság helyes definiálása. Mintavételi keret.

A statisztikai hibák két nagy csoportja:

a) Nem mintavételi hiba (mérési, kódolási, kérdezési stb.)

b) Mintavételi hiba, nem a teljes sokaságot, hanem annak csak egy részét figyeljük meg.

MINTAVÉTELI MÓDOK

1.Véletlen, valószínűségi

Ismert, vagy meghatározható a sokaság elemeinek mintába kerülési esélye. Mintavételi hiba csak itt számítható

1.1. Egyszerű véletlen (EV)

1.2. Rétegzett (R)

1.3. Csoportos (CS)

1.4. Többlépcsős (TL)

2. Nem véletlen

2.1. (EV) Szisztematikus

2.2. Kvótás

2.3. Koncentrált

2.4. Önkényes (szubjektív)

1.1. Egyszerű véletlen kiválasztás (EV)

Homogén, véges elemszámú sokaság esetén,

visszatevés nélkül, minden lehetséges „n” elemű

minta kiválasztásnak azonos esélyt adva.

Alkalmazásához komplett lista szükséges.

Kiválasztási technika:

• sorsolás

• véletlen számok generálása

• szisztematikus

1.2. Rétegzett minta (R)

Heterogén sokaság esetén alkalmazzuk.

(A sokaságot homogén részekre bontják, ezeken

belül egyszerű véletlen mintavételt hajtanak

végre.)

Előnye, hogy azonos mintanagyság esetén kisebb

mintavételi hibát eredményez, mint a rétegzés

nélküli EV mintavétel.

A minta elemszámának elosztása az egyes rétegekközött:

a) Egyenletes elosztás:

minden rétegbe azonos számú mintaelem kerül

b) Arányos elosztás:

a tényleges, sokasági arányoknak megfelelően

történik a rétegenkénti elosztás

c) Neyman-féle optimális elosztás:

a rétegenkénti szórásokat vesszük figyelembe.

(nagyobb szórású rétegből nagyobb

elemszámot veszünk figyelembe)

d) Költségoptimális elosztás

a szórások mellett vannak információink

(vagy feltételezéseink) az egységek

költségeiről is

1.3. Csoportos (CS) minta

Nincs (vagy igen költséges) a teljes lista beszerzése,

de nagyobb összetartozó egységekre rendelkezésre

áll.

Csoportos mintavétel esetén a csoportok halmazából

EV mintát veszünk, s ezen belül teljeskörű

megfigyelést végzünk.

(pl. középiskolások szórakozási szokásai: a

középiskolák közül véletlenszerűen választunk, a

kiválasztottaknál minden tanulót megkérdezünk.)

Elsődleges mintavételi egység:

Amire a felvétel közvetlenül irányul.

Végső mintavételi egység:

Amelyikre nézve következtetéseket kívánunk levonni.

1.4. Többlépcsős mintavétel (TL)

A CS mintát tovább bontjuk: a kiválasztott

elsődleges egységeken belül további mintavételt

hajtunk végre.

(Nem kérdezünk meg minden középiskolás

diákot a kiválasztott iskoláknál, hanem azoknak

csak egy részét)

2.1. Szisztematikus kiválasztás:

Hasonlóságot mutat a EV mintavétellel – ha a

sorrend véletlenszerű.

2.2. Kvótás kiválasztás:

A kérdezőknek tartani kell bizonyos kvótákat.

(pl. 30%-a legyen vidéki, 60%-a férfi)

2.2. Koncentrált kiválasztás

A sokaság legnagyobb súllyal rendelkező

elemeit választják ki.

(pl. TOP 200 vállalat megfigyelése)

2.3. Önkényes minta

Tipikus esete a szakértői megkérdezés.

Paraméterek becslése, becslési kritériumok

Becslés: a sokaság egy paraméterének mintából való közelítése

Pontbecslés: egy értékkel való becslés

Intervallumbecslés: előre meghatározott megbízhatósággal egy intervallumot ad a sokasági paraméterre.

Becslő függvény: a minta alapján végzett becslés, amely függvénye a mintaelemeknek.

Sokasági paraméterek: átlag, értékösszeg, szórás, arány

Bemutató példa

Tételezzük fel, hogy a teljes sokaság (alapsokaság) 5 tagból áll (N=5)

Az értékek: 1,2,3,4,5

Két tagú mintákat veszünk (n=2)

Az összes lehetséges minták száma: (ismétlés nélkül)

Általában:102

20

21

4552

N

n

Ssz. Lehetséges minta

A minták átlaga

1.2.3.4.5.6.7.8.9.

10.

1,21,31,41,52,32,42,53,43,54,5

1,52,02,53,02,53,03,53,54,04,5

-1,5-1,0-0,5

0-0,5

00,50,51,01,5

2,251,000,25

00,25

00,250,251,002,25

Σ - 3 7,5

Xx 2Xx x

Az alapsokaság átlaga:

Az összes lehetséges mintaátlagból:

Torzítatlanság: a becslőfüggvény várható

értéke megegyezik a becsülni kívánt sokasági

jellemzővel. (a mintaátlagok ingadozásának

középpontjában a becsülni kívánt sokasági

jellemző áll.)

35

15

5

54321

310

30

10

5,40,4....0,25,1

Állapítsuk meg, hogyan szóródnak a mintaátlagok a sokasági tényleges átlag körül.

Standard hiba:

87,075,0

10

5,72

Nn

x

Xx

Hatásosság: egy becslés annál hatásosabb minél

kisebb a szórása (a minta alapján számított átlag

annál közelebb van a tényleges értékhez.) Ennek

mérése a standard hibával történik.

Standard hiba: a véletlen hiba átlagos nagysága.

Maximális hiba: az adott valószínűségi szinthez

tartozó hiba. (a standard hiba valahányszorosa)

A mintaátlagok normális eloszlást követnek.

Az intervallum a normális eloszlási görbe 68%-át fedi le.Az intervallum a görbe alatti terület 95,5 %-át fedi le.(Annak valószínűsége, hogy egy véletlenszerűen kiválasztott minta ebbe a sávba esik, 95,5%, hogy ezen kívül, 4,5%.

x

xx

x2 x2

xx

xx 2

A becslés gyakorlati lépései:

1.Véletlen minta kiválasztása. A lehetőségből egyetlen, konkrét mintánk van.

2.A minta átlagának ( )és szórásának ( ) kiszámítása

3.Standard hiba meghatározása (a mintabeli információ alapján)

N

n

x s

n

sx

4. A maximális hiba meghatározása: (adott valószínűségi szinten)

5. A konfidencia intervallum felírása.

xu

x

top related