tÁrsadalomstatisztika vi. mintavÉtel előadó: prof. dr. besenyei lajos
DESCRIPTION
TÁRSADALOMSTATISZTIKA VI. MINTAVÉTEL Előadó: Prof. Dr. Besenyei Lajos. A sokaság egy részének kiválasztását mintavételnek , a sokaság így kiválasztott részét mintának nevezzük. Alapkövetelmény: a sokaság helyes definiálása. Mintavételi keret. - PowerPoint PPT PresentationTRANSCRIPT
TÁRSADALOMSTATISZTIKA VI.
MINTAVÉTEL
Előadó: Prof. Dr. Besenyei Lajos
A sokaság egy részének kiválasztását mintavételnek, a sokaság így kiválasztott részét mintának nevezzük.
Alapkövetelmény: a sokaság helyes definiálása. Mintavételi keret.
A statisztikai hibák két nagy csoportja:
a) Nem mintavételi hiba (mérési, kódolási, kérdezési stb.)
b) Mintavételi hiba, nem a teljes sokaságot, hanem annak csak egy részét figyeljük meg.
MINTAVÉTELI MÓDOK
1.Véletlen, valószínűségi
Ismert, vagy meghatározható a sokaság elemeinek mintába kerülési esélye. Mintavételi hiba csak itt számítható
1.1. Egyszerű véletlen (EV)
1.2. Rétegzett (R)
1.3. Csoportos (CS)
1.4. Többlépcsős (TL)
2. Nem véletlen
2.1. (EV) Szisztematikus
2.2. Kvótás
2.3. Koncentrált
2.4. Önkényes (szubjektív)
1.1. Egyszerű véletlen kiválasztás (EV)
Homogén, véges elemszámú sokaság esetén,
visszatevés nélkül, minden lehetséges „n” elemű
minta kiválasztásnak azonos esélyt adva.
Alkalmazásához komplett lista szükséges.
Kiválasztási technika:
• sorsolás
• véletlen számok generálása
• szisztematikus
1.2. Rétegzett minta (R)
Heterogén sokaság esetén alkalmazzuk.
(A sokaságot homogén részekre bontják, ezeken
belül egyszerű véletlen mintavételt hajtanak
végre.)
Előnye, hogy azonos mintanagyság esetén kisebb
mintavételi hibát eredményez, mint a rétegzés
nélküli EV mintavétel.
A minta elemszámának elosztása az egyes rétegekközött:
a) Egyenletes elosztás:
minden rétegbe azonos számú mintaelem kerül
b) Arányos elosztás:
a tényleges, sokasági arányoknak megfelelően
történik a rétegenkénti elosztás
c) Neyman-féle optimális elosztás:
a rétegenkénti szórásokat vesszük figyelembe.
(nagyobb szórású rétegből nagyobb
elemszámot veszünk figyelembe)
d) Költségoptimális elosztás
a szórások mellett vannak információink
(vagy feltételezéseink) az egységek
költségeiről is
1.3. Csoportos (CS) minta
Nincs (vagy igen költséges) a teljes lista beszerzése,
de nagyobb összetartozó egységekre rendelkezésre
áll.
Csoportos mintavétel esetén a csoportok halmazából
EV mintát veszünk, s ezen belül teljeskörű
megfigyelést végzünk.
(pl. középiskolások szórakozási szokásai: a
középiskolák közül véletlenszerűen választunk, a
kiválasztottaknál minden tanulót megkérdezünk.)
Elsődleges mintavételi egység:
Amire a felvétel közvetlenül irányul.
Végső mintavételi egység:
Amelyikre nézve következtetéseket kívánunk levonni.
1.4. Többlépcsős mintavétel (TL)
A CS mintát tovább bontjuk: a kiválasztott
elsődleges egységeken belül további mintavételt
hajtunk végre.
(Nem kérdezünk meg minden középiskolás
diákot a kiválasztott iskoláknál, hanem azoknak
csak egy részét)
2.1. Szisztematikus kiválasztás:
Hasonlóságot mutat a EV mintavétellel – ha a
sorrend véletlenszerű.
2.2. Kvótás kiválasztás:
A kérdezőknek tartani kell bizonyos kvótákat.
(pl. 30%-a legyen vidéki, 60%-a férfi)
2.2. Koncentrált kiválasztás
A sokaság legnagyobb súllyal rendelkező
elemeit választják ki.
(pl. TOP 200 vállalat megfigyelése)
2.3. Önkényes minta
Tipikus esete a szakértői megkérdezés.
Paraméterek becslése, becslési kritériumok
Becslés: a sokaság egy paraméterének mintából való közelítése
Pontbecslés: egy értékkel való becslés
Intervallumbecslés: előre meghatározott megbízhatósággal egy intervallumot ad a sokasági paraméterre.
Becslő függvény: a minta alapján végzett becslés, amely függvénye a mintaelemeknek.
Sokasági paraméterek: átlag, értékösszeg, szórás, arány
Bemutató példa
Tételezzük fel, hogy a teljes sokaság (alapsokaság) 5 tagból áll (N=5)
Az értékek: 1,2,3,4,5
Két tagú mintákat veszünk (n=2)
Az összes lehetséges minták száma: (ismétlés nélkül)
Általában:102
20
21
4552
N
n
Ssz. Lehetséges minta
A minták átlaga
1.2.3.4.5.6.7.8.9.
10.
1,21,31,41,52,32,42,53,43,54,5
1,52,02,53,02,53,03,53,54,04,5
-1,5-1,0-0,5
0-0,5
00,50,51,01,5
2,251,000,25
00,25
00,250,251,002,25
Σ - 3 7,5
Xx 2Xx x
Az alapsokaság átlaga:
Az összes lehetséges mintaátlagból:
Torzítatlanság: a becslőfüggvény várható
értéke megegyezik a becsülni kívánt sokasági
jellemzővel. (a mintaátlagok ingadozásának
középpontjában a becsülni kívánt sokasági
jellemző áll.)
35
15
5
54321
310
30
10
5,40,4....0,25,1
Állapítsuk meg, hogyan szóródnak a mintaátlagok a sokasági tényleges átlag körül.
Standard hiba:
87,075,0
10
5,72
Nn
x
Xx
Hatásosság: egy becslés annál hatásosabb minél
kisebb a szórása (a minta alapján számított átlag
annál közelebb van a tényleges értékhez.) Ennek
mérése a standard hibával történik.
Standard hiba: a véletlen hiba átlagos nagysága.
Maximális hiba: az adott valószínűségi szinthez
tartozó hiba. (a standard hiba valahányszorosa)
A mintaátlagok normális eloszlást követnek.
Az intervallum a normális eloszlási görbe 68%-át fedi le.Az intervallum a görbe alatti terület 95,5 %-át fedi le.(Annak valószínűsége, hogy egy véletlenszerűen kiválasztott minta ebbe a sávba esik, 95,5%, hogy ezen kívül, 4,5%.
x
xx
x2 x2
xx
xx 2
A becslés gyakorlati lépései:
1.Véletlen minta kiválasztása. A lehetőségből egyetlen, konkrét mintánk van.
2.A minta átlagának ( )és szórásának ( ) kiszámítása
3.Standard hiba meghatározása (a mintabeli információ alapján)
N
n
x s
n
sx
4. A maximális hiba meghatározása: (adott valószínűségi szinten)
5. A konfidencia intervallum felírása.
xu
x