3. két független minta összehasonlítása

1

3. Két független minta összehasonlítása

2

Tartalom Csoportosító változók Két független minta átlagának az

összehasonlítása Két független minta összehasonlítása

ordinális függő változó segítségével

3

Független minták

4

Hogyan juthatunk független mintákhoz?

1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket.

2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint

vagy a nem szerint.

5

Csoportdefiniálás a ROPstatban

1. Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok

2. Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú

GYAK

6

Férfiak és nők feminitása (n = 82)CPI-Feminitás skála

0

2

4

6

8

10

12

14

16

18

Nők Férfiak

szórás

átlag

7

Az apa érettségije és gyerekének matematika jegye (n = 3507)

Matek-jegy a 8. osztály végén

0

1

2

3

4

5

6

Apa érettségi nélkül Apa érettségivel

szórás

átlag

8

Két független minta átlagának összehasonlítása

Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban?

Nullhipotézis: H0: μ1 = μ2

Próbastatisztika:

t = (y – x)/SEdif

9

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti

különbség, annál valószínűbb, hogy H0 nem igaz.

Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).

Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

10





11





12





13





14

Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82):

– X-átlag = 12,1, Y-átlag = 14,0– t(80) = -2,95, p = 0,0041 (p < 0,01)

Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507):– X-átlag = 4,06, Y-átlag = 3,82– t(3505) = 6,38, p = 0,000 (p < 0,001)

GYAK

15

A kétmintás t-próba alkalmazási feltételei

Különbségváltozó normalitása Elméleti szórások egyenlősége: σ1 = σ2

Szóráshomogenitás tesztelése: Levene-próba, O’Brien-próba

Kétmintás t-próba robusztus alternatívája: Welch-féle d-próba

16

Példa CPI-Fem skála, Férfiak vs. Nők (N = 82):

– X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése:

– Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+

Átlagok összehasonlítása:– Kétmintás t: t(80) = -2,95 (p = 0,0041)**– Welch-féle d: d(13,1) = -2,37 (p = 0,0337)*

GYAK

Kezelési hatás két független minta esetén

Elméleti változás (különbség): 12

Cohen-féle delta (átlagok standardizált különbsége): (12)/

Mintabeli becslés: d = (x1x2)/se

Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK

Két független minta Két független minta összehasonlításaösszehasonlítása ordinális ordinális

függő változóvalfüggő változóval

19

Hagyományos elemzési módszer

Kvantitatív függő változó Nagyságszint mérése az átlaggal Két független minta átlagának

összehasonlítása kétmintás t-próbával. Kétmintás t-próba alkalmazási feltételei:

Normalitás Szóráshomogenitás

20

Ordinális megközelítés Ötlet: dominancia-arányok meghatározása Pl. fiúk és lányok összehasonlítása az IQ

segítségével Fiú dom%: milyen gyakran fordul elő, hogy

egy fiú nagyobb IQ-értékű, mint egy lány? Lány dom%: milyen gyakran fordul elő,

hogy egy lány nagyobb IQ-értékű, mint egy fiú?

21

Sztochasztikus egyenlőség

Fiú dominancia % = Lány dominancia %

Más szavakkal:

A fiúk adata ugyanolyan gyakran nagyobb a lányok adatánál, mint kisebb

Két populáció sztochasztikus Két populáció sztochasztikus összehasonlításaösszehasonlítása

Fő kérdés: Ha két populációból vagy eloszlásból

véletlenszerűen kiválasztunk 1-1 értéket, milyen gyakran fordul elő, hogy az egyik (X) nagyobb lesz, mint a másik (Y)?

A sztochasztikus dominancia legegyszerűbb mértéke:

p+ = P(X > Y)

Átlagok és Átlagok és pp++ értékek a CPI- értékek a CPI-

Feminitás Skála esetében (n = 82)Feminitás Skála esetében (n = 82)

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

24%

66%

p+

Férfiak Nők

0

2

4

6

8

10

12

14

átlag

12,114,0

Férfiak Nők

A Szondi teszt m1 képe

Átlagok és Átlagok és pp++ értékek a Szondi m1 értékek a Szondi m1

képváltozó esetében (N = 277)képváltozó esetében (N = 277)

0.0

0.1

0.1

0.2

0.2

0.3

0.3

0.4

0.4

0.5

0.5

21%

50%

p+

Férfiak Nők0

1

1

2

2

3

3

átlag

2,392,95

Férfiak Nők

26

A sztochasztikus egyenlőség (SZTE) matematikai jelölése

X: vizsgált változó a P1 populációban Y: vizsgált változó a P2 populációban P1 sztochasztikusan egyenlő P2-vel, ha

P(X > Y) = P(X < Y) P(X > Y): P1-beli fölény esélye (p+)

P(X < Y): P2-beli fölény esélye (p-)

X-minta Y-minta0 11 28 3

X > Y: (8; 1), (8; 2), (8; 3) X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3)

n+ = 3 (X dominancia); arány: 3/9 = 33% n- = 5 (Y dominancia); arány: 5/9 = 56%

H0: Sztochasztikus egyenlőség

• Hagyományos próba:- Mann-Whitney-próba (MW-próba)

• Alkalmazási feltétel: - szóráshomogenitás

• Robusztus változatok:- Brunner-Munzel-próba (BM-próba)- FPW-próba

A MW-próba végrehajtásaxi rang yj rang

0 1 1 2,5

1 2,5 2 4

8 6 3 5

R1 = 9,5 R2 = 11,5

(ta - tf): megtartási tartomány

Döntés a MW-próbában

• Kis minták: táblázat

• Nagy minták: normális közelítés (z)

31

p+ pe p- A = p+ + pe/2

Fem/ffi 24% 10% 66% 0,24 + 0,05 = 0,29

Fem/nő 66% 10% 24% 0,66 + 0,05 = 0,71

m1/ffi 21% 29% 50% 0,21 + 0,145 = 0,345

m1/nő 50% 29% 21% 0,50 + 0,145 = 0,655

A valószínűségi fölény A mutatója

Sztochasztikus egyenlőség nullhipotézise

H0: A12 = A21 = 0,5

3. két független minta összehasonlítása

Documents