3. két független minta összehasonlítása

32
3. Két független minta összehasonlítása

Upload: liz

Post on 25-Jan-2016

46 views

Category:

Documents


0 download

DESCRIPTION

3. Két független minta összehasonlítása. Csoportosító változók Két független minta átlagának az összehasonlítása Két független minta összehasonlítása ordinális függő változó segítségével. Tartalom. Független minták. 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 3. Két független minta összehasonlítása

1

3. Két független minta összehasonlítása

Page 2: 3. Két független minta összehasonlítása

2

Tartalom Csoportosító változók Két független minta átlagának az

összehasonlítása Két független minta összehasonlítása

ordinális függő változó segítségével

Page 3: 3. Két független minta összehasonlítása

3

Független minták

Page 4: 3. Két független minta összehasonlítása

4

Hogyan juthatunk független mintákhoz?

1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket.

2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint

vagy a nem szerint.

Page 5: 3. Két független minta összehasonlítása

5

Csoportdefiniálás a ROPstatban

1. Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok

2. Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú

GYAK

Page 6: 3. Két független minta összehasonlítása

6

Férfiak és nők feminitása (n = 82)CPI-Feminitás skála

0

2

4

6

8

10

12

14

16

18

Nők Férfiak

szórás

átlag

Page 7: 3. Két független minta összehasonlítása

7

Az apa érettségije és gyerekének matematika jegye (n = 3507)

Matek-jegy a 8. osztály végén

0

1

2

3

4

5

6

Apa érettségi nélkül Apa érettségivel

szórás

átlag

Page 8: 3. Két független minta összehasonlítása

8

Két független minta átlagának összehasonlítása

Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban?

Nullhipotézis: H0: μ1 = μ2

Próbastatisztika:

t = (y – x)/SEdif

Page 9: 3. Két független minta összehasonlítása

9

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti

különbség, annál valószínűbb, hogy H0 nem igaz.

Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).

Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Page 10: 3. Két független minta összehasonlítása

10

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti

különbség, annál valószínűbb, hogy H0 nem igaz.

Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).

Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Page 11: 3. Két független minta összehasonlítása

11

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti

különbség, annál valószínűbb, hogy H0 nem igaz.

Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).

Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Page 12: 3. Két független minta összehasonlítása

12

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti

különbség, annál valószínűbb, hogy H0 nem igaz.

Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).

Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Page 13: 3. Két független minta összehasonlítása

13

Kétmintás t-próba Minél nagyobb a két mintaátlag közötti

különbség, annál valószínűbb, hogy H0 nem igaz.

Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).

Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.

Page 14: 3. Két független minta összehasonlítása

14

Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82):

– X-átlag = 12,1, Y-átlag = 14,0– t(80) = -2,95, p = 0,0041 (p < 0,01)

Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507):– X-átlag = 4,06, Y-átlag = 3,82– t(3505) = 6,38, p = 0,000 (p < 0,001)

GYAK

Page 15: 3. Két független minta összehasonlítása

15

A kétmintás t-próba alkalmazási feltételei

Különbségváltozó normalitása Elméleti szórások egyenlősége: σ1 = σ2

Szóráshomogenitás tesztelése: Levene-próba, O’Brien-próba

Kétmintás t-próba robusztus alternatívája: Welch-féle d-próba

Page 16: 3. Két független minta összehasonlítása

16

Példa CPI-Fem skála, Férfiak vs. Nők (N = 82):

– X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése:

– Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+

Átlagok összehasonlítása:– Kétmintás t: t(80) = -2,95 (p = 0,0041)**– Welch-féle d: d(13,1) = -2,37 (p = 0,0337)*

GYAK

Page 17: 3. Két független minta összehasonlítása

Kezelési hatás két független minta esetén

Elméleti változás (különbség): 12

Cohen-féle delta (átlagok standardizált különbsége): (12)/

Mintabeli becslés: d = (x1x2)/se

Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK

Page 18: 3. Két független minta összehasonlítása

Két független minta Két független minta összehasonlításaösszehasonlítása ordinális ordinális

függő változóvalfüggő változóval

Page 19: 3. Két független minta összehasonlítása

19

Hagyományos elemzési módszer

Kvantitatív függő változó Nagyságszint mérése az átlaggal Két független minta átlagának

összehasonlítása kétmintás t-próbával. Kétmintás t-próba alkalmazási feltételei:

Normalitás Szóráshomogenitás

Page 20: 3. Két független minta összehasonlítása

20

Ordinális megközelítés Ötlet: dominancia-arányok meghatározása Pl. fiúk és lányok összehasonlítása az IQ

segítségével Fiú dom%: milyen gyakran fordul elő, hogy

egy fiú nagyobb IQ-értékű, mint egy lány? Lány dom%: milyen gyakran fordul elő,

hogy egy lány nagyobb IQ-értékű, mint egy fiú?

Page 21: 3. Két független minta összehasonlítása

21

Sztochasztikus egyenlőség

Fiú dominancia % = Lány dominancia %

Más szavakkal:

A fiúk adata ugyanolyan gyakran nagyobb a lányok adatánál, mint kisebb

Page 22: 3. Két független minta összehasonlítása

Két populáció sztochasztikus Két populáció sztochasztikus összehasonlításaösszehasonlítása

Fő kérdés: Ha két populációból vagy eloszlásból

véletlenszerűen kiválasztunk 1-1 értéket, milyen gyakran fordul elő, hogy az egyik (X) nagyobb lesz, mint a másik (Y)?

A sztochasztikus dominancia legegyszerűbb mértéke:

p+ = P(X > Y)

Page 23: 3. Két független minta összehasonlítása

Átlagok és Átlagok és pp++ értékek a CPI- értékek a CPI-

Feminitás Skála esetében (n = 82)Feminitás Skála esetében (n = 82)

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

24%

66%

p+

Férfiak Nők

0

2

4

6

8

10

12

14

átlag

12,114,0

Férfiak Nők

Page 24: 3. Két független minta összehasonlítása

A Szondi teszt m1 képe

Page 25: 3. Két független minta összehasonlítása

Átlagok és Átlagok és pp++ értékek a Szondi m1 értékek a Szondi m1

képváltozó esetében (N = 277)képváltozó esetében (N = 277)

0.0

0.1

0.1

0.2

0.2

0.3

0.3

0.4

0.4

0.5

0.5

21%

50%

p+

Férfiak Nők0

1

1

2

2

3

3

átlag

2,392,95

Férfiak Nők

Page 26: 3. Két független minta összehasonlítása

26

A sztochasztikus egyenlőség (SZTE) matematikai jelölése

X: vizsgált változó a P1 populációban Y: vizsgált változó a P2 populációban P1 sztochasztikusan egyenlő P2-vel, ha

P(X > Y) = P(X < Y) P(X > Y): P1-beli fölény esélye (p+)

P(X < Y): P2-beli fölény esélye (p-)

Page 27: 3. Két független minta összehasonlítása

X-minta Y-minta0 11 28 3

X > Y: (8; 1), (8; 2), (8; 3) X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3)

n+ = 3 (X dominancia); arány: 3/9 = 33% n- = 5 (Y dominancia); arány: 5/9 = 56%

Page 28: 3. Két független minta összehasonlítása

H0: Sztochasztikus egyenlőség

• Hagyományos próba:- Mann-Whitney-próba (MW-próba)

• Alkalmazási feltétel: - szóráshomogenitás

• Robusztus változatok:- Brunner-Munzel-próba (BM-próba)- FPW-próba

Page 29: 3. Két független minta összehasonlítása

A MW-próba végrehajtásaxi rang yj rang

0 1 1 2,5

1 2,5 2 4

8 6 3 5

R1 = 9,5 R2 = 11,5

(ta - tf): megtartási tartomány

Page 30: 3. Két független minta összehasonlítása

Döntés a MW-próbában

• Kis minták: táblázat

• Nagy minták: normális közelítés (z)

Page 31: 3. Két független minta összehasonlítása

31

p+ pe p- A = p+ + pe/2

Fem/ffi 24% 10% 66% 0,24 + 0,05 = 0,29

Fem/nő 66% 10% 24% 0,66 + 0,05 = 0,71

m1/ffi 21% 29% 50% 0,21 + 0,145 = 0,345

m1/nő 50% 29% 21% 0,50 + 0,145 = 0,655

A valószínűségi fölény A mutatója

Page 32: 3. Két független minta összehasonlítása

Sztochasztikus egyenlőség nullhipotézise

H0: A12 = A21 = 0,5