3. két független minta összehasonlítása
DESCRIPTION
3. Két független minta összehasonlítása. Csoportosító változók Két független minta átlagának az összehasonlítása Két független minta összehasonlítása ordinális függő változó segítségével. Tartalom. Független minták. 1) Egymástól függetlenül választunk ki mintákat különböző populációkból. - PowerPoint PPT PresentationTRANSCRIPT
1
3. Két független minta összehasonlítása
2
Tartalom Csoportosító változók Két független minta átlagának az
összehasonlítása Két független minta összehasonlítása
ordinális függő változó segítségével
3
Független minták
4
Hogyan juthatunk független mintákhoz?
1) Egymástól függetlenül választunk ki mintákat különböző populációkból. Pl. egészségeseket és betegeket.
2) Egyetlen véletlen mintát valamilyen szempont szerint részekre bontunk. Pl. bontunk az iskolázottsági szint
vagy a nem szerint.
5
Csoportdefiniálás a ROPstatban
1. Kódok segítségével, pl. 1 = férfi, 2 = nő 1 = alapfok, 2 = középfok, 3 = felsőfok
2. Övezetek segítségével, pl. 18-35: fiatal 36-55: középkorú 56-70: idős 71-150: szépkorú
GYAK
6
Férfiak és nők feminitása (n = 82)CPI-Feminitás skála
0
2
4
6
8
10
12
14
16
18
Nők Férfiak
szórás
átlag
7
Az apa érettségije és gyerekének matematika jegye (n = 3507)
Matek-jegy a 8. osztály végén
0
1
2
3
4
5
6
Apa érettségi nélkül Apa érettségivel
szórás
átlag
8
Két független minta átlagának összehasonlítása
Szakmai kérdés: ugyanakkora-e az X változó elméleti átlaga két populációban?
Nullhipotézis: H0: μ1 = μ2
Próbastatisztika:
t = (y – x)/SEdif
9
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
10
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
11
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
12
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
13
Kétmintás t-próba Minél nagyobb a két mintaátlag közötti
különbség, annál valószínűbb, hogy H0 nem igaz.
Ha igaz H0, akkor a fenti t mennyiség közelítőleg t-eloszlású (f = N - 2).
Ha t elég nagy, akkor H0-t elutasítjuk. t p (szignifikancia p-értéke) Ha p elég kicsi, akkor H0-t elutasítjuk.
14
Két példa CPI-Fem skála, Férfiak vs. Nők (N = 82):
– X-átlag = 12,1, Y-átlag = 14,0– t(80) = -2,95, p = 0,0041 (p < 0,01)
Matek-jegy 8. végén, Érettségizett vs. nem érettségizett apák gyermekei (N = 3507):– X-átlag = 4,06, Y-átlag = 3,82– t(3505) = 6,38, p = 0,000 (p < 0,001)
GYAK
15
A kétmintás t-próba alkalmazási feltételei
Különbségváltozó normalitása Elméleti szórások egyenlősége: σ1 = σ2
Szóráshomogenitás tesztelése: Levene-próba, O’Brien-próba
Kétmintás t-próba robusztus alternatívája: Welch-féle d-próba
16
Példa CPI-Fem skála, Férfiak vs. Nők (N = 82):
– X-átlag: 12,1 (s=2,7), Y-átlag = 14,0 (s=2,0) Szóráshomogenitás tesztelése:
– Levene-próba: F(1; 14,6) = 3,409 (p = 0,0852)+
Átlagok összehasonlítása:– Kétmintás t: t(80) = -2,95 (p = 0,0041)**– Welch-féle d: d(13,1) = -2,37 (p = 0,0337)*
GYAK
Kezelési hatás két független minta esetén
Elméleti változás (különbség): 12
Cohen-féle delta (átlagok standardizált különbsége): (12)/
Mintabeli becslés: d = (x1x2)/se
Értelmezés: 0,2: gyenge, 0,5: közepes, 0,8: erős különbség GYAK
Két független minta Két független minta összehasonlításaösszehasonlítása ordinális ordinális
függő változóvalfüggő változóval
19
Hagyományos elemzési módszer
Kvantitatív függő változó Nagyságszint mérése az átlaggal Két független minta átlagának
összehasonlítása kétmintás t-próbával. Kétmintás t-próba alkalmazási feltételei:
Normalitás Szóráshomogenitás
20
Ordinális megközelítés Ötlet: dominancia-arányok meghatározása Pl. fiúk és lányok összehasonlítása az IQ
segítségével Fiú dom%: milyen gyakran fordul elő, hogy
egy fiú nagyobb IQ-értékű, mint egy lány? Lány dom%: milyen gyakran fordul elő,
hogy egy lány nagyobb IQ-értékű, mint egy fiú?
21
Sztochasztikus egyenlőség
Fiú dominancia % = Lány dominancia %
Más szavakkal:
A fiúk adata ugyanolyan gyakran nagyobb a lányok adatánál, mint kisebb
Két populáció sztochasztikus Két populáció sztochasztikus összehasonlításaösszehasonlítása
Fő kérdés: Ha két populációból vagy eloszlásból
véletlenszerűen kiválasztunk 1-1 értéket, milyen gyakran fordul elő, hogy az egyik (X) nagyobb lesz, mint a másik (Y)?
A sztochasztikus dominancia legegyszerűbb mértéke:
p+ = P(X > Y)
Átlagok és Átlagok és pp++ értékek a CPI- értékek a CPI-
Feminitás Skála esetében (n = 82)Feminitás Skála esetében (n = 82)
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
24%
66%
p+
Férfiak Nők
0
2
4
6
8
10
12
14
átlag
12,114,0
Férfiak Nők
A Szondi teszt m1 képe
Átlagok és Átlagok és pp++ értékek a Szondi m1 értékek a Szondi m1
képváltozó esetében (N = 277)képváltozó esetében (N = 277)
0.0
0.1
0.1
0.2
0.2
0.3
0.3
0.4
0.4
0.5
0.5
21%
50%
p+
Férfiak Nők0
1
1
2
2
3
3
átlag
2,392,95
Férfiak Nők
26
A sztochasztikus egyenlőség (SZTE) matematikai jelölése
X: vizsgált változó a P1 populációban Y: vizsgált változó a P2 populációban P1 sztochasztikusan egyenlő P2-vel, ha
P(X > Y) = P(X < Y) P(X > Y): P1-beli fölény esélye (p+)
P(X < Y): P2-beli fölény esélye (p-)
X-minta Y-minta0 11 28 3
X > Y: (8; 1), (8; 2), (8; 3) X < Y: (0; 1), (0; 2), (0; 3), (1;2), (1; 3)
n+ = 3 (X dominancia); arány: 3/9 = 33% n- = 5 (Y dominancia); arány: 5/9 = 56%
H0: Sztochasztikus egyenlőség
• Hagyományos próba:- Mann-Whitney-próba (MW-próba)
• Alkalmazási feltétel: - szóráshomogenitás
• Robusztus változatok:- Brunner-Munzel-próba (BM-próba)- FPW-próba
A MW-próba végrehajtásaxi rang yj rang
0 1 1 2,5
1 2,5 2 4
8 6 3 5
R1 = 9,5 R2 = 11,5
(ta - tf): megtartási tartomány
Döntés a MW-próbában
• Kis minták: táblázat
• Nagy minták: normális közelítés (z)
31
p+ pe p- A = p+ + pe/2
Fem/ffi 24% 10% 66% 0,24 + 0,05 = 0,29
Fem/nő 66% 10% 24% 0,66 + 0,05 = 0,71
m1/ffi 21% 29% 50% 0,21 + 0,145 = 0,345
m1/nő 50% 29% 21% 0,50 + 0,145 = 0,655
A valószínűségi fölény A mutatója
Sztochasztikus egyenlőség nullhipotézise
H0: A12 = A21 = 0,5