gyakorisági táblázatok elemzése · pdf file3 példák...
TRANSCRIPT
1
V. Gyakorisági táblázatok elemzése
2
Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét
változók segítségével Diszkrét változók kapcsolatvizsgálata
Tartalom
3
Példák diszkrét változóra
Személy neme (x1 = férfi, x2 = nő)Iskolázottsági szint (x1 = Alsófok,
x2 = Középfok, x3 = Felsőfok)5-fokú skálaváltozókDiagnózis (x1 = Neurózis, x2
= Szkizofrénia, ...)
4 NEM
NEM
nõférfi
Per
cent
60
50
40
30
20
10
0
5 ISK
ISK
181716151413121110987
Per
cent
40
30
20
10
0
6 ISKKOD
ISKKOD
16-2012-157-11
Per
cent
50
40
30
20
10
0
7
Alsófok Középfok Felsőfok
29% 40% 31%
Az iskolai végzettség eloszlása
8
Másik példa diszkrét eloszlásra
0 1 2 3
arány 0,20 0,35 0,40 0,05
érték
9
Kvantitatív
Ordinális Nominális
Kvalitatív
Változó típusa
Arány Intervallum
Kiemelt fontosságú diszkrét változók
10
Statisztikai problématípusok diszkrét változók
esetén
11
–Igaz-e, hogy a pszichológusok között több az extravertált, mint az introvertált?
–A Koronás, a Kádár és a Kossuth címer kedveltsége ugyanolyan mértékű-e?
1. Egy diszkrét változó eloszlásával kapcsolatos kérdések vizsgálata
(Eloszlásvizsgálatok)
12
–Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között?
–Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?
2a. Populációk összehasonlításaegy diszkrét változó segítségével
(Homogenitásvizsgálatok független mintákkal)
13
–Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban?
2b. Helyzetek összehasonlítása egy diszkrét változó segítségével
(Homogenitásvizsgálatok összetartozó mintákkal)
14
–Függ-e a pártpreferencia az iskolázottságtól?
–Milyen szoros kapcsolatban van a fenti két változó egymással?
3. Két diszkrét változó kapcsolatának vizsgálata
(Kapcsolatvizsgálatok)
15
Statisztikai probléma típusa
Eloszlásvizsgálat Homogenitásvizsgálat Kapcsolatvizsgálat
Független minták Összetartozó minták
Problématípusok rendszere
16
A mintabeli kapott és a nullhipotézis (H0) igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy 2 próbastatisztika kiszámítása.
g
1i i
2ii2
várt
)vártkapott(
A khi-négyzet-próba alapötlete
17
Két populáció összehasonlítása egy diszkrét változó segítségével
Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében?
Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok.
18
116 15 32 n1 =163
Vidék 592 94 90
Bpest
n2 =776
Kétszempontosgyakorisági táblázat Koronás Kádár Kossuth Össz.
Össz.: 708 109 122 N =939
19
Kétszempontos gyakorisági táblázat (sorösszegek szerinti százalékok)
71,2% 9,2% 19,6% 100%
Vidék 76,3% 12,1% 11,6%
Bpest
100%
Koronás Kádár Kossuth Össz.
20
H0 igaz volta esetén a
próbastatisztika 2-eloszlást követ (szabadságfok: f = (sorok-1)(oszlopok-1)).
2 < 20,05: H0-t 5%-os szinten nem utasítjuk el.
2 20,05 : H0-t 5%-os szinten elutasítjuk.
j,i ij
2ijij2
várt
)vártkapott(
Általános khi-négyzet-próba
21
A címeres példa eredményeSorok száma: g = 2Oszlopok száma: h = 3Szabadságfok: f = (2-1)(3-1) = 12 = 2Kritikus értékek:
- 20,05 = 5,991 - 2
0,01 = 9,210Kiszámított khi-négyzet-érték: 2 = 8,144 p-érték: p = 0,0170*
Döntés: H0-t 5%-os szinten elutasítjuk (p < 0,05)
22
Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz.
Az eltérés egyik mértéke a 2 próbastatisztika.Ha igaz H0, ez a mennyiség közelítőleg 2-eloszlású.
Ha 2 elég nagy, akkor H0-t elutasítjuk.
A khi-négyzet-próba lényege
23
A várt gyakoriságok ne legyenek kb. 5-nél kisebbek.
Engedmény: elég, ha 80%-ra teljesül.Például egy 2x2-es táblázatban 4 cella
van, ezért ezekre mind teljesülnie kell.
A 2-próba alkalmazási feltétele
GYAK
24
Kis gyakoriságú sorok vagy oszlopok összevonása.
Nagyobb minta választása.2x2-es táblázat esetén a Fisher-egzakt-
próba alkalmazása a 2x2-es 2 helyett.
Mit tehetünk, ha az alkalmazási feltétel nem teljesül?
25
Példa oszlopok összevonására
Isk. szint 0 1 2 3 4 Össz.
Alsófok 3 2 16 10 24 55
Középfok 0 2 10 13 20 45
Felsőfok 0 4 17 5 16 42
Össz. 3 8 43 28 60 142
h6 változó értékei
GYAK
26
Két diszkrét változó kapcsolatának vizsgálata
Könnyen teremt baráti kapcsolatokat
15 éveslányok
Kapcsolatvizsgálat homogenitásvizsgálat
Dohányzik Igen Nem ÖsszesenIgen 105 17 122Nem 469 340 809Összesen 574 357 931
27
Sorösszegek szerinti százalékok táblázata
Könnyen teremt baráti kapcsolatokat
15 éveslányok
Dohányzik Igen Nem ÖsszesenIgen 86,1 13,9 100Nem 58,0 42,0 100Összesen 61,7 38,3 100
28
A pártpreferencia függése az életkortól és a nemtől
• A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz.• A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.
29
Két változó (X és Y) függetlensége
• X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett;• Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett;• A függetlenség kölcsönös
30
Függ-e az iskolai végzettségtől ennek a személynek a kedveltsége?
Iskolázottság és szimpátia
31
Eloszlás a 3 iskolázottsági szinten
0
10
20
30
40
50
Neg+ Neg 0 Poz Poz+
száz
alék
alsófok középfok felsőfok
32
Összefügg-e a nemmel ennek a személynek a kedveltsége?
Nem és szimpátia
33
Az eloszlás férfiaknál és nőknél
0
10
20
30
40
50
Neg+ Neg 0 Poz Poz+
száz
alék
férfi nő
34
A kapcsolat szorosságának mérése diszkrét változók esetén
Cramér-féle V kontingencia-együttható:
Ha X és Y független, V = 0.0 ≤ V ≤ 1.Dichotóm változók esetén V φ kontingencia e.h.
VN g h
2
1(min( , ) )
GYAK