gyakorisági táblázatok elemzése · pdf file3 példák...

Post on 31-Jan-2018

227 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

V. Gyakorisági táblázatok elemzése

2

Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét

változók segítségével Diszkrét változók kapcsolatvizsgálata

Tartalom

3

Példák diszkrét változóra

Személy neme (x1 = férfi, x2 = nő)Iskolázottsági szint (x1 = Alsófok,

x2 = Középfok, x3 = Felsőfok)5-fokú skálaváltozókDiagnózis (x1 = Neurózis, x2

= Szkizofrénia, ...)

4 NEM

NEM

nõférfi

Per

cent

60

50

40

30

20

10

0

5 ISK

ISK

181716151413121110987

Per

cent

40

30

20

10

0

6 ISKKOD

ISKKOD

16-2012-157-11

Per

cent

50

40

30

20

10

0

7

Alsófok Középfok Felsőfok

29% 40% 31%

Az iskolai végzettség eloszlása

8

Másik példa diszkrét eloszlásra

0 1 2 3

arány 0,20 0,35 0,40 0,05

érték

9

Kvantitatív

Ordinális Nominális

Kvalitatív

Változó típusa

Arány Intervallum

Kiemelt fontosságú diszkrét változók

10

Statisztikai problématípusok diszkrét változók

esetén

11

–Igaz-e, hogy a pszichológusok között több az extravertált, mint az introvertált?

–A Koronás, a Kádár és a Kossuth címer kedveltsége ugyanolyan mértékű-e?

1. Egy diszkrét változó eloszlásával kapcsolatos kérdések vizsgálata

(Eloszlásvizsgálatok)

12

–Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között?

–Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?

2a. Populációk összehasonlításaegy diszkrét változó segítségével

(Homogenitásvizsgálatok független mintákkal)

13

–Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban?

2b. Helyzetek összehasonlítása egy diszkrét változó segítségével

(Homogenitásvizsgálatok összetartozó mintákkal)

14

–Függ-e a pártpreferencia az iskolázottságtól?

–Milyen szoros kapcsolatban van a fenti két változó egymással?

3. Két diszkrét változó kapcsolatának vizsgálata

(Kapcsolatvizsgálatok)

15

Statisztikai probléma típusa

Eloszlásvizsgálat Homogenitásvizsgálat Kapcsolatvizsgálat

Független minták Összetartozó minták

Problématípusok rendszere

16

A mintabeli kapott és a nullhipotézis (H0) igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy 2 próbastatisztika kiszámítása.

g

1i i

2ii2

várt

)vártkapott(

A khi-négyzet-próba alapötlete

17

Két populáció összehasonlítása egy diszkrét változó segítségével

Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében?

Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok.

18

116 15 32 n1 =163

Vidék 592 94 90

Bpest

n2 =776

Kétszempontosgyakorisági táblázat Koronás Kádár Kossuth Össz.

Össz.: 708 109 122 N =939

19

Kétszempontos gyakorisági táblázat (sorösszegek szerinti százalékok)

71,2% 9,2% 19,6% 100%

Vidék 76,3% 12,1% 11,6%

Bpest

100%

Koronás Kádár Kossuth Össz.

20

H0 igaz volta esetén a

próbastatisztika 2-eloszlást követ (szabadságfok: f = (sorok-1)(oszlopok-1)).

2 < 20,05: H0-t 5%-os szinten nem utasítjuk el.

2 20,05 : H0-t 5%-os szinten elutasítjuk.

j,i ij

2ijij2

várt

)vártkapott(

Általános khi-négyzet-próba

21

A címeres példa eredményeSorok száma: g = 2Oszlopok száma: h = 3Szabadságfok: f = (2-1)(3-1) = 12 = 2Kritikus értékek:

- 20,05 = 5,991 - 2

0,01 = 9,210Kiszámított khi-négyzet-érték: 2 = 8,144 p-érték: p = 0,0170*

Döntés: H0-t 5%-os szinten elutasítjuk (p < 0,05)

22

Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz.

Az eltérés egyik mértéke a 2 próbastatisztika.Ha igaz H0, ez a mennyiség közelítőleg 2-eloszlású.

Ha 2 elég nagy, akkor H0-t elutasítjuk.

A khi-négyzet-próba lényege

23

A várt gyakoriságok ne legyenek kb. 5-nél kisebbek.

Engedmény: elég, ha 80%-ra teljesül.Például egy 2x2-es táblázatban 4 cella

van, ezért ezekre mind teljesülnie kell.

A 2-próba alkalmazási feltétele

GYAK

24

Kis gyakoriságú sorok vagy oszlopok összevonása.

Nagyobb minta választása.2x2-es táblázat esetén a Fisher-egzakt-

próba alkalmazása a 2x2-es 2 helyett.

Mit tehetünk, ha az alkalmazási feltétel nem teljesül?

25

Példa oszlopok összevonására

Isk. szint 0 1 2 3 4 Össz.

Alsófok 3 2 16 10 24 55

Középfok 0 2 10 13 20 45

Felsőfok 0 4 17 5 16 42

Össz. 3 8 43 28 60 142

h6 változó értékei

GYAK

26

Két diszkrét változó kapcsolatának vizsgálata

Könnyen teremt baráti kapcsolatokat

15 éveslányok

Kapcsolatvizsgálat homogenitásvizsgálat

Dohányzik Igen Nem ÖsszesenIgen 105 17 122Nem 469 340 809Összesen 574 357 931

27

Sorösszegek szerinti százalékok táblázata

Könnyen teremt baráti kapcsolatokat

15 éveslányok

Dohányzik Igen Nem ÖsszesenIgen 86,1 13,9 100Nem 58,0 42,0 100Összesen 61,7 38,3 100

28

A pártpreferencia függése az életkortól és a nemtől

• A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz.• A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

29

Két változó (X és Y) függetlensége

• X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett;• Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett;• A függetlenség kölcsönös

30

Függ-e az iskolai végzettségtől ennek a személynek a kedveltsége?

Iskolázottság és szimpátia

31

Eloszlás a 3 iskolázottsági szinten

0

10

20

30

40

50

Neg+ Neg 0 Poz Poz+

száz

alék

alsófok középfok felsőfok

32

Összefügg-e a nemmel ennek a személynek a kedveltsége?

Nem és szimpátia

33

Az eloszlás férfiaknál és nőknél

0

10

20

30

40

50

Neg+ Neg 0 Poz Poz+

száz

alék

férfi nő

34

A kapcsolat szorosságának mérése diszkrét változók esetén

Cramér-féle V kontingencia-együttható:

Ha X és Y független, V = 0.0 ≤ V ≤ 1.Dichotóm változók esetén V φ kontingencia e.h.

VN g h

2

1(min( , ) )

GYAK

top related