gyakorisági táblázatok elemzése · pdf file3 példák...

34
1 V. Gyakorisági táblázatok elemzése

Upload: dangnguyet

Post on 31-Jan-2018

227 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

1

V. Gyakorisági táblázatok elemzése

Page 2: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

2

Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét

változók segítségével Diszkrét változók kapcsolatvizsgálata

Tartalom

Page 3: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

3

Példák diszkrét változóra

Személy neme (x1 = férfi, x2 = nő)Iskolázottsági szint (x1 = Alsófok,

x2 = Középfok, x3 = Felsőfok)5-fokú skálaváltozókDiagnózis (x1 = Neurózis, x2

= Szkizofrénia, ...)

Page 4: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

4 NEM

NEM

nõférfi

Per

cent

60

50

40

30

20

10

0

Page 5: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

5 ISK

ISK

181716151413121110987

Per

cent

40

30

20

10

0

Page 6: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

6 ISKKOD

ISKKOD

16-2012-157-11

Per

cent

50

40

30

20

10

0

Page 7: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

7

Alsófok Középfok Felsőfok

29% 40% 31%

Az iskolai végzettség eloszlása

Page 8: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

8

Másik példa diszkrét eloszlásra

0 1 2 3

arány 0,20 0,35 0,40 0,05

érték

Page 9: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

9

Kvantitatív

Ordinális Nominális

Kvalitatív

Változó típusa

Arány Intervallum

Kiemelt fontosságú diszkrét változók

Page 10: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

10

Statisztikai problématípusok diszkrét változók

esetén

Page 11: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

11

–Igaz-e, hogy a pszichológusok között több az extravertált, mint az introvertált?

–A Koronás, a Kádár és a Kossuth címer kedveltsége ugyanolyan mértékű-e?

1. Egy diszkrét változó eloszlásával kapcsolatos kérdések vizsgálata

(Eloszlásvizsgálatok)

Page 12: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

12

–Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között?

–Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?

2a. Populációk összehasonlításaegy diszkrét változó segítségével

(Homogenitásvizsgálatok független mintákkal)

Page 13: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

13

–Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban?

2b. Helyzetek összehasonlítása egy diszkrét változó segítségével

(Homogenitásvizsgálatok összetartozó mintákkal)

Page 14: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

14

–Függ-e a pártpreferencia az iskolázottságtól?

–Milyen szoros kapcsolatban van a fenti két változó egymással?

3. Két diszkrét változó kapcsolatának vizsgálata

(Kapcsolatvizsgálatok)

Page 15: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

15

Statisztikai probléma típusa

Eloszlásvizsgálat Homogenitásvizsgálat Kapcsolatvizsgálat

Független minták Összetartozó minták

Problématípusok rendszere

Page 16: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

16

A mintabeli kapott és a nullhipotézis (H0) igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy 2 próbastatisztika kiszámítása.

g

1i i

2ii2

várt

)vártkapott(

A khi-négyzet-próba alapötlete

Page 17: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

17

Két populáció összehasonlítása egy diszkrét változó segítségével

Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében?

Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok.

Page 18: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

18

116 15 32 n1 =163

Vidék 592 94 90

Bpest

n2 =776

Kétszempontosgyakorisági táblázat Koronás Kádár Kossuth Össz.

Össz.: 708 109 122 N =939

Page 19: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

19

Kétszempontos gyakorisági táblázat (sorösszegek szerinti százalékok)

71,2% 9,2% 19,6% 100%

Vidék 76,3% 12,1% 11,6%

Bpest

100%

Koronás Kádár Kossuth Össz.

Page 20: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

20

H0 igaz volta esetén a

próbastatisztika 2-eloszlást követ (szabadságfok: f = (sorok-1)(oszlopok-1)).

2 < 20,05: H0-t 5%-os szinten nem utasítjuk el.

2 20,05 : H0-t 5%-os szinten elutasítjuk.

j,i ij

2ijij2

várt

)vártkapott(

Általános khi-négyzet-próba

Page 21: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

21

A címeres példa eredményeSorok száma: g = 2Oszlopok száma: h = 3Szabadságfok: f = (2-1)(3-1) = 12 = 2Kritikus értékek:

- 20,05 = 5,991 - 2

0,01 = 9,210Kiszámított khi-négyzet-érték: 2 = 8,144 p-érték: p = 0,0170*

Döntés: H0-t 5%-os szinten elutasítjuk (p < 0,05)

Page 22: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

22

Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H0 nem igaz.

Az eltérés egyik mértéke a 2 próbastatisztika.Ha igaz H0, ez a mennyiség közelítőleg 2-eloszlású.

Ha 2 elég nagy, akkor H0-t elutasítjuk.

A khi-négyzet-próba lényege

Page 23: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

23

A várt gyakoriságok ne legyenek kb. 5-nél kisebbek.

Engedmény: elég, ha 80%-ra teljesül.Például egy 2x2-es táblázatban 4 cella

van, ezért ezekre mind teljesülnie kell.

A 2-próba alkalmazási feltétele

GYAK

Page 24: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

24

Kis gyakoriságú sorok vagy oszlopok összevonása.

Nagyobb minta választása.2x2-es táblázat esetén a Fisher-egzakt-

próba alkalmazása a 2x2-es 2 helyett.

Mit tehetünk, ha az alkalmazási feltétel nem teljesül?

Page 25: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

25

Példa oszlopok összevonására

Isk. szint 0 1 2 3 4 Össz.

Alsófok 3 2 16 10 24 55

Középfok 0 2 10 13 20 45

Felsőfok 0 4 17 5 16 42

Össz. 3 8 43 28 60 142

h6 változó értékei

GYAK

Page 26: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

26

Két diszkrét változó kapcsolatának vizsgálata

Könnyen teremt baráti kapcsolatokat

15 éveslányok

Kapcsolatvizsgálat homogenitásvizsgálat

Dohányzik Igen Nem ÖsszesenIgen 105 17 122Nem 469 340 809Összesen 574 357 931

Page 27: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

27

Sorösszegek szerinti százalékok táblázata

Könnyen teremt baráti kapcsolatokat

15 éveslányok

Dohányzik Igen Nem ÖsszesenIgen 86,1 13,9 100Nem 58,0 42,0 100Összesen 61,7 38,3 100

Page 28: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

28

A pártpreferencia függése az életkortól és a nemtől

• A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz.• A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

Page 29: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

29

Két változó (X és Y) függetlensége

• X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett;• Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett;• A függetlenség kölcsönös

Page 30: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

30

Függ-e az iskolai végzettségtől ennek a személynek a kedveltsége?

Iskolázottság és szimpátia

Page 31: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

31

Eloszlás a 3 iskolázottsági szinten

0

10

20

30

40

50

Neg+ Neg 0 Poz Poz+

száz

alék

alsófok középfok felsőfok

Page 32: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

32

Összefügg-e a nemmel ennek a személynek a kedveltsége?

Nem és szimpátia

Page 33: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

33

Az eloszlás férfiaknál és nőknél

0

10

20

30

40

50

Neg+ Neg 0 Poz Poz+

száz

alék

férfi nő

Page 34: Gyakorisági táblázatok elemzése · PDF file3 Példák diszkrét változóra Személy neme (x 1 = férfi, x2 = nő) Iskolázottsági szint (x 1 = Alsófok, x2 = Középfok, x3 =

34

A kapcsolat szorosságának mérése diszkrét változók esetén

Cramér-féle V kontingencia-együttható:

Ha X és Y független, V = 0.0 ≤ V ≤ 1.Dichotóm változók esetén V φ kontingencia e.h.

VN g h

2

1(min( , ) )

GYAK