korrelációs kapcsolatok elemzésegtk.uni-miskolc.hu/files/12613/1e_korrelációs...•...
TRANSCRIPT
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Korrelációs kapcsolatok elemzése
1. előadás
Kvantitatív statisztikai módszerek
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Két változó közötti kapcsolat
• Független: Az X ismérv szerinti hovatartozásismerete nem ad semmilyen többletinformációtaz Y szerinti hovatartozásról.
• Sztochasztikus: Az egyik ismérv hatással van amásikra, de nem határozza meg egyértelműenannak értékeit/változatait.
• Függvényszerű (determinisztikus): A vizsgáltegységek X szerinti hovatartozásánakismeretében egyértelműen megmondható azok Yszerinti hovatartozása is.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A kapcsolat mérőszámai
• Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük .
• Ordinális típusú változók összefüggését a rangkorrelációs mutatók mérik.
• Arány skála típusú változók összefüggését korreláció- és regresszió-analízissel elemezzük.
• Intervallum/arány és nominális skálán mért változók közötti összefüggést H;
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Sztochasztikus kapcsolatok fajtái
• Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve).
• Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve.
• Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve).
• Rangkorreláció (mindkét változó sorrendi skálán mérhető).
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Korrelációs kapcsolat elemzése
• Van-e összefüggés az ismérvek között?
• Milyen irányú az összefüggés?
• Mennyire szoros a kapcsolat?
• Az egyik ismérv változása milyen hatással van a másik ismérv változására?
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Alapfogalmak I.
• A mennyiségi ismérvek közötti kapcsolatotkorrelációnak nevezzük.
• A korrelációszámítás: a mennyiségi ismérvekközötti kapcsolat szorosságának mérése.
• A regressziószámítás: a mennyiségi ismérvekegymásra gyakorolt hatásánakszámszerűsítésével, e hatások irányának ésmértékének megállapításával foglalkozik.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Alapfogalmak II.
Ha a korreláció mögött egyirányú okozatiösszefüggés állapítható meg:
• az ok szerepét betöltő ismérvet tényező-változónak, magyarázó-, független változónak(X),
• az okozat szerepét játszó ismérvet pedigeredményváltozónak, függő változónak (Y)nevezzük.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A korreláció fontosabb típusai
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Korreláció hiánya
A regresszió-függvény bármely X helyenazonos (közel azonos) értéket vesz fel.
A függvény képe vízszintes vonal.
( Y független X-től, X nem befolyásolja Yértékét.)
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
- 2 - 1 0 1 2
- 3
- 2
- 1
0
1
2
3
N i n c s k o r r e lá c i ó
Y = - 7 . 4 E - 0 2 + 0 . 2 0 8 3 4 8 X
R - S q = 3 . 4 %
A korreláció hiánya
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Függvényszerű kapcsolat
A korreláció hiányának logikai ellentéte afüggvényszerű kapcsolat.
Egy adott X értékhez csupán egyetlen Y értéktartozhat. Ilyenkor a pontdiagram pontjai aregresszió-vonalhoz illeszkednek, azaz a regresszió-vonal körül nincs szóródás.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Pozitív korreláció
Általában a regressziógörbe körül vanszóródás. A regressziógörbe alakja a korrelációtartalmát fejezi ki. Ha nagyobb X értékekhezáltalában nagyobb Y értékek tartoznak, vagyisa tényezőváltozó növelése az eredményváltozónagyságát növeli.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
3210- 1- 2- 3
3
2
1
0
- 1
- 2
- 3
P o z i t ív k o r r e l á c i ó
R -S q = 6 2 .5 %
Y = -8 . 6 E -0 2 + 0 . 6 9 0 2 8 6 X
Pozitív korreláció
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Negatív korreláció
Az előbbi kapcsolat ellentéte természetesen anegatív korreláció, amelyet a regressziófüggvényugyancsak szemléletesen jelez.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
- 3 - 2 - 1 0 1 2 3
- 3
- 2
- 1
0
1
2
3
N e g a t ív k o r r e lá c i ó
Y = 5 . 0 7 E - 0 2 - 0 . 6 4 7 8 7 2 X
R - S q = 7 0 . 9 %
Negatív korreláció
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Görbevonalú kapcsolat
A lineáristól eltérő típust görbe vonalú(nemlineáris) kapcsolatnak nevezzük.
A nemlineáris kapcsolatok egy részénél továbbra isvan értelme pozitív, vagy negatív irányzatrólbeszélni, feltéve, hogy a görbe monoton növekvő,illetve csökkenő irányzatot mutat az értelmezésitartományon belül.
Nem lehet azonban pozitív vagy negatív irányrólbeszélni, ha a regresszió irányt változtat.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
- 3 - 2 - 1 0 1 2 3
0
1 0
2 0
3 0
4 0
N e m l i n e á r i s k o r r e lá c i ó
Y = 1 2 . 0 9 5 8 + 6 . 0 7 6 8 4 X + 1 . 1 6 6 8 6 X * * 2
R - S q = 8 8 . 4 %
Görbevonalú kapcsolat
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A kapcsolat szorosságának mérőszámai
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A kovariancia
Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg.
A megfelelő átlagtól vett ( ) és ( ) eltéréseken alapszik.
yx - 1-n
xy =
1-n
dd = C
yx
yxrC ss
x-x y-y
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Kovariancia tulajdonságai
• A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást.
• Kovariancia előjele a kapcsolat irányát mutatja.
• A kovariancia abszolút mértékének nincs határozott felső korlátja.
• A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Egy vállalat dolgozóinak keresete és havi megtakarítása
DolgozóBér
(Ft/fő)
Havi megtakarítás
(Ft/hó)
1 120000 13000
2 90000 10000
3 220000 35000
4 150000 18000
5 100000 12000
6 115000 12500
7 160000 20000
8 130000 13800
9 145000 14000
10 100000 11800
Összesen 1330000 160100
dx
-13000
-43000
87000
17000
-33000
-18000
27000
-3000
12000
-33000
0
dy
-3010
-6010
18990
1990
-4010
-3510
3990
-2210
-2010
-4210
0
dxdy
39130000
258430000
1652130000
33830000
132330000
63180000
107730000
6630000
-24120000
138930000
2408200000
dx2
169000000
1849000000
7569000000
289000000
1089000000
324000000
729000000
9000000
144000000
1089000000
13260000000
dy2
9060100
36120100
360620100
3960100
16080100
12320100
15920100
4884100
4040100
17724100
480729000
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Kovariancia
Értelmezés: a dolgozók keresete és a havimegtakarított összege közötti kapcsolatpozitív irányú.
8267577777,9
2408200000yx -
1-n
xy =
1-n
dd = C
yx
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A korrelációs együttható
• A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma.
• A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi.
• Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg.
• A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Korrelációs együttható
d d = xy - n x yx y
d = x n xx
2 2 2
d = y n yy
2 2 2
)()(2
2222y
2x
yx
yx ynyxnx
yxn-xy
dd
ddC=r
ss
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Korrelációs együtthatóDolgozó Bér (Ft/fő)
Havi megtakarítás
(Ft/hó)dx dy dxdy dx
2 dy2
Összesen 1330000 160100 0 0 2408200000 13260000000 480729000
0,95448072900001326000000
2408200000
dd
ddC=r
2
y
2
x
yx
yx
ss
Értelmezés: a dolgozók keresete és a havi
megtakarított összege közötti kapcsolat
pozitív irányú és erős.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Determinációs együttható
• A determinációs együttható megmutatja, hogya magyarázóváltozó hány %-ban befolyásoljaaz eredményváltozó szóródását.
• Jele: r2
• A determinációs együttható jellemzi:
• A regressziós függvény illeszkedését,
• A modell magyarázó erejét.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Determinációs együttható
%98,909098,00,954r 22
Értelmezés: a dolgozók keresete 90,98%-
ban befolyásolja a havi megtakarított összeg
szóródását.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A rangkorreláció
Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegűtulajdonságai, amelyek számszerűen egyáltalán nem, vagy csaknehezen mérhetők.
A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 közötthelyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor =1, ha a sorszámok a két ismérv szerint következetesen ellentétesenalakulnak, akkor = -1.
)1n(n
d6-1=
2
2
i
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Rangkorreláció
Régió 1 2 3 4 5 6 7 8 9 10
Árbevétel (MFt) 34 30 25 22 21 10 12 8 31 20
Nyereség (MFt) 16 10,5 10 12 7 4 2 1 9 11
x 10 8 7 6 5 2 3 1 9 4
y 10 7 6 9 4 3 2 1 5 8
d 0 1 -1 -3 1 -1 1 0 4 -4
d2 0 1 1 9 1 1 1 0 16 16
Egy régió vállalatainak gazdálkodására vonatkozó adatok
7212,0
11010
4661
)1n(n
d6-1=
22
2
i
Értelmezés: a vállalatok árbevétele és nyeresége között közepesnélszorosabb, pozitív irányú kapcsolat van.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A korrelációs hányados
• A görbevonalú kapcsolatok szorosságának mérőszáma.
• A mutatószám kialakításának gondolatmenete: csoportosítjuk a megfigyelt értékeket a tényezőváltozó értékei vagy osztályközei szerint, és kiszámítjuk az eredményváltozó részátlagait az egyes csoportokban.
y/x
2 K(y)
2
(y)
2
K (y)
(y)
B (y)
2
y)
2
B (y)
(y)
S
S
S
S 1 1
(
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A korrelációs hányados
• A korrelációs hányados négyzetét definiáltuk, mivel az csupán a kapcsolat intenzitását jelzi, irányát nem.
• Megoszlási viszonyszám jellegénél fogva a korrelációs hányados négyzete mindig nulla és egy közé esik.
• Előjelét nem értelmezzük, megállapodásszerűen pozitív számként kezeljük.
• A korrelációs hányadost nem szokták százalékos formában kifejezni.
• Általában y/x x/y tehát nem szimmetrikus az X és Y változókban.
• X csupán mint csoportképző ismérv szerepel .
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Köszönöm a [email protected]