szemelvények táv jegyzetből nappalisoknak

Upload: tamas-szabo

Post on 09-Jan-2016

216 views

Category:

Documents


0 download

DESCRIPTION

stat II

TRANSCRIPT

  • Kovcs Pter

    Szemelvnyek a tvos jegyzetbl

    Szeged 2011

  • 2

    Tartalomjegyzk

    1. LER STATISZTIKAI ELJRSOK ................................................................ 3

    STATISZTIKAI MEGFIGYELSEK TPUSAI ......................................................................... 3

    2. VRHAT RTKEK (TLAGOK) VIZSGLATRA IRNYUL PRBK ........... 6

    ELMLETI SSZEFOGLAL ......................................................................................... 6

    3. SSZEFGGS VIZSGLAT ......................................................................... 10

    ELMLETI SSZEFOGLAL ........................................................................................10

    4. VARIANCIAANALZIS ................................................................................. 15

    ELMLETI SSZEFOGLAL ........................................................................................15

    5. KORRELCI- S REGRESSZISZMTS .................................................. 17

    ELMLETI SSZEFOGLAL ........................................................................................17 A PONTDIAGRAM S A REGRESSZI KAPCSOLATA EXCELBEN .................................................23

    6. IDSORELEMZS ....................................................................................... 27

    ELMLETI SSZEFOGLAL ........................................................................................27 MINTAFELADAT .....................................................................................................33

    7. SSZEFOGLAL TBLZAT......................................................................... 40

    8. IRODALOMJEGYZK ................................................................................... 41

  • 3

    1. Ler statisztikai eljrsok

    A ler statisztika az informcitmrts legegyszerbb formjnak tekinthet. Gyakorlatilag ide tartozik a megfigyelt egyedek egy vltoz (ismrv) szerinti eloszlsnak jellemzse: diagramok, tblzatok ksztse, az tlagos tendencik, azaz a kzprtkek a szrds, az aszimmetria jellemzse. Az sszetettebb statisztikai elemzsek eltt clszer az adott vltozk mentn ler statisztikai elemzst is vgrehajtanunk.

    Statisztikai megfigyelsek tpusai

    Teljes kr adatgyjtsek sorn az egsz vizsglt sokasgot megfigyelik. A teljes kr megfigyelsek ltalban nagyon kltsgesek, sokszor lehetetlen megvalstani. A teljes kr adatgyjts tipikus pldja a npszmlls. A nemzetkzi gyakorlat szerint ltalban 10 venknt tartanak npszmllst. Legutbb 2001-ben volt haznkban ilyen sszers. A teljes kr megfigyels helyett ltalban a rszleges megfigyelseket hasznljuk a gyakorlatban. Rszleges megfigyelsek sorn csak a sokasg egy rszt, nhny egyedt figyeljk meg. A rszleges megfigyelsek fbb tpusa a monogrfia, a reprezentatv megfigyels, illetve egyb rszleges megfigyelsek. A monogrfia a sokasg nhny kiemelt, fontos egyednek a vizsglatt jelenti. A reprezentatv megfigyels sorn a megfigyelt egyedek kivlasztsa klnbz kritriumok alapjn trtnik, gy, hogy a megfigyelt egyedek tulajdonsgai tkrzik az alapsokasg tulajdonsgait. Ekkor a vizsglt sokasgot alapsokasgnak, mg a megfigyelt rszsokasgot pedig mintnak nevezzk. A minta csak vges elemszm lehet. A reprezentatv mintavtel megvalstsnak mdja a vletlen mintavtel. Ez azt jelenti, hogy az alapsokasg mindegyik egyede valamilyen valsznsggel, esllyel kerlhet a mintba. Ha a mintba kerl elemeket visszatevssel vlasztjuk ki, akkor az alapsokasg mindegyik egyede ugyanakkora valsznsggel kerlhet be a mintba. Ekkor fggetlen, azonos eloszls mintt (FAE-mintt) kapunk. Ekkor az alapsokasg egyedei akr tbbszr is bekerlhetnek a mintba. Ez nha problmt okozhat akkor, ha valamilyen szlssges elem tbbszr bekerl a mintba. Ha a mintba kerl elemeket visszatevs nlkl vlasztjuk ki, akkor egyszer vletlen mintt (EV-mintt) kapunk. Ekkor az alapsokasg egyedei csak egyszer kerlhetnek a mintba. Ezrt az EV-minta jobbnak tekinthet az FAE-mintnl. Egy vizsglt alapsokasgbl vehet, adott elemszm sszes lehetsges FAE-mintk szma nagyobb az EV-mintk szmnl.

  • 4

    Az elz kt vletlen minthoz viszonytva az alapsokasg jobb reprezentcijt kapjuk a rtegezett minta alkalmazsval. Amennyiben egy heterogn sokasgot megkzeltleg homogn rszsokasgokra tudunk bontani, akkor alkalmazhatjuk a rtegzett mintavtelt. A rtegzett mintt (R-mintt) gy kapjuk meg, hogy minden rtegbl (rszsokasgbl) EV-mintt vesznk. Az egyes rtegekbl vett EV-mintk elemszmainak meghatrozsra kt mdszert emltnk meg. Egyenletes eloszts esetn mindegyik rtegbl ugyanannyi elemet vlogatunk a mintba. Arnyos eloszts esetn a rtegek elemszmnak sokasgbeli arnyt figyelembe vve trtnik a kivlaszts. Csoportos (CS) mintavtel esetn az alapsokasgot heterogn csoportokra bontjuk szt. Ezutn a csoportok kzl vesznk EV-mintt. A kivlasztott csoportokat pedig teljes kren megfigyeljk. A tbblpcss (TL) mintavtel az elz eljrsok kombinlst jelenti. Pldul egy ktlpcss mintavtel esetn elszr csoportos mintavtelt alkalmazunk, majd a kivlasztott csoportokat nem teljes kren figyeljk meg, hanem ezekbl EV-mintkat vesznk. Plda Egy ruhzlnc kzrzetjavt intzkedseket szeretne vgrehajtani. Ehhez meg szeretnk krdezni a dolgozik vlemnyt is. Amennyiben minden dolgoz vlemnyt megkrdezik, akkor teljes kr megfigyelsrl van sz. Amennyiben a dolgozk kzl reprezentatv vletlen mintt vesznek akkor az elbbi eljrsokra az albbi plda adhat. EV-minta: vletlenszeren vlasztunk ki nhny dolgozt. FAE-minta: vletlenszeren vlasztunk ki nhny dolgozt. (ismtlds lehet, valakit tbbszr is megkrdezhetnk). R-minta: az alkalmazottakat beosztsuk szerint csoportostst tekintve (pl. pnztros, elad, osztlyvezet, stb.) minden egyes csoportbl vlasztunk elemeket a mintba. Egyenletes eloszts esetn minden csoportbl ugyanannyi ft krdeznk meg, mg arnyos eloszts esetn a mintban ugyanannyi lesz minden csoport arnya, mint az alapsokasgban. CS-minta: vletlenszeren kivlasztunk nhny ruhzat, majd az ott dolgozk mindegyikt megkrdezzk. TL-minta: vletlenszeren kivlasztunk nhny ruhzat, majd az ott dolgozkbl EV-mintt vesznk. Az adatgyjtsek, megfigyelsek hibkkal jrnak. A nemmintavteli hibk azok a hibk, amelyek mind a teljes, mind a rszleges megfigyelseknl fellphetnek. Ezek matematikai eszkzkkel nem kezelhetek. Ilyenek pldul a defincis hiba (rossz krdvszerkeszts), a vlaszadsi hiba (tves adat kzlse), a vgrehajtsi hiba (rossz lekrdezs), az adatrgztsi hiba. A mintavteli hiba a rszleges megfigyelsbl fakad hiba. Ez a tpus matematikailag kezelhet. Mintavtel esetn amit ler statisztikai eszkzkkel lltunk kizrlag az adott mintra vonatkozik. A gyakorlatban viszont sokszor nem pusztn az

  • 5

    adott minta, hanem az egsz alapsokasg jellemzi rdekelnek bennnket. Ekkor,

    vagy meg szeretnnk becslni az alapsokasg valamely paramtert (pldul megkrdezznk 1000 embert, hogy mely prtra szavazni, s ez alapjn megbecsljk, hogy az sszes szavazsra jogosult hny szzalka szavazna e prtra). Teht egy vagy tbb minta alapjn a vizsglt alapsokasg valamely mg ismeretlen jellemzjt kell meghatrozni, jellemezni. Erre kt lehetsg van.

    o Pontbecsls esetn a minthoz egyetlen szmszer rtket rendelnk, s ezt tekintjk a becslni kvnt paramter rtknek, azaz a mintbl kiszmtott rtket tekintjk a sokasgi jellemz becslt rtknek.

    o Intervallumbecsls esetn azonban egy olyan intervallumot hatrozunk meg, amely elre adott nagy valsznsggel tartalmazza a becslni kvnt paramtert. Ezt az intervallumot konfidenciaintervallumnak nevezzk.

    Gondoljunk bele, hogy ha vennnk 100 klnbz mintt, akkor mindegyiknek a mintatlaga ms s ms rtk lehet. ppen ezrt pldul a 95 szzalkos konfidenciaintervallum azt jelenti, hogy sszes lehetsges adott elemszm mintt vve, tlagosan az esetek 95 szzalkban a sokasgi tlag bele esik a konfidenciaintervallumba. Az intervallum megadsa az intervallum als s fels hatrnak megadst jelenti. Az intervallum kzppontja a vizsglt mintajellemz lesz. Az intervallum kzppontjnak s szlnek tvolsga a hibahatr. A hibahatr megmutatja, hogy a mintatlag s a sokasgi tlag maximlisan mennyivel trhet el egymstl az adott megbzhatsgi szint mellett. A mintatlag s a hibahatr alapjn kapjuk meg a sokasgi tlag intervallumbecslst: (mintatlag hibahatr; mintatlag + hibahatr).

    A hibahatr rtke 3 tnyeztl fgg: 1. A minta elemszmtl: minl nagyobb a minta elemszma, annl kisebb

    lesz a hibahatr rtke. 2. Az alapsokasg szrstl: minl nagyobb a szrs, annl nagyobb lesz

    a hibahatr rtke. Gyakorlatban problmt jelent, hogy az alapsokasg szrsa elre nem ismert, gy ennek rtkt becslni kell a rendelkezsre ll minta alapjn. Ezt a szrst korriglt tapasztalati szrsnak nevezzk. Ennek kiszmtsa annyiban tr el a hagyomnyos szrs kiszmtstl, hogy a nevezjben nem a minta n elemszma, hanem eggyel cskkentetett rtke (n-1) szerepel.

    3. A konfidenciaszinttl s a vltoz eloszlstl: adott eloszls mellett minl nagyobb a megbzhatsgi szint, annl nagyobb lesz a hibahatr rtke. A megbzhatsgi szint s a vltoz eloszlsa egy valsznsgi paramtert eredmnyez, amely kzvetlenl befolysolja a hibahatr rtkt.

    vagy pedig van valamilyen elzetes elkpzelsnk az alapsokasg adott tulajdonsgra vonatkozan s egy minta alapjn ellenrizni szeretnnk, hogy az helytll vagy sem. Ezzel a hipotzisvizsglat foglalkozik, melyet a ksbbiekben fogunk trgyalni.

  • 6

    2. Vrhat rtkek (tlagok) vizsglatra irnyul prbk

    Elmleti sszefoglal

    A hipotzisvizsglatrl ltalban A gyakorlatban sokszor elfordul, hogy egy sokasg valamely paramterre vonatkozan van egy felttelezett rtk, vagy valamilyen jellemzjrl (pldul eloszlsrl) van egy elzetes elkpzelsnk s csak azt szeretnnk eldnteni, hogy ez megfelel-e a valsgnak. Ha a sokasg teljes kr megfigyelsre nincs mdunk, akkor a mintavtel mdszerhez folyamodhatunk. Ilyenkor egy vletlen minta alapjn azt fogjuk megvizsglni, hogy a mintnk tmogatja-e a hipotzisnket, vagy ellentmond neki. gy bizonyos megbzhatsggal llthatjuk majd, hogy hipotzisnk teljesl vagy sem. A fellltott hipotzisek helyessgnek vletlen mintkra alapozott vizsglatt hipotzisvizsglatnak nevezzk. Az ennek sorn alkalmazott eljrsok a statisztikai prbk vagy tesztek. A hipotzisvizsglat sorn a hipotzisvizsglat lpseit kell vgrehajtani. Ezek az albbiak. 1. A tesztelni kvnt nullhipotzisnek nevezett felttelezs megfogalmazsa. Ezzel szemben mindig van egy alternatv hipotzis. Ez a nullhipotzis tagadsa. Amikor dntst hozunk, a kt hipotzis kzl valamelyiket elfogadjuk, nyilvn ekkor a msikat elvetjk. 2. A nullhipotzist s a rendelkezsre ll informcikat figyelembe vve a prbafggvny kivlasztsa. Ez gyakorlatilag egy statisztika (kplet) kivlasztst jelenti. Ez a prbafggvny gyakorlatilag a mintbl kiszmtott rtk(ek)et hasonltja ssze a tesztelt sokasgi paramter felttelezett rtkvel. Ezt a szoftverek a megfelel elemzsi eljrsok kivlasztsval tbbnyire elvgzik helyettnk, a szmtgpes kimeneteken ezeknek a vizsglt mintn felvett rtkeit is megtallhatjuk. 3. A 0-hoz kzeli szignifikanciaszint kivlasztsa, s a prbafggvny rtkkszletnek elfogadsi s kritikus tartomnyra bontsa. Gyakorlatilag meghatrozzuk egy olyan eltrs tartomnyt, amire azt mondjuk, hogy a tesztelt sokasgi paramter mintbl kiszmtott rtke s vrt rtke kztti eltrs nem szignifikns adott valsznsg mellett. A szoftverek ltalban csak egy gynevezett kritikus rtket kzlnek a tartomnyok helyett. Gyakorlatban ltalban tszzalkos szignifikanciaszint mellett dolgozunk, de elfordul a 10, illetve minsggyi vizsglatok sorn az 1 szzalkos szint alkalmazsa is. Pldul az tszzalkos szignifikanciaszint azt jelenti, hogy ha van egy helyes lltsunk s szzszor elvgeznnk ugyanazt a vizsglatot, akkor tlagosan 95 esetben helyes dntst hozunk. 4. A prbafggvny mintn felvett rtknek megllaptsa. 5. Dnts a nullhipotzis elfogadsrl-elvetsrl adott szignifikanciaszint mellett. Ez gyakorlatilag a prbafggvny mintn felvett rtknek sszehasonltst jelenti a kritikus rtkkel. A nullhipotzis elvetse maga utn vonja az alternatv hipotzis elfogadst. Amikor dntst hozunk a nullhipotzis elfogadsrl, illetve elvetsrl, akkor termszetesen elfordulhat, hogy hibs dntst hozunk.

  • 7

    Abban az esetben, ha a nullhipotzist elvetjk, noha az a valsgnak megfelel, akkor elsfaj hibt kvetnk el. Ennek elkvetsi valsznsge megegyezik az szignifikanciaszinttel. Abban az esetben, ha a nullhipotzist elfogadjuk, noha az a valsgnak nem felel meg, akkor msodfaj hibt kvetnk el. Ennek valsznsgt csak becslni tudjuk. Annyit rdemes megjegyezni, hogy a msodfaj hiba s az elsfaj hiba elkvetsnek valsznsge ellenttesen mozog, ezrt nem clszer tlsgosan kicsinek vlasztani a szignifikanciaszintet, mert cskkentse nveli a msodfaj hiba elkvetsnek valsznsgt. Ezrt hasznljuk gyakran az tszzalkos szignifikanciaszintet, mint maximlis trshatrt az els faj hiba elkvetsnek valsznsgre. Hipotzisvizsglattal szmos dolog tesztelhet, erre nhny plda:

    Tekinthet-e a frfiak vrhat lettartama 70 vnek, vagy szignifiknsan eltr ettl?

    Szignifikns klnbsgek vannak-e rgik szmtgpes elltottsgban? Szignifiknsan klnbzik-e kt prt szavazinak arnya? Szignifikns kapcsolat van-e munkanlklisgi rta s az egy fre jut

    GDP kztt? Szignifikns kapcsolat van-e a nem s a beoszts kztt? Egyenletesen rkeznek-e az gyfelek egy gyflszolglatra?

    Hipotzisvizsglat sorn elszr azt kell tudnunk, hogy az adott problma a sokasg mely paramternek tesztelst jelenti: tlag, arny, szrs, eloszls? A fejezet htralv rszben a vrhat rtk (sokasgi tlag) tesztelsre szortkozom. Vrhat rtkek tesztelse A vrhat rtkek sszehasonltsra szmos lehetsg kzl vlaszthatunk a vltozk tpusa s a mintk szma alapjn. Ezen a kpzsi szinten a metrikus vltozk vrhat rtkeinek, nagy mintn trtn sszehasonltsval foglalkozunk. Ezt azrt tesszk, mert a gyakorlati letben tbbnyire nagy mintkkal, azaz tbb szzas mintanagysggal dolgozunk. Egymints prbk (pldul a frfiak vrhat lettartama tekinthet-e 70 vnek, vagy szignifiknsan eltr ettl) esetn meg kell adnunk, hogy a vrhat rtket milyen konkrt rtkkel szeretnnk sszehasonltani. Ktmints prbk esetben (pldul a frfiak s a nk vrhat lettartama azonosnak tekinthet-e, vagy szignifiknsan klnbznek; a kezd fizetsek s a jelenlegi fizetsek kztti tlagos klnbsg 20 ezer forint, vagy ettl szignifiknsan klnbz), vagy csak a vizsglt kt vltozt kell megadnunk, vagy pedig a vrt eltrst is. Ennek az oka az, hogy nem csak a kt vrhat rtk egyezsgt, hanem adott rtkkel val klnbzsgt is lehet tesztelni. Ezeknl a prbknl a nullhipotzis mindig a vrhat rtkek egy adott rtkkel trtn, egymssal val megegyezst, vagy klnbsgk adott rtkkel val egyezsgt jelenti. E vizsglatoknl az elsfaj hiba elkvetse (elvetjk a helyes nullhipotzist), hogy szignifikns klnbsget mutatunk ki ott, ahol nincs is.

  • 8

    Vrhat rtkek sszehasonltsa esetn (is) beszlhetnk egyoldali s ktoldali prbkrl is. Pldul, ha azt a nullhipotzist vizsgljuk, hogy a frfiak s a nk vrhat lettartama megegyezik, azaz szignifiknsan nem klnbzik, akkor legegyszerbb alternatv hipotzisknt azt fogalmazhatjuk meg, hogy a frfiak s a nk vrhat lettartama nem egyezik meg, azaz szignifiknsan klnbzik. Ennl azonban tbbet is llthatunk, pldul azt, hogy a nk vrhat lettartama nagyobb (kisebb), mint a frfiak. Az els esetben gynevezett ktoldali prbt, mg az utbbi esetben egyoldali prbt hajtunk vgre. Az egyoldali prbk esetn beszlhetnk bal-, illetve jobboldali prbrl is, az alternatv hipotzis fggvnyben. A statisztikai programcsomagok ltalban csak ktoldali prbt hajtanak vgre, mivel nhny paramterbl kvetkeztethetnk az egyoldali prba eredmnyre is. Pldul, ha szignifikns klnbsget tallunk a frfiak s a nk vrhat lettartama kztt, akkor pldul a mintatlagok nagysgbl megllapthatjuk, hogy melyik nem vrhat lettartama szignifiknsan nagyobb. Nagy mintk esetben a centrlis hatreloszls ttel alapjn a minta elemszmnak nvelsnek hatsra a vrhat rtkek eloszlsa egyre jobban kzelti a normlis eloszlst. Mivel a szoftverek mintt s ez ltal az alapsokasgnak ismeretlen szrst felttelezik, ezrt a szmtgpes eljrsok dnt tbbsgben gynevezett t-prbkat hajtanak vgre vrhat rtkek tesztelsekor. Az albbi tblzatban nhny vrhat rtk tesztelsi eljrs tallhat. Jegyezzk meg, hogy amennyiben kis elemszm mintval dolgozunk, akkor a metrikus vltozk e prbkkal trtn tesztelsnek elfelttele a normlis eloszls. Ha ez nem teljesl, akkor az els oszlopbl vlaszthatunk tesztet.

    A vrhat rtkek hipotzisvizsglattal trtn sszehasonltsnak lehetsgei

    Vrhat rtkek sszehasonltsa

    Sorrendi mrsi szint vltoz

    (ordinlis skla)

    Metrikus vltoz (intervallumskla,

    arnyskla) Medin tlag

    Vrhat rtk sszehasonltsa egy adott rtkkel

    WILCOXON-prba

    Egymints z-prba (ha az alapsokasg szrsa ismert). Egymints t-prba (ha az alapsokasg szrsa nem ismert).

    Kt vrhat rtk sszehasonltsa

    egymssal MANN-WHITNEY prba

    Ktmints z-prba (ha az alapsokasgok szrsa ismert). Ktmints t-prba (ha az alapsokasgok szrsa nem ismert. Ekkor kln tesztelnnk kell F-prbval a variancik egyezsgt.)

    Tbb vrhat rtk sszehasonltsa

    egymssal

    KRUSKALL-WALLIS prba (fggetlen mintk esetn) FRIEDMANN prba (nem

    fggetlen mintk esetn)

    Varianciaanalzis (varianciahomogenits s normlis eloszls esetn).

  • 9

    Mivel az Excel Adatelemzs modulja csak kt s tbb mints esettel tud dolgozni, ezrt csak erre fogunk koncentrlni. Ezekben az esetekben a vrhat rtkek sszehasonltsa azzal a krdssel ekvivalens, hogy szignifikns klnbsg van-e a mintk kztt az adott vltoz tlagban. Ekkor a vizsglat nullhipotzise a vrhat rtkek egyezsge, azaz az, hogy e tekintetben nincs szignifikns klnbsg a mintk kztt. Ebben a fejezetben, a tovbbiakban a ktmints t-prbkkal foglalkozunk. Ennek alkalmazsra ltalban az albbi hrom esetben kerl sor. Ha kt minta fggetlen (pldul szignifikns klnbsg van-e a frfiak s a nk kezd fizetse kztt)

    1. Ktmints t-prba egyenl variancikkal. A prba eltt, F-prbval meg kell vizsglnunk a variancik egyezsgt.

    2. Ktmints t-prba nem egyenl variancikkal. A prba eltt, F-prbval meg kell vizsglnunk a variancik egyezsgt.

    Az F-prbval azt vizsgljuk, hogy a vltoz variabilitsa azonosnak tekinthet-e a kt csoportban. A kt prba kztt a prbafggvnyben (httrszmts) van klnbsg.

    Ha kt minta nem fggetlen (pldul szignifikns klnbsg van-e a kezd fizets s a jelenlegi fizets kztt)

    3. Ktmints, pros t-prba. Ekkor az egyes megfigyelsek egymssal prba llthatk (nem fggetlenek a mintk). Tipikusan errl az esetrl van sz, ha egy csoportot megfigyelnk valamilyen ksrlet eltt s utn.

    Mg egyszer hangslyoznm, a hipotzisvizsglatot az alapsokasgokban meglv szignifikns klnbsgek kimutatsra hasznljuk. Teht nem a mintra vonatkozan, hanem az alapsokasgra vonatkozan lltjuk azt, hogy nincs szignifikns klnbsg az tlagok kztt. A minta elemszmval kapcsolatban jegyezzk meg, hogy minl nagyobb a mintnk elemszma annl kisebb klnbsgeket tudunk kimutatni. Ezt gy kpzelhetjk el, hogy a kis elemszm egy informcihinyos llapotot jelent. Kevs elem alapjn kevsb biztosan mondhatjuk egy klnbsgre hogy az szignifikns.

  • 10

    3. sszefggs vizsglat

    Elmleti sszefoglal

    Modelltpusok Empirikus vizsglatok sorn kutatsi problmaknt gyakran kerlhetnk szembe a mirt, a mi ennek az oka, milyen sszefggs van a vltozk kztt krdsekkel. Ezen krdsek kezelsre mind kvalitatv, mind kvantitatv eljrsok ismertek. m a kvalitatv vizsglatokkal szemben, a kvantitatv vizsglatok eredmnyei szmszersthetek. A krdskr statisztikai vizsglatra a statisztikai magyarz modelleket is alkalmazhatjuk. Az alkalmazand magyarz modell kivlasztsa eltt szmos krdst kell tisztzni. Elszr is, meg kell llaptani a vizsglatba bevont fgg vltoz s a magyarzatknt lehetsges tnyezk kztti fggsgi kapcsolat tpust. Ehhez a vltozk tpusait kell felismernnk.

    Amennyiben mind a magyarz- (ok), mind a fggvltoz metrikus akkor korrelci- s regresszianalzist vgezhetnk. Pldul befolysolja-e egy termk rtkestst a termk ra. Ezzel a vizsglati tpussal a ksbbi fejezetekben foglalkozunk.

    Amennyiben a magyarzvltoz metrikus, a fggvltoz kategorizlt akkor diszkriminanciaanalzist, illetve logisztikus regresszit clszer alkalmaznunk. Pldul befolysolja-e egy termk ra azt, hogy megvesszk, vagy sem. Ezzel a vizsglati tpussal ezen a kpzsi szinten nem foglalkozunk.

    Amennyiben a magyarzvltoz kategorizlt, a fggvltoz pedig metrikus akkor varianciaanalzist vgezhetnk. Pldul befolysolja-e egy termk rtkestst a termk minsge. Ezzel a vizsglati tpussal a ksbbi fejezetekben foglalkozunk, az alapjaival az I. flvben foglalkoztunk (varianciafelbonts, kls s bels eltrs-ngyzetsszeg).

    Amennyiben mind a magyarz-, mind a fggvltoz kategorizlt akkor kereszttbla elemzst vgezhetnk. Pldul befolysolja-e az ruhzakban a termk elhelyezst a termk minsge. Termszetesen vannak kevert modellek is, amikor a magyarzvltoz oldalon keverednek a vltoz tpusok. Ezekkel a modelltpusokkal nem foglalkozunk.

    Vltozk kztti sszefggsek vizsglatnak tpusai

    Metrikus magyarz Nem metrikus magyarz

    Metrikus fgg Korrelciszmts (kapcsolatvizsglat) Regressziszmts (ok-okozati vizsglat)

    Varianciaanalzis (ANOVA)

    Nem metrikus fgg diszkriminanciaanalzis (ok-okozati vizsglat)

    kereszttblaelemzs

    Amennyiben vltozk kapcsolatait vizsgljuk elszr rdemes tisztzni, hogy egyltaln szignifikns kapcsolat van-e a vltozk kztt. E prbk

  • 11

    nullhipotzise szerint a kt ismrv (vltoz) egymstl fggetlen, azaz a kt vltoz kztt nincs szignifikns kapcsolat, mg az alternatv hipotzis szerint szignifikns kapcsolat van a vltozk kztt. Kapcsolatvizsglat sorn az els faj hiba elkvetse azt jelenti, hogy kapcsolatot mutatunk ki ott, ahol nincs is. A nullhipotzis elvetse csupn azt jelenti, hogy a kt vltoz nem tekinthet egymstl fggetlennek. Ettl a kztk lv kapcsolat erssge gyakorlati szempontbl mg jelentktelen is lehet. Teht elszr meg kellene vizsglnunk, hogy szignifikns kapcsolat van-e kt vltoz kztt, s csak azutn beszlhetnk a kapcsolat erejrl. Ekkor alkalmazhatjuk a kapcsolatmr mutatkat. Meg kell jegyezni, hogy a kapcsolatvizsglat pusztn matematikailag vizsglja a vltozk egyttmozgst, ami nem felttlen jelent vals kapcsolatot. Ezek vizsglata mindig az elemz felelssge. Pldul, matematikailag szoros kapcsolat mutathat ki a csecsemhalandsg s a Magyarorszgra rkez klfldi turistk szma kztt, de ez mgsem jelent vals kapcsolatot. Kereszttblk vizsglata Kt minsgi vagy terleti ismrv esetn ktdimenzis kombincis tblt kszthetnk. Ekkor mindegyik megfigyelst egyidejleg kt ismrv szerint osztlyozzuk. Ezt az Excelben a kimutats kszts segtsgvel vgezhetjk el. A kombincis tbla alapjn lehetsgnk van a kt vizsglt vltoz kztti kapcsolat szignifikancijnak vizsglatra. Ezt a vizsglatot fggetlensgvizsglatnak nevezzk. A prba nullhipotzise szerint a kt ismrv (vltoz) egymstl fggetlen. Pldul, ha azt vizsgljuk, hogy a jegyzet hasznlat fggetlen-e a tagozattl, akkor a nullhipotzis azzal ekvivalens, hogy mind a nappalis, mind a tvos hallgatk esetben ugyanaz a jegyzethasznlat szerinti megoszls. A fggetlensgvizsglat alapja az a valsznsgszmtsbl tanult sszefggs, mely szerint, ha A s B esemnyek egymstl fggetlenek, akkor P(AB)=P(A)P(B). E vizsglatok sorn a tblzatok egy mintaadatait tartalmazza. Neknk meg kellene, hatrozni, azt, hogy a vizsglt tblzat belsejben milyen adatok szerepelnnek fggetlensg esetn, majd ezeket ssze kellene hasonltanunk. A kvetkezkben ezt szemlltetem. A vizsglat sorn ijf azt jelenti, hogy a megfigyelsek alapjn az egyes cellkba hny elem kerlt, *ijf azt jelenti, hogy az egyes cellkba hny elem kerlne, ha a kt ismrv fggetlen lenne egymstl. Nzznk egy pldt egy vros vletlenszeren (FAE) kivlasztott 1156 laksnak komfortsgra s a benne lk hztartstpusra vonatkoz adatok alapjn.

    Komfortfokozat

    Hztartstpus

    sszesen

    Egyedlllk s

    gyermektelen hzasprok

    szma

    Gyermekes hzasprok

    szma

    Komfort nlkli Flkomfortos Komfortos

    20 90

    300

    10 236 500

    30 326 800

    sszesen 410 746 1156

  • 12

    Mivel a vizsglt kt ismrv (komfortfokozat, hztartstpus) minsgi ismrv, ezrt a kereszttbla elemzst hajthatunk vgre. Elszr szmtsuk ki, hogy milyen rtkek szerepelnnek az egyes cellkban, ha a kt ismrv teljesen fggetlen lenne egymstl! A megadott tblzat egy empirikus vizsglat eredmnyt tartalmazza. A tblzat belsejben szerepl ijf rtkek azt jelentik, hogy a megfigyelsek alapjn az egyes cellkba hny elem kerlt. A krds azt jelenti, hogy az egyes cellkba milyen *ijf rtkek kerlnnek az ijf rtkek helyre. Az *ijf azt mutatja, hogy az egyes cellkba hny elem kerlne, ha a kt ismrv fggetlen lenne egymstl. Krds az, hogy hogyan. Ennek szemlltetsre nhny megjegyzst teszek, amelyben tmenetileg hasznljuk a valsznsg terminust arra a kifejezsre, hogy valami az esetek hny szzalkban teljesl.

    1. Pldul, annak a valsznsge, hogy egy vizsglt laks komfort nlkli 30/1156.

    2. Annak a valsznsge, hogy egy vizsglt laksban egyedlllk, vagy

    gyermektelen hzasprok laknak 410/1156.

    3. Annak a valsznsge, hogy egy vizsglt laksban egyedlllk, vagy gyermektelen hzasprok laknak, valamint a vizsglt laks komfort nlkli 20/1156.

    4. Annak a valsznsge, hogy egy vizsglt laksban egyedlllk, vagy

    gyermektelen hzasprok laknak, valamint a vizsglt laks komfort nlkli

    s a kt ismrv (esemny) egymstl fggetlen 1156

    301156410

    . Ennek a

    magyarzata az, hogy ha A s B esemnyek egymstl fggetlenek, akkor P(AB)=P(A)P(B).

    5. Ebbl kvetkezen, ha a kt ismrv teljesen fggetlen egymstl, akkor

    azon vizsglt laksok szma, ahol egyedlllk, vagy gyermektelen hzasprok laknak, valamint a vizsglt laks komfort nlkli

    11561156

    301156410

    . Ennek a magyarzata az, hogy a valsznsget

    leegyszerstve gy foghatjuk fel, hogy az esetek hny szzalkban teljesl valami. Teht a fggetlensg esetn fennll gyakorisgokat gyakorlatilag a sorok, az oszlopok sszege s a minta elemszma alapjn hatrozhatjuk meg.

    Ezek utn szmtsuk ki az sszes *ijf rtkeket. Ennek menett az albbi tblzat zrjelben szerepl kpletei mutatjk.

  • 13

    Komfortfokozat

    Hztartstpus

    sszesen Egyedlllk s gyermektelen hzasprok

    szma ijf ( *ijf )

    Gyermekes hzasprok szma ijf

    ( *ijf ) Komfort nlkli 20 )64,10( 115641030 = 10 )36,19( 115674630 = 30 Flkomfortos 90 )62,115( 1156410326 = 236 )38,210( 1156746326 = 326 Komfortos 300 )74,283( 1156410800 = 500 )26,516( 1156746800 = 800 sszesen 410 746 1156

    Lthat, hogy egy-egy cellban az ijf s az *ijf rtkek nem azonosak, gy a komfortfokozat s a hztats tpus nem teljesen fggetlen, krds az, hogy ezek az eltrsek szignifiknsak-e, azaz szignifikns kapcsolat van-e a kt vltoz kztt. A fggetlensgvizsglat lefuttatshoz egyetlen kplettel kell sszehasonltanunk az sszes sszetartoz ijf s *ijf rtket Ezt klnfle matematikai okok miatt a

    ( )

    = =

    =

    r

    i

    c

    j ij

    ij

    fff

    1 1

    2

    ij2

    kplettel tehetjk meg. A dupla szumma jel azt jelenti, hogy a kpletben szerepl mennyisget minden cella esetben kln-kln kiszmtjuk, majd ezeket sszeadjuk. A kpletben az angol szavak kezdbetibl az r a sorok szmt, mg a c az oszlopok szmt jelli. Lthat, hogy teljesen fggetlensg esetn (mindencellban ijf = *ijf ), a prbafggvny rtke nulla. Ebben a konkrt pldban

    0022,2326,516

    )26,516500(36,19

    )36,1910(64,10

    )64,1020( 2222=

    ++

    +

    =

    A krds az, hogy ez az rtk nagy eltrst jelez-e a nulla rtktl. Ennek eldntsre hasznljuk a hipotzisvizsglatot. Szignifikns kapcsolat esetn a kapcsolat erssgnek meghatrozshoz kt kh-ngyzet alap mrszmot is alkalmazhatunk: a CRAMER-fle

    ,)1,1min(2

    =

    crNC

    illetve CSUPROV-fle

    .

    )1()1(2

    =

    crNT

    asszocicis egytthatt. A C s T mutatk rtke csak ngyzetes tblk esetn egyezik meg. A mutatk rtke 0 s 1 kztt mozog. Teljes fggetlensg esetn

  • 14

    a mutat rtke 0. Minl nagyobb a mutat rtke, annl ersebb a kapcsolat a kt vltoz kztt.

    Az elz konkrt plda szerint

    ;14,011156

    022,23)12,13min(1156

    022,23)1,1min(

    2

    =

    =

    =

    =

    crNC

    .12,021156

    022,23)12()13(1156

    022,23)1()1(

    2

    =

    =

    =

    =

    crNT

    mivel a mutatk rtke nullhoz kzeli a komfortfokozat s a hztartstpus kztt gyenge kapcsolat van.

  • 15

    4. Varianciaanalzis

    Elmleti sszefoglal

    A varianciaanalzis kt alkalmazst rdemes megemlteni: az els alkalmazs segtsgvel tbb sokasg vrhat rtknek egyezsge tesztelhet (lsd: elz fejezet sszefoglal tblzata), a msik alkalmazs segtsgvel pedig regresszis modellek illeszkedse, illetve a tbbszrs korrelcis egytthat tesztelhet. Ezt a regressziszmtsnl fogjuk trgyalni. Ebben a fejezetben az els alkalmazst taglaljuk. Az els alkalmazs segtsgvel tbb sokasg vrhat rtknek egyezsge tesztelhet. Nhny alkalmazsi plda.

    Milyen fogykra mdszer a leghatkonyabb a kilk leadsra? Befolysolja-e a keresetek nagysgt a beoszts s/vagy a nem? Fgg-e egy termk rtkestse a termk elhelyezstl, csomagolstl? Kimutathat-e valamilyen terleti s/vagy gazati egyenltlensg a GDP-

    ben? Klnbz fajtj, de azonos nvnyek termstlagban van-e szignifikns

    klnbsg? Egy adott termk tlagra szignifiknsan klnbzik-e, az egyes

    teleplseken, s/vagy zletlncoknl. Szignifiknsan klnbzik-e az amerikai a japn s az eurpai autk

    tlagos gyorsulsa? A kt mints t-prbk ltalnostsnak tekinthet varianciaanalzis, tbb, egyenl szrs, normlis eloszls csoport/sokasg vrhat rtknek sszehasonltsra alkalmas statisztikai mdszer, melyet angol elnevezsnek kezdbetibl addan ANOVA-knt (ANalysis Of VAriance) is emlegetnek.

    Az elsfaj hiba elkvetsnek valsznsge az sszehasonltsok szmnak fggvnyben

  • 16

    Kettnl tbb minta alapjn trtn vrhat rtkek sszehasonltsra is elvileg mkdnek a ktmints prbk, a mintk sszes lehetsges pronknti sszehasonltsval. Azonban, ez az eljrs nem ajnlott, ugyanis az sszehasonltsok szmnak nvekedsvel drasztikusan emelkedik az elsfaj hiba elkvetsnek valsznsge. A varianciaanalzis alkalmazsakor az elsfaj hiba elkvetse gyakorlatilag azt jelenti, hogy kapcsolatot mutatunk ki ott, ahol nincs is. Teht legalbb egy csoportost ismrv szerint rszekre bontott sokasg valamely, legalbb intervallumskln mrt ismrvnek s a csoportost vltozk a kapcsolatt vizsgljuk. Arra keressk a vlaszt, hogy a csoportok statisztikailag szignifiknsan klnbznek-e a metrikus vltozban. A vizsglat eredmnye az ANOVA tblzatbl olvashat ki. A prba nullhipotzise szerint a csoportok vrhat rtkei megegyeznek, azaz a csoportost ismrv nem befolysolja a metrikus vltozt. Mg az alternatv hipotzis ennek tagadsa. Teht az alternatv hipotzis nem azt jelenti, hogy mindegyik csoport vrhat rtke klnbzik, hanem csak azt, hogy nem tekinthet mindegyik azonosnak. Pldul, ha a nullhipotzisnk szerint a rgik munkanlklisgi rti azonosnak tekinthetek, akkor ezt a nullhipotzist akkor is elvetjk, ha az sszes rgi munkanlklisgi rtja klnbz, de akkor is, ha csak egy tr el szignifiknsan az sszes tbbitl. Ha ennl tbb informcira van szksgnk, azaz kvncsiak vagyunk arra, hogy a nullhipotzis mirt bukott el, akkor gynevezett Post Hoc tesztet kell vgrehajtanunk. A varianciaanalzis alkalmazsnak kt felttele van. Az egyik a sokasg normlis eloszlsa, a msik pedig a variancik egyezsge. Az Excel Adatelemzs modulja nem ellenrzi le a felttelek teljeslst, gy a kapott eredmnyeket vatosan kell kezelnnk. rdekessg Mr az egyszerbb jelensgek vizsglatakor is felmerl, hogy nem csak egy tnyez befolysolja a vizsglt metrikus vltoznk rtkt. Attl fggen, hogy hny csoportost ismrv (hattnyez vagy faktor) hatst vizsgljuk, beszlnk egy szempontos (egyutas), kt szempontos (kt utas), illetve tbb szempontos (tbb utas) varianciaanalzisrl. Pldul, a jelenlegi fizetsek klnbzsge magyarzhat-e a nemmel (egyutas), illetve a nem s a vgzettsg (kt utas) egyttesvel. Tbb kategorilis vltozt bevonva azonban gyorsan n modellnk bonyolultsga. Kt hattnyez esetn mr szmolnunk kell az azok kztti fggsgi viszonnyal is, azaz azzal a hatssal, amelyet a kt vltoz egyttese gyakorol a vizsglt fgg vltoznkra. Ezt interakcis hatsnak nevezzk. (A faktorok ltal kln-kln magyarzott rszt fhatsoknak nevezzk.) Az interakci kt hattnyez esetn azt jelenti, hogy rgztve az egyik rtkt (ismrvvltozatt) a msik fggetlen vltoz klnbz ismrvvltozatai mentn a fgg vltoz msknt viselkedik, mint az els vltoz ms rgztett rtkei mellett. A fhatsok elemzse csak akkor vgezhet el, ha nincs interakcis hats. Ha modellnkben a kategorilis hattnyezk mellett metrikus fggetlen vltozt is szerepeltetnk, akkor ANCOVA mdszert alkalmazunk (pldul, a jelenlegi fizetsek klnbzsge magyarzhat-e a nem s az letkor egyttesvel). A nem metrikus fggetlen vltozkat faktoroknak, a metrikus fggetlen vltozkat pedig kovarinsoknak nevezzk.

  • 17

    5. Korrelci- s regressziszmts

    Elmleti sszefoglal

    A korrelci- s regresszianalzis vgrehajtsra van szksg szmtalan, a htkznapi letben is elfordul problma kapcsn. Nhny plda regresszis modellek alkalmazsra:

    Egy adott jrm fktvolsgt a gpkocsi sebessge s a gpkocsivezet reakci ideje hogyan befolysolja?

    Hogyan befolysolja a dolgoz letkora a tppnzen tlttt napok szmt? Milyen hatssal van az adott bank kihelyezsi klcsn kltsgre az ves

    tlagos klcsn nagysga, az vi sszes klcsnkrk szma, az j klcsnkrvnyezk szma s a bank fizetsi skla indexe?

    Hogyan fgg az adott id eltelte utn bert paradicsom mennyisge az elre jelzett csapadk mennyisgtl, az elre jelzett napfnytartamtl, a paradicsom fajtjtl, valamint a kiltets idpontjtl?

    Milyen kapcsolat van a budapesti laksok knlati ra s a terlete, a szobk szma, valamint a terasz nagysga kztt?

    Egy autplya forgalmra mikpp hat az autplya hasznlati dja s az autplyt ignybevev gpkocsik szma?

    Egy adott ru keresett mennyisge hogyan vltozik klnbz rak mellett? (Keresleti grbe).

    Egy adott ru knlt mennyisge hogyan alakul klnbz rak mellett? (Knlati grbe).

    Adott tkellomny s technolgia mellett a felhasznlt munka klnbz mennyisgeihez mekkora megtermelhet maximlis termkmennyisg tartozik? (Rvid tv termelsi fggvny.)

    Hogyan vltozik a maximlisan elllthat termkmennyisg, ha nemcsak a felhasznlt munka, hanem a tkellomny s az zemmret is vltozik? (Hossz tv termelsi fggvny)

    A munkabr klnbz rtkei hogyan befolysoljk az egyn ltal knlt munkamennyisget? (Egyni munkaknlati grbe).

    Korrelciszmts Korrelciszmts esetn az elemzsbe vont metrikus vltozk kztti kapcsolatot vizsgljuk. Kt metrikus vltoz (x,y) kztti kapcsolat vizsglatnak els fzisban pontdiagramot kszthetnk az x-y vltozpr alapjn. A pontdiagram alapjn megllapthatjuk a vltozpr kztti kapcsolat tpust: lineris, vagy nem lineris a kapcsolat. Lineris kapcsolat esetn a pontok egy kpzeletbeli egyenes, nem lineris kapcsolat esetn egy szablyos grbe krl szrdnak. Mivel a gyakorlatban nagyon gyakran lnk a linearits felttelezsvel, gy a tovbbiakban erre koncentrlunk. A pontoknak a kpzeletbeli egyenes krli szrdsbl kvetkeztethetnk arra, hogy milyen szoros kapcsolat van a kt vltoz kztt. Az egyenes meredeksgbl pedig kvetkeztethetnk a kapcsolat irnyra, ami pozitv, vagy negatv lehet. A pozitv irny kapcsolat azt jelenti, hogy a kt vltoz azonos irnyba vltozik. Mivel a pontdiagram nem egzakt megoldsa a korrelciszmtsnak, ezrt a kapcsolat erssgnek jellemzsre mrszmokat hasznlunk. Lineris kapcsolat esetn az gynevezett lineris korrelcis egytthatt, mg nem lineris kapcsolatok esetn az gynevezett

  • 18

    korrelcis indexet hasznljuk. A r lineris korrelcis egytthat rtke [-1;+1] tartomnyba esik. Eljele megadja a kt vltoz kztti kapcsolat irnyt, mg abszolt rtke a kapcsolat erssgt. A nullhoz kzeli rtk gyenge, az egyhez kzeli rtk ers kapcsolatot jelent. Pozitv irny kapcsolat esetn a kt vltoz ugyanolyan irnyba vltozik. A korrelcis index rtke [0;+1] tartomnyba esik, s kizrlag a vltozpr kztti kapcsolat erssgt adja meg. Pldul, mit llapthatunk meg az albbi pontdiagramok alapjn?

    A)

    Pontdiagram

    0200400600800

    1000120014001600

    0 5 10 15 20 25 30

    x

    y

    Mivel a pontok nagyon kis mrtkben szrdnak egy kpzeletbeli, pozitv meredeksg egyenes krl, ezrt a kt mennyisgi ismrv kztt pozitv irny, ers lineris korrelcis kapcsolat van. A lineris korrelcis egytthat rtke egyhez kzeli.

    B)

    Pontdiagram

    0200400600800

    1000120014001600

    0 5 10 15 20 25 30

    x

    y

    Mivel a pontok kis mrtkben szrdnak egy kpzeletbeli, negatv meredeksg egyenes krl, ezrt a kt mennyisgi ismrv kztt negatv irny, nagyon ers

  • 19

    lineris korrelcis kapcsolat van. A lineris korrelcis egytthat rtke mnusz egyhez kzeli.

    C)

    Pontdiagram

    0200400600800

    1000120014001600

    0 5 10 15 20 25 30

    x

    y

    Mivel a pontok mindkt dimenziban nagyon szrdnak, gy nem lehetsges egy kpzeletbeli egyenes rjuk illesztse, ezrt a kt mennyisgi ismrv kztt nagyon gyenge, szinte elhanyagolhat lineris korrelcis kapcsolat van. A lineris korrelcis egytthat rtke nullhoz kzeli.

    D)

    Pontdiagram

    0200400600800

    1000120014001600

    0 5 10 15 20 25 30x

    y

    Mivel a pontok kis mrtkben szrdnak egy kpzeletbeli, zr meredeksg egyenes krl, azaz az x rtktl fggetlenl y megkzeltleg konstans, ezrt a kt mennyisgi ismrv kztt elhanyagolhatan gyenge lineris korrelcis kapcsolat van. A lineris korrelcis egytthat rtke nullhoz kzeli. Lineris korrelci esetn rdekes krds a kapcsolat szignifikancijnak vizsglata. A prba nullhipotzise szerint a vizsglt kt vltoz egymstl lineris fggetlen, teht a korrelcis egytthat rtke szignifiknsan nem klnbzik nulltl. A korrelcis mtrix mellett ltalban megtallhatjuk a lineris

  • 20

    korrelcis kapcsolatok szignifikancijt, azonban az Excel ezt nem vizsglja meg, ezrt hasznos lehet az albbi tblzat.

    A lineris korrelcis egytthat kritikus rtke

    Minta elemszm rkritikus

    Minta elemszm rkritikus

    3 0,997 28 0,374 4 0,950 29 0,367 5 0,878 30 0,361 6 0,811 35 0,334 7 0,754 40 0,312 8 0,707 45 0,294 9 0,666 50 0,279 10 0,632 55 0,266 11 0,602 60 0,254 12 0,576 65 0,244 13 0,553 70 0,235 14 0,532 75 0,227 15 0,514 80 0,220 16 0,497 85 0,213 17 0,482 90 0,207 18 0,468 95 0,202 19 0,456 100 0,197 20 0,444 200 0,139 21 0,433 300 0,113 22 0,423 400 0,098 23 0,413 500 0,088 24 0,404 1000 0,062 25 0,396 1500 0,051 26 0,388 2000 0,044 27 0,381

    A tblzatban a megfigyels szmnak fggvnyben megtallhat a lineris korrelcis egytthat kritikus rtke. Ez azt jelenti, hogy, ha a vizsglatainkban kiszmtott korrelcis egytthat abszolt rtke nagyobb a kritikus rtknl, akkor a kt vltoz kztti kapcsolat szignifikns. Lthat, hogy kis elemszm esetn informcihinyos llapotban vagyunk. Pldul, 3 megfigyels alapjn a valsgban merszsg lenne a kapcsolat szignifikancijrl brmit is lltani, ezrt olyan magas ekkor a kritikus rtk. Abban az esetben, ha kettnl tbb vltoz kztti kapcsolat vizsglunk, akkor egyrszt beszlhetnk a vltozprok kztti kapcsolatrl. Ekkor minden egyes vltozprra kiszmthatjuk a lineris korrelcis egytthat rtkt. Ekkor ezeket egy mtrixba rendezve adjuk meg, melyet korrelcis mtrixnak neveznk. Msrszt vltozk csoportjai kztt is vizsglhatunk kapcsolatot. Ezzel ltalnosan a kanonikus korrelcianalzis foglalkozik. Ezzel rszletesen nem foglalkozunk. Szmunkra mg a tbbszrs korrelcis egytthat lesz fontos, amely a fggvltoznak az egyttmozgst mri a magyarzvltozk egyttesvel.

  • 21

    Regressziszmts Statisztikai elemzseknl gyakran vetdik fel az a krds, hogy sztochasztikus kapcsolat esetn az egyik ismrv (vagy tbb ismrv) ltal hordozott informcit hogyan tudnnk felhasznlni a msik ismrv rtkeinek meghatrozsra. Az sszefggseket ok(x)- okozati(y) kapcsolattal ler egyik ilyen mdszert regressziszmtsnak nevezzk. Ekkor egy egyenlettel adott kapcsolatot ltestnk a vltozk kztt, melynek segtsgvel a magyarzvltozk (x) alapjn becslst adhatunk az eredmnyvltozra (y). Pldul, ha jgkrmet rulunk, akkor egy adott napra az eladott mennyisget elre becslhetjk pusztn hasra tsszeren is, de akr azt is mondhatjuk, hogy az rtkestst befolysolja a kls hmrsklet, s ez alapjn becsljk meg az rtkestst. A regresszis modellben alkalmazott fggvny tpusnak fontos szerepe van; ez egyszerbb esetekben lineris, de az empirikus elemzseknl gyakran nemlineris (pldul, exponencilis, vagy hatvnykitevs). Nhny plda fggvnyalakokra.

    Tpus Ktdimenzis modell Hromdimenzis modell

    Lineris xy 10 += 22110 xxy ++=

    Exponencilis xy 10 = 22110 xxy = Hatvnykitevs

    10

    xy = 22110

    xxy = A regressziszmts outputjn lthat, hogy milyen vltozk s milyen szerepkrben szerepelnek a modellben. Regressziszmts sorn felttlenl meg kell vizsglnunk

    a tbbszrs determincis egytthatt (R-square), ami a modell magyarz erejt adja meg, azaz azt, hogy a magyarzvltozk egyttesen milyen mrtkben magyarzzk az eredmnyvltoz rtkeinek klnbzsgt. Egy adott modell magyarzereje ltalban 80 szzalk felett tekinthet elfogadhatnak. Ha egy adott modellbe jabb vltozkat csatolunk, akkor a modell magyarzereje biztosan nem cskken. Ez ltal a magyarz er akr 100% kzelbe is felhzhat, azonban ettl mindenkit va intenk, ugyanis egyrszt tl bonyolultt teszi a modellt, msrszt sok negatv kvetkezmnnyel jr;

    a tbbszrs korrelcis egytthatt (R), ami a tbbszrs determincis egytthat gyke. Megmutatja, hogy a magyarzvltozk egyttese (mint vltozk halmaza) milyen szoros kapcsolatban ll (mennyire mozog egytt) az eredmnyvltozval (y);

    a rezidulis szrst (standard error of the estimates), ami az eredmnyvltoz tnyleges s a modell alapjn becslt rtkeinek az tlagos eltrst adja meg;

    a regresszis modell illeszkedsnek jsgt. Ez a vizsglat egy variancianalzis vgrehajtst jelenti. A prba nullhipotzise szerint a modell illeszkedse nem megfelel, azaz azt hogy a tbbszrs korrelcis egytthat rtke szignifiknsan nem klnbzik nulltl. A vizsglat eredmnyt egy ANOVA tblzatban kapjuk meg.

  • 22

    Fontos megjegyeznnk, hogy a nullhipotzis elvetse csak azt jelenti, hogy a modell alkalmazhat a problma vizsglatra.

    Vgre kell hajtanunk a paramterek tesztelst. Ekkor mindegyik magyarzvltoz fontossgt, magyarz erejt fogjuk tesztelni kln-kln. A prba nullhipotzise szerint a vizsglt magyarzvltoz szignifiknsan nem befolysolja az eredmnyvltozt. Azokat a vltozkat, amik nincsenek szignifikns hatssal az eredmnyvltozra nem rdemes szerepeltetnnk a modellben. Azonban a vltozk kidoblsval vatosan kell bnni. Ugyanis, ha egy a vizsglat szempontjbl relevns vltozt nem lptetnk be a modellbe azzal az okkal, hogy ennek hatsa statisztikailag nem szignifikns, akkor torztott modellhez jutunk. Az is klnsen szignifikns multikollinearits (magyarzvltozk nem fggetlenek) esetn lehetsges, hogy egy magyarzvltoz ereje nmagban nem csekly, de a modellben lev tbbi magyarzvltoz ltal hordozott megmagyarzott hnyadon fell tovbbi tbbletinformcival nem rendelkezik. Fontos megjegyezni, hogy szignifikns multikollinearits esetn a teszt eredmnyei nem rtelmezhetek, hiszen ekkor nem lehet parcilis hatsokrl beszlni. Ha csak elrejelzs a clunk, akkor a multikollinearits nem jelent problmt.

    Miutn megllaptottuk, hogy megfelel a modell magyarz ereje, a modellben csak megfelel vltozk szerepelnek, felrhatjuk a regresszis modell egyenlett, majd rtelmezzk ennek paramtereit. A regresszis paramterek megadjk, hogy az adott magyarzvltoz vltozsra ceteris paribus tlagosan hogyan vltozik az eredmnyvltoz rtke. A pontos rtelmezs a modell tpustl fgg.

    o Lineris modell esetben: az adott magyarzvltoz (x) rtknek 1 egysgnyi nvekedse esetn az eredmnyvltoz (y)

    rtke tlagosan s megkzeltleg 1 egysggel vltozik, minden ms vltozatlansga mellett.

    o Exponencilis modell esetben: az adott magyarzvltoz (x) rtknek 1 egysgnyi nvekedse esetn az eredmnyvltoz (y)

    rtke tlagosan s megkzeltleg 1 -szeresre vltozik, minden ms vltozatlansga mellett

    o Hatvnykitevs modell esetben: az adott magyarzvltoz (x) rtknek brmilyen szintrl trtn 1 szzalkos nvekedse esetn az eredmnyvltoz (y) rtke tlagosan s megkzeltleg

    1 szzalkkal vltozik, minden ms vltozatlansga mellett.

    A fentieken kvl mg szmos modell diagnosztikai krdst ajnlatos megvizsglni (autokorrelci, heteroszkedaszticits, multikollinearits, outlierek), ezek nem kpezik a tananyag rszt.

  • 23

    A pontdiagram s a regresszi kapcsolata Excelben

    Az Excelben lehetsgnk van ktdimenzis regresszis modelleket vizsglni, a vltozpr pontdiagramja alapjn is. Ha valamelyik pontprra kattintunk az egr jobb gombjval, akkor az elugr ablakban vlasszuk ki a Trendvonal felvtele funkcit.

    Az elugr ablak Tpus fln kivlaszthatjuk a pontokra szerintnk legjobban illeszked grbetpust. (A mozgtlagrl a kvetkez fejezetben lesz sz.) Az elugr ablak Egyebek fln opcionlisan bellthatjuk, hogy a modell magyarz ereje s egyenlete jelenjen meg a kimenten. Ugyanitt elrejelzseket, becslseket is kszthetnk.

  • 24

    Nzzk meg hrom fggvnytpus esetn a kimenetet.

  • 25

    Lineris modell

    y = 1,75x + 4,5R2 = 0,9701

    0

    5

    10

    15

    20

    25

    30

    0 2 4 6 8 10 12 14

    Ekkor az 1,75 azt jelenti, hogy ha a magyarzvltoz egy egysggel n, akkor az eredmnyvltoz tlagosan 1,75 egysggel n. A magyarzvltoz 97,01 szzalkban magyarzhatja az eredmnyvltoz rtkeinek klnbzsgeit. A maradk hrom szzalk ms tnyezkkel, illetve a vletlennel magyarzhat.

    Hatvnykitevs modell

    y = 3,0745x1,9921

    R2 = 0,9998

    0

    50

    100

    150

    200

    250

    300

    350

    400

    450

    500

    0 2 4 6 8 10 12 14

  • 26

    Ekkor az 1,9921 azt jelenti, hogy ha a magyarzvltoz brmilyen szintrl egy szzalkkal n, akkor az eredmnyvltoz tlagosan s megkzeltleg 1,9921 szzalkkal n.

    Exponencilis modell

    y = 7,5559e0,726x

    R2 = 0,9726

    0

    10000

    20000

    30000

    40000

    50000

    60000

    0 2 4 6 8 10 12 14

    Ekkor a regresszis egytthat rtke: 067,2726,0 =e ; azaz, ha a magyarzvltoz rtke egy egysggel n, akkor az eredmnyvltoz tlagosan a 2,067-szeresre, azaz 106,7 szzalkkal n.

  • 27

    6. Idsorelemzs

    Elmleti sszefoglal

    Idsorok vizsglatnak alapjai Idsorok vizsglatakor valamilyen jelensg, sokasg idbeli vltozst, alakulst vizsgljuk. Ennek alapjaival, azaz a bzis- s a lncviszonyszmokkal mr korbban tallkoztunk. A viszonyszmokon tl lehetsg van az idbeli vltozs modellezsre is. Az egyik legegyszerbb vizsglati mdszer a determinisztikus idsorelemzs. E szerint az idsorban matematikailag jl kezelhet, hossz tv trendek vannak. A determinisztikus idsorelemzs leggyakrabban alkalmazott modellje a dekompozcis idsormodell. Ez azt felttelezi, hogy az idsorok alakulst ngy f sszetevre bonthatjuk.

    1. Trend: hosszabb idszakon t, tartsan meglev tendencia (tlagos mozgsirny). Ez az alapirnyzat, amit a vizsglt jelensgre hat alapvet gazdasgi, trsadalmi tnyezk alaktanak ki. Az idsorok legfontosabb sszetevi. A trend meghatrozsa trtnhet a mozgtlagok mdszere alapjn, illetve analitikus trendszmts segtsgvel. Trendszmts sorn clunk az idsor kisimtsa.

    2. Szezonlis hats: szablyos ingadozs a trend krl, amely rendszeresen ismtld hullmzst jelent. ltalban egy ven bell jelentkezik, termszeti tnyezkkel, trsadalmi szoksokkal magyarzhat (pldul tlen tbb gzt fogyasztunk, nyron kevesebbet).

    3. Ciklikus komponens: kevsb szablyos, hossz ingadozsok a trend krl. Ilyenek pldul a konjunktra-ciklusok. Ennek a komponensnek a vizsglatval nem foglalkozunk.

    4. Vletlen tnyez: az eddigi sszetevkkel nem magyarzhat szablytalan ingadozsok.

    Aszerint, hogy a ngy sszetev hogyan tevdik ssze, megklnbztetnk additv s multiplikatv modelleket. Az additv modelleknl a tnyezk sszeaddnak, mg multiplikatv modellek esetben sszeszorzdnak. Az egyszersg kedvrt, a tovbbiakban felttelezzk, hogy a vletlen tnyez vrhat rtke nulla. Az idsorok statisztikai szoftverekkel trtn alapszint elemzse sorn elszr a trend (idsor kisimtsa) vizsglata trtnik. Ez vagy a mozgtlagok mdszervel, vagy pedig analitikus ton trtnhet. Ezutn kvetkezhet a szezonlis hats vizsglata. Brmelyik mdszert is vlasztjuk, menetkzben lehetsgnk van elrejelzsek ksztsre. Termszetesen nagyon fontos az adatok grafikus megjelentse is.

    A mozgtlagok mdszere Ennl a mdszernl a trendet tlagszmts segtsgvel hatrozzuk meg. Minden egyes idszakban (ltalban egy idszak= egy negyedv, vagy egy hnap) kiszmtjuk valamekkora krzetben az adatok tlagt. Ezrt hvjuk a

  • 28

    mdszert mozgtlagolsnak. Nagyon fontos az, hogy hogyan hatrozzuk meg a mozgtlag tagszmt. Mivel a mdszer arra pl, hogy egy periduson (ltalban egy peridus = egy v) bell a szezonlis hats kinullzza magt, ezrt negyedves bonts idsor esetben a mozgtlag tagszma 4, vagy ennek egszszm tbbszrse, havi bonts idsor esetben a mozgtlag tagszma 12, vagy ennek egszszm tbbszrse lehet. Pros tagszm mozgtlag esetn a kapott mozgtlagokat mg centrrozni kell, azaz az idszakokhoz kell ezeket igaztani. Minl nagyobbra vlasztjuk a mozgtlag tagszmt, az idsor annl jobban rvidlni fog. Ez azt jelenti, hogy az idsor elejn s vgn nhny idszakhoz nem tudjuk a trendrtket meghatrozni. Plda A hallozsok szmnak alakulst negyedves bontsban az albbi tblzat tartalmazza. Hatrozzuk meg a trendet a mozgtlagok mdszere alapjn.

    Negyedv v

    1997 1998 1999 2000 2001

    I 39839 42220 39229 37180 40919

    II 35663 36532 35920 37223 34534

    III 35148 33883 34538 33618 32340

    IV 38131 37609 37202 37410 35707

    Els lpsben a mozgtlag tagszmt kell meghatroznunk. Mivel az adatok negyedves bontsban vannak megadva, gy a mozgtlag tagszma vagy ngy, vagy ennek egszszm tbbszrse lehet. Minl nagyobbnak vlasztjuk ezt, annl nagyobb mrtkben fog rvidlni az idsor. Ezrt a mozgtlag tagszmt ngynek vlasztjuk. Ezutn kiszmtjuk a mozgtlagokat, azaz minden adat-ngyesnek vesszk a szmtani tlagt. Az albbi brn lthat, hogy ahny mozgtlag, annyi tlagszmts volt. A mozgtlag, mindig a vizsglt adatngyes, azaz idszak kzephez kerl igaztsra. Mivel a mozgtlag pros tagszm (azaz a kapott mozgtlagok idszakok kz esnnek), gy ezek centrrozsval, azaz a szomszdos kt mozgtlag tlagolsval kapjuk meg a keresett trendrtkeket.

  • 29

    Az analitikus trendszmts Ennl a mdszernl a trendet, mint regresszifggvnyt hatrozzuk meg. A magyarzvltozk vagy az vszmok lesznek, vagy egy mestersges vltozt vezetnk be az idre. A gyakorlatban analitikus trendszmtskor tbbfle megoldsi utat lehet hasznlni. Ez azzal a kvetkezmnnyel jr, hogy ugyanazt a trendvonalat tbbfle egyenlettel is meg lehet adni. Ez pedig azt jelenti, hogy a trendegyenletek paramtereinek ms a jelentse. Ezrt a lehetsges flrertsek elkerlse vgett a trendegyenlet mellett ktelezen meg kell adni azt is, hogy ennek kiszmtsakor mit vettnk kiindulpontnak, valamint, hogy a tengelyeken 1 egysg mit jelent. Idsorok vizsglatakor mindkt regresszis paramter rtelmezhet. Pldul lineris trend esetn az egyenes meredeksge megadja a vizsglt jelensgnek az idegysgenknti tlagos vltozst a vizsglt idszakban, mg a tengelymetszet a kiindulskor adja meg az idsor rtkt. Ennek bemutatsa vgett tekintsk az albbi mr korbban is hasznlt idsort!

    v Kivitel (t)

    2000 100

  • 30

    2001 105 2002 109 2003 116 2004 120 2005 125

    1. megolds Az eredeti adatok alapjn lineris regressziszmtst vgznk gy, hogy az vszm lesz a magyarzvltoz, mg a kivitel az eredmnyvltoz. Ekkor a tengelymetszet azt jelenti, hogy az adott kivitel elmletileg mennyi volt idszmtsunk kezdetekor. Ennek termszetesen nincsen gazdasgi rtelme. A tbbi megoldsi mdnl nem az eredeti vszmokkal dolgozunk, hanem egy j, mestersges t-vel jellt, lineris transzformcival kapott vltozt vezetnk be az id jellsre, gy ezeket a megoldsi mdokat tetszleges bonts idsor esetn is alkalmazhatjuk. A lineris transzformci leegyszerstve azt jelenti, hogy kivlasztunk egy tetszleges kezdpontot (t=0), majd a t vltoz rtkt idegysgenknt ugyanannyival vltoztatjuk. Pontosan ebben klnbznek az albbi megoldsi mdszerek. 2. megolds Ebben a megoldsban a t=1 rtket az idsor kezdrtkhez rendeljk.

    v yi ti 2000 100 1 2001 105 2 2002 109 3 2003 116 4 2004 120 5 2005 125 6

    Ekkor a tengelymetszet azt jelenti, hogy az adott kivitel trendszerinti rtke mennyi volt 1999-ben. A szoftverek ezt a transzformcit hasznljk. Az utols kt megoldsi md esetn a t=0 rtket az idsor kzephez rendeljk. Ez azzal az elnnyel jr, hogy a normlegyenlet-rendszer leegyszersdik, mivel ekkor a t vltoz sszege nullval egyenl. Ezrt, ezt a

    megoldsi mdot 01

    ==

    n

    iit jellssel illetik. Mint ltni fogjuk, ez a jells hinyos,

    mivel a t rtkek idegysgenknti vltoztatsra nem utal. 3. megolds Ebben a megoldsban idegysgenknt a t rtket eggyel vltoztatjuk.

    v yi ti 2000 100 2,5 2001 105 1,5

  • 31

    2002 109 0,5 2003 116 0,5 2004 120 1,5 2005 125 2,5

    Ekkor a tengelymetszet azt jelenti, hogy mennyi volt az adott kivitel trendszerinti rtke 2002 vgn. 4. megolds Ebben a megoldsban idegysgenknt a t rtket kettvel vltoztatjuk.

    v yi ti 2000 100 5 2001 105 3 2002 109 1 2003 116 1 2004 120 3 2005 125 5

    Ekkor a tengelymetszet azt jelenti, hogy az adott kivitel trendszerinti rtke mennyi volt 2002 vvgn. Az egyenes meredeksge viszont most azt mutatja meg, hogy a kivitel a vizsglt idszakban flvente tlagosan mennyivel vltozott. A szezonlis hats vizsglata Jelen kpzsi szintben elgedjnk meg azzal, hogy a mozgtlagokhoz hasonlan a szezonlis hats vizsglatnak csak akkor van rtelme, ha az adatok bontsa egy vnl srbb, azaz pldul havi, negyedves, harmadves, stb. adatok llnak a rendelkezsnkre. Mivel a ciklikus komponenstl eltekintnk a vizsglataink sorn, ezrt a szezonlis hats vizsglata az albbiak szerint trtnik. Minden idszakban a szezonlis hatst egyetlen szmszer rtkkel kell jellemeznnk, azaz pldul negyedves bonts esetn egy-egy szmot kapunk az els, a msodik, a harmadik, a negyedik negyedvre. Elszr azt kell eldntennk, hogy additv, vagy multiplikatv modellt vizsglunk. Amelyik vltozat nagyobb llandsgot mutat, olyan tpusnak tekintjk a modellt. Ennek eldntse meglehetsen szubjektv. Az idsor grafikus brzolsbl is sejtseket fogalmazhatunk meg a modell tpusra vonatkozan. Amennyiben az ingadozs mrtke llandnak tekinthet a trendhez kpest, akkor additv, amennyiben a trenddel arnyosnak tekinthet a trend krl, akkor multiplikatv modelltpusra kvetkeztethetnk. Additv modell esetn szezonlis eltrseket, mg multiplikatv modell esetn szezonlis indexeket (szezonindexeket) vizsglunk. A szezonlis eltrsek megadjk, hogy a vizsglt vltoz tnyleges rtkei tlagosan mennyivel trnek el a trendtl a vizsglt idszakban. A szezonindexek megadjk, hogy a vizsglt vltoz tnyleges rtkei tlagosan hny szzalkkal trnek el a trendtl a vizsglt idszakban.

  • 32

    Mivel additv modell esetn

    Vizsglt vltoz rtke= Trend+szezonlis eltrs;

    ezrt, a

    vizsglt vltoz rtke Trend; vltozt kell meghatrozni. Ezt analitikus trendszmts esetn, a szmtgpes kimeneten a Maradk Tbla Maradkok oszlopa adja. Additv modell esetn a kiszmtott klnbsgeknek idszakonknt kiszmtjuk a szmtani tlagt, gy minden negyedvre vonatkozan megkapjuk a nyers szezonlis eltrseket. Mivel a szezonalts egy periduson bell kiegyenltdik, ezrt a szezonlis eltrsek sszegnek nullnak kell lennie. Amennyiben a nyers szezonlis eltrsek sszege nulla, akkor ezek az rtkek lesznek a tnyleges szezonlis eltrsek. Amennyiben ezek sszege nem nulla, akkor korriglnunk kell, mg pedig minden egyes rtket ugyanazzal a korrekcis tnyezvel. A korrekcis tnyez a nyers szezonlis eltrsek szmtani tlaga lesz. Ezt az rtket egyszeren kivonjuk a nyers szezonlis eltrsekbl. A kapott szmok lesznek a tnyleges szezonlis eltrsek. Mivel multiplikatv modell esetn

    Vizsglt vltoz rtke= Trend*szezonindex;

    ezrt, a

    a vizsglt vltoz rtke / Trend vltozt kell meghatrozni. Ezt vizsglt vltoz tnyleges s becslt rtkeinek hnyadosaknt szmthatjuk ki a szmtgpes kimeneten. Multiplikatv modell esetn a kiszmtott hnyadosoknak idszakonknt kiszmtjuk a mrtani tlagt, gy minden negyedvre vonatkozan megkapjuk a nyers szezonlis indexeket. Mivel a szezonalts egy periduson bell kiegyenltdik, ezrt a szezonlis indexek szorzatnak egynek kell lennie. Amennyiben a nyers szezonlis eltrsek szorzata egy, akkor ezek az rtkek lesznek a tnyleges szezonindexek. Amennyiben ezek szorzata nem egy, akkor korriglnunk kell, mg pedig mindenegyes rtket ugyanazzal a korrekcis tnyezvel. A korrekcis tnyez a nyers szezonlis indexek mrtani tlaga lesz. Ezzel az rtkkel egyszeren leosztjuk a nyers szezonlis indexeket. A kapott szmok lesznek a tnyleges szezonindexek. A trend s a szezonlis hats meghatrozsa utn lehetsgnk van elrejelzsek ksztsre, felttelezve, hogy a vizsglt jelensg mozgsirnya nem vltozik meg. Az elrejelzsek ksztse trtnhet

    pusztn a trend alapjn analitikus trenddel, vagy mozgtlagols trenddel,

    a szezonalits figyelembevtelvel: additv modell esetben trend+szezonalits; multiplikatv modell esetben trend*szezonalits,

  • 33

    szezonalitstl tiszttott adatokkal: ekkor az eredeti rtkekbl kiszrjk a szezonalitst. additv modell esetben eredeti rtkek-szezonalits; multiplikatv modell esetben eredeti rtkek / szezonalits.

    Mintafeladat

    A hzassgktsek szmt az albbi tblzat tartalmazza.

    A) Ksztsen lineris trendet az idsor kisimtsra, a tarts mozgsirnyzat jellemzsre!

    B) Additv modellt felttelezve, szmtsa ki s rtelmezze a szezonlis eltrseket!

    C) Becslje meg a B) pont alapjn a hzassgktsek szmt 2002 mjusra, felttelezve, hogy az tlagos mozgsirny nem vltozott!

    D) Multiplikatv modellt felttelezve, szmtsa ki s rtelmezze a szezonlis indexeket!

    E) Becslje meg a D) pont alapjn a hzassgktsek szmt 2002 mjusra, felttelezve, hogy az tlagos mozgsirny nem vltozott!

    F) brzoljuk kzs pontdiagramon a hzassgktsek tnyleges szmt, a lineris trendet, a mozgtlagols trendet s a szezonalitstl tiszttott adatokat multiplikatv modellt felttelezve! Mit llapthatunk meg?

    Hnap v

    1997 1998 1999 2000 2001

    J 1831 1716 1724 1389 1250 F 2300 2247 2223 1883 1632 M 3101 3199 3420 2988 2724 3793 4423 4057 3020 2900 Mj 6914 6322 6363 5720 5700 Ju 5099 4887 5077 5501 5420 Jl 6690 6845 6401 5333 5380 A 7552 7462 7511 8540 8220 Sz 6101 6182 6969 5626 5600 O 4644 4643 3990 3926 3890 N 2990 2749 2581 2674 2660 D 3084 3329 3147 2900 2910

    Vezessnk be egy j t vltozt az idre, gy, hogy 1997. janur lesz az 1, stb. A feladat megoldsakor a hzassgktsek szmt egy oszlopba kell rgzteni, mivel ez egy darab vltoz.

  • 34

    A) Idsorok vizsglatakor a szmtgpes kimenetbl csak az albbi rszlet rtelmezhet.

    Koefficiensek Tengelymetszet 4444,757062 id -4,007335371

    Megfigyels Becslt Hzassgktsek szma Maradkok 1 4440,749727 -2609,749727 2 4436,742391 -2136,742391 3 4432,735056 -1331,735056 4 4428,727721 -635,7277207 5 4424,720385 2489,279615 6 4420,71305 678,2869501 7 4416,705715 2273,294285 8 4412,698379 3139,301621 9 4408,691044 1692,308956

    10 4404,683708 239,3162916 11 4400,676373 -1410,676373 12 4396,669038 -1312,669038 13 4392,661702 -2676,661702 14 4388,654367 -2141,654367 15 4384,647032 -1185,647032 16 4380,639696 42,36030379 17 4376,632361 1945,367639 18 4372,625025 514,3749745 19 4368,61769 2476,38231 20 4364,610355 3097,389645 21 4360,603019 1821,396981 22 4356,595684 286,404316 23 4352,588349 -1603,588349

  • 35

    Megfigyels Becslt Hzassgktsek szma Maradkok 24 4348,581013 -1019,581013 25 4344,573678 -2620,573678 26 4340,566343 -2117,566343 27 4336,559007 -916,5590071 28 4332,551672 -275,5516718 29 4328,544336 2034,455664 30 4324,537001 752,462999 31 4320,529666 2080,470334 32 4316,52233 3194,47767 33 4312,514995 2656,485005 34 4308,50766 -318,5076595 35 4304,500324 -1723,500324 36 4300,492989 -1153,492989 37 4296,485653 -2907,485653 38 4292,478318 -2409,478318 39 4288,470983 -1300,470983 40 4284,463647 -1264,463647 41 4280,456312 1439,543688 42 4276,448977 1224,551023 43 4272,441641 1060,558359 44 4268,434306 4271,565694 45 4264,42697 1361,57303 46 4260,419635 -334,4196351 47 4256,4123 -1582,4123 48 4252,404964 -1352,404964 49 4248,397629 -2998,397629 50 4244,390294 -2612,390294 51 4240,382958 -1516,382958 52 4236,375623 -1336,375623 53 4232,368287 1467,631713 54 4228,360952 1191,639048 55 4224,353617 1155,646383 56 4220,346281 3999,653719 57 4216,338946 1383,661054 58 4212,331611 -322,3316106 59 4208,324275 -1548,324275 60 4204,31694 -1294,31694

    Az els tblzat szerint a trendegyenlet az albbi formban rhat fel.

    Hzassgktsek trendszerinti szma=4444,764*t

    Ezek szerint a hzassgktsek trend szerint becslt szma 2006 decemberben megkzeltleg 4445, mg a vizsglt idszakban a hzassgktsek szma havonta tlagosan 4 darabbal cskkent.

    B) Additv modellt felttelezve havonta meg kell hatroznunk a hzassgktsek tnyleges s becslt szma eltrseinek, azaz a Maradkok szmtani tlagt

  • 36

    havonknt. Pldul, a januri nyers szezonlis eltrs az albbi brn jellt 5 darab januri maradk szmtani tlaga lesz.

    Ekkor az albbi eredmnyeket kapjuk.

    Hnap Nyers szezonlis eltrs J -2762,57 F -2283,57 M -1250,16 -693,95 M 1875,26 J 872,26 J 1809,27 A 3540,48 S 1783,09 O -89,91 N -1573,70 D -1226,49 sszesen 0,00

    Mivel a nyers szezonlis eltrsek sszege nulla, ezrt nincs szksg korrekcira, azaz a nyers szezonlis eltrsek egyben a tnyleges szezonlis eltrsek is. Ekkor megllapthatjuk, hogy a vizsglt idszak janurjaiban a hzassgktsek tnyleges szma tlagosan megkzeltleg 2763 darabbal kevesebb, augusztusban pedig tlagosan megkzeltleg 3540 darabbal tbb a trend szerinti rtknl. A tbbi adat ehhez hasonlan rtelmezhet.

  • 37

    C) A feladat szerint 2002 mjusra vonatkozan kell megbecslnnk a hzassgktsek szmt. Mivel a vizsglt vltoz rtke additv modellek esetn a trend s a szezonlis eltrs sszegeknt rtelmezhet, ezrt ezt a kt komponenst kell meghatroznunk. A trend meghatrozshoz annyit kell tudni, hogy 2002 mjusban t=65; a t rtk bevezetsbl kvetkezen, ezrt ekkor TREND=4444,764*65=4184,76. A szezonlis eltrst pedig az elz pont alapjn mjusban 1875,26. Ezrt 2002 mjusban a hzassgktsek szmnak becslt rtke 4184,76+1875,26=6060,02 darab. D) Multiplikatv modellt felttelezve havonta meg kell hatroznunk a hzassgktsek tnyleges s becslt szma hnyadosainak mrtani tlagt. Pldul, a januri nyers szezonlis indexek az albbi brn jellt 5 darab januri rtk mrtani tlaga lesz.

    Mivel a nyers szezonindexek szorzata nem egy, ezrt korrekcira van szksgnk. A korrekcis tnyez ezek mrtani tlaga lesz.

  • 38

    Hnap Nyers

    szezonindexek Szezonindexek Szezonindexek (%) J 0,360394 0,401593 40,16 F 0,469975 0,523701 52,37 M 0,709797 0,790939 79,09 0,828651 0,923380 92,34 M 1,429602 1,593029 159,30 J 1,200685 1,337944 133,79 J 1,410838 1,572120 157,21 A 1,817644 2,025432 202,54 S 1,409097 1,570181 157,02 O 0,975978 1,087549 108,75 N 0,633675 0,706115 70,61 D 0,713936 0,795551 79,56

    Szorzat 0,272832 1,000000 - A korrekci utn megkapjuk a szezonindexek tnyleges rtkt. Ekkor megllapthatjuk, hogy a vizsglt idszak janurjaiban a hzassgktsek tnyleges szma tlagosan 59,84 szzalkkal kevesebb, augusztusban pedig tlagosan 102,54 szzalkkal tbb a trend szerinti rtknl. (Ugyanis a januri tnyleges rtkek a trend szerinti rtknek tlagosan 40,16 szzalkai, stb.). A tbbi adat ehhez hasonlan rtelmezhet. E) A feladat szerint 2002 mjusra vonatkozan kell megbecslnnk a hzassgktsek szmt. Mivel a vizsglt vltoz rtke multiplikatv modellek esetn a trend s a szezonindex szorzataknt rtelmezhet, ezrt ezt a kt komponenst kell meghatroznunk. A trend meghatrozshoz annyit kell tudni, hogy 2002 mjusban t=65; a t rtk bevezetsbl kvetkezen, ezrt ekkor TREND=4444,764*65=4184,76. A szezonindex pedig az elz pont alapjn mjusban 1,593. Ezrt 2002 mjusban a hzassgktsek szmnak becslt rtke 4184,76*1,593=6666,32 darab. F) A szezonalitstl tiszttott adatokat gy kapjuk meg, hogy a hzassgktsek tnyleges szmt minden hnapban elosztjuk a hnapnak megfelel szezon index rtkvel. Ekkor az albbi pontdiagramot kszthetjk el. Az brn jl ltszik, hogy a trendek mennyire kisimtjk az idsort.

  • 39

    02000400060008000

    10000

    0 10 20 30 40 50 60 70

    Lineris trendHzassgktsek szmaSzeonlisan korriglt trendElrejelzs a szezonalits figyelembevtelvelTrend- mozgtlag

  • 40

    7. sszefoglal tblzat

    Az albbi tblzatban sszefoglalva megtallhat az, hogy az egyes problmakrk vizsglatra, melyik elemzsi technikk kerlnek alkalmazsra a leggyakrabban.

    Cl Eszkz Adatok szemlltetse Diagramok, tblzatok ksztse Mennyisgi vltozk ltalnos jellemzse

    Ler statisztika

    Egy tlag rtknek vizsglata Egymints t-prba Kt tlag sszehasonltsa Ktmints t-prba Tbb tlag sszehasonltsa Egyutas varianciaanalzis Mennyisgi vltoz magyarzata nem mennyisgi vltozval (csoportost ismrvvel)

    Varianciaanalzis

    Mennyisgi vltozk kapcsolatnak, egyttmozgsnak vizsglata

    Korrelciszmts

    Mennyisgi vltoz magyarzata mennyisgi vltozkkal

    Regressziszmts

    Mennyisgi vltoz idbeli vltozsnak vizsglata, elrejelzs kszts

    Idsorelemzs

  • 41

    8. Irodalomjegyzk

    [1] CSENDES T. - KATONA T. - LENGYEL I. - PETRES T.: Statisztikai ismerettr, JATEPress, Szeged, 1999. [2] FALUS I. OLL J.: Az empirikus kutatsok gyakorlata, Nemzeti Tanknyvkiad, Budapest, 2008. [3] HUNYADI L.: Statisztikai kvetkeztetselmlet kzgazdszoknak, Kzponti Statisztikai Hivatal, Budapest, 2001. [4] HUNYADI L. VITA L.: Statisztika I. II., Bologna-Tanknyvsorozat, Aula Kiad, Budapest, 2008. [5] JNOSA A.: Adatelemzs szmtgppel, Perfekt Kiad, Budapest, 2005. [6] PETRES T. TTH L.: Statisztika, Kzponti Statisztikai Hivatal, Budapest, 2006. [7] RAPPAI G.: zleti statisztika Excellel, Kzponti Statisztikai Hivatal, Budapest, 2001. [8] SAJTOS L. MITEV A.: Spss kutatsi s adatelemzsi kziknyv, Alinea Kiad, Budapest, 2007. [9] VG A.: Szabad hozzfrs statisztikai elemz szoftverek a vilghln, Statisztikai Szemle 84. vfolyam 4. szm, Kzponti Statisztikai Hivatal, Budapest, 2006. 417-423 old.