spss segédkonyv

277
Huzsvai László BIOMETRIAI MÓDSZEREK AZ SPSS-BEN SPSS ALKALMAZÁSOK Debreceni Egyetem, Mezőgazdaságtudományi Kar DEBRECEN 2004-2011

Upload: kata

Post on 27-Sep-2015

21 views

Category:

Documents


3 download

DESCRIPTION

stat

TRANSCRIPT

  • Huzsvai Lszl

    BIOMETRIAI MDSZEREK AZ SPSS-BENSPSS ALKALMAZSOK

    Debreceni Egyetem, Mezgazdasgtudomnyi KarDEBRECEN2004-2011

  • Huzsvai Lszl: SPSS alkalmazsok

    Ez a munka kziratknt kezelend. A tartalma lefedi a mezgazdasgi s gazdlkodstudomnyi doktori iskolk Statisztika s szmtgpes adatfeldolgozs, valamint Statisztika, kutatsmdszertan cm tantrgyak anyagt. Tbb fejezete azonban mg kidolgozs alatt ll.

    Minden jog fenntartva. Jelen knyvet vagy annak rszleteit a Kiad engedlye nlkl brmilyen formban vagy eszkzzel reproduklni s kzlni tilos.

    Dr. Huzsvai Lszl

    - 2 -

  • Huzsvai Lszl: SPSS alkalmazsok

    BEVEZETSAz SPSS program magba foglalja a legmodernebb statisztika eljrsokat az adatbzis kezelstl, a ler statisztikn keresztl a legbonyolultabb tbbvltozs matematikai statisztikai eljrsokig. A programcsomag nagy elnye, hogy nem csak elre elksztett statisztikai teszteket hasznlhatunk, hanem sajt magunk is kszthetnk egyszer modelleket, s ezek statisztikai elemzst is el tudjuk vgezni. Ennek elnye, hogy sok elre beptett statisztikai teszt igen szigor alkalmazsi feltteleket kvn meg, amik a talaj nvny lgkr rendszerben nem teljeslnek, de az ltalunk, a vizsglt jelensg sajtossgaihoz igaztott eljrsok mr sokkal megbzhatbb eredmnyeket szolgltatnak.Az adatok az albbi tpusba tartozhatnak:

    nominlis ordinlis intervallum skla

    Az alacsony mrsi szint adatok:a) nominlis (kzprtke a mdusz, a leggyakrabban

    elfordul adat)b) ordinlis (kzprtke a medin, a kzpen elhelyezked

    adat)Magas mrsi szint adatok:

    a) intervallumb) skla tpus adatok (kzprtke az tlag)

    - 3 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Fgg vltoz (y)Alacsony Magas

    Fgg

    etle

    n v

    ltoz

    (x) Alacsony Kontingencia

    tblzat, Chi-ngyzet

    Kt mints t-prba, szrselemzs, GLM

    Magas Diszkriminancia-analzis

    Korrelci-, regresszi analzis (tbbvltozs esetekben: Faktoranalzis, stb

    1. tblzat: Kt vltoz kapcsolatnak elemzse

    Magas mrsi szint adatokbl lehet ellltani alacsony mrsi szint adatot, fordtva nem.

    - 4 -

  • Huzsvai Lszl: SPSS alkalmazsok

    FILE MEN

    Read Text Data:

    text tpus adatok beolvassa, pl. automata meteorolgia lloms adatait. *.dat kiterjesztssel. Fixed widht, a fels sor tartalmazza a vltozk neveit. A vltozk rgi neveinek jakat adhatunk. Mentsk el a fjl formtumt ksbbi munkk szmra *.tpf kiterjesztssel.

    Apply Data Dictionary:

    Az SPSS-be mr beolvasott adatok oszlop, cmke, stb. kiegszt adatait mr meglv adatbzisbl is beolvashatjuk a fenti paranccsal, *.sav kiterjeszts fjlt vlasztva.

    Display Data Info:

    Lemezen trolt adatbzis tulajdonsgait, vltozit, cmkit listzza ki.rdemes nha *.por, portable formtumba menteni az adatokat, mert ezt mg a DOS-os programok is el tudjk olvasni, mivel majdnem szveg fjlknt menti. Excelbl 4.0-s munkalapknt kell menteni az adatokat.

    - 5 -

  • Huzsvai Lszl: SPSS alkalmazsok

    SZERKESZTS (EDIT) MEN

    Options

    Charts: A grafikonok formtumt, kinzett lehet megadni. A mintt (template) elre szerkesztett formtumban, fjlban megrizve is megadhatjuk. Figyeljnk arra, hogy a megadott knyvtrban ott legyen a *.sct kiterjeszts fjl. Ha trljk, a program indtsa utn hibajelzst kapunk. Bettpusokat, szneket, vonalakat, mintzatot hatrozhatunk meg. A grafikon kerett, rcsozatt llthatjuk be interaktv mdon.Alapbelltsok: Edit Options General, Output Labels, Data

    - 6 -

  • Huzsvai Lszl: SPSS alkalmazsok

    NZET (VIEW) MEN

    Status Bar

    A tblzat aljn tallhat informcis svot jelenthetjk meg vagy rejthetjk el.

    Toolbars

    A mensor al klnbz ikonokat rakhatunk ki, amelyek gy gyors billentyknt szolglnak. A leggyakrabban hasznlt eljrsokat rdemes itt megjelenteni. (Show Toolbars). A bellts paranccsal (Customize) elvgezhetjk a szksges belltsokat. Az Edit Tool billentyvel mg az ikonokat is trajzolhatjuk kvnsg szerint. Bal egr gombbal fogjuk meg az ikonokat s vigyk a kvnt helyre. Az ikonok trlst is hasonl mdon vgezhetjk, egyszeren vontassuk ki az ikon terletrl.

    Fonts

    Meghatrozhatjuk a bet tpust (Arial, Courier, stb., stlust (norml, dlt, flkvr, flkvr dlt), mrett (8-72). Kivlaszthatjuk az alkalmazott rsrendszert (Kzp-eurpai, Nyugati, Grg, stb.).

    Grid Lines

    Az adatbzis ablakban a rcsozatot tudjuk ki, illetve bekapcsolni.

    - 7 -

  • Huzsvai Lszl: SPSS alkalmazsok

    ADATOK (DATA) MEN

    Define Variable

    Az aktv adat editor ablakban a kivlasztott vltoz ler fejlc adatait lehet megvltoztatni, vagy j adatbzis vltozit lehet definilni.

    Templates

    Ha tbb vltoznak egyszerre akarjuk belltani a tulajdonsgait, akkor ezt a parancsot kell hasznlni. Elzetesen az aktv editor ablakban a mdostand vltozkat lenyomott egrbillentyvel ki kell jellni

    Insert Variable

    j vltoz (oszlop) beszrst vgzi az aktv vltoz utn.

    Insert Case

    Egy j eset (sor) beszrst vgzi az aktv eset utn.

    Goto Case

    Megkeresi az adott esetet. Ha nem az adat ablak az aktv, akkor ennek a parancsnak hatsra azz vlik. A keres dobozt a kvnt eset megkeresse utn a Close gomb megnyomsval lehet lezrni.

    Sort Cases

    Az adatmtrix sorai cskken vagy nvekv sorrendbe rendezhetk. A parancsdobozban meghatrozhatjuk, hogy melyik legyen az elsdleges, msodlagos, stb. kulcs.

    - 8 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Transpose

    Az adatmtrix sorainak s oszlopainak felcserlse, ezzel az esetek s vltozk szerepei is felcserldnek. A rgi vltozk nevei a legels j vltoz esetei lesznek, a tbbi j vltoz neve case_1, case_2, stb. lesznek.

    Restructure

    Itt az adatbzisok szerkezett tudjuk megvltoztatni. Ezt tstrukturlsnak is nevezik. Vegyk az albbi egyszer adatbzist, s vltoztassuk meg a szerkezett. A mrt nedvessgi rtkek rtegenknt kerljenek j vltozkba.

    ntzs Talajmvels Rteg Nedvessg1,00 1,00 1,00 14,001,00 1,00 2,00 15,001,00 1,00 3,00 16,001,00 2,00 1,00 17,001,00 2,00 2,00 18,001,00 2,00 3,00 19,002,00 1,00 1,00 20,002,00 1,00 2,00 21,002,00 1,00 3,00 22,002,00 2,00 1,00 23,002,00 2,00 2,00 24,002,00 2,00 3,00 25,00

    Data, Restructure parancs utn az albbi prbeszdpanelt kapjuk. Itt kivlaszthatjuk, hogy a vltozkbl csinljuk eseteket vagy fordtva, a kivlasztott esetekbl legyenek j vltozk. A harmadik esetben az adatbzist transzponljuk.

    - 9 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A Tovbb billenty utn meg kell adni az j adatbzis szerkezett. Szerintem, ez a prbeszdablakokban kiss nehzkes, sokkal egyszerbb programbl megadni. A baloldali ablakban lthatk a jelenlegi adatbzis vltozi (Variables in the Current File). Azonost vltozknak adjuk meg az ntzs s talajmvels vltozkat. Ezek kln sorokban fognak megjelenni az j adatbzisban. Index vltoznak jelljk ki a rteg vltozt. Ez az adatbzis oszlopaiban fog megjelenni j vltozknt. Mivel hrom rteg van a nedvessg hrom j vltozban fog megjelenni.

    - 10 -

  • Huzsvai Lszl: SPSS alkalmazsok

    ntzs Talajmvels Nedvessg_1 Nedvessg_2 Nedvessg_31,00 1,00 14,00 15,00 16,001,00 2,00 17,00 18,00 19,002,00 1,00 20,00 21,00 22,002,00 2,00 23,00 24,00 25,00

    Merge Files

    Fjlok bvtse, sszekapcsolsa. j megfigyelsekkel (esetekkel) vagy j vltozkkal bvthetjk az adatbzist. Az esetek bvtsvel jabb megfigyelseket csatolhatunk az adatainkhoz. j vltozkkal trtn bvtskor tbb vlasztsi lehetsgnk is van, el tudjuk lltani, pl. kt fjl kombincijt

    - 11 -

  • Huzsvai Lszl: SPSS alkalmazsok

    egy kulcs vltoz felhasznlsval. Legyen a terms.sav fjlnak hrom vltozja: v, npk, terms. sszesen 84 megfigyelt termseredmnynk van, t-t 1990-tl 2003-ig. Legyen a csapadk.sav fjlnak kt vltozja: v s csapadk. sszesen 14 megfigyelsnk (rekord) van, 1990-tl 2003-ig. Ki szeretnnk bvteni a terms.sav fjlunkat a csapadk rtkekkel, hogy minden megfigyelshez a megfelel csapadkrtk tartozzon. Nyissuk meg a terms.sav fjlt, s rendezzk nvekv sorrendbe az vek szerint. Vlasszuk az Add Variables parancsot, a fjl megnyits prbeszdpanelbl vlasszuk ki a csapadk.sav fjlt. j prbeszdpanelt kapunk, amiben a kt fjl informcii lthatk. Vlasszuk a Match cases on key variables in sorted files lehetsget, s a rdigombok kzl External file is keyed table. A kls adatbzis lesz a kulcsmez tbla, ez tartalmazza a kulcsmezt. A kulcsmez csak egyszer fordulhat el a tblban. Az Excluded Variables: mezben jelljk ki az vvltozt, s hzzuk a Key Variables: mezbe. Az OK gomb lenyomsa utn figyelmeztetst kapunk: ha nincsenek a fjlok a kulcsmez szerint sorba rendezve, rossz eredmnyt kapunk. Ez a lehetsg nagyon jl hasznlhat a logikailag sszetartoz klnbz tblk idszakos sszekapcsolsra, s elemzsi feladatok elvgzsre. Ez nem ms, mint az egy a tbbhz kapcsolat megteremtse egy relcis adatbzisban. Ennek kt felttele van, hogy mindkt fjlban legyen azonos kulcsmez, ami alapjn ssze lehet kapcsolni a kt adatbzist, s mindkt fjl a kulcsmez szerint sorba legyen rendezve.

    Aggregate Data

    Break Variables: az a vltoz, ami szerint az sszegzs ill. statisztika kszljn. Aggregate Variables: vltoz, amit sszegezni szeretnnk. Create new data file: ezt vlasztva egy j aggr.sav kiterjeszts fjl kszl az aggreglt adatokkal.

    - 12 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Orthogonal Design

    GenerateTbbtnyezs ksrletek szmra linerisan fggetlen kezelskombinci tervet kszthetnk vletlen szm genertor segtsgvel. A tnyez nevnek (Factor Name) s cmkjnek (Factor Label) megadsa utn az Add billentyvel felvesszk a tnyezk ablakba. Az egrrel kivlasztva a tnyezt definilni kell a kezelsszintek szmt (Define Values), s el is lehet nevezni, pl. mtrgybl 13, nem trgyzott, 30 kg nitrogn, 60 kg nitrogn, stb.

    Mtrgyzs ntzs Status KrtyaN 60 nem ntztt Design 1N 30 nem ntztt Design 2N 30 ntztt Design 3nem trgyzott

    ntztt Design 4

    nem trgyzott

    nem ntztt Design 5

    N 60 ntztt Design 6

    Split File

    Lehetsgnk van az adatbzist felosztani s az elvgzett analziseket gy elvgezni. Hrom lehetsg kzl vlaszthatunk:

    1. Minden esetet megvizsglunk, nem kpeznk csoportokat.2. A csoportokat hasonltjuk ssze.3. Az analzisek eredmnyt csoportonknt jelentjk meg.

    - 13 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Select Cases

    eseteket vlaszthatunk ki az adatbzisbl. Ngy lehetsg kzl vlaszthatunk:

    1. Minden eset rszt vegyen az analzisben.2. Ha valamilyen felttel teljesl (if then)3. Vletlen minta az esetekbl4. Kijellhetjk az esetek bizonyos tartomnyt, az els s

    utols eset megjellsvel5. Hasznlhatunk szr vltozt

    Mi legyen a ki nem vlasztott esetek sorsa? Lehet szrni s trlni ket az adatbzisbl.

    Nagymennyisg adat lekrdezseEgy viszonylag nagy adatbzisbl nagy mennyisg adatot klnbzkppen krdezhetnk le. Az egyik legegyszerbb megolds az adatok szrse (select cases) parancs hasznlata, azonban nagy mennyisg adat, illetve tbbszempontos lekrdezskor nagyon sokat kell rni, s bonyolult logikai kifejezseket kell megalkotni. Nagy a hibzsi valsznsg. A msik nagyon hatkony megolds, ha ksztnk egy lekrdez adatbzist, s ehhez kapcsoljuk a nagy adatbzisbl az adatokat az sszekapcsol utastssal (merge files, add variables).Pl.: a nagy adatbzis harminc v klnbz kukorica hibridjeinek termseit tartalmazza. Ksztsk el az elre kivlasztott harminc hibrid egy-kt vagy tbb ves termseredmnyt. Az els lps, alkossuk meg a lekrdez adatbzist. Rendezzk nvekv sorrendbe az adatokat a hibridek s v szempont alapjn (Data, Sort Cases).

    - 14 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A msodik lpsben kapcsoljuk hozz a termseredmnyeket a nagy adatbzisbl.

    - 15 -

  • Huzsvai Lszl: SPSS alkalmazsok

    - 16 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Weight Cases,

    Alul vagy tl reprezentlt mintk esetben lehet slyztnyezt alkalmazni. Ha tbb ismrv alapjn is alul vagy tl reprezentlt a minta, akkor egyenknt kell a slyztnyezket kiszmtani, s az egyenknti slyztnyezket ssze kell szorozni. (Ez a szociolgiai s trsadalomkutatsban elfogadott eljrs.) Pl.: 60 megfigyelsbl 50 frfi s 10 n. A frfiak tl reprezentltak ebben a mintban ezrt a kt slyz tnyez frfiak esetben 10/60, nk esetben 50/60.

    - 17 -

  • Huzsvai Lszl: SPSS alkalmazsok

    TALAKTSOK (TRANSFORM) MENAz adatmtrix elemeit lehet megvltoztatni, illetve j vltozkat lehet ellltania rgi vltozk segtsgvel. tkdolhatjuk a rgi esetek rtkeit akr j, akr a rgi vltozkba. Az esetek rangszmait is kiszmthatjuk.

    Compute Variable:

    Szmtott vltoz ltrehozsa. Meg kell adni a clvltoz nevt s a numerikus kifejezst. Lehetsg van arra is, hogy valamilyen logikai kifejezst is belltsunk, s ilyenkor csak azoknl az eseteknl kpzdik a szmtott rtk, amelyeknl a logikai rtk igaz. A tbbi helyre system missing value kerl.Gyakran elfordul feladat, hogy idsort kell ellltani, vagy meglv idsort kell klnbz szempontok szerint talaktani. A talaj-nvny-atmoszfra modellekben az idt az aktulis v janur elsejtl eltelt napok szmval jellik (julian dtum). Havonknti, negyedvenknti sszestst ill. kimutatst gy elg nehz elvgezni. A program a klnbz dtum fggvnyekkel lehetsget biztost az talaktsokra. Pl. DATE.YRDAY(v, az v napja) segtsgvel rendes dtumot lehet ellltani. A szmtott j vltoznak termszetesen dtum tpust kell megadni. A DATE.* fggvnyekkel szmokbl lehet klnfle dtumot ellltani, az XDATE.* fggvnyek pedig dtumbl szmokat, pl. napok szma, hnap szma, negyedvek szma, stb. Az gy elksztett attribtumokkal klnfle szempontok szerint csoportosthatjuk az adatokat, kszthetnk statisztikkat, elemzseket. (ld. esztend2002.sav).Vletlen szmokat is el tudunk lltani a beptett eloszlsfggvnyek segtsgvel. Pl. RV.NORMAL(mean, stddev) normleloszls ismert kzprtk s szrs esetn.

    Random Number Seed:

    A szmtgppel generlt u.n. pszeud-vletlen szmok ellltsakor a kiindulsi szm megadsa. Csak sokszmjegy, pratlan szm adhat meg. Amennyiben

    - 18 -

  • Huzsvai Lszl: SPSS alkalmazsok

    sokszor generlunk vletlen szmokat, idnknt clszer tlltani, nehogy ismtlds lpjen fel a vletlen szmok kztt.Count:Egy olyan j vltoz hozhat ltre, amelyben a vltozlistra felvitt vltozk egyttes elfordulsait lehet regisztrlni.

    Recode:

    Elfordulhat, hogy ugyanazt a hibridet szintaktikailag ktfle mdon rgztettk, pl. Pelican s Pelikn. Az automatikus jrakdols sorn kt klnbz szm fog hozzrendeldni a kt megnevezshez. Hogyan lehet ezt kijavtani?Az jrakdols sorn vlaszthatjuk, hogy ugyanabba a vltozba (Into Same Variables) vagy j vltozba (Into Different Variables) kerljenek az j rtkek. Vlasszuk, hogy ugyanabba a vltozba kerljenek az rtkek. Fel kell sorolnunk a rgi s j rtkeket, s fel kell venni ket a listba, majd OK. Az jrakdols megtrtnik. Meg kell jegyezni, hogy a rgi rtkek, amelyek most mr nem szerepelnek az adatbzisban, cmki tovbbra is megrzdnek.A rgi felesleges cmkket az Automatikus jrakdolssal (Autamatic Recode) trlhetjk. sszefoglalsknt: Automatic Recode Recode Into Same Variable Automatic Recode.Ezzel a funkcival kategorizlhatunk egy folytonos vltozt. A mezgazdasgban pl. a talaj tpanyag-elltottsgnak megtlst a talaj humusztartalmval szoktk becslni. A tpanyag-elltottsg azonban a humusz mellett fgg a talaj tpustl s egyb, pl. a talaj ktttsgtl is. Ezeket korbban un. hatrrtk tblzatokban foglaltk ssze. A tblzatok felhasznlsval az SPSS-ben knnyen el tudjuk vgezni a humusztartalom minstst. Humusztartalom alapjn: igen gyenge(1), gyenge(2), kzepes(3), j(4) s igen j(5) elltottsgot lehet megklnbztetni.Egy ilyen tblzat rszlete lthat lent.

    - 19 -

  • Huzsvai Lszl: SPSS alkalmazsok

    2. tblzat: A talajok humusztartalmnak hatrrtkeiSzntfldi termhely Ka

    Humusz %igen

    gyengegyenge kzepes j igen

    j

    I.>42 4,0138 3,51

  • Huzsvai Lszl: SPSS alkalmazsok

    prbeszdablakban a tblzat egyetlen sort tudjuk csak megadni a felttelekkel egytt. Az els sor felttele: Thely=1 s Ka>42. Ezutn kell megadni a rgi s j rtkeket. A prbeszd ablak teht csak egyetlen sorra j. Ilyenkor nagyon hasznos az SPSS syntax editora, mert segtsgvel automatizlhatjuk a kdolst. A Paste billenty megnyomsval a prbeszdpanelen belltott utastsok a Syntax editor ablakban jelennek meg. Itt egyszer msolssal kibvthetjk a feltteleket s megadhatjuk a kategria rtkeket.

    2. bra: Program a humuszelltottsg megtlshez

    A programot a mensor Run parancsval, Run All tudjuk futtatni. A futtats utn egy elhumusz vltozban troldnak ez elltottsg kategrii. (a msodik termhely nem tartalmazza az sszes kategrit)Az adatbzis a program futsa utn gy alakul.

    - 21 -

  • Huzsvai Lszl: SPSS alkalmazsok

    3. bra: Humuszelltottsg megtlse

    Az elhumusz vltozban az rtkekhez cmkket kell rendelni.

    4. bra: rtkcmkk megadsa

    Adatbzis az rtkcmkk belltsa utn:

    - 22 -

  • Huzsvai Lszl: SPSS alkalmazsok

    5. bra: Humuszelltottsg megtlse

    Categorize Variables:

    Egy vltoz tartomnyt lehet felosztani kategrikra, alapllapotban ngy kategrit ajnl fel a program, de lehet vltoztatni.

    Rank Cases:

    Egy vltoz rtkeinek a nagysg szerinti sorrendben elfoglalt helyzetnek megfelel rangszmt generlja egy j vltozba. Ha kt egyforma rtk ll a vltozban, megfelezi a sorszmot, pl. 1,5 s 1,5.

    Automatic Recode:

    Vltozkat lehet automatikusan jrakdolni. A vltoz listbl vlasszuk ki az jrakdoland vltozt, a New Name ablakba rjuk be az j vltoz nevt s nyomjuk meg a New Name

    - 23 -

  • Huzsvai Lszl: SPSS alkalmazsok

    gombot. OK utn automatikusan jrakdolja a vltozt. Text tpus vltoz esetben, ha a vltoz klnbz csoportokat jell nem rdemes a szveget mindenegyes rekordban trolni, elg csak a kdokat. Ezzel az adatfjlt mrete jelentsen cskken. A kdok numerikus rtkek lesznek. Az jrakdolt vltozban a szmokhoz cmkk (labels) kapcsoldnak, melyek az eredeti text tpus vltoz tartalmt veszik fel.

    Run Pending Transforms:

    A felfggesztett transzformcis parancsokat hajtja vgre. Fknt a syntax-ok futtatsakor hasznljuk. amelyeket a transzformcis opcikat hasznlva a Preferences parancsdobozban felfggesztettnk.

    - 24 -

  • Huzsvai Lszl: SPSS alkalmazsok

    ELOSZLSOK

    UNIFORM(max) = egyenletes eloszls pszeud vletlen szmok ellltsa a 0 s max tartomnyban.RV.UNIFORM(min, max) = egyenletes eloszls pszeud vletlen szmok ellltsa min s max kztt.RND(numexpr) = egsz rsz fggvnyKockadobsok szimullsa:RND(UNIFORM(6)+0.5), egyenletes eloszls 1-tl 6-ig. brzolni a gyakorisgot oszlopdiagramon.

    VL1

    6.005.004.003.002.001.00

    Cou

    nt

    640

    630

    620

    610

    600

    590

    580

    570

    Hat j egyenletes eloszls vltoz ltrehozsa, sszeg kiszmtsa. brzoljuk az sszeget!

    - 25 -

  • Huzsvai Lszl: SPSS alkalmazsok

    SSZEG

    34.00

    32.00

    30.00

    28.00

    26.00

    24.00

    22.00

    20.00

    18.00

    16.00

    14.00

    12.00

    10.00

    7.00

    Cou

    nt

    400

    300

    200

    100

    0

    Az adatok standardizlsa, Analyze, Descriptive Statistics, Descriptives, Save standardized values as variables. brzols.

    Zscore(SSZEG)

    3.11661

    2.63735

    2.15808

    1.67881

    1.19954

    .72028

    .24101

    -.23826

    -.71752

    -1.19679

    -1.67606

    -2.15532

    -2.63459

    -3.35349

    Cou

    nt

    400

    300

    200

    100

    0

    - 26 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Csebisev ttel

    Az adatoknak 211K

    -ad rsze mindig kzelebb van az tlaghoz, mint K standard eltrsen kvl. Ez fggetlen a vltoz eloszlstl. K egy egynl nagyobb pozitv szm.

    Pl. K=2 esetn, (75%) az adatoknak 2 standard eltrsen bell helyezkedik el, K=3 esetn 8/9 (89%) 3 standard eltrsen bell tallhat.

    - 27 -

  • Huzsvai Lszl: SPSS alkalmazsok

    ANALZISEK

    Riportok

    Adatbzisunkrl klnbz szempontok alapjn kszthetnk kimutatsokat tblzatos formban.

    OLAP CubesKimutatsokat, kimutats tblzatokat kszthetnk skla tpus adtokkal (Olap Cubes), Pivot tbla formtumban. OLAP (Online Analytical Processing). Rteg (layer), sor (row) s oszlop (column) vltozk szerint csoportosthatjuk az adatainkat. Klnbz statisztikkat jelenthetnk meg, centrlis mutatkat, szrdsi s terjedelmi jellemzket.Analyze, Reports, OLAP CubesAz elemezni kvnt skla tpus adatot vagy adatokat a

    6. bra: Kimutats varzsl prbeszdablaka

    Summary Variable(s): ablakba tegyk. A csoportkpz vltozkat a Grouping Variable(s) ablakba. A Statistics

    - 28 -

  • Huzsvai Lszl: SPSS alkalmazsok

    gombra kattintva klnbz statisztikai jellemzket vlaszthatunk.

    7. bra: A kimutatsban megjelenthet statisztikk

    Differences gomb a vltozk, ill. csoportok kztti klnbsgeket jelenti meg.

    - 29 -

  • Huzsvai Lszl: SPSS alkalmazsok

    8. bra: A kimutatsban megjelenthet klnbsgek

    Az OK gomb lenyomsa utn az Output ablakban megjelenik az eredmny sszezrt formban, azaz minden csoportkpz vltoz a rtegekben (layer) kerl.

    OLAP Cubes

    Esztend: TotalNAP: Total

    5101.1RAINSum

    A kimutatst tetszs szerinti formba nthetjk, a rtegeket sorokba illetve oszlopokba hzhatjuk. Ehhez kattintsunk kettt a

    - 30 -

  • Huzsvai Lszl: SPSS alkalmazsok

    tblzatban az egr balgombjval. A fels mensoron megjelenik a Pivot parancs, melyben a Pivoting Trays parancs megnyitja a szerkesztsi lehetsget.

    9. bra: A kimutats szerkezetnek megvltoztatsa

    A baloldalon a rteg (layer), alul a sor (row) s jobboldalon az oszlop (column) tallhat. A vltozkat az egrrel hzzuk a kvnt helyre, pl.

    - 31 -

  • Huzsvai Lszl: SPSS alkalmazsok

    OLAP Cubes

    NAP: TotalSum

    414.0573.0397.0635.0637.0359.0585.0411.5520.9568.7

    5101.1

    1995199619971998199920002001200220032004Total

    RAIN

    A tblzat mindenegyes elemt formzhatjuk, s elmenthetjk a kimutats egyes vltozatait. Ehhez nyissuk meg a Bookmarks (knyvjelzk) parancsot.

    10. bra: A

    knyvjelzk megadsa

    Adjunk nevet az aktulis kimutats vltozatnak, s az Add gombbal adjuk hozz a knyvjelzt.A View menparancsban vlasszuk a Toolbars lehetsget, ekkor megjelennek a segdeszkzk (tolltart), melyek

    - 32 -

  • Huzsvai Lszl: SPSS alkalmazsok

    segtsgvel hasznos eszkzk llnak rendelkezsnkre a kimutatsok tovbbi elemzshez, formzshoz.

    11. bra: Segdeszkzk a kimutatsok formzshoz

    Itt megtallhatk a knyvjelzk is, amivel a kimutatsok klnbz vltozatai knnyen ttekinthetk.

    Case summariesNagyon hasonlt a pivot tblhoz, csak sokkal egyszerbb formtumban jelenti meg az adatokat. Jl hasznlhat a bevitt adatok ellenrzsre, klnbz csoportostsok szerinti adatmegjelentshez.

    Case Summaries

    Mean

    -1,268 -7,496-1,629 -12,0937,677 -2,019

    15,650 3,21326,100 12,61628,057 14,82327,352 15,67429,671 13,00822,063 9,45312,165 3,24810,490 2,657

    2,652 -3,03915,005 4,431

    HONAP1,0002,0003,0004,0005,0006,0007,0008,0009,00010,00011,00012,000Total

    TMAX TMIN

    - 33 -

  • Huzsvai Lszl: SPSS alkalmazsok

    3. tblzat

    Report summaries in Rows

    Report summaries in ColumnsA meteorolgia adatbzisbl minden kimutats elvgezhet ezzel az eljrssal. A Data Columns prbeszd ablakban kell megadni az elemzend vltozkat. Minden vltozhoz klnbz statisztikt rendelhetnk, st ugyanazt a vltozt tbbszr is felvehetjk klnbz szmtsi eljrsokkal. Pl. a hmrskletvltozbl az tlagot, minimumot, maximumot gy egy tblzaton (kimutatson) bell egyszeren ki tudjuk szmtani. A csoportkpz vltozt a Break Columns ablakban kell megadni. Vlaszthatunk nvekv, ill. cskken kirats kztt. A kimutats rtf formtumban kszl. Nagyon jl hasznlhat az aggreglt adatok megjelentshez.

    Ler statisztikk (Descriptive Statistics)

    Centrlis mutatk: tlag (vrhat rtk), Medin (kzps adat, gyakran helyettesti a szmtani kzepet), Mdusz (leggyakrabban elfordul elem)Szrdsi mutatk: Helyzeti s szmtott, Maximum (standardizlt rtke), Minimum (standardizlt rtke), Terjedelem (max.-min., range), Kiugr rtkek, Kvartilisek (negyedelk), Interkvartilis (Q3-Q1)/2, Szrs (standard eltrs), Variancia (szrsngyzet), Standard hibja az tlagnak,Standard hibja a medinnakAz eloszls alakjnak jellemzse: Ferdesg (skewness, jobbra-balra ferde eloszlsok), Cscsossg (kurtosis, 0 normlis mg 2, +2 kztt), Boxplot brzolsTrimelt, csonktott, robosztus ler statisztika, a kiugr rtkek elhagysa.

    - 34 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Gyakorisgok (Frequencies)A megfigyelt vltozk relatv s kumulatv eloszlst tudjuk elemezni, ill. brzolni. Megjelenthetjk a gyakorisgi tblzatot (Display frequency tables). A szzalkos rtkeken bell (Percentile Values): a kvartiliseket, ahol az adatok 25, 50 s 75%-a tallhat. Feloszthatjuk az adatokat egyenl csoportokra (2-tl 100-ig) (Cut points for x equal groups) valamint tetszlegesen megadott szzalkok alapjn is megjelenthetjk az adatok eloszlst. A centrlis mutatk kzl az tlagot (mean), medint, mduszt valamint a megfigyelsek sszegt (sum), az eloszlsi mutatk kzl a szrst (std. Deviation), a variancit, a terjedelmet (range), a minumum s maximum rtkeket valamint az tlag hibjt (S.E. mean) tudjuk kiszmtani.

    - 35 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Statistics

    t/ha18208

    09.867863.05116

    -.474.018

    -.207.036

    4.591007.75800

    10.2280012.2250014.20255

    ValidMissing

    N

    MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis

    525507595

    Percentiles

    4. tblzat

    Meghatrozhatjuk az eloszls jellemz paramtereit is. Az eloszls szimmetrijt a ferdesgi mutatval (skewness) jellemezhetjk. A normleloszls szimmetrikus s a ferdesge nulla. Pozitv ferdesgi rtk mellett az eloszlsnak hossz jobboldali rsze, farka van (right tail), ekkor balra ferdl, negatv rtk esetben jobbra ferdl az eloszls. Amennyiben a ferdesg rtke nagyobb, mint egy, az eloszls nem norml. Az adatok kzppont krli csoportosulst a cscsossgi mutatval (kurtosis) mrhetjk. Norml eloszls esetn az rtke ennek is nulla. A cscsossg pozitv rtke azt mutatja, hogy az adatok szlesebb csoportban helyezkednek el, az eloszls kt szle hossz. Negatv rtk esetben kisebb csoportban helyezkednek el az adatok, az eloszls kt szle rvidebb. A plda a kukorica termsnek (t/ha) eloszlst mutatja be.

    - 36 -

  • Huzsvai Lszl: SPSS alkalmazsok

    brzolhatjuk az adatokat oszlop s kr diagramon, valamint hisztogram formjban is. A diagramokon brzolhatjuk a gyakorisgokat vagy a megfigyelsek szzalkos rtkeit.

    t/ha

    19.018.0

    17.016.0

    15.014.0

    13.012.0

    11.010.0

    9.08.07.06.05.04.03.02.01.00.0

    t/ha

    Freq

    uenc

    y

    3000

    2000

    1000

    0

    Std. Dev = 3.05

    Mean = 9.9

    N = 18208.00

    12. bra

    Descriptives

    ExploreItt exploratv adatanalzist vgezhetnk. Ez klnsen fontos nagy adatbzisok esetben az adatok alapos megismersre, feldertsre.

    - 37 -

  • Huzsvai Lszl: SPSS alkalmazsok

    13. bra

    A Statistics gombra kattintva klnbz statisztikkat szmthatunk ki. Ler statisztikk (Descriptives): tlag, medin, mdusz, 5%-os csonkolt tlag, az tlag hibja, variancia, szrs, minimum, maximum, terjedelem, interkvartilisek, ferdesg, cscsossg.

    14. bra

    Robosztus centrlis mutat meghatrozsa maximum-likelihood mdszerrel (M-estimators). Ngyfle mdszerrel lehet

    - 38 -

  • Huzsvai Lszl: SPSS alkalmazsok

    meghatrozni a centrlis mutatt, mely torz eloszls vagy extrm, kiugr rtkek esetn jobb becslst ad, mint az tlag.

    15. bra

    Az t legnagyobb s legkisebb rtk kijelzse (Outliers), ezeket az eredmnylistban extrm rtkknt lthatjuk.

    484848N =

    Talajmvels

    trcsstavaszi szntsszi sznts

    term

    s t/

    ha

    16

    14

    12

    10

    8

    6

    4

    16. bra

    - 39 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A megfigyelsek szzalkos eloszlst hatrozhatjuk meg, 5, 10, 25, 50, 75, 90, 95% (Percentiles).brk ksztse, eloszlsok tesztelse. Box-plot grafikonok (kvartilis vagy doboz bra): a fggetlen vltozk fggvnyben kszthetnk kvartilis brt. A kiugrrtkeket kln jelzi a program. A kvartilis brn a nagysg szerint rendezett adatok ngy egyenl rszre vannak osztva. A minimlis rtktl haladva a maximlisig Q1, Q2, Q3 jelli az adatok 25, 50, 75%-t. A Q3 egyben a medin. Interkvartilis IQR= Q3-Q1, ezt doboznak is nevezik. A program kiugr rtknek (kr vagy csillag) jelli a doboztl 1,5IQR-nl nagyobb tvolsgra elhelyezked adatokat (Q3+1,5IQR illetve Q1-1,5IQR).

    Az adatok eloszlsnak lersa (Descriptive):Stem-and-leaf grafikon: stem=szr, leaf=levl skla tpus adatok felbontsa, hogy a f rtket a szr, az utols jegyeket a leaf adja. Pl. 7.18 t/ha stem=7, leaf=1.

    terms t/ha Stem-and-Leaf Plot forTALAJMUV= szi sznts

    Frequency Stem & Leaf

    2.00 7 . 99 6.00 8 . 002458 6.00 9 . 013699 3.00 10 . 009 5.00 11 . 02278 8.00 12 . 00035679 13.00 13 . 1223346666668 3.00 14 . 233 2.00 Extremes (>=113.5)

    Stem width: 1.000 Each leaf: 1 case(s)

    Hisztogram ksztse (Histogram):

    - 40 -

  • Huzsvai Lszl: SPSS alkalmazsok

    terms t/ha

    13.0012.50

    12.0011.50

    11.0010.50

    10.009.50

    9.008.50

    8.007.50

    7.006.50

    Histogram

    Freq

    uenc

    y

    14

    12

    10

    8

    6

    4

    2

    0

    Std. Dev = 2.07 Mean = 10.31

    N = 48.00

    17. braNormleloszls tesztelse Kolmogorov-Smirnov s Shapiro-Wilk prbval.

    Tests of Normality

    .127 48 .050 .916 48 .002

    .227 48 .000 .845 48 .000

    .263 48 .000 .817 48 .000

    Talajmvelsszi szntstavaszi szntstrcss

    terms t/haStatistic df Sig. Statistic df Sig.

    Kolmogorov-Smirnova Shapiro-Wilk

    Lilliefors Significance Correctiona.

    Shapiro s Wilks W-prbaNormlis eloszls tesztelsre szolgl mdszer, rtke maximum 1 lehet. Ennl jval kisebb rtk esetn nem normlis az eloszls. Szignifikancia vizsglata megoldott, = 0,05. Akkor rdemes kiszmolni, ha a minta elemszma nem haladja meg az 50-et.

    - 41 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Normal Q-Q Plot of terms t/ha

    For TALAJMUV= szi sznts

    Observed Value

    1614121086

    Expe

    cted

    Nor

    mal

    3

    2

    1

    0

    -1

    -2

    -3

    Detrended Normal Q-Q Plot of terms t/ha

    For TALAJMUV= szi sznts

    Observed Value

    151413121110987

    Dev

    from

    Nor

    mal

    .4

    .2

    0.0

    -.2

    -.4

    -.6

    -.8

    - 42 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Kereszttblk (Crosstabs)A meteorolgiai alapadatok ellenrzst is el lehet vgezni vele. Minden nap 24 darab nulla, negyed, fl s hromnegyed rs mrsnek kell lennie. Adjuk meg a napokat sorknt, a negyedrkat oszlopknt.

    A hnap napja * Perc Crosstabulation

    Count

    23 24 24 24 9524 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 96

    719 720 720 720 2879

    123456789101112131415161718192021222324252627282930

    Ahnapnapja

    Total

    0 15 30 45Perc

    Total

    5. tblzat

    - 43 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Ngymezs Chi2-prba fggetlensg s homogenits vizsglatra

    Osszunk fel egy vletlen minta alapjn kivlasztott 100 szemlyt kt alternatv ismrv szerint: nemek szerint s dohnyzsi szoks szerint.

    Nem dohnyz Dohnyz Nk 33 20 53

    Frfiak 9 38 47 42 58 100

    + a b a+b = n1+ c d c+d = n2 a+c b+d a+b+c+d = n

    Fggetlensg esetn:a/ n1 = c/n2 = (a+c)/n vagyb/ n1 = d/n2 = (b+d)/n stb

    ))()()(())(1( 22

    dbcadcbabcadnChi

    ++++

    =

    819,18)3820)(933)(389)(2033(

    )9*2038*33(99 22=

    ++++

    =Chi

    DF = 1Kritikus Chi2-rtkek 5%-on: 3,841

    Plda:Kukorica fajtk csvesedse:

    - 44 -

  • Huzsvai Lszl: SPSS alkalmazsok

    FAJTA * CSVESD Crosstabulation

    Count

    73 23 9648 8 56

    121 31 152

    A fajtaB fajta

    FAJTA

    Total

    Egy csLegalbbkt cs

    CSVESD

    Total

    Chi-Square Tests

    2.038b 1 .1531.486 1 .2232.123 1 .145

    .210 .110

    2.025 1 .155

    152

    Pearson Chi-SquareContinuity Correctiona

    Likelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases

    Value dfAsymp. Sig.

    (2-sided)Exact Sig.(2-sided)

    Exact Sig.(1-sided)

    Computed only for a 2x2 tablea.

    0 cells (.0%) have expected count less than 5. The minimum expectedcount is 11.42.

    b.

    A Yates korrekcival korriglt klnbsg ngyzetbl szmtott Chi-ngyzetet a Continuity Correction mutatja. A kt kukoricafajta a vizsglt tulajdonsg szempontjbl egyforma.

    Custom Tables

    Kzprtk sszehasonlts (Compare Means)

    A kezelstlagok kztti klnbsgek megbzhatsgnak igazolsra tbbfle teszt ismeretes. Az sszehasonlts sorn, vagy kt tlag klnbsgre vagyunk kvncsiak, vagy a kezelsszintjeinket akarjuk sszehasonltani egymssal, sorban tesztelve, hogy melyik kett vagy tbb kezels tlag tr el a tbbitl (szimultn vagy tbbszrs sszehasonlts). A ktfle

    - 45 -

  • Huzsvai Lszl: SPSS alkalmazsok

    eljrs ktfle sszehasonltsi mdszer csoportot takar. Az els mdszer a pronknti-tesztek csoportja a msodik a tbbszrs sszehasonlt tesztek csoportja.

    Kzprtkek (Means)A fgg vltozk (Dependent List) klnbz statisztikai mutatit lehet kiszmtani a fggetlen vltozk (Independent List) fggvnyben. Elkszthetjk a variancia-tblzatot, tesztelhetjk az sszefggs linearitst s az sszefggs szorossgra az R s eta paramter nagysgbl kvetkeztethetnk. Az R-rtk, ill. R2 a fgg vltoz megfigyelt s becslt rtkei kztti lineris kapcsolat ersgt mri. rtke 0,0 1,0 terjedhet. Kis rtk esetben a fgg s fggetlen vltoz kztt gyenge a kapcsolat vagy nem lineris. Az eta paramter a korrelcis koefficienshez hasonlt, de itt a fggetlen vltoz nem folytonos, hanem kategriavltoz.

    Report

    terms t/ha

    11.50673 48 2.0605810.30987 48 2.068899.56033 48 2.28744

    10.45898 144 2.27357

    Talajmvelsszi szntstavaszi szntstrcssTotal

    Mean NStd.

    Deviation

    ANOVA Table

    92.524 2 46.262 10.087 .00090.923 1 90.923 19.825 .0001.601 1 1.601 .349 .556

    646.657 141 4.586739.181 143

    (Combined)LinearityDeviation from Linearity

    BetweenGroups

    Within GroupsTotal

    terms t/ha *Talajmvels

    Sum ofSquares df

    MeanSquare F Sig.

    Measures of Association

    -.351 .123 .354 .125terms t/ha *Talajmvels

    R R Squared EtaEta

    Squared

    6. tblzat

    A fenti tblzat els rsze a kezelsek hatsra kialakul termstlagokat s szrsokat tartalmazza. A legnagyobb

    - 46 -

  • Huzsvai Lszl: SPSS alkalmazsok

    termst szi sznts utn takarthatjuk be. Az ANOVA tbla a variancia-analzis eredmnyt mutatja. A Between a csoportok kztti hatst. Ez fel van bontva lineris s nem lineris hatsra. A Sig. alapjn a lineris hats szignifikns, a nem lineris hats nem szignifikns. Az utols tblzat a talajmvels s terms kztti sszefggs szorossgt mutatja. Az R s R2-nek ebben az esetben nincs rtelme, mivel a fggetlen vltoz (talajmvels) nem skla tpus vltoz, hanem nominlis. Ez vegyes kapcsolat, ami az Eta ill. a ngyzete mutat. Ennek termszetesen nincs irnya csak nagysga. Minl kzelebb van egyhez, annl szorosabb a kt tnyez kztti kapcsolat. Az Eta-ngyzet a csoportok kztti eltrs-ngyzetsszeg s az sszes eltrs-ngyzetsszeg hnyadosa. Ebben az esetben 92,5/739,2=0,125. Ennek a gyke az Eta, ami ebben a pldban kzepes erssg sszefggst mutat (0,354).

    Egymints t-teszt (One Sample T Test)Egymints t-prba. Tesztelhetjk, hogy a valsznsgi vltoznk rtke megegyezik-e egy konkrt rtkkel. Megvlaszthatjuk a konfidencia intervallum nagysgt is.Felttel:Normlis eloszls populci, szigma ismeretlen s n>30.

    nsXz

    /0

    =

    DF = n-1A minta elemszmnak nvekedsvel a t eloszls egyre jobban kzelti a standard normlis eloszlst.Az X kzprtk minta abban az esetben szrmazhat a m kzprtk populcibl ha t prbastatisztika abszolt rtke kisebb, mint az adott valsznsghez tartoz kritikus t rtk.

    - 47 -

  • Huzsvai Lszl: SPSS alkalmazsok

    One-Sample Statistics

    144 10.45898 2.27357 .18946terms t/haN Mean

    Std.Deviation

    Std. ErrorMean

    One-Sample Test

    2.423 143 .017 .45898 8.45E-02 .83349terms t/hat df

    Sig.(2-tailed)

    MeanDifference Lower Upper

    95% ConfidenceInterval of the

    Difference

    Test Value = 10

    7. tblzat

    Egymints z-prbaA minta kzprtknek sszehasonltsa egy felttelezett kzprtkkel. Szrmazhat-e az X kzprtk minta egy 0 kzprtk populcibl? H0 hipotzis:

    H0: = 0Felttel:

    Normlis eloszls populci, s ismert szrs,Vagy tetszleges eloszls populci, s n>30.

    A minta alapjn szmtott X kzprtk standardizlt rtk felrhat az albbi formban:

    nXz

    /0

    =

    Ahol:z a prbastatisztika minta alapjn meghatrozott rtkeX a minta kzprtke, a populci felttelezett kzprtke (adott kzprtk), a populci (ismert) szrsa,n a minta elemszma.

    - 48 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A minta abban az esetben szrmazhat az m kzprtk populcibl, ha minta alapjn meghatrozott z prbastatisztika rtke kisebb az adott valsznsgi szinthez tartoz kritikus z - rtknl. Egyoldal hipotzis esetn alfnl, ktoldal hipotzis esetn alfa/2-nl kell kikeresni.

    z < kritikus z

    Kt fggetlen minta kzprtknek sszehasonltsa (Independent-Samples T Test)

    Szrmazhat-e a kt fggetlen megfigyels, minta azonos kzprtk populcibl?Azonosnak tekinthet-e a kt populci kzprtke, amelyekbl a mintk szrmaznak? A kt populci, amelyekbl a mintk szrmaznak, 1, ill. 2 vrhat rtknek becslsre a mintk kzprtkei szolglnak, 11 )( =XE , ill. 22 )( =XE .

    H0: 1 = 2A kzprtkek sszehasonltsra szolgl statisztikai prbk az egymints prbkhoz hasonlan nmileg eltrek attl fggen, hogy mekkora az egyes mintk elemszma, ill. hogy ismert-e az alappopulcik szrsa.Kt fggetlen minta kzprtknek sszehasonltsa. Felttel:

    Kt fggetlen minta,Normlis eloszls sokasgok,A variancik ismeretlenek, de azonosak

    s n

  • Huzsvai Lszl: SPSS alkalmazsok

    A nevezben az sp a kt minta sszevont variancijnak (pooled variancie) ngyzetgykt jelenti, melyet a kt minta sszevont szrsnak nevezzk s az albbi kplettel szmtjuk ki:

    2)1()1(

    21

    222

    211

    +

    +=

    nnsnsns p

    A kt populci kzprtke, amelyekbl a mintk szrmaznak, abban az esetben tekinthetk azonosnak, ha:

    *tt

    A prba statisztika kritikus t rtkt ktoldali alternatv hipotzis esetn /2-nl, egyoldali alternatv hipotzis esetn, -nl kell a tblzatbl meghatrozni. Ha a kt populci ismeretlen szrsngyzete korbbi ismeretek, ill. a mintkbl szmtott szrsngyzetek alapjn nem tekinthet azonosnak, akkor a t prba helyett a Welch-prbt kell alkalmazni, mely igen hasonl a t-prbhoz, a klnbsg a szabadsgfokok meghatrozsban van. A t-teszt alkalmazsakor elre tudni kell, hogy a kt csoport szrsa megegyezik-e, teht tesztelni kell a csoportok szrst (Levene-pba). Amennyiben a szrsok egyenlk, akkor a vizsglatba vont sszes csoportbl kell a variancit becslni (pooled variancia). A prba valsznsgi vltozja t-eloszls, gy a kzprtkek klnbsgnek szignifikancija a t-rtk tblzatbl megllapthat.Ha a kt csoport szrsa szignifiknsan klnbzik, ilyenkor a kt sszehasonltand csoport variancijt slyozni kell a variancia becslshez (separate variancia). A mdostott variancia becsls az albbi:

    +=2

    22

    1

    21

    ns

    nsSd

    A prba valsznsgi vltozja ebben az esetben nem t-eloszls, ezrt nem a t-tblzatot, hanem a Bonferroni-mdostott szignifikancia rtkeket kell hasznlni a kzprtkek klnbzsgnek elbrlsakor.

    - 50 -

  • Huzsvai Lszl: SPSS alkalmazsok

    8. tblzat

    Group Statistics

    48 7.66106 1.23444 .1781848 11.77213 1.08695 .15689

    Trgya kezelsnem trgyzottnitrogn 120

    terms t/haN Mean

    Std.Deviation

    Std. ErrorMean

    Independent Samples Test

    .472 .494 -17.317 94 .000 -4.11106 .23740 -4.58243 -3.63969

    -17.317 92.518 .000 -4.11106 .23740 -4.58253 -3.63959

    Equal variancesassumedEqual variancesnot assumed

    terms t/haF Sig.

    Levene's Test forEquality of Variances

    t dfSig.

    (2-tailed)Mean

    DifferenceStd. ErrorDifference Lower Upper

    95% ConfidenceInterval of the

    Difference

    t-test for Equality of Means

    Ktmints z-prbaFelttel:Normlis eloszls fggetlen sokasgok, a variancia ismert,Vagy tetszleges eloszls, mindkt mintban n>30.Az X1 s X2 kzprtkek klnbsge akkor normlis, ill. kzeltleg normlis eloszls, ha a sokasgok amelyekbl a mintk szrmaznak normlis eloszlsak, illetve tetszleges eloszlsak, de a mintaelemek szma mindkt populciban nagyobb, mint 30.A prbastatisztika:

    )/()/( 2221

    21

    21

    nnXXz

    +

    =

    A kt populci kzprtke, amelyekbl a mintk szrmaznak, abban az esetben tekinthetk azonosnak, ha:

    *zz

    A prba statisztika kritikus z-rtkt ktoldali alternatv hipotzis esetn /2-nl, egyoldali alternatv hipotzis esetn, -nl kell a tblzatbl meghatrozni.

    - 51 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Prostott t-prba (Paired-Samples T Test)Prostott t-prba, kt sszefgg minta kzprtknek sszehasonltsra szolgl.Ugyanazon egyeden kt klnbz idpontban mrnk egy tulajdonsgot, vagy valamilyen csoportkpz tulajdonsg alapjn prokat tudok kpezni.A kt minta kzprtknek azonossga helyett a prostott mintk d (eljeles) klnbsgnek kzprtkre is megfogalmazhatjuk a H0 hipotzist:H0: dtlag = 0Az elz eljrsokhoz hasonlan itt is z-. ill. t-prbt alkalmazhatunk attl fggen, hogy ismert-e a d klnbsgek eloszlsa s szrsa, illetve mekkora a minta elemszma?Felttel: a d klnbsgek eloszlsa normlis, s d ismeretlen (a

    mintbl szmtott), s n

  • Huzsvai Lszl: SPSS alkalmazsok

    Paired Samples Test

    9.424 4.521 .237 8.958 9.889 39.824 364 .000Maximlis hmrsklet(C) - Minimlishmrsklet (C)

    Pair1

    MeanStd.

    DeviationStd. Error

    Mean Lower Upper

    95% ConfidenceInterval of the

    Difference

    Paired Differences

    t dfSig.

    (2-tailed)

    9. tblzattlag, az esetek szma, szrs, az tlag hibja. A kt csoport kztti lineris korrelcis egytthat. Prostott t-prba eredmny tblzata: a kt csoport klnbsgnek tlaga, szrsa, az tlag hibja, az tlag 95%-os konfidencia intervalluma, t-rtk, szabadsgfok, ktoldal szignifikancia szint.

    Egytnyezs variancia-analzis (One-Way ANOVA)Egytnyezs variancia-analzis. Segtsgvel egy tnyez hatst lehet vizsglni a fgg vltoz mennyisgi alakulsra. A tnyez, faktor valamilyen csoportkpz ismrvvel rendelkezik, a fgg vltoz pedig legtbbszr skla tpus adat. Egyszerre tbb fgg vltozt is kijellhetnk az analzis szmra. A teszt sorn a nullhipotzis, hogy az tlagok egyenlk, nincs kzttk klnbsg. Ez a technika a ktmints t-teszt ltalnostsa, kiterjesztse tbb mintra.Kzs szrsngyzet (variancia) =Vizsglt tnyezk + HibaA szmts sorn az sszes eltrs-ngyzetsszeget bontjuk fel csoportok kztti (kezels hats) s csoporton belli (hiba) hatsokra.

    ijiij Ax ++=

    = a ksrlet ftlagaAi = (Kezelstlagok-)ij = hiba

    A hiba normlis eloszls, fggetlen a blokk s kezelshatstl. Mi van, ha nem teljesl? Lehet transzformlni az alapadatokat,

    - 53 -

  • Huzsvai Lszl: SPSS alkalmazsok

    logaritmikus vagy egyb transzformcival. A blokk (sokszor ez az ismtls), kezels s hiba hatsok sszege nulla.

    Alkalmazsi felttelek: Fggetlen megfigyelsek Normlis eloszls sokasgok Azonos szrsok

    Amennyiben az analzis az tlagok kztti egyenlsget nem igazolja, szksges az tlagok kztti klnbsgek kimutatsa. A variancia-analzist kiegszt kzprtk sszehasonlt teszteknek ktfle tpusa ltezik:

    1. elzetes, un. a priori kontrasztok s2. az analzis utn elvgezhet, un. post hoc analzisek

    A kontrasztokat teht a ksrleti adatok elemzse eltt kell ellltani, s gy elvgezni az elemzst.Az albbi statisztikk kszlnek: minden csoportrl az esetek szma, tlag, szrs, az tlag hibja, minimum, maximum s az tlag 95%-os konfidencia intervalluma.A csoportok variancijnak egyezsgt Levenes teszttel vizsgljuk. Minden fgg vltozra elkszlnek a variancia-tblzatok. A post hoc range s tbbszrs kzprtk sszehasonlt tesztek: Bonferroni, Sidak, Tukeys honestly szignifikns differencia, Hochbergs GT2, Gabriel, Dunnett, Ryan-Einot-Gabriel-Welsch F test (R-E-G-W F), Ryan-Einot-Gabriel-Welsch range teszt (R-E-G-W Q), Tamhanes T2, Dunnetts T3, Games-Howell, Dunnetts C, Duncans multiple range test, Student-Newman-Keuls (S-N-K), Tukeys b, Waller-Duncan, Scheff, and least-significant difference.Szimultn vagy tbbszrs sszehasonlts (multiple comparison) a kztudatban a szrsanalzis kiegsztje, fejldst fleg felhasznli ignyek indtottk tjra.

    - 54 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Jelentsge azonban jval nagyobb, klnsen a nem paramteres esetben, ahol szrsanalzisre, e normalitst felttelez eljrsra, nem kerlhet sor. Ha az egyszempontos szrsanalzis F-prbja szignifikns, kvncsiak vagyunk, mely populcik miatt nem homogn a minta. Eleinte csak pronknt az sszes lehetsges csoport prra ktmints t-prbt hajtottak vgre. Elfordulhat azonban, hogy adott -szinten szignifikns F-prba esetn egyik csoport pr sem mutat szignifikns t-rtket az adott -szint mellett. A szimultn hipotzis vizsglatok nemcsak az egyszempontos szrsanalzisben hdtottak teret, hanem mindentt, ahol egyidej dntsre van szksg, pl. regresszi, kovariancia, tbbszempontos szrsanalzis, stb.Szimultn dnts, ha kettnl tbb sszehasonltand mintm van. Olyan lltsokat fogalmaznak meg, amelyek egyidejleg rvnyesek. Ezek lehetnek:

    Egyidejleg rvnyes konfidencia intervallumok vagy Szimultn vgzett statisztikai prbk.

    A tbbszrs statisztikai prbk zme paramteres, a normlis eloszlsra pl eljrs. Sorozatos statisztikai sszehasonltsok vgzsekor halmozdik a prbaknt vllalt elsfaj hiba (kockzat). A szimultn sszehasonltsi mdszerek f clkitzse ennek a halmozdsnak a cskkentse, illetve megszntetse. Ennek eredmnyeknt az egyes sszehasonltsok konzervatv irnyba toldnak el: az egyenknti prbkra rvnyes elsfaj hiba kisebb a vllalt (nvleges) kockzatnl. Ez azonnal szembetlik a tbbszrs sszehasonltsok azon csoportjnl, amelyek az n. Bonferroni-egyenltlensg alapjn dolgoznak. Az els ilyen javaslat Fisher knyvben (1935) tallhat. A lnyege, hogy m sszehasonlts estn, az egyes sszehasonltsokat a nvleges szint helyett /m valsznsgi szinten hajtjk vgre. A valsznsg szubadditv tulajdonsga miatt, ha az sszehasonltsonknt vllalt i kockzatok sszege olyan

    - 55 -

  • Huzsvai Lszl: SPSS alkalmazsok

    nagy, mint a teljes sorozatra vllalt valsznsgi szint, akkor annak valsznsge, hogy m elvgzett sszehasonlts utn valahol elkvetjk az elsfaj hibt, legfeljebb :

    =

    =m

    iiHP

    1

    )(

    ahol: H esemny azt jelenti, hogy az lltsok kzt legalbb egy hibs. Ha az egyes lltsok (valsznsg-szmtsi rtelemben) fggetlenek lennnek, akkor a fenti becsls helyett az

    =

    =

    m

    iiHP

    1

    )1()(1

    egyenlsget alkalmazhatnnk, ami azt mutatja, hogy az lltsok kztt nincs hibs. Miller (1966) megmutatta, hogy a szimultn konfidencia-intervalumokra a fenti egyenlsg helyett mindig a rvnyes. A szimultn vizsglt mintk kztt vgezhet sszehasonltsok nem fggetlenek. Legyen valamennyi i valsznsge egyforma: i = m = /m, akkor az sszehasonltsok nem fggetlen termszett figyelembe vve, a szimultn prbk egyttes kockzata:

    P(H)

  • Huzsvai Lszl: SPSS alkalmazsok

    foglalkozott, magyar nyelven LTET .-ZIERMANN M. 1964 megjelent mvben tallhat meg. A mdszer lnyege, hogy egy olyan lineris fggvnyt kell alkotni, mint pl.:

    g = cg1x1. + cg2x2. + ... + cgpxp.s ha teljesl a

    cg1 + cg2 + ... cgp = 0

    felttel, akkor ez egy lineris sszehasonlt fggvny. A fenti defincibl kvetkezen vgtelen szm g ltezik.A kontrasztokra vonatkoz nullhipotzis: Hg: g = 0,Az ellenhipotzis: Ag: g 0.Ha pl. egy tnyez hatst T1, T2, T3, T4 szinten vizsglunk, akkor a (T1, T2) csoport egybevetst a (T3, T4) csoporttal a g = x1. + x2. -x3. -x4. fggvny segtsgvel vgezhetjk el (itt 1+1-1-1=0).A fenti sszehasonlts a variancia-analzis ltal szolgltatott pooled variancia felhasznlsval trtnik, ezrt kvetelmny, hogy a csoportok szrsai megegyezzenek, gy gyakran a variancia-analzis kiegszt rszt kpezi. A kontraszt fejezetben a hattnyezk sokfle csoportostsa tjn kapott tlagok klnbzsgt lehet vizsglni, pl. mtrgyzs esetn, a felttelezsem az, hogy az szi bza a legnagyobb termst a 120 kg nitrogn adag mellet ri el. Vizsglhatom az ez alatti adagokat, mintt vve, vagy az e feletti adagokat, szintn mintt vve, vletlenszeren, ha nem 120 kg-t alkalmazok, vajon milyen eredmny szletne.Az egyszempontos szrsanalzis F-prbja akkor ad -szinten szignifikns eredmnyt, ha ezen a szinten ltezik szignifikns kontraszt a csoportok kztt.

    Feladat:Nyissuk meg a Terms1989.sav fjlt, s vizsgljuk meg, hogy a talajmvelsnek milyen hatsa volt ebben az vben a kukorica termsre.

    - 57 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A legels lpsben brzoljuk talajmvelsi vltozatonknt a termsek tlagnak hibjt (standard error), pontosabban az tlagot az tlag hibjnak ktszerest. Ebbe a tartomnyba fog legalbb 95%-os valsznsggel a valdi tlag beleesni.Graph, Error Bar, Simple, Summaries for groups of cases, Define, Variable: terms t/ha, Category Axis: Talajmvels, Bars Represent: Standard error of mean, Multiplier: 2.

    trcsstavaszi szntsszi sznts

    Talajmvels

    22

    20

    18

    16

    14

    12

    10

    8

    Mean

    +-

    2 S

    E t

    erm

    s t

    /ha

    18. bra: Az tlag s az tlag hibjnak ktszerese

    Az szi szntsos kezels adataival valami problma lehet, mert tlsgosan nagy az tlag hibja, magba leli a msik kt kezelst is. Egyelre hagyjuk gy, s vgezzk el a variancia-analzist.Analyze, Compare Means, One-Way ANOVA, Dependent List: terms t/ha, Factor: Talajmvels, Options: Homogeneity of variance test.

    - 58 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Test of Homogeneity of Variances

    terms t/ha

    5.107 2 141 .007

    LeveneStatistic df1 df2 Sig.

    10. tblzat

    A Levene-teszt azt mutatja, hogy a csoportokon bell a variancik nem egyenlk. Ezek szerint valsznleg az szi szntsos parcellk termseinek szrsa szignifiknsan nagyobb, mint a msik kett. A variancia-analzis alkalmazsnak egyik felttele nem teljesl, ezrt a lenti tblzat eredmnyt fenntartsokkal kell kezelni. Az elvgzett analzis a talajmvels szignifikns hatst igazolja ltszlag, sig. < 0,05. Ezt csak akkor fogadhatnnk el, ha a variancik megegyeznnek.

    ANOVA

    terms t/ha

    1106.779 2 553.390 3.758 .02620763.765 141 147.26121870.544 143

    Between GroupsWithin GroupsTotal

    Sum ofSquares df Mean Square F Sig.

    11. tblzat

    Vgezzk el a kzprtkek tbbszrs sszehasonltst (Post Hoc analzis). A tbbszrs sszehasonlt teszteknek kt nagy csoportja van: 1. a varianciknak egyenlknek kell lenni, 2. nem felttel a variancik egyenlsge. Vlasszuk ki mindkt csoportbl az elst!One-Way ANOVA, Post Hoc, Equal Variances Assumed: LSD, Equal Variances Not Assumed: Tamhanes T2.

    - 59 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Multiple Comparisons

    Dependent Variable: terms t/ha

    5.470354* 2.477068 .029 .57336 10.367356.219896* 2.477068 .013 1.32290 11.11689

    -5.470354* 2.477068 .029 -10.36735 -.57336.749542 2.477068 .763 -4.14745 5.64653

    -6.219896* 2.477068 .013 -11.11689 -1.32290-.749542 2.477068 .763 -5.64653 4.147455.470354 3.015757 .211 -1.99077 12.931486.219896 3.019043 .128 -1.24821 13.68800

    -5.470354 3.015757 .211 -12.93148 1.99077.749542 .445175 .260 -.33289 1.83197

    -6.219896 3.019043 .128 -13.68800 1.24821-.749542 .445175 .260 -1.83197 .33289

    (J) Talajmvelstavaszi szntstrcssszi szntstrcssszi szntstavaszi szntstavaszi szntstrcssszi szntstrcssszi szntstavaszi sznts

    (I) Talajmvelsszi sznts

    tavaszi sznts

    trcss

    szi sznts

    tavaszi sznts

    trcss

    LSD

    Tamhane

    MeanDifference

    (I-J) Std. Error Sig. Lower Bound Upper Bound

    95% Confidence Interval

    The mean difference is significant at the .05 level.*.

    12. tblzatAz LSD-teszt az szi sznts s tavaszi sznts, valamint az szi sznts s trcss talajmvels kztt 5%-os szignifikns klnbsget mutat. A Tamhane teszt egyik kezels pr kztt sem mutat szignifikns klnbsget. Mivel a variancik klnbzsge miatt LSD tesztet nem csinlhatunk, a Tamhane-teszt eredmnyt kell elfogadni, s kiderteni, hogy mirt nem tudjuk kimutatni a talajmvels okozta hatst.Vizsgljuk meg az szi szntsos kezelsek adatait!Analyze, Descriptive Statistics, Explore, Dependent List: terms t/ha, Factor List: Talajmvels, Statistics, Outliers.Az eredmnylistbl csak a kiugr rtkek tblzatt mutatom be.

    - 60 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Extreme Values

    9 szi sznts 114.4110 szi sznts 113.5132 szi sznts 14.39535 szi sznts 14.39236 szi sznts 14.286

    135 trcss 5.355134 trcss 5.421136 trcss 5.652122 trcss 5.697124 trcss 6.059

    1234512345

    Highest

    Lowest

    terms t/haCase Number Talajmvels Value

    13. tblzatJl lthat, hogy a 9. s 10. megfigyels adatrgztsi hiba miatt egy nagysgrenddel nagyobb, mint a tbbi. Javtsuk ki a hibs adatokat s ismteljk meg az analzist a legels lpstl kezdden!

    trcsstavaszi szntsszi sznts

    Talajmvels

    12

    11

    10

    9

    Mean

    +-

    2 S

    E t

    erm

    s t

    /ha

    19. bra: Az tlag s az tlag hibjnak ktszereseAz tlagok ebben az esetben mr jl elklnlnek egymstl. Az tlagok hibibl kpzett intervallumok mr kevsb rnek egymsba.

    - 61 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Test of Homogeneity of Variances

    terms t/ha

    1.096 2 141 .337

    LeveneStatistic df1 df2 Sig.

    14. tblzat

    A variancia-analzis alkalmazsi felttele, a csoporton belli variancik egyezsge teljesl, teht lehet variancia-analzist csinlni.

    ANOVA

    terms t/ha

    92.524 2 46.262 10.087 .000646.657 141 4.586739.181 143

    Between GroupsWithin GroupsTotal

    Sum ofSquares df Mean Square F Sig.

    15. tblzat

    A variancia-analzis a talajmvels szignifikns hatst mutatja. Az elvgzett tbbszrs kzprtk sszehasonlt tesztek most mr hasonl eredmnyt adnak. Mivel a variancik megegyeznek, az LSD-teszt eredmnyt rdemes figyelembe venni, mert ennek a tesztnek ebben az esetben nagyobb a prba ereje. Ez azt jelenti, hogy a meglv valdi klnbsget nagyobb biztonsggal tudja kimutatni, mint a Tamhane teszt.

    - 62 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Multiple Comparisons

    Dependent Variable: terms t/ha

    1.196854* .437141 .007 .33266 2.061051.946396* .437141 .000 1.08220 2.81059

    -1.196854* .437141 .007 -2.06105 -.33266.749542 .437141 .089 -.11466 1.61374

    -1.946396* .437141 .000 -2.81059 -1.08220-.749542 .437141 .089 -1.61374 .114661.196854* .421463 .017 .17227 2.221441.946396* .444371 .000 .86591 3.02689

    -1.196854* .421463 .017 -2.22144 -.17227.749542 .445175 .260 -.33289 1.83197

    -1.946396* .444371 .000 -3.02689 -.86591-.749542 .445175 .260 -1.83197 .33289

    (J) Talajmvelstavaszi szntstrcssszi szntstrcssszi szntstavaszi szntstavaszi szntstrcssszi szntstrcssszi szntstavaszi sznts

    (I) Talajmvelsszi sznts

    tavaszi sznts

    trcss

    szi sznts

    tavaszi sznts

    trcss

    LSD

    Tamhane

    MeanDifference

    (I-J) Std. Error Sig. Lower Bound Upper Bound

    95% Confidence Interval

    The mean difference is significant at the .05 level.*.

    16. tblzat

    Az SPSS post hoc analzisei

    Legkisebb szignifikns differencia (LSD)R.A.Fisher 1935-ben gy mdostotta az egyszer t-prbt, amennyiben a szrsanalzis F-prbja szignifikns, akkor alkalmazhatjuk a legkisebb szignifikns klnbsg (LSD) prbt, amelyben a kzs hiba ngyzetsszeg osztva a szabadsgfokval (error mean square) becsli a variancit. A mezgazdasgi kutatsban, a ksrletek kirtkelsben, a legrgebben hasznlt mdszer a kezelsszintek klnbsgnek vizsglatra. A variancia-analzis szolgltatta Hiba MQ-bl kiszmolt SZDp% -bl ( dpp stSzD %% = ) levont kvetkeztetsek azonban csak akkor rvnyesek, ha az analzis eltt vletlenl vlasztunk ki kt kezelstlagot, s ennek a klnbsgt teszteljk. ltalban a legnagyobb s legkisebb rtket ad kezelsek kztti klnbsgek akkor is nagyobbak, mint az SZDp%, ha a kezelsek vletlen mintk ugyanabbl a sokasgbl, teht nincs kzttk valdi klnbsg. Erre a

    - 63 -

  • Huzsvai Lszl: SPSS alkalmazsok

    kvetkeztetsre jutott Svb, 1981 is s a fenti htrnyok kikszblsre a Duncan-tesztet emlti, de az rtkels krlmnyes voltra hivatkozva nem foglalkozik vele. Sajnos a mezgazdasgi kutatsban is sokszor tvesen alkalmazzk az SZDp%-t s gyakorlatilag sorba tesztelik a kezelsszinteket, s azt nzik, hogy melyik kt kezels kztti klnbsg nagyobb, mint az SZDp%. Az gy kimutatott szignifikns klnbsgek igen ktes rtkek, mivel az -hiba valsznsge (az elsfaj hiba elkvetsnek kockzata) az sszehasonltsok sorn halmozdik. A legkisebb szignifikns differencia teht a t-eloszlst alkalmazza.

    Newman-tesztD. Newman (1939) dolgozta ki az els, studentizlt terjedelmeken alapul tbbszrs sszehasonlt tesztet. Erre az eloszlsra elszr lltott fel tblzatokat, ksbb Pearson s Hartley (1943) rszletesebb tblzatot ksztett. Ha a prba rtk szignifikns, akkor elhagyjk valamelyik szls rtket, s a kvetkez terjedelmet vizsgljk tovbb. Newman a prbt Student (alias W.S. Gosset) (1927) cikke alapjn dolgozta ki. Statisztikja:

    sxxq k 1=

    k, paramterekkel, ahol k a norml eloszls populcik szma s

    =ji

    iij xxs,

    2.

    2 )(

    ngyzetsszeg, amelynek szabadsgfoka =k(m-1), ahol m a minta elemszma.

    Bonferroni-tesztPronknti tlagok klnbsgnek vizsglatra hasznlhat, a kt csoport elemszma lehet klnbz is. Lnyege, hogy az -hibhoz tartoz t-rtket korriglja a fggetlen sszehasonltsok szmnak megfelelen.

    - 64 -

  • Huzsvai Lszl: SPSS alkalmazsok

    +=ji

    p nnSlitblzatbetL 11)( 2

    Az -hiba a ksrlet egszre igaz, az egyenknti sszehasonltskor /m az elsfaj hiba valsznsge. Ez a teszt is teht a t-eloszlst alkalmazza.

    Tukey-teszt, J.W. Tukey (1953)Studentizlt terjedelem tesztjben a p-elem rszcsoportokat ugyanazzal a kritikus rtkkel hasonltja ssze. Itt a teljes vizsglat elsfaj hibja rgztett, s az egyes sszehasonltsok elsfaj hibja n nvekedsvel cskken, s gy a msodfaj hiba n. A Tukey teszt (1953) alapesetben egyforma minta nagysg csoportok tlagainak klnbsgt tudja tesztelni, s a kvetkez null-hipotzist vizsglja:

    H0: 1==k,.Ezt felbontja a kvetkez hipotzisek metszetre:

    2.. 2)(

    smxxt jiij

    =

    Hij=i-j=0,Ellenhipotzis: Aij: i-j0. Mivel a mintk azonos elemszmak: ni=m, ezrt =k(m-1). Teht a pronknti egyenlsgeket szimultn teszteli. Statisztikja:A Hij hipotzist elfogadja -szinten, ha tij

  • Huzsvai Lszl: SPSS alkalmazsok

    Tukey s tle fggetlenl C.Y.Kramer (1956) javaslata alapjn kiterjesztettk nem egyenl elemszmra. Ez a mdszer a Tukey-Kramer mdostott teszt. A teszt a Newman-Keuls-teszttel kiszmtott legnagyobb klnbsggel egyenl, ezrt is hvjk Tukey's Honestly (szinte, becslet) Significant Difference-nek. Ksbb ltalnostottk tetszleges kontrasztokra is.

    L=q tblzatbelisnp( )

    Dunett (1980a) cikkben szmtgpes szimulcival tbb szerz hasonl eljrst hasonltotta ssze s ezek kzl a Tukey-Kramer prbt tallta a legjobbnak, azaz a klnbz elsfaj hibk mellett a konfidencia-intervallum hosszt a legrvidebbnek.

    H. Scheff (1953) Scheffe-tesztA hagyomnyos tesztek kz tartozik. mr valban a Hg hipotziseket vizsglta. Az egyszer F-prba akkor utastja el a H0-hipotzist, ha ltezik egy a0 vektor, amelynl a konfidencia-intervallum nem tartalmazza a 0-t. Ha k darab sszehasonltand csoportom van akkor k(k-1)/2 sszehasonltst kell vgeznem. A statisztikja:

    ( )

    +=ji

    litblzatbep nnFksL 111 )(

    2

    Ez a teszt teht az F-eloszlst alkalmazza. A teszt tetszleges elemszmok esetn rvnyes, s a paramterek valamennyi kontrasztjnak (lineris kombincijnak) egyidej vizsglatra alkalmas. A kontrasztok szimultn vizsglata legtbbszr a szimultn konfidencia intervallumok felrsval trtnik, s vizsgljuk, hogy azok tartalmazzk-e a nullt vagy nem. Mivel a kontrasztok szma vgtelen, a Scheff ltal kezdemnyezett kiterjeszts igen lnyeges ltalnostst jelent. Ez a mdszer a legltalnosabb, egyedl ennek van meg az a tulajdonsga, hogy ekvivalens a szrsanalzissel. Az olyan vizsglatokat azonban, amelyek megfelelnek a Tukey vagy Dunett-mdszer

    - 66 -

  • Huzsvai Lszl: SPSS alkalmazsok

    eredeti krdsfelvetsnek (egyenl elemszm csoportok kztti klnbsgek vizsglata ill. ezek egy kontrollal val sszehasonltsa a cl) rdemes ezekkel a mdszerekkel elvgezni, mert erejk ilyenkor nagyobb a Scheff-mdszer erejnl. A Scheff-mdszer ereje a Bonferroni-egyenltlensg alapjn kiterjesztett t-prbknl is kisebb mindaddig, mg az elvgzett sszehasonltsok m szma lnyegesen meg nem haladja az elvgezhet sszehasonltsok dimenzijt (Miller, 1966) k fggetlen csoport egyszempontos sszehasonltsakor ez a dimenzi (k-1).A Scheffe-teszt gyakorlati alkalmazshoz nyjt nagy segtsget O BRIEN R. R. 1983 megjelent mve s LOTHAR SACHS 1985.

    Dunnett-tesztA Dunnett-teszt (1955) egy kijellt csoportot (kontroll) hasonlt ssze a tbbivel. Eredetileg egyenl elemszmokra volt rvnyes, de ksbb elkszlt az ltalnostsa egyenltlen elemszmokra is. Lnyegt tekintve pronknti t-tesztet vgez tbbszr, de meg kell adni egy kezd, kontroll csoportot, s ehhez hasonltja a tbbi csoport tlagt. Statisztikja:

    nsdxx poi

    2

    xo= kontrol csoport tlagaStatisztikja megegyezik Tukey statisztikjval, elfogadsi tartomnya viszont nem.

    P(tik

  • Huzsvai Lszl: SPSS alkalmazsok

    Student-Newman-Keuls prbaM.Keuls (1952) Mdostotta a Newman prbt. A prba a studentizlt range eloszlst hasznlja. A mintk elemszmai egyenlk. A statisztikja megegyezik Newmanval, az elsfaj hiba sszehasonltsonknt rgztett, ezrt a teljes vizsglat elsfaj hibja n-nel egytt n.

    ns

    rqw pr ,,=

    A prba teszteli, hogy mely kezels kombincik tartoznak egy homogn csoportba. Kiszmtsa bonyolultabb, ezrt clszer szmtgppel elvgezni. Az eredmny grafikusan brzolhat s knnyen rtelmezhet. Legtbb szmtgpes program elszr az tlagokat sorba rendezi, kicsitl a nagy fel s vzszintes vagy fggleges vonallal jelzi a homogn csoportokat, ahol nincs szignifikns klnbsg a kezels kombincik kztt. Vlemnyem szerint a kezels kombincik sorba tesztelsre a mezgazdasgban is az egyik legjobban hasznlhat prba.

    Duncan tbbszrs rang teszt (1955, 1965)Itt is a homogn csoportok kpzse a cl. Studentizlt terjedelem eloszlst alkalmazza. Napjainkban az egyik legjobbnak tartott tbbszrs sszehasonlt teszt. Itt is a grafikus megjelents nagyban segti a kapott eredmnyek interpretcijt. A mezgazdasgi kutatsban is potencilisan nagy jelentsggel br teszt.

    ltalnos lineris modell (General Linear Model)

    Az ltalnos lineris modell a hagyomnyos variancia-analzis s a lineris regresszi-analzis tvzete. Egyetlen tblzatban jelenik meg a szrs elemzs s regresszi-analzis eredmnye (17. tblzat). Napjainkban a variancia-analzisnek nagyon sokfle technikja ltezik, amik lehetv teszik a feladat sajtossgainak figyelembevtelvel a legalkalmasabb

    - 68 -

  • Huzsvai Lszl: SPSS alkalmazsok

    rtkelsi mdszer kivlasztst. Az elemzs megbzhatsga a hiba (error) meghatrozsnak mdjtl fgg, ami tulajdonkppen az eltrs ngyzetsszeg (SQ) szmtsi technikjnak fggvnye. Az SPSS lehetv teszi a ksrleti elrendezshez h, a felhasznl ltal megalkotott lineris modell megbzhat rtkelst.

    Tests of Between-Subjects Effects

    Dependent Variable: X

    119.248a 3 39.749 4.706 .00620563.279 1 20563.279 2434.723 .000

    119.248 3 39.749 4.706 .006439.184 52 8.446

    21121.710 56558.431 55

    SourceCorrected ModelInterceptFAJTAErrorTotalCorrected Total

    Type IIISum of

    Squares dfMean

    Square F Sig.

    R Squared = .214 (Adjusted R Squared = .168)a.

    17. tblzat

    A 17. tblzat 1-4 oszlopnak rtelmezse logikai sorrendben: Total: az alapadatok ngyzet sszege (21 121), 2x ,

    szabadsgfok (56). A szabadsgfok itt megegyezik az adatok szmval.

    Intercept: az alapadatok sszegnek ngyzete osztva az

    adatok szmval (20 563) ( )nx 2 , szabadsgfok (1) valamint

    tlaga (20 563). Amennyiben az adatok egyltaln nem szrnak (minden adat megegyezik), akkor a fenti kt kifejezs rtke megegyezik. Az Intercept SS rtkt Svb knyveiben korrekcis tnyezknt (C) emlti, mely nem ms, mint a ksrlet ftlagnak ngyzetsszege, 2x

    Corrected Total: egyenl Total Intercept (558), vagyis 2x -( )

    nx 2 , ez tulajdonkppen az alapadatok eltrsngyzet-

    sszege. Svb knyveiben ez jelentette az sszesen sort. Szabadsgfok (55).

    - 69 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Error: ebben a pldban a ngy FAJTA csoporton belli eltrs ngyzetsszege (439) ( )

    i jiij xx

    2

    , szabadsgfok (52), valamint ennek tlaga (8,446), ami gyakorlatilag a csoporton belli variancik tlaga. Svb knyveiben a Hiba, a vletlen hatsa, a meg nem magyarzott hatsok. Minden FAJTA csoportban 14-14 megfigyels van. Ebbl az rtkbl gykt vonva megkapjuk a csoporton belli tlagos szrs nagysgt, a ksrlet hibjt.

    FAJTA: a kezels okozta hats, a ngy fajta tlagnak eltrse a ftlagtl. 2fajtar

    Corrected Model: a lineris modellel becslt s a megfigyelt rtkekre illesztett lineris fggvny jsgt mutatja. Eldnthet, hogy az alkalmazott modell megfelel-e.

    ( ) ==x

    xyiR SS

    SPYYSS

    22

    r-ngyzet rtke Corrected Model SS/Corrected Total SS, (119/558).

    Ha az ltalnos lineris modell alkalmazsa sorn a becslt (predicted values) rtkeket is elmentjk, elvgezhetjk a lineris regresszi-analzist (18. tblzat). A regresszi eredmnye megknnyti a GLM tblzatnak jbli rtelmezst.

    Model Summary

    .462a .214 .199 2.8518Model1

    R R SquareAdjustedR Square

    Std. Errorof the

    Estimate

    Predictors: (Constant), Predicted Value for Xa.

    - 70 -

  • Huzsvai Lszl: SPSS alkalmazsok

    ANOVAb

    119.248 1 119.248 14.662 .000a

    439.184 54 8.133558.431 55

    RegressionResidualTotal

    Model1

    Sum ofSquares df

    MeanSquare F Sig.

    Predictors: (Constant), Predicted Value for Xa.

    Dependent Variable: Xb.

    18. tblzat: A lineris regresszi-analzis eredmnye

    A lineris fggvny illesztse sorn kapott eltrs ngyzetsszegek teljesen megegyeznek a GLM-vel kapott rtkekkel. A lineris regresszi-analzis tblzatnak (ANOVA) rtelmezse: Total: az alapadatok eltrs ngyzetsszege,

    szabadsgfoka. Ez megegyezik a GLM Corrected Total

    rtkvel. ( ) = ny

    ySS iiy2

    2

    Regression: a lineris modellel becslt s a megfigyelt rtkekre illesztett lineris fggvny jsgt mutatja. Eldnthet, hogy az alkalmazott modell megfelel-e.

    ( ) ==x

    xyiR SS

    SPYYSS

    22

    Residual: maradkok ngyzetsszege, szabadsgfok, ngyzetsszeg tlagok. A lineris egyenessel meg nem magyarzott hats.

    Az r-ngyzet rtke 0,214. Ez a Regression SS/Total SS hnyadosa (119/558).

    A GLM alkalmazhatsgi feltteli megegyeznek a variancia-analzis alkalmazhatsgi feltteleivel:

    Fggetlen megfigyelsek (a maradknak kell fggetlennek lennie a fgg vltoz megfigyelt s becslt rtktl. Ezt brzolssal s regresszi-analzissel tudjuk leellenrizni.)

    - 71 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Normlis eloszls sokasgok (a maradknak kell nulla vrhat rtk normleloszlst mutatni. Ezt hisztogrammal s Kolmogorov-Smirnov teszttel vizsglhatjuk.)

    Azonos szrsok (a maradkok varianciinak meg kell egyeznie minden kezels kombinciban, azaz cellban. Ezt Levene-teszttel ellenrizhetjk.)

    Egyvltozs variancia-analzis (Univariate)Segtsgvel egy tnyez hatst lehet vizsglni a fgg vltoz mennyisgi alakulsra. A tnyez, faktor valamilyen csoportkpz ismrvvel rendelkezik, a fgg vltoz pedig legtbbszr skla tpus adat. Egyszerre tbb fgg vltozt is kijellhetnk az analzis szmra. A variancia-analzis sorn ngyflekppen tudjuk kiszmtani az eltrs ngyzetsszegeket (SS). Rmai szmokkal jellm a ngy tpust (I-IV.). A programban kezdrtkknt a III. jelenik meg, ezt hasznlhatjuk az egy vagy tbbtnyezs, kiegyenslyozott (balanced) vagy kiegyenslyozatlan (unbalanced), teljes, azaz nincs hinyz parcella adat ksrletek kirtkelsekor (ez a leggyakoribb). Ez a mdszer megegyezik a szles krben ismert Yates-fle mdszerrel. A Yates mdszer lnyegben az tlagok slyozott eltrsngyzet technikjt hasznlja a ngyzetsszegek szmtsakor. Ez a mdszer jl ismert a mezgazdasgi kutatsban, mivel Svb knyveiben a variancia-analzis ismertetsekor ezt a technikt mutatja be.Type I: ezt kell hasznlni, ha a kezelsekben nem egyezik meg a megfigyelsek szma, hinyz parcellaadat van.Type II: kiegyenslyozott (balanced) egymsba gyazott (nested) ksrleteknl kell alkalmazni.Type IV: kiegyenslyozott vagy kiegyenslyozatlan ksrleteknl, ha hinyz adat van.

    - 72 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Amennyiben az analzis az tlagok kztti egyenlsget nem igazolja, szksges az tlagok kztti klnbsgek kimutatsa. A variancia-analzist kiegszt kzprtk sszehasonlt teszteknek ktfle tpusa ltezik:

    1. elzetes, n. a priori kontrasztok s2. az analzis utn elvgezhet, n. post hoc analzisek

    A kontrasztokat teht a ksrleti adatok elemzse eltt kell ellltani, s gy elvgezni az elemzst.Az egyszempontos szrsanalzis F-prbja akkor ad -szinten szignifikns eredmnyt, ha ezen a szinten ltezik szignifikns kontraszt a csoportok kztt.Plda: vizsgljuk meg, hogy hrom talajmvelsi vltozatban hogyan alakul a kukorica termse. Az egytnyezs variancia-analzis alkalmazshoz kattintsunk az ANALYZE menpont COMPARE MEANS almenjben az ONE-WAY ANOVA parancsra (20. bra).

    20. bra: Egytnyezs variancia-analzis

    A statisztikai szmts elvgzshez a vizsglt fgg vltozt helyezzk a DEPENDENT LIST ablakba, mg FACTOR-nt definiljuk a talajmvelst, hiszen a termsnek a talajmvelsi vltozatok kztti klnbsgt prbljuk igazolni. Amennyiben a variancia-

    - 73 -

  • Huzsvai Lszl: SPSS alkalmazsok

    analzis a talajmvels szignifikns hatst igazolja, kvncsiak lesznk, hogy a hrom talajmvelsi vltozat kzl vajon melyik kztt van lnyeges (szignifikns) klnbsg. A variancia-analzis utn elvgzend kzprtk sszehasonlt tesztek helyes alkalmazshoz azonban tudni kell, hogy a csoporton belli variancia vajon megegyezik-e. Ezeket a teszteket a ksbbi fejezetekben mutatjuk be.

    21. bra: A vltozk s a tnyez megadsa

    19. tblzat: A variancia-analzis eredmnye

    ANOVA

    terms t/ha

    92.524 2 46.262 10.087 .000646.657 141 4.586739.181 143

    Between GroupsWithin GroupsTotal

    Sum ofSquares df Mean Square F Sig.

    A fenti tblzat a szrs-elemzs eredmnyt mutatja. 5%-os elsfaj hibt vlasztva, megllapthat, hogy a talajmvelsi vltozatokban a kukoricatermse szignifiknsan klnbzik. Hangslyozzuk, hogy az F-prba eredmnye csak akkor fogadhat el, ha a hiba norml eloszls s a csoportokon belli variancik megegyeznek.

    A modell rvnyessgnek vizsglata

    Normalits vizsglat

    - 74 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A variancia-analzis alkalmazhatsgnak felttele, hogy a fgg vltoz normlis eloszls legyen, pontosabban a klnbz kezelsek mintinak

    22. bra. Az adatbzis megosztsa

    (lnyegben azonban a hibnak, vagy eltrsnek) kell normleloszlsnak lenni. A kezelscsoportok elklntett elemzshez meg kell osztani az adatbzist a DATA, majd a SPLIT FILE kivlasztsa utn a megjelen ablakban vlasszuk a COMPARE GROUPS rdigombot, s a GROUPS BASED ON: ablakba helyezzk a talajmvels vltozt. Az OK gomb megnyomsa utn trjnk vissza az adatbzis ablakhoz.

    Normalits vizsglatot az SPSS-ben tbbflekppen is vgezhetnk, pl. ANALYZE/NONPARAMETRIC TEST/1-SAMPLE K-S a megjelen prbeszdablakban (23. bra) adjuk meg a vizsgland vltozt, s jelljk be a normleloszlst (alapesetben ez van megjellve). A nullhipotzisnk ennek megfelelen az lesz, hogy a vizsglt vltoz eloszlsa nem klnbzik a normlis eloszlstl. Vlasszuk a szignifikancia szintet 5%-osra, s vgezzk el az analzist az OK gomb megnyomsval. Az eredmny a tblzatban lthat.

    - 75 -

  • Huzsvai Lszl: SPSS alkalmazsok

    23. bra. Az egymints Kolmogorov-Smirnov teszt

    20. tblzat: A vltoz eloszlsnak vizsglata Kolmogorov-Smirnov prbval

    One-Sample Kolmogorov-Smirnov Test

    4811.506732.060577

    .127

    .095-.127.882.418

    4810.309882.068890

    .227

    .148-.2271.574.014

    489.56033

    2.287441.263.136

    -.2631.821.003

    NMeanStd. Deviation

    Normal Parametersa,b

    AbsolutePositiveNegative

    Most ExtremeDifferences

    Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)N

    MeanStd. Deviation

    Normal Parametersa,b

    AbsolutePositiveNegative

    Most ExtremeDifferences

    Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)N

    MeanStd. Deviation

    Normal Parametersa,b

    AbsolutePositiveNegative

    Most ExtremeDifferences

    Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)

    Talajmvelsszi sznts

    tavaszi sznts

    trcss

    terms t/ha

    Test distribution is Normal.a.

    Calculated from data.b.

    Az ASYMP. SIG. (2-TAILED) sort tanulmnyozva elmondhat, hogy az szi szntsos parcellk kukoricatermse normleloszls (p>0,05), azonban a msik kt talajmvelsi vltozat (tavaszi

    - 76 -

  • Huzsvai Lszl: SPSS alkalmazsok

    sznts, trcss) nem normleloszls, mert p0,05) (21. tblzat). Ez azt jelenti, hogy majd a kezelstlagok sszehasonltsa sorn nyugodtan alkalmazhatjuk az egyenl variancikat felttelez teszteket. Abban az esetben, ha a Levene-teszt a variancik klnbzsgt igazolja (22. tblzat), nem hasznlhatjuk a Fischer-fle tesztet. Ilyenkor robosztusabb prbt kell vlasztani, pl. Brown-Forsythe vagy Welch prbt (WELCH, 1938).

    21. tblzat: A talajmvelsi vltozatokon belli variancik egyenlsgnek ellenrzse

    - 77 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Test of Homogeneity of Variances

    terms t/ha

    1.096 2 141 .337

    LeveneStatistic df1 df2 Sig.

    22. tblzat: A talajmvelsi vltozatokon belli variancik egyenlsgnek ellenrzse

    Test of Homogeneity of Variances

    terms t/ha

    5,144 2 141 ,007

    LeveneStatistic df1 df2 Sig.

    A statisztika panelen klnbz kiegszt szmtsokat krhetnk. Ler statisztika (Descriptive): esetek szma, tlag, szrs, az tlag hibja, minimum, maximum, 95%-os konfidencia intervallum mindenegyes csoportra. Fix s vletlen hatsok (Fixed and random effects):

    Brown-Forsythe prbaEzt a prbt BROWN-FORSYTHE 1974-ben kzlte elszr. A szrsok klnbzsge esetn meg kell vizsglni, mirt klnbzik a szrs, milyen szakmai magyarzatot lehet r adni. Ha a szrsok klnbzsgnek semmilyen logikai vagy szakmai okt nem tudjuk megadni, nagy valsznsggel a szrsok vletlenl vagy valamilyen ksrleti hiba miatt klnbznek.A Welch s Brown-Forsythe-prba mezgazdasgi alkalmazsval mg nem tallkoztunk, ezrt a tbb ves kutatmunka tapasztalatai alapjn itt ragadjuk meg az alkalmat, hogy a hasznlatukhoz nhny tancsot adjunk. Ha a csoporton belli szrs ngyzetek (variancik) nem egyformk nyugodtan hasznlhatjuk a kezelstlagok egyenlsgnek tesztelsre brmelyiket a kett kzl. A legjobb, ha mindkettt kiprbljuk s sszehasonltjuk az eredmnyeket.

    - 78 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Vlasszuk ki az OPTIONS prbeszdablakban (24. bra) a Brown-Forsythe s Welch prbkat s futtassuk le a programot jbl. A kapott eredmnyeket lentebb lthatjuk.

    23. tblzat: A kezels kzprtkek sszehasonltsa robosztus tesztekkel

    Robust Tests of Equality of Means

    terms t/ha

    3,238 2 83,571 ,0443,725 2 49,027 ,031

    WelchBrown-Forsythe

    Statistica df1 df2 Sig.

    Asymptotically F distributed.a.

    Ebben az esetben a kt teszt ugyanazt az eredmnyt adta, ha klnbsg lett volna a kt eredmny kztt, tovbb kell folytatni az rtkelst. Ilyenkor szlssges esetben a Welch-prba szignifikns klnbsget mutathat a kezels tlagok kztt, mg a Brown-Forsythe-prba nem. Mi lehet ennek az oka? Ez akkor kvetkezik be, ha a csoportok variancija nagyon nagymrtkben klnbzik egymstl. Ilyenkor az elklntett (separate) variancia tesztek a szabadsgfok cskkentsvel vlaszolnak, s ezzel rontjk a teszt eredmnyt. A variancik nagyon nagy mrtk klnbzsgt legtbbszr a csoportokon belli kiugr rtkek okozzk. A kiugr rtkek zavar hatst tbbflekppen szrhetjk ki. Az egyik hatsos eszkz a csonktott (trimmed) teszt, amikor mindenegyes csoportbl elhagyjuk a legnagyobb s legkisebb rtk 15%-t. A csonkols mrtkt szakmai megfontolsok miatt tetszlegesen megvltoztathatjuk. A csonkols utn megismtelt Brown-Forsythe prbban a szabadsgfokok szma nni fog s a teszt eredmnye javul (24. tblzat). A fenti felttelek esetn a szrs hagyomnyos meghatrozsa helyett a ROBUST SD s WINSORIZED SD kiszmtsa jobb becslst ad a csoporton belli szrs nagysgra. Ezek a prbk kevsb rzkenyek a kiugr rtkekre. A klnbz mdon kiszmtott szrsok sszehasonltsa kzvetett mdon, a csoporton belli variancik egyenlsgre vagy egyenltlensgre is rmutat. Szntfldn tszm

    - 79 -

  • Huzsvai Lszl: SPSS alkalmazsok

    ksrleteknl, ahol a variancik egyezsge nem vrhat, a Welch vagy Brown-Forsythe- ltal kidolgozott variancia-analzist kell alkalmazni.

    24. tblzat: A kezels kzprtkek sszehasonltsa robosztus tesztekkel a csonkols utn

    Robust Tests of Equality of Means

    terms t/ha

    9,905 2 93,797 ,00010,087 2 139,613 ,000

    WelchBrown-Forsythe

    Statistica df1 df2 Sig.

    Asymptotically F distributed.a.

    Kiugr rtkek vizsglataAz elz fejezetben lttuk, hogy a kiugr rtkek milyen nagymrtkben tudjk megzavarni a variancia-analzis eredmnyt. Ezrt a statisztikai elemzsek els s egyik legfontosabb lpse a kiugr rtkek ellenrzse. Az SPSS ennek ellenrzsre is knl lehetsget.

    Az elemzs els lpseknt nzzk meg, hogy a kukoricaterms adataiban tallunk-e kiugr rtket. Van-e vajon adatrgztsi, gpelsi hiba? A kiugr rtkek ellenrzse az ANALYZE / DESCIPTRIVE STATISTICS blokkjban az EXPLORE parancs szolgl.

    - 80 -

  • Huzsvai Lszl: SPSS alkalmazsok

    25. bra. Az kiugr rtkek vizsglata

    A DEPENDENT LIST mezbe helyezzk a vizsglni kvnt vltozt (vltozkat). Mivel mind a hrom talajmvelsre ellenrizni kvnjuk, hogy a kukoricaterms adatok tartalmaznak-e kiugr rtket, a FACTOR LIST mezbe helyezzk a terms vltozt. Ezzel rjk el, hogy a program a kiugr rtkeket talajmvelsi vltozatonknt kln-kln s nem sszevont llomnyon ellenrizze. A STATISTICS nyomgombra kattintva a megjelen beszdpanelban vlasszuk ki az OUTLIERS lehetsget (26. bra).

    26. bra. Az kiugr rtkek vizsglata

    A belltsok elvgzse utn futtassuk le a programot. A 25.tblzat talajmvelsi vltozatonknt az t legnagyobb s legkisebb rtket tartalmazza. A kiugr rtkek ugyanis biztos, hogy itt keresendk, hiszen azok vagy sokkal nagyobbak, vagy sokkal kisebbek, mint a tbbi rtk a mintban. A tblzatbl jl ltszik, hogy az szi szntsos adatokban a 9. s 10. adat kiugr rtk, adatrgztsi hiba miatt a tizedesvessz eggyel jobbra csszott. A msik kt talajmvelsnl nem tallunk kiugr eseteket. Hasonlan vgezhetjk el ms vltoz esetben is a vizsglatot.

    A kiugr rtkek ellenrzsnek egy msik lehetsges mdja az adatok grafikus megjelentse. Az EXPLORE prbeszdpanel

    - 81 -27. bra. A kiugr esetek

    grafikus brzolsa

  • Huzsvai Lszl: SPSS alkalmazsok

    ablakbl vlasszuk a PLOTS lehetsget (25. bra). A BOXPLOTS panelrszben jelljk meg a FACTOR LEVELS TOGETHER lehetsget, majd a CONTINUES gombra kattintva menjnk vissza a fablakba, s ott az OK gomb megnyomsval hagyjuk jv a statisztika szmtst. Ezt a vizsglatot mindhrom talajmvelsre futtatva a 28. brat kapjuk. A megjelen bra legals s legfels vonala a klnbz talajmvelsekben a kiugr rtkeket nem szmtva a mrt legnagyobb s legkisebb rtkeket jellik. Az brn e kt vonal alatt s fltt jelennek meg a kiugr rtkek (9. 10. adat szi sznts) pontok formjban brzolva1.

    1 A kiugr rtkek ellenrzsre az SPSS mg szmos lehetsget knl, ezek tovbbi bemutatsra most nem kerl sor.

    - 82 -

  • Huzsvai Lszl: SPSS alkalmazsok

    25. tblzat: A kiugr rtket ellenrz tblzatExtreme Values

    9 114,4110 113,5132 14,39535 14,39236 14,286

    1 7,9062 7,957

    13 8,0104 8,043

    38 8,24884 13,11883 12,85978 12,74682 12,67280 12,56988 6,71587 6,86585 6,92949 7,07862 7,099

    118 12,070115 11,966117 11,936129 11,859119 11,801135 5,355134 5,421136 5,652122 5,697124 6,059

    123451234512345123451234512345

    Highest

    Lowest

    Highest

    Lowest

    Highest

    Lowest

    Talajmvelsszi sznts

    tavaszi sznts

    trcss

    terms t/haCase Number Value

    484848N =

    Talajmvels

    trcsstavaszi szntsszi sznts

    term

    s t/

    ha

    140

    120

    100

    80

    60

    40

    20

    0

    -20

    109

    28. bra. A kiugr rtkek grafikus ellenrzse (box-plot bra)

    - 83 -

  • Huzsvai Lszl: SPSS alkalmazsok

    Egyvltozs lineris modell (GLM Univariate

    Lehetsgek (Options)

    - 84 -

  • Huzsvai Lszl: SPSS alkalmazsok

    A lineris modell validlshoz kapunk segtsget a lehetsgek panelen. A legfontosabb lehetsgek:

    Ler statisztika (descriptive statistics) A kezels nagysgnak becslse (estimates of effect

    size): ez a parcilis eta meghatrozst jelenti. Megmutatja, hogy a fggetlen vltoz (ami gyakran nominlis tpus vltoz) hny szzalkban befolysolja a fgg vltoz variancijt. A szmts menete: a kezels SS (eltrs ngyzetsszeg) osztva az sszes SS-vel. A mutat rtke 0-1.00 kztt lehet. A nulla fggetlensget az 1.00 determinisztikus kapcsolatot jelent. A kztes rtkek a sztochasztikus kapcsolat erssgt becslik. Minl kzelebb van egyhez, annl ersebb a kt vltoz kztti sszefggs. Ennek a mutatnak termszetesen

    - 85 -

  • Huzsvai Lszl: SPSS alkalmazsok

    nincs eljele, gy a kapcsolat irnyt nem lehet vele jellemezni.

    Homogenits teszt: a kezelskombincik csoporton belli variancijt teszteli. A variancia-analzis egyik alkalmazhatsgi felttelt tesztelhetjk vele. A H0: a variancik egyformk.

    Maradkok brzolsa (residual plot): a standardizlt maradkokat brzolja a megfigyelt, ill. becslt rtkek fggvnyben.

    Tbbvltozs variancia-analzis, (Multivariate)Tbb kvantitatv tulajdonsg egyttes figyelembe vtele alapjn kvnjuk kimutatni a kezelsek hatsa kztti klnbsgeket. Kt kezels kztti klnbsg szignifikancijnak vizsglata, D2 ltalnostott tvolsg tesztelse F-prbval. A DA a MANOVA hatresete. Hotelling T2.

    Ismtelt mrsi modellek (Repeated Measures)

    Variancia komponensek (Variance Components)

    - 86 -

  • Huzsvai Lszl: SPSS alkalmazsok

    KSRLETEK TERVEZSE S RTKELSE LTALNOS LINERIS MODELLEL

    Az albbi fejezetekben a mezgazdasgi, fldmvelsi, nvnytermesztsi, nemestsi, fajta sszehasonlt, stb. ksrletek laboratriumi s klnbz szntfldi kisparcells elrendezseinek rtkelst mutatom be a teljessg ignye nlkl. Az ismertetsre kerl klasszikus elrendezsek tanulmnyozsa s megrtse segtsget nyjt a jvbeli ksrletek megtervezshez s kirtkelshez. A fejezetekben az elrendezs rvid ismertetse utn megadom a ksrlet vzrajzt, a matematikai modell lerst s a GLM-tblzat szerkezett valamint a kirtkelshez szksges parancsokat, amit a parancsszerkeszt (syntax editor) ablakban lehet futtatni. Az elrendezshez h kirtkels legfontosabb parancsa a DESIGN, ezrt ezt a GLM-tblzat szerkezetben is megadom. Ezt kveti a mintaplda GLM-tblzata, melyben a tnyezk, ngyzetsszegek, szabadsgfokok, tlagos ngyzetsszegek, F-prbk eredmnyei, valamint a szignifikancia szintek lthatk.

    A variancia-analzis modellben a fgg vltozkat magyarzzuk fggetlen vltoz(k) segtsgvel. A magyarzat a fgg vltoz teljes heterogenitsnak2 kt rszre bontst jelenti. A teljes heterogenits egyik rsze az, amelynek okai a fggetlen vltozk, a msik heterogenits-rsz pedig az, amelynek okait az egyb, ltalunk nem vizsglt tnyezk tartalmazzk. Ez utbbit sokszor a vletlen hatsaknt is emlegetik. A heterogenits mrsre tbbfle mrszm szolgl:

    (1) range (terjedelem); a legnagyobb s legkisebb rtk kztti tvolsg

    (2) tlagos eltrs;

    =

    =

    N

    ii xxN 1

    1 ;

    (3) szrs; ( )

    ==

    N

    ii xxN 1

    21 ;

    2 A vltoz heterogenitsa azt jelenti, hogy az adott vltoz nem konstans.

    - 87 -

  • Huzsvai Lszl: SPSS alkalmazsok

    (4) variancia- vagy szrsngyzet; ( )

    =

    =

    N

    ii xxN 1

    22 1 .

    Ebbl ltszik, hogy a fgg vltoznak magas (intervallum- vagy arnyskla) mrsi szintnek kell lenni. Attl fggen, hogy a fggetlen vltozk alacsony vagy magas mrsi szintek, eltr magyarz modelleket kell felpteni. Ha ugyanis a fggetlen vltozink nominlis vagy ordinlis mrsi szintek, akkor variancia-analzissell kereshetjk a magyarzatot a fgg vltoz viselkedsre. Ha a fggetlen vltozk is magas mrsi szintek, akkor regresszi-analzist alkalmazhatunk. (Ha a fgg vltoz alacsony mrsi szint, a magyarzatra szolgl vltozk pedig magas mrsi szintek, akkor diszkriminancia-analzist hasznlhatunk.)A variancia-analzis sorn kettnl tbb sokasg kzprtkeinek minta alapjn trtn sszehasonltsa trtnik. Ezrt nevezik a ktmints t-prba ltalnostsnak. A variancia-analzis modellek olyan rugalmas statisztikai eszkzk, amelyek alkalmasak valamely kvantitatv (numerikus vagy intervallum sklj) vltoznak (fgg vltoznak) egy vagy tbb nem felttlenl kvantitatv vltozval (fggetlen vltozk) val kapcsolata elemzsre. Arra vagyunk kvncsiak, hogy van-e hatsa a fggetlen vltozknak a fgg vltozra, s a hats klnbzik-e vagy egyforma? A hats, kapcsolat fggvnyszer lersa azonban nem clunk, mg akkor sem, ha a fggetlen vltozk kvantitatvak. A regresszi-analzistl kt szempont klnbzteti meg a variancia-analzist:

    A vizsglt fggetlen vltozk kvalitatvak is lehetnek (pl. a vizsglt szemly neme, lakhelye stb.). Ebben az esetben ugyanis regresszi-analzis nem alkalmazhatunk.

    Mg ha a fgg vltozk kvantitatvak is, nem cl a fggetlen vltozval val kapcsolat termszetnek feltrsa. A szrsanalzist tekinthetjk a regresszi-analzis vizsglat megelz vizsglatnak, ha ugyanis pozitv sszefggst kapunk a fgg s fggetlen vltoz

    - 88 -

  • Huzsvai Lszl: SPSS alkalmazsok

    kapcsolatra, akkor van rtelme vizsglni az sszefggs jellegt.

    AlapfogalmakNzzk t azokat az alapfogalmakat, amelyeket a variancia-analzis sorn hasznlunk.

    a)