Download - spss segédkonyv
-
Huzsvai Lszl
BIOMETRIAI MDSZEREK AZ SPSS-BENSPSS ALKALMAZSOK
Debreceni Egyetem, Mezgazdasgtudomnyi KarDEBRECEN2004-2011
-
Huzsvai Lszl: SPSS alkalmazsok
Ez a munka kziratknt kezelend. A tartalma lefedi a mezgazdasgi s gazdlkodstudomnyi doktori iskolk Statisztika s szmtgpes adatfeldolgozs, valamint Statisztika, kutatsmdszertan cm tantrgyak anyagt. Tbb fejezete azonban mg kidolgozs alatt ll.
Minden jog fenntartva. Jelen knyvet vagy annak rszleteit a Kiad engedlye nlkl brmilyen formban vagy eszkzzel reproduklni s kzlni tilos.
Dr. Huzsvai Lszl
- 2 -
-
Huzsvai Lszl: SPSS alkalmazsok
BEVEZETSAz SPSS program magba foglalja a legmodernebb statisztika eljrsokat az adatbzis kezelstl, a ler statisztikn keresztl a legbonyolultabb tbbvltozs matematikai statisztikai eljrsokig. A programcsomag nagy elnye, hogy nem csak elre elksztett statisztikai teszteket hasznlhatunk, hanem sajt magunk is kszthetnk egyszer modelleket, s ezek statisztikai elemzst is el tudjuk vgezni. Ennek elnye, hogy sok elre beptett statisztikai teszt igen szigor alkalmazsi feltteleket kvn meg, amik a talaj nvny lgkr rendszerben nem teljeslnek, de az ltalunk, a vizsglt jelensg sajtossgaihoz igaztott eljrsok mr sokkal megbzhatbb eredmnyeket szolgltatnak.Az adatok az albbi tpusba tartozhatnak:
nominlis ordinlis intervallum skla
Az alacsony mrsi szint adatok:a) nominlis (kzprtke a mdusz, a leggyakrabban
elfordul adat)b) ordinlis (kzprtke a medin, a kzpen elhelyezked
adat)Magas mrsi szint adatok:
a) intervallumb) skla tpus adatok (kzprtke az tlag)
- 3 -
-
Huzsvai Lszl: SPSS alkalmazsok
Fgg vltoz (y)Alacsony Magas
Fgg
etle
n v
ltoz
(x) Alacsony Kontingencia
tblzat, Chi-ngyzet
Kt mints t-prba, szrselemzs, GLM
Magas Diszkriminancia-analzis
Korrelci-, regresszi analzis (tbbvltozs esetekben: Faktoranalzis, stb
1. tblzat: Kt vltoz kapcsolatnak elemzse
Magas mrsi szint adatokbl lehet ellltani alacsony mrsi szint adatot, fordtva nem.
- 4 -
-
Huzsvai Lszl: SPSS alkalmazsok
FILE MEN
Read Text Data:
text tpus adatok beolvassa, pl. automata meteorolgia lloms adatait. *.dat kiterjesztssel. Fixed widht, a fels sor tartalmazza a vltozk neveit. A vltozk rgi neveinek jakat adhatunk. Mentsk el a fjl formtumt ksbbi munkk szmra *.tpf kiterjesztssel.
Apply Data Dictionary:
Az SPSS-be mr beolvasott adatok oszlop, cmke, stb. kiegszt adatait mr meglv adatbzisbl is beolvashatjuk a fenti paranccsal, *.sav kiterjeszts fjlt vlasztva.
Display Data Info:
Lemezen trolt adatbzis tulajdonsgait, vltozit, cmkit listzza ki.rdemes nha *.por, portable formtumba menteni az adatokat, mert ezt mg a DOS-os programok is el tudjk olvasni, mivel majdnem szveg fjlknt menti. Excelbl 4.0-s munkalapknt kell menteni az adatokat.
- 5 -
-
Huzsvai Lszl: SPSS alkalmazsok
SZERKESZTS (EDIT) MEN
Options
Charts: A grafikonok formtumt, kinzett lehet megadni. A mintt (template) elre szerkesztett formtumban, fjlban megrizve is megadhatjuk. Figyeljnk arra, hogy a megadott knyvtrban ott legyen a *.sct kiterjeszts fjl. Ha trljk, a program indtsa utn hibajelzst kapunk. Bettpusokat, szneket, vonalakat, mintzatot hatrozhatunk meg. A grafikon kerett, rcsozatt llthatjuk be interaktv mdon.Alapbelltsok: Edit Options General, Output Labels, Data
- 6 -
-
Huzsvai Lszl: SPSS alkalmazsok
NZET (VIEW) MEN
Status Bar
A tblzat aljn tallhat informcis svot jelenthetjk meg vagy rejthetjk el.
Toolbars
A mensor al klnbz ikonokat rakhatunk ki, amelyek gy gyors billentyknt szolglnak. A leggyakrabban hasznlt eljrsokat rdemes itt megjelenteni. (Show Toolbars). A bellts paranccsal (Customize) elvgezhetjk a szksges belltsokat. Az Edit Tool billentyvel mg az ikonokat is trajzolhatjuk kvnsg szerint. Bal egr gombbal fogjuk meg az ikonokat s vigyk a kvnt helyre. Az ikonok trlst is hasonl mdon vgezhetjk, egyszeren vontassuk ki az ikon terletrl.
Fonts
Meghatrozhatjuk a bet tpust (Arial, Courier, stb., stlust (norml, dlt, flkvr, flkvr dlt), mrett (8-72). Kivlaszthatjuk az alkalmazott rsrendszert (Kzp-eurpai, Nyugati, Grg, stb.).
Grid Lines
Az adatbzis ablakban a rcsozatot tudjuk ki, illetve bekapcsolni.
- 7 -
-
Huzsvai Lszl: SPSS alkalmazsok
ADATOK (DATA) MEN
Define Variable
Az aktv adat editor ablakban a kivlasztott vltoz ler fejlc adatait lehet megvltoztatni, vagy j adatbzis vltozit lehet definilni.
Templates
Ha tbb vltoznak egyszerre akarjuk belltani a tulajdonsgait, akkor ezt a parancsot kell hasznlni. Elzetesen az aktv editor ablakban a mdostand vltozkat lenyomott egrbillentyvel ki kell jellni
Insert Variable
j vltoz (oszlop) beszrst vgzi az aktv vltoz utn.
Insert Case
Egy j eset (sor) beszrst vgzi az aktv eset utn.
Goto Case
Megkeresi az adott esetet. Ha nem az adat ablak az aktv, akkor ennek a parancsnak hatsra azz vlik. A keres dobozt a kvnt eset megkeresse utn a Close gomb megnyomsval lehet lezrni.
Sort Cases
Az adatmtrix sorai cskken vagy nvekv sorrendbe rendezhetk. A parancsdobozban meghatrozhatjuk, hogy melyik legyen az elsdleges, msodlagos, stb. kulcs.
- 8 -
-
Huzsvai Lszl: SPSS alkalmazsok
Transpose
Az adatmtrix sorainak s oszlopainak felcserlse, ezzel az esetek s vltozk szerepei is felcserldnek. A rgi vltozk nevei a legels j vltoz esetei lesznek, a tbbi j vltoz neve case_1, case_2, stb. lesznek.
Restructure
Itt az adatbzisok szerkezett tudjuk megvltoztatni. Ezt tstrukturlsnak is nevezik. Vegyk az albbi egyszer adatbzist, s vltoztassuk meg a szerkezett. A mrt nedvessgi rtkek rtegenknt kerljenek j vltozkba.
ntzs Talajmvels Rteg Nedvessg1,00 1,00 1,00 14,001,00 1,00 2,00 15,001,00 1,00 3,00 16,001,00 2,00 1,00 17,001,00 2,00 2,00 18,001,00 2,00 3,00 19,002,00 1,00 1,00 20,002,00 1,00 2,00 21,002,00 1,00 3,00 22,002,00 2,00 1,00 23,002,00 2,00 2,00 24,002,00 2,00 3,00 25,00
Data, Restructure parancs utn az albbi prbeszdpanelt kapjuk. Itt kivlaszthatjuk, hogy a vltozkbl csinljuk eseteket vagy fordtva, a kivlasztott esetekbl legyenek j vltozk. A harmadik esetben az adatbzist transzponljuk.
- 9 -
-
Huzsvai Lszl: SPSS alkalmazsok
A Tovbb billenty utn meg kell adni az j adatbzis szerkezett. Szerintem, ez a prbeszdablakokban kiss nehzkes, sokkal egyszerbb programbl megadni. A baloldali ablakban lthatk a jelenlegi adatbzis vltozi (Variables in the Current File). Azonost vltozknak adjuk meg az ntzs s talajmvels vltozkat. Ezek kln sorokban fognak megjelenni az j adatbzisban. Index vltoznak jelljk ki a rteg vltozt. Ez az adatbzis oszlopaiban fog megjelenni j vltozknt. Mivel hrom rteg van a nedvessg hrom j vltozban fog megjelenni.
- 10 -
-
Huzsvai Lszl: SPSS alkalmazsok
ntzs Talajmvels Nedvessg_1 Nedvessg_2 Nedvessg_31,00 1,00 14,00 15,00 16,001,00 2,00 17,00 18,00 19,002,00 1,00 20,00 21,00 22,002,00 2,00 23,00 24,00 25,00
Merge Files
Fjlok bvtse, sszekapcsolsa. j megfigyelsekkel (esetekkel) vagy j vltozkkal bvthetjk az adatbzist. Az esetek bvtsvel jabb megfigyelseket csatolhatunk az adatainkhoz. j vltozkkal trtn bvtskor tbb vlasztsi lehetsgnk is van, el tudjuk lltani, pl. kt fjl kombincijt
- 11 -
-
Huzsvai Lszl: SPSS alkalmazsok
egy kulcs vltoz felhasznlsval. Legyen a terms.sav fjlnak hrom vltozja: v, npk, terms. sszesen 84 megfigyelt termseredmnynk van, t-t 1990-tl 2003-ig. Legyen a csapadk.sav fjlnak kt vltozja: v s csapadk. sszesen 14 megfigyelsnk (rekord) van, 1990-tl 2003-ig. Ki szeretnnk bvteni a terms.sav fjlunkat a csapadk rtkekkel, hogy minden megfigyelshez a megfelel csapadkrtk tartozzon. Nyissuk meg a terms.sav fjlt, s rendezzk nvekv sorrendbe az vek szerint. Vlasszuk az Add Variables parancsot, a fjl megnyits prbeszdpanelbl vlasszuk ki a csapadk.sav fjlt. j prbeszdpanelt kapunk, amiben a kt fjl informcii lthatk. Vlasszuk a Match cases on key variables in sorted files lehetsget, s a rdigombok kzl External file is keyed table. A kls adatbzis lesz a kulcsmez tbla, ez tartalmazza a kulcsmezt. A kulcsmez csak egyszer fordulhat el a tblban. Az Excluded Variables: mezben jelljk ki az vvltozt, s hzzuk a Key Variables: mezbe. Az OK gomb lenyomsa utn figyelmeztetst kapunk: ha nincsenek a fjlok a kulcsmez szerint sorba rendezve, rossz eredmnyt kapunk. Ez a lehetsg nagyon jl hasznlhat a logikailag sszetartoz klnbz tblk idszakos sszekapcsolsra, s elemzsi feladatok elvgzsre. Ez nem ms, mint az egy a tbbhz kapcsolat megteremtse egy relcis adatbzisban. Ennek kt felttele van, hogy mindkt fjlban legyen azonos kulcsmez, ami alapjn ssze lehet kapcsolni a kt adatbzist, s mindkt fjl a kulcsmez szerint sorba legyen rendezve.
Aggregate Data
Break Variables: az a vltoz, ami szerint az sszegzs ill. statisztika kszljn. Aggregate Variables: vltoz, amit sszegezni szeretnnk. Create new data file: ezt vlasztva egy j aggr.sav kiterjeszts fjl kszl az aggreglt adatokkal.
- 12 -
-
Huzsvai Lszl: SPSS alkalmazsok
Orthogonal Design
GenerateTbbtnyezs ksrletek szmra linerisan fggetlen kezelskombinci tervet kszthetnk vletlen szm genertor segtsgvel. A tnyez nevnek (Factor Name) s cmkjnek (Factor Label) megadsa utn az Add billentyvel felvesszk a tnyezk ablakba. Az egrrel kivlasztva a tnyezt definilni kell a kezelsszintek szmt (Define Values), s el is lehet nevezni, pl. mtrgybl 13, nem trgyzott, 30 kg nitrogn, 60 kg nitrogn, stb.
Mtrgyzs ntzs Status KrtyaN 60 nem ntztt Design 1N 30 nem ntztt Design 2N 30 ntztt Design 3nem trgyzott
ntztt Design 4
nem trgyzott
nem ntztt Design 5
N 60 ntztt Design 6
Split File
Lehetsgnk van az adatbzist felosztani s az elvgzett analziseket gy elvgezni. Hrom lehetsg kzl vlaszthatunk:
1. Minden esetet megvizsglunk, nem kpeznk csoportokat.2. A csoportokat hasonltjuk ssze.3. Az analzisek eredmnyt csoportonknt jelentjk meg.
- 13 -
-
Huzsvai Lszl: SPSS alkalmazsok
Select Cases
eseteket vlaszthatunk ki az adatbzisbl. Ngy lehetsg kzl vlaszthatunk:
1. Minden eset rszt vegyen az analzisben.2. Ha valamilyen felttel teljesl (if then)3. Vletlen minta az esetekbl4. Kijellhetjk az esetek bizonyos tartomnyt, az els s
utols eset megjellsvel5. Hasznlhatunk szr vltozt
Mi legyen a ki nem vlasztott esetek sorsa? Lehet szrni s trlni ket az adatbzisbl.
Nagymennyisg adat lekrdezseEgy viszonylag nagy adatbzisbl nagy mennyisg adatot klnbzkppen krdezhetnk le. Az egyik legegyszerbb megolds az adatok szrse (select cases) parancs hasznlata, azonban nagy mennyisg adat, illetve tbbszempontos lekrdezskor nagyon sokat kell rni, s bonyolult logikai kifejezseket kell megalkotni. Nagy a hibzsi valsznsg. A msik nagyon hatkony megolds, ha ksztnk egy lekrdez adatbzist, s ehhez kapcsoljuk a nagy adatbzisbl az adatokat az sszekapcsol utastssal (merge files, add variables).Pl.: a nagy adatbzis harminc v klnbz kukorica hibridjeinek termseit tartalmazza. Ksztsk el az elre kivlasztott harminc hibrid egy-kt vagy tbb ves termseredmnyt. Az els lps, alkossuk meg a lekrdez adatbzist. Rendezzk nvekv sorrendbe az adatokat a hibridek s v szempont alapjn (Data, Sort Cases).
- 14 -
-
Huzsvai Lszl: SPSS alkalmazsok
A msodik lpsben kapcsoljuk hozz a termseredmnyeket a nagy adatbzisbl.
- 15 -
-
Huzsvai Lszl: SPSS alkalmazsok
- 16 -
-
Huzsvai Lszl: SPSS alkalmazsok
Weight Cases,
Alul vagy tl reprezentlt mintk esetben lehet slyztnyezt alkalmazni. Ha tbb ismrv alapjn is alul vagy tl reprezentlt a minta, akkor egyenknt kell a slyztnyezket kiszmtani, s az egyenknti slyztnyezket ssze kell szorozni. (Ez a szociolgiai s trsadalomkutatsban elfogadott eljrs.) Pl.: 60 megfigyelsbl 50 frfi s 10 n. A frfiak tl reprezentltak ebben a mintban ezrt a kt slyz tnyez frfiak esetben 10/60, nk esetben 50/60.
- 17 -
-
Huzsvai Lszl: SPSS alkalmazsok
TALAKTSOK (TRANSFORM) MENAz adatmtrix elemeit lehet megvltoztatni, illetve j vltozkat lehet ellltania rgi vltozk segtsgvel. tkdolhatjuk a rgi esetek rtkeit akr j, akr a rgi vltozkba. Az esetek rangszmait is kiszmthatjuk.
Compute Variable:
Szmtott vltoz ltrehozsa. Meg kell adni a clvltoz nevt s a numerikus kifejezst. Lehetsg van arra is, hogy valamilyen logikai kifejezst is belltsunk, s ilyenkor csak azoknl az eseteknl kpzdik a szmtott rtk, amelyeknl a logikai rtk igaz. A tbbi helyre system missing value kerl.Gyakran elfordul feladat, hogy idsort kell ellltani, vagy meglv idsort kell klnbz szempontok szerint talaktani. A talaj-nvny-atmoszfra modellekben az idt az aktulis v janur elsejtl eltelt napok szmval jellik (julian dtum). Havonknti, negyedvenknti sszestst ill. kimutatst gy elg nehz elvgezni. A program a klnbz dtum fggvnyekkel lehetsget biztost az talaktsokra. Pl. DATE.YRDAY(v, az v napja) segtsgvel rendes dtumot lehet ellltani. A szmtott j vltoznak termszetesen dtum tpust kell megadni. A DATE.* fggvnyekkel szmokbl lehet klnfle dtumot ellltani, az XDATE.* fggvnyek pedig dtumbl szmokat, pl. napok szma, hnap szma, negyedvek szma, stb. Az gy elksztett attribtumokkal klnfle szempontok szerint csoportosthatjuk az adatokat, kszthetnk statisztikkat, elemzseket. (ld. esztend2002.sav).Vletlen szmokat is el tudunk lltani a beptett eloszlsfggvnyek segtsgvel. Pl. RV.NORMAL(mean, stddev) normleloszls ismert kzprtk s szrs esetn.
Random Number Seed:
A szmtgppel generlt u.n. pszeud-vletlen szmok ellltsakor a kiindulsi szm megadsa. Csak sokszmjegy, pratlan szm adhat meg. Amennyiben
- 18 -
-
Huzsvai Lszl: SPSS alkalmazsok
sokszor generlunk vletlen szmokat, idnknt clszer tlltani, nehogy ismtlds lpjen fel a vletlen szmok kztt.Count:Egy olyan j vltoz hozhat ltre, amelyben a vltozlistra felvitt vltozk egyttes elfordulsait lehet regisztrlni.
Recode:
Elfordulhat, hogy ugyanazt a hibridet szintaktikailag ktfle mdon rgztettk, pl. Pelican s Pelikn. Az automatikus jrakdols sorn kt klnbz szm fog hozzrendeldni a kt megnevezshez. Hogyan lehet ezt kijavtani?Az jrakdols sorn vlaszthatjuk, hogy ugyanabba a vltozba (Into Same Variables) vagy j vltozba (Into Different Variables) kerljenek az j rtkek. Vlasszuk, hogy ugyanabba a vltozba kerljenek az rtkek. Fel kell sorolnunk a rgi s j rtkeket, s fel kell venni ket a listba, majd OK. Az jrakdols megtrtnik. Meg kell jegyezni, hogy a rgi rtkek, amelyek most mr nem szerepelnek az adatbzisban, cmki tovbbra is megrzdnek.A rgi felesleges cmkket az Automatikus jrakdolssal (Autamatic Recode) trlhetjk. sszefoglalsknt: Automatic Recode Recode Into Same Variable Automatic Recode.Ezzel a funkcival kategorizlhatunk egy folytonos vltozt. A mezgazdasgban pl. a talaj tpanyag-elltottsgnak megtlst a talaj humusztartalmval szoktk becslni. A tpanyag-elltottsg azonban a humusz mellett fgg a talaj tpustl s egyb, pl. a talaj ktttsgtl is. Ezeket korbban un. hatrrtk tblzatokban foglaltk ssze. A tblzatok felhasznlsval az SPSS-ben knnyen el tudjuk vgezni a humusztartalom minstst. Humusztartalom alapjn: igen gyenge(1), gyenge(2), kzepes(3), j(4) s igen j(5) elltottsgot lehet megklnbztetni.Egy ilyen tblzat rszlete lthat lent.
- 19 -
-
Huzsvai Lszl: SPSS alkalmazsok
2. tblzat: A talajok humusztartalmnak hatrrtkeiSzntfldi termhely Ka
Humusz %igen
gyengegyenge kzepes j igen
j
I.>42 4,0138 3,51
-
Huzsvai Lszl: SPSS alkalmazsok
prbeszdablakban a tblzat egyetlen sort tudjuk csak megadni a felttelekkel egytt. Az els sor felttele: Thely=1 s Ka>42. Ezutn kell megadni a rgi s j rtkeket. A prbeszd ablak teht csak egyetlen sorra j. Ilyenkor nagyon hasznos az SPSS syntax editora, mert segtsgvel automatizlhatjuk a kdolst. A Paste billenty megnyomsval a prbeszdpanelen belltott utastsok a Syntax editor ablakban jelennek meg. Itt egyszer msolssal kibvthetjk a feltteleket s megadhatjuk a kategria rtkeket.
2. bra: Program a humuszelltottsg megtlshez
A programot a mensor Run parancsval, Run All tudjuk futtatni. A futtats utn egy elhumusz vltozban troldnak ez elltottsg kategrii. (a msodik termhely nem tartalmazza az sszes kategrit)Az adatbzis a program futsa utn gy alakul.
- 21 -
-
Huzsvai Lszl: SPSS alkalmazsok
3. bra: Humuszelltottsg megtlse
Az elhumusz vltozban az rtkekhez cmkket kell rendelni.
4. bra: rtkcmkk megadsa
Adatbzis az rtkcmkk belltsa utn:
- 22 -
-
Huzsvai Lszl: SPSS alkalmazsok
5. bra: Humuszelltottsg megtlse
Categorize Variables:
Egy vltoz tartomnyt lehet felosztani kategrikra, alapllapotban ngy kategrit ajnl fel a program, de lehet vltoztatni.
Rank Cases:
Egy vltoz rtkeinek a nagysg szerinti sorrendben elfoglalt helyzetnek megfelel rangszmt generlja egy j vltozba. Ha kt egyforma rtk ll a vltozban, megfelezi a sorszmot, pl. 1,5 s 1,5.
Automatic Recode:
Vltozkat lehet automatikusan jrakdolni. A vltoz listbl vlasszuk ki az jrakdoland vltozt, a New Name ablakba rjuk be az j vltoz nevt s nyomjuk meg a New Name
- 23 -
-
Huzsvai Lszl: SPSS alkalmazsok
gombot. OK utn automatikusan jrakdolja a vltozt. Text tpus vltoz esetben, ha a vltoz klnbz csoportokat jell nem rdemes a szveget mindenegyes rekordban trolni, elg csak a kdokat. Ezzel az adatfjlt mrete jelentsen cskken. A kdok numerikus rtkek lesznek. Az jrakdolt vltozban a szmokhoz cmkk (labels) kapcsoldnak, melyek az eredeti text tpus vltoz tartalmt veszik fel.
Run Pending Transforms:
A felfggesztett transzformcis parancsokat hajtja vgre. Fknt a syntax-ok futtatsakor hasznljuk. amelyeket a transzformcis opcikat hasznlva a Preferences parancsdobozban felfggesztettnk.
- 24 -
-
Huzsvai Lszl: SPSS alkalmazsok
ELOSZLSOK
UNIFORM(max) = egyenletes eloszls pszeud vletlen szmok ellltsa a 0 s max tartomnyban.RV.UNIFORM(min, max) = egyenletes eloszls pszeud vletlen szmok ellltsa min s max kztt.RND(numexpr) = egsz rsz fggvnyKockadobsok szimullsa:RND(UNIFORM(6)+0.5), egyenletes eloszls 1-tl 6-ig. brzolni a gyakorisgot oszlopdiagramon.
VL1
6.005.004.003.002.001.00
Cou
nt
640
630
620
610
600
590
580
570
Hat j egyenletes eloszls vltoz ltrehozsa, sszeg kiszmtsa. brzoljuk az sszeget!
- 25 -
-
Huzsvai Lszl: SPSS alkalmazsok
SSZEG
34.00
32.00
30.00
28.00
26.00
24.00
22.00
20.00
18.00
16.00
14.00
12.00
10.00
7.00
Cou
nt
400
300
200
100
0
Az adatok standardizlsa, Analyze, Descriptive Statistics, Descriptives, Save standardized values as variables. brzols.
Zscore(SSZEG)
3.11661
2.63735
2.15808
1.67881
1.19954
.72028
.24101
-.23826
-.71752
-1.19679
-1.67606
-2.15532
-2.63459
-3.35349
Cou
nt
400
300
200
100
0
- 26 -
-
Huzsvai Lszl: SPSS alkalmazsok
Csebisev ttel
Az adatoknak 211K
-ad rsze mindig kzelebb van az tlaghoz, mint K standard eltrsen kvl. Ez fggetlen a vltoz eloszlstl. K egy egynl nagyobb pozitv szm.
Pl. K=2 esetn, (75%) az adatoknak 2 standard eltrsen bell helyezkedik el, K=3 esetn 8/9 (89%) 3 standard eltrsen bell tallhat.
- 27 -
-
Huzsvai Lszl: SPSS alkalmazsok
ANALZISEK
Riportok
Adatbzisunkrl klnbz szempontok alapjn kszthetnk kimutatsokat tblzatos formban.
OLAP CubesKimutatsokat, kimutats tblzatokat kszthetnk skla tpus adtokkal (Olap Cubes), Pivot tbla formtumban. OLAP (Online Analytical Processing). Rteg (layer), sor (row) s oszlop (column) vltozk szerint csoportosthatjuk az adatainkat. Klnbz statisztikkat jelenthetnk meg, centrlis mutatkat, szrdsi s terjedelmi jellemzket.Analyze, Reports, OLAP CubesAz elemezni kvnt skla tpus adatot vagy adatokat a
6. bra: Kimutats varzsl prbeszdablaka
Summary Variable(s): ablakba tegyk. A csoportkpz vltozkat a Grouping Variable(s) ablakba. A Statistics
- 28 -
-
Huzsvai Lszl: SPSS alkalmazsok
gombra kattintva klnbz statisztikai jellemzket vlaszthatunk.
7. bra: A kimutatsban megjelenthet statisztikk
Differences gomb a vltozk, ill. csoportok kztti klnbsgeket jelenti meg.
- 29 -
-
Huzsvai Lszl: SPSS alkalmazsok
8. bra: A kimutatsban megjelenthet klnbsgek
Az OK gomb lenyomsa utn az Output ablakban megjelenik az eredmny sszezrt formban, azaz minden csoportkpz vltoz a rtegekben (layer) kerl.
OLAP Cubes
Esztend: TotalNAP: Total
5101.1RAINSum
A kimutatst tetszs szerinti formba nthetjk, a rtegeket sorokba illetve oszlopokba hzhatjuk. Ehhez kattintsunk kettt a
- 30 -
-
Huzsvai Lszl: SPSS alkalmazsok
tblzatban az egr balgombjval. A fels mensoron megjelenik a Pivot parancs, melyben a Pivoting Trays parancs megnyitja a szerkesztsi lehetsget.
9. bra: A kimutats szerkezetnek megvltoztatsa
A baloldalon a rteg (layer), alul a sor (row) s jobboldalon az oszlop (column) tallhat. A vltozkat az egrrel hzzuk a kvnt helyre, pl.
- 31 -
-
Huzsvai Lszl: SPSS alkalmazsok
OLAP Cubes
NAP: TotalSum
414.0573.0397.0635.0637.0359.0585.0411.5520.9568.7
5101.1
1995199619971998199920002001200220032004Total
RAIN
A tblzat mindenegyes elemt formzhatjuk, s elmenthetjk a kimutats egyes vltozatait. Ehhez nyissuk meg a Bookmarks (knyvjelzk) parancsot.
10. bra: A
knyvjelzk megadsa
Adjunk nevet az aktulis kimutats vltozatnak, s az Add gombbal adjuk hozz a knyvjelzt.A View menparancsban vlasszuk a Toolbars lehetsget, ekkor megjelennek a segdeszkzk (tolltart), melyek
- 32 -
-
Huzsvai Lszl: SPSS alkalmazsok
segtsgvel hasznos eszkzk llnak rendelkezsnkre a kimutatsok tovbbi elemzshez, formzshoz.
11. bra: Segdeszkzk a kimutatsok formzshoz
Itt megtallhatk a knyvjelzk is, amivel a kimutatsok klnbz vltozatai knnyen ttekinthetk.
Case summariesNagyon hasonlt a pivot tblhoz, csak sokkal egyszerbb formtumban jelenti meg az adatokat. Jl hasznlhat a bevitt adatok ellenrzsre, klnbz csoportostsok szerinti adatmegjelentshez.
Case Summaries
Mean
-1,268 -7,496-1,629 -12,0937,677 -2,019
15,650 3,21326,100 12,61628,057 14,82327,352 15,67429,671 13,00822,063 9,45312,165 3,24810,490 2,657
2,652 -3,03915,005 4,431
HONAP1,0002,0003,0004,0005,0006,0007,0008,0009,00010,00011,00012,000Total
TMAX TMIN
- 33 -
-
Huzsvai Lszl: SPSS alkalmazsok
3. tblzat
Report summaries in Rows
Report summaries in ColumnsA meteorolgia adatbzisbl minden kimutats elvgezhet ezzel az eljrssal. A Data Columns prbeszd ablakban kell megadni az elemzend vltozkat. Minden vltozhoz klnbz statisztikt rendelhetnk, st ugyanazt a vltozt tbbszr is felvehetjk klnbz szmtsi eljrsokkal. Pl. a hmrskletvltozbl az tlagot, minimumot, maximumot gy egy tblzaton (kimutatson) bell egyszeren ki tudjuk szmtani. A csoportkpz vltozt a Break Columns ablakban kell megadni. Vlaszthatunk nvekv, ill. cskken kirats kztt. A kimutats rtf formtumban kszl. Nagyon jl hasznlhat az aggreglt adatok megjelentshez.
Ler statisztikk (Descriptive Statistics)
Centrlis mutatk: tlag (vrhat rtk), Medin (kzps adat, gyakran helyettesti a szmtani kzepet), Mdusz (leggyakrabban elfordul elem)Szrdsi mutatk: Helyzeti s szmtott, Maximum (standardizlt rtke), Minimum (standardizlt rtke), Terjedelem (max.-min., range), Kiugr rtkek, Kvartilisek (negyedelk), Interkvartilis (Q3-Q1)/2, Szrs (standard eltrs), Variancia (szrsngyzet), Standard hibja az tlagnak,Standard hibja a medinnakAz eloszls alakjnak jellemzse: Ferdesg (skewness, jobbra-balra ferde eloszlsok), Cscsossg (kurtosis, 0 normlis mg 2, +2 kztt), Boxplot brzolsTrimelt, csonktott, robosztus ler statisztika, a kiugr rtkek elhagysa.
- 34 -
-
Huzsvai Lszl: SPSS alkalmazsok
Gyakorisgok (Frequencies)A megfigyelt vltozk relatv s kumulatv eloszlst tudjuk elemezni, ill. brzolni. Megjelenthetjk a gyakorisgi tblzatot (Display frequency tables). A szzalkos rtkeken bell (Percentile Values): a kvartiliseket, ahol az adatok 25, 50 s 75%-a tallhat. Feloszthatjuk az adatokat egyenl csoportokra (2-tl 100-ig) (Cut points for x equal groups) valamint tetszlegesen megadott szzalkok alapjn is megjelenthetjk az adatok eloszlst. A centrlis mutatk kzl az tlagot (mean), medint, mduszt valamint a megfigyelsek sszegt (sum), az eloszlsi mutatk kzl a szrst (std. Deviation), a variancit, a terjedelmet (range), a minumum s maximum rtkeket valamint az tlag hibjt (S.E. mean) tudjuk kiszmtani.
- 35 -
-
Huzsvai Lszl: SPSS alkalmazsok
Statistics
t/ha18208
09.867863.05116
-.474.018
-.207.036
4.591007.75800
10.2280012.2250014.20255
ValidMissing
N
MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis
525507595
Percentiles
4. tblzat
Meghatrozhatjuk az eloszls jellemz paramtereit is. Az eloszls szimmetrijt a ferdesgi mutatval (skewness) jellemezhetjk. A normleloszls szimmetrikus s a ferdesge nulla. Pozitv ferdesgi rtk mellett az eloszlsnak hossz jobboldali rsze, farka van (right tail), ekkor balra ferdl, negatv rtk esetben jobbra ferdl az eloszls. Amennyiben a ferdesg rtke nagyobb, mint egy, az eloszls nem norml. Az adatok kzppont krli csoportosulst a cscsossgi mutatval (kurtosis) mrhetjk. Norml eloszls esetn az rtke ennek is nulla. A cscsossg pozitv rtke azt mutatja, hogy az adatok szlesebb csoportban helyezkednek el, az eloszls kt szle hossz. Negatv rtk esetben kisebb csoportban helyezkednek el az adatok, az eloszls kt szle rvidebb. A plda a kukorica termsnek (t/ha) eloszlst mutatja be.
- 36 -
-
Huzsvai Lszl: SPSS alkalmazsok
brzolhatjuk az adatokat oszlop s kr diagramon, valamint hisztogram formjban is. A diagramokon brzolhatjuk a gyakorisgokat vagy a megfigyelsek szzalkos rtkeit.
t/ha
19.018.0
17.016.0
15.014.0
13.012.0
11.010.0
9.08.07.06.05.04.03.02.01.00.0
t/ha
Freq
uenc
y
3000
2000
1000
0
Std. Dev = 3.05
Mean = 9.9
N = 18208.00
12. bra
Descriptives
ExploreItt exploratv adatanalzist vgezhetnk. Ez klnsen fontos nagy adatbzisok esetben az adatok alapos megismersre, feldertsre.
- 37 -
-
Huzsvai Lszl: SPSS alkalmazsok
13. bra
A Statistics gombra kattintva klnbz statisztikkat szmthatunk ki. Ler statisztikk (Descriptives): tlag, medin, mdusz, 5%-os csonkolt tlag, az tlag hibja, variancia, szrs, minimum, maximum, terjedelem, interkvartilisek, ferdesg, cscsossg.
14. bra
Robosztus centrlis mutat meghatrozsa maximum-likelihood mdszerrel (M-estimators). Ngyfle mdszerrel lehet
- 38 -
-
Huzsvai Lszl: SPSS alkalmazsok
meghatrozni a centrlis mutatt, mely torz eloszls vagy extrm, kiugr rtkek esetn jobb becslst ad, mint az tlag.
15. bra
Az t legnagyobb s legkisebb rtk kijelzse (Outliers), ezeket az eredmnylistban extrm rtkknt lthatjuk.
484848N =
Talajmvels
trcsstavaszi szntsszi sznts
term
s t/
ha
16
14
12
10
8
6
4
16. bra
- 39 -
-
Huzsvai Lszl: SPSS alkalmazsok
A megfigyelsek szzalkos eloszlst hatrozhatjuk meg, 5, 10, 25, 50, 75, 90, 95% (Percentiles).brk ksztse, eloszlsok tesztelse. Box-plot grafikonok (kvartilis vagy doboz bra): a fggetlen vltozk fggvnyben kszthetnk kvartilis brt. A kiugrrtkeket kln jelzi a program. A kvartilis brn a nagysg szerint rendezett adatok ngy egyenl rszre vannak osztva. A minimlis rtktl haladva a maximlisig Q1, Q2, Q3 jelli az adatok 25, 50, 75%-t. A Q3 egyben a medin. Interkvartilis IQR= Q3-Q1, ezt doboznak is nevezik. A program kiugr rtknek (kr vagy csillag) jelli a doboztl 1,5IQR-nl nagyobb tvolsgra elhelyezked adatokat (Q3+1,5IQR illetve Q1-1,5IQR).
Az adatok eloszlsnak lersa (Descriptive):Stem-and-leaf grafikon: stem=szr, leaf=levl skla tpus adatok felbontsa, hogy a f rtket a szr, az utols jegyeket a leaf adja. Pl. 7.18 t/ha stem=7, leaf=1.
terms t/ha Stem-and-Leaf Plot forTALAJMUV= szi sznts
Frequency Stem & Leaf
2.00 7 . 99 6.00 8 . 002458 6.00 9 . 013699 3.00 10 . 009 5.00 11 . 02278 8.00 12 . 00035679 13.00 13 . 1223346666668 3.00 14 . 233 2.00 Extremes (>=113.5)
Stem width: 1.000 Each leaf: 1 case(s)
Hisztogram ksztse (Histogram):
- 40 -
-
Huzsvai Lszl: SPSS alkalmazsok
terms t/ha
13.0012.50
12.0011.50
11.0010.50
10.009.50
9.008.50
8.007.50
7.006.50
Histogram
Freq
uenc
y
14
12
10
8
6
4
2
0
Std. Dev = 2.07 Mean = 10.31
N = 48.00
17. braNormleloszls tesztelse Kolmogorov-Smirnov s Shapiro-Wilk prbval.
Tests of Normality
.127 48 .050 .916 48 .002
.227 48 .000 .845 48 .000
.263 48 .000 .817 48 .000
Talajmvelsszi szntstavaszi szntstrcss
terms t/haStatistic df Sig. Statistic df Sig.
Kolmogorov-Smirnova Shapiro-Wilk
Lilliefors Significance Correctiona.
Shapiro s Wilks W-prbaNormlis eloszls tesztelsre szolgl mdszer, rtke maximum 1 lehet. Ennl jval kisebb rtk esetn nem normlis az eloszls. Szignifikancia vizsglata megoldott, = 0,05. Akkor rdemes kiszmolni, ha a minta elemszma nem haladja meg az 50-et.
- 41 -
-
Huzsvai Lszl: SPSS alkalmazsok
Normal Q-Q Plot of terms t/ha
For TALAJMUV= szi sznts
Observed Value
1614121086
Expe
cted
Nor
mal
3
2
1
0
-1
-2
-3
Detrended Normal Q-Q Plot of terms t/ha
For TALAJMUV= szi sznts
Observed Value
151413121110987
Dev
from
Nor
mal
.4
.2
0.0
-.2
-.4
-.6
-.8
- 42 -
-
Huzsvai Lszl: SPSS alkalmazsok
Kereszttblk (Crosstabs)A meteorolgiai alapadatok ellenrzst is el lehet vgezni vele. Minden nap 24 darab nulla, negyed, fl s hromnegyed rs mrsnek kell lennie. Adjuk meg a napokat sorknt, a negyedrkat oszlopknt.
A hnap napja * Perc Crosstabulation
Count
23 24 24 24 9524 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 9624 24 24 24 96
719 720 720 720 2879
123456789101112131415161718192021222324252627282930
Ahnapnapja
Total
0 15 30 45Perc
Total
5. tblzat
- 43 -
-
Huzsvai Lszl: SPSS alkalmazsok
Ngymezs Chi2-prba fggetlensg s homogenits vizsglatra
Osszunk fel egy vletlen minta alapjn kivlasztott 100 szemlyt kt alternatv ismrv szerint: nemek szerint s dohnyzsi szoks szerint.
Nem dohnyz Dohnyz Nk 33 20 53
Frfiak 9 38 47 42 58 100
+ a b a+b = n1+ c d c+d = n2 a+c b+d a+b+c+d = n
Fggetlensg esetn:a/ n1 = c/n2 = (a+c)/n vagyb/ n1 = d/n2 = (b+d)/n stb
))()()(())(1( 22
dbcadcbabcadnChi
++++
=
819,18)3820)(933)(389)(2033(
)9*2038*33(99 22=
++++
=Chi
DF = 1Kritikus Chi2-rtkek 5%-on: 3,841
Plda:Kukorica fajtk csvesedse:
- 44 -
-
Huzsvai Lszl: SPSS alkalmazsok
FAJTA * CSVESD Crosstabulation
Count
73 23 9648 8 56
121 31 152
A fajtaB fajta
FAJTA
Total
Egy csLegalbbkt cs
CSVESD
Total
Chi-Square Tests
2.038b 1 .1531.486 1 .2232.123 1 .145
.210 .110
2.025 1 .155
152
Pearson Chi-SquareContinuity Correctiona
Likelihood RatioFisher's Exact TestLinear-by-LinearAssociationN of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expectedcount is 11.42.
b.
A Yates korrekcival korriglt klnbsg ngyzetbl szmtott Chi-ngyzetet a Continuity Correction mutatja. A kt kukoricafajta a vizsglt tulajdonsg szempontjbl egyforma.
Custom Tables
Kzprtk sszehasonlts (Compare Means)
A kezelstlagok kztti klnbsgek megbzhatsgnak igazolsra tbbfle teszt ismeretes. Az sszehasonlts sorn, vagy kt tlag klnbsgre vagyunk kvncsiak, vagy a kezelsszintjeinket akarjuk sszehasonltani egymssal, sorban tesztelve, hogy melyik kett vagy tbb kezels tlag tr el a tbbitl (szimultn vagy tbbszrs sszehasonlts). A ktfle
- 45 -
-
Huzsvai Lszl: SPSS alkalmazsok
eljrs ktfle sszehasonltsi mdszer csoportot takar. Az els mdszer a pronknti-tesztek csoportja a msodik a tbbszrs sszehasonlt tesztek csoportja.
Kzprtkek (Means)A fgg vltozk (Dependent List) klnbz statisztikai mutatit lehet kiszmtani a fggetlen vltozk (Independent List) fggvnyben. Elkszthetjk a variancia-tblzatot, tesztelhetjk az sszefggs linearitst s az sszefggs szorossgra az R s eta paramter nagysgbl kvetkeztethetnk. Az R-rtk, ill. R2 a fgg vltoz megfigyelt s becslt rtkei kztti lineris kapcsolat ersgt mri. rtke 0,0 1,0 terjedhet. Kis rtk esetben a fgg s fggetlen vltoz kztt gyenge a kapcsolat vagy nem lineris. Az eta paramter a korrelcis koefficienshez hasonlt, de itt a fggetlen vltoz nem folytonos, hanem kategriavltoz.
Report
terms t/ha
11.50673 48 2.0605810.30987 48 2.068899.56033 48 2.28744
10.45898 144 2.27357
Talajmvelsszi szntstavaszi szntstrcssTotal
Mean NStd.
Deviation
ANOVA Table
92.524 2 46.262 10.087 .00090.923 1 90.923 19.825 .0001.601 1 1.601 .349 .556
646.657 141 4.586739.181 143
(Combined)LinearityDeviation from Linearity
BetweenGroups
Within GroupsTotal
terms t/ha *Talajmvels
Sum ofSquares df
MeanSquare F Sig.
Measures of Association
-.351 .123 .354 .125terms t/ha *Talajmvels
R R Squared EtaEta
Squared
6. tblzat
A fenti tblzat els rsze a kezelsek hatsra kialakul termstlagokat s szrsokat tartalmazza. A legnagyobb
- 46 -
-
Huzsvai Lszl: SPSS alkalmazsok
termst szi sznts utn takarthatjuk be. Az ANOVA tbla a variancia-analzis eredmnyt mutatja. A Between a csoportok kztti hatst. Ez fel van bontva lineris s nem lineris hatsra. A Sig. alapjn a lineris hats szignifikns, a nem lineris hats nem szignifikns. Az utols tblzat a talajmvels s terms kztti sszefggs szorossgt mutatja. Az R s R2-nek ebben az esetben nincs rtelme, mivel a fggetlen vltoz (talajmvels) nem skla tpus vltoz, hanem nominlis. Ez vegyes kapcsolat, ami az Eta ill. a ngyzete mutat. Ennek termszetesen nincs irnya csak nagysga. Minl kzelebb van egyhez, annl szorosabb a kt tnyez kztti kapcsolat. Az Eta-ngyzet a csoportok kztti eltrs-ngyzetsszeg s az sszes eltrs-ngyzetsszeg hnyadosa. Ebben az esetben 92,5/739,2=0,125. Ennek a gyke az Eta, ami ebben a pldban kzepes erssg sszefggst mutat (0,354).
Egymints t-teszt (One Sample T Test)Egymints t-prba. Tesztelhetjk, hogy a valsznsgi vltoznk rtke megegyezik-e egy konkrt rtkkel. Megvlaszthatjuk a konfidencia intervallum nagysgt is.Felttel:Normlis eloszls populci, szigma ismeretlen s n>30.
nsXz
/0
=
DF = n-1A minta elemszmnak nvekedsvel a t eloszls egyre jobban kzelti a standard normlis eloszlst.Az X kzprtk minta abban az esetben szrmazhat a m kzprtk populcibl ha t prbastatisztika abszolt rtke kisebb, mint az adott valsznsghez tartoz kritikus t rtk.
- 47 -
-
Huzsvai Lszl: SPSS alkalmazsok
One-Sample Statistics
144 10.45898 2.27357 .18946terms t/haN Mean
Std.Deviation
Std. ErrorMean
One-Sample Test
2.423 143 .017 .45898 8.45E-02 .83349terms t/hat df
Sig.(2-tailed)
MeanDifference Lower Upper
95% ConfidenceInterval of the
Difference
Test Value = 10
7. tblzat
Egymints z-prbaA minta kzprtknek sszehasonltsa egy felttelezett kzprtkkel. Szrmazhat-e az X kzprtk minta egy 0 kzprtk populcibl? H0 hipotzis:
H0: = 0Felttel:
Normlis eloszls populci, s ismert szrs,Vagy tetszleges eloszls populci, s n>30.
A minta alapjn szmtott X kzprtk standardizlt rtk felrhat az albbi formban:
nXz
/0
=
Ahol:z a prbastatisztika minta alapjn meghatrozott rtkeX a minta kzprtke, a populci felttelezett kzprtke (adott kzprtk), a populci (ismert) szrsa,n a minta elemszma.
- 48 -
-
Huzsvai Lszl: SPSS alkalmazsok
A minta abban az esetben szrmazhat az m kzprtk populcibl, ha minta alapjn meghatrozott z prbastatisztika rtke kisebb az adott valsznsgi szinthez tartoz kritikus z - rtknl. Egyoldal hipotzis esetn alfnl, ktoldal hipotzis esetn alfa/2-nl kell kikeresni.
z < kritikus z
Kt fggetlen minta kzprtknek sszehasonltsa (Independent-Samples T Test)
Szrmazhat-e a kt fggetlen megfigyels, minta azonos kzprtk populcibl?Azonosnak tekinthet-e a kt populci kzprtke, amelyekbl a mintk szrmaznak? A kt populci, amelyekbl a mintk szrmaznak, 1, ill. 2 vrhat rtknek becslsre a mintk kzprtkei szolglnak, 11 )( =XE , ill. 22 )( =XE .
H0: 1 = 2A kzprtkek sszehasonltsra szolgl statisztikai prbk az egymints prbkhoz hasonlan nmileg eltrek attl fggen, hogy mekkora az egyes mintk elemszma, ill. hogy ismert-e az alappopulcik szrsa.Kt fggetlen minta kzprtknek sszehasonltsa. Felttel:
Kt fggetlen minta,Normlis eloszls sokasgok,A variancik ismeretlenek, de azonosak
s n
-
Huzsvai Lszl: SPSS alkalmazsok
A nevezben az sp a kt minta sszevont variancijnak (pooled variancie) ngyzetgykt jelenti, melyet a kt minta sszevont szrsnak nevezzk s az albbi kplettel szmtjuk ki:
2)1()1(
21
222
211
+
+=
nnsnsns p
A kt populci kzprtke, amelyekbl a mintk szrmaznak, abban az esetben tekinthetk azonosnak, ha:
*tt
A prba statisztika kritikus t rtkt ktoldali alternatv hipotzis esetn /2-nl, egyoldali alternatv hipotzis esetn, -nl kell a tblzatbl meghatrozni. Ha a kt populci ismeretlen szrsngyzete korbbi ismeretek, ill. a mintkbl szmtott szrsngyzetek alapjn nem tekinthet azonosnak, akkor a t prba helyett a Welch-prbt kell alkalmazni, mely igen hasonl a t-prbhoz, a klnbsg a szabadsgfokok meghatrozsban van. A t-teszt alkalmazsakor elre tudni kell, hogy a kt csoport szrsa megegyezik-e, teht tesztelni kell a csoportok szrst (Levene-pba). Amennyiben a szrsok egyenlk, akkor a vizsglatba vont sszes csoportbl kell a variancit becslni (pooled variancia). A prba valsznsgi vltozja t-eloszls, gy a kzprtkek klnbsgnek szignifikancija a t-rtk tblzatbl megllapthat.Ha a kt csoport szrsa szignifiknsan klnbzik, ilyenkor a kt sszehasonltand csoport variancijt slyozni kell a variancia becslshez (separate variancia). A mdostott variancia becsls az albbi:
+=2
22
1
21
ns
nsSd
A prba valsznsgi vltozja ebben az esetben nem t-eloszls, ezrt nem a t-tblzatot, hanem a Bonferroni-mdostott szignifikancia rtkeket kell hasznlni a kzprtkek klnbzsgnek elbrlsakor.
- 50 -
-
Huzsvai Lszl: SPSS alkalmazsok
8. tblzat
Group Statistics
48 7.66106 1.23444 .1781848 11.77213 1.08695 .15689
Trgya kezelsnem trgyzottnitrogn 120
terms t/haN Mean
Std.Deviation
Std. ErrorMean
Independent Samples Test
.472 .494 -17.317 94 .000 -4.11106 .23740 -4.58243 -3.63969
-17.317 92.518 .000 -4.11106 .23740 -4.58253 -3.63959
Equal variancesassumedEqual variancesnot assumed
terms t/haF Sig.
Levene's Test forEquality of Variances
t dfSig.
(2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
Ktmints z-prbaFelttel:Normlis eloszls fggetlen sokasgok, a variancia ismert,Vagy tetszleges eloszls, mindkt mintban n>30.Az X1 s X2 kzprtkek klnbsge akkor normlis, ill. kzeltleg normlis eloszls, ha a sokasgok amelyekbl a mintk szrmaznak normlis eloszlsak, illetve tetszleges eloszlsak, de a mintaelemek szma mindkt populciban nagyobb, mint 30.A prbastatisztika:
)/()/( 2221
21
21
nnXXz
+
=
A kt populci kzprtke, amelyekbl a mintk szrmaznak, abban az esetben tekinthetk azonosnak, ha:
*zz
A prba statisztika kritikus z-rtkt ktoldali alternatv hipotzis esetn /2-nl, egyoldali alternatv hipotzis esetn, -nl kell a tblzatbl meghatrozni.
- 51 -
-
Huzsvai Lszl: SPSS alkalmazsok
Prostott t-prba (Paired-Samples T Test)Prostott t-prba, kt sszefgg minta kzprtknek sszehasonltsra szolgl.Ugyanazon egyeden kt klnbz idpontban mrnk egy tulajdonsgot, vagy valamilyen csoportkpz tulajdonsg alapjn prokat tudok kpezni.A kt minta kzprtknek azonossga helyett a prostott mintk d (eljeles) klnbsgnek kzprtkre is megfogalmazhatjuk a H0 hipotzist:H0: dtlag = 0Az elz eljrsokhoz hasonlan itt is z-. ill. t-prbt alkalmazhatunk attl fggen, hogy ismert-e a d klnbsgek eloszlsa s szrsa, illetve mekkora a minta elemszma?Felttel: a d klnbsgek eloszlsa normlis, s d ismeretlen (a
mintbl szmtott), s n
-
Huzsvai Lszl: SPSS alkalmazsok
Paired Samples Test
9.424 4.521 .237 8.958 9.889 39.824 364 .000Maximlis hmrsklet(C) - Minimlishmrsklet (C)
Pair1
MeanStd.
DeviationStd. Error
Mean Lower Upper
95% ConfidenceInterval of the
Difference
Paired Differences
t dfSig.
(2-tailed)
9. tblzattlag, az esetek szma, szrs, az tlag hibja. A kt csoport kztti lineris korrelcis egytthat. Prostott t-prba eredmny tblzata: a kt csoport klnbsgnek tlaga, szrsa, az tlag hibja, az tlag 95%-os konfidencia intervalluma, t-rtk, szabadsgfok, ktoldal szignifikancia szint.
Egytnyezs variancia-analzis (One-Way ANOVA)Egytnyezs variancia-analzis. Segtsgvel egy tnyez hatst lehet vizsglni a fgg vltoz mennyisgi alakulsra. A tnyez, faktor valamilyen csoportkpz ismrvvel rendelkezik, a fgg vltoz pedig legtbbszr skla tpus adat. Egyszerre tbb fgg vltozt is kijellhetnk az analzis szmra. A teszt sorn a nullhipotzis, hogy az tlagok egyenlk, nincs kzttk klnbsg. Ez a technika a ktmints t-teszt ltalnostsa, kiterjesztse tbb mintra.Kzs szrsngyzet (variancia) =Vizsglt tnyezk + HibaA szmts sorn az sszes eltrs-ngyzetsszeget bontjuk fel csoportok kztti (kezels hats) s csoporton belli (hiba) hatsokra.
ijiij Ax ++=
= a ksrlet ftlagaAi = (Kezelstlagok-)ij = hiba
A hiba normlis eloszls, fggetlen a blokk s kezelshatstl. Mi van, ha nem teljesl? Lehet transzformlni az alapadatokat,
- 53 -
-
Huzsvai Lszl: SPSS alkalmazsok
logaritmikus vagy egyb transzformcival. A blokk (sokszor ez az ismtls), kezels s hiba hatsok sszege nulla.
Alkalmazsi felttelek: Fggetlen megfigyelsek Normlis eloszls sokasgok Azonos szrsok
Amennyiben az analzis az tlagok kztti egyenlsget nem igazolja, szksges az tlagok kztti klnbsgek kimutatsa. A variancia-analzist kiegszt kzprtk sszehasonlt teszteknek ktfle tpusa ltezik:
1. elzetes, un. a priori kontrasztok s2. az analzis utn elvgezhet, un. post hoc analzisek
A kontrasztokat teht a ksrleti adatok elemzse eltt kell ellltani, s gy elvgezni az elemzst.Az albbi statisztikk kszlnek: minden csoportrl az esetek szma, tlag, szrs, az tlag hibja, minimum, maximum s az tlag 95%-os konfidencia intervalluma.A csoportok variancijnak egyezsgt Levenes teszttel vizsgljuk. Minden fgg vltozra elkszlnek a variancia-tblzatok. A post hoc range s tbbszrs kzprtk sszehasonlt tesztek: Bonferroni, Sidak, Tukeys honestly szignifikns differencia, Hochbergs GT2, Gabriel, Dunnett, Ryan-Einot-Gabriel-Welsch F test (R-E-G-W F), Ryan-Einot-Gabriel-Welsch range teszt (R-E-G-W Q), Tamhanes T2, Dunnetts T3, Games-Howell, Dunnetts C, Duncans multiple range test, Student-Newman-Keuls (S-N-K), Tukeys b, Waller-Duncan, Scheff, and least-significant difference.Szimultn vagy tbbszrs sszehasonlts (multiple comparison) a kztudatban a szrsanalzis kiegsztje, fejldst fleg felhasznli ignyek indtottk tjra.
- 54 -
-
Huzsvai Lszl: SPSS alkalmazsok
Jelentsge azonban jval nagyobb, klnsen a nem paramteres esetben, ahol szrsanalzisre, e normalitst felttelez eljrsra, nem kerlhet sor. Ha az egyszempontos szrsanalzis F-prbja szignifikns, kvncsiak vagyunk, mely populcik miatt nem homogn a minta. Eleinte csak pronknt az sszes lehetsges csoport prra ktmints t-prbt hajtottak vgre. Elfordulhat azonban, hogy adott -szinten szignifikns F-prba esetn egyik csoport pr sem mutat szignifikns t-rtket az adott -szint mellett. A szimultn hipotzis vizsglatok nemcsak az egyszempontos szrsanalzisben hdtottak teret, hanem mindentt, ahol egyidej dntsre van szksg, pl. regresszi, kovariancia, tbbszempontos szrsanalzis, stb.Szimultn dnts, ha kettnl tbb sszehasonltand mintm van. Olyan lltsokat fogalmaznak meg, amelyek egyidejleg rvnyesek. Ezek lehetnek:
Egyidejleg rvnyes konfidencia intervallumok vagy Szimultn vgzett statisztikai prbk.
A tbbszrs statisztikai prbk zme paramteres, a normlis eloszlsra pl eljrs. Sorozatos statisztikai sszehasonltsok vgzsekor halmozdik a prbaknt vllalt elsfaj hiba (kockzat). A szimultn sszehasonltsi mdszerek f clkitzse ennek a halmozdsnak a cskkentse, illetve megszntetse. Ennek eredmnyeknt az egyes sszehasonltsok konzervatv irnyba toldnak el: az egyenknti prbkra rvnyes elsfaj hiba kisebb a vllalt (nvleges) kockzatnl. Ez azonnal szembetlik a tbbszrs sszehasonltsok azon csoportjnl, amelyek az n. Bonferroni-egyenltlensg alapjn dolgoznak. Az els ilyen javaslat Fisher knyvben (1935) tallhat. A lnyege, hogy m sszehasonlts estn, az egyes sszehasonltsokat a nvleges szint helyett /m valsznsgi szinten hajtjk vgre. A valsznsg szubadditv tulajdonsga miatt, ha az sszehasonltsonknt vllalt i kockzatok sszege olyan
- 55 -
-
Huzsvai Lszl: SPSS alkalmazsok
nagy, mint a teljes sorozatra vllalt valsznsgi szint, akkor annak valsznsge, hogy m elvgzett sszehasonlts utn valahol elkvetjk az elsfaj hibt, legfeljebb :
=
=m
iiHP
1
)(
ahol: H esemny azt jelenti, hogy az lltsok kzt legalbb egy hibs. Ha az egyes lltsok (valsznsg-szmtsi rtelemben) fggetlenek lennnek, akkor a fenti becsls helyett az
=
=
m
iiHP
1
)1()(1
egyenlsget alkalmazhatnnk, ami azt mutatja, hogy az lltsok kztt nincs hibs. Miller (1966) megmutatta, hogy a szimultn konfidencia-intervalumokra a fenti egyenlsg helyett mindig a rvnyes. A szimultn vizsglt mintk kztt vgezhet sszehasonltsok nem fggetlenek. Legyen valamennyi i valsznsge egyforma: i = m = /m, akkor az sszehasonltsok nem fggetlen termszett figyelembe vve, a szimultn prbk egyttes kockzata:
P(H)
-
Huzsvai Lszl: SPSS alkalmazsok
foglalkozott, magyar nyelven LTET .-ZIERMANN M. 1964 megjelent mvben tallhat meg. A mdszer lnyege, hogy egy olyan lineris fggvnyt kell alkotni, mint pl.:
g = cg1x1. + cg2x2. + ... + cgpxp.s ha teljesl a
cg1 + cg2 + ... cgp = 0
felttel, akkor ez egy lineris sszehasonlt fggvny. A fenti defincibl kvetkezen vgtelen szm g ltezik.A kontrasztokra vonatkoz nullhipotzis: Hg: g = 0,Az ellenhipotzis: Ag: g 0.Ha pl. egy tnyez hatst T1, T2, T3, T4 szinten vizsglunk, akkor a (T1, T2) csoport egybevetst a (T3, T4) csoporttal a g = x1. + x2. -x3. -x4. fggvny segtsgvel vgezhetjk el (itt 1+1-1-1=0).A fenti sszehasonlts a variancia-analzis ltal szolgltatott pooled variancia felhasznlsval trtnik, ezrt kvetelmny, hogy a csoportok szrsai megegyezzenek, gy gyakran a variancia-analzis kiegszt rszt kpezi. A kontraszt fejezetben a hattnyezk sokfle csoportostsa tjn kapott tlagok klnbzsgt lehet vizsglni, pl. mtrgyzs esetn, a felttelezsem az, hogy az szi bza a legnagyobb termst a 120 kg nitrogn adag mellet ri el. Vizsglhatom az ez alatti adagokat, mintt vve, vagy az e feletti adagokat, szintn mintt vve, vletlenszeren, ha nem 120 kg-t alkalmazok, vajon milyen eredmny szletne.Az egyszempontos szrsanalzis F-prbja akkor ad -szinten szignifikns eredmnyt, ha ezen a szinten ltezik szignifikns kontraszt a csoportok kztt.
Feladat:Nyissuk meg a Terms1989.sav fjlt, s vizsgljuk meg, hogy a talajmvelsnek milyen hatsa volt ebben az vben a kukorica termsre.
- 57 -
-
Huzsvai Lszl: SPSS alkalmazsok
A legels lpsben brzoljuk talajmvelsi vltozatonknt a termsek tlagnak hibjt (standard error), pontosabban az tlagot az tlag hibjnak ktszerest. Ebbe a tartomnyba fog legalbb 95%-os valsznsggel a valdi tlag beleesni.Graph, Error Bar, Simple, Summaries for groups of cases, Define, Variable: terms t/ha, Category Axis: Talajmvels, Bars Represent: Standard error of mean, Multiplier: 2.
trcsstavaszi szntsszi sznts
Talajmvels
22
20
18
16
14
12
10
8
Mean
+-
2 S
E t
erm
s t
/ha
18. bra: Az tlag s az tlag hibjnak ktszerese
Az szi szntsos kezels adataival valami problma lehet, mert tlsgosan nagy az tlag hibja, magba leli a msik kt kezelst is. Egyelre hagyjuk gy, s vgezzk el a variancia-analzist.Analyze, Compare Means, One-Way ANOVA, Dependent List: terms t/ha, Factor: Talajmvels, Options: Homogeneity of variance test.
- 58 -
-
Huzsvai Lszl: SPSS alkalmazsok
Test of Homogeneity of Variances
terms t/ha
5.107 2 141 .007
LeveneStatistic df1 df2 Sig.
10. tblzat
A Levene-teszt azt mutatja, hogy a csoportokon bell a variancik nem egyenlk. Ezek szerint valsznleg az szi szntsos parcellk termseinek szrsa szignifiknsan nagyobb, mint a msik kett. A variancia-analzis alkalmazsnak egyik felttele nem teljesl, ezrt a lenti tblzat eredmnyt fenntartsokkal kell kezelni. Az elvgzett analzis a talajmvels szignifikns hatst igazolja ltszlag, sig. < 0,05. Ezt csak akkor fogadhatnnk el, ha a variancik megegyeznnek.
ANOVA
terms t/ha
1106.779 2 553.390 3.758 .02620763.765 141 147.26121870.544 143
Between GroupsWithin GroupsTotal
Sum ofSquares df Mean Square F Sig.
11. tblzat
Vgezzk el a kzprtkek tbbszrs sszehasonltst (Post Hoc analzis). A tbbszrs sszehasonlt teszteknek kt nagy csoportja van: 1. a varianciknak egyenlknek kell lenni, 2. nem felttel a variancik egyenlsge. Vlasszuk ki mindkt csoportbl az elst!One-Way ANOVA, Post Hoc, Equal Variances Assumed: LSD, Equal Variances Not Assumed: Tamhanes T2.
- 59 -
-
Huzsvai Lszl: SPSS alkalmazsok
Multiple Comparisons
Dependent Variable: terms t/ha
5.470354* 2.477068 .029 .57336 10.367356.219896* 2.477068 .013 1.32290 11.11689
-5.470354* 2.477068 .029 -10.36735 -.57336.749542 2.477068 .763 -4.14745 5.64653
-6.219896* 2.477068 .013 -11.11689 -1.32290-.749542 2.477068 .763 -5.64653 4.147455.470354 3.015757 .211 -1.99077 12.931486.219896 3.019043 .128 -1.24821 13.68800
-5.470354 3.015757 .211 -12.93148 1.99077.749542 .445175 .260 -.33289 1.83197
-6.219896 3.019043 .128 -13.68800 1.24821-.749542 .445175 .260 -1.83197 .33289
(J) Talajmvelstavaszi szntstrcssszi szntstrcssszi szntstavaszi szntstavaszi szntstrcssszi szntstrcssszi szntstavaszi sznts
(I) Talajmvelsszi sznts
tavaszi sznts
trcss
szi sznts
tavaszi sznts
trcss
LSD
Tamhane
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
12. tblzatAz LSD-teszt az szi sznts s tavaszi sznts, valamint az szi sznts s trcss talajmvels kztt 5%-os szignifikns klnbsget mutat. A Tamhane teszt egyik kezels pr kztt sem mutat szignifikns klnbsget. Mivel a variancik klnbzsge miatt LSD tesztet nem csinlhatunk, a Tamhane-teszt eredmnyt kell elfogadni, s kiderteni, hogy mirt nem tudjuk kimutatni a talajmvels okozta hatst.Vizsgljuk meg az szi szntsos kezelsek adatait!Analyze, Descriptive Statistics, Explore, Dependent List: terms t/ha, Factor List: Talajmvels, Statistics, Outliers.Az eredmnylistbl csak a kiugr rtkek tblzatt mutatom be.
- 60 -
-
Huzsvai Lszl: SPSS alkalmazsok
Extreme Values
9 szi sznts 114.4110 szi sznts 113.5132 szi sznts 14.39535 szi sznts 14.39236 szi sznts 14.286
135 trcss 5.355134 trcss 5.421136 trcss 5.652122 trcss 5.697124 trcss 6.059
1234512345
Highest
Lowest
terms t/haCase Number Talajmvels Value
13. tblzatJl lthat, hogy a 9. s 10. megfigyels adatrgztsi hiba miatt egy nagysgrenddel nagyobb, mint a tbbi. Javtsuk ki a hibs adatokat s ismteljk meg az analzist a legels lpstl kezdden!
trcsstavaszi szntsszi sznts
Talajmvels
12
11
10
9
Mean
+-
2 S
E t
erm
s t
/ha
19. bra: Az tlag s az tlag hibjnak ktszereseAz tlagok ebben az esetben mr jl elklnlnek egymstl. Az tlagok hibibl kpzett intervallumok mr kevsb rnek egymsba.
- 61 -
-
Huzsvai Lszl: SPSS alkalmazsok
Test of Homogeneity of Variances
terms t/ha
1.096 2 141 .337
LeveneStatistic df1 df2 Sig.
14. tblzat
A variancia-analzis alkalmazsi felttele, a csoporton belli variancik egyezsge teljesl, teht lehet variancia-analzist csinlni.
ANOVA
terms t/ha
92.524 2 46.262 10.087 .000646.657 141 4.586739.181 143
Between GroupsWithin GroupsTotal
Sum ofSquares df Mean Square F Sig.
15. tblzat
A variancia-analzis a talajmvels szignifikns hatst mutatja. Az elvgzett tbbszrs kzprtk sszehasonlt tesztek most mr hasonl eredmnyt adnak. Mivel a variancik megegyeznek, az LSD-teszt eredmnyt rdemes figyelembe venni, mert ennek a tesztnek ebben az esetben nagyobb a prba ereje. Ez azt jelenti, hogy a meglv valdi klnbsget nagyobb biztonsggal tudja kimutatni, mint a Tamhane teszt.
- 62 -
-
Huzsvai Lszl: SPSS alkalmazsok
Multiple Comparisons
Dependent Variable: terms t/ha
1.196854* .437141 .007 .33266 2.061051.946396* .437141 .000 1.08220 2.81059
-1.196854* .437141 .007 -2.06105 -.33266.749542 .437141 .089 -.11466 1.61374
-1.946396* .437141 .000 -2.81059 -1.08220-.749542 .437141 .089 -1.61374 .114661.196854* .421463 .017 .17227 2.221441.946396* .444371 .000 .86591 3.02689
-1.196854* .421463 .017 -2.22144 -.17227.749542 .445175 .260 -.33289 1.83197
-1.946396* .444371 .000 -3.02689 -.86591-.749542 .445175 .260 -1.83197 .33289
(J) Talajmvelstavaszi szntstrcssszi szntstrcssszi szntstavaszi szntstavaszi szntstrcssszi szntstrcssszi szntstavaszi sznts
(I) Talajmvelsszi sznts
tavaszi sznts
trcss
szi sznts
tavaszi sznts
trcss
LSD
Tamhane
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
16. tblzat
Az SPSS post hoc analzisei
Legkisebb szignifikns differencia (LSD)R.A.Fisher 1935-ben gy mdostotta az egyszer t-prbt, amennyiben a szrsanalzis F-prbja szignifikns, akkor alkalmazhatjuk a legkisebb szignifikns klnbsg (LSD) prbt, amelyben a kzs hiba ngyzetsszeg osztva a szabadsgfokval (error mean square) becsli a variancit. A mezgazdasgi kutatsban, a ksrletek kirtkelsben, a legrgebben hasznlt mdszer a kezelsszintek klnbsgnek vizsglatra. A variancia-analzis szolgltatta Hiba MQ-bl kiszmolt SZDp% -bl ( dpp stSzD %% = ) levont kvetkeztetsek azonban csak akkor rvnyesek, ha az analzis eltt vletlenl vlasztunk ki kt kezelstlagot, s ennek a klnbsgt teszteljk. ltalban a legnagyobb s legkisebb rtket ad kezelsek kztti klnbsgek akkor is nagyobbak, mint az SZDp%, ha a kezelsek vletlen mintk ugyanabbl a sokasgbl, teht nincs kzttk valdi klnbsg. Erre a
- 63 -
-
Huzsvai Lszl: SPSS alkalmazsok
kvetkeztetsre jutott Svb, 1981 is s a fenti htrnyok kikszblsre a Duncan-tesztet emlti, de az rtkels krlmnyes voltra hivatkozva nem foglalkozik vele. Sajnos a mezgazdasgi kutatsban is sokszor tvesen alkalmazzk az SZDp%-t s gyakorlatilag sorba tesztelik a kezelsszinteket, s azt nzik, hogy melyik kt kezels kztti klnbsg nagyobb, mint az SZDp%. Az gy kimutatott szignifikns klnbsgek igen ktes rtkek, mivel az -hiba valsznsge (az elsfaj hiba elkvetsnek kockzata) az sszehasonltsok sorn halmozdik. A legkisebb szignifikns differencia teht a t-eloszlst alkalmazza.
Newman-tesztD. Newman (1939) dolgozta ki az els, studentizlt terjedelmeken alapul tbbszrs sszehasonlt tesztet. Erre az eloszlsra elszr lltott fel tblzatokat, ksbb Pearson s Hartley (1943) rszletesebb tblzatot ksztett. Ha a prba rtk szignifikns, akkor elhagyjk valamelyik szls rtket, s a kvetkez terjedelmet vizsgljk tovbb. Newman a prbt Student (alias W.S. Gosset) (1927) cikke alapjn dolgozta ki. Statisztikja:
sxxq k 1=
k, paramterekkel, ahol k a norml eloszls populcik szma s
=ji
iij xxs,
2.
2 )(
ngyzetsszeg, amelynek szabadsgfoka =k(m-1), ahol m a minta elemszma.
Bonferroni-tesztPronknti tlagok klnbsgnek vizsglatra hasznlhat, a kt csoport elemszma lehet klnbz is. Lnyege, hogy az -hibhoz tartoz t-rtket korriglja a fggetlen sszehasonltsok szmnak megfelelen.
- 64 -
-
Huzsvai Lszl: SPSS alkalmazsok
+=ji
p nnSlitblzatbetL 11)( 2
Az -hiba a ksrlet egszre igaz, az egyenknti sszehasonltskor /m az elsfaj hiba valsznsge. Ez a teszt is teht a t-eloszlst alkalmazza.
Tukey-teszt, J.W. Tukey (1953)Studentizlt terjedelem tesztjben a p-elem rszcsoportokat ugyanazzal a kritikus rtkkel hasonltja ssze. Itt a teljes vizsglat elsfaj hibja rgztett, s az egyes sszehasonltsok elsfaj hibja n nvekedsvel cskken, s gy a msodfaj hiba n. A Tukey teszt (1953) alapesetben egyforma minta nagysg csoportok tlagainak klnbsgt tudja tesztelni, s a kvetkez null-hipotzist vizsglja:
H0: 1==k,.Ezt felbontja a kvetkez hipotzisek metszetre:
2.. 2)(
smxxt jiij
=
Hij=i-j=0,Ellenhipotzis: Aij: i-j0. Mivel a mintk azonos elemszmak: ni=m, ezrt =k(m-1). Teht a pronknti egyenlsgeket szimultn teszteli. Statisztikja:A Hij hipotzist elfogadja -szinten, ha tij
-
Huzsvai Lszl: SPSS alkalmazsok
Tukey s tle fggetlenl C.Y.Kramer (1956) javaslata alapjn kiterjesztettk nem egyenl elemszmra. Ez a mdszer a Tukey-Kramer mdostott teszt. A teszt a Newman-Keuls-teszttel kiszmtott legnagyobb klnbsggel egyenl, ezrt is hvjk Tukey's Honestly (szinte, becslet) Significant Difference-nek. Ksbb ltalnostottk tetszleges kontrasztokra is.
L=q tblzatbelisnp( )
Dunett (1980a) cikkben szmtgpes szimulcival tbb szerz hasonl eljrst hasonltotta ssze s ezek kzl a Tukey-Kramer prbt tallta a legjobbnak, azaz a klnbz elsfaj hibk mellett a konfidencia-intervallum hosszt a legrvidebbnek.
H. Scheff (1953) Scheffe-tesztA hagyomnyos tesztek kz tartozik. mr valban a Hg hipotziseket vizsglta. Az egyszer F-prba akkor utastja el a H0-hipotzist, ha ltezik egy a0 vektor, amelynl a konfidencia-intervallum nem tartalmazza a 0-t. Ha k darab sszehasonltand csoportom van akkor k(k-1)/2 sszehasonltst kell vgeznem. A statisztikja:
( )
+=ji
litblzatbep nnFksL 111 )(
2
Ez a teszt teht az F-eloszlst alkalmazza. A teszt tetszleges elemszmok esetn rvnyes, s a paramterek valamennyi kontrasztjnak (lineris kombincijnak) egyidej vizsglatra alkalmas. A kontrasztok szimultn vizsglata legtbbszr a szimultn konfidencia intervallumok felrsval trtnik, s vizsgljuk, hogy azok tartalmazzk-e a nullt vagy nem. Mivel a kontrasztok szma vgtelen, a Scheff ltal kezdemnyezett kiterjeszts igen lnyeges ltalnostst jelent. Ez a mdszer a legltalnosabb, egyedl ennek van meg az a tulajdonsga, hogy ekvivalens a szrsanalzissel. Az olyan vizsglatokat azonban, amelyek megfelelnek a Tukey vagy Dunett-mdszer
- 66 -
-
Huzsvai Lszl: SPSS alkalmazsok
eredeti krdsfelvetsnek (egyenl elemszm csoportok kztti klnbsgek vizsglata ill. ezek egy kontrollal val sszehasonltsa a cl) rdemes ezekkel a mdszerekkel elvgezni, mert erejk ilyenkor nagyobb a Scheff-mdszer erejnl. A Scheff-mdszer ereje a Bonferroni-egyenltlensg alapjn kiterjesztett t-prbknl is kisebb mindaddig, mg az elvgzett sszehasonltsok m szma lnyegesen meg nem haladja az elvgezhet sszehasonltsok dimenzijt (Miller, 1966) k fggetlen csoport egyszempontos sszehasonltsakor ez a dimenzi (k-1).A Scheffe-teszt gyakorlati alkalmazshoz nyjt nagy segtsget O BRIEN R. R. 1983 megjelent mve s LOTHAR SACHS 1985.
Dunnett-tesztA Dunnett-teszt (1955) egy kijellt csoportot (kontroll) hasonlt ssze a tbbivel. Eredetileg egyenl elemszmokra volt rvnyes, de ksbb elkszlt az ltalnostsa egyenltlen elemszmokra is. Lnyegt tekintve pronknti t-tesztet vgez tbbszr, de meg kell adni egy kezd, kontroll csoportot, s ehhez hasonltja a tbbi csoport tlagt. Statisztikja:
nsdxx poi
2
xo= kontrol csoport tlagaStatisztikja megegyezik Tukey statisztikjval, elfogadsi tartomnya viszont nem.
P(tik
-
Huzsvai Lszl: SPSS alkalmazsok
Student-Newman-Keuls prbaM.Keuls (1952) Mdostotta a Newman prbt. A prba a studentizlt range eloszlst hasznlja. A mintk elemszmai egyenlk. A statisztikja megegyezik Newmanval, az elsfaj hiba sszehasonltsonknt rgztett, ezrt a teljes vizsglat elsfaj hibja n-nel egytt n.
ns
rqw pr ,,=
A prba teszteli, hogy mely kezels kombincik tartoznak egy homogn csoportba. Kiszmtsa bonyolultabb, ezrt clszer szmtgppel elvgezni. Az eredmny grafikusan brzolhat s knnyen rtelmezhet. Legtbb szmtgpes program elszr az tlagokat sorba rendezi, kicsitl a nagy fel s vzszintes vagy fggleges vonallal jelzi a homogn csoportokat, ahol nincs szignifikns klnbsg a kezels kombincik kztt. Vlemnyem szerint a kezels kombincik sorba tesztelsre a mezgazdasgban is az egyik legjobban hasznlhat prba.
Duncan tbbszrs rang teszt (1955, 1965)Itt is a homogn csoportok kpzse a cl. Studentizlt terjedelem eloszlst alkalmazza. Napjainkban az egyik legjobbnak tartott tbbszrs sszehasonlt teszt. Itt is a grafikus megjelents nagyban segti a kapott eredmnyek interpretcijt. A mezgazdasgi kutatsban is potencilisan nagy jelentsggel br teszt.
ltalnos lineris modell (General Linear Model)
Az ltalnos lineris modell a hagyomnyos variancia-analzis s a lineris regresszi-analzis tvzete. Egyetlen tblzatban jelenik meg a szrs elemzs s regresszi-analzis eredmnye (17. tblzat). Napjainkban a variancia-analzisnek nagyon sokfle technikja ltezik, amik lehetv teszik a feladat sajtossgainak figyelembevtelvel a legalkalmasabb
- 68 -
-
Huzsvai Lszl: SPSS alkalmazsok
rtkelsi mdszer kivlasztst. Az elemzs megbzhatsga a hiba (error) meghatrozsnak mdjtl fgg, ami tulajdonkppen az eltrs ngyzetsszeg (SQ) szmtsi technikjnak fggvnye. Az SPSS lehetv teszi a ksrleti elrendezshez h, a felhasznl ltal megalkotott lineris modell megbzhat rtkelst.
Tests of Between-Subjects Effects
Dependent Variable: X
119.248a 3 39.749 4.706 .00620563.279 1 20563.279 2434.723 .000
119.248 3 39.749 4.706 .006439.184 52 8.446
21121.710 56558.431 55
SourceCorrected ModelInterceptFAJTAErrorTotalCorrected Total
Type IIISum of
Squares dfMean
Square F Sig.
R Squared = .214 (Adjusted R Squared = .168)a.
17. tblzat
A 17. tblzat 1-4 oszlopnak rtelmezse logikai sorrendben: Total: az alapadatok ngyzet sszege (21 121), 2x ,
szabadsgfok (56). A szabadsgfok itt megegyezik az adatok szmval.
Intercept: az alapadatok sszegnek ngyzete osztva az
adatok szmval (20 563) ( )nx 2 , szabadsgfok (1) valamint
tlaga (20 563). Amennyiben az adatok egyltaln nem szrnak (minden adat megegyezik), akkor a fenti kt kifejezs rtke megegyezik. Az Intercept SS rtkt Svb knyveiben korrekcis tnyezknt (C) emlti, mely nem ms, mint a ksrlet ftlagnak ngyzetsszege, 2x
Corrected Total: egyenl Total Intercept (558), vagyis 2x -( )
nx 2 , ez tulajdonkppen az alapadatok eltrsngyzet-
sszege. Svb knyveiben ez jelentette az sszesen sort. Szabadsgfok (55).
- 69 -
-
Huzsvai Lszl: SPSS alkalmazsok
Error: ebben a pldban a ngy FAJTA csoporton belli eltrs ngyzetsszege (439) ( )
i jiij xx
2
, szabadsgfok (52), valamint ennek tlaga (8,446), ami gyakorlatilag a csoporton belli variancik tlaga. Svb knyveiben a Hiba, a vletlen hatsa, a meg nem magyarzott hatsok. Minden FAJTA csoportban 14-14 megfigyels van. Ebbl az rtkbl gykt vonva megkapjuk a csoporton belli tlagos szrs nagysgt, a ksrlet hibjt.
FAJTA: a kezels okozta hats, a ngy fajta tlagnak eltrse a ftlagtl. 2fajtar
Corrected Model: a lineris modellel becslt s a megfigyelt rtkekre illesztett lineris fggvny jsgt mutatja. Eldnthet, hogy az alkalmazott modell megfelel-e.
( ) ==x
xyiR SS
SPYYSS
22
r-ngyzet rtke Corrected Model SS/Corrected Total SS, (119/558).
Ha az ltalnos lineris modell alkalmazsa sorn a becslt (predicted values) rtkeket is elmentjk, elvgezhetjk a lineris regresszi-analzist (18. tblzat). A regresszi eredmnye megknnyti a GLM tblzatnak jbli rtelmezst.
Model Summary
.462a .214 .199 2.8518Model1
R R SquareAdjustedR Square
Std. Errorof the
Estimate
Predictors: (Constant), Predicted Value for Xa.
- 70 -
-
Huzsvai Lszl: SPSS alkalmazsok
ANOVAb
119.248 1 119.248 14.662 .000a
439.184 54 8.133558.431 55
RegressionResidualTotal
Model1
Sum ofSquares df
MeanSquare F Sig.
Predictors: (Constant), Predicted Value for Xa.
Dependent Variable: Xb.
18. tblzat: A lineris regresszi-analzis eredmnye
A lineris fggvny illesztse sorn kapott eltrs ngyzetsszegek teljesen megegyeznek a GLM-vel kapott rtkekkel. A lineris regresszi-analzis tblzatnak (ANOVA) rtelmezse: Total: az alapadatok eltrs ngyzetsszege,
szabadsgfoka. Ez megegyezik a GLM Corrected Total
rtkvel. ( ) = ny
ySS iiy2
2
Regression: a lineris modellel becslt s a megfigyelt rtkekre illesztett lineris fggvny jsgt mutatja. Eldnthet, hogy az alkalmazott modell megfelel-e.
( ) ==x
xyiR SS
SPYYSS
22
Residual: maradkok ngyzetsszege, szabadsgfok, ngyzetsszeg tlagok. A lineris egyenessel meg nem magyarzott hats.
Az r-ngyzet rtke 0,214. Ez a Regression SS/Total SS hnyadosa (119/558).
A GLM alkalmazhatsgi feltteli megegyeznek a variancia-analzis alkalmazhatsgi feltteleivel:
Fggetlen megfigyelsek (a maradknak kell fggetlennek lennie a fgg vltoz megfigyelt s becslt rtktl. Ezt brzolssal s regresszi-analzissel tudjuk leellenrizni.)
- 71 -
-
Huzsvai Lszl: SPSS alkalmazsok
Normlis eloszls sokasgok (a maradknak kell nulla vrhat rtk normleloszlst mutatni. Ezt hisztogrammal s Kolmogorov-Smirnov teszttel vizsglhatjuk.)
Azonos szrsok (a maradkok varianciinak meg kell egyeznie minden kezels kombinciban, azaz cellban. Ezt Levene-teszttel ellenrizhetjk.)
Egyvltozs variancia-analzis (Univariate)Segtsgvel egy tnyez hatst lehet vizsglni a fgg vltoz mennyisgi alakulsra. A tnyez, faktor valamilyen csoportkpz ismrvvel rendelkezik, a fgg vltoz pedig legtbbszr skla tpus adat. Egyszerre tbb fgg vltozt is kijellhetnk az analzis szmra. A variancia-analzis sorn ngyflekppen tudjuk kiszmtani az eltrs ngyzetsszegeket (SS). Rmai szmokkal jellm a ngy tpust (I-IV.). A programban kezdrtkknt a III. jelenik meg, ezt hasznlhatjuk az egy vagy tbbtnyezs, kiegyenslyozott (balanced) vagy kiegyenslyozatlan (unbalanced), teljes, azaz nincs hinyz parcella adat ksrletek kirtkelsekor (ez a leggyakoribb). Ez a mdszer megegyezik a szles krben ismert Yates-fle mdszerrel. A Yates mdszer lnyegben az tlagok slyozott eltrsngyzet technikjt hasznlja a ngyzetsszegek szmtsakor. Ez a mdszer jl ismert a mezgazdasgi kutatsban, mivel Svb knyveiben a variancia-analzis ismertetsekor ezt a technikt mutatja be.Type I: ezt kell hasznlni, ha a kezelsekben nem egyezik meg a megfigyelsek szma, hinyz parcellaadat van.Type II: kiegyenslyozott (balanced) egymsba gyazott (nested) ksrleteknl kell alkalmazni.Type IV: kiegyenslyozott vagy kiegyenslyozatlan ksrleteknl, ha hinyz adat van.
- 72 -
-
Huzsvai Lszl: SPSS alkalmazsok
Amennyiben az analzis az tlagok kztti egyenlsget nem igazolja, szksges az tlagok kztti klnbsgek kimutatsa. A variancia-analzist kiegszt kzprtk sszehasonlt teszteknek ktfle tpusa ltezik:
1. elzetes, n. a priori kontrasztok s2. az analzis utn elvgezhet, n. post hoc analzisek
A kontrasztokat teht a ksrleti adatok elemzse eltt kell ellltani, s gy elvgezni az elemzst.Az egyszempontos szrsanalzis F-prbja akkor ad -szinten szignifikns eredmnyt, ha ezen a szinten ltezik szignifikns kontraszt a csoportok kztt.Plda: vizsgljuk meg, hogy hrom talajmvelsi vltozatban hogyan alakul a kukorica termse. Az egytnyezs variancia-analzis alkalmazshoz kattintsunk az ANALYZE menpont COMPARE MEANS almenjben az ONE-WAY ANOVA parancsra (20. bra).
20. bra: Egytnyezs variancia-analzis
A statisztikai szmts elvgzshez a vizsglt fgg vltozt helyezzk a DEPENDENT LIST ablakba, mg FACTOR-nt definiljuk a talajmvelst, hiszen a termsnek a talajmvelsi vltozatok kztti klnbsgt prbljuk igazolni. Amennyiben a variancia-
- 73 -
-
Huzsvai Lszl: SPSS alkalmazsok
analzis a talajmvels szignifikns hatst igazolja, kvncsiak lesznk, hogy a hrom talajmvelsi vltozat kzl vajon melyik kztt van lnyeges (szignifikns) klnbsg. A variancia-analzis utn elvgzend kzprtk sszehasonlt tesztek helyes alkalmazshoz azonban tudni kell, hogy a csoporton belli variancia vajon megegyezik-e. Ezeket a teszteket a ksbbi fejezetekben mutatjuk be.
21. bra: A vltozk s a tnyez megadsa
19. tblzat: A variancia-analzis eredmnye
ANOVA
terms t/ha
92.524 2 46.262 10.087 .000646.657 141 4.586739.181 143
Between GroupsWithin GroupsTotal
Sum ofSquares df Mean Square F Sig.
A fenti tblzat a szrs-elemzs eredmnyt mutatja. 5%-os elsfaj hibt vlasztva, megllapthat, hogy a talajmvelsi vltozatokban a kukoricatermse szignifiknsan klnbzik. Hangslyozzuk, hogy az F-prba eredmnye csak akkor fogadhat el, ha a hiba norml eloszls s a csoportokon belli variancik megegyeznek.
A modell rvnyessgnek vizsglata
Normalits vizsglat
- 74 -
-
Huzsvai Lszl: SPSS alkalmazsok
A variancia-analzis alkalmazhatsgnak felttele, hogy a fgg vltoz normlis eloszls legyen, pontosabban a klnbz kezelsek mintinak
22. bra. Az adatbzis megosztsa
(lnyegben azonban a hibnak, vagy eltrsnek) kell normleloszlsnak lenni. A kezelscsoportok elklntett elemzshez meg kell osztani az adatbzist a DATA, majd a SPLIT FILE kivlasztsa utn a megjelen ablakban vlasszuk a COMPARE GROUPS rdigombot, s a GROUPS BASED ON: ablakba helyezzk a talajmvels vltozt. Az OK gomb megnyomsa utn trjnk vissza az adatbzis ablakhoz.
Normalits vizsglatot az SPSS-ben tbbflekppen is vgezhetnk, pl. ANALYZE/NONPARAMETRIC TEST/1-SAMPLE K-S a megjelen prbeszdablakban (23. bra) adjuk meg a vizsgland vltozt, s jelljk be a normleloszlst (alapesetben ez van megjellve). A nullhipotzisnk ennek megfelelen az lesz, hogy a vizsglt vltoz eloszlsa nem klnbzik a normlis eloszlstl. Vlasszuk a szignifikancia szintet 5%-osra, s vgezzk el az analzist az OK gomb megnyomsval. Az eredmny a tblzatban lthat.
- 75 -
-
Huzsvai Lszl: SPSS alkalmazsok
23. bra. Az egymints Kolmogorov-Smirnov teszt
20. tblzat: A vltoz eloszlsnak vizsglata Kolmogorov-Smirnov prbval
One-Sample Kolmogorov-Smirnov Test
4811.506732.060577
.127
.095-.127.882.418
4810.309882.068890
.227
.148-.2271.574.014
489.56033
2.287441.263.136
-.2631.821.003
NMeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)N
MeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)N
MeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)
Talajmvelsszi sznts
tavaszi sznts
trcss
terms t/ha
Test distribution is Normal.a.
Calculated from data.b.
Az ASYMP. SIG. (2-TAILED) sort tanulmnyozva elmondhat, hogy az szi szntsos parcellk kukoricatermse normleloszls (p>0,05), azonban a msik kt talajmvelsi vltozat (tavaszi
- 76 -
-
Huzsvai Lszl: SPSS alkalmazsok
sznts, trcss) nem normleloszls, mert p0,05) (21. tblzat). Ez azt jelenti, hogy majd a kezelstlagok sszehasonltsa sorn nyugodtan alkalmazhatjuk az egyenl variancikat felttelez teszteket. Abban az esetben, ha a Levene-teszt a variancik klnbzsgt igazolja (22. tblzat), nem hasznlhatjuk a Fischer-fle tesztet. Ilyenkor robosztusabb prbt kell vlasztani, pl. Brown-Forsythe vagy Welch prbt (WELCH, 1938).
21. tblzat: A talajmvelsi vltozatokon belli variancik egyenlsgnek ellenrzse
- 77 -
-
Huzsvai Lszl: SPSS alkalmazsok
Test of Homogeneity of Variances
terms t/ha
1.096 2 141 .337
LeveneStatistic df1 df2 Sig.
22. tblzat: A talajmvelsi vltozatokon belli variancik egyenlsgnek ellenrzse
Test of Homogeneity of Variances
terms t/ha
5,144 2 141 ,007
LeveneStatistic df1 df2 Sig.
A statisztika panelen klnbz kiegszt szmtsokat krhetnk. Ler statisztika (Descriptive): esetek szma, tlag, szrs, az tlag hibja, minimum, maximum, 95%-os konfidencia intervallum mindenegyes csoportra. Fix s vletlen hatsok (Fixed and random effects):
Brown-Forsythe prbaEzt a prbt BROWN-FORSYTHE 1974-ben kzlte elszr. A szrsok klnbzsge esetn meg kell vizsglni, mirt klnbzik a szrs, milyen szakmai magyarzatot lehet r adni. Ha a szrsok klnbzsgnek semmilyen logikai vagy szakmai okt nem tudjuk megadni, nagy valsznsggel a szrsok vletlenl vagy valamilyen ksrleti hiba miatt klnbznek.A Welch s Brown-Forsythe-prba mezgazdasgi alkalmazsval mg nem tallkoztunk, ezrt a tbb ves kutatmunka tapasztalatai alapjn itt ragadjuk meg az alkalmat, hogy a hasznlatukhoz nhny tancsot adjunk. Ha a csoporton belli szrs ngyzetek (variancik) nem egyformk nyugodtan hasznlhatjuk a kezelstlagok egyenlsgnek tesztelsre brmelyiket a kett kzl. A legjobb, ha mindkettt kiprbljuk s sszehasonltjuk az eredmnyeket.
- 78 -
-
Huzsvai Lszl: SPSS alkalmazsok
Vlasszuk ki az OPTIONS prbeszdablakban (24. bra) a Brown-Forsythe s Welch prbkat s futtassuk le a programot jbl. A kapott eredmnyeket lentebb lthatjuk.
23. tblzat: A kezels kzprtkek sszehasonltsa robosztus tesztekkel
Robust Tests of Equality of Means
terms t/ha
3,238 2 83,571 ,0443,725 2 49,027 ,031
WelchBrown-Forsythe
Statistica df1 df2 Sig.
Asymptotically F distributed.a.
Ebben az esetben a kt teszt ugyanazt az eredmnyt adta, ha klnbsg lett volna a kt eredmny kztt, tovbb kell folytatni az rtkelst. Ilyenkor szlssges esetben a Welch-prba szignifikns klnbsget mutathat a kezels tlagok kztt, mg a Brown-Forsythe-prba nem. Mi lehet ennek az oka? Ez akkor kvetkezik be, ha a csoportok variancija nagyon nagymrtkben klnbzik egymstl. Ilyenkor az elklntett (separate) variancia tesztek a szabadsgfok cskkentsvel vlaszolnak, s ezzel rontjk a teszt eredmnyt. A variancik nagyon nagy mrtk klnbzsgt legtbbszr a csoportokon belli kiugr rtkek okozzk. A kiugr rtkek zavar hatst tbbflekppen szrhetjk ki. Az egyik hatsos eszkz a csonktott (trimmed) teszt, amikor mindenegyes csoportbl elhagyjuk a legnagyobb s legkisebb rtk 15%-t. A csonkols mrtkt szakmai megfontolsok miatt tetszlegesen megvltoztathatjuk. A csonkols utn megismtelt Brown-Forsythe prbban a szabadsgfokok szma nni fog s a teszt eredmnye javul (24. tblzat). A fenti felttelek esetn a szrs hagyomnyos meghatrozsa helyett a ROBUST SD s WINSORIZED SD kiszmtsa jobb becslst ad a csoporton belli szrs nagysgra. Ezek a prbk kevsb rzkenyek a kiugr rtkekre. A klnbz mdon kiszmtott szrsok sszehasonltsa kzvetett mdon, a csoporton belli variancik egyenlsgre vagy egyenltlensgre is rmutat. Szntfldn tszm
- 79 -
-
Huzsvai Lszl: SPSS alkalmazsok
ksrleteknl, ahol a variancik egyezsge nem vrhat, a Welch vagy Brown-Forsythe- ltal kidolgozott variancia-analzist kell alkalmazni.
24. tblzat: A kezels kzprtkek sszehasonltsa robosztus tesztekkel a csonkols utn
Robust Tests of Equality of Means
terms t/ha
9,905 2 93,797 ,00010,087 2 139,613 ,000
WelchBrown-Forsythe
Statistica df1 df2 Sig.
Asymptotically F distributed.a.
Kiugr rtkek vizsglataAz elz fejezetben lttuk, hogy a kiugr rtkek milyen nagymrtkben tudjk megzavarni a variancia-analzis eredmnyt. Ezrt a statisztikai elemzsek els s egyik legfontosabb lpse a kiugr rtkek ellenrzse. Az SPSS ennek ellenrzsre is knl lehetsget.
Az elemzs els lpseknt nzzk meg, hogy a kukoricaterms adataiban tallunk-e kiugr rtket. Van-e vajon adatrgztsi, gpelsi hiba? A kiugr rtkek ellenrzse az ANALYZE / DESCIPTRIVE STATISTICS blokkjban az EXPLORE parancs szolgl.
- 80 -
-
Huzsvai Lszl: SPSS alkalmazsok
25. bra. Az kiugr rtkek vizsglata
A DEPENDENT LIST mezbe helyezzk a vizsglni kvnt vltozt (vltozkat). Mivel mind a hrom talajmvelsre ellenrizni kvnjuk, hogy a kukoricaterms adatok tartalmaznak-e kiugr rtket, a FACTOR LIST mezbe helyezzk a terms vltozt. Ezzel rjk el, hogy a program a kiugr rtkeket talajmvelsi vltozatonknt kln-kln s nem sszevont llomnyon ellenrizze. A STATISTICS nyomgombra kattintva a megjelen beszdpanelban vlasszuk ki az OUTLIERS lehetsget (26. bra).
26. bra. Az kiugr rtkek vizsglata
A belltsok elvgzse utn futtassuk le a programot. A 25.tblzat talajmvelsi vltozatonknt az t legnagyobb s legkisebb rtket tartalmazza. A kiugr rtkek ugyanis biztos, hogy itt keresendk, hiszen azok vagy sokkal nagyobbak, vagy sokkal kisebbek, mint a tbbi rtk a mintban. A tblzatbl jl ltszik, hogy az szi szntsos adatokban a 9. s 10. adat kiugr rtk, adatrgztsi hiba miatt a tizedesvessz eggyel jobbra csszott. A msik kt talajmvelsnl nem tallunk kiugr eseteket. Hasonlan vgezhetjk el ms vltoz esetben is a vizsglatot.
A kiugr rtkek ellenrzsnek egy msik lehetsges mdja az adatok grafikus megjelentse. Az EXPLORE prbeszdpanel
- 81 -27. bra. A kiugr esetek
grafikus brzolsa
-
Huzsvai Lszl: SPSS alkalmazsok
ablakbl vlasszuk a PLOTS lehetsget (25. bra). A BOXPLOTS panelrszben jelljk meg a FACTOR LEVELS TOGETHER lehetsget, majd a CONTINUES gombra kattintva menjnk vissza a fablakba, s ott az OK gomb megnyomsval hagyjuk jv a statisztika szmtst. Ezt a vizsglatot mindhrom talajmvelsre futtatva a 28. brat kapjuk. A megjelen bra legals s legfels vonala a klnbz talajmvelsekben a kiugr rtkeket nem szmtva a mrt legnagyobb s legkisebb rtkeket jellik. Az brn e kt vonal alatt s fltt jelennek meg a kiugr rtkek (9. 10. adat szi sznts) pontok formjban brzolva1.
1 A kiugr rtkek ellenrzsre az SPSS mg szmos lehetsget knl, ezek tovbbi bemutatsra most nem kerl sor.
- 82 -
-
Huzsvai Lszl: SPSS alkalmazsok
25. tblzat: A kiugr rtket ellenrz tblzatExtreme Values
9 114,4110 113,5132 14,39535 14,39236 14,286
1 7,9062 7,957
13 8,0104 8,043
38 8,24884 13,11883 12,85978 12,74682 12,67280 12,56988 6,71587 6,86585 6,92949 7,07862 7,099
118 12,070115 11,966117 11,936129 11,859119 11,801135 5,355134 5,421136 5,652122 5,697124 6,059
123451234512345123451234512345
Highest
Lowest
Highest
Lowest
Highest
Lowest
Talajmvelsszi sznts
tavaszi sznts
trcss
terms t/haCase Number Value
484848N =
Talajmvels
trcsstavaszi szntsszi sznts
term
s t/
ha
140
120
100
80
60
40
20
0
-20
109
28. bra. A kiugr rtkek grafikus ellenrzse (box-plot bra)
- 83 -
-
Huzsvai Lszl: SPSS alkalmazsok
Egyvltozs lineris modell (GLM Univariate
Lehetsgek (Options)
- 84 -
-
Huzsvai Lszl: SPSS alkalmazsok
A lineris modell validlshoz kapunk segtsget a lehetsgek panelen. A legfontosabb lehetsgek:
Ler statisztika (descriptive statistics) A kezels nagysgnak becslse (estimates of effect
size): ez a parcilis eta meghatrozst jelenti. Megmutatja, hogy a fggetlen vltoz (ami gyakran nominlis tpus vltoz) hny szzalkban befolysolja a fgg vltoz variancijt. A szmts menete: a kezels SS (eltrs ngyzetsszeg) osztva az sszes SS-vel. A mutat rtke 0-1.00 kztt lehet. A nulla fggetlensget az 1.00 determinisztikus kapcsolatot jelent. A kztes rtkek a sztochasztikus kapcsolat erssgt becslik. Minl kzelebb van egyhez, annl ersebb a kt vltoz kztti sszefggs. Ennek a mutatnak termszetesen
- 85 -
-
Huzsvai Lszl: SPSS alkalmazsok
nincs eljele, gy a kapcsolat irnyt nem lehet vele jellemezni.
Homogenits teszt: a kezelskombincik csoporton belli variancijt teszteli. A variancia-analzis egyik alkalmazhatsgi felttelt tesztelhetjk vele. A H0: a variancik egyformk.
Maradkok brzolsa (residual plot): a standardizlt maradkokat brzolja a megfigyelt, ill. becslt rtkek fggvnyben.
Tbbvltozs variancia-analzis, (Multivariate)Tbb kvantitatv tulajdonsg egyttes figyelembe vtele alapjn kvnjuk kimutatni a kezelsek hatsa kztti klnbsgeket. Kt kezels kztti klnbsg szignifikancijnak vizsglata, D2 ltalnostott tvolsg tesztelse F-prbval. A DA a MANOVA hatresete. Hotelling T2.
Ismtelt mrsi modellek (Repeated Measures)
Variancia komponensek (Variance Components)
- 86 -
-
Huzsvai Lszl: SPSS alkalmazsok
KSRLETEK TERVEZSE S RTKELSE LTALNOS LINERIS MODELLEL
Az albbi fejezetekben a mezgazdasgi, fldmvelsi, nvnytermesztsi, nemestsi, fajta sszehasonlt, stb. ksrletek laboratriumi s klnbz szntfldi kisparcells elrendezseinek rtkelst mutatom be a teljessg ignye nlkl. Az ismertetsre kerl klasszikus elrendezsek tanulmnyozsa s megrtse segtsget nyjt a jvbeli ksrletek megtervezshez s kirtkelshez. A fejezetekben az elrendezs rvid ismertetse utn megadom a ksrlet vzrajzt, a matematikai modell lerst s a GLM-tblzat szerkezett valamint a kirtkelshez szksges parancsokat, amit a parancsszerkeszt (syntax editor) ablakban lehet futtatni. Az elrendezshez h kirtkels legfontosabb parancsa a DESIGN, ezrt ezt a GLM-tblzat szerkezetben is megadom. Ezt kveti a mintaplda GLM-tblzata, melyben a tnyezk, ngyzetsszegek, szabadsgfokok, tlagos ngyzetsszegek, F-prbk eredmnyei, valamint a szignifikancia szintek lthatk.
A variancia-analzis modellben a fgg vltozkat magyarzzuk fggetlen vltoz(k) segtsgvel. A magyarzat a fgg vltoz teljes heterogenitsnak2 kt rszre bontst jelenti. A teljes heterogenits egyik rsze az, amelynek okai a fggetlen vltozk, a msik heterogenits-rsz pedig az, amelynek okait az egyb, ltalunk nem vizsglt tnyezk tartalmazzk. Ez utbbit sokszor a vletlen hatsaknt is emlegetik. A heterogenits mrsre tbbfle mrszm szolgl:
(1) range (terjedelem); a legnagyobb s legkisebb rtk kztti tvolsg
(2) tlagos eltrs;
=
=
N
ii xxN 1
1 ;
(3) szrs; ( )
==
N
ii xxN 1
21 ;
2 A vltoz heterogenitsa azt jelenti, hogy az adott vltoz nem konstans.
- 87 -
-
Huzsvai Lszl: SPSS alkalmazsok
(4) variancia- vagy szrsngyzet; ( )
=
=
N
ii xxN 1
22 1 .
Ebbl ltszik, hogy a fgg vltoznak magas (intervallum- vagy arnyskla) mrsi szintnek kell lenni. Attl fggen, hogy a fggetlen vltozk alacsony vagy magas mrsi szintek, eltr magyarz modelleket kell felpteni. Ha ugyanis a fggetlen vltozink nominlis vagy ordinlis mrsi szintek, akkor variancia-analzissell kereshetjk a magyarzatot a fgg vltoz viselkedsre. Ha a fggetlen vltozk is magas mrsi szintek, akkor regresszi-analzist alkalmazhatunk. (Ha a fgg vltoz alacsony mrsi szint, a magyarzatra szolgl vltozk pedig magas mrsi szintek, akkor diszkriminancia-analzist hasznlhatunk.)A variancia-analzis sorn kettnl tbb sokasg kzprtkeinek minta alapjn trtn sszehasonltsa trtnik. Ezrt nevezik a ktmints t-prba ltalnostsnak. A variancia-analzis modellek olyan rugalmas statisztikai eszkzk, amelyek alkalmasak valamely kvantitatv (numerikus vagy intervallum sklj) vltoznak (fgg vltoznak) egy vagy tbb nem felttlenl kvantitatv vltozval (fggetlen vltozk) val kapcsolata elemzsre. Arra vagyunk kvncsiak, hogy van-e hatsa a fggetlen vltozknak a fgg vltozra, s a hats klnbzik-e vagy egyforma? A hats, kapcsolat fggvnyszer lersa azonban nem clunk, mg akkor sem, ha a fggetlen vltozk kvantitatvak. A regresszi-analzistl kt szempont klnbzteti meg a variancia-analzist:
A vizsglt fggetlen vltozk kvalitatvak is lehetnek (pl. a vizsglt szemly neme, lakhelye stb.). Ebben az esetben ugyanis regresszi-analzis nem alkalmazhatunk.
Mg ha a fgg vltozk kvantitatvak is, nem cl a fggetlen vltozval val kapcsolat termszetnek feltrsa. A szrsanalzist tekinthetjk a regresszi-analzis vizsglat megelz vizsglatnak, ha ugyanis pozitv sszefggst kapunk a fgg s fggetlen vltoz
- 88 -
-
Huzsvai Lszl: SPSS alkalmazsok
kapcsolatra, akkor van rtelme vizsglni az sszefggs jellegt.
AlapfogalmakNzzk t azokat az alapfogalmakat, amelyeket a variancia-analzis sorn hasznlunk.
a)