· web view tölthető le. 4.2.4.2. 4.2.4.2 labdsv ez a csomag pedig ökológiai alkalmazásokra...

Download  · Web view tölthető le. 4.2.4.2. 4.2.4.2 labdsv Ez a csomag pedig ökológiai alkalmazásokra készült. Itt a pca függvény számítja ki a főkomponenseket, gyakorlatilag a

If you can't read please download the document

Upload: dinhque

Post on 30-Apr-2018

220 views

Category:

Documents


2 download

TRANSCRIPT

Tbbdimenzis statisztika

Tbbdimenzis statisztika

Tbbdimenzis statisztika

Prhle, Tams

Zemplni, Andrs

Tbbdimenzis statisztika

rta Prhle, Tams s Zemplni, Andrs

Publication date 2013

Szerzi jog 2013 Prhle Tams, Zemplni Andrs

Created by XMLmind XSL-FO Converter.

Created by XMLmind XSL-FO Converter.

Created by XMLmind XSL-FO Converter.

Tartalom

Tbbdimenzis statisztika 0

1. 1 Elsz 0

2. 2 Ksrlettervezs 0

2.1. 2.1 Bevezet 0

2.2. 2.2 Teljes faktorilis tervek 0

2.2.1. 2.2.1 Vletlents 0

2.2.2. 2.2.2 Szrselemzs, ANOVA 0

2.2.3. 2.2.3 Plda: paprhelikopter-tervezs 0

2.3. 2.3 Rszfaktorilis tervek 0

2.4. 2.4 Blokkosts 0

2.5. 2.5 Az R ksrlettervezsi csomagjainak bemutatsa 0

3. 3 Nem-lineris regresszi 0

3.1. 3.1 Bevezet 0

3.2. 3.2 ltalnos nem-lineris regresszi 0

3.2.1. 3.2.1 A nem-lineris regresszi matematikai leirsa 0

3.2.2. 3.2.2 A nem-lineris regresszi R-beli technikja 0

3.2.3. 3.2.3 A nem-lineris regresszi a gyakorlatban 0

3.3. 3.3 Monoton regresszi 0

3.3.1. 3.3.1 A monoton regresszi algoritmusai 0

3.3.2. 3.3.2 Monoton regresszi az Rp segitsgvel 0

3.4. 3.4 ltalnostott lineris regresszi 0

3.4.1. 3.4.1 Az ltalnostott lineris modell 0

3.4.2. 3.4.2 Az ltalnostott lineris modell a gyakorlatban 0

3.4.3. 3.4.3 Modell csaldok a glm fggvnyhez 0

4. 4 Dimenzicskkentsi eljrsok 0

4.1. 4.1 Bevezet 0

4.2. 4.2 Fkomponens-analzis 0

4.2.1. 4.2.1 A feladat megfogalmazsa 0

4.2.2. 4.2.2 Becsls az adatok alapjn 0

4.2.3. 4.2.3 Plda alkalmazsok 0

4.2.4. 4.2.4 R fggvnyek 0

4.3. 4.3 Faktoranalzis 0

4.3.1. 4.3.1 A feladat megfogalmazsa 0

4.3.2. 4.3.2 Pldk 0

4.3.3. 4.3.3 R fggvnyek 0

5. 5 Tbbdimenzis regresszi 0

5.1. 5.1 Bevezet 0

5.2. 5.2 Parcilis regresszi 0

5.2.1. 5.2.1 Mirt van szksg a PLS modellre? 0

5.2.2. 5.2.2 A PLS komponensek defincija 0

5.2.3. 5.2.3 PLS modellek a gyakorlatban 0

5.3. 5.3 A path analizis 0

5.3.1. 5.3.1 A PATH trtnet 0

5.3.2. 5.3.2 A PATH fogalmak 0

5.3.3. 5.3.3 PATH modellek a gyakorlatban 0

5.4. 5.4 A SEM modellek 0

5.4.1. 5.4.1 A SEM trtnet 0

5.4.2. 5.4.2 A SEM fogalmak 0

5.4.3. 5.4.3 SEM modellek a gyakorlatban 0

6. 6 Sklzs 0

6.1. 6.1 Bevezet 0

6.2. 6.2 Tvolsgok brzolsa 0

6.2.1. 6.2.1 Tvolsgok egzakt brzolsa 0

6.2.2. 6.2.2 Az brzolhatsgi felttel ltalnostsa 0

6.3. 6.3 Tvolsgok kzelt brzolsa 0

6.3.1. 6.3.1 Kzelts normban 0

6.3.2. 6.3.2 Kzelts normban 0

6.3.3. 6.3.3 A tvolsgok fggvnynek kzelt brzolsa 0

6.3.4. 6.3.4 Kzelts ltalnostott felttelek mellett 0

6.4. 6.4 Az elmlet demonstrcija 0

6.4.1. 6.4.1 Egy hromszg s a kr irhat kr 0

6.4.2. 6.4.2 A patkeffektus interpretcija 0

6.5. 6.5 Sklzst vgz R programok 0

6.5.1. 6.5.1 A stats::cmdscale() eljrs 0

6.5.2. 6.5.2 A MASS::sammon() eljrs 0

6.5.3. 6.5.3 A MASS::isoMDS() eljrs 0

6.5.4. 6.5.4 A SensoMineR::indscal() eljrs 0

6.5.5. 6.5.5 A smacof csomag sklz eljrsai 0

6.6. 6.6 A sklzs alkalmazsai 0

6.6.1. 6.6.1 Korrespondencia analzis 0

7. Hivatkozsok 0

Tbbdimenzis statisztika

Tbbdimenzis statisztika

Created by XMLmind XSL-FO Converter.

Created by XMLmind XSL-FO Converter.

Created by XMLmind XSL-FO Converter.

Tbbdimenzis statisztika

1. 1 Elsz

Ez a jegyzet az ELTE TTK Matematikai Intzet Valsznsgelmleti s Statisztika Tanszken tartott tbbdimenzis statisztika trgyak tanulshoz kvn segtsget nyjtani, elssorban gyakorlati szempontbl. A jegyzet felhasznlja a valsznsgszmts s a matematikai statisztika alapfogalmait, ezrt rtelemszeren ezek utn a kurzusok utn ajnlott a tanulmnyozsa. Azonban nem clunk az elmlet teljeskr feldolgozsa, csak a mdszerek, alkalmazsok megrtshez felttlenl szksges mlysgben trgyaljuk ezeket. Nhny kevss ismert, rdekes modellnl azonban kivtelt tesznk s felvillantjuk a bizonytsok alapgondolatt is.

A jegyzetben a fogalmak, megkzeltsmdok rvid ismertetse utn pldkon keresztl mutatjuk be a mdszereket, ezek lnyege remnyeink szerint a trstudomnyok mveli (mrnkk, pszichometrikusok, termszettudsok) szmra is rthet lesz. Ezeket a pldkat a nylt forrskd R program [26] s szmos kiegszt csomagja segtsgvel oldjuk meg, sok esetben a hasznlt programkdokat is megadva. gy az olvas kpes lesz arra, hogy sajt praxisban felmerl hasonl jelleg krdseket is sikerrel vlaszolja meg. Az R progamon bell is ltalban tbb csomag kzl vlaszthatunk egy adott feladat megoldsnl, ezek sszehasonltsra is kitrnk. A gyorsan fejld tmknl az aktulis, relevns szakirodalom felkutatsnak hatkony mdszere a programok hivatkozslistjnak tnzse. Mi itt most nem vllalkoztunk ezek kigyjtsre, a legfontosabb "klasszikus" knyvek mellett az R csomagjait s adatelemzseket vgz internetes oktatsi segdanyagokat tartalmazza a hivatkozsjegyzk.

Az els fejezet a ksrlettervezs alapfogalmait mutatja be. Elssorban a leggyakrabban hasznlt faktorilis terveket s a gyakorlati megvalsts sorn felmerl krdseket veszi sorra. Jpr pldn keresztl kerlnek bevezetsre olyan fogalmak, mint a tervek felbontsa. A kapott eredmnyek kirtkelsi mdszereit is bemutatjuk, gy elssorban a szrselemzst. Ugyanakkor a terjedelmi korltok miatt szksgszeren kimaradnak fontos rszek, ezeket pldul Kemny s Dek tanknyvbl [20] ismerheti meg az rdekld olvas.

A 3 fejezet a nemlineris regresszival foglalkozik, rszletesen bemutatva az R rengeteg beptett regresszis fggvnyt. Kln rszben szerepel a monoton regresszi mdszere, itt nhny egyszer bizonyts is tallhat. Vgl az nmagban is kiemelked fontossg ltalnostott lineris model kvetkezik. A [29] knyv hasznos tovbbi informcikat nyjt.

A kvetkez fejezet a klasszikusnak szmt fkomponens- s faktoranalzis modelljeivel foglalkozik. Ezek a dimenzicskkent eljrsok arra is alkalmasak, hogy az adatok rejtett kapcsolatait feltrjk, ezrt alkalmazsi lehetsgk igen szles kr. A bemutatott pldk is megfelelnek ennek a sokoldalsgnak: a pszichometritl a pnzgyi alkalmazsokig lthatunk adatelemzst. Az elmlet itt nem trgyalt rszei pldul a [32] knyvben olvashatak. J sszefoglal az angol nyelv [4] knyv is.

Az 5 fejezet a tbbdimenzis regresszi modern eljrsaival foglalkozik. Ezen bell kln rszben szerepel a parcilis regresszi, a path analzis s a SEM (struktrlis egyenlet-modell) megkzelts. Mivel igen j tmrl van sz, a tovbbi informcik itt legclszerbben az R kapcsold dokumentcijbl szerezhetek be. Az utols fejezetben a tbbdimenzis sklzst s a korrespondencia analzist ismertetjk. Itt is nagy szerepet kap a klnbz R csomagok s az ltaluk megoldott minta-adatelemzsek bemutatsa. Az elmlet tovbbi fejezetei itt is megtallhatak a [32] vagy a [4] tanknyben.

A jegyzethez kapcsoldan animcikat is ksztettnk. Ezek a szvegben megadott honlapokrl rhetk el, s mindenkinek nagyon ajnljuk a tanulmnyozsukat! Segtsgkkel az ppen ismertetett mdszerek gyakorlati tulajdonsgai, a bemutatott eljrsok klnbz adatok, illetve paramterezs melletti eredmnyei figyelhetk meg.

Vgl nhny apr megjegyzs. Mivel az R tipikusan az angolszsz jellsrendszernek megfelelen tizedespontot hasznl, ezrt mi is ezt alkalmazzuk a szvegben is, hogy fenntartsuk az sszhangot a program outputjaival. A programkdok legfontosabb rszeit is megadjuk a jegyzetben, ezzel is segtve az olvas szmra az nll munkt. Ezek knnyen felismerhetek a szvegkrnyezettl eltr bettpus segtsgvel, idnknt megjegyzsek is segtik a megrtsket. A foly szvegen bell ... jelli az R utastsokat, vltozkat, attribtumokat.

A "Ksrlettervezs" (2) s a "Dimenzicskkentsi eljrsok" (4) fejezet, valamint a szerkeszts s az animcik Zemplni Andrs, a "Nem-lineris regresszi" (3), a "Tbbdimenzis regresszi" (5) s a "Sklzs" (6) fejezet Prhle Tams munkja. Ksznjk a lektornak, Gll Jzsefnek (Debreceni Egyetem) a hasznos szrevteleket.

2. 2 Ksrlettervezs

2.1. 2.1 Bevezet

Elszr magnak a ksrletnek a fogalmt kell tisztznunk. A statisztikban tbbnyire nem irnytott ksrletek eredmnyeit elemezzk, hanem a vletlenszer megfigyelsek adataival dolgozunk. A lnyeges klnbsg a kt adattpus kztt, hogy mg a megfigyelseknl az egyes vltozk rtkeit nem mi kontrollljuk (pl. idjrs, pnzgyi folyamatok), a ksrleteket mi magunk tervezzk, elre meghatrozva a bellthat paramterek rtkeit.

Mire is hasznlhatjuk ezeket a ksrleteket? Elssorban az iparban, de mshol is lnyeges lehet annak vizsglata, hogy egy termk adott tulajdonsgt milyen gyrtsi technolgival lehet optimalizlni (pldul: mikor lesz a gyrtott ktl szaktszilrdsga a legnagyobb). Ehhez hasonl krdsekre precz vlaszt a ksrlettervezs eszkzeinek alkalmazsval kaphatunk. A ksrlet eredmnyt befolysol tnyezket faktoroknak nevezzk. A ksrletek sorn ezek belltst (itt most szinteknek nevezzk) vltoztatjuk.

A f problmt az jelenti, hogy a ksrletek tipikusan drgk s idrablk (gondoljunk csak bele: a legklnbzbb faktorokat kell minden egyes alkalommal adott szintre belltani), ezrt nem mindig lehet az sszes faktor-kombincira elvgezni a ksrleteket.

Ltni fogjuk, hogy ezekben az esetekben gynevezett rszfaktorilis tervek jelenthetik a megoldst. Ezek sajtos tulajdonsga az alias struktra azaz az, hogy bizonyos hatsok nem becslhetk kln, hanem csupn ms idelis esetben jval magasabb rend klcsnhatssal egytt. A mrnkk feladata eldnteni mg a tervezs fzisban , hogy ilyen esetben egyrtelmsthet-e a tnylegesen hat faktor(kombinci). Ha nem, akkor tovbbi ksrletek vgzsre, jobb felbonts tervek ksztsre van szksg.

Ugyanakkor arra minden esetben trekednnk kell, hogy a ksrletek fedjk le a gyakorlatban felmerl lehetsgeket (ne csak egy rszt vizsgljuk, mg ha az knyelmesebbnek is tnik), mert csak gy vrhat, hogy valban hasznlhat eredmnyeket kapjunk.

A ksrlet eredmnyt befolysol tnyezket faktoroknak nevezzk. Az rtkket a ksrlet sorn szisztematikusan vltoztatjuk, ezek a belltsok a faktorok szintjei. A vrhatan legfontosabb faktorokat igyeksznk elzetesen meghatrozni. A tbbi faktort pedig zajfaktornak tekintjk s a ksrlet megtervezse sorn arra gyelnk, hogy hatsuk minimlis legyen. Ez trtnhet vletlentssel vagy blokkostssal. A ksbbiekben visszatrnk ezen mdszerek rszletes ismertetsre. Lnyeges, hogy foglalkozzunk ezekkel a krdsekkel, mert a gyakorlatban mindig vannak olyan hatsok, amket nem tudunk vagy nem lehetsges belltani (kls krlmnyek), de hatsuk nem biztos, hogy elhanyagolhat.

A leggyakrabban hasznlt faktorilis tervek rszletes ismertetsre a 2.2 fejezetben trnk ki. De elszr rdemes megjegyezni, hogy mirt van egyltaln szksg ilyen sszetett matematikai appartusra az optimum keressnl. Logikusnak tnhet az a mdszer is, ami szerint sorra vesszk a faktorokat s egyesvel mindegyikre megkeressk az optimlis belltst. A gond ezzel az egyesvel trtn optimalizlssal (one factor at a time, OFAT), hogy nem tudja figyelembe venni a faktorok kztt igen gyakran megfigyelhet klcsnhatst. Ennek eredmnyeknt az gy kapott megolds egyltaln nem biztos, hogy optimlis lesz. Tekintsk a 1 brn lthat eredmnyeket, amelyek 3 faktor hatst mutatjk. Ha a bal als sarokbl indulunk, akkor brmely faktort is mdostjuk, az eredmny rosszabb lesz a kiindulpontbelinl. De a faktorilis ksrleti terv alapjn meg tudjuk tallni a jobb fels sarokban a meglepen nagy clrtket.

Az eredmnyek kirtkelse a szrselemzs (2.2.2 alfejezet) segtsgvel trtnhet, de jnhny, a ksrlettervezsre jellemz specilis technika is alkalmazhat, ezeket is bemutatjuk. Lnyeges, hogy a tervnk eredmnyeknt az eredmnyek megbzhatsgrl is kpet kapjunk, pldul tudjunk konfidencia intervallumokat szerkeszteni, szignifikancia-szinteket becslni.

A fejezet anyaga jelentsen pt Oehlert 2010-es knyvre [25], amely szabadon letlthet s nagy segtsget jelenthet azoknak, akik a most bemutatsra kerl zeltn tlmenen is rdekldnek a tma irnt.

2.2. 2.2 Teljes faktorilis tervek

Azokat a terveket nevezzk teljes faktorilis tervnek, amelyeknl az sszes vizsgland faktor minden szint-kombincijn elvgezzk a ksrleteket. A leggyakrabban kt szinten vgezzk a mrseket. Ennek egyrszt gyakorlati okai vannak: pldul az faktor 3 szintjn szksges kisrlet mr elg kis rtkekre is nagysgrendekkel tbb, mint a kt szinthez tartoz . Msrszt ugyan igaz, hogy ilymdon csak lineris hatsokat tudunk detektlni (2 pontra csak egyenest tudunk illeszteni, magasabb hatvnyhoz tartoz polinomot nem), de sokszor elegend a lineris hats kimutatsa pldul a vltoztats irnynak meghatrozshoz erre pedig mr a csak 2 szinten elvgzett ksrlet is alkalmas. Radsul a matematikai mdszerek is sokkal egyszerbbek erre az esetre, ezrt a mdszer bemutatsra klnsen kzenfekv ezt vlasztani.

Ennl a legegyszerbb, ktszint tervnl a szinteket clszeren +1 (magas), -1 (alacsony) rtkekkel jellhetjk. Ez tbb szempontbl is igen praktikus:

ilymdon a ksrlet mtrixa (amelynek soraiban az egyes ksrleteknl a faktorok szintjeinek megfelelen +1, illetve -1 ll) ortogonlis oszlopvektor. Ez azt eredmnyezi, hogy az egyes paramterek becslse korrellatlan (normlis eloszls hiba esetn fggetlen is) lesz,

a szintekhez rendelt szmok rvn a szorzatuk rtelmess vlik, s ez ppen a klcsnhats szintjnek felel meg: ha a szorzat +1, akkor a kt faktor azonos szinten ll, mg a -1 az ellenttes szintnek felel meg. A 2.2.2 alfejezetben rszletesebben visszatrnk erre a fontos krdsre.

2.2.1. 2.2.1 Vletlents

Ahogy mr a bevezetben emltettk, nem tudunk minden potencilis tnyezt faktorknt figyelembe venni a ksrlet sorn. Ha viszont ezeknek a tnyezknek mindig az azonos (vagy hasonl) szintje esne egybe valamely vizsglt faktor adott szintjvel, akkor nem lenne lehetsgnk ennek a kt hatsnak a klnvlasztsra. Hiszen nem tudhatjuk, hogy a trtnetesen megfigyelt jobb eredmny a vizsglt faktornak, vagy a zaj-tnyeznek a kvetkezmnye-e. Ilyen zajfaktor lehet pldul

az id: a ksbb vgzett ksrletek a gp kopsa, a kezel fradtsga miatt adhatnak rosszabb, de a bemelegeds, tanuls hatsra akr jobb eredmnyt is,

a kezel: ha tbb mszakra hzdik el a ksrlet, akkor a mszakvlts az eredmnyeket is befolysolhatja.

Nzznk nhny tovbbi pldt a vletlentsre.

Egy orvosi ksrletben arra vagyunk kvncsiak, hogy az j gygyszer van-e olyan hatsos, mint a hagyomnyos mtti kezels. A vllalkoz betegeket be kell osztanunk kt csoportra aszerint, hogy melyik kezelst is kapjk. Ha ezt az orvos dnti el, akkor felteheten a jobb llapotban lev betegeket vlasztan ki a mttre, mert az ersen megterheli a szervezetet - egyttal a slyosabb llapot, gyengbb betegek kerlnnek a gygyszeres csoportba. Ennek eredmnyeknt nem tudnnk sztvlasztani az ltalnos llapot hatst a mtt hatstl. Ha viszont vletlentssel vlasztjuk ki a gygyszeres kezelsben rsztvevket, akkor ez a kevereds nem lp fel.

Egy irodban szeretnk tesztelni, hogy kt billentyzet kzl melyik a jobb. Ebbl a clbl mind a 10 titkrn megkap egy szveget, amit mindkt billentyzettel begpel, s a mrt idk alapjn dntnk arrl, hogy melyik a hatkonyabb. Ha minden titkrn elbb az "A", azutn pedig a "B" billentyzettel dolgozik, akkor lehet, hogy a szveg ismertsge miatt a msodik billentyzet elnyben van. Vagy ppen ellenkezleg a fradtsg miatt lehet az els billentyzet elnyben. Nem tudhatjuk elre, melyik tnyez jelentkezik a valsgban de egyrtelm, hogy egyik esetben sem kapunk vlaszt a krdsnkre, mert nem tudjuk eldnteni, hogy a billentyzet vagy az id hatsa volt a klnbsg. Ezrt vletlenteni kell: 5 vletlenszeren kivlasztott titkrn az "A", az 5 msik pedig a "B" billentyzettel kezdi a munkt.

A fenti pldk jl megvilgtottk a vletlents fontossgt. Az is lthat ezekbl, hogy vletlenteni akkor is clszer, ha elre nem ltunk olyan okot, ami ezt felttlenl indokoln. Hiszen ltalban csupn minimlis plusz munkt jelent, de megvd az esetleges tves kvetkeztetsektl. Termszetesen nem csak a ksrletek sorrendjt lehet vletlenteni, hanem minden ms olyan komponenst is, amelyeket nem szerepeltetnk faktorknt (anyag, gp, kezel stb.).

Ha van olyan tnyez, amelyrl hatst is feltteleznk, akkor ezt blokkostssal (2.4 pont) be is tudjuk vonni a kirtkelsbe.

A vletlents fizikai megvalstshoz minden szbajv szmtgpes programban rendelkezsre llnak vletlen szmok st sok clprogram maga alaprtelmezsknt hozz is rendel vletlen sorszmot a ksrletekhez. A 2 bra egy ilyen vletlentett rszleges faktorilis ksrleti tervet mutat 8 faktorra. Lthatjuk hogy a faktorszintek belltsai nem szisztematikusan vltakoznak.

2.2.2. 2.2.2 Szrselemzs, ANOVA

A szrselemzs lnyege - az egyfaktoros (gyakran egyszempontosnak is nevezett) esetben - a kvetkez: ha a faktornak nincs befolysa a mrsi eredmnyre, akkor az sszes egyedi eredmnyt azonos alapsokasgbl szrmaznak tekinthetjk. Ezek, s gy az tlagok is csak a kzs vrhat rtktl val vletlenszer eltrseknek (ksrleti zajnak) vannak kitve. Ellenkez esetben a faktornak szignifikns hatsa van a mrsi eredmnyre a faktor szintjeihez tartoz eloszlsok vrhat rtkei szignifiknsan klnbzek lesznek.

A modellnk lnyege, hogy a szmunkra lnyeges, optimalizland mennyisget vletlennek (matematikai szhasznlattal: valsznsgi vltoznak) tekintjk. A legegyszerbb, egyfaktoros modell:

ahol a faktor -edik szintjn mrtk az rtkeket ().. Itt az adott faktorszinten kapott vrhat rtk, pedig a vletlen hiba (zaj). Ezek az rtkek egymstl fggetlenek s 0 vrhat rtkek.

A modellnk valjban egy lineris modellknt is felfoghat, ahol a fggetlen vltozk mtrixnak minden sorban csak egyetlen nem 0 rtk van ppen az adott faktorszintnek megfelel oszlopban. Ez rszletesen megtallhat pldul a [22] lersban.

Az elnevezsek arra is utalnak, hogy faktor lehet mennyisgi (kemence hmrsklete), de minsgi is (alapanyag tpusa). Nagyon knny a (1) sszefggsben szerepl egytthatk becslse: egyszeren vehetjk az adott szinten megfigyelt rtkek tlagt. Ugyanakkor a f krds az, hogy vajon az adott faktor hatsa (teht az -re kapott becslsek rtkeinek eltrse) szignifikns-e, azaz kellen nagy-e annak a valsznsge, hogy a ksrletek megismtlse esetn is ugyanilyen irny eltrseket kapunk-e. Ennek a matematikai vizsglatra alkalmas a szrselemzs.

Az egyszempontos szrselemzs sorn fggetlen, normlis eloszls, azonos szrsngyzet alapsokasgot tteleznk fel, s azt a nullhipotzist vizsgljuk, hogy az sszes kzprtk azonos , teht az eredmnyeink azonos vrhat rtk alapsokasgokbl szrmaznak. Mivel azonos szrsngyzeteket tteleztnk fel, a nullhipotzis egyttal azt is jelenti, hogy az sszes mrsi rtk egy s ugyanazon alapsokasgbl szrmazik.

A gyakorlatban, hogy a klnbsgek (hatsok) vizsglata szemlletesebb s matematikailag egyszerbb legyen, ltalban az

modellt alkalmazzk, ahol az -edik szint hatsa, pedig a fentiekben definilt tlagos hats.

Mivel csak csoportunk van s paramternk, ezrt egyikket tetszs szerint bellthatjuk. Ez a vlaszts azonban nem rinti a mdszer eredmnyt, csupn a kpletek alakjt mdostja. Taln a leggyakoribb az a vlaszts, ami szerint

ahol az -edik szinten vgzett ksrletek szma, pedig ezek sszege (a teljes ksrleti terv elemszma). gy a hatsok slyozott tlaga lesz 0:

Abban a tipikus esetben, amikor minden szinten ugyanannyi ksrletet vgeztnk, a slyozott tlagok helyett egyszer szmtani tlagokat vehetnk.

Az R program ugyanakkor azt a mdszert alkalmazza, hogy az els faktorszint hatst vlasztja referencinak, azaz 0-nak s a tbbi rtket ehhez viszonytja.

Az ismeretlen hatsokat az adataink alapjn becslhetjk, a kvetkezkppen: legyen

az -edik szinten az eredmnyek tlaga. A ftlag (az sszes megfigyels tlaga):

Ha a csoportokban a hatsok eltrek is lehetnek, akkor az kzprtk torztatlan becslse

mg az azonosnak felttelezett kzprtkek esetn

Ebbl az -edik szint hatsnak becslse:

Az gynevezett bels ngyzetsszeg (a csoportokon belli eltrsek ngyzetsszege, a "W" index a "within" sz rvidtse):

A megfigyelseink szrst is becslnnk kell. Itt kihasznlhatjuk, hogy minden szinten ugyanaz a szrs, ezrt

A nevezben azrt szerepel , mert minden csoportban kapunk egy szabadsgfok becslst s ezekbl az sszeg szabadsgfoka , teht (3) torztatlan becsls -re, fggetlenl attl, hogy melyik hipotzis is az igaz.

A csoportok kztti klnbsget mri a csoportok kztti eltrs-ngyzetsszeg (a "B" index a "between" sz rvidtse):

Ennek szabadsgfoka rtelemszeren , hiszen tlagot hasonltunk ssze gy, hogy egy paramtert becsltnk (a ftlagot).

A kt ngyzetsszeg sszege ppen a teljes ngyzetsszeg ():

Ennek bizonytsa egyszer, csak be kell hozni a jobboldalon lthat ngyzetsszegeket az egyszer

talaktssal s szre kell venni, hogy a ngyzetek kifejtsnl a ktszeres szorzatok kiesnek.

A hipotzisvizsglatra a lineris modellnl alkalmazhat (l. pldul [20]) F-prbt hasznlhatjuk:

A nullhipotzis (azaz nincsen klnbsg a szintek kztt) esetn ppen eloszls szabadsgfokokkal. A prba teht akkor utastja el a nullhipotzist elsfaj hibavalsznsg mellett, ha rtke nagyobb, mint a megfelel eloszls kvantilise.

A mdszereket egy egyszer pldn szemlltetjk. Tegyk fel, hogy acldrtok szaktszilrdsgra vonatkozan kt ksrletet is vgeztnk. Az eredmnyeket a 3 bra mutatja. A kt diagram kt klnbz mrsi eljrs eredmnyt tartalmazza. Jl lthat, hogy a baloldali sokkal pontosabb, kisebb hibj, mg a jobboldalon szerepl mdszer hibja sokkal nagyobb de az tlagok azonosak a kt esetre.

A minta-adatokra a kvetkez R-kd vgzi el a szrselemzst:

library(doBy)ex.data