pl.nov.n. pokus. (kap 3).ppt [jen pro .ten.] · parsimonie a modelování v s-plus •při...

Post on 29-Aug-2019

218 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Plánování pokusů

• Replikace (opakování) kvůli spolehlivosti (reliability)

• Randomizace (znáhodnění) kvůli zabráněnízkreslení výsledků (bias)

• Princip parsimonie• Síla statistického testu• Kontroly• Efektivní experimentální uspořádání• Rozpoznání pseudoreplikací• Rozdíl mezi experimentálními a observačními

daty (ortogonalita)

Princip parsimonie (Occamovabřitva)

• Máme-li několik alternativních vysvětlení, správné vysvětlení je to, které je nejjednodušší

• Modely by měly mít co nejméně parametrů• Lineární modely mají přednost před nelineárními• Experimenty spoléhající na méně předpokladů

jsou upřednostňovány před experimenty založenými na více předpokladech

• Jednodušší vysvětlení jsou upřednostňována před složitějšími

Parsimonie a modelování v S-Plus

• Při modelování je proměnná ponechána v modelu jen tehdy, jestliže způsobí statisticky průkazný vzrůst variability při odstranění z modelu

• „Model by měl být tak jednoduchý jak je to možné. Ale nikoli jednodušší.“ (A. Einstein)

Pozorování, teorie a experiment

• … navzájem promyšleně kombinované jsou nejlepší cestou k řešení vědeckých problémů

Opakování dělá n

• Děláme-li stejnou věc s různými jedinci, dostaneme různé výsledky

• Příčiny jsou různé: genotyp, věk, pohlaví, substrát, mikroklima …

• Cílem je zvýšit spolehlivost odhadu parametrů a jejich rozptylu

Co je správné opakování

• Měření musí být nezávislá: opakovaná měřenístejného jedince nebo na stejném místě nejsou nezávislá

• Nesmí tvořit časovou řadu: data sbíraná na stejném místě při různých příležitostech nejsou nezávislá

• Nesmí se dávat dohromady z jednoho místa: nejsou pak prostorově nezávislá

• Měření musí být prováděno ve správném prostorovém měřítku

Co je ideální opakování

• Jedno opakování z každého typu ošetření je uspořádáno do bloku a tyto bloky jsou mnohokrát opakovány

Jak mnoho opakování

• Tak mnoho jak si můžete dovolit• 30; menší vzorek je malý, větší je velký;

není to ale vždycky pravda• Správnou minimální velikost vzorku lze

spočítat; potřebujeme k tomu pilotní studii

Opakování nebo bloky?

• Mnoho opakování v malém počtu bloků?• Mnoho bloků bez opakování uvnitř bloku?• Většinou lepší více bloků, protože

variabilita je většinou veliká• Opakování uvnitř bloku ale umožňuje

specifikovat interakci (blok) x (ošetření) a tak odhadnout podíl chyby měření

Znáhodnění (randomizace)

• Náhodně vybraný objekt zájmu je takový objekt, který splňuje podmínku, že měl stejnou šanci být vybrán jako všechny ostatní objekty zájmu

• „Dělejte to tak, jak říkám, nikoli tak, jak to dělám“

Znáhodnění (randomizace)

• Toxikologický test na broucích potemnících• Kontaktní insekticidy: 4 typy + kontrola,

pro každé ošetření a kontrolu 3 Petrihomisky, na každou misku 10 brouků

Síla testu

Správné rozhodnutíChyba I. druhuOdmítnuta

Chyba II. druhu Správné rozhodnutíPřijata

NepravdaPravda

Skutečná situaceNulová hypotéza

• Pst zamítnutí nulové hypotézy když je nepravdivá• Souvisí s chybou II. druhu (beta)• Čím menší bude chyba II. druhu, tím větší bude chyba I. druhu (alfa)• Většinou pracujeme s alfa = 0,05 a beta = 0,2; síla testu (1 – beta) je

pak rovna 0,8• Tato síla testu se konvenčně používá k výpočtu velikosti vzorku, který

je nutný k určení definované velikosti rozdílu mezi vzorky pro známou nebo odhadnutou standardní chybu (např. z pilotní studie)

Experimentální studie

1. Formulujte jasnou hypotézu– Musí být jednoznačná, tj. nesmí být

vysvětlitelná jinými jevy než navrhujete2. Navrhněte, jak ji testovat

– Test musí jednoznačně říci, zda je či neníhypotéza pravdivá

• Spousta experimentů je dělána bez jasnéhypotézy; jejich výsledky pak lze vysvětlit milióny příčin

Observační studie

• Můžeme mezi ně zahrnout i tzv. přírodníexperimenty (popis situace po výbuchu sopky, na výsypce apod.)

• Při zisku informací z observačních studií, kterézpravidla představují jediná dostupná data, musíme brát v úvahu všechny limitace těchto dat (neortogonalita, absence kontroly, chybějícíopakování atd.)

• Výsledky tak často mají spíše charakter hypotéz než jejich potvrzení či zamítnutí

Jak dlouho jev zkoumat

• O délce bychom měli rozhodnout před počátkem experimentu

• Většina ekologických experimentů patrně probíhápříliš krátkou dobu; krátkodobá dynamika např. po disturbanci (narušení) prostředí přitom může být úplně jiná než její dlouhodobé důsledky

• (Podobně krátkozraké může být nedostatečnědlouhé sledování efektů např. v medicínském výzkumu)

Vedle ošetření vždy potřebujete kontrolu

Bez kontrolních pokusů nemůžete dospět k žádným věrohodným

závěrům

Rozptyl roste s průměrem (Taylorův mocninový zákon)

• Základní statistické aplikace jako regrese a ANOVA ale předpokládají, že rozptyl vzorků je konstatní

• Vysvětlovanou proměnnou je proto zpravidla potřeba logaritmovat abychom rozptyl stabilizovali

• V S-Plusu můžeme místo logaritmovánívyužít různých transformačních funkcí

Pseudoreplikace

• Vznikají tehdy, když analyzujeme data jako by měly více stupňů volnosti než ve skutečnosti mají

• Časové pseudoreplikace: opakovaná měřenína jednom místě v čase

• Opakovaná měření na stejném jedinci• Prostorové pseudoreplikace: např. několik

měření v těsné blízkosti vedle sebe

Pseudoreplikace

• Porušují jeden ze základních předpokladů řádnéstatistické analýzy: nezávislost chyb

• Opakovaná měření v čase na stejném jedinci nebudou mít nezávislé chyby díky tomu, že zvláštnosti měřeného jedince se projeví ve všech měřeních tohoto jedince

• Vzorky brané ze stejného kousku pole nebudou mít nezávislé chyby protože zvláštnosti tohoto kousku pole se projeví ve všech měřeních (budeme-li např. měřit výnos, může být tento kousek pole mimořádně úrodný či naopak mimořádně neúrodný)

Pseudoreplikace: příklad s použitím insekticidů

• 20 ploch: 10 ošetřených a 10 neošetřených• Na každé ploše je 50 rostlin• Na každé rostlině je počítán hmyz 5 x za

sezónu• Experiment má 20 x 50 x 5 = 5 000 čísel;

kolik má stupňů volnosti pro měření chyby?• Proč nemá pokus 4 998 stupňů volnosti pro

měření chyby, ale jen 18?

Jak analyzovat pseudoreplikovaná data

• Analyzovat průměry s pseudoreplikací(předchozí příklad)

• Analyzovat každý časový úsek zvlášť• Použít analýzu časových řad nebo smíšené

modely (mixed models)

Měření počátečních podmínek

• Na počátku pokusu by měly být všechny experimentální jednotky shodné; to je ale třeba dokázat

• Nejsme-li schopni prokázat homogenitu jednotek na počátku experimentu, je vždy možné přisoudit konečný rozdíl v experimentu rozdílu v počátečních podmínkách

• Nejjednodušší a zároveň zpravidla nejdůležitějšíbývá zjištění, zda jsou organismy na počátku experimentu stejně velké (např. v růstových experimentech)

Ortogonální vs. neortogonálníuspořádání

• Ortogonální data - zpravidla plánovanéexperimenty: všechny kombinace ošetření jsou rovnocenně zastoupeny; s výjimkou nehod nejsou žádné chybějící hodnoty

• Neortogonální uspořádání – observační data, ve kterých nemáme žádnou kontrolu nad množstvím individuí použitých pro analýzu; zastoupeníkombinací pro ošetření není proto rovnocenné

Ortogonální vs. neortogonálnídata: rozdíly v analýze

• Při ortogonálním uspořádání je odchylka příslušející vysvětlujícímu faktoru konstantní a nezávisí na pořadí, v jakém je faktor z modelu odstraňován

• Při neortogonálním uspořádání je odchylka příslušející vysvětlujícímu faktoru závislána pořadí, v jakém jsou faktory z modelu odstraňovány

Chybějící hodnoty

• Mohou se objevit v každém typu analýzy• Vždy způsobují „naředění“ experimentu• S-Plus si sice umí s chybějícími hodnotami

poradit, ale vždy to je na úkor dosažených výsledků: menší d.f., nafouknuté standardníchyby -> snížení psti, že dosáhneme průkazné výsledky

Fixní a náhodné efekty

• Fixní efekty jsou takové, které vyvoláváexperimentátor (Model I ANOVA)

• Náhodné efekty jsou zpravidla místa, kde pokus opakujeme (Model II ANOVA)

Fixní a náhodné efekty

• Často jsou experimentálně kombinované• Například různá společenstva slouží jako

statistické bloky (náhodný efekt), ve kterých aplikujeme ošetření (fixní efekt)

Fixní a náhodné efekty

• V případě fixních efektů předpokládáme, že příčina odlišností je v působení efektů

• V případě náhodných efektů buď pouze víme, že působení je odlišné, ale nevíme proč, a nebo to sice víme, ale zajímá nás, jak naše ošetření působív různých případech (např. fixní efekt odrůdy na různě úrodných půdách, které představujístatistický blok)

Experimentální uspořádání

• Mějme faktor (kategorická proměnná) se 4 úrovněmi, s 8 opakováními každé úrovně (4 x 8 = 32 čísel)

• Předpokládejme, že jde o polní experiment prováděný na 32 polích

Zcela znáhodnělé uspořádání(completely randomized design)

• 32 papírků s opakováními (8 pro každou ze 4 úrovní faktoru), které představujíjednotlivá pole, vytáhneme z klobouku

• Tento postup nejlépe zabraňuje zkreslenívýsledků (bias)

Zcela znáhodnělé uspořádání: slabiny

• Aplikovat 4 typy ošetření na 32 ploch bude prakticky obtížné

• Budou-li od sebe plochy vzdálené a v určitéoblasti přitom budou plochy podobné, může se nám navíc stát, že ošetření v určitéoblasti budou spleteny (confounded) s charakterem dané oblasti

Zcela znáhodnělé uspořádání:

Příklad v S-Plus

Stratifikované náhodné uspořádání (stratifiedrandom sampling; stratum = vrstva)

• Pole rozdělené do vrstev• V každé vrstvě je jedna plocha pro každé

ošetření (v našem příkladu 4 plochy)• Počet vrstev je je tedy velikost experimentu

(32) dělená počtem ošetření (32/4 = 8)• Ošetření je přiřazováno každé ploše v rámci

vrstvy náhodně

Stratifikované náhodnéuspořádání

• Každé ošetření má stejnou pst objevit se na každé ploše

• Existují-li systematické rozdíly v kvalitěploch, stratifikované náhodné uspořádáníje může vzít v úvahu

Jak byste uspořádali vrstvy? Rovnoběžně s gradientemvlhkosti (a) nebo kolmo na gradient (b)?

V případě (a) mají všechny vrstvy stejnou průměrnouvlhkost, ale každá vrstva je vnitřně heterogenní;v případě (b) je každá vrstva vnitřně homogenní, alemá jinou průměrnou vlhkost

Vyberete-li případ (a), Vaše 4 plochy budou tvořenyplochou velmi vlhkou, vlhkou, suchou a velmi suchou.Když každé vrstvě náhodně přidělíte ošetření, předemvíte, že efekt ošetření bude spleten (counfouded) sefektem plochy. Musíte věřit, že znáhodnění proběhnetak, že se efekty plochy vyruší (ale proč by se to mělostát?)

Vyberete-li případ (b), Vaše 4 plochy budou mítstejnou vlhkost, takže efekt ošetření nebude spleten sefektem plochy. Průměrná odpověď nebude v každévrstvě stejná, protože bude záviset na vlhkosti. Můžeteale věřit tomu, že v každé vrstvě odpovídající určitévlhkosti dostanete nespletený efekt ošetření.

V případě (b) se tedy průměrný výnos bude lišit mezivrstvami, ale to je výhoda, nikoli nevýhoda. Efektvrstvy lze totiž odstranit jako statistický blok v prů-běhu analýzy variance. Variabilita uvnitř vrstvy se tímznačně zmenší, protože veškerá variabilita působenávlhkostí bude z modelu odstraněna. Zbylou variabilitumůžeme přisoudit rozdílům mezi ošetřeními.

Slabinou tohoto přístupu však zůstává možnost, žesamotný efekt ošetření může na vlhkosti záviset. To jeefekt interakce (ošetření) x (vlhkost). Abychom mohlizjišťovat jeho vliv, musí být ošetření opakováno vkaždé vrstvě. Chyba, která nám zbude, už je pak čistáchyba měření.

Stratifikované náhodnéuspořádání

Příklad v S-Plus

Latinské čtverceGradient může být vícesměrný; může se např. týkatZároveň vlhkosti a obsahu živin

Latinské čtverceBude-li gradient takový, jak znázorňuje obr., pak se4 ošetřeními můžeme vytvořit 4 x 4 = 16 plochv jednom čtverci a opakovat celé uspořádání dvakrát;tím získáme naše n = 32.

Latinské čtverce: omezenéznáhodnění

CDBA

DACB

ABDC

BCAD

Latinské čtverce: omezenéznáhodnění

Příklad v S-Plus

Faktoriální vs. hierarchickéuspořádání

(Factorial vs. nested desing)

Faktoriální uspořádání

Zjišťování, zda úroveň jednoho faktoru závisí na úrovni jiného

faktoru

Faktoriální uspořádání: pozor na počet vysvětlujících proměnných

• Vysvětlovaná proměnná účinek léku• Vysvětlující proměnné pohlaví (2 úrovně),

věk (3), rasa (3), zaměstnání (4), vzdělání(3), životní úroveň (3), kuřácký návyk (2)

• Počet kombinací v pokusu = 2 x 3 x 3 x 4 x 3 x 3 x 2 = 1296

• Minimální počet pozorování = 1296 x 2 = 2 592

Faktoriální vs. hierarchickéuspořádání

• Uspořádání je faktoriální, jestliže:– Jestliže máme opakování pro každý interakčníčlen

– Kombinace ošetření jsou navzájem nezávislé– Kombinace ošetření jsou náhodné

Faktoriální vs. hierarchickéuspořádání: příklad na (ne)závislost ošetření

• Vysvětlovaná proměnná je růst hmyzu• Vysvětlující proměnné typ potravy (5 typů,

na každé potravě tři opakování) a teplota (4 teploty ve čtyřech různých klimatických komorách)

• Kolik klimatických komor potřebujeme, aby šlo o faktoriální experiment?

Faktoriální vs. hierarchickéuspořádání: příklad na (ne)závislost ošetření

• 5 potrav s 3 opakováními = 15 komor pro každou teplotu

• Teploty jsou 4 = 4 x 15 = 60 komor• Protože komory máme čtyři, nemůže jít o

faktoriální uspořádání• (Jde o split – plot uspořádání)

Uspořádání dělením ploch: split-plot design

Různé typy ošetření jsou aplikovanéna různě velké plochy

Split plot design – příklad

Split-plot design: analýza

• Ošetření (= faktor) jsou aplikována na plochy různé velikosti

• Každá plocha má proto jinou nevysvětlenou variabilitu (error term), přes kterou testujeme význam ošetření (faktoru), který byl na plochu aplikován

Split-plot design: analýza

• Tři typy ošetření (=faktory):– Zavlažování (ano, ne = 2 úrovně faktoru)– Hustota porostu (nízká, stření vysoká = 3 úrovně

faktoru)– Hnojení (slabé, střední, silné = 3 úrovně faktoru)

• Opakování ve 4 blocích (= pole)• Celkem 4 x 3 x 3 x 2 = 72 výnosů (= vysvětlovaná

proměnná)

Split-plot design: analýza

• Začínáme ošetřením (= faktorem) aplikovaným na největší ploše a pokračujeme v hierarchii ošetřenísměrem dolů, tj. na menší plochy

• V každém stádiu analýzy je správná nevysvětlenávariabilita, přes kterou testujeme efekt ošetření (tj. Error) interakce mezi blokem a všemi faktory v hierarchii výše

Závlaha

471.031412.0Chyba (Z)x(B)

0.1 (NS)64.83194.4Blok

17.68278.018278.0Závlaha

FMSdfSSZdroj

• pro závlahu máme jen 8 čísel (4 bloky x 2 úrovně závlahy), ne 72• stupně volnosti jsou proto 7 celkem, 4-1=3 pro bloky, 2-1=1 prozávlahy a 7-3-1=3 pro chybu• ve faktoriálním experimentu by chyba měla 2x3x3x(4-1)=54 df

PorostFMSdfSSZdroj

232.3122788.0Chyba (P)x(Z) + (P)x(Z)x(B)

5.91373.522747.0(Porost) x (Závlaha)

3.8879.021758.0Porost

HnojeníFMSdfSSZdroj

11.4988.521977.0Hnojivo

86.4363108.8Chyba (H)x(P)x(Z)x(B) + (H)x(Z)x(B) + (H)x(B)

NS58.74234.7(Hnojivo) x (Porost) x (Závlaha)

NS76.24304.9(Hnojivo) x (Porost)

5.5476.72953.4(Hnojivo) x (Závlaha)

Split plot analýza – testovánípomocí nevysvětlené variability

• Je to vždy interakce• Je vždy tvořena faktorem, který právě

testujeme, plus všemi faktory v hierarchii výše

• Stupně volnosti postupně stoupají s tím, jak jdeme v hierarchii níže

Efektivní uspořádání regresníanalýzy

Dva kontrastní případy pro zdroje omezené na 14 experimentálních

opakování

(a) Nejednodušší je uspořádat všechna měření ve stejně vzdálených in-tervalech podél osy x. To je nejefektivnější pro nalezení prahové hod-noty efektu a nelinearity jeho působení. Je to ale nejméně efektivníuspořádání pro minimalizaci standardní chyby regresního sklonu.

SSXsSEy

2=

Standardní chyba regresního sklonu roste s rozptylem chyby a

klesá s rostoucím rozsahem hodnotpodél osy x

(b) Výhodou tohoto uspořádání je, že má opakování pro každou hodnotu x, takže umožňuje odhad chyby vzorku nezávisle na regresnímsklonu. Tím umožňuje v nejvyšší možné míře testy významnostiodchylek regresního sklonu od linearity

(c) Kompromisní uspořádání mající opakování pro měřené hodnoty x(takže umožňuje nezávislé testování chyby vzorku), ale s větším poč-tem opakování na obou koncích (takže se zmenšuje standardní chybaodhadu regresního sklonu, protože se zvětšuje hodnota SSX).

SSXsSEy

2=

(d) Podobný kompromis, s menší standardní chybou sklonu, ale takés menší schopností detekovat nelinearitu.

(e) Toto uspořádání by bylo rozumné, pokud bychom věděli, že zá-vislost bude mocninová. Bylo by ale nerozumné pro sigmoidní závis-lost (neodhalilo by totiž nelinearitu).

Mocninová závislost

Sigmoidní závislost

(f) Jako (e), ale extrémnější. Dává dobrý odhad standardní chybysklonu, pokud se ukáže, že vztah je lineární.

SSXsSEy

2=

(g) Je-li vztah lineární, toto uspořádání vede k nejmenší standardníchybě. Neumožňuje však detekovat nelinearitu.

SSXsSEy

2=

top related