statistické testy

27
statistické testy • z náhodného výběru vyvozuji závěry ohledně základního souboru • často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd.

Upload: dobry

Post on 11-Jan-2016

85 views

Category:

Documents


2 download

DESCRIPTION

statistické testy. z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd. liší se hmotnost samic a samců?. mám hypotézu H: m f ≠ m m - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: statistické testy

statistické testy

• z náhodného výběru vyvozuji závěry ohledně základního souboru

• často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd.

Page 2: statistické testy

liší se hmotnost samic a samců?• mám hypotézu H: mf ≠ mm

– předpokládám, že se liší

• hypotézu nemůžu potvrdit (verifikovat) → zkusím zamítnout (falzifikovat) nulovou hypotézu H0: mf = mm

– mají stejnou hmotnostpokud ji zamítnu, přijmu opačnou

alternativní hypotézu HA (tu moji původní)

• průměr mf, mm se téměř určitě bude lišit. Bude se lišit tak, abych mohl zamítnout H0?

Page 3: statistické testy

statistické testy

• z dat spočítám testovou statistiku, která má známé teoretické rozdělení (t, F, 2, U….)

• lze určit, jakou hodnotu bude testová statistika mít, pokud platí H0

• na základě stupňů volnosti (d.f., s.v. – z počtu nezávislých pozorování) stanovím, jestli odchylky jsou jen dílem náhody - p

Page 4: statistické testy

statistické testy• definuji si hladinu významnosti α –

pravděpodobnost, že zamítnu H0 ačkoli platí – chyba prvního druhu

• většinou 5 % (= 0.05)

• pokud spočítané p je menší než α – zamítám H0 a tím „přijímám“ HA

Page 5: statistické testy

statistické testy

• jako výsledek statistického testu uvádím– hodnotu testové statistiky (t, F, 2, U…..)– stupně volnosti (degrees of freedom – d.f., s.v.)– dosažená hladina významnosti (p)

• t = 3.414, d.f. = 28, p = 0.0215

• t (28) = 3.414, p = 0.0215

• t28 = 3.414, p = 0.0215

Page 6: statistické testy

Studentův t-test

Page 7: statistické testy

• testuji, zda můj výběr má střední hodnotu shodnou s danou hodnotou – jednovýběrový t-test (H0: μ = k)– dlouhodobá průměrná denní teplota v červnu je rovna

17.5 °C. Byla letos stejná?

• testuji, zda dva náhodné výběry (nezávislé) pochází ze stejného základního souboru (mají stejnou střední hodnotu) – dvouvýběrový t-test (H0: μA = μB)– hmotnost samic a samců,….

• testuji, zda rozdíl párových hodnot (závislých) je roven dané hodnotě (větš. 0) - párový t-test (H0: μ1- μ2 = 0)– hmotnost před a po zásahu, délka pravé a levé nohy,

….

Page 8: statistické testy

Studentův t-test

• předpoklad použití:– normalita dat

• pracuji s průměry, pokud mám dostatek dat, tak se rozdělení blíží normálnímu (centrální limitní věta)

• pokud mám dat málo, většinou nemůžu zamítnout že data nepochází z normálního rozdělení

• ne kategoriální či ordinální stupnice!

– shodnost variancí – ale různé modifikace

Page 9: statistické testy

Příklad:

• měřím zadní stehno bruslařky a chci porovnat, jestli se liší samci a samice

• chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků 2 gymnázií

• měřím střevle ve dvou řekách a chci zjistit, jestli jsou stejně velké

dvouvýběrový t-test

Page 10: statistické testy

Příklad:

• měřím zadní stehno bruslařky a chci porovnat, jestli se liší levé a pravé

• chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků před a po prázdninách / přednášce

• vážím lidi (myši) před a po snězení 0.1 kg cukru – je změna 0.1 kg?

párový t-test

Page 11: statistické testy

formální provedení• chci ukázat: střevle z povodí Stropnice jsou jinak velké

než střevle z povodí Černé (musím zdůvodnit proč!)• formuluji hypotézu: H0: Výběry naměřených délek střevlí

pochází z jednoho základního souboru (průměry se neliší)

• alternativní hypotéza: HA: Výběry naměřených délek střevlí z povodí Stropnice i Černé nepochází z jednoho základního souboru (= střevle obou povodí jsou různě velké)

• provedu testování, jak moc je pravděpodobné že oba výběry pochází ze stejného souboru

• pokud je pravděpodobnost malá (p < 0.05), zamítnu H0 a akceptuji HA

• pokud je p > 0.05, nemůžu zamítnout H0 (ale ani HA!)

Page 12: statistické testy
Page 13: statistické testy

dvouvýběrový t-test• rovnají se rozptyly?

• shodnost rozptylů testuji F-testem (H0: s21

= s22)

• pokud p větší než 0.05 – nemůžu zamítnout H0 rozptyly se rovnají (asi)

• pokud p menší než 0.05 – můžu zamítnout H0 rozptyly se nerovnají (asi)

Page 14: statistické testy

Excel vyžaduje, aby data s větším rozptylem byla zadána jako první!!!

Page 15: statistické testy

stupně volnosti

hodnota t

odpovídající p:

-jednostranného testu

-dvoustranného testu

Page 16: statistické testy

test jednostranný a dvoustranný

• testuji zda A se liší od B (H0: A=B) – dvoustranný• testuji zda A je menší / větší než B (H0: A≤B) - jednostranný

Page 17: statistické testy

výsledek

• Průměrná velikost střevlí z povodí Stropnice a Černé se signifikantně liší (t (33) = -2.61, p = 0.013)

• dobré je i uvést výsledek F-testu: Po nezamítnutí homogenity variancí (F(15,18) = 1.429, p = 0.466)…..

• formálně – zamítám H0 o shodnosti velikostí střevlí z obou povodí….

Page 18: statistické testy

chyby statistických testů testu

zamítnu H0 nezamítnu H0

H0 platí

(např. A=B)

chyba 1. druhu správně

H0 neplatí

(např. A≠B)

správně chyba 2. druhurealita

rozhodnutí

pravděpodobnost chyby je α = hladina významnosti

pravděpodobnost chyby je β = neznáme

Page 19: statistické testy

Grafické vyjádření

• pro znázornění t-testu je vhodný krabicový graf Krab icový gra f (Tabulka6 10v*40c)

M ed ián 25% -75% R ozsah neodleh . O d leh lé E xtrém yČ erná S tropn ice

P rom 1

6.0

6.2

6 .4

6 .6

6 .8

7 .0

7 .2

7 .4

7 .6

7 .8

8 .0

8 .2

8 .4

8 .6

8 .8

Pro

m2

Page 20: statistické testy

krabicový graf

• v Excelu problém

Page 22: statistické testy

Statistica• data se zadávají

odlišně• každý sloupec je

jedna proměnná• u t-testu je jedna

kategoriální proměnná (zde povodí) a jedna kvantitativní (zde délka)

Page 23: statistické testy
Page 24: statistické testy

dvouvýběrový t-test, data ve sloupci pod sebou

dvouvýběrový t-test, data ve sloupcích vedle sebe (jako v Excelu)

párový t-test, data ve sloupcích vedle sebe (jako v Excelu)

jednovýběrový t-test na střední hodnotu

Page 25: statistické testy
Page 26: statistické testy

výsledek testů se ukládá v samostatném souboru

Page 27: statistické testy

další výsledky, grafy apod.