tutkimusaineiston kvantitatiivinen …users.jyu.fi/~tatima/ter/l17_10.pdfkun testataan k kpl...

TUTKIMUSAINEISTON

KVANTITATIIVINEN ANALYYSI

LTKY012 Timo Törmäkangas

NORMAALIJAKATUNEISUUDEN TESTAUS

H0: Muuttuja on perusjoukossa normaalisti jakautunut.

H1: Muuttuja ei ole perusjoukossa normaalisti jakautunut.

Jos muuttuja on normaalisti jakautunut testin p-arvon (Sig.) pitäisi olla suuri, suurempi kuin valittu riskitaso, esim. 0.05

Kolmogorov-Smirnovin testiä käytetään usein kuin n > 50.

Huom. Testin merkitsevyyteen vaikuttaa myös otoskoko: Suuremmissa otoksissa pienikin jakauman poikkeavuus aiheuttaa tilastollisesti merkitsevän tuloksen

VARIANSSIEN YHTÄ SUURUUS

Keskiarvojen ryhmävertailussa oletetaan hajonnan olevan samalla tasolla ryhmissä

Oletuksen voimassaoloa voi testata Levenen testillä

Kun testataan k kpl ryhmiä: H0: Ryhmien varianssit ovat yhtä suuret (s1

2 = … = sk2).

H1: Ryhmien varianssit eivät ole yhtä suuret.

Esim. pituusmuuttujan varianssit siviilisääty-ryhmissä

p = 0.532 > 0.05, tämän tulkitaan tukevan varianssien yhtä suuruutta riskitasolla 0.05.

NORMAALIJAKAUMA

n = 209

Vinous: 0.92 (0.17)*

Huip.: 6.19 (0.34)*

KS (p-arvo): 0.006

SW (p-arvo): < 0.001

n = 29

Vinous: 2.03 (0.43)*

Huip.: 4.19 (0.85)*

KS (p-arvo): < 0.001

SW (p-arvo): < 0.001

n = 29

Vinous: -0.11 (0.43)

Huip.: -0.47 (0.85)

KS (p-arvo): > 0.200

SW (p-arvo): 0.858

n = 205

Vinous: 0.56 (0.17)*

Huip.: -0.23 (0.39)

KS (p-arvo): 0.001

SW (p-arvo): < 0.001

Mikä jakaumista on normaalisti jakautunut?

Mitä ongelmia löytyy muista jakaumista?

A B C D

*Tunnusluku on tilastollisesti merkitsevä.

PERUSTESTEJÄ

Ongelma: Ovatko kahden ryhmän perusjoukkojen keskiarvot yhtä suuret?

Esim. Onko jyväskyläläisten miesten keskimääräinen kehon rasvaprosentti yhtä suuri kuin göteborgilaisten miesten ?

Riippumattomuus: Jokainen tutkittava on riippumaton mittaus toisista tutkittavista (miten tämä todennetaan?)

Hypoteesit:

Nollahypoteesi H0: μ1 = μ2 Keskiarvot ovat yhtä suuret (μ1 - μ2 = 0)

Vastahypoteesit (valitaan vain yksi tutk. kys. perusteella) H1: μ1 ≠ μ2 Keskiarvot eri suuret

H1: μ1 < μ2 Ensimmäisen ryhmän keskiarvo on pienempi kuin toisen ryhmän

H1: μ1 > μ2 Toisen ryhmän keskiarvo on pienempi kuin ensimmäisen ryhmän

Kahden riippumattoman otoksen keskiarvojen

vertailu

Oletukset:

Muuttuja vähintään välimatka-asteikollinen

Otos on riippumaton otos perusjoukosta (ts. se on

satunnaisotos) ja tarkasteltavat kaksi ryhmää ovat

riippumattomia toisistaan

Muuttuja on likimain normaalijakautunut kummassakin

perusjoukossa

Perusjoukon varianssit ovat yhtä suuret. Jos ovat erisuuret,

käytetään erilaista menettelyä kuin tässä esitellään.

Riskitaso:

Asetetaan sopiva α-taso (0.05 / 0.01 / 0.001)


vertailu

Johtopäätökset

Jos testisuureeseen liittyvä p-arvo on pienempi kuin

riskitaso (p < α), nollahypoteesi hylätään ja

vastahypoteesi astuu voimaan

Jos testisuureeseen liittyvä p-arvo on suurempi kuin

riskitaso (p > α), nollahypoteesi saa tukea

Esim. jos riskitasoksi asetetaan α = 0.05, hylätään

nollahypoteesi, jos p-arvo on tätä pienempi.


vertailu

Käytetään kahden riippumattoman ryhmän t-testiä tutkimuskysymykseen 1.

Polven ojennusvoiman testissä käytetään käytetään kahta muuttujaa;

- Vastemuuttuja: polven ojennusvoima

- Ryhmäindikaattori (koe- vs. kontrolliryhmä)

Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Perusjoukko: Uransa lopettaneet pohjoismaiset kilpaurheilijat Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1) Onko ryhmien keskiarvoissa eroa perusjoukossa? → Auttaako liikuntainterventio toimintakyvyn ylläpitämistä? 2) Onko keskiarvoeroja itsearvioidun terveyden suhteen (hyvä / keskinkertainen / huono).

Tutkimushypoteesi

Interventioryhmässä polvenojennusvoima on keskimäärin

korkeammalla tasolla kuin kontrolliryhmässä (μ1 > μ2)

Markolla ei ole tietoa kumpaan suuntaan ero voisi esiintyä

intervention seurauksena

Aiheuttaako liikuntainterventio odottamattomia

haittavaikutuksia?

valitaan kaksisuuntainen vastahypoteesi

Testaushypoteesit

Nollahypoteesi: H0: μ1 = μ2

Vastahypoteesi: H1: μ1 ≠ μ2


vertailu

Oletukset

Muuttuja on suhdeasteikollinen

Koeasetelmassa otokset (ryhmät) ovat satunnaisotoksia ja

riippumattomia toisistaan

Normaalijakautuneisuus: ks. seuraava dia

Varianssit oletetaan yhtä suuriksi (testaus myöhemmin)

Riskitaso

Valitaan testille 0.05, joka on yleisesti käytetty riskitaso

tutkimuksessa.


vertailu

Interventioryhmän keskiarvo (599, SD 106) oli tilastollisesti merkitsevästi

korkeampi (t = -2.45, df = 50, p = 0.018) kuin koeryhmällä (518, SD 131).

Koe- ja kontrolliryhmän välinen ero oli -81 N (95 % luottamusväli: -146, -15).

Koe

(n = 25)

Kontrolli

(n = 27)

Keskiarvo SD Keskiarvo SD p-arvo

Polvenojennusvoima 518 131 599 106 0.018

Tasapainotesti 39 5.8 38 6.5 0.561

Kävelynopeus 1.62 0.42 1.34 0.56 0.047

Taulukko 1. Keskiarvot, keskihajonnat (SD) ja

ryhmävertailujen p-arvot koe- ja kontrolliryhmille.

Ehrenberg ASC. 1977. Rudiments of Numeracy. J R Stat Soc A: 140, 277-297.

Ehrenberg ASC. 1981. The Problem of Numeracy. Am Stat: 35, 67-71.

Tulosten taulukoinnista lisää:

Huom. Jos Markon tarkoitus olisi ollut osoittaa, että interventio

aiheuttaa parannuksen kaikissa kolmessa muuttujassa, olisi hän

joutunut jakamaan riskitason näille muuttujille.

Monitestaus: αBonferroni = 0.05 / 3 = 1/60 ≈ 0.0166…

Data:

järjestysast.

Ei

Jatkuva,

normaali

Ei

Poikkeavia

arvoja

Ei

Kyllä t-testi

Kyllä Mediaani testi

Mann-Whitney

Valintakaavio:

Kahden riippumattoman ryhmän

jakauman keskikohdan vertailu

Jäikö tulos vielä epävarmaksi:

Selvitä antavatko eri testit samansuuntaisen tuloksen.

Kyllä

ks. luentomoniste

VARIANSSIANALYYSI

Varianssianalyysillä ei testata varianssien yhtä suuruutta, vaan keskiarvojen yhtä suuruutta

Yksisuuntaisessa varianssianalyysissä vertaillaan yhden jatkuvan muuttujan keskiarvoja toisen, luokittelevan muuttujan eri luokissa.

Tällöin siis tarkastellaan yhden selitettävän muuttujan keskiarvojen (tasot) vaihtelua luokitteluasteikollisen selittävän muuttujan (käsittelyt) mukaan.

Selitettävä muuttuja (esim. pituus, cm) jaetaan luokittelevan muuttujan (esim. koulutustausta, kolmiluokkainen muuttuja) perusteella ryhmiin ja keskiarvojen yhtä suuruutta tarkastellaan näissä ryhmissä

VARIANSSIANALYYSIN VAIHEET

Olkoon vertailtavia ryhmiä k kpl

Hypoteesit

H0: 1 = 2 = … = k (kaikkien ryhmien keskiarvot ovat yhtä suuret)

H1: Ainakin yhden joukon keskiarvo poikkeaa muiden joukkojen keskiarvoista

Oletukset

1) selitettävä muuttuja vähintään välimatka-asteikollinen

2) perusjoukkojen jakaumat normaaliset

3) perusjoukkojen varianssit yhtä suuret

4) perusjoukoista poimittujen otosten täytyy olla toisistaan riippumattomia

[5) ryhmät yhtä suuria]

VARIANSSIHAJOTELMA

Varianssianalyysissä vertaillaan ryhmien välistä

vaihtelua ryhmien sisäiseen vaihteluun varianssien

kaltaisilla neliösummilla

Ryhmien välinen vaihtelu (SSb) kertoo siitä, kuinka paljon

ryhmittelevä muuttuja selittää ryhmien välisiä

keskiarvoeroja (ts. miten erilaisia ryhmät ovat).

Ryhmien sisäinen vaihtelu (SSw) kertoo ryhmän sisällä

olevan vaihtelun määrää (miten erilaisia ovat ryhmän

tutkittavat keskenään) .

Kokonaisvaihteluksi saadaan:

SSTOTAL = SSb + SSw

Testisuure F lasketaan neliösummien pohjalta ja se

kertoo keskimääräisestä ryhmien välisestä

vaihtelusta suhteessa ryhmien sisäiseen vaihteluun

VARIANSSIANALYYSI

Riskitaso: Riskitaso α asetetaan kuten muissa

keskiarvotesteissä.

Johtopäätökset:

Jos testisuureeseen liittyvä p-arvo on pienempi

kuin riskitaso (p < α), nollahypoteesin hylätään ja

vastahypoteesi astuu voimaan

Jos testisuureeseen liittyvä p-arvo on suurempi

kuin riskitaso (p > α), nollahypoteesi saa tukea

Jos nollahypoteesi hylätään testin tuloksena, voidaan

selvittää keskiarvoparien välisten erojen

merkitsevyyttä parittaisilla ryhmävertailutestillä

PARITTAISET RYHMÄVERTAILUT

Varianssianalyysin merkitsevä tulos kertoo, että ainakin yhden ryhmäparin keskiarvoero on merkitsevä

Parittaisia vertailuja ei yleensä tehdä t-testeinä, koska todennäköisyys löytää sattumanvarainen merkitsevä ero ainakin yhdessä keskiarvoparissa kasvaa liian suureksi

Varianssianalyysin yhteydessä: parittaisia keskiarvovertailuja on sallittua käyttää vasta, kun varianssianalyysin nollahypoteesi hylätään

H0: μi = μj, i =1, …, k; j = 1, …, k; i ≠ j

Erilaisia menetelmiä (SPSS: 18 kpl) Varianssit yhtä suuret: LSD, Tukey, Scheffe, Bonferroni

Varianssit eivät yhtä suuret: Tamhane T2

Lisää ks. Toothaker, 1991

Käytetään varianssianalyysiä tutkimuskysymykseen 2.

Polven ojennusvoiman testissä käytetään kahta muuttujaa;

- Vastemuuttuja: polven ojennusvoima

- Ryhmäindikaattori: itsearvioitu terveys

Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Perusjoukko: Uransa lopettaneet pohjoismaiset kilpaurheilijat Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1) Onko ryhmien keskiarvoissa eroa perusjoukossa? → Auttaako liikuntainterventio toimintakyvyn ylläpitämistä? 2) Onko keskiarvoeroja itsearvioidun terveyden suhteen (hyvä / keskinkertainen / huono).

Tutkimushypoteesi

Itsearvioidun terveyden ryhmissä polvenojennusvoima on

korkeampi paremman terveyden ryhmissä (μ1 > μ2 > μ3)

Markolla ei ole tietoa, onko näin

Valitaan kaksisuuntainen vastahypoteesi

Testaushypoteesit

Nollahypoteesi: H0: μ1 = μ2 = μ3

Vastahypoteesi: H1: Vähintään yhden

ryhmäparin keskiarvoissa on eroa


vertailu

μ1 ≠ μ2 = μ3

μ1 = μ2 ≠ μ3

μ1 ≠ μ2 ≠ μ3

Ei

eroja

η2 = 43431.322 / 783555.923

= 0.5542849

Polven ojennusvoimassa

normaalijakautuneisuus.

Varianssit yhtä suuria.

Selitysaste

Itsearvioitu terveys

Selittää noin 5.5 % polven

ojennusvoiman vaihtelusta.

On

eroja

η2 = 2.307 / 12.998

= 0.1774888

Kävelynopeudessa

normaalijakautuneisuus.

Varianssit yhtä suuria.

Selitysaste

Itsearvioitu terveys

Selittää noin 17.7 % kävely-

nopeuden vaihtelusta.

Ero näkyy hyvän terveyden

keskiarvon osalta suhteessa

heikkoon (p = 0.034) ja

keskinkertaiseen (p = 0.013).

Heikko Keskinkertainen Hyvä

Keskiarvo SD Keskiarvo SD Keskiarvo SD p-arvo

(ANOVA)

Polvenojennusvoima 567 123 523 131 592 114 0.247

Kävelynopeus 1.37 0.54 1.32 0.42 1.79 0.43 0.008§

Tasapainotesti 37 6.3 37 4.9 42 5.8 0.010§

Taulukko 2. Keskiarvot, keskihajonnat (SD) ja ryhmävertailujen

p-arvot itse arvioidun terveyden ryhmissä.

§Hyvä eroaa tilastollisesti merkitsevästi (p < 0.05) heikosta ja keskinkertasesta.

Data:

järjestysast.

Ei

Jatkuva,

normaali

Ei

Suuria

poikkeavia

arvoja

Kyllä

Kyllä Yhtä suuret

varianssit

Ei Kruskal-

Wallis

Mediaani

testi

Kyllä Varianssi-

analyysi

Brown-Forsythe

Welsh

Ei

Kyllä

Ei

Valintakaavio:

Kolmen tai useamman riippumat-

toman ryhmän jakauman keski-

kohdan vertailu

RIIPPUVUUS

Ongelma: Onko korrelaatiokertoimen arvo nollasta poikkeava perusjoukossa?

Hypoteesit:

Nollahypoteesi H0: ρ = 0 Muuttujat ovat riippumattomia

Vastahypoteesi (valitaan vain yksi) H1: ρ ≠ 0 Muuttujat riippuvat toisistaan

H1: ρ < 0 Muuttujien välillä on negatiivinen korrelaatio

H1: ρ > 0 Muuttujien välillä on positiivinen korrelaatio

Korrelaatiokertoimen merkitsevyystestaus

KORRELAATIOKERTOIMEN MERKITSEVYYSTESTAUS

Oletukset:

Muuttujat vähintään järjestysasteikollisia

Riippumaton otos perusjoukosta

(Jatkuvat) muuttujat ovat likimain normaalijakautuneet

perusjoukossa

Riskitaso:

Valitaan sopiva α-taso (0.05 / 0.01 / 0.001)


Testisuure:

lasketaan korrelaatiokertoimen, r, ja otoskoon, n,

avulla:

Vapausasteet:

lasketaan otoskoon avulla: df = n – 2

22 1

2

2/1 r

nr

nr

rt

~ t(df)


Johtopäätökset

Jos testisuureeseen liittyvä p-arvo on pienempi kuin

riskitaso (p < α), katsotaan testin puoltavan nolla-

hypoteesin hylkäämistä. Tällöin vastahypoteesi selittää

tutkittavan ilmiön paremmin ja se astuu voimaan.

Muuttujien välillä sanotaan silloin olevan riippuvuutta.

Jos testisuureeseen liittyvä p-arvo on suurempi kuin

riskitaso (p > α), nollahypoteesi saa tukea. Tällöin

muuttujia pidetään toisistaan riippumattomia.

ESIMERKKI

Sari: Aineisto: Ryhmä naisia, tutkimus on osa geneettistä analyysia Kolme muuttujaa: Kehon painoindeksi (kg/m2) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksin, fyysisen aktiivisuuden määrän ja kävelynopeuden välillä riippuvuutta?

Käytetään korrelaatiokerrointa kehon painoindeksin ja kävelynopeuden

välisen riippuvuuden tarkastelemiseksi.

Tarkastelussa käytetään kahta muuttujaa;

- Kehon painoindeksi

- Kävelynopeus

ESIMERKKI

Testaushypoteesit: H0: ρ = 0 Muuttujat ovat riippumattomia

H1: ρ ≠ 0 Muuttujat riippuvat toisistaan

Oletukset:

Muuttujat ovat jatkuvia

Riippumaton otos perusjoukosta

Normaalijakautuneisuus

Valitaan korrelaatiotarkastelun

riskitasoksi 0.05.

Norm

aali

jak

au

tun

eis

uu

s L

ineaari

suu

s

LOESS

Regressiosuora

Skew: 0.50 (0.13)

Kurtosis: 0.99 (0.25)

Skew: -0.08 (0.13)

Kurtosis: -0.07 (0.25)

Statistic Std.Error Statistic Std.Error

p < 0.001

Nollahypoteesi hylätään ja kävelynopeuden ja kehon painoindeksin

välillä sanotaan olevan kohtalaista negatiivista riippuvuutta.

(Tarkka p-arvo: 5.996 × 10-10)

Raportointi:

Kävelynopeuden ja kehonpainoindeksin välillä

havaittiin kohtalainen negatiivinen riippuvuus

(r = -0.30, p < 0.001).

Walking speed and body mass index were moderately

negatively correlated (r = -0.30, p < 0.001).

Useamman muuttujaparien tilanteessa raportoidaan

korrelaatiomatriisi.

χ2-RIIPPUMATTOMUUSTESTI

Ongelma: Onko kahden vähintään

luokitusasteikollisen muuttujan välinen

riippuvuus tilastollisesti merkitsevää?

Nollahypoteesinmukaisessa

tilanteessa mm. rivijakaumat ovat

samanlaiset.

Hypoteesit

H0: fij = eij eli muuttujat ovat riippumattomia

H1: fij ≠ eij eli muuttujat riippuvat toisistaan

x1 x2 x3

y1 f11 f12 f13

y2 f21 f22 f23


Oletukset

Muuttujat ovat vähintään luokitusasteikollisia.

Otos on satunnaisotos.

Kaikki odotetut frekvenssit ovat suurempia kuin 1.

Korkeintaan 20% odotetuista frekvensseistä on

arvoltaan pienempiä kuin 5.

Riskitaso

Valitaan sopiva α-taso (0.05 / 0.01 / 0.001).


Johtopäätökset

Jos p-arvo on pienempi kuin riskitaso (p < α), niin

nollahypoteesi ei saa tukea ja se hylätään. Tällöin

sanotaan, että muuttujien välillä on riippuvuutta.

Jos p-arvo on suurempi kuin riskitaso (p > α),

nollahypoteesia ei voida hylätä ja sanotaan, että

muuttujien välillä ei ole riippuvuutta.

ESIMERKKI

Haluttiin selvittää oliko alkumittauksessa mitattu tutkittavien oma arvio terveydentilastaan yhteydessä seurannan loppuun mennessä havaittuun kuolleisuuteen 75-vuotiailla jyväskyläläisillä Terveydentila: (1 = hyvä, 2 = tyydyttävä, 3 = huono) Kuolleisuus: (0 = kuollut, 1 = elossa)

Hypoteesit Kuten edellä esitettiin. Valitaan vastahypoteesi kaksisuuntaiseksi

Oletukset Muuttujat ovat luokitusasteikollisia.

Kyseessä on satunnaisotos.

Tarkastetaan frekvenssioletukset myöhemmin

Riskitaso Valitaan riskitasoksi 0.05.

Χ2-RIIPPUMATTOMUUSTESTI (5)

Nähdään, että pienin odotettu frekvenssi on 18.2, joten frekvenssioletukset ovat kunnossa.

χ2-RIIPPUMATTOMUUSTESTI (6)

Nollahypoteesi ei saa tukea,

koska p < 0.05.

Tulkinta: Seurannan päättyessä

elossa olleet arvioivat alkumittauksen

terveytensä paremmaksi (p < 0.001).

tutkimusaineiston kvantitatiivinen …users.jyu.fi/~tatima/ter/l17_10.pdfkun testataan k kpl...

Documents