tutkimusaineiston kvantitatiivinen …users.jyu.fi/~tatima/ter/l17_10.pdfkun testataan k kpl...
TRANSCRIPT
TUTKIMUSAINEISTON
KVANTITATIIVINEN ANALYYSI
LTKY012 Timo Törmäkangas
NORMAALIJAKATUNEISUUDEN TESTAUS
H0: Muuttuja on perusjoukossa normaalisti jakautunut.
H1: Muuttuja ei ole perusjoukossa normaalisti jakautunut.
Jos muuttuja on normaalisti jakautunut testin p-arvon (Sig.) pitäisi olla suuri, suurempi kuin valittu riskitaso, esim. 0.05
Kolmogorov-Smirnovin testiä käytetään usein kuin n > 50.
Huom. Testin merkitsevyyteen vaikuttaa myös otoskoko: Suuremmissa otoksissa pienikin jakauman poikkeavuus aiheuttaa tilastollisesti merkitsevän tuloksen
VARIANSSIEN YHTÄ SUURUUS
Keskiarvojen ryhmävertailussa oletetaan hajonnan olevan samalla tasolla ryhmissä
Oletuksen voimassaoloa voi testata Levenen testillä
Kun testataan k kpl ryhmiä: H0: Ryhmien varianssit ovat yhtä suuret (s1
2 = … = sk2).
H1: Ryhmien varianssit eivät ole yhtä suuret.
Esim. pituusmuuttujan varianssit siviilisääty-ryhmissä
p = 0.532 > 0.05, tämän tulkitaan tukevan varianssien yhtä suuruutta riskitasolla 0.05.
NORMAALIJAKAUMA
n = 209
Vinous: 0.92 (0.17)*
Huip.: 6.19 (0.34)*
KS (p-arvo): 0.006
SW (p-arvo): < 0.001
n = 29
Vinous: 2.03 (0.43)*
Huip.: 4.19 (0.85)*
KS (p-arvo): < 0.001
SW (p-arvo): < 0.001
n = 29
Vinous: -0.11 (0.43)
Huip.: -0.47 (0.85)
KS (p-arvo): > 0.200
SW (p-arvo): 0.858
n = 205
Vinous: 0.56 (0.17)*
Huip.: -0.23 (0.39)
KS (p-arvo): 0.001
SW (p-arvo): < 0.001
Mikä jakaumista on normaalisti jakautunut?
Mitä ongelmia löytyy muista jakaumista?
A B C D
*Tunnusluku on tilastollisesti merkitsevä.
PERUSTESTEJÄ
Ongelma: Ovatko kahden ryhmän perusjoukkojen keskiarvot yhtä suuret?
Esim. Onko jyväskyläläisten miesten keskimääräinen kehon rasvaprosentti yhtä suuri kuin göteborgilaisten miesten ?
Riippumattomuus: Jokainen tutkittava on riippumaton mittaus toisista tutkittavista (miten tämä todennetaan?)
Hypoteesit:
Nollahypoteesi H0: μ1 = μ2 Keskiarvot ovat yhtä suuret (μ1 - μ2 = 0)
Vastahypoteesit (valitaan vain yksi tutk. kys. perusteella) H1: μ1 ≠ μ2 Keskiarvot eri suuret
H1: μ1 < μ2 Ensimmäisen ryhmän keskiarvo on pienempi kuin toisen ryhmän
H1: μ1 > μ2 Toisen ryhmän keskiarvo on pienempi kuin ensimmäisen ryhmän
Kahden riippumattoman otoksen keskiarvojen
vertailu
Oletukset:
Muuttuja vähintään välimatka-asteikollinen
Otos on riippumaton otos perusjoukosta (ts. se on
satunnaisotos) ja tarkasteltavat kaksi ryhmää ovat
riippumattomia toisistaan
Muuttuja on likimain normaalijakautunut kummassakin
perusjoukossa
Perusjoukon varianssit ovat yhtä suuret. Jos ovat erisuuret,
käytetään erilaista menettelyä kuin tässä esitellään.
Riskitaso:
Asetetaan sopiva α-taso (0.05 / 0.01 / 0.001)
Kahden riippumattoman otoksen keskiarvojen
vertailu
Johtopäätökset
Jos testisuureeseen liittyvä p-arvo on pienempi kuin
riskitaso (p < α), nollahypoteesi hylätään ja
vastahypoteesi astuu voimaan
Jos testisuureeseen liittyvä p-arvo on suurempi kuin
riskitaso (p > α), nollahypoteesi saa tukea
Esim. jos riskitasoksi asetetaan α = 0.05, hylätään
nollahypoteesi, jos p-arvo on tätä pienempi.
Kahden riippumattoman otoksen keskiarvojen
vertailu
Käytetään kahden riippumattoman ryhmän t-testiä tutkimuskysymykseen 1.
Polven ojennusvoiman testissä käytetään käytetään kahta muuttujaa;
- Vastemuuttuja: polven ojennusvoima
- Ryhmäindikaattori (koe- vs. kontrolliryhmä)
Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Perusjoukko: Uransa lopettaneet pohjoismaiset kilpaurheilijat Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1) Onko ryhmien keskiarvoissa eroa perusjoukossa? → Auttaako liikuntainterventio toimintakyvyn ylläpitämistä? 2) Onko keskiarvoeroja itsearvioidun terveyden suhteen (hyvä / keskinkertainen / huono).
Tutkimushypoteesi
Interventioryhmässä polvenojennusvoima on keskimäärin
korkeammalla tasolla kuin kontrolliryhmässä (μ1 > μ2)
Markolla ei ole tietoa kumpaan suuntaan ero voisi esiintyä
intervention seurauksena
Aiheuttaako liikuntainterventio odottamattomia
haittavaikutuksia?
valitaan kaksisuuntainen vastahypoteesi
Testaushypoteesit
Nollahypoteesi: H0: μ1 = μ2
Vastahypoteesi: H1: μ1 ≠ μ2
Kahden riippumattoman otoksen keskiarvojen
vertailu
Oletukset
Muuttuja on suhdeasteikollinen
Koeasetelmassa otokset (ryhmät) ovat satunnaisotoksia ja
riippumattomia toisistaan
Normaalijakautuneisuus: ks. seuraava dia
Varianssit oletetaan yhtä suuriksi (testaus myöhemmin)
Riskitaso
Valitaan testille 0.05, joka on yleisesti käytetty riskitaso
tutkimuksessa.
Kahden riippumattoman otoksen keskiarvojen
vertailu
Interventioryhmän keskiarvo (599, SD 106) oli tilastollisesti merkitsevästi
korkeampi (t = -2.45, df = 50, p = 0.018) kuin koeryhmällä (518, SD 131).
Koe- ja kontrolliryhmän välinen ero oli -81 N (95 % luottamusväli: -146, -15).
Koe
(n = 25)
Kontrolli
(n = 27)
Keskiarvo SD Keskiarvo SD p-arvo
Polvenojennusvoima 518 131 599 106 0.018
Tasapainotesti 39 5.8 38 6.5 0.561
Kävelynopeus 1.62 0.42 1.34 0.56 0.047
Taulukko 1. Keskiarvot, keskihajonnat (SD) ja
ryhmävertailujen p-arvot koe- ja kontrolliryhmille.
Ehrenberg ASC. 1977. Rudiments of Numeracy. J R Stat Soc A: 140, 277-297.
Ehrenberg ASC. 1981. The Problem of Numeracy. Am Stat: 35, 67-71.
Tulosten taulukoinnista lisää:
Huom. Jos Markon tarkoitus olisi ollut osoittaa, että interventio
aiheuttaa parannuksen kaikissa kolmessa muuttujassa, olisi hän
joutunut jakamaan riskitason näille muuttujille.
Monitestaus: αBonferroni = 0.05 / 3 = 1/60 ≈ 0.0166…
Data:
järjestysast.
Ei
Jatkuva,
normaali
Ei
Poikkeavia
arvoja
Ei
Kyllä t-testi
Kyllä Mediaani testi
Mann-Whitney
Valintakaavio:
Kahden riippumattoman ryhmän
jakauman keskikohdan vertailu
Jäikö tulos vielä epävarmaksi:
Selvitä antavatko eri testit samansuuntaisen tuloksen.
Kyllä
ks. luentomoniste
VARIANSSIANALYYSI
Varianssianalyysillä ei testata varianssien yhtä suuruutta, vaan keskiarvojen yhtä suuruutta
Yksisuuntaisessa varianssianalyysissä vertaillaan yhden jatkuvan muuttujan keskiarvoja toisen, luokittelevan muuttujan eri luokissa.
Tällöin siis tarkastellaan yhden selitettävän muuttujan keskiarvojen (tasot) vaihtelua luokitteluasteikollisen selittävän muuttujan (käsittelyt) mukaan.
Selitettävä muuttuja (esim. pituus, cm) jaetaan luokittelevan muuttujan (esim. koulutustausta, kolmiluokkainen muuttuja) perusteella ryhmiin ja keskiarvojen yhtä suuruutta tarkastellaan näissä ryhmissä
VARIANSSIANALYYSIN VAIHEET
Olkoon vertailtavia ryhmiä k kpl
Hypoteesit
H0: 1 = 2 = … = k (kaikkien ryhmien keskiarvot ovat yhtä suuret)
H1: Ainakin yhden joukon keskiarvo poikkeaa muiden joukkojen keskiarvoista
Oletukset
1) selitettävä muuttuja vähintään välimatka-asteikollinen
2) perusjoukkojen jakaumat normaaliset
3) perusjoukkojen varianssit yhtä suuret
4) perusjoukoista poimittujen otosten täytyy olla toisistaan riippumattomia
[5) ryhmät yhtä suuria]
VARIANSSIHAJOTELMA
Varianssianalyysissä vertaillaan ryhmien välistä
vaihtelua ryhmien sisäiseen vaihteluun varianssien
kaltaisilla neliösummilla
Ryhmien välinen vaihtelu (SSb) kertoo siitä, kuinka paljon
ryhmittelevä muuttuja selittää ryhmien välisiä
keskiarvoeroja (ts. miten erilaisia ryhmät ovat).
Ryhmien sisäinen vaihtelu (SSw) kertoo ryhmän sisällä
olevan vaihtelun määrää (miten erilaisia ovat ryhmän
tutkittavat keskenään) .
Kokonaisvaihteluksi saadaan:
SSTOTAL = SSb + SSw
Testisuure F lasketaan neliösummien pohjalta ja se
kertoo keskimääräisestä ryhmien välisestä
vaihtelusta suhteessa ryhmien sisäiseen vaihteluun
VARIANSSIANALYYSI
Riskitaso: Riskitaso α asetetaan kuten muissa
keskiarvotesteissä.
Johtopäätökset:
Jos testisuureeseen liittyvä p-arvo on pienempi
kuin riskitaso (p < α), nollahypoteesin hylätään ja
vastahypoteesi astuu voimaan
Jos testisuureeseen liittyvä p-arvo on suurempi
kuin riskitaso (p > α), nollahypoteesi saa tukea
Jos nollahypoteesi hylätään testin tuloksena, voidaan
selvittää keskiarvoparien välisten erojen
merkitsevyyttä parittaisilla ryhmävertailutestillä
PARITTAISET RYHMÄVERTAILUT
Varianssianalyysin merkitsevä tulos kertoo, että ainakin yhden ryhmäparin keskiarvoero on merkitsevä
Parittaisia vertailuja ei yleensä tehdä t-testeinä, koska todennäköisyys löytää sattumanvarainen merkitsevä ero ainakin yhdessä keskiarvoparissa kasvaa liian suureksi
Varianssianalyysin yhteydessä: parittaisia keskiarvovertailuja on sallittua käyttää vasta, kun varianssianalyysin nollahypoteesi hylätään
H0: μi = μj, i =1, …, k; j = 1, …, k; i ≠ j
Erilaisia menetelmiä (SPSS: 18 kpl) Varianssit yhtä suuret: LSD, Tukey, Scheffe, Bonferroni
Varianssit eivät yhtä suuret: Tamhane T2
Lisää ks. Toothaker, 1991
Käytetään varianssianalyysiä tutkimuskysymykseen 2.
Polven ojennusvoiman testissä käytetään kahta muuttujaa;
- Vastemuuttuja: polven ojennusvoima
- Ryhmäindikaattori: itsearvioitu terveys
Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli), liikuntainterventio Perusjoukko: Uransa lopettaneet pohjoismaiset kilpaurheilijat Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1) Onko ryhmien keskiarvoissa eroa perusjoukossa? → Auttaako liikuntainterventio toimintakyvyn ylläpitämistä? 2) Onko keskiarvoeroja itsearvioidun terveyden suhteen (hyvä / keskinkertainen / huono).
Tutkimushypoteesi
Itsearvioidun terveyden ryhmissä polvenojennusvoima on
korkeampi paremman terveyden ryhmissä (μ1 > μ2 > μ3)
Markolla ei ole tietoa, onko näin
Valitaan kaksisuuntainen vastahypoteesi
Testaushypoteesit
Nollahypoteesi: H0: μ1 = μ2 = μ3
Vastahypoteesi: H1: Vähintään yhden
ryhmäparin keskiarvoissa on eroa
Kahden riippumattoman otoksen keskiarvojen
vertailu
μ1 ≠ μ2 = μ3
μ1 = μ2 ≠ μ3
μ1 ≠ μ2 ≠ μ3
Ei
eroja
η2 = 43431.322 / 783555.923
= 0.5542849
Polven ojennusvoimassa
normaalijakautuneisuus.
Varianssit yhtä suuria.
Selitysaste
Itsearvioitu terveys
Selittää noin 5.5 % polven
ojennusvoiman vaihtelusta.
On
eroja
η2 = 2.307 / 12.998
= 0.1774888
Kävelynopeudessa
normaalijakautuneisuus.
Varianssit yhtä suuria.
Selitysaste
Itsearvioitu terveys
Selittää noin 17.7 % kävely-
nopeuden vaihtelusta.
Ero näkyy hyvän terveyden
keskiarvon osalta suhteessa
heikkoon (p = 0.034) ja
keskinkertaiseen (p = 0.013).
Heikko Keskinkertainen Hyvä
Keskiarvo SD Keskiarvo SD Keskiarvo SD p-arvo
(ANOVA)
Polvenojennusvoima 567 123 523 131 592 114 0.247
Kävelynopeus 1.37 0.54 1.32 0.42 1.79 0.43 0.008§
Tasapainotesti 37 6.3 37 4.9 42 5.8 0.010§
Taulukko 2. Keskiarvot, keskihajonnat (SD) ja ryhmävertailujen
p-arvot itse arvioidun terveyden ryhmissä.
§Hyvä eroaa tilastollisesti merkitsevästi (p < 0.05) heikosta ja keskinkertasesta.
Data:
järjestysast.
Ei
Jatkuva,
normaali
Ei
Suuria
poikkeavia
arvoja
Kyllä
Kyllä Yhtä suuret
varianssit
Ei Kruskal-
Wallis
Mediaani
testi
Kyllä Varianssi-
analyysi
Brown-Forsythe
Welsh
Ei
Kyllä
Ei
Valintakaavio:
Kolmen tai useamman riippumat-
toman ryhmän jakauman keski-
kohdan vertailu
RIIPPUVUUS
Ongelma: Onko korrelaatiokertoimen arvo nollasta poikkeava perusjoukossa?
Hypoteesit:
Nollahypoteesi H0: ρ = 0 Muuttujat ovat riippumattomia
Vastahypoteesi (valitaan vain yksi) H1: ρ ≠ 0 Muuttujat riippuvat toisistaan
H1: ρ < 0 Muuttujien välillä on negatiivinen korrelaatio
H1: ρ > 0 Muuttujien välillä on positiivinen korrelaatio
Korrelaatiokertoimen merkitsevyystestaus
KORRELAATIOKERTOIMEN MERKITSEVYYSTESTAUS
Oletukset:
Muuttujat vähintään järjestysasteikollisia
Riippumaton otos perusjoukosta
(Jatkuvat) muuttujat ovat likimain normaalijakautuneet
perusjoukossa
Riskitaso:
Valitaan sopiva α-taso (0.05 / 0.01 / 0.001)
KORRELAATIOKERTOIMEN MERKITSEVYYSTESTAUS
Testisuure:
lasketaan korrelaatiokertoimen, r, ja otoskoon, n,
avulla:
Vapausasteet:
lasketaan otoskoon avulla: df = n – 2
22 1
2
2/1 r
nr
nr
rt
~ t(df)
KORRELAATIOKERTOIMEN MERKITSEVYYSTESTAUS
Johtopäätökset
Jos testisuureeseen liittyvä p-arvo on pienempi kuin
riskitaso (p < α), katsotaan testin puoltavan nolla-
hypoteesin hylkäämistä. Tällöin vastahypoteesi selittää
tutkittavan ilmiön paremmin ja se astuu voimaan.
Muuttujien välillä sanotaan silloin olevan riippuvuutta.
Jos testisuureeseen liittyvä p-arvo on suurempi kuin
riskitaso (p > α), nollahypoteesi saa tukea. Tällöin
muuttujia pidetään toisistaan riippumattomia.
ESIMERKKI
Sari: Aineisto: Ryhmä naisia, tutkimus on osa geneettistä analyysia Kolme muuttujaa: Kehon painoindeksi (kg/m2) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksin, fyysisen aktiivisuuden määrän ja kävelynopeuden välillä riippuvuutta?
Käytetään korrelaatiokerrointa kehon painoindeksin ja kävelynopeuden
välisen riippuvuuden tarkastelemiseksi.
Tarkastelussa käytetään kahta muuttujaa;
- Kehon painoindeksi
- Kävelynopeus
ESIMERKKI
Testaushypoteesit: H0: ρ = 0 Muuttujat ovat riippumattomia
H1: ρ ≠ 0 Muuttujat riippuvat toisistaan
Oletukset:
Muuttujat ovat jatkuvia
Riippumaton otos perusjoukosta
Normaalijakautuneisuus
Valitaan korrelaatiotarkastelun
riskitasoksi 0.05.
Norm
aali
jak
au
tun
eis
uu
s L
ineaari
suu
s
LOESS
Regressiosuora
Skew: 0.50 (0.13)
Kurtosis: 0.99 (0.25)
Skew: -0.08 (0.13)
Kurtosis: -0.07 (0.25)
Statistic Std.Error Statistic Std.Error
p < 0.001
Nollahypoteesi hylätään ja kävelynopeuden ja kehon painoindeksin
välillä sanotaan olevan kohtalaista negatiivista riippuvuutta.
(Tarkka p-arvo: 5.996 × 10-10)
Raportointi:
Kävelynopeuden ja kehonpainoindeksin välillä
havaittiin kohtalainen negatiivinen riippuvuus
(r = -0.30, p < 0.001).
Walking speed and body mass index were moderately
negatively correlated (r = -0.30, p < 0.001).
Useamman muuttujaparien tilanteessa raportoidaan
korrelaatiomatriisi.
χ2-RIIPPUMATTOMUUSTESTI
Ongelma: Onko kahden vähintään
luokitusasteikollisen muuttujan välinen
riippuvuus tilastollisesti merkitsevää?
Nollahypoteesinmukaisessa
tilanteessa mm. rivijakaumat ovat
samanlaiset.
Hypoteesit
H0: fij = eij eli muuttujat ovat riippumattomia
H1: fij ≠ eij eli muuttujat riippuvat toisistaan
x1 x2 x3
y1 f11 f12 f13
y2 f21 f22 f23
χ2-RIIPPUMATTOMUUSTESTI
Oletukset
Muuttujat ovat vähintään luokitusasteikollisia.
Otos on satunnaisotos.
Kaikki odotetut frekvenssit ovat suurempia kuin 1.
Korkeintaan 20% odotetuista frekvensseistä on
arvoltaan pienempiä kuin 5.
Riskitaso
Valitaan sopiva α-taso (0.05 / 0.01 / 0.001).
χ2-RIIPPUMATTOMUUSTESTI
Johtopäätökset
Jos p-arvo on pienempi kuin riskitaso (p < α), niin
nollahypoteesi ei saa tukea ja se hylätään. Tällöin
sanotaan, että muuttujien välillä on riippuvuutta.
Jos p-arvo on suurempi kuin riskitaso (p > α),
nollahypoteesia ei voida hylätä ja sanotaan, että
muuttujien välillä ei ole riippuvuutta.
ESIMERKKI
Haluttiin selvittää oliko alkumittauksessa mitattu tutkittavien oma arvio terveydentilastaan yhteydessä seurannan loppuun mennessä havaittuun kuolleisuuteen 75-vuotiailla jyväskyläläisillä Terveydentila: (1 = hyvä, 2 = tyydyttävä, 3 = huono) Kuolleisuus: (0 = kuollut, 1 = elossa)
Hypoteesit Kuten edellä esitettiin. Valitaan vastahypoteesi kaksisuuntaiseksi
Oletukset Muuttujat ovat luokitusasteikollisia.
Kyseessä on satunnaisotos.
Tarkastetaan frekvenssioletukset myöhemmin
Riskitaso Valitaan riskitasoksi 0.05.
Χ2-RIIPPUMATTOMUUSTESTI (5)
Nähdään, että pienin odotettu frekvenssi on 18.2, joten frekvenssioletukset ovat kunnossa.
χ2-RIIPPUMATTOMUUSTESTI (6)
Nollahypoteesi ei saa tukea,
koska p < 0.05.
Tulkinta: Seurannan päättyessä
elossa olleet arvioivat alkumittauksen
terveytensä paremmaksi (p < 0.001).