tilastotiede tietoyhteiskunnan perustiede
DESCRIPTION
Esa Läärän luento Tiedekeskus Tietomaassa 22.2.2012TRANSCRIPT
Tilastotiede – tietoyhteiskunnan perustiede
Esa Läärä
Tietomaa, 22.2.2012
Matemaattisten tieteiden laitos
Tietoyhteiskunta?
Yhteiskunta,
I jossa käytetään paljon ns. tietotekniikan välineitä?
I vai jossa päätöksenteko ja ammattikäytännöt perustuvat– arvojen, tarpeiden sekä voimavarojen ohella –pätevin menetelmin hankittuun tietoon?
Tieto
= hyvin perusteltu tosi uskomus.
I ei ole sama kuin data tai informaatio.
I sana kokenut inflaation se jälkeen, kun kieleemme tuli“tietokone” (computer eikä “knowledge machine”)
Päivän ja viikon sääennusteet
Maapallon keskilämpötilan kehitys?
1000 1200 1400 1600 1800 2000Year
−1.0
−0.5
0.0
0.5
1.0 r
ela
tive to 1
961 to 1
990
Nort
hern
Hem
isphere
anom
aly
(°C
)
1998 instrumental value
Instrumental data (AD 1902 to 1999)Reconstruction (AD 1000 to 1980)Reconstruction (40 year smoothed)
Figure 5: Millennial Northern Hemisphere (NH) temperature reconstruction (blue – tree rings, corals, ice cores, and historical records) and instru-
mental data (red) from AD 1000 to 1999. Smoother version of NH series (black), and two standard error limits (gray shaded) are shown. [Based on
Figure 2.20]
Näinkö on mennyt 1000 v? Kuinka jatkuu?
Lyhyen aikavälin talousindikaattoreita
Erään talousindikaattorin 20 v kehitys
0
2
4
6
8
10
12
14
16
18
20
22
1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010
Työttömyysaste, %
TyöttömyysasteKausitasoitettu aikasarja
Työvoimatiedustelu
Lähde: Tilastokeskus
24.1.2012/tyot1/jka/EKI Talousgraafit
Kuntauudistuksen taustatietoja
Kuntauudistuksen taustatietoja
Puolueiden kannatusarviot
Sanomalehdet ja PISA-menestys
I “Aktiivinen sanomalehtien lukeminen näkyy myöskansainvälisessä Pisa-tutkimuksessa ...
I Sanomalehteä useita kertoja viikossa lukevatsuomalaisnuoret menestyivät vuoden 2009 vertailussakaikilla osa-alueilla paremmin kuin harvemmin ja eikoskaan sanomalehteä lukevat nuoret.
I Lukutaidossa aktiivilukijoiden ja kaikkein passiivisimpienlukijoiden koepistemäärien ero oli niin suuri, että sevastaa lähes 1,5 kouluvuoden edistystä.”
HS 1.2.2012.
Makkara lisää diabetesriskiä?I Paljon makkaraa ja muita prosessoituja lihatuotteita
syövillä naisilla on muita suurempi riski sairastuaaikuisiän diabetekseen, kertoo ranskalaistutkimus.
I Ranskalaisten tulokset perustuvat 66 000 terveen naisenruokavalio- ja terveystietoihin, jotka kerättiin vuosina1993–2007. Keskimäärin 16-vuotisen seurannan aikana1 400 naista sairastui aikuistyypin diabetekseen.
I Naisilla, jotka söivät prosessoitua lihaa vähintään viidestiviikossa, oli tutkimuksen mukaan noin kolmanneksensuurempi riski sairastua aikuisiän diabetekseen kuinnaisilla, joille liha maistui harvemmin kuin kerranviikossa.
HS 22.2.2012
Mitä yhteistä?
I huomisen sää ja ilmastonmuutos?
I pörssikurssien ja työttömyyden kehitys?
I vaihtoehtoisten kuntarakenteiden vaikutukset kuntientalouteen ja asukkaiden hyvinvointiin?
I puolueiden kannatusosuudet?
I sanomalehtien lukeminen ja lukutaito?
I makkaransyönnin terveysvaikutukset?
Mitä yhteistä?
Vastaukset näihin kysymyksiin
I eivät eksakteja vaan epävarmoja – sisältävät ainajonkinsuuruisen virhemarginaalin
I perustuvat kokeellisesti tai epäkokeellisesti hankittuunnumeeriseen havaintoaineistoon eli dataan,
I haetaan tilastollisten menetelmien avulla,
I ovat päteviä vain, jos datan hankinnassa on sovellettuasianmukaisia metodisia periaatteita kutenedustavuus ja vertailukelpoisuus
I vaativat usein mutkikkaiden tilastollisten mallienrakentamista ja sovittamista havaintoihin.
Mitä tilastotiede on?
Oppiaine ja tieteenala, jonka kohteena ovat
I sattuman ja vaihtelun hallinta,
I informaation suodattaminen datasta,
ja jonka soveltaminen on monin tavoin läsnäjokapäiväisessä elämässämme.
Tieto- ja informaatiotekniikka?
I Maailma (ml. Internet) on pullollaan dataa.
I Ns. informaatio- tai tietotekniikan välineet tuottavat,tallentavat, muokkaavat, siirtävät jne. dataa aina entistärunsaammin, pikkupiirteisemmin ja tehokkaammin.
I Täsmällisempää olisikin puhua datatekniikasta.
I Jotta kaiken datan sisältämä informaatio saataisiinsuodatetuksi ja sen pohjalta saataisiin tarkkaa jakäyttökelpoista tietoa, tarvitaan todellistainformaatioteknologiaa = tilastotiedettä!
Missä tilastotiedettä tarvitaan?I Tekniikka ja tuotantoelämä
• IT-ala: signaalin- ja kuvankäsittely• teollisuuden ja laboratorioiden laadunvalvonta
I Biologia• genetiikka, bioinformatiikka• ekologia, ympäristöntutkimus,• maatalous- ja metsäntutkimus
I Lääketiede ja terveydenhuolto• sairauksien syiden etsiminen• tautien ehkäisyn ja hoitojen vaikuttavuuden arviointi• lääkkeiden tuotekehitys
I Talous-, yhteiskunta- ja käyttäytymistieteetI Julkishallinto, yritykset, järjestöt, jne.
MISSÄ EI TARVITA?
Tilastotiede on matemaattinen tiede
Vaihtelun ja sattuman kuvaamisessa, mallittamisessa sekähavaintoaineiston analyysissä ja sen pohjalta tehtävässätilastollisessa päättelyssä tarvitaan matematiikkaa:
I todennäköisyyslaskentaa, satunnaismuuttujien jatodennäköisyysjakaumien teoriaa,
I matemaattista analyysiä l. differentiaali- jaintegraalilaskentaa,
I vektori- ja matriisialgebraa, kompleksianalyysiä, . . .
Tilastotiede on muutakin
Tilastotiede on vahvasti sovelluslähtöinen.
Tarpeellisten matematiikan välineiden lisäksi tilastotieteenpiiriin kuuluvat ainakin
I tutkimuksen suunnittelun ja havaintoaineiston hankinnanyleiset periaatteet ja menetelmät, kuten koesuunnitteluja otantamenetelmät
I tilastollisen analyysin tulosten esitys: informatiivistentaulukoiden ja kuvioiden laadinta – yhteyshavaintopsykologiaan ja kognitiotieteeseen.
I tilastollisen päättelyn filosofia.
Puolueiden kannatusarviotI Kysymys: Kuinka suuri osa äänestäjäkunnasta antaisi
tällä hetkellä äänensä kullekin puolueelle?
I Havaintoaineiston hankinta: Poimitaan satunnaisotosäänioikeutetuista ja haastatellaan puhelimitse.
I Aineiston analyysi: Lasketaan kutakin puoluetta kkannattavien määrä haastateltujen joukossa,kannatusosuuden pk piste-estimaatti p̂k ja ns.virhemarginaali eli tavallisesti 95% luottamusväli
p̂k ± 2×√
p̂k(1− p̂k)/n′
I Tulkinta ja päätelmät: Onko näyttöä kannatusosuuksienmuutoksista edelliseen gallupiin tai vaaleihin verrattuna?Vastausten luoitettavuus?
Karpalo-puolukkamehu ja virtsatietulehdus?I Kysymys: Vähentääkö karpalo-puolukkamehun
nauttiminen virtsatieinfektioiden uusiutumista?I Aineisto: Oulun YTHS:n ja OYS:n työterveyshuollon
potilaista värvätyt naiset satunnaistettiin (miksi?)koeryhmään (mehua 50 ml/d, n = 50) javertailuryhmään (n = 50).
I Analyysi: 6 kk aikana 16% koe- ja 36% vertailuryhmännaisista sai uuden infektion; ero 20%-yksikköä, 95%luottamusväli 3–36 %-yks., P-arvo 0.023.
I Tulkinta: Tutkimus antoi – sittemmin vahvistunutta –näyttöä siitä, että karpalo-puolukkamehulla voidaanvähentää virtsatieinfektion uusiutumista.
Lähde: Kontiokari ym. BMJ 2001; 322: 1-5
HS:n Nuorten postista 20.2.2012 poimittua
Ylioppilas Antti Remsun (19 v) kirjoitus “Tutkimuksista janiiden tuloksista pitäisi kirjoittaa kansantajuisesti”:
I Monet lukevat sanomalehdistä, kuinka esimerkiksi“uusi tutkimus osoittaa, että uusi lisäaine X on tai ei oleterveydelle haitallinen”. Lehdissä ei useinkaan kerrota,miten tulokseen on päädytty.
I Toivoisin, että tutkimusten tekoa, kriittistä analyysiä jaylipäätään omilla aivoilla ajattelemista opetettaisiinenemmän kouluissa, mieluiten jo peruskoulussa.
Sisältänee myös tilastolukutaidon opettamisen?
Tilastolukutaito
ISI:n (International Statistical Institute) maailmankongressin(Helsinki, 1999) lehdistötiedote
I “Tilastojen lukutaidon tarve kasvaa.
I Tilastojen lukutaitoa on parannettava niin päättäjienkuin tavallisen kansan keskuudessakin.
I Numerotaito on Unescon lukutaidottomuuskampanjanheikoin lenkki, jonka merkitys korostuu jatkuvasti.”
Kuinka koululaitoksemme huolehtii tilastolukutaidosta?
Tilastolukutaito
Kansalaisille tilastojen lukutaito on kahdella tavalla tärkeätä.
I Tilastojen lukutaito on olennainen osa arkielämänymmärtämistä, edellytys yksityiselämän järkevillepäätöksille ja apuväline hallinnon demokraattisenkontrollin toteuttamiselle.
I Työelämän kansainvälistyminen ja teknistyminen vaatiityöntekijöiltä yhä kehittyneempää tilastojen lukutaitoa jatilastollisen ajattelun hallintaa.
I Sille joka hallitsee tilastoajattelua, työmarkkinattarjoavat lukuisia mahdollisuuksia.
Lopuksi: Erään tilastotieteilijän CV
I matematiikan ja tilastotieteen opintoja, HYI tutkija, Suomen SyöpärekisteriI va. professori, lääketieteellinen tdk, KuY ja TaYI biostatistikko, lääket. tdk, OYI asiantuntijatehtäviä:
• terveydenhuollon menetelmien arviointi (THL),• Maailman terveysjärjestön (WHO) ja kv. syövän-
tutkimuskeskuksen kouluttajana:Ranska, Jordania, Thaimaa, Intia
I OY:n matemaattisten tieteiden laitoksen varajohtaja . . .
Elämä tilastotietelijänä on vaihtelevaa!