kvantitatiivnendata - jyväskylän yliopisto · • epäsuorat tunnisteet arvioidaan, jonka...

24
KVANTITATIIVNEN DATA JA SEN AVAAMINEN Eliisa Haanpää, Tietoarkisto Metodifestivaali, Jyväskylä 30.5.2017

Upload: others

Post on 06-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

KVANTITATIIVNEN DATAJA SEN AVAAMINEN

Eliisa Haanpää, TietoarkistoMetodifestivaali, Jyväskylä

30.5.2017

Page 2: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

1 Taustaa2 Suunnittelu & käsittely3 Anonymisointi

Esityksensisältö

Page 3: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

1 TAUSTAA

Page 4: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Miksi avata aineisto?• Tieteen avoimuus ja hyvä tieteellinen käytäntö• Rahoittajan tai yliopiston vaatimus• Tieteellinen meriitti tutkijalle• Yksittäinen aineisto on arvokas jatkotutkimukselle

Page 5: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Tutkimusaineiston elinkaari

TutkimussuunnitelmaAineistonhallinta-

suunnitelma

Luvat ja eettinen arviointiKeruun suunnittelu & toteutus

Käsittely & kuvailu

Aineiston avaaminen / arkistointi

Aineistotietojen julkaisu luetteloissa

1 2 3

Rahoituksen hakeminen

Aineiston analyysi & tulosten julkaisu

Elinkaari jatkuu mm. uusissa tutkimuksissa, opetuksessa, opiskelussa

Page 6: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

• Kerätty kyselyinä (käynti, puhelin, internet) strukturoidulla lomakkeella

• Myös mittausdataa, asiakirja- ja rekisteriaineistoja

• Havaintoyksikkö useimmiten henkilö (myös mm. ilmiö, maantieteellinen alue)

• Kvantidata -> tallennettuhavaintomatriisiksi

Kvantitatiivinen elimäärällinen aineisto

Page 7: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

FSD0115 ISSP 2000 : ympäristö II : Suomen aineisto

Page 8: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

2 SUUNNITTELU & KÄSITTELY

Page 9: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Aineistonhallintasuunnitelma osana tutkimussuunnitelmaavarmistaa, että aineistojen suhteen noudatetaan hyvää tieteellistä

käytäntöä ja mahdollistetaan aineiston jatkokäyttö.

Aineistonhallinnan suunnittelu

Page 10: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Aineistonhallintasuunnitelma

1 Aineisto2 Oikeudet3 Tietosuoja ja tietoturva4 Tiedostoformaatit ja

ohjelmistot5 Aineiston käsittelyn ja

sisällön kuvaus6 Elinkaari

Page 11: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

FSD0115 ISSP 2000 : ympäristö II : Suomen aineisto

Tutkimusaineisto

Page 12: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

• Havaintomatriisin tallennus• Muuttujien nimet ja selitteet• Muuttujan arvot ja niiden selitteet• Muuttujien muunnokset• Puuttuvat tiedot• Painomuuttujat

Aineiston käsittely avaamisen näkökulmasta

Page 13: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Tutkimuksentoteutuksen kuvailu• Alkuperäinen käyttötarkoitus• Julkaisut• Tekijät• Tuottajat• Perusjoukko• Havaintoyksikkö• Aineistonkeruu• Lähdeaineistot

Page 14: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Tietoarkisto sekä Avoin tiede ja tutkimus (ATT) järjestävät webinarin mm. kvantitatiivisten

aineistojen kuvailusta 6.6.2017 klo 14

Lisätietoa (Tietoarkisto > ajankohtaista > Osallistu webinareihin Ailan käytöstä ja tutkimusaineistojen kuvailusta)

Page 15: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

3 ANONYMISOINTI

Page 16: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Anonyymi aineisto

Pseudonyymi aineisto

Page 17: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Anonymisointi tulee suunnitella aina aineistokohtaisesti

Keinoja kvantitatiivisten aineistojen anonymisoinnille löytyy Tietoarkiston Aineistonhallinnan käsikirjasta > www.fsd.uta.fi/aineistonhallinta

Tietoarkisto toivoo tutkijoiden anonymisoivan kvantitatiivisen aineiston ennen sen arkistoimista

Anonymisoinnista

Page 18: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Yleisimmät kvantitatiivisenaineiston anonymisointikeinot

2 Arvojen uudelleen luokittelu sekä arvojen harkinnanvarainen luokittelu

1 Muuttujan poistaminen

3 Tunnisteiden poistaminen avointen kysymysten vastauksista

www.fsd.uta.fi/aineistonhallinta

Page 19: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

1 Muuttujien poistaminen

Muuttujat, joissa on tunnisteita, käsitellään seuraavasti:• Suorat tunnisteet poistetaan• Vahvat epäsuorat tunnisteet poistetaan• Epäsuorat tunnisteet arvioidaan, jonka

jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa

Page 20: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Avuksi luokitteluun: Tilastokeskuksen alue- ja henkilöluokituksetLuokittelutapoja:

• Vastausten yhdistäminen luokkiin (esim. ikä: vuosista luokiksi)

• Ääriarvojen poistaminen tai karkeistaminen (esim. yli 50 vuotiaat)

• Selkeästi poikkeavien ja yksilöivien arvojen luokittelu Muu-vastaukseksi

2 Muuttujien luokittelu

Page 21: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Avoimet kysymykset saattavat sisältää vastaajaa tai kolmansia henkilöitä koskevia tunnisteita, joista vastaaja on kertonut omin sanoin

• Yksittäisiä tunnisteita voidaan anonymisoida

• Esim. Humppila > [Maaseutumainen kunta Kanta-Hämeessä]

3 Tunnisteet avovastauksissa

Tunnistamisriski tulee arvioida aina tapauskohtaisesti suhteessa aineiston aihepiiriin ja taustamuuttujiin

Page 22: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Lisää anonymisoinnistaKvantitatiivisen aineiston anonymisointikeinot - Eliisa Haanpää

YouTubeAineistoesimerkit (kvantitatiiviset aineistot) - Eliisa Haanpää

YouTube

Lisää esityksiä anonymisoinnistaTutkimusaineistojen anonymisointi -seminaari 5.4.2017(Tietoarkisto > Ajankohtaista > Tapahtumat > Aiemmat tapahtumat)

Page 23: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

Hyvin toteutettu suunnittelu, kuvailu ja käsittely tukee tutkimuksen tekoa ja myöhemmin aineiston avaamista

Page 24: KVANTITATIIVNENDATA - Jyväskylän yliopisto · • Epäsuorat tunnisteet arvioidaan, jonka jälkeen ne luokitellaan, karkeistetaan tai poistetaan tarvittaessa. Avuksi luokitteluun:

TIETOARKISTOwww.fsd.uta.fi

Asiakaspalvelu (a) uta.fiEsityksen kuvat: Unsplash & Gratisography & StockSnap.io CC0

Lue lisää: aineistonhallinnan käsikirja: fsd.uta.fi/aineistonhallinta

Ehdota aineistoasi arkistoitavaksi Tietoarkistoon ottamalla yhteyttä asiakaspalveluun