tutkijan puheenvuoro, matti sarvimäki
TRANSCRIPT
Tutkijan puheenvuoro
Matti Sarvimäki
Aalto ja VATT
Tutkimusaineistojen etäkäyttö ja tietosuoja, 20.1.2015
Ehdotuksia TK:lle
• Laskentateho kuntoon!
– nykykäytännössä usein lähes mahdotonta työskennellä
– osaa menetelmistä ei kannatta edes yrittää käyttää
– laskentaintensiiviset ajot haittaavat myös muiden käyttäjien työtä
• Miten?
– erillinen palvelu paljon tehoa tarvitseville?
– tehokkaampi käyttäjien allokointi palvelimille?
Ehdotuksia tutkijoille
• Etäkäytössä on kaksi niukkaa resurssia: – järjestelmän laskentateho / säilytyskapasiteetti
– tutkijapalveluiden työntekijöiden aika
• Meillä on oikeus käyttää näitä resursseja … mutta kaikki kärsivät tehottomuudesta
• Miksi vähentää resurssien hukkakäyttöä? – muiden työskentely tehostuu
– sinun työskentelysi tehostuu (enemmän!)
• Lukusuositus:– Gentzkow & Shapiro: Code and data for the social sciences: A
practitioner's guide. [link]
Ehdotuksia
1. Ajattele ensin
2. Noudata tehokasta projektinhallintastrategiaa
3. Tee itsellesi harjoitteludata
4. Koodaa tehokkaasti
5. Seuraa resurssien käyttöä(si)
6. Tee suuret ajot viikonloppuna / yöllä
7. Anna palautetta
8. Pyydä vain tarpeelliset tulokset ulos
Ehdotus 1. Ajattele ensin
• Tee näin:
– määrittele täsmällinen tutkimuskysymys
– mieti millainen analyysi siihen vastaa
– tee analyysi (ja tarpeelliset robustness checkit)
• Miksi?
– hyvä empiirinen työ perustuu ennalta mietittyihin analyyseihin (ei spesifikaatiokalasteluun!)
– turhien analyysien ajo vie sinulta (ja muilta) aikaa
Ehdotus 2. Noudata tehokasta projektinhallintastrategiaa
• Tee näin:
– lue Gentzkow & Shapiro
– noudata heidän ohjeitaan
• Miksi?
– säästät paljon aikaa
– teet vähemmän virheitä
– kuormitat vähemmän etäyhteyttä
Ehdotus 3. Tee itsellesi harjoitteludata
• Tee näin:
– ota analyysisi perusdatasta pieni otos
– kirjoita koodi käyttäen tätä dataa
– aja tulokset koko datalla kun koodi on valmis
• Miksi?
– säästää sinun (ja muiden!) aikaa
– teet parempaa tutkimusta (muistuttaa spesifikaatioon ennalta sitoutumista)
Ehdotus 4. Koodaa tehokkaasti
• Tee näin:
– lue Gentzkow & Shapiro
– noudata heidän ohjeitaan
• Miksi?
– säästät paljon aikaa
– teet vähemmän virheitä
– kuormitat vähemmän etäyhteyttä
Ehdotus 5. Seuraa resurssien käyttöä(si)
• Tee näin:
– käynnistä Task Manager painamalla ctrl-shift-esc
– katso paljonko resursseja käytät
– katso paljonko muut käyttävät
– oleta että muut tekevät samoin
• Miksi?
– seuraavat kalvot
Ehdotus 6. Tee suuret ajot viikonloppuna / yöllä
• Tee näin:
– pistä iso ajo pyörimään
– sulje etäyhteysikkuna, mutta älä kirjaudu ulos(ajo jää pyörimään)
• Miksi?
– kaikki osaavat nyt seurata resurssiesi käyttöä
– … ja jotkut saatavat noudattaa seuraavaakin ohjetta
Ehdotus 7. Anna palautetta
• Tee näin:
– jos jokin ei toimi, kerro siitä henkilölle joka pystyy sen korjaamaan
– jos osaat, ehdota miten asian voisi korjata
• Muista kuitenkin:
– joskus on pakko ajaa isoja ajoja (päivälläkin)
– tutkijapalveluissa on töissä liian vähän ihmisiä (ja tämä ei ole heidän vikansa)
– jotkut ongelmat on vaikea ratkaista
Ehdotus 8. Pyydä vain tarpeelliset tulokset ulos
• Tee näin:– mieti mitä oikeasti aiot raportoida
– varmista että et pyydä mitään, mitä ulos ei voi antaa
– laita output kansioon readme-tiedosto, jossa kerrot täsmällisesti mitä pyytämäsi materiaali on, miksi sen antaminen ei ole laitonta ja millä koodilla se on tehty
• Miksi?– tutkijapalveluissa on töissä liian vähän ihmisiä (ja tämä ei ole
heidän – tai muiden tutkijoiden – vika)
• Ehdotus TK:lle:– ilmainen ”välitila” etäyhteydettömille kanssakirjoittajille,
jossa tarkastamattomia tuloksia voisi hallitusti katsella