HET WAT, WAAROM, HOE EN WIE
Datamanagement
Presentatie voor de bijeenkomst ‘Van Bibliothecaris naar Embedded Librarian’ – Hogeschool Utrecht, 17 oktober 2013 – Joeri Nortier
• SURF- In 1988 opgezet- Samenwerkingsorganisatie van
verschillende universiteiten, hogescholen en instituten
- Gericht op ICT-innovaties om kwaliteit onderwijs en onderzoek te verbeteren
- Bestaat uit verschillende organisaties
Even voorstellen
2
Garandeerd samenwerking en betrokkenheid van managers in het hoger onderwijs en onderzoek
Verbindt ICT en gebruikers en zoekt naar nieuwe technieken
Biedt ICT, software en training
High-performance computing en visualisatie
Efficient managen van de resultaten van samenwerkingsverbanden
Onderdelen SURF
3
Even voorstellen
• Mijn rol binnen SURF- Projectcoördinator bij ICT en
Onderzoek- Gericht op onderzoeksdata
- Special Interest Group Research Data
- SIM4RDM
4
Opzet presentatie
• Wat is datamanagement (Research Data Management)?
• Waarom is datamanagement belangrijk?
• Hoe moet goed datamanagement worden uitgevoerd?
• Wie is verantwoordelijk voor welke delen van datamanagement?
• Wat kan SURF voor jullie doen?
5
Wat is Datamanagement
6
Wat is Datamanagement?
• Definitie datamanagement: ‘alle werkzaamheden die te maken hebben met het archiveren, collectioneren, beschrijven, toegankelijk maken en publiceren van onderzoeksdata in digitale vorm’
• Definitie onderzoeksdata: ‘digitale gegevens die gebruikt (kunnen) worden voor wetenschappelijk onderzoek, alsook de gegevens die uit wetenschappelijk onderzoek worden gegenereerd’
• 3 belangrijke hoofdthema’s1. Data-archivering2. Metadata3. Digitale duurzaamheid
7
• Zowel tijdens als na het onderzoeksproces
• Wordt steeds belangrijker- Overheidsbeleid- Steeds meer aandacht vanuit
onderzoekers en vanuit bestuurders
• Van groot naar klein- Excell-sheet- Big Data
Wat is Datamanagement?
8
9
10
Wat is Datamanagement?
• Wat is belangrijke onderzoekdata?- Hoge waarde
- Maatschappelijk- Toekomstig- Historisch
- Uniek
- Definitie wordt echter steeds ruimer
11
Waarom is Datamanagement belangrijk?
12
Waarom is Datamanagement belangrijk?
Zeer veel redenen, hieronder een aantal belangrijke
• Groot voordeel voor onderzoekers zelf
• Onderdeel van een goed wetenschappelijk proces
‘Sound research rests on the ability to evidence, verify and reproduce results – managing your data enables all three’ Simon Hodson, CODATA
• Goed voor de wetenschap in het algemeen- Data blijft beschikbaar, ook nadat het onderzoek is afgelopen- Internationale onderzoeksinfrastructuur
• Sneller en gemakkelijker data delen = sneller oplossingen voor problemen- Meer mensen kunnen meewerken- Onderzoek gaat sneller
13
Waarom is Datamanagement belangrijk?
• Goed voor de reputatie van een instelling- Data die gemakkelijk te vinden is, zal veel worden gebruikt- Veel citaties is een hoge ranking
• Controle van wetenschappelijke conclusies- Gaat fraudegevallen tegen (integriteit)
• Wetgeving en regulering- Eisen vanuit overheid, NWO, EU en uitgevers
• Sluit aan bij veranderen maatschappij- Connected society- Steeds meer data
14
Hoe moet goed datamanagement worden uitgevoerd?
15
Hoe moet goed datamanagement worden uitgevoerd?
• Verschillende onderdelen waar rekening me gehouden moet worden- datamanagementplannen- opslag tijdens en na een onderzoeksproject- cloudoplossingen voor opslag- ondersteuning aan onderzoekers door dataprofessionals- juridische aspecten- security en privacy
• Verschillende niveau’s hebben verschillende wensen en zijn verantwoordelijk voor verschillende onderdelen- Bestuurders- Data Librarians / Dataprofessionals / Ondersteuners- Onderzoekers
16
Hoe moet goed datamanagement worden uitgevoerd?
• Datamanagementplannen- Opgesteld door financiers, uitgevers en bestuurders- Schetst de kaders- Vooraf in kaart brengen van benodigde voorzieningen en knelpunten- Al verschillende pilotprojecten en ‘best practices’
- DANS, Regie in de Cloud,
• Opslag tijdens en na een onderzoeksproject- Kan op verschillende niveaus worden aangeboden- Groot verschil tussen opslag tijdens en na
- Digitale onderzoeksomgeving- Opslag omgevingen (toch geen data kerkhoven?)
- Open Data? - Heeft vele voordelen- Onderzoek met publiek geld
17
Hoe moet goed datamanagement worden uitgevoerd?
• Cloudoplossingen voor opslag- Rekening houden met veiligheid- Al enkele pilots uitgevoerd (Regie in de Cloud)
• Ondersteuning aan onderzoekers door dataprofessionals- Geef waardering aan onderzoekers als zij hun onderzoeksdata delen- Geef training op het gebied van datamanagement- Richt een data-infrastructuur in
• Juridische aspecten- WBP- Aan verandering onderhevig en multi-interpretabel
• Security en Privacy- Grote zorg voor onderzoekers
18
Hoe moet goed datamanagement worden uitgevoerd?
• Wat willen onderzoekers?- Controle en zekerheid over wat er met hun data gebeurt
- Privacy- Iemand anders gaat er met mijn data vandoor!
- Beloning- Citaties
- Vrijheid- Elk wetenschapsveld is uniek, tools moeten hierop afgestemd zin- Verplichten werkt contra-productief- Cafetaria-model
- Ondersteuning- Voordelen gelijk duidelijk- Praktisch, gelijk toe te passen
19
Hoe moet goed datamanagement worden uitgevoerd?
• Wat willen data librarians?- Een duidelijk mandaat van de
bestuurders- Duidelijk beleid- Goede opleidingen / cursussen- Goede ICT voorzieningen
20
Hoe moet goed datamanagement worden uitgevoerd?
7 stappen voor beter datamanagement aan een HO instelling (CODATA)
1. Onderzoeken hoe je instelling nu al met onderzoeksdata omgaat2. Collega’s en bestuurders overtuigen van het nut van datamanagement3. Bepaal welke positie je m.b.t. datamanagement wil innemen
- Betrek hierbij onderzoekers, IT, de bibliotheek, etc.4. Zorg voor bewustwording bij onderzoekers5. Zorg voor een robuuste en gemakkelijke infrastructuur6. Zorg dat je data makkelijk te vinden en te citeren is7. Blijf je beleid, training en infrastructuur verder ontwikkelen
21
Wie is verantwoordelijk voor welke delen van Datamanagement?
22
Wie is verantwoordelijk voor welke delen van Datamanagement?
• Taken Bestuurders- Verantwoordelijke voor de kaders- Opstellen datamanagementplan
- Datamanagement inbedden in cyclus van onderzoek- Beschikbaar stellen van infrastructuur- Incentives voor onderzoekers- Vertalen van wensen onderzoekers en ondersteuners
- En natuurlijk: geld- Voor goede ondersteuning, infrastructuur en beleid- Ook kosten na afronding onderzoek!
- Datamanagement nu vaak nog een ondergeschoven kindje
23
Wie is verantwoordelijk voor welke delen van Datamanagement?
• Taken Data Librarians- Nieuw type ondersteuner is nodig: Dataprofessional
- Belangrijke taak in het ondersteunen van onderzoekers- Schakelfunctie tussen de praktijk en het beleid- Face-to-face contact belangrijk
- Training is nodig: ‘train the trainers’- In VK en USA al veel online cursussen, vaak algemeen van karakter- Ook in Nederland in opkomst (DANS, 3TU.Datacentrum)
• Wat heeft een dataprofessional nodig?- De juiste mix van IT- en ‘soft skills’
- Dataspecifieke vaardigheden (technische vaardigheden)- Algemene datavaardigheden (sociale vaardigheden)
24
Wie is verantwoordelijk voor welke delen van Datamanagement?
• Taken Onderzoekers- Zorgen voor kwaliteit en toegankelijkheid van data
- In voorbereiding onderzoek meenemen- Beheer tijdens uitvoering- Beheer na afronding onderzoek
- Kortom: datamanagement moet een bepaalde mindset worden
25
Wie is verantwoordelijk voor welke delen van Datamanagement?
Uitwerking in de praktijk
• Front Office- Bestaat uit ondersteuners- Direct contact met gebruikers- Instellingen
• Back Office- Opslag en toegankelijkheid op lange termijn- Expertisecentrum- Landelijke datacentra
• Federatief model van SURF als voorbeeld
26
Wie is verantwoordelijk voor welke delen van Datamanagement?
27
Wat kan SURF voor jullie betekenen?
28
Wat kan SURF voor jullie betekenen?
• Communiceren en onderhandelen met de belangrijkste spelers
• Commitment verzekeren op het bestuursniveau
• Partijen samenbrengen om tot een samenwerking te komen
• Kennis en informatie uitwisselen
• Op de hoogte blijven van (inter)nationale trends
• In enkele gevallen het managen van kleine projecten of pilots
• Voorbeeld: Regie in de Cloud
29
30
SOS Project - Uitdagingen
Aantal onderzoekers
ONDERSTEUNINGWeinig onderzoekersMaatwerk en specialisatieProjecten op de lange termijnVeel ondersteuning per onderzoeker
Veel onderzoekersAlgemene hulpKleine projectenWeinig ondersteuning per onderzoeker
0 20,000
31
SOS Project - Aanpak
Aantal onderzoekers
ONDERSTEUNING
0 20,000
Pool of project managers
Outreach (website, use cases, videos)
Train-the-Trainer
Community building Eén e-maildres
Meer informatie?
• Website SURF – www.surf.nl/onderzoek
• Website DANS – www.dans.knaw.nl
• Website 3TU.Datacentrum – datacentrum.3tu.nl
• Website NWO – www.nwo.nl
• SIG Research Data - www.surfspace.nl/sig/28-research-data/
32
www.surf.nl
Joeri [email protected]