samlingsportaler for universitetsmuseene, musit seminar, gbif norge (2013)

42
MUSIT seminar: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata? Global Biodiversity Information Facility GBIF Norge Dag Endresen og Christian Svindseth GBIF Norge, NHM-UiO Naturhistorisk museum, Universitetet i Oslo (NHM-UiO) Global Biodiversity Information Facility (GBIF) 6 februar 2013

Upload: dag-endresen

Post on 12-Dec-2014

202 views

Category:

Technology


0 download

DESCRIPTION

MUSIT seminar 6 februar 2013: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata? Presentasjon fra GBIF Norge.

TRANSCRIPT

Page 1: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

MUSIT seminar: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata?

Global Biodiversity Information FacilityGBIF Norge

Dag Endresen og Christian SvindsethGBIF Norge, NHM-UiONaturhistorisk museum, Universitetet i Oslo (NHM-UiO)Global Biodiversity Information Facility (GBIF)

6 februar 2013

Page 2: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Emner

2

• Hva er GBIF?• GBIF data portal• Portal toolkit (NPT)• Darwin Core (DwC), DwC arkiv• Stabile ID nøkler (UUID)• Data manuskript, sitering for datasett

Page 3: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Status data portalFebruar 2013

3

GBIF arbeider for fri og åpen tilgang til biodiversitetsdata online.

Vi er et internasjonalt og statlig initiert og finansiert nettverk med fokus på å bidra til at biodiversitetsdata er tilgjengelig for alle og enhver, for vitenskapelig forskning, bevaring og bærekraftig utvikling.

Page 4: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

4Norge ble medlem i februar 2004.

Page 5: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Etter anbefaling fra OECD Global Science Forum (1999):

“[E]stablish and support a distributed system of interlinked and interoperable modules (databases, software and networking tools, search engines, analytical algorithms, etc.) that together will form a Global Biodiversity Information Facility (GBIF)”.

Etter anbefaling fra OECD Global Science Forum (1999):

“[E]stablish and support a distributed system of interlinked and interoperable modules (databases, software and networking tools, search engines, analytical algorithms, etc.) that together will form a Global Biodiversity Information Facility (GBIF)”.

Page 6: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

GBIF’s unike rolle

• Register for biodiversitet data ressurser.• Verktøy og support for publisering av biodiversitetsdata.• Nettverk på nasjonalt, regionalt og globalt nivå.• Ett globalt virtuelt naturhistorisk datasett.• Tverrsektoriell lenke mellom data fra samlinger, økologi

og genetikk.• Tilgang til biodiversitetsdata for GIS analyse og

miljøovervåking.– Aggregerte data for stedfestede artsobservasjoner.

Basert på ett lysbilde av Donald Hobern (2012)6

Page 7: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Forbedrer ”fitness-for-use”Aggregate

Data Indexes

Data Quality

Expert Curation

• Progressiv forbedring– Dataindeks

• Sentralisert søkesystem.• Standardisering av stabile nøkler.• Konsekvensanalyse for metadata.

– Datakvalitet• Uoverenstemmelser innenfor poster.• Validering av poster mot metadata.• Identifisering av avvikende data.• Statistikk per post og per datasett.

– Ekspert korrigering• Interface med fagmiljø for artsnavn.• Rapportering av feil og annoteringer fra

databrukere.

Basert på ett lysbilde av Donald Hobern (2012)

Page 8: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Samarbeidspartnere– Biologisk litteratur

• Biodiversity Heritage Library (BHL).• Annoteringer fra brukere for å ekstrahere stedfestede

artsobservasjoner.• Lenke mellom artsbeskrivelser fra litteratur til taxonomi og

artsnavn.

– Artsinformasjoner• Encyclopedia of Life (EOL).• Assistere EOL som global aggregator av artsbeskrvninger.• Include EOL summary box on each GBIF species page

– Artsnavn, nomenklatur• Catalogue of Life (CoL), etc.• Publisere globale og regionale datasett med artsnavn.• GBIF infrastruktur kan levere artsnavn til CoL (etc.).

8 Basert på ett lysbilde av Donald Hobern (2012)

Page 9: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

1.Informasjonsinfrastruktur – en Internet-basert indeks for et globalt distributert nettverk av interoperative databaser som inneholder primær biodiversitet data.

1.Programvare, standarder og protokoller – verktøy som dataleverandører behøver for å formattere og publisere data.

1.Opplæring– og tilgang til et globalt nettverk med eksperter.

9

Page 10: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

http://data.gbif.org/

Page 11: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

GBIF portal: 17,281,052 artsobservasjoner og objekter (16,076,604 med koordinater). GBIF Norge: 11,777,738 artsobservasjoner og objekter er publisert FRA norske dataleverandører.

Page 12: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

GBIF portal: 17,281,052 artsobservasjoner og objekter (16,076,604 med koordinater). GBIF Norge: 11,777,738 artsobservasjoner og objekter er publisert FRA norske dataleverandører.

Page 13: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Ta gjerne kontakt med oss med tilbakemeldinger og forslag til endringer og forbedringer for denne portalen!

Page 14: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

GBIF leverer data for artsobservasjoner og museumsobjekter til “Artskart”.

14

Page 15: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

15

• Programvare fra GBIF for å implementere online dataportaler for biodiversietsdata.– Nasjonal, tematisk eller regional.

• Åpen kildekode, fritt tilgjengelig (Google Code).• Drupal 7 (PHP, Javascript).• Bygger videre på Scratchpads 2 .

– ViBRANT, NHM London, EU 7th framework.– http://scratchpads.eu/

Page 16: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

16

Page 17: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Basert på ett lysbilde av David Remsen (2011)

Page 18: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

NPT Startup

Basert på ett lysbilde av David Remsen (2011)

Page 19: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

NPT kan utvides ved å utvikle eller installere ferdige Moduler.

Basert på ett lysbilde av David Remsen (2011)

Page 20: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

En modul kan vise en kalender på din webportal.

Basert på ett lysbilde av David Remsen (2011)

Page 21: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

En annen modul kan vise en liste med artsnavn basert på artsobservasjoner

rapportert inn til GBIF portalen.

Basert på ett lysbilde av David Remsen (2011)

Page 22: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Modul som viser et GBIF data kart for hver taxon i en artsliste

Basert på ett lysbilde av David Remsen (2011)

Page 23: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Standard oppsett fra GBIF leverer et startpunkt for videre utvikling.•Leverer en konfigurerbar webportal.•Leverer et rammeverk for der nye moduler kan legges til.•Viser GBIF portal data som datakart for ditt land eller din region.

Basert på ett lysbilde av David Remsen (2011)

Page 24: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Ulike portaler vil implementere helt ulike sett av moduler for å

imøtekomme sine egne behov.

Basert på ett lysbilde av David Remsen (2011)

Page 25: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Basert på ett lysbilde av David Remsen (2011)

Page 26: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Basert på ett lysbilde av David Remsen (2011)

Page 27: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

27

Page 28: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Darwin Core – terminologi, vokabulær

Wieczorek J, Bloom D, Guralnick R, Blum S, Döring M, De Giovanni R, Robertson T, and Vieglais D (2012) Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLoS ONE 7(1): e29715. (doi:10.1371/journal.pone.0029715)

Page 29: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Tverrsektorell artsdata

Integrert tilgang for artsobservasjoner for alle arter:

• Hva?• Når?• Hvor?• Bevis og

dokumentasjon?• Dataeier?• Lenke til originaldata

Forekomst av art

Collections

EcologicalMonitoring Genomics

Darwin Core

Basert på ett lysbilde av Donald Hobern (2012)

Page 30: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Collections

EcologicalMonitoring Genomics

Darwin CoreUtvidelser kompatibel med Darwin Core standarden, pluss:

• Hvilke arter er funnet sammen?

• Hvilke datasett er direkte sammenlignbare?

• Hvilke arter er mest tallrike på ulike lokaliteter?

Forekomst og fraværs-data

Darwin Core+ Core Survey

Fields

Sample IdMethod Id

Relative abundance...

Basert på ett lysbilde av Donald Hobern (2012)

Integrert tilgang for artsobservasjoner for alle arter:

• Hva?• Når?• Hvor?• Bevis og

dokumentasjon?• Dataeier?• Lenke til originaldata

Forekomst av art

Tverrsektorell artsdata

Page 31: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

http://rs.tdwg.org/dwc/terms/

Page 32: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Darwin Core Arkiv (DwC-A) Publiseringsformat for Darwin Core

termer inkludert flere standardiserte utvidelser.

Enkelt tekstbasert format. Zip-komprimert filarkiv.

Germplasm.txt

32

Page 33: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

MUSITPortal…?

Artskart

33

UiT

UiB

NTNU

Darwin Core Arkiv

Samlinger publiseres fra dataeier som ett Darwin Core arkiv (DwC-A). Ulike datatyper fra samme DwC-A kan inkluderes til ulike data portaler.

GBIFPortal

Muligheter med Darwin Core:

Page 34: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

• Stabile ID nøkler (UUID, QR code)• Datasett metadata (data manuskript)

34

Page 35: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

• Globalt unike ID nøkler.• Skalerbar modell, antall ID nøkler.• Sosial aksept i fagmiljø.• Lang livssyklus for ID nøkler.• ”Resolution service(s)”.• Kostnad per ID nøkkel.• Bruker- eller maskin-vennlig.• Løsning for å generere nye ID nøkler.

– Sentralisert system for nye ID nøkler. – Føderert generering av ID ved kilde.

35

Page 36: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

• En UUID er et 16-octet (128-bit) nummer.• Eksempel:

C37E3F9B-BCAF-4479-8EB7-3346A2DB2373

• Sannsynligheten at en duplisert nøkkel blir generert er omkring 50% dersom alle personer på hele jorden lager 600 million UUIDs hver.

• Tillater lettvindt generering av nøkler ved kilden i et føderert nettverk.

36

Page 37: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

• “Quick Response Code” (QR code).• En type matriks strekkode (eller to-

dimensjonal kode).• Populær grunnet hurtig maskinlesbar og

stor kapasitet for lagring.• Anvendelsen av QR koder er gratis uten

begrensende lisensbetingelser.• Format for QR koder er entydig definert og

publisert som en ISO standard.• Oppfunnet i Japan av et datterselskap til

Toyota: Denso Wave i 1994.37

Page 38: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

QR-kode for museumsobjektene ved NHM-UiO ville kunne levere:

•Maskinlesbar id med en ordinær smart phone (eller PDA).•Ny og effektiv arbeidsflyt for samlingsarbeide.•Implementering av stabile id nøkler velegnet for databaser.

38

Page 39: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

• Peer review løsning for biodiversitetsdata.• Vitenskapelig anerkjennelse for publisering

av data.• Mekanisme for bedre datakvalitet.• Mekanisme for sitering av data.• Metadata format: Ecological Metadata

Language (EML), Dublin Core, Darwin Core, Natural Collections Descriptions (NCD)…

• Nye muligheter Hvert datasett publisert til GBIF med eget data manuskript…?

39

Page 40: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)
Page 41: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

FNs “Millennium Ecosystem Assessment” (2005) viste at menneskelige handlinger ofte leder til irreversible tap innen det biologiske mangfoldet, og at disse tap har vært større i de siste 50 årene enn noen gang før i menneskehetens historie.

Biologisk mangfold er nøkkelen til en bærekraftig fremtid – og evnen av naturlige og sosiale systemer for å tilpasse seg endringer, er avgjørende for nesten alle aspekter av menneskets velvære.

Fordi menneskeskapte trusler mot biologisk mangfold oppstår over brede romlige og tidsmessige skalaer, biologisk mangfold og økosystem overvåkning, varsling, og risikovurderinger krever data som er organisert i en globalt og lett-tilgjengelig, integrert infrastruktur.

GBIF’s Data Portal leverer denne infrastruktur.

41

Page 42: Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Takk for oppmerksomheten!

GBIF Norge

Dag [email protected]

Christian [email protected]

Innlegg ved MUSIT seminar på Gardermoen, 6 februar 2013