samlingsportaler for universitetsmuseene, musit seminar, gbif norge (2013)
DESCRIPTION
MUSIT seminar 6 februar 2013: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata? Presentasjon fra GBIF Norge.TRANSCRIPT
MUSIT seminar: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata?
Global Biodiversity Information FacilityGBIF Norge
Dag Endresen og Christian SvindsethGBIF Norge, NHM-UiONaturhistorisk museum, Universitetet i Oslo (NHM-UiO)Global Biodiversity Information Facility (GBIF)
6 februar 2013
Emner
2
• Hva er GBIF?• GBIF data portal• Portal toolkit (NPT)• Darwin Core (DwC), DwC arkiv• Stabile ID nøkler (UUID)• Data manuskript, sitering for datasett
Status data portalFebruar 2013
3
GBIF arbeider for fri og åpen tilgang til biodiversitetsdata online.
Vi er et internasjonalt og statlig initiert og finansiert nettverk med fokus på å bidra til at biodiversitetsdata er tilgjengelig for alle og enhver, for vitenskapelig forskning, bevaring og bærekraftig utvikling.
4Norge ble medlem i februar 2004.
Etter anbefaling fra OECD Global Science Forum (1999):
“[E]stablish and support a distributed system of interlinked and interoperable modules (databases, software and networking tools, search engines, analytical algorithms, etc.) that together will form a Global Biodiversity Information Facility (GBIF)”.
Etter anbefaling fra OECD Global Science Forum (1999):
“[E]stablish and support a distributed system of interlinked and interoperable modules (databases, software and networking tools, search engines, analytical algorithms, etc.) that together will form a Global Biodiversity Information Facility (GBIF)”.
GBIF’s unike rolle
• Register for biodiversitet data ressurser.• Verktøy og support for publisering av biodiversitetsdata.• Nettverk på nasjonalt, regionalt og globalt nivå.• Ett globalt virtuelt naturhistorisk datasett.• Tverrsektoriell lenke mellom data fra samlinger, økologi
og genetikk.• Tilgang til biodiversitetsdata for GIS analyse og
miljøovervåking.– Aggregerte data for stedfestede artsobservasjoner.
Basert på ett lysbilde av Donald Hobern (2012)6
Forbedrer ”fitness-for-use”Aggregate
Data Indexes
Data Quality
Expert Curation
• Progressiv forbedring– Dataindeks
• Sentralisert søkesystem.• Standardisering av stabile nøkler.• Konsekvensanalyse for metadata.
– Datakvalitet• Uoverenstemmelser innenfor poster.• Validering av poster mot metadata.• Identifisering av avvikende data.• Statistikk per post og per datasett.
– Ekspert korrigering• Interface med fagmiljø for artsnavn.• Rapportering av feil og annoteringer fra
databrukere.
Basert på ett lysbilde av Donald Hobern (2012)
Samarbeidspartnere– Biologisk litteratur
• Biodiversity Heritage Library (BHL).• Annoteringer fra brukere for å ekstrahere stedfestede
artsobservasjoner.• Lenke mellom artsbeskrivelser fra litteratur til taxonomi og
artsnavn.
– Artsinformasjoner• Encyclopedia of Life (EOL).• Assistere EOL som global aggregator av artsbeskrvninger.• Include EOL summary box on each GBIF species page
– Artsnavn, nomenklatur• Catalogue of Life (CoL), etc.• Publisere globale og regionale datasett med artsnavn.• GBIF infrastruktur kan levere artsnavn til CoL (etc.).
8 Basert på ett lysbilde av Donald Hobern (2012)
1.Informasjonsinfrastruktur – en Internet-basert indeks for et globalt distributert nettverk av interoperative databaser som inneholder primær biodiversitet data.
1.Programvare, standarder og protokoller – verktøy som dataleverandører behøver for å formattere og publisere data.
1.Opplæring– og tilgang til et globalt nettverk med eksperter.
9
http://data.gbif.org/
GBIF portal: 17,281,052 artsobservasjoner og objekter (16,076,604 med koordinater). GBIF Norge: 11,777,738 artsobservasjoner og objekter er publisert FRA norske dataleverandører.
GBIF portal: 17,281,052 artsobservasjoner og objekter (16,076,604 med koordinater). GBIF Norge: 11,777,738 artsobservasjoner og objekter er publisert FRA norske dataleverandører.
Ta gjerne kontakt med oss med tilbakemeldinger og forslag til endringer og forbedringer for denne portalen!
GBIF leverer data for artsobservasjoner og museumsobjekter til “Artskart”.
14
15
• Programvare fra GBIF for å implementere online dataportaler for biodiversietsdata.– Nasjonal, tematisk eller regional.
• Åpen kildekode, fritt tilgjengelig (Google Code).• Drupal 7 (PHP, Javascript).• Bygger videre på Scratchpads 2 .
– ViBRANT, NHM London, EU 7th framework.– http://scratchpads.eu/
16
Basert på ett lysbilde av David Remsen (2011)
NPT Startup
Basert på ett lysbilde av David Remsen (2011)
NPT kan utvides ved å utvikle eller installere ferdige Moduler.
Basert på ett lysbilde av David Remsen (2011)
En modul kan vise en kalender på din webportal.
Basert på ett lysbilde av David Remsen (2011)
En annen modul kan vise en liste med artsnavn basert på artsobservasjoner
rapportert inn til GBIF portalen.
Basert på ett lysbilde av David Remsen (2011)
Modul som viser et GBIF data kart for hver taxon i en artsliste
Basert på ett lysbilde av David Remsen (2011)
Standard oppsett fra GBIF leverer et startpunkt for videre utvikling.•Leverer en konfigurerbar webportal.•Leverer et rammeverk for der nye moduler kan legges til.•Viser GBIF portal data som datakart for ditt land eller din region.
Basert på ett lysbilde av David Remsen (2011)
Ulike portaler vil implementere helt ulike sett av moduler for å
imøtekomme sine egne behov.
Basert på ett lysbilde av David Remsen (2011)
Basert på ett lysbilde av David Remsen (2011)
Basert på ett lysbilde av David Remsen (2011)
27
Darwin Core – terminologi, vokabulær
Wieczorek J, Bloom D, Guralnick R, Blum S, Döring M, De Giovanni R, Robertson T, and Vieglais D (2012) Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLoS ONE 7(1): e29715. (doi:10.1371/journal.pone.0029715)
Tverrsektorell artsdata
Integrert tilgang for artsobservasjoner for alle arter:
• Hva?• Når?• Hvor?• Bevis og
dokumentasjon?• Dataeier?• Lenke til originaldata
Forekomst av art
Collections
EcologicalMonitoring Genomics
Darwin Core
Basert på ett lysbilde av Donald Hobern (2012)
Collections
EcologicalMonitoring Genomics
Darwin CoreUtvidelser kompatibel med Darwin Core standarden, pluss:
• Hvilke arter er funnet sammen?
• Hvilke datasett er direkte sammenlignbare?
• Hvilke arter er mest tallrike på ulike lokaliteter?
Forekomst og fraværs-data
Darwin Core+ Core Survey
Fields
Sample IdMethod Id
Relative abundance...
Basert på ett lysbilde av Donald Hobern (2012)
Integrert tilgang for artsobservasjoner for alle arter:
• Hva?• Når?• Hvor?• Bevis og
dokumentasjon?• Dataeier?• Lenke til originaldata
Forekomst av art
Tverrsektorell artsdata
http://rs.tdwg.org/dwc/terms/
Darwin Core Arkiv (DwC-A) Publiseringsformat for Darwin Core
termer inkludert flere standardiserte utvidelser.
Enkelt tekstbasert format. Zip-komprimert filarkiv.
Germplasm.txt
32
MUSITPortal…?
Artskart
33
UiT
UiB
NTNU
Darwin Core Arkiv
Samlinger publiseres fra dataeier som ett Darwin Core arkiv (DwC-A). Ulike datatyper fra samme DwC-A kan inkluderes til ulike data portaler.
GBIFPortal
Muligheter med Darwin Core:
• Stabile ID nøkler (UUID, QR code)• Datasett metadata (data manuskript)
34
• Globalt unike ID nøkler.• Skalerbar modell, antall ID nøkler.• Sosial aksept i fagmiljø.• Lang livssyklus for ID nøkler.• ”Resolution service(s)”.• Kostnad per ID nøkkel.• Bruker- eller maskin-vennlig.• Løsning for å generere nye ID nøkler.
– Sentralisert system for nye ID nøkler. – Føderert generering av ID ved kilde.
35
• En UUID er et 16-octet (128-bit) nummer.• Eksempel:
C37E3F9B-BCAF-4479-8EB7-3346A2DB2373
• Sannsynligheten at en duplisert nøkkel blir generert er omkring 50% dersom alle personer på hele jorden lager 600 million UUIDs hver.
• Tillater lettvindt generering av nøkler ved kilden i et føderert nettverk.
36
• “Quick Response Code” (QR code).• En type matriks strekkode (eller to-
dimensjonal kode).• Populær grunnet hurtig maskinlesbar og
stor kapasitet for lagring.• Anvendelsen av QR koder er gratis uten
begrensende lisensbetingelser.• Format for QR koder er entydig definert og
publisert som en ISO standard.• Oppfunnet i Japan av et datterselskap til
Toyota: Denso Wave i 1994.37
QR-kode for museumsobjektene ved NHM-UiO ville kunne levere:
•Maskinlesbar id med en ordinær smart phone (eller PDA).•Ny og effektiv arbeidsflyt for samlingsarbeide.•Implementering av stabile id nøkler velegnet for databaser.
38
• Peer review løsning for biodiversitetsdata.• Vitenskapelig anerkjennelse for publisering
av data.• Mekanisme for bedre datakvalitet.• Mekanisme for sitering av data.• Metadata format: Ecological Metadata
Language (EML), Dublin Core, Darwin Core, Natural Collections Descriptions (NCD)…
• Nye muligheter Hvert datasett publisert til GBIF med eget data manuskript…?
39
FNs “Millennium Ecosystem Assessment” (2005) viste at menneskelige handlinger ofte leder til irreversible tap innen det biologiske mangfoldet, og at disse tap har vært større i de siste 50 årene enn noen gang før i menneskehetens historie.
Biologisk mangfold er nøkkelen til en bærekraftig fremtid – og evnen av naturlige og sosiale systemer for å tilpasse seg endringer, er avgjørende for nesten alle aspekter av menneskets velvære.
Fordi menneskeskapte trusler mot biologisk mangfold oppstår over brede romlige og tidsmessige skalaer, biologisk mangfold og økosystem overvåkning, varsling, og risikovurderinger krever data som er organisert i en globalt og lett-tilgjengelig, integrert infrastruktur.
GBIF’s Data Portal leverer denne infrastruktur.
41
Takk for oppmerksomheten!
GBIF Norge
Christian [email protected]
Innlegg ved MUSIT seminar på Gardermoen, 6 februar 2013