länkade data – intro på ldsv 2013

43
Länkade data Länkad data i Sverige, 16 april, 2013 Marie Gustafsson Friberger, Malmö högskola [email protected] twitter: mariegus

Upload: marie-gustafsson-friberger

Post on 22-Apr-2015

325 views

Category:

Documents


0 download

DESCRIPTION

En översiktlig introduktion till länkade data. Länkade data i Sverige 2013: http://ldsv2013.eventbrite.com

TRANSCRIPT

Page 1: Länkade data – intro på LDSV 2013

Länkade dataLänkad data i Sverige, 16 april, 2013

Marie Gustafsson Friberger, Malmö högskola [email protected]

twitter: mariegus

Page 2: Länkade data – intro på LDSV 2013

Översikt

• Länkade data och den semantiska webben

• En kort introduktion till SW-relaterad W3C rekommendationer

• Några exempel

• Vill du tillgängliggöra data och/eller vokabulär?

• Vill du hitta data?

• Vill du bygga?

2

Page 3: Länkade data – intro på LDSV 2013

Hans Rosling

http://www.flickr.com/photos/23176450@N08/2663925153/

Page 4: Länkade data – intro på LDSV 2013

Hans Rosling

http://www.flickr.com/photos/23176450@N08/2663925153/

"The database hugging in public institutions is hampering innovation."

Hans Rosling at OECD World Forum in Istanbul, 2007http://www.viddler.com/explore/JesseRobbins/videos/4/

Page 5: Länkade data – intro på LDSV 2013
Page 6: Länkade data – intro på LDSV 2013

6

Page 7: Länkade data – intro på LDSV 2013

• Hur tillhandahålla data så att den går att återanvända?

• Hur möjliggöra upptäckandet av relevanta data bland alla dataset som finns tillgängliga?

• Hur möjliggöra att applikationer kan integrera data från tidigare okända datakällor?

7

Page 8: Länkade data – intro på LDSV 2013

★ Tillgänglig på webben (oavsett format),

med en öppen licens

★★ Tillgänglig som maskinläsbar strukturerad

data (t ex Excel i stället för scannad tabell)

★★★ som (2) samt ickeproprietärt format

(t ex CSV i stället för Excel)

★★★★ Alla ovan, plus att använda W3C-standarder (RDF

och SPARQL) för beskriva saker

★★★★★ Alla ovan plus att länka din data till andras data

Page 9: Länkade data – intro på LDSV 2013

Principer för länkade data1. Använd URI:er för att namnge saker

2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information

3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL)

4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas

http://www.w3.org/DesignIssues/LinkedData.html

Page 10: Länkade data – intro på LDSV 2013

10

Page 11: Länkade data – intro på LDSV 2013

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Page 12: Länkade data – intro på LDSV 2013

Semantiska webben

• Data-webb (snarare än dokument-webb).

• Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den.

• Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor.

12

Page 13: Länkade data – intro på LDSV 2013

define the concepts and relationships used to describe and represent an area of concern

13

Main SW components

RDF Linked Data

OWL

SKOSVocabularies

Ontologies

common formats for integration and combination of data drawn from diverse sources

SPARQL

Page 14: Länkade data – intro på LDSV 2013

En kort introduktion till W3C-rekommendationer

relaterade till den semantiska webben

Page 15: Länkade data – intro på LDSV 2013

Resource Description Framework

Page 16: Länkade data – intro på LDSV 2013

“Description”?

Subject - Predicate - Object

Page 17: Länkade data – intro på LDSV 2013

Subject - Predicate - Object

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 18: Länkade data – intro på LDSV 2013

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 19: Länkade data – intro på LDSV 2013

Flera källor

+

+Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 20: Länkade data – intro på LDSV 2013

En graf...

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 21: Länkade data – intro på LDSV 2013

Vad är vad?

• Om två källor använder samma benämningar, avser de då samma ”sak”?

• URI:er to the rescue!

• Två noder avser samma sak om de använder samma URI.

Page 22: Länkade data – intro på LDSV 2013

SPARQL

• SPARQL Protocol and RDF Query Language

• En fråga består av en uppsättning trippel-mönster (tripple patterns).

• Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.

Page 23: Länkade data – intro på LDSV 2013

Ontologier – OWL

• Kallas ofta vokabulärer i samband med länkade data

• Används för att beskriva begrepp och relationer mellan begrepp i någon domän

• Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data

23

Page 24: Länkade data – intro på LDSV 2013

Simple Knowledge Organization System (SKOS)

• RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier.

24

ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals.

ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology.

Page 25: Länkade data – intro på LDSV 2013

25

Exempel

DBpediaNYTimes

Page 26: Länkade data – intro på LDSV 2013

• Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben.

• Beskriver över 3,77 miljoner saker, varav 2,35 miljoner är klassificerade i en konsistent ontologi som innehåller 764.000 personer, 573.000 platser, 112.000 musikalbum, 72.000 filmer, 18.000 videospel, 192.000 organisationer, 202.000 arter och 5.500 sjukdomar.

Page 27: Länkade data – intro på LDSV 2013

Möjliga frågor

• DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipedia-artiklar.

• Till exempel...

Page 28: Länkade data – intro på LDSV 2013

28

Personer födda i Köpenhamn innan år 1900.

Page 29: Länkade data – intro på LDSV 2013

29

Page 30: Länkade data – intro på LDSV 2013

30

Page 31: Länkade data – intro på LDSV 2013

NYTimes – Linked Open Data

http://data.nytimes.com/

Page 32: Länkade data – intro på LDSV 2013

32

Page 33: Länkade data – intro på LDSV 2013

Example app: Who Went Where?

Page 34: Länkade data – intro på LDSV 2013

Vill du göra data och/eller vokabulär

tillgängliga?

Page 35: Länkade data – intro på LDSV 2013

Välja vokabulär

• Hur många använder? Vilka?

• Underhåll och styrning

• Vilka koncept täcker den?

• Hur uttrycksfull är den?

35

Baserat på http://linkeddatabook.com/

Page 36: Länkade data – intro på LDSV 2013

Verktyg för att utveckla vokabulär

• Protégé

• TopBraid Composer

36

Specifikt för SKOS:

• PoolParty Thesaurus Manager

• VocBench (developed by the FAO of the UN)

Page 37: Länkade data – intro på LDSV 2013

Recept för att publicera länkade data

• Statiska RDF/XML-filer

• Som RDF inbäddad i HTML (RDFa)

• Genom egna server-side scripts

• Från relationsdatabaser

• Från RDF Triple Stores

• Genom att ”wrappa” existerande API:er

37 http://linkeddatabook.com/

Page 38: Länkade data – intro på LDSV 2013

Vill du hitta data?

Page 39: Länkade data – intro på LDSV 2013

39

Page 40: Länkade data – intro på LDSV 2013

40

Page 41: Länkade data – intro på LDSV 2013

Vill du bygga?

Page 42: Länkade data – intro på LDSV 2013

42

Page 43: Länkade data – intro på LDSV 2013

Läs mer!

• Heath and Bizer (2011) Linked Data: Evolving the Web into a Global Data Spacehttp://linkeddatabook.com/editions/1.0/

• Allemang and Hendler (2011) Semantic Web for the Working Ontologisthttp://workingontologist.org/

• http://www.w3.org/2001/sw/wiki/Tools