skos w p guŁce
TRANSCRIPT
PLAN WYSTĄPIENIA
• Wprowadzenie• Semantic Web w 5 minut,• Linked Data.
• Czym jest SKOS?• Dlaczego SKOS?• SKOS w praktyce.• Krytyka SKOS.• Wnioski.
SEMANTIC WEB W 5 MINUT
Tim Berners-Lee (2007)Sukces World Wide Web:
• nieograniczone możliwości łączenia informacji (np. hiperłącza),
• otwarte standardy,• rozdzielenie warstw sieci (komunikacja,
wizualizacja, przetwarzanie).
• dzisiejsza sieć to sieć dokumentów (statyczne, dynamiczne),
• dane w dokumentach zrozumiałe tylko dla ludzi,
• aplikacje sieciowe nie są w stanie przetworzyć danych.
SEMANTIC WEB W 5 MINUT
SEMANTIC WEB W 5 MINUT
• utrzymanie postulatu AAA (Anyone can say Anything about Any topic),
• rozpowszechnienie standardów opisywania treści,
• „zrozumienie” danych przez aplikacje,• możliwość powiązania danych.
SEMANTIC WEB W 5 MINUT
Podstawowe standardy/specyfikacje:
• RDF (Resource Description Framework) - specyfikacja modelu metadanych,
• RDF Schema (RDFS) - język reprezentacji wiedzy,
• OWL (Web Ontology Language) – język modelowania ontologii internetowych, rozszerzenie RDFS.
SEMANTIC WEB W 5 MINUT
Cel• standaryzowany i spójny model danych,• zmiana perspektywy - dane,• dane powiązane (Linked Data).
SEMANTIC WEB W 5 MINUT
• nie model danych, lecz filozofia, • metoda ekspresji, reprezentacji, łączenia
i współdzielenia danych,• Tim Berners-Lee: data hugging,• narzędzia:
– identyfikator URI,– protokół http,– RDF oraz RDFS/OWL.
LINKED DATA
Cztery zasady Linked Data:1. Używaj URI jako nazwy dla obiektów.2. Stosuj protokół http, po to by uzyskać
informacje o tych obiektach.3. Aktywacja poszczególnego URI ma
spowodować pozyskanie użytecznych informacji.
4. Wykorzystuj powiązania z innymi obiektami za pomocą URI, aby zapewnić możliwość eksploracji i odkrywania innych obiektów.
LINKED DATA
• FOAF (Friend Of A Friend),• format reprezentacji danych personalnych,• internetowa tożsamość, • wizytówka sieciowa,• rozszerzenie RDF.
LINKED DATA
FOAF
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:admin="http://webns.net/mvcb/">
</foaf:PersonalProfileDocument><foaf:Person rdf:ID="me"><foaf:name>Marcin Roszkowski</foaf:name><foaf:givenname>Marcin</foaf:givenname><foaf:family_name>Roszkowski</foaf:family_name><foaf:mbox_sha1sum>e59bff904001aa669cc84a983fcbf6e4b97e2299</foaf:mbox_sha1sum><foaf:homepage rdf:resource="http://biblioteka.unipt.pl"/><foaf:based_near rdf:resource="http://sws.geonames.org/3088972/" rdfs:label="Piotrków Trybunalski"/><foaf:depiction rdf:resource="http://4.bp.blogspot.com/_4XgyLS9g-Xg/roszkowski.jpg"/><foaf:workplaceHomepage rdf:resource="http://mroszkowski.blogspot.com"/><foaf:schoolHomepage rdf:resource="Uniwersytet Jana Kochanowskiego. Filia w Piotrkowie Trybunalskim"/></foaf:Person></rdf:RDF>
FOAF
FOAF + GEONAMES
LINKED DATA
Formaty danych / zbiory danych:• FOAF (Friend Of A Friend),• SIOC (Semantically-Interlinked Online Communities)
Project – format danych do opisu społeczności, jej członków, zainteresowań
• DOAP (Description of a Project) - format danych do opisu projektów open source, jego twórców, przebiegu, efektów,
• Kartoteki wzorcowe VIAF (The Virtual International Authority File),
• DBpedia – ustrukturyzowane dane pochodzące z Wikipedii.
• SKOS (Simple Knowledge Organisation System).
LINKED DATA
Czym jest SKOS?• format danych dla systemów
porządkowania pojęć (systemy organizacji wiedzy),
• formalny język reprezentacji struktury SOW,
• rozszerzenie RDF,• rekomendacja World Wide Web
Consortium - W3C (sierpień 2009 r.)
CZYM JEST SKOS?
Systemy organizacji wiedzy (SOW):• systemy porządkowania pojęć,• tradycyjne języki informacyjno-
-wyszukiwawcze,• sieciowe systemy organizacji wiedzy:
– taksonomie internetowe,– ontologie.
CZYM JEST SKOS?
OPIS W SKOS
• opis pojęcia z wykorzystaniem składni RDF,
• Trójki RDF (RDF triples) : – podmiot – predykat – obiekt,– pojęcie – predykat – wartość.
• Przywołanie pojęcia za pomocą indywidualnego URI w opisywanym zbiorze.
OPIS W SKOS
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750"> <skos:prefLabel>Economic cooperation</skos:prefLabel> </skos:Concept> </rdf:RDF>
Standaryzowany zbiór klas i własności, któresłużą do: • identyfikacji pojęcia: skos:Concept za
pomocą jego URI– http://bn.org.pl/jhp/concept/1750
(pojęcie językoznawstwa)• identyfikacji SOW: skos:ConceptScheme
– np. JHP BN
CECHY SKOS
• ustalenia nazw dla pojęcia i określenie ich statusu:
– skos:prefLabel (w różnych językach etnicznych) Językoznawstwo @pl,
– skos:prefLabel Linguistics @en,– skos:altLabel Lingwistyka,– skos:hiddenLabel Językonzawstwo,
CECHY SKOS
• dodatkowych informacji o znaczeniu pojęcia i jego zmianach:– skos:note,– skos:scopeNote,– skos:definition, – skos:editorialNote,
CECHY SKOS
• ustalenia relacji znaczeniowych pomiędzy pojęciami:– relacja nadrzędności zakresowej
skos:broader, – relacja podrzędności zakresowej
skos:narrower, – relacja skojarzeniowa
skos:related,
CECHY SKOS
JHP W SKOS
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://bn.org.pl/jhp/concept/1750"> <skos:prefLabel>Językoznawstwo</skos:prefLabel> <skos:altLabel>Lingwistyka</skos:altLabel> <skos:hiddenLabel>Językoznwastwo</skos:hiddenLabel><skos:broader rdf:resource="http://bn.org.pl/jhp/concept/4382"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/2108"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/9505"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/15053"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/18987"/> <skos:related rdf:resource="http://bn.org.pl/jhp/concept/3250"/> <skos:inScheme rdf:resource="http://bn.org.pl/jhp"/> </skos:Concept> </rdf:RDF>
JHP W SKOS
JHP W SKOS
Siła ekspresji SKOS pozwala również na uwzględnienie:
• sztucznego systemu notacyjnego, np. dla klasyfikacji: <skos:notation>81</skos:notation>,
• odwzorowanie fasetowej struktury pola semantycznego: <skos:collection>Procesy</skos:collection>
• odwzorowanie zależności pomiędzy pojęciami z różnych SOW (mapowanie), wykładniki typów zgodności zakresowej: skos:exactMatch, skos:closeMatch.
EKSPRESJA SKOS
ELASTYCZNOŚĆ SKOS
• UK Archival Thesaurus (UKAT),• The General Multilingual Environmental Thesaurus
(GEMET),• Australian Public Affairs Information Service (APAIS)
Thesaurus,• Tezaurus AGROVOC,• Library of Congress Subject Headings (LCSH)• Medical Subject Headings (MeSH),• GeoNames, kartoteka wzorcowa nazw geograficznych,• UNESCO Thesaurus,• ISO639 Codes for the representation of names of
languages.
SOW W SKOS
SOW W SKOS
DLACZEGO SKOS?
• wspólny model danych dla opisu SOW,• opis SOW musi być zrozumiały dla
aplikacji,• SOW muszą być współdzielone,• SOW jako platforma wspólnego
odniesienia.
JAK TO DZIAŁA?
BAZA1 BAZA2
JIW SOW1 SOW2
OPAC
Rezultatywyszukiwania
Rezultatywyszukiwania
Rezultatywyszukiwania
API
JAK TO DZIAŁA?
http://www.flickr.com/photos/dullhunk/639163558/sizes/l/
JAK TO DZIAŁA?
• format danych vs. mechanizmy ich przetwarzania,
• wymiar technologiczny:– aplikacje eksplorujące i przetwarzające linked
data, języki zapytań (np. SPARQL),– mechanizmy wizualizacji RAW DATA,
KRYTYKA SKOS
• wymiar technologiczny:– narzędzia opisu SOW w SKOS (np. Protege,
Tematres)• problemy:
– reprezentacja niesamodzielnych jednostek leksykalnych (symbole pomocnicze, określniki),
– reprezentacja zdań JIW.
KRYTYKA SKOS
• formalizacja umożliwia automatyczne przetwarzanie,
• bariery: odległość, język, granice dyscyplinarne,
• SKOS < Linked Data,• projekt nadal rozwijany,• ocena bibliotekarzy?
PODSUMOWANIE
• SKOS = format danych dla SOW,• potrzeba współdzielonych zbiorów danych,• co z „naszymi” formatami?
PODSUMOWANIE
PODSUMOWANIE