semantic web

30
Semantic Web Resource Description Framework

Upload: moses

Post on 12-Jan-2016

27 views

Category:

Documents


0 download

DESCRIPTION

Semantic Web. Resource Description Framework. Zakaj splet ni zadosti. Omrežna dostopnost informacij v poznih 80-ih: Internet je načeloma omogočal dostop do informacij na oddaljenih računalnikih, vendar je bilo to lahko zelo zapleteno. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Semantic Web

Semantic Web

Resource Description Framework

Page 2: Semantic Web

Zakaj splet ni zadosti

Omrežna dostopnost informacij v poznih 80-ih:

Internet je načeloma omogočal dostop do informacij na oddaljenih računalnikih, vendar je bilo to lahko zelo zapleteno.

Dostop do informacij je lahko pomenil prehod preko različnih omrežij in uporabo različnih ukazov za rabo zbirk.

Ko je bila informacija najdena, jo je bilo težko dobiti na svoj računalnik,

največkrat je šlo le s prepisovanjem z zaslona,

v najboljšem primeru si jo lahko naročil na svoj e-poštni naslov.

Zbrane so bile največkrat le najlaže dostopne informacije in ne najboljše.

Page 3: Semantic Web

Zakaj splet ni zadosti

Splet je spremenil vse: Omogoča enostavno, od oddaljenosti, konkretne

hrbtenice in računalniškega sistema neodvisno odkrivanje in pridobivanje informacij.

Kopiranje informacij ni potrebno, isto dosežemo s postavljanjem kazalcev na informacije.

Splet je postal enoten, medsebojno povezan prostor dokumentov.

Page 4: Semantic Web

Zakaj splet ni zadosti

Splet omogoča človeškemu uporabniku izkoriščanje hipertekstnih povezav za povezovanje dokumentov in podatkov in, posledično, tvorbo novega znanja.

Pretok informacij od informacijskih aplikacij k uporabnikom je postal izjemno enostaven.

Zelo zapleten in neučinkovit pa je ostal pretok informacij med aplikacijami.

Splet ne omogoča avtomatskega povezovanja podatkov in avtomatske tvorbe novega znanja.

Page 5: Semantic Web

Zakaj splet ni zadosti

Običajni spletni hipertekstni kazalci omogočajo le enostavno statično povezovanje dokumentov, namenjenih človeškim očem, na način, ki ga je predvidel avtor dokumenta.

Večina podatkov, trenutno dostopnih na spletu (skritih v dokumentih in v podatkovnih zbirkah), je uporabnih samo na način, za katerega so bili objavljeni.

Ne obstaja splošen sistem spletnega objavljanja, ki bi omogočal poljubno rabo podatkov.

Page 6: Semantic Web

Zakaj splet ni zadosti

Splet je predvsem mreža dokumentov, Semantic Web bo predvsem mreža podatkov.

Semantic Web bo razširitev spleta, v kateri bodo podatki dobili jasno določen pomen.

Page 7: Semantic Web

Semantic Web (SW)

SW je zamišljen kot globalna mreža podatkov, nameščenih in povezanih na način, ki omogoča enostavno strojno procesiranje, učinkovitejše odkrivanje, avtomatsko tvorbo informacij, njihovo

“razumevanje” in sklepanje, integracijo podatkov in različne načine rabe

z različnimi aplikacijami. Tak splet si lahko predstavljamo kot globalno,

decentralizirano inteligetno podatkovno zbirko.

Page 8: Semantic Web

Semantic Web (SW)

Namen SW je opisati podatke tako, da bodo globalno razumljivi za poljubne aplikacije in za ljudi.

Če je informacija namenjena strojni rabi, ni nujno, da je nerazumljiva človeku, in obratno.

Slovnico za opisovanje podatkov, razvito v ta namen, ureja Resource Description Framework (RDF).

Page 9: Semantic Web

Semantic Web (SW)

Ko je podatek opisan z RDF, so avtomatski postopki z njim mogoči.

RDF je generični format, ki ne predvideva vnaprej nobenega načina rabe.

Da je podatek mogoče opisati z RDF, mora biti identificiran – imeti mora svoj URI.

RDF temelji na XML. XML predstavlja standardizirano sintakso, s katero je mogoče zapisati podatke.

RDF in z njim povezani jeziki podatkom podelijo pomen, iz podatkov sestavijo dejstva in dejstva sestavijo v znanje.

Page 10: Semantic Web

Abstraktno o RDF

RDF je poudarjeno splošen (generičen) format, kar pomeni, da je uporaben za abstrakten način opisovanja česarkoli.

Z RDF sestavljamo izjave o virih. Vir je karkoli, kar ima URI. Najbolj znan URI je URL (vendar to načeloma

ne pomeni, da mora biti vsak vir, opisan z RDF, dostopen na spletu).

RDF je standarden način izjavljanja o URI, zapisan v XML.

Page 11: Semantic Web

Semantic Web (SW)

SW je utemeljil Tim Berners-Lee, avtor spleta. Razvoj poteka pod okriljem W3C. Pri razvoju sodeluje veliko število raziskovalcev

in partnerjev iz informacijske industrije.

Page 12: Semantic Web

Možen scenarij rabe SW Naletiš na omrežju na najavo zanimivega kongresa.

Sprožiš postopek prijave (vsi podatki so, jasno, opisani z RDF): tvoj osebni programski organizator* preveri

razpoložljivost v osebnem koledarju, če je ok, s strani z najavo kongresa izlušči naslov

za prijavo, sproži prijavo, vnese datume v osebni koledar, po potrebi sproži dialog, da si razjasni vir denarja

za kotizacijo, v sodelovanju z osebnim finančnim agentom*

nakaže denar,

* program

Page 13: Semantic Web

Možen scenarij rabe SW

osebni programski organizator* redno spremlja novosti na kongresni spletni strani,

ko se pojavijo informacije o sekcijah in referatih (v sodelovanju z osebnim vsebinskim agentom*) sestavi predlog dnevnega reda obiskov referatov,

v sodelovanju s programskimi agenti* transportnih agencij sestavi predlog potovanja,

če ga potrdiš, izvede rezervacije ali plačila, in

* program

Page 14: Semantic Web

Možen scenarij rabe SW

na spletu poišče zgodovinske, kulturne, kulinarične... informacije o kraju kongresa in izdela povzetek.

Vse to je možno, če so podatki ali storitve aplikacij, ki so sicer (razen finančnih) vse že zdaj javno dostopne na spletu, opisane na standarden način, ki omogoča izmenjavo med aplikacijami.

Zaenkrat seveda nič od tega ne moremo narediti drugače kot ročno.

Page 15: Semantic Web

Kaj lahko trenutno storimo brez SW

Denimo, da želimo omogočiti izmenjavo podatkov med aplikacijama a in b.

a uporabi Extensible Markup Language (XML) za opis podatkov. Programer, ki piše programe za transformacijo podatkov med

formatoma aplikacij a in b, mora razumeti XML in ne njunih “zasebnih” formatov.

Aplikaciji sta tako povezani z orodji XML, predvsem transformacijskim jezikom XSLT. Tako se podatek iz aplikacije a avtomatsko preoblikuje v format b, če ga gledamo skozi aplikacijo b.

Vendar problem komunikacije ostaja: za vsak par aplikacij, celo za vsak način rabe podatkov v

paru je treba narediti transformacijski program.

Page 16: Semantic Web

Kaj lahko trenutno storimo brez SW

Problem avtomatskega prenosa podatkov med podatkovnimi zbirkami: Prenos podatkov ovirajo različne strukture

(podatkovne sheme) zbirk. XML Schema omogoča izdelavo standardne

podatkovne sheme za zbirke. Če bi srenja sprejela tako standardno shemo,

bi to omogočalo prenašanje podatkov. Nobena srenja ni sposobna brez izjem

sprejeti ene standardne sheme.

Page 17: Semantic Web

RDF

Potrebujemo torej mehanizem, ki bo omogočal prenašanje podatkov med različnimi podatkovnimi shemami.

Tak mehanizem mora opisovati značilnosti virov podatkov in podatkov v njih.

Spet: tak mehanizem je Resource Description Framework (RDF).

Page 18: Semantic Web

RDF

Podoben problem, kot s prenosljivostjo podatkov, je na spletu tudi s programi.

Spletni programski jeziki so zelo primerni za vključevanje programov v dokumente, nič pa to ne pripomore k sodelovanju spletnih programov.

Razvijajo se novi protokoli in jeziki (v skladu z RDF), ki bodo standardizirali opisovanje, kaj počnejo programi.

Page 19: Semantic Web

RDF

Potrebujemo torej jezike in protokole, s katerimi bomo lahko opisali inpute, outpute programov, kaj programi počnejo s podatki, same podatke in odnose (hierarhične in drugačne) med podatki.

Taka jezika sta tudi RDF-Schema in OWL (Web Ontology Language), jezik s katerim gradimo ontologije (npr. tezavre).

Tak protokol, zapisan z XML, je Simple Object Access Protocol (SOAP).

Page 20: Semantic Web

Načini izjavljanja v RDF

Izjave v RDF so v osnovi trojke subjekt, lastnost, objekt. Primer trojke:

Janez Novak avtor http://www.enstreznik.org/besedilo.htmlsubjekt lastnost objekt

Vrstni red elementov je lahko drugačen (npr. objekt lastnost subjekt)

Elementi trojk so izraženi z URI (Uniform Resource Identifiers). URI je identifikacija vira, ki opisuje subjekt, lastnost ali objekt. URI vira imenujemo “URIref” – referenca v obliki URI. Različne možne vrednosti subjektov, lastnosti ali objektov, na

katere kaže en URIref imenujemo slovar (vocabulary) teh vrednosti.

URIref, ki predstavlja posamezen slovar, imenujemo “imenski prostor”.

Page 21: Semantic Web

Načini izjavljanja v RDF Slovar referatov v letniku:

http://www.mf.uni-lj.si/~jure/referati08/referat1.htmlhttp://www.mf.uni-lj.si/~jure/referati08/referat2.htmlhttp://www.mf.uni-lj.si/~jure/referati08/referat3.html

imenski prostor = ref: Slovar študentov v letniku:

http://www.mf.uni-lj.si/~jure/studenti08/student1.htmlhttp://www.mf.uni-lj.si/~jure/studenti08/student2.htmlhttp://www.mf.uni-lj.si/~jure/studenti08/student3.html

imenski prostor = stud: Slovar elementov Dublin Core:

http://purl.org/dc/elements/1.1/

imenski prostor = dc: Izjave:

stud:student1.html dc:creator ref:referat1.html stud:student2.html dc:creator ref:referat2.html

Page 22: Semantic Web

Načini izjavljanja v RDF

Tudi RDF ima svoj slovar in imenski prostor rdf:.

Slovar RDF vsebuje izraze, namenjene delovanju RDF.

Gre večinoma za izraze, ki uvajajo neke splošne odnose.

Tak izraz je “about”, ki uvaja URIref subjekta.

Page 23: Semantic Web

RDF/XML

V resnični rabi se izjave RDF zapisujejo v XML:<?xml version=“1.0”?><rdf:RDF xmlns:rdf=“http://www.w3c.org/1999/02/22-rdf-syntax-ns#”

xmlns:stud=“http://www.mf.uni-lj.si/~jure/studenti08/” xmlns:dc=“http://purl.org/dc/elements/1.1/”>

<rdf:Description rdf:about=“http://www.mf.uni-lj.si/~jure/referati08/referat1.html”> <dc:creator stud:ime=“http://www.mf.uni-lj.si/~jure/studenti08/student1.html”/> <dc:date>2008/03/15</dc:date></rdf:Description></rdf:RDF>

uvajanje imenskih prostorov

student1 je 15. 3. 2008 izdelal referat1

Page 24: Semantic Web

Možen scenarij rabe SW

Želiš, da tvoj spletni robot najde identifikacije (URIje) vseh ljudi, ki predavajo na Odd. za gojenje zajcev Filozofske fakultete.

Robot ima na voljo informacije, opisane v trojki RDF, npr:<http://www.ff.uni-lj.si/predav/JakaKunc.html><http://www.ff.uni-lj.si/nac_sodel/predavanje.html> <http://www.ff.uni-lj.si/Odd_goj_zajcev.html>

Izjava lahko pomeni da nekdo, predstavljen z JakaKunc.html sodeluje z entiteto, predstavljeno v Odd_goj_zajcev.html na način, predstavljen v predavanje.html.

Page 25: Semantic Web

Možen scenarij rabe SW

Izjava v RDF, predstavljena z XML, bi izgledala približno takole:

<rdf:RDF xmlns:rdf= "http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:nacin= "http://www.ff.uni-lj.si/nac_sodel/"> <rdf:Description rdf:about="http://www.ff.uni-lj.si/predav/JakaKunc.html"> <nacin:predava rdf:place="http://www.ff.uni-lj.si/Odd_goj_zajcev.html"/> </rdf:Description>

</rdf:RDF>

Page 26: Semantic Web

Možen scenarij rabe SW

Novi jeziki za sestavljanje ontologij opisujejo medsebojne odnose podatkov.

Znanju o predavateljih bi v enem od takih jezikov lahko dodali

@prefix vloga: <http://www.ff.uni-lj.si/sodelavci/>@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>

# komentar: profesor in docent sta tipa predavatelja:vloga:profesor rdfs:subClassOf vloga:predavatelj vloga:docent rdfs:subClassOf vloga:predavatelj

profesor in docent sta izraza v ontologiji.

Page 27: Semantic Web

Možen scenarij rabe SW

Nekdo drug iz nekega drugega razloga v svojem imenskem prostoru (imprx) definira pojem ima_predavatelja:

@prefix imprx: <http://www.moj_streznik/oddelki/>

rdf:place=<http://www.ff.uni-lj.si/Odd_goj_zajcev.html>

imprx:ima_predavatelja

rdf:about=

<http://www.ff.uni-lj.si/predav/MihaKrt.html> ima_predavatelja je izraz v ontologiji.

Page 28: Semantic Web

Možen scenarij rabe SW

Da bi izkoristili take informacije dodatno definiramo

imprx:ima_predavatelja rdfs:inverse_of nacin:predava kar pomeni,

ima_predavatelja je nasprotno od predava in

v izjavah, ki uporabljajo imprx:ima_predavatelja lahko enostavno zamenjamo subjekt in objekt in dobimo nova dejstva, kakršna potrebujemo.

ima_predavatelja in predava sta izraza v ontologiji.

Page 29: Semantic Web

Možen scenarij rabe SW

Zdaj lahko iz različnih spletnih virov podatkov avtomatsko skonstruiramo znanje, ki pravi:

a) Jaka Kunc in Miha Krt predavata na Odd. za gojenje zajcev in

b) tam predavajo tudi vsi, ki so tam definirani kot profesorji ali docenti.

Na osnovi dejstev b) lahko verjetno iz kakšne druge zbirke, objavljene na spletu v zapisu RDF, pridobimo še dodatne informacije.

Page 30: Semantic Web

Primer opisa spletišča D-Lib z RDF in DC<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://www.dlib.org"> <dc:title>D-Lib Program - Research in Digital Libraries</dc:title> <dc:description>The D-Lib program supports the community of people with research interests in digital libraries and electronic publishing. </dc:description> <dc:publisher>Corporation For National Research Initiatives </dc:publisher> <dc:date>1995-01-07</dc:date> <dc:subject> <rdf:Bag> <rdf:li>Research; statistical methods</rdf:li> <rdf:li>Education, research, related topics</rdf:li> <rdf:li>Library use Studies</rdf:li> </rdf:Bag> </dc:subject> <dc:type>World Wide Web Home Page</dc:type> <dc:format>text/html</dc:format> <dc:language>en</dc:language> </rdf:Description></rdf:RDF>