9a. il web semantico
DESCRIPTION
Sapienza Università di Roma Anno Accademico 2012 – 2013 Informatica per gli Archivi e le Biblioteche Prof.ssa Linda Giuva Prof. Maurizio Caminito Lezione 9aTRANSCRIPT
WEB SEMANTICO: Ontologie e RDF
Sapienza Università di RomaAnno Accademico 2012 – 2013
Informatica per gli Archivi e le BibliotecheProf.ssa Linda Giuva
Prof. Maurizio CaminitoLEZIONE 9a
1
2
Il Web Semantico ha una architettura a livelli
Il Web Semantico è un sistema controllato di organizzazione di dati.Adotta una serie di standard:
Al livello superiore si pone il livello ontologico. Una ontologia descrive le relazioni tra i tipi di elementi
• lo standard URI (Uniform Resource Identifiers), per la definizione univoca di indirizzi Internet
• l’RDF (Resource Description Framework) e RDF Schema, che costituiscono il linguaggio per descrivere le risorse e i loro tipi (derivano da XML).
3
La piramide del WEB SEMANTICO
L’architettura del Web Semantico si compone di vari livelli:
• i dati• i metadati • i concetti che esprimono le relazioni fra i dati• un linguaggio che descriva la struttura dei dati
4
L’architettura del WEB SEMANTICO
E’ importante lo schema utilizzato per archiviare le informazioni.
Lo schema RDF è un insieme di regole sull'organizzazione dei dati. Definisce relazioni fra i dati.
I metadati devono mappare i dati rispetto a classi, o concetti, di questo schema.
In questo modo si hanno strutture in grado di descrivere e automatizzare i collegamenti esistenti fra i dati.
Il Web Semantico è, come l'XML, un ambiente dichiarativo, in cui si specifica il significato dei dati.
La semantica dei dati consiste nel dare alla macchina delle informazioni utili in modo che essa possa utilizzare i dati nel modo corretto.
5
Gli standard del WEB SEMANTICO
Il consorzio W3C ha prodotto una serie di standard
per descriver e organizzare i metadati semantici:
l’RDF e l’OWL.
6
Il Web Semantico e i livelli di controllo
Prevede dei livelli di controllo e validazione interna:
• Adotta la firma digitale • Prevede un livello di “proof”• Porta ad un risultato univoco e credibile (livello
“trust”)
7
WEB SEMANTICOIl Web Semantico ha una architettura a livelli
3
URI: il primo mattone
L’architettura del Web Semantico si basa su una pila di tecnologie, primo concetto delle quali è il fatto che in rete è possibile assegnare un riferimento univoco – URI - a qualsiasi cosa.
Anche una persona può essere rappresentata tramite l’indirizzo della sua pagina web o quello della sua casella di posta elettronica (o un quadro può essere rappresentato da una foto o dalla documentazione pubblicata sul sito del museo che lo conserva).
8
9
MEMO: cos’è l’URI
URI è acronimo di Uniform Resource Identifier: un indirizzo che, in forma compatta, consente di
identificare una qualsiasi risposta come una pagina web, un documento, un'immagine, un indirizzo e-mail e così via. Gli URI sono definiti utilizzando una
specifica sintassi, facente riferimento all'uso di differenti protocolli. URL (Uniform Resource
Locator) e URN (Uniform Resource Name) possono essere considerati sottoinsiemi di URI.
10
L’ONTOLOGIA
• ONTOLOGIA in filosofia:si riferisce alla struttura, all’essenza e alle proprietà dell’ESSERE (ontos + logos), di ciò che esiste.
• ONTOLOGIA in informatica:una descrizione formale di un insieme di concetti e delle relazioni che intercorrono tra essi.
11
Ontologia: alcune definizioni 1
Un’ONTOLOGIA è una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi ed i vincoli specifici del dominio.
12
Ontologia: alcune definizioni 2
“L’ontologia e’ come un vocabolario (tassonomia) di
concetti, che rappresenta un determinato dominio di
interesse, dotato di un insieme di relazioni tra i concetti
stessi che consentono di capire come sono legati fra
loro” [Josephson&other, 99]
«Un’ontologia e’ una collezione di frasi che definiscono
le relazioni tra concetti e specificano le regole logiche» [Tim Berners-Lee, 99]
13
WEB SEMANTICO: un esempio di applicazione di ontologie
Si può fare una ricerca del tipo: quali sono… le aziende (soggetto)
che hanno come servizio (predicato) la fornitura di scarpe (oggetto)?
N.B. Questa query è diversa da quella che si potrebbe fare ad un motore di ricerca, a cui si propongono le tre parole: azienda, servizio e scarpe, ma senza mai esprimere il legame fra di essi. Da qui derivano appunto le imprecisioni dei motori di ricerca.
14
WEB SEMANTICO: le Ontologie
ONTOLOGIE(descritte con l’OWL Web Ontology Language)
sono collezioni di informazioni.
I più comuni tipi di ontologia per il Web:
• tassonomia (definisce classi e sottoclassi di oggetti) • regole di inferenza (definisce relazioni tra di entità)
15
ONTOLOGIE: Proprieta’ e attributi
Es.: FAMIGLIA Rappresentare le relazioni esistenti tra le classi del dominio (es. “le MADRI sono GENITORI”, “i GENITORI hanno figli che sono PERSONE”…)
FEMMINA
MADRE
DONNA
PERSONA
GENITORE
PADRE
ha_figli
(1,n)
is_a
16
Elementi delle ontologie
Il contenuto di un’ontologia è rappresentato da:
Un insieme di classi (concetti – astrazioni del mondo reale).
Un insieme di relazioni (tra 2 classi); un esempio è la relazione IS_A
Un insieme di assiomiUn insieme di individui
17
Ontologie: metodologia per la loro “costruzione”
Steps [1]
Determinare il dominio e lo scopo dell’ontologia Elencare i termini principali dell’ontologia Definire le classi e la gerarchia tra le classi Definire le proprietà delle classi Definire vincoli sulle proprietà Creare le istanze
[1]Noy, McGuinness, “Ontology Development 101: A Guide to Creating Your First Ontology ”,2001
18
Creare una ontologia
Es.: creare una ontologia del mondo universitario.
Supporre che l’ontologia verrà utilizzata da una segreteria didattica, per tener traccia dei corsi, dei professori che insegnano i corsi e degli studenti che li seguono. Devono essere quindi rappresentate le entità più importanti del mondo (personale docente, professori, professori ordinari, professori associati, ricercatori, studenti, corsi, …) e le relazioni che intercorrono tra di essi
19
Il WEB SEMANTICO e l’ONTOLOGIA “Star Wars”
20
WEB SEMANTICO Linguaggi di gestione delle ontologie
Principali linguaggi formali per la definizione di ontologie, per supportare il ragionamento su di esse ed interrogarle:
OWL (Web Ontology Language) è un linguaggio di markup per rappresentare esplicitamente ontologie (semantica formale di termini e relazioni tra i termini).
RDF produce specifiche di contenuto grazie alle triple (soggetto-predicato-oggetto)
21
OWL: Web Ontology Language
Il Web Ontology Language (OWL) è un linguaggio di markup
per rappresentare esplicitamente le ontologie (ovvero il significato dei termini e relazioni tra i termini).
L'obiettivo è supportare l’elaborazione automatica del contenuto delle informazioni dei documenti scritti in OWL
OWL è un linguaggio di rappresentazione della conoscenza
22
Principali caratteristiche di OWL
ClassisubClassOf, intersectionOf, unionOf, complementOf,enumeration, equivalence, disjointProprietàsymmetric, transitive, functional, inverse Functionalrange, domain, subPropertyOf, inverseOf,equivalentPropertyAffermazioni sulle istanzesameIndividualAs, differentFrom, AllDifferent
23
WEB SEMANTICO: la struttura dei dati
lo standard
Resource Description Framework (RDF)
è una struttura organizzativa dei dati
che standardizza la definizione
di relazioni tra informazioni
24
WEB SEMANTICO: cos’è l’RDF
RDF ovvero Resource Description Framework
RDF (Resource Description Framework) è uno standard proposto dal W3C come set di linguaggi dichiarativi basato su sintassi XML ed adatto a descrivere la struttura di una parte della realtà. Per realtà intendiamo qualsiasi risorsa sia possibile identificare sulla rete con un indirizzo univoco, mentre per descrizione indichiamo l'insieme delle proprietà, degli attributi e delle relazioni con altre realtà.
RDF è lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati, e consente l'interoperabilità tra applicazioni che si scambiano sul Web informazioni machine-understandable.
RDF
Resource Description FrameworkUno schema per definire l’informazione.
RDF fornisce la tecnologia per esprimere il significato di termini e concetti in una forma che i computer possono elaborare. RDF utilizza il linguaggio XML per la sua sintassi e gli URI per le specifiche entità, concetti, proprietà e relazioni.
25
26
Le “triple” RDF
L’RDF è un linguaggio che rappresenta delle relazioni. La rappresentazione più semplice di una relazione è data dalla “tripla” soggetto/predicato/oggetto. Ciò che rende speciale le triple RDF è che ogni loro elemento è associato a un URI.
27
WEB SEMANTICO. Il modello RDFRDF (Resource Description Framework) e RDF Schema costituiscono il modello più utile per descrivere le risorse e i loro tipi nel web semantico.
Un RDF-based data model è più idoneo ad esprimere certi tipi di rappresentazione della conoscenza di quanto non lo
siano il modello relazionale ed altri modelli ontologici.
I tre principi dell’RDF
Il Resource Description Framework (RDF) è un framework per la descrizione della conoscenza sul web. Esso è stato specificatamente creato per la descrizione dei metadati relativi alle risorse. RDF è sostanzialmente un modello formale di dati dotato di sintassi di interscambio, un sistema di schemi di tipo ed un linguaggio d’interrogazione
L’RDF si basa su tre principi chiave:• Qualunque cosa può essere identificata da un URI (Universal Resource Identifier)
• The least power: utilizzare il linguaggio meno espressivo per definire qualunque cosa
• Qualunque cosa può dire qualunque cosa su qualunque cosa28