wade 2014—2015 (12/12): semantic web—inginerie ontologică: alinierea ontologiilor. domenii de...
TRANSCRIPT
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Dezvoltarea aplicațiilor Web
Ⰿinginerie ontologică (II)
alinierea ontologiilor, utilizări pragmatice
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
“Este dificil să vezi un tablouatunci când ești în interiorul ramei.”
/usr/games/fortune
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Cum integrăm diferite ontologiidescriind aceleași cunoștințe,
dar prezentând definiții,puncte de vedere și noțiuni diferite?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
realitate
existența unor ontologii diverse,modelând puncte de vedere diferite
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
preliminarii
Expresivitatea limbajului ontologii folositversus
complexitatea inferențelor ce pot fi efectuate
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
preliminarii
Aspecte de interes(Calvanese, Giacomo & Rodriguez-Muro, 2008):
utilizarea construcțiilor ontologice oferite de OWLefectuarea de inferențe
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
preliminarii
Aspecte de interes(Calvanese, Giacomo & Rodriguez-Muro, 2008):
recurgerea la volum mare de date (indivizi)(re)utilizare a unor baze de date
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
preliminarii
Aspecte de interes(Calvanese, Giacomo & Rodriguez-Muro, 2008):
flexibilitate privind realizarea interogărilorlimbaje de interogare – specifice (SPARQL)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
preliminarii
Aspecte de interes(Calvanese, Giacomo & Rodriguez-Muro, 2008):
realizarea de asocieri între date,păstrând sursele originare
asocieri (mappings) – e.g., baze de date↔triplestores
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
preliminarii
Context: integrarea datelor – data integration
data integration is the problem of providing unifiedand transparent access to a set of autonomous and
heterogeneous sources
Bernstein & Haas, Communications of the ACM, 2008
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
necesități
Crearea corespondențelor dintre ontologii
O1 O2
Om
O1 O2
mappingmerging
articulation
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Context:
integrarea datelor
scheme de baze de date (relaționale)
specificații provenite din inteligența artificială
Web (semantic) – RDF, JSON(-LD), OWL,…
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Motive ale existenței nepotrivirilor – mismatchesconform (Noy, 2005)
reprezentarea subiectivă a unui domeniu (lume, web)
exemplu:carte pentru copii despre animale vs. compendiu zoologic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Motive ale existenței nepotrivirilor – mismatchesconform (Noy, 2005)
existența diferitelor cerințe și workflow-uriprivitoare la (tipuri de) aplicații software
exemplificări:e-business vs. e-learning vs. e-entertainment,
interacțiune convențională (desktop) vs. mediu mobil/TV
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Motive ale existenței nepotrivirilor – mismatchesconform (Noy, 2005)
folosirea altor convenții de reprezentare a cunoștințelor
a se (re)vedea și cursul anterior
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tipuri de nepotrivirila nivel…
de limbaj
ontologic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Nepotriviri la nivel de limbaj
diferențe de sintaxă, expresivitate sau semanticăa limbajelor ontologice actuale
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Nepotriviri la nivel ontologic
diferențe vizând structura semantică
exemple: termeni diferiți definind același concept,același termen descriind mai multe concepte, convenții/paradigme de modelare eterogene,
puncte de vedere diferite etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
scop:modelare de cunoștințe din domeniul academic
periodice, publicații compuse vs. absolvenți, invitați
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
nume diferite pentru același concept:
PhD-Student versus PhDStudent
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
specificare diferită a conceptelor:
Publication – restricții privitoare la citări, referințe biblio.versus
Publication – restricții referitoare la rezumat
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
convenții de modelare diferite:
Journal (clasă) vs. journal (proprietate)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
granularitate:
Professor-In-Academia vs. adjunct, affiliated, associate,…
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
convenții de modelare și nivel de detaliere:
proprietatea address compusădin alte fragmente de informație
versusproprietatea address de tip șir de caractere (nestructurat)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Problemă: date la intrare ontologii – exprimate prin entități
discrete (tabele, XML, JSON, clase, proprietăți,…) –, trebuie determinate relațiile (e.g., echivalență, subsumare,…) care au loc între aceste entități
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Problemă: ontology matching
www.ontologymatching.org
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Pavel Shvaiko & Jérôme Euzenat (2014)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Pavel Shvaiko & Jérôme Euzenat (2014)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Reducerea eterogenitățiipoate fi realizată în 2 pași
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
1. potrivire (match) – determinarea alinierii
la momentul proiectării sau (re)utilizării ontologiei
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
2. procesarea alinierii
procese: fuzionare (merging), transformare etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Corespondența între O1 și O2
⟨ id, e1, e2, r ⟩
id = identificator unic al corespondenței
ei entitate din ontologia Oi (e.g., clasă,…), i=1,2
r = relație între e1 și e2
echivalență (=), disjuncție (⊥) etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Alinierea (alignment) A între O1 și O2 esteo mulțime de corespondențe peste O1 și O2
prezintă o anumită cardinalitate: 1 la 1, 1 la N etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Alinierea (alignment) A între O1 și O2 esteo mulțime de corespondențe peste O1 și O2
prezintă o anumită cardinalitate: 1 la 1, 1 la N etc.
pot fi atașate meta-date adiționale:metoda de aliniere, data alinierii, proprietăți specifice,…
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Alinierile pot fi descrise semanticpe baza logicilor descrierii (Zimmermann, 2006)
conform François Scharffe (2008)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Alinierea (alignment)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor: utilizare
conform (Jérôme Euzenat & Pavel Shvaiko, 2007, 2013)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor: utilizare
aspect de interes: facilitarea interconectării datelor RDFlinked data interlinking
(Jérôme Euzenat & Pavel Shvaiko, 2014)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor: utilizare
aspect de interes: compunerea serviciilor WebWeb service composition
(Jérôme Euzenat & Pavel Shvaiko, 2014)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor: utilizare
Patrimoniul cultural (cultural heritage)
alinieri realizate în faza de proiectare a aplicațiilor de integrare a capodoperelor descrise via lexicoane
precum Iconclass și Aria
alinierile rezultate pot fi folosite și pentru a facilita căutările multicriteriale (faceted search)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor: utilizare
Geografie computațională (geo-information)
exemplu: planificarea urbană
bazată pe terminologii din arii diverse (hidrologie, topografie) utilizate pentru a oferi
rezultate de interes conform cererilor utilizatorului
alinierile sunt (re)folosite la expandarea interogărilor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Alinierea – ciclul de viață
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilorAlinierea
etape
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
clasificarea tehnicilor de potrivire(Euzenat & Shvaiko, 2014)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel de termenipe baza șirurilor de caractere
prefixul: net = network, pin = pinguin (?)
sufixul: ID = PID, nail = snail (?)
distanța editării (numărul de operații de inserare,ștergere, substituție a caracterelor pentru transformarea
unui termen în altul): EditDistance (NKN, Nikon) = 4
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel de termenibazate pe limbaj
procesarea entităților (tokenization)Hands-Free Kits → ⟨ hands, free, kits ⟩
analiza morfologică pentru găsireatuturor formelor de bază (lemmalization): Kits → Kit
utilizarea N-gram-elor
eliminarea cuvintelor nerelevante: “a”, “the”, “by” etc.
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel de termenipe baza sensurilor – cazul WordNet
hiponimie, meronimie: Brand ⊑ Name
hipernimie, holonimie: Software ⊒ WebFramework
sinonimie: Quantity = Amount
antonimie sau relații de siblings: Microprocessors ⊥ PC Board
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel de termenipe baza glossei – se folosește WordNet
numărul acelorași cuvinte prezenteîn ambele glosse (texte) de intrare
conduce la creșterea valorii de similaritate a termenilor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel de termenipe baza glossei – se folosește WordNet
exemplu: Maltese dog is a breed of toy dogs having
a long straight silky white coat
Afghan hound is a tall graceful breed of hound with a long silky coat
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel de termenipe baza glossei – se folosește WordNet
pot fi adoptate API-uri/biblioteci/servicii specializate precum AlchemiAPI, Diffbot, Stemmer, Textalytics și altele
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire multilingvămultilingual matching
potrivire pe baza etichetelor (e.g., via rdfs:label) – disponibile în mai multe limbi – asociate conceptelor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Extensional techniquesfolosind o mulțime de instanțe ce recurg la un concept,se aplică metode statistice și/sau de învățare automată
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel structuralpe baza taxonomiei (tree-based)
reguli privitoare la super/sub-concepte
e.g., dacă super-conceptele sunt similare,conceptele – copii ale acestora – sunt și ele similare
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel structuralpe baza taxonomiei
potriviri ale drumurilor mărginite în graful ontologiilor(bounded path matching)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Potrivire probabilistică
recurgerea la rețele Bayesiene ori Markov pentru a evidenția posibilii candidați la potrivire
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel structuralbazate pe modele
verificarea satisfiabilității (SAT) pe baza axiomelor:
Axioms → rel (context1, context2)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Tehnici de potrivire la nivel structuralbazate pe modele – utilizarea logicilor descrierii
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Procesele de potrivire pot avea loc secvențial
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Procesele de potrivire se pot desfășura în paralel
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
potrivirea ontologiilor
Remarcă: “Matching, however, requires explanations
because mappings between terms are not alwaysintuitively obvious to human users.”
Pavel Shvaiko, 2005
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Procesul general: metodologie pentru creareaasocierilor – mappings (M. Ehrig, 2006)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Date de intrare:două ontologii O1 și O2
eventual, pot fi puse la dispoziție asocieri cunoscute
(realizate manual, semi-automat ori automat)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Date de ieșire:o reprezentare a alinierilortabel indicând relația alignO1,O2
suplimentar, se pot oferi și valori de încredere
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 1: feature engineeringsunt selectate fragmente mici descriind entități
de interes – reprezentând anumite semantici
ulterior, aceste trăsături vor fi folositepentru compararea ontologiilor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 2: search step selectionse caută candidați pentru aliniere
se calculează similaritatea unor perechide concepte (c1, c2), cu c1 O1, c2 O2
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 2: search step selectionse caută candidați pentru aliniere
unele construcții pot fi ignorate
de exemplu,se poate compara o1:car cu o2:automobile,
dar nu cu o2:hasMotor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 2: search step selectionse caută candidați pentru aliniere
suplimentar, se pot adopta strategii (euristici) de reducere a spațiului comparațiilor pentru ontologii largi
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 3: similarity computationpentru descrierile date ale 2 entități din spațiulde candidați ai alinierii, se indică o similaritate
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 3: similarity computationpentru descrierile date ale 2 entități din spațiulde candidați ai alinierii, se indică o similaritate
măsura similarității poate fi dată de
una sau mai multe caracteristici (trăsături, features)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 3: similarity computation
exemplu:
simlabel(o1:car, o2:automobile) = simsynonym(“car”, “automobile”) = 1
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 4: similarity aggregationpentru 2 entități, pot exista mai multe similarități,
conform criteriilor considerate
e.g., privind etichetele conceptelor saurelațiile cu alte entități
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 4: similarity aggregationpentru 2 entități, pot exista mai multe similarități,
conform criteriilor considerate
aceste valori se agregăîntr-o unică valoare de similaritate
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 4: similarity aggregation
exemplu:
(simlabel(o1:car, o2:automobile) +
simsubconcepts(o1:car, o2:automobile) +
siminstances(o1:car, o2:automobile)) / 3 = 0.5
combinarea acestor valori se realizeazăprin mai multe strategii
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 5: interpretationvalorile de similaritate individuale și agregate
sunt utilizate pentru alinierea entităților
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 5: interpretationvalorile de similaritate individuale și agregate
sunt utilizate pentru alinierea entităților
aceste similarități vor fi interpretate(se aleg diverse criterii: prag limită, structură etc.)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 5: interpretation
la final, se oferă sau nu o schemă de alinierea entităților considerate
e.g., align(o1:car) =‘⊥’
nu s-a putut determina nici o aliniere convenabilă
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 6: iterationsimilaritatea e propagată în ontologii
pe baza relațiilor între entități
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 6: iterationsimilaritatea e propagată în ontologii
pe baza relațiilor între entități
la fiecare interație, va fi recalculată similaritateaunei alinieri candidate
pe baza similarității perechilor entităților vecine
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 6: iterationdupă realizarea unei interații,
pot rezulta alte similarități
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Pasul 6: iterationprocesul se termină când nu se propun noi alinieri
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Abordările avansate de aliniere utilizează:
potrivire contextuală (CBM – context-based matching)
potrivire bazată pe învățare (matching learning)
metode bazate pe reguli
tehnici de analiză structurală a grafurilor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Abordările avansate de aliniere utilizează:
tehnici de raționament – e.g., theorem proving
ajustare optimală (tuning)
îmbunătățirea alinierii: quality measures, debugging
algoritmi combinați, cu implicarea expertului uman(user-driven composition, collective matching)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
Există mai mulți algoritmi propuși
competiția anuală OAC – Ontology Alignment Contest(2004—2014)
http://oaei.ontologymatching.org/
detalii în P. Shvaiko, J. Euzenat, “Ontology Matching: State of the Art and Future Challenges”,
IEEE Transactions on Knowledge and Data Engineering (2013)http://disi.unitn.it/~p2p/RelatedWork/Matching/SurveyOMtkde_SE.pdf
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
alinierea ontologiilor
De asemenea, se pot folosi cunoștințe anterioare(background knowledge)
WordNetontologii de referință ale domeniului
ontologii de nivel superior – e.g., DOLCE, SUMO, UMBELresurse textuale on-line – i.e. Wikipedia (DBpedia)
vocabulare/ontologii disponibile on-line
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
pentru două entități provenind din vocabularele AGROVOC și NAL (National Agricultural Library) se deduce automat
că termenul Food este mai general decât Beef
sistemul de efectuare a potrivirilor (matcher) a recurs la cunoștințe anterioare (background knowledge) disponibile pe Web
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
procese de bază vizând alinierea (Lambrix & Tan, 2005)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări: S-Match
Utilizează scheme (e.g., specificații XML Schema, OWL,…)
calculează relații de similaritate: echivalență (=), mai general (⊒), mai puțin general (⊑), disjuncție (⊥)
transformă fiecare ontologie într-o teorie propoziționalăfolosind definiții WordNet + structura ontologică
procesele sunt rulate secvențial
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări: S-Match
http://semanticmatching.org/s-match.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări: LogMap
Acceptă scheme (TBox) + instanțe (ABox)
aplică partiționarea ontologiilor de mari dimensiuniși eliminarea fragmentelor (pruning) incomparabile
„repararea asocierilor” (mapping repair) via algoritmi de verificare a satisfiabilității
oferit și la nivel de Web, incluzând acces și la diverse sisteme de reasoning
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări: LogMap
http://www.cs.ox.ac.uk/isg/projects/LogMap/
https://code.google.com/p/logmap-matcher/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementari (actuale)
arhitectura generală a framework-ului COMA++ 3.0(S. Massmann et al., 2011)
http://dbs.uni-leipzig.de/Research/coma.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
vizualizarea alinierilor folosind COMA++http://dbs.uni-leipzig.de/de/Research/coma.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări
SAMBO – focalizat asupra potrivirii și fuziunii de ontologii biomedicale
Falcon – utilizează divide-et-impera și algoritmi de clustering pentru alinieri de ontologii largi
RiMOM – framework ce folosește strategii multipleconform unor algoritmi de decizie bayesiană
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
implementări
ASMOV (Automatic Semantic Matching of Ontologieswith Verification) – scop: integrarea informațiilor
din domeniul bioinformaticii
AgreementMaker – include o multitudine de sistemeautomate de potrivire, cu suport pentru extensii
eTuner – metamatcher, capabil să ajusteze automat diverși parametri de control
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizarea alinierilor
După efectuarea alinierilor, pot avea loc procese precum:
fuziune – Merge (o, o’, A) = o’’
traducere – Translate (d, A) = d’
interconectare – Interlink (d, d’, A) = L
rescriere de interogări – TransformQuery (q, A) = q’
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
fuziunea ontologiilor
Merging ontology – algoritmul general:
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
fuziunea ontologiilor
Merging ontology – în cazul ontologiilor OWL:
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Câteva exemple de utilizări pragmaticeale ontologiilor?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Dezvoltarea unei/unor ontologiitrebuie să reprezinte doar primul pas
un model conceptual nu are sensdacă nu e utilizat în practică
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
baze de dateaplicațiisoftware
serviciiWeb
problem-solving methods
baze de cunoștințe
recomandare, filtrare, analiză,…
adaptare după Alan Rector et al., 2005
declară o manierăde structurare
oferă o descrierea unui domeniu (web)
ontologii
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Ian Horrocks & Peter F. Patel-Schneider, 2011)
agriculturaAGROVOC (multilingual agricultural vocabulary),
Fisheries ontology, Geopolitical ontology, OpenAGRIS etc.
http://aims.fao.org/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Ian Horrocks & Peter F. Patel-Schneider, 2011)
biologieGO (Gene Ontology)
BioPAX (Biological Pathways Exchange ontology)
www.biopax.org
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Ian Horrocks & Peter F. Patel-Schneider, 2011)
biomedicinăOBO – Open Biological and Biomedical Ontologies
e.g., PRO (PRotein Ontology), Anatomical Entity Ontology,Common Anatomy Reference Ontology etc.
www.bioontology.org
www.obofoundry.org
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practica a ontologiilor
detalii despre serviciul Web REST oferit:http://data.bioontology.org/documentation
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Martin Hepp, 2012)
comerț electronicGoodRelations, FAB (Food and Beverage Ontology),
PTO (Product Types Ontology), TIO (Tickets Ontology),…
http://purl.org/goodrelations/
www.productontology.org
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Joost Breuker et al., 2009)
legislațieLKIF (Legal Knowledge Interchange Format),
OPJK (Ontology of Professional Judicial Knowledge), IPROnto (Intellectual Property Rights Ontology) etc.
https://github.com/RinkeHoekstra/lkif-core
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
modelarea conceptelor din legislația spaniolă(Oscar Corcho et al.)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Y. Raimond, P. Sinclair, N. Humfrey, M. Smethurst, 2009)
mass-mediaPO (Programmes Ontology), MO (Music Ontology)
folosite de BBC
http://purl.org/ontology/po/
http://www.bbc.co.uk/things/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Antoine Isaac, 2012)
culturăproiectul Europeana reutilizează vocabulare + ontologii
via ontologia ORE (Object Reuse and Exchange)
www.w3.org/2001/sw/sweo/public/UseCases/Europeana/
http://europeana.eu/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Ian Horrocks & Peter F. Patel-Schneider, 2011)
mediuontologiile SWEET (Semantic Web for Earth and
Environmental Terminology)
http://sweet.jpl.nasa.gov/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Joshua Shinavier, 2012; Oscar Corcho, 2013)
preluarea datelor de la senzoriconstituirea așa-numitelor semantic sensor networks ce recurg la modele conceptuale – e.g., OntoSensor
www.slideshare.net/joshsh/semantics-and-sensors
www.slideshare.net/ocorcho/semantic-social-sensor-networks
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(J. Breslin et al., 2011; Ș. Negru & S. Buraga, 2013)
aplicații Web socialeFOAF, SIOC, PIMO (Personal Information MOdel),
CommonTag, PersonasOnto,…
www.semanticdesktop.org/ontologies/pimo/
http://blankdots.com/open/personasonto.html
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Peter Mika & Thanh Tran, 2013)
semantic Web search
se bazează pe structura/înțelesul datelor șipe cunoștințe anterioare modelate explicit
www.slideshare.net/thanhtran81/sem-tech2013-tutorial-22953164
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Peter Mika & Thanh Tran, 2013)
semantic Web search
recurge la modele lingvistice + modele conceptuale
consideră intențiile utilizatorului (query intent)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practica a ontologiilor
T. Tran & P. Mika, A Survey of Semantic Search Approacheshttps://t.co/Ucxws48z (2012)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Martin et al., 2008; Fensel et al., 2007)
descrierea serviciilor Webscop: automatizarea descoperirii, selectării, invocării, compunerii și monitorizării execuției serviciilor Web
OWL-S, WSMO (Web Services Modeling Ontology)
www.daml.org/services/owl-s/
www.wsmo.org
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii(Khalid Belhajjame et al., 2013)
ingineria modelării cunoștințelorprovenance of a resource = a record that describes entities
and processes involved in producing and delivering or otherwise influencing that resource
PROV (Provenance Ontology) – recomandare W3C (2013)
http://www.w3.org/TR/prov-o/
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
utilizare practică a ontologiilor
pentru detalii, a se studia seria de prezentări de la http://www.w3.org/2001/sw/wiki/ESWC2013ProvTutorial
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Totuși, ce este Web-ul semantic?
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
viziunea stratificată privitoare la Semantic Web(Tim Berners-Lee)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
ce este web-ul semantic
Mit:
the semantic Web technology is Description Logic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
ce este web-ul semantic
Mit:
the semantic Web technology is Description Logic
OWL este doar un limbaj al Web-ului semantic
aplicațiile (dezvoltatorii) care doresc să exprimediverse expresivități îl pot utiliza
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Asigurarea interoperabilitățiio abordare pragmaticăfolosirea și altor limbaje via URI
JSON-LD – linked data via JSON http://json-ld.org/
JSONiq – realizarea de interogări asupra datelor JSONwww.jsoniq.org
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Având un model ontologic (consistent), pot fiexprimate reguli referitoare la entitățile modelate
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
antecedent consecvent
Având un model ontologic (consistent), pot fiexprimate reguli referitoare la entitățile modelate
if condition then conclusion
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Via reguli, pot fi deduse noi aspecte de interes
e.g., dacă un membru al unei echipe e interesat de un limbaj de programare, atunci echipa în ansamblu
e interesată de acel limbaj
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Via reguli, pot fi deduse noi aspecte de interes
e.g., dacă un membru al unei echipe e interesat de un limbaj de programare, atunci echipa în ansamblu
e interesată de acel limbaj
?person interestedBy ?lang
?person member ?team
ce este web-ul semantic
?team interestedBy ?lang
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
reguli
de la formule logice la reguli (Subrata Das, 2008)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
suită de specificații W3C standardizate (2010, 2013)
www.w3.org/2005/rules/
www.w3.org/TR/rif-overview/
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
scop:asigurarea interoperabilității vizând specificarea regulilor
și transferul între sisteme de reguli existente
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
limitarea raționamentelor (ipoteza lumilor deschise)
prin reguli, se poate impune NAF – negation as failure
“If Cristina isn’t known to have a brother,then assert she is brother-less.”
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
regulile pot fi utilizare și în cadrul medierilor ontologice
la nivel de TBox și/sau ABox
“If Ana knows Bogdan and Bogdan knows Carmen
and Carmen hasFamilyMember Dana,then assert Dana canTrust Ana.”
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
reguli – rif
trăsături de bază (Core) și extensii:BLD (Basic Logic Dialect) + PRD (Production Rule Dialect)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
RIF BLD – Basic Logic Dialect
aserțiunile privind condițiile + concluziile sunt monotone
valoarea de adevăr a predicatelor nu poate fi schimbată
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
RIF BLD – Basic Logic Dialect
if Ana rel:childOf Bogdan
and Bogdan rel:brotherOf Cosmin
then Cosmin rel:uncleOf Ana
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
RIF PRD – Production Rule Dialect
aserțiunile despre condiții + concluzii nu sunt monotone
valoarea de adevăr a predicatelor poate fi modificată(similar situației de la limbajele de programare)
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
RIF (Rule Interchange Format)
RIF PRD – Production Rule Dialect
if customer.level = "premium"
then customer.discount = 0.25
inițial: customer.discount = 0
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Amit Sheth)utilizarea ontologiilor și regulilorîn contextul aplicațiilor financiare
scop:automatizarea detectării inconsistențelor
și neregulilor financiare
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Amit Sheth)
specificarea riguroasă a terminologieidin sistemul financiar
integrarea datelor din surse multiple (semi)structurate
managementul și evaluarea formulelor analiticeasupra datelor financiare
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Amit Sheth, 2006)
pasul I:crearea ontologiei – financial domain ontology –,
populată pe baza unor surse de încredere
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Amit Sheth, 2006)
pasul II:implementarea unor extractori software
pentru eliminarea ambiguităților privind datele+ deducerea relațiilor relevante dintre acestea
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Amit Sheth, 2006)
pasul III:dezvoltarea unui cadru de lucru
pentru specificarea formulelor/regulilorși pentru interogarea cunoștințelor modelate ontologic
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Q. Zhu et al., 2010)recurgerea la reguli pentru descoperireainformațiilor privitoare la medicamente
scop:detectarea relațiilor între componentele medicamentelor
și efecte biologice, în contextul diverselor afecțiuni
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Studiu de caz (Q. Zhu et al., 2010)
date preluate via servicii Web:PubChem Compound, Pubchem BioAssay, Drug Bank
agregarea informațiilor se realizează folosindWENDI (Web Engine for Non-obvious Drug Information)
procesare – inclusiv a regulilor – folosind Apache Jenahttp://jena.apache.org/
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Scenariu de recomandare de produse (S. Hawke, 2009)utilizatorul se află într-un magazin și
dorește să cumpere un obiect
folosind telefonul mobil scanează produsul și poate obținevia sistem(e) de reguli descrise semantic
prețul în alte magazine din vecinătate, caracteristici deinteres – e.g., proveniență, componente, păreri,
pericole/maniere de utilizare,… –, oferte ale producătorului, dacă prietenii îl dețin deja etc.
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Mit:
semantic Web is about public data
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Mit:
semantic Web is about public data
tehnologiile Web-ului semantic se pot aplicași în cazul datelor la nivel personal, de grup,
organizațional – inclusiv vizând mediile enterprise
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Sabincreator
author
Man
type
web.htmlauthor
Dezvoltarea aplicațiilor Web
Person
Man
subProperty subClass
model ontologic
dc:title
de la modelare formală la specificații ontologiceadaptare după Fabien Gandon (2009)
Sabin
Paul Anca
Cristina
Claudia
Radu
analiza rețelelor sociale via teoria grafurilor
),(;)( pxrelxpdin
4)( Ancadin
dc:creator
Person
type
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Mit:
semantic Web is about public data
…dar nu trebuie ignorate așteptările utilizatorilor
acces public la informații/cunoștințe procesabile automatopen knowledge
open government, open culture, open science etc.
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web is about hand-annotatedWeb pages
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web is about hand-annotatedWeb pages
such pages are interesting, but not the mainstay of semantic Web: too much trouble!
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web is mainly about contentextracted from text
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web is mainly about contentextracted from text
it is primarily an interlingua for relational data and logic
bridges will always be important
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web is about making one big ontology
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web is about making one big ontology
the semantic Web is about a fractal messof interconnected vocabularies/ontologies
a se revedea inițiativa Linked Open Data
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web ontologies must all be consistent
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Alte mituri (Tim Berners-Lee)
the semantic Web ontologies must all be consistent
only the parts I am using together
existența instrumentelor – teoretice și practice –de verificare formală + efectuare de raționamente
ce este web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Diverse aspecte avute în vedere de Web-ul semanticpot fi aplicații pe scară largă
(e.g., în cadrul cloud computing, în contextul big data)
căutare, regăsire, reutilizare de date/cunoștințedata/relation/knowledge mining
sisteme de recomandare (socială) „inteligentă”etc.
problematici avute în vedere de Web science
ce va fi web-ul semantic
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
rezumat
Ⰿknowledge engineering
de la alinieri la utilizări pragmatice ale ontologiilorstudii de caz & perspective
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
episodul viitor: evaluarea proiectului (P)
Dr.
Sab
in B
ura
ga
www.purl.org/net/busa
co
Mult succes!