1 découverte de correspondances entre ontologies distribuées f.-e. calvier le 03/07/07
Post on 04-Apr-2015
111 Views
Preview:
TRANSCRIPT
1
Découverte de correspondances entre ontologies distribuées
F.-E. Calvierle 03/07/07
2
Plan
1. Contexte de travail
2. Découverte de mappings : environnement centralisé vs. distribué
3. Exploitation du raisonnement• Découverte de raccourcis de mappings
• Identification d’éléments pertinents à mettre en correspondance
4. Conclusions et perspectives
3
1. Contexte de travail
• Les ontologies et les mappings sont représentés en RDF(S) et les données en RDF
• Les mêmes constructeurs sont utilisés pour représenter les ontologies et les mappings
• Ontologies :– Vocabulaire d’un pair = {noms de classes du pair} {noms de propriétés du pair}
• Mappings :– Inclusions entre classes ou propriétés de 2 pairs différents
– Typage d’une propriété d’un pair donné par une classe d’un autre pair
D
O M
4
Opérateurs RDF(S)
Inclusion de classes : X, C1(X) C2(X)
Inclusion de propriétés : X Y, P1(X,Y) P2(X,Y)
X, Painter(X) Artist(X) X Y, Paints(X, Y) Creates(X,Y)
5
Opérateurs RDF(S)
Typage de domaine et de co-domaine d'une propriété X Y , P1(X,Y) C1(X) X Y , P1(X,Y) C2(Y)
Langage restreint : coreRDFS
X Y , Paints(X,Y) Painter(X) X Y , Paints(X,Y) Painting(Y)
6
Mappings SomeRDF(S)
Des expressions construites à partir du vocabulaire de pairs différents qui établissent ainsi des correspondances sémantiques entre eux.
Notation : P : R, relation R de l’ontologie d’un pair P
Inclusion de classes : X, P1:C1(X) P
2:C2(X)
Inclusion de propriétés :
X Y , P1:P1(X,Y) P
2:P2(X,Y)
Typage de domaine et de co-domaine d'une propriété
X Y , P1:P1(X,Y) P
2:C1(X)
X Y , P1:P1(X,Y) P
2:C2(Y)
7
Q1(X) ≡ P1:Artifact(X)
R1(X) ≡ P1:Artifact(X)
R2(X) ≡ P1:Painting(X)
R3(X) ≡ Y, P1:Belongsto(X, Y )
R4(X) ≡ P2:Sculpture(X)
R5(X) ≡ Y, P1:Creates(Y,X)
R6(X) ≡ Y, P1:Paints(Y,X)
R7(X) ≡ Y, P2:Sculpts(Y,X)
Q1(X) ≡ P1:Artifact(X)
R1(X) ≡ Ø
R2(X) ≡ {la_joconde}
R3(X) ≡ Ø
R4(X) ≡ {statue_de_david}
R5(X) ≡ {les_demoiselles_d_avignon}
R6(X) ≡ Ø
R7(X) ≡ {le_penseur}
Exemple
Artifact
Painting
GlassSculptor Movement
Sculptor
Artist
SteelSculptor
Painter
WoodSculptor
Q1(X)
P2
Refersto
Belongsto
Sculpts
Creates
Paints
P1
Sculpture
8
2. Découverte de mappings : environnement centralisé vs. distribué
Spécificités du contexte distribué par rapport au contexte centralisé :
• Nombre de comparaisons
• Des connaissances locales
• Richesse du raisonnement
9
Nombre de comparaisons
Contexte distribué :– Multitude de pairs
– Nombre variable de pairs
Nombre important et variable de comparaisons
Contexte centralisé :– Nombre établi d’ontologies
Nombre limité de comparaisons
…
O O O
10
Nombre de comparaisons
Contexte centralisé :– Découverte de mappings
produit cartésien des éléments des ontologies
…
O O
A1 B1 … Z1
A2 1 0.5 … 0.8
B2 0.1 0.7 … 0
C2 0.4 0.2 … 0.6
… … … … …
Z2 0.7 0.5 … 0.3
?
O
11
Contexte distribué :
• Accès aux pairs voisins uniquement via les mappings
Aucune vision sur les autres relations des pairs voisins
• Communication entre certains pairs impossible
Des limitations fortes sur les mappings pouvant être découverts
Un processus à l’initiative d’un pair donné
Des connaissances locales
P1
D1 N1
H1
F1
D2 N2
H2P2
F2P1 P2
12
Richesse du raisonnement
Contexte distribué :
– Les réponses aux requêtes : indicateurs utiles à la découverte
de mappings
D1 N1
H1P1
F1
D2 N2
H2P2
F2
D2 N2D2 N2
P2P1
13
3. Exploitation du raisonnement
Exploitation des réponses aux requêtes
• Découverte de raccourcis de mappings
• Identification d’éléments pertinents à mettre en correspondance
14
3.1 Découverte de raccourcis de mappings
• Liens indirects remplacés par de liens directs
• Renforce le réseau– Intéressant en cas de
disparition de pairs
• Un processus automatisable
Pb : l’ajout ne doit pas être systématique
Processus de filtrage nécessaire
15
3.1 Découverte de raccourcis de mappings
Un processus en 2 temps :
• Exploiter les résultats des requêtes posées dans SomeRDFS
• Appliquer des techniques de sélection des raccourcis pertinents à représenter
16
B?{A}
{W, T, K, A, Z, G, …}{W, T, A1, M, A2, Z, …}
G
K
Scénario de découverte de raccourcis de mappings
R T
B
D
W
V
N
HP
F
B
A?
AA2
A1
Z M
P1
{A1, A2}
17
3.1 Découverte de raccourcis de mappings
Un processus en 2 temps :• Exploiter les résultats des requêtes posées dans SomeRDFS
– Dissociation des étapes de réécriture et d’évaluation
– L’utilisateur sélectionne les réécritures pour lesquelles il demande l’évaluation
• Appliquer des techniques de sélection des raccourcis pertinents à représenter
– Analyse de la trace des interactions entre les utilisateurs et les pairs
– Raccourcis de mapping ajoutés = liens directs avec les classes intéressantes pour les utilisateurs
• Apparues dans les réécritures
• Les utilisateurs ont, à plusieurs reprises, demandé leur évaluation
– Nombre de fois que l’évaluation de la classe distante est demandée détermine l’ajout de raccourcis de mappings seuil à fixer
18
3.2 Identification d’éléments pertinents à mettre en correspondance
Reformulation du problème :
A partir de quelles relations rechercher des
correspondances ? = relations cibles
exploitation du raisonnement
Parmi quelles relations distantes rechercher des
correspondances ? = contexte de mapping (CM)
19
Identification de relations cibles
A partir de quelles relations ?
Identifiables à partir des requêtes dont les réécritures sont toutes locales
Les relations pour lesquelles il n’existe pas de spécialisation au sein des réécritures
20
Parmi quelles relations rechercher des mappings?
Idée : recherche de mise en correspondance des classes qui ont des points communs
généralisant ou spécialisant
Pour chaque classe cible, déterminer un ensemble de classes entre lesquelles il serait pertinent de rechercher des mises en correspondance (CM)
CCIBLE = C1
Si ! Cg | CCIBLE Cg et Q(X) ≡ Cg(X)
Alors CM = {C | R réécriture de Q(X), C R}
CCIBLE = C2
Si G = {Cg | CCIBLE Cg} avec G = G1G2 |
G1 = {Cg PCIBLE}
et G2 = {Cg PCIBLE} Alors CM = G
21
• Scénarios combinables
• Permet de définir un ensemble CM sur lequel utiliser des techniques d’alignement
• CM permet aussi de trouver des mappings entre relations de pairs distants
Que faire de ces mappings particuliers ?
22
Conclusion et perspectives
• Des méthodes exploitant le raisonnement dans SomeRDFS– Orientant la découverte de mappings– Nécessitant d’autres outils :
• Analyse de la trace des interactions (outils statistiques)• Méthodes d’alignement particulières prenant en compte la
dissymétrie structurelle (Taxomap)
• D’autres méthodes possibles basées sur l’évolution des connaissances d’un pair
• Etude des requêtes sous forme de conjonctions de relations• Implémentation des méthodes proposées
top related