réconciliation de références

1

Réconciliation de références

LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo

Université Paris-Sud XI

2

Différents problèmes de réconciliation

Alignement/Réconciliation de schémas

Réconciliation de données Apparier des données avec un schéma cible/annoter Détecter que deux descriptions de données représentent la

même entité (ex: hôtel, gene, publication,...)=> intégration de données provenant de différentes sources

(élimination des redondances, combiner des éléments d’informations)

=> nettoyage d’une source de données

3

http://www.lri.fr/~sais/publis/DS-SML.pdf

"A semantic enrichment …"

AuthorTitle

http://www.lri.fr/~gag

H. Gagliardi

PersName

Author

http://www.univ-tlse2.fr/ grimm/ ~ohaemmerle

O. Haemmerle

PersName

Author

http://www.lri.fr/~pernelle

N. Pernelle

PersName

"Discovery in Science "

PublishedIn

“LNAI-3735 "

Notes

Author http://www.lri.fr/~sais

F. Saïs

PersName

http://hal.inria.fr/inria-00000930

Author

Title

http://hal.inria.fr/#auth2

Hélène Gagliardi

PersName

Author


Ollivier Haemmerle

PersName

Author


Nathalie Pernelle

PersName

“DS’05 c

PublishedIn

Author http://hal.inria.fr/#auth6

Fatiha Saïs

PersName"A semantic enrichment …"

http://hal.inria.fr/inria-0000006

Author

“E.DOT"

InProject

Source 1

Source 2

Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/inria-00000930)

Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/inria- inria-0000006)

Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/#auth12)Reconcile ? ("Discovery in Science ", “DS’05 ")

Compare ({"Hélène G.",“Ollivier H.", “Nathalie P." , "Fatiha S."}, {"H. Gagliardi", “O. Haemmerle", “N. Pernelle" , "F. Saïs"})

4

Approche LN2R - Combinaison de 2 méthodes

L2R : méthode logique partielle. Génération automatique de règles d’inférence qui traduisent la

sémantique logique des connaissances déclarées en RDFS+ (+ disjonction, PF)

Exemple : traduction de PF(R): R6.1(R): Reconcile(X, Y) R(X, Z) R(Y, W) Reconcile (Z, W)R6.1(Located): Reconcile(X, Y) Located (X, Z)Located (Y, W) Reconcile (Z, W)

R6.2(A): Reconcile(X, Y) A(X, Z) A(Y, W) SynVals(Z, W)R6.2(MuseumName):Reconcile(X,Y) MuseumName (X, Z) MuseumName (Y,W)

SynVals(Z, W)

Utilisation de la résolution unitaire pour inférer des décisions de réconciliation et de non réconciliation correctes.

5

Approche LN2R - Combinaison de 2 méthodes

N2R : méthode numérique itérative qui complète les résultats de L2R. Fondée sur un calcul de similarité informé et modélisé dans un

système d’équations. Décision de réconciliation, fondée sur les scores de similarité.

Approche LN2R automatique et déclarative, fondée sur la sémantique du schéma et des données.

Testées sur 2 corpus dont le benchmark CORA.

6

N2R: illustration

m1, m’1 c1, c’1

p1, p’1

“Le Louvre”,“Louvre”

“Paris”,“La ville de Paris”

“La Joconde”,“l’Européenne”

x1 = max(max(max(b11, x3), x4), * x2)

x2 = max(b21, x1)

x3 = max(b31, * x1)

x4 = max(b41 , * x1)

x1 x2

x3

b11

p1, p’2“La Joconde”,“Joconde”

x4b41

b21

b31

= 1/(| CAttr | + | CRel |) = 0.02

b11 = 0.8, b21 = 0.3, b31 = 0.1, b41 = 0.7

x1 x2 x3 x4

Initialisation 0.0 0.0 0.0 0.0

Itération 1 0.8 0.3 0.1 0.7

Itération 2 0.8 0.8 0.4 0.7

Itération 3 0.8 0.8 0.4 0.7

Solution : x1 = 0.8 x2 = 0.8 x3 = 0.4 x4 = 0.7

réconciliation de références

Documents