réconciliation de références

6
1 Réconciliation de références LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo Université Paris-Sud XI

Upload: yuri-thompson

Post on 01-Jan-2016

43 views

Category:

Documents


3 download

DESCRIPTION

Réconciliation de références. LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo Université Paris-Sud XI. Différents problèmes de réconciliation. Alignement/Réconciliation de schémas Réconciliation de données Apparier des données avec un schéma cible/annoter - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Réconciliation de références

1

Réconciliation de références

LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo

Université Paris-Sud XI

Page 2: Réconciliation de références

2

Différents problèmes de réconciliation

Alignement/Réconciliation de schémas

Réconciliation de données Apparier des données avec un schéma cible/annoter Détecter que deux descriptions de données représentent la

même entité (ex: hôtel, gene, publication,...)=> intégration de données provenant de différentes sources

(élimination des redondances, combiner des éléments d’informations)

=> nettoyage d’une source de données

Page 3: Réconciliation de références

3

http://www.lri.fr/~sais/publis/DS-SML.pdf

"A semantic enrichment …"

AuthorTitle

http://www.lri.fr/~gag

H. Gagliardi

PersName

Author

http://www.univ-tlse2.fr/ grimm/ ~ohaemmerle

O. Haemmerle

PersName

Author

http://www.lri.fr/~pernelle

N. Pernelle

PersName

"Discovery in Science "

PublishedIn

“LNAI-3735 "

Notes

Author http://www.lri.fr/~sais

F. Saïs

PersName

http://hal.inria.fr/inria-00000930

Author

Title

http://hal.inria.fr/#auth2

Hélène Gagliardi

PersName

Author

http://hal.inria.fr/#auth4

Ollivier Haemmerle

PersName

Author

http://hal.inria.fr/#auth5

Nathalie Pernelle

PersName

“DS’05 c

PublishedIn

Author http://hal.inria.fr/#auth6

Fatiha Saïs

PersName"A semantic enrichment …"

http://hal.inria.fr/inria-0000006

Author

“E.DOT"

InProject

Source 1

Source 2

Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/inria-00000930)

Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/inria- inria-0000006)

Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/#auth12)Reconcile ? ("Discovery in Science ", “DS’05 ")

Compare ({"Hélène G.",“Ollivier H.", “Nathalie P." , "Fatiha S."}, {"H. Gagliardi", “O. Haemmerle", “N. Pernelle" , "F. Saïs"})

Page 4: Réconciliation de références

4

Approche LN2R - Combinaison de 2 méthodes

L2R : méthode logique partielle. Génération automatique de règles d’inférence qui traduisent la

sémantique logique des connaissances déclarées en RDFS+ (+ disjonction, PF)

Exemple : traduction de PF(R): R6.1(R): Reconcile(X, Y) R(X, Z) R(Y, W) Reconcile (Z, W)R6.1(Located): Reconcile(X, Y) Located (X, Z)Located (Y, W) Reconcile (Z, W)

R6.2(A): Reconcile(X, Y) A(X, Z) A(Y, W) SynVals(Z, W)R6.2(MuseumName):Reconcile(X,Y) MuseumName (X, Z) MuseumName (Y,W)

SynVals(Z, W)

Utilisation de la résolution unitaire pour inférer des décisions de réconciliation et de non réconciliation correctes.

Page 5: Réconciliation de références

5

Approche LN2R - Combinaison de 2 méthodes

N2R : méthode numérique itérative qui complète les résultats de L2R. Fondée sur un calcul de similarité informé et modélisé dans un

système d’équations. Décision de réconciliation, fondée sur les scores de similarité.

Approche LN2R automatique et déclarative, fondée sur la sémantique du schéma et des données.

Testées sur 2 corpus dont le benchmark CORA.

Page 6: Réconciliation de références

6

N2R: illustration

m1, m’1 c1, c’1

p1, p’1

“Le Louvre”,“Louvre”

“Paris”,“La ville de Paris”

“La Joconde”,“l’Européenne”

x1 = max(max(max(b11, x3), x4), * x2)

x2 = max(b21, x1)

x3 = max(b31, * x1)

x4 = max(b41 , * x1)

x1 x2

x3

b11

p1, p’2“La Joconde”,“Joconde”

x4b41

b21

b31

= 1/(| CAttr | + | CRel |) = 0.02

b11 = 0.8, b21 = 0.3, b31 = 0.1, b41 = 0.7

x1 x2 x3 x4

Initialisation 0.0 0.0 0.0 0.0

Itération 1 0.8 0.3 0.1 0.7

Itération 2 0.8 0.8 0.4 0.7

Itération 3 0.8 0.8 0.4 0.7

Solution : x1 = 0.8 x2 = 0.8 x3 = 0.4 x4 = 0.7