alignement entre ontologie de domaine et la snomed: trois études de cas
DESCRIPTION
Présentation de Laurent Mazuel et Jean Charlet à IC 2009TRANSCRIPT
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Alignement entre des ontologies de domaine et laSnomed : trois études de cas
Laurent Mazuel et Jean Charlet
INSERM UMR_S 872, Eq. 20, Centre des Cordeliers, Paris{laurent.mazuel, jean.charlet}@spim.jussieu.fr
Conférence IC'09, 27 Mai 2009
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 1 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Plan
1 Contexte
2 Construction de l'alignement
3 Étude de l'alignement
4 Conclusion et perspectives
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 2 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Plan
1 Contexte
2 Construction de l'alignement
3 Étude de l'alignement
4 Conclusion et perspectives
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 3 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Contexte
Terminologie/ontologie de référence
Ingénierie des connaissances médicales
Besoin important dans le domaine médical→e.g. MeSH, FMA, Snomed, etc.
Ce sont des terminologies de référence, utiles pour :
Aide aux codage de dossiers patients, etc.
Terminologie Snomed v3.5
116 000 concepts
Hiérarchie (subsomption) de concepts
Amenée à devenir la référence o�cielle pour le codade enFrance (pour compléter la CIM-10 et la CCAM - épidémiologiemédicale)
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 4 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Contexte
Terminologie/ontologie d'interface
Modèle de spécialité médicale
Spéci�que à une spécialité médicale
e.g. pneumologie, HTA (hypertension artérielle)Plus détaillée qu'un modèle de référence
Ce sont des terminologies d'interface, utiles pour :
Indexation de dossiers médicaux spécialisés, etc.
Ontologies de l'équipe
OntoPneumo (pneumologie, 1 114 concepts)
OntoHTA (hypertension artérielle, 506 concepts)
OntoReaChir (réanimation post-chirurgicale, 2 039 concepts)
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 5 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Alignement
Problème d'hétérogénéité
Situation
Le codage médical doit utiliser les modèles de référence
L'indexation ne peut être e�cace qu'avec des modèles de
spécialité
Problème
Comment passer d'un modèle de spécialité à un modèle deréférence ?
Proposition
Utiliser un alignement entre les concepts d'interface et de référence
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 6 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Alignement
Problème d'hétérogénéité
Situation
Le codage médical doit utiliser les modèles de référence
L'indexation ne peut être e�cace qu'avec des modèles de
spécialité
Problème
Comment passer d'un modèle de spécialité à un modèle deréférence ?
Proposition
Utiliser un alignement entre les concepts d'interface et de référence
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 6 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Alignement
Notre utilisation d'alignement
Dé�nition
Un alignement est un ensemble de correspondances entre unou plusieurs concepts de deux terminologies
Notre limite : couple d'équivalence entre deux concepts
Exemples
AccidentVasculaireCerebralSNOMED ≡ AVCOntoPneumo
DosageDuPotassiumSNOMED ≡ KaliemieOntoPneumo
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 7 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
But de cette présentation
But de cette présentation
But de cette présentation
Présenter notre travail d'alignement entre trois ontologiesd'interface (OntoPneumo, OntoHTA et OntoReaChir) à laSnomed v3.5
Discuter de ces résultats
Où sont situés ces alignements dans les arbres conceptuels ?La conceptualisation de ces modèles est-elle compatible ?
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 8 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Plan
1 Contexte
2 Construction de l'alignement
3 Étude de l'alignement
4 Conclusion et perspectives
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 9 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Stratégie
Déroulement de la construction1 Calcul automatique d'un alignement2 Validation manuelle3 Complétion manuelle
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 10 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Choix d'un algorithme d'alignement automatique
Type d'alignement
Alignement morpho-syntaxique (similarité des labels)
Alignement hiérarchique (localisation des n÷uds)
Alignement par instance (instances communes)
Alignement par médiation (déduction d'un alignement à partirde deux alignements vers une ontologie de médiation)
Dans notre cas :
Hiérarchie faible dans la Snomed, pas d'instances et la Snomed estjustement notre � ontologie � médiatrice pour des alignementsfuturs !
Finalement
Uniquement une approche morpho-syntaxiqueL. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 11 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Choix d'un algorithme d'alignement automatique
Type d'alignement
Alignement morpho-syntaxique (similarité des labels)
Alignement hiérarchique (localisation des n÷uds)
Alignement par instance (instances communes)
Alignement par médiation (déduction d'un alignement à partirde deux alignements vers une ontologie de médiation)
Dans notre cas :
Hiérarchie faible dans la Snomed, pas d'instances et la Snomed estjustement notre � ontologie � médiatrice pour des alignementsfuturs !
Finalement
Uniquement une approche morpho-syntaxiqueL. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 11 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Choix d'un algorithme d'alignement automatique
Type d'alignement
Alignement morpho-syntaxique (similarité des labels)
Alignement hiérarchique (localisation des n÷uds)
Alignement par instance (instances communes)
Alignement par médiation (déduction d'un alignement à partirde deux alignements vers une ontologie de médiation)
Dans notre cas :
Hiérarchie faible dans la Snomed, pas d'instances et la Snomed estjustement notre � ontologie � médiatrice pour des alignementsfuturs !
Finalement
Uniquement une approche morpho-syntaxiqueL. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 11 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Notre application morpho-syntaxique
Pré-traitement morphologique
Suppression des diacritiques, espaces et autres caractèresspéciaux
Suppression des mots de liaisons
Snomed : suppression de certains su�xes � codage � (e.g. enanatomie : � SAI � - Sans Autre Indication)
Méthodes utilisées
Lexicalisations SKOS (altLabel, prefLabel)
Distance de Levenshtein (seuil acceptable : 0,97)⇒ fondée sur les suppressions, délétions, échange de lettres
Mesure de Stoilos, I_sub (seuil acceptable : 0,9)⇒ fondée sur les occurrences de sous-chaînes de caractères
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 12 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Résultats de l'alignement automatique
Ontologiede spécialité
ConceptsAlignements
automatiques à laSnomed
Alignement�nal
Directs Validés
OntoPneumo 1114 669 613 787OntoHTA 506 159 144 228OntoReaChir 2039 1046 987 1187
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 13 / 23
Validation manuelle
Logiciel présenté demain à la session Demo
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Après validation
Ontologiede spécialité
ConceptsAlignements
automatiques à laSnomed
Alignement�nal
Directs Validés
OntoPneumo 1114 669 613 787OntoHTA 506 159 144 228OntoReaChir 2039 1046 987 1187
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 15 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Construction de l'alignement
Après complétion manuelle
Ontologiede spécialité
ConceptsAlignements
automatiques à laSnomed
Alignement�nal
Directs Validés
OntoPneumo 1114 669 613 787OntoHTA 506 159 144 228OntoReaChir 2039 1046 987 1187
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 16 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Plan
1 Contexte
2 Construction de l'alignement
3 Étude de l'alignement
4 Conclusion et perspectives
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 17 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Étude de l'alignement
Visualisation de cet alignement
Partie droite : sous-arbres complets non alignés (de la racineaux feuilles)
Partie gauche :
Haute : concepts hauts non alignés (i.e. pas d'ancêtres alignés)Basse : concepts feuilles non alignés (i.e. pas de �ls alignés)Centrale/bleue : concepts alignés (i.e. au moins un ancêtre etun descendant aligné)
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 18 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Étude de l'alignement
Interprétation des résultats
1 Les concepts spéci�ques sont peu dans la Snomed2 Les concepts structurants génériques sont absents de la
Snomed⇒ alignements au niveau central (� core �)
Des sous-arbres entiers de spécialités absent de la Snomed⇒ di�érence de conceptualisation (e.g. sous-arbres traitant des
médicaments, échelle de classi�cation internationale, etc.)
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 19 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Étude de l'alignement
Comparaison des alignements
Croisement des alignements
Anatomie (� jambe �, � c÷ur �)
État physiologique patient (� tension artérielle �)
Examen générique (� échographie �)
Signes (� AVC �)
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 20 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Plan
1 Contexte
2 Construction de l'alignement
3 Étude de l'alignement
4 Conclusion et perspectives
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 21 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Conclusion
Conclusion
Conclusion
Résultats analogues à ceux déjà menés sur laSnomed-CT[Bodenreider :AMIA08] avec la terminologie LoincLaboratory Test
Les modèles de spécialité sont plus détaillés que les références,il n'est pas possible d'induire automatiquement une ontologie
de spécialité à partir d'un modèle générique de référence
⇒ con�rme la pertinence des processus de constructionexterne des modèles d'interface, malgré le temps nécessaire
L'alignement permet une proposition pour pratiquementchaque concept médical (même plus générique)⇒ possibilité pour le codage médical automatique
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 22 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Conclusion
Conclusion
Conclusion
Résultats analogues à ceux déjà menés sur laSnomed-CT[Bodenreider :AMIA08] avec la terminologie LoincLaboratory Test
Les modèles de spécialité sont plus détaillés que les références,il n'est pas possible d'induire automatiquement une ontologie
de spécialité à partir d'un modèle générique de référence
⇒ con�rme la pertinence des processus de constructionexterne des modèles d'interface, malgré le temps nécessaire
L'alignement permet une proposition pour pratiquementchaque concept médical (même plus générique)⇒ possibilité pour le codage médical automatique
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 22 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Conclusion
Conclusion
Conclusion
Résultats analogues à ceux déjà menés sur laSnomed-CT[Bodenreider :AMIA08] avec la terminologie LoincLaboratory Test
Les modèles de spécialité sont plus détaillés que les références,il n'est pas possible d'induire automatiquement une ontologie
de spécialité à partir d'un modèle générique de référence
⇒ con�rme la pertinence des processus de constructionexterne des modèles d'interface, malgré le temps nécessaire
L'alignement permet une proposition pour pratiquementchaque concept médical (même plus générique)⇒ possibilité pour le codage médical automatique
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 22 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Perspectives
Perspectives
OntoHTA est aligné à la Snomed-CT, Snomed v3.5 est alignéà la Snomed-CT⇒possibilité de créer un alignement par transitivité et de lecomparer au notre
développer un système de codage médical !
Merci pour votre attention !
Quelques questions ?
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 23 / 23
Contexte Construction de l'alignement Étude de l'alignement Conclusion et perspectives
Perspectives
Perspectives
OntoHTA est aligné à la Snomed-CT, Snomed v3.5 est alignéà la Snomed-CT⇒possibilité de créer un alignement par transitivité et de lecomparer au notre
développer un système de codage médical !
Merci pour votre attention !
Quelques questions ?
L. Mazuel / J. Charlet Alignement entre ontologies de domaine et Snomed 27/05/2009 23 / 23