ecoonto - une ontologie pour la biodiversité
DESCRIPTION
Workshop Sémantique & Ontologies AnaEE-FranceTRANSCRIPT
EcoOnto, une ontologie pour la Biodiversité
Acquisition, structuration et valorisation de données issues d’observations biologiques
Workshop Sémantique & Ontologies AnaEE-France
6 décembre 2013 - Moulis
Julie Chabalier
Plan
2010 2011 2012 2013
glossary ecoOnto-Med
La genèse … Le projet …………. La suite ……………………..........
1998
2002
Marseille
carole duval
amandine sahl
olivier coullet
1998
2002
2008
Marseille
carole duval
amandine sahl
olivier coullet
2004
2008
Marseille
Rennes
carole duval
amandine sahl
olivier coullet 2009 2008
Marseille
Des outils numériques pour la nature
ACQUÉRIR
STRUCTURER Aide à la décision : Risque de perte de
biodiversité ?
Espèces / écosystèmes à
préserver ?
DONNÉES EXISTANTES
COLLECTE
SI
BD
CARTES
GRAPHES
VALORISER
Idée Quelles sont les
zones à protéger
en PACA?
Recherche
des
données
existantes
Web
Observations à collecter
pour répondre à la
question
Proposition de
zones à protéger
en PACA
?
Données de biodiversité
Multi-
observateurs
Biologie
Multi-sites
Géographie
Génétique Pédologie Hétérogènes
Multi-modèles
Multi-formats
Données de biodiversité
Données de biodiversité liées
Projet ECO-INC ECOlogical INtelligent Census
Quelles sont les
zones à protéger
en PACA?
Observations à
collecter pour répondre
à la question
Proposition de
zones à
protéger en
PACA
ecoRelevé Knowledge
Module de connaissances
Module de données
Recherche
des données
existantes
AAP « Eco-industries » Avril 2009
• ADEME – OSEO – DGCIS (Fonds de compétitivité des entreprises)
• Type de projets : projet de développement expérimental et d’innovation individuel (PME)
• Axe : surveiller et tracer
• Thème : observer davantage et mieux l’environnement
• Projet déposé : 30 avril 2009
• Demande de financement : 390 k€ sur 3 ans
Projet Lauréat !
Financement après
négociation
Subvention 150k€ sur 1,5 an
• 50 k€ OSEO AFI –
Faisabilité du système :
ecoQuery
• 100 k€ Ministère écologie –
Ontologie : ecoOnto
• Début des travaux janvier
2010
ecoOnto
Une
ontologie
de la
biodiversité
2010 2011 2012 2013
glossary ecoOnto-Med
Comité scientifique
Comité Scientifique et
technique
Institution Domaine d’expertise
Thierry Bourgoin MNHN, FRB Systématique
Olivier Dameron INSERM/Université de Rennes 1 Web sémantique
Sophie Gachet IMEP Ecologie
Wilfried Heintz GIP ECOFOR Geomatique
Thérèse Libourel LIRMM Informatique
Ammar Mechouche IGN Web sémantique
Isabelle Mougenot LIRMM Bioinformatique
Emmanuelle Porcher MNHN Ecologie
Concepts
environnementaux
La conception de l’ontologie
WP1 – Définition des concepts
Standards en
biodiversité
Concepts
environnementaux
La conception de l’ontologie
WP2 – Mapping avec les standards
Standards en
biodiversité
Concepts
environnementaux
La conception de l’ontologie
WP3 – Top domaine ontologie
Top
domaine
ontologie
Standards en
biodiversité
Concepts
environnementaux
La conception de l’ontologie
WP4 – Mapping et extension
Inventaire des concepts
Un glossaire pour la biodiversité
1. Lister un ensemble de questions environnementales
2. Extraire les concepts
3. Définir des concepts
Exemple :
Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche?
Le glossaire Un concept [fr] :
[label préféré; synonymes; Définitions; Références; termes associés]
label préféré : Impact sur l’environnement
Synonymes : Conséquence sur l’environnement, effet sur l’environnement
Définitions :
1. Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique
d'écosystème.
2. Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement
des activités, produits ou services d’un organisme.
Références :
1. P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4,
pp. 215-306.
2. Norme ISO 14001.
Terme associé : Etude d’impact
Le glossaire Un concept [fr] :
[label préféré; synonymes; Définitions; Références; termes associés]
label préféré : Impact sur l’environnement
Synonymes : Conséquence sur l’environnement, effet sur l’environnement
Définitions :
1. Déviations de dynamiques naturelles d'évolution aboutissant à des modifications de l'état théorique d'écosystème.
2. Toute modification de l’environnement, négative ou bénéfique, résultant totalement ou partiellement des activités,
produits ou services d’un organisme.
Références :
1. P. Blandin, 1986, Bioindicateurs et diagnostic des systèmes écologiques, Bull. Ecol., t. 17, fasc 4, pp. 215-306.
2. Norme ISO 14001.
Terme associé : Etude d’impact
Enrichissement
du glossaire
label préféré : Etude d’impact
Synonyme : Etude d’incidence
Définitions :
1. Processus d’identification des conséquences probables pour l’environnement bio-
géophysique, pour la santé de l’homme et pour son bien-être, de la mise en œuvre
de certaines activités et transmission de ces informations aux responsables
capables de sanctionner les propositions.
Références :
1. Wathern (Ed.), 1988, Environmental Impact Assessment: Theory and Practice,
Routledge, London
Terme associé : Impact sur l’environnement
Enrichissement du glossaire
Décomposition des questions :
Quels sont les impacts sur la biodiversité si l'étang de Mauguio s'assèche?
• Quel est le polygone correspondant à l’étang de Mauguio ?
• Quelles sont les espèces observées dans le polygone?
• Parmi les espèces observées, quelles espèces pourraient disparaître s’il y avait assèchement ?
– Rechercher les habitats des espèces observées?
– Sélectionner les espèces observées qui ont pour habitat les zones humides
Polygone Aire formée d'une surface intérieure, d'un anneau extérieur et qui peut comporter plusieurs anneaux intérieurs qui ne se croisent pas ni ne s'imbriquent. Glossaire - Exploring GIS, by Nicholas Chrisman. [Aire]
Etang Etendue d'eau stagnante, peu profonde, de surface inférieure à 8 hectares résultant de l'imperméabilité du sol. Convention de Ramsar, 1971.
Observation
1.Une observation est une action dont le résultat est une estimation de la valeur de certaines propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. SEEgrid,”OGC Standard - Observations and Measurements”
2. Une observation est une affirmation selon laquelle une entité a été observée. Une observation peut consister en des mesures qui se réfèrent à une ou plusieurs caractéristiques de l’entité. Les observations sont effectuées dans un contexte. Le contexte d’une observation se compose d’autres observations. Par exemple, une observation d’un lieu particulier peut servir de cadre pour une observation d’un organisme. Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol2,3,pp 279-296 [Observateur]
Habitat
1. Ensemble de caractéristiques environnementales qui, pour les animaux terrestres, est généralement assimilé à une communauté végétale, une association végétale, ou un type de couverture . Garshelis,2000, Delusions in habitat Evaluation: Measuring Use, Selection, and Importance in Research techniques in animal ecology
2. Lieu ou type de site dans lequel un organisme ou une population existe à l'état naturel. Convention sur la diversité biologique, 1992.
Zone humide 1. terrains, exploités ou non, habituellement inondés ou gorgés d'eau douce […] Article 2 de la loi du 3 janvier 1992 Codifié à l'article L 211-1 du code de l'environnement. 2.les zones humides sont des étendues de marais, de fagnes, de tourbières ou d'eaux naturelles ou artificielles […] Article 1.1 Convention de Ramsar, 1971.
Définir les termes
Un Wiki pour collaborer
XWiki : un moteur de wiki open source • Edition collaborative via un navigateur Web
view/edit/preview/save
• Edition WYSIWYG
• Gestion des versions
• Gestion des droits
http://www.xwiki.com/
1. Quels sont les impacts sur l’environnement si l'étang de Mauguio s'assèche?
2. Quelles sont les conséquences de l'introduction de la coccinelle orientale, Harmonia axyridis Pallas sur l'écosystème européen?
3. Est-ce que les campagnes entourant Lunel ont un niveau de biodiversité élevée?
4. Quelles sont les méthodes pour évaluer la biodiversité de ma région?
5. Pourquoi malgré son statut d’espèce protégée, l’Esturgeon européen est en train de disparaître?
6. Depuis le début de sa protection en 1979, comment évolue la taille de la population de la genette (Genetta genetta) en France?
7. Quel est l'impact de la mise en place d’une aire de stationnement de poids lourds, au niveau de l’aire d’autoroute de Vidauban ?
8. Le fauchage en juin n’est-il pas un puits écologique pour la biodiversité pour mon pâturage, en Auvergne, Marcenat ?
9. Pourquoi je ne vois plus de chouettes lorsque je me balade en Camargue?
10. Puis-je observer des Bouquetins dans le Parc National des Ecrins?
11. Quels sont les impacts sur la biodiversité s'il n'y a plus de paturage dans les montagnes alpines?
12. Combien d'espèces en danger y a-t-il autour de ma zone?
13. Comment pouvons nous atteindre l'objectif de la CDB (Convention sur la diversité biologique) dans l'aire méditerranéenne de protéger 10% desécorégions du monde ?
14. Comment délimiter le territoire du futur Parc National en forêt feuillus de plaine (entre Champagne et Bourgogne) ?
15. Comment délimiter le cœur de parc du futur Parc National des calanques ?
16. Quels terrains sont prioritaires à l'achat pour le Conservatoire du Littoral en region PACA ?
17. Quels terrains sont prioritaires à l'achat par la "CDC Biodiversité" pour la protection du Coussoul de Craux?
18. Quelle est l'évolution de la taille de la population des insectes pollinisateurs dans la plaine de Beauce depuis les révolutions agricoles?
19. Combien d'observations sont présentes dans la zone sélectionnées?
20. Combien d'individus de l'espèce X ont été vus sur la zone Y ?
21. Quels sont les principaux protocoles d'échantillonnage pour estimer la taille d'une population/densité d'une population d'oiseaux ?
22. Quelles est la taille, la forme et le nombre de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ?
23. Quelle est la précision et l'exactitude de ce jeu de données ?
24. Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
25. Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
26. Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élévé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
27. Quelles étaient les valeurs des variables d'environnement pour cet échantillon ?
28. Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
29. Existe-t-il des modèles numériques de terrain disponibles pour l'aire d'étude ?
30. Existe-t-il des images rasters disponibles pour l'aire d'étude ?
31. Quelles sont les differentes categories d'Aires Protegées?
32. Comment pouvons-nous sauvegarder l'agrobiodiversité des bananes cultivées dans le contexte de la mondialisation?
33. Quels sont les principaux services écosystémiques fournis par les habitats humides de Camargue ?
35 questions [fr- en] Politiques
Scientifiques
Locales
~100 termes définis
Glossary for exploring GIS by Nicholas Chrismas
Glossary of the Federal Geographic Data Committee
Glossary of the Great Lakes Environmental Indicators Project
Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO
Glossary of statistical terms, Organization for economic co-operation and development
OceanLink’s Glossary of Common Terms and Definitions in Marine Biology
International Code of Zoological Nomenclature 1999
Larousse
Wiktionary
Références
bibliographiques
Glossaires
Dictionnaires
Etude des standards
Dublin Core EML
Darwin Core
ABCD schema Taxon Concept Schema
GML ISO 19115
Standards de
métadonnées
Standards de données
de biodiversité
Standards de données
géographiques
Les ontologies en biodiversité
ALTER-Net Ontologies (SERONTO) Amphibien taxonomy Basis Formal Ontology Biological Taxonomy Vocabulary Biotop Cereal plant trait< Crop ontology Darwin-SW DOLCE Environment Ontology Extensible Observation Ontology Fly taxonomy Gazetteer Ontology GeoConcepts Ontology Geonames
geo OWL
geoSpecies ontology
INSEE ontology
NCBI organismal classification
OBO relationship types
ontology of geographical region (from UMLS)
Ordnance Survey Ontologies
Plant environmental conditions
Spire: ethan ontology
SUMO
Sweet ontologies
Taxonomic rank vocabulary
Taxon concept ontology
Taxonomy Ontology
Teleost taxonomy
Wildlife Ontology (BBC)
30 ontologies de
domaine
Biologie 17
Géographie 11
Haut niveau 4
OWL 16
OBO 12
RDFS 2
Construction de l’ontologie
Domaine « Observations » « Action dont le résultat est une estimation de la valeur de certaines
propriétés de la caractéristique d’intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. » OGC
• Collecte de données
• Méthodes d’échantillonnage
• Identification
• Préparation de la collecte (recherche d’information cartographique, par exemple)
• Données collectées
~30 termes du glossaire
Accuracy (ABCD)
Identification (ABCD)
Taxon (DwC)
Observation (GML)
Polygon (GML)
Dans les Standards ?
Top
domaine
ontologie
Standards en
biodiversité
Concepts
environnementaux
Top domaine ontologie
• OBOE, extensible Observational ontology
• Ontologie issue du projet SEEK (Science Environment for Ecological Knowledge)
• LTER : Long Term Ecological Research (US)
• http://seek.ecoinformatics.org.
• Madin et al, 2007
OBOE-core
Une entité peut être observée dans le
contexte de plusieurs entités
un individu peut être observé dans
le contexte d’un habitat et d’une date.
Les caractéristiques observées sont
mesurées suivant un protocole et un
standard.
Taille en cm
Extension OBOE core
Les points d’extension : • Entity
• Characteristic
• Measurement
Classification des concepts définis suivant les points d’extension
Modélisation des propriétés et classes supplémentaires
Les concepts
Entity Characteristic Measurement
Sample Population Polygon Quadrat Transect Individu
Date Area PopulationSize PopulationDensity SpatialPattern Criteria EnvironnementalVariable
SamplingProtocol Identification
Les ressources externes
• Wgs84_pos geo:lat geo:long geo:alt
• Dublin core dc:Location
• Foaf foaf:person
• Taxon concept txn:speciesConcept
txn:hasGBIF
txn: hasEOL
…
Measurement
Entity
Knowledge
ecoOnto
• Réflexion sur les concepts
• Etat de l’art sur les standards, les ontologies, les technologies
• Ontologie pas vraiment aboutie
– Rôle de NS ? Du comité scientifique ?
– Fin de projet
– Pas de validation des acteurs du domaine
ecoQuery
Extraire et exploiter
les données de
biodiversité
2010 2011 2012 2013
glossary ecoOnto-Med
Etude de la faisabilité du système ECO-INC
Quelles sont les
zones à protéger
en PACA?
Observations à
collecter pour répondre
à la question
Proposition de
zones à
protéger en
PACA
ecoRelevé Knowledge
Module de connaissances
Module de données
Recherche
des données
existantes
Etude de la faisabilité du système
Quelles sont les
zones à protéger
en PACA?
Observations à
collecter pour répondre
à la question
Proposition de
zones à
protéger en
PACA
ecoRelevé Knowledge
Module de connaissances
Module de données
Recherche
des données
existantes
LOD
Web de données et biodiversité +200 jeux de données 40 en biologie/15 en géographie
Des bonnes pratiques Identification des éléments par des URI Utilisation d'URI HTTP déréférençables Fournir des informations lisibles par les humains et les machines Ajouter des URI externes
http://datahub.io/dataset//
La plateforme ecoRelevé
http://naturalsolutions.github.io/ecoReleve/
ecoRelevé
Core Explorer
Data
Espèces
Temps
Localisation
Service
Web
La plateforme ecoRelevé
http://naturalsolutions.github.io/ecoReleve/
ecoRelevé Knowlege
Core Explorer
Data
Ontologie
Sparql
Service
Web
Espèces
Temps
Localisation
Étude de l’impact sur l’avifaune de la
restructuration des dispositifs de
protection contre les crues
Sénas - Cheval Blanc
Cas d’utilisation
Collecte de données (web, terrain)
• Occurrence des taxons
• Statut de protection
Détermination de l'importance du site pour l'avifaune
Démarche
Recherche des données
Web
Inventaire de l’avifaune
GeoNames : Communes de Cheval Blanc
Taxon Concepts : Occurrence d’espèces
Taxon Concepts : Dates
RDFization des
données de l’Avian
Knowledge Network
http://www.avianknowledge.net/
6 taxons
Inventaire de l’avifaune Collecte des données
Terrain 17 taxons
Import dans ecoRelevé Data
Acrocephalus
arundinaceus
(Linnaeus, 1758)
Rousserolle
turdoïde
Enrichissement
DBpedia
- statuts IUCN
- photos
Inventaire de l’avifaune
Enrichissement
GeoNames : Département du Vaucluse
AKN : occurrences
Dbpedia : statuts, photos
49 taxons
Utilisation des technologies du Web
Sémantique pour intégrer des données de
biodiversité
Mise à disposition de ces technologies pour
les acteurs de la biodiversité
Etude de la faisabilité du système
Bémol
Faible volume d’observations disponibles dans le LOD
Utilisation de l’ontologie de la biodiversité pour intégrer plus de données !
ecoOnto
Module de données
Et la suite ?
Les acteurs du domaine pas prêts pour accueillir ces nouvelles technologies
• Besoin de définir les concepts du domaine
• Besoin d’outils pour définir ces concepts et pour les utiliser
2 Projets
• ecoOnto-Med
• ecoRelevé glossary
ecoOnto-Med
Glossaire en ligne
trilingue pour un
développement durable
en Méditerranée
2010 2011 2012 2013
glossary ecoOnto-Med
ecoOnto-Med
Résoudre les problèmes d’interprétation et de traduction des connaissances scientifiques sur la biodiversité dans les pays arabophone
Glossaire trilingue (Français/Anglais/Arabe) de la biodiversité en Méditerranée
Besoins Etablir un glossaire Anglais – Français – Arabe
[Terme préféré – Définition – Références - Synonymes – Termes reliés]
Editable en ligne dans toute les langues (avec prise en compte de l’écriture droite-vers-gauche)
Mettre en place un workflow collaboratif d’édition des termes
Rédaction/Traduction/Validation
MediaWiki
Un moteur de Wiki open source
Wikipedia, Wikitionary, Wikimedia Commons (+4000 services)
• Ajouter, modifier, supprimer les contenus via un
navigateur
• Edition collaborative avec prise en compte de l’écriture droite-vers-gauche
• Gestion des droits
ecoOnto-Med
http://ecoonto.cmimarseille.org/
~150 concepts Blondel J., Aronson J., Bodiou J.Y. and Boeuf G. (2010); The Mediterranean
region: biological diversity in space and time
Edition via des formulaires
ecoOnto-Med
Sur les traces du projet ecoOnto … • Un glossaire de la biodiversité • Une édition collaborative
• Pas de relation en les termes • Pas d’utilisation de standards existants
Vers le web sémantique…
ecoRelevé Glossary
Un éditeur de
vocabulaires
contrôlés
2010 2011 2012 2013
glossary ecoOnto-Med
Gestion des données de biodiversité
Données de biodiversité
Annotation • Ajouter du sens auX
données
• Domaines de valeurs
• Design de protocoles
• Communication
Controlled vocabularies
Controlled vocabularies Vocabulaires
contrôlés
Données de Biodiv
Vocabulaires contrôlés
Communication
Données de Biodiv
Vocabulaires contrôlés
Communication
Données de Biodiv
Vocabulaires contrôlés
Communication
Communication
Données de Biodiv
Vocabulaires contrôlés
Besoins
Accompagner le
changement pour
interopérer avec le
monde Données de biodiversité
Controlled vocabularies
Controlled vocabularies Vocabulaires
contrôlés
Solution
Editeur de
vocabulaires
souscription
Extrait de
vocabulaires
extract
Données de biodiversité
Controlled vocabularies
Controlled vocabularies Vocabulaires
contrôlés
Solution
Editeur de
vocabulaire
souscription
Interopérabilité
Editeur de vocabulaires
Besoins • Web
• Open source
• Edition collaborative
• Gestion des versions
• Fédérer une communauté
• Importer and réutiliser des vocabulaires existants
• Compatible avec les technologies du sémantique Web
Extension de Semantic MediaWiki
Semantic MediaWiki
Une extension de MediaWiki ajoutant des
annotations semantiques
• Ajouter des propriétés à aux pages
• Interroger de manière sémantique
• Importer and réutiliser vocabulaires
• Exporter en RDF
ecoRelevé Glossary
Import des vocabulaires
•SKOS
•Dubin Core
•Bibo
•RDF/RDFS
1 page = 1 concept • URI déréférencées
• Propriétés extraites des vocabulaires pour
décrire les concepts
Glossary:concept
dcterms:identifier
skos:prefLabel
skos:altLabel
skos:definition
skos:exactMatch
bibo:document
Hiérarchie simple
Glossary:concept
rdf:type
skos:broader/skos:narrower
skos:hasTopConcept
Glossary:concept
Glossary:concept
Glossary:topConcept
Glossary:category
Fonctionnalités spécifiques
• Gestion des références
bibliographiques
• Navigation via fil d’ariane
• Import de vocabulaires SKOS
L’interface
Le connecteur Comment utiliser ces vocabulaires pour annoter les
données ?
1. Définir une thésaurus via la page de souscription
2. Un thesaurus = une requête sémantique à partir du glossaire
• un ensemble de concepts
• un ensemble de propriétés
3. Souscrire à ce thésaurus via la page des préférences utilisateur
4. Appeler ce thésaurus
• via le web
• via un client glossary
5. Voir les logs des événements à partir du menu utilisateur
• Initialisation
• Mise à jour
Définir le thésaurus
Souscrire
Client Glossary
Biodiversity data
Controlled vocabularies
Controlled vocabularies
Controlled vocabularies
ecoRelevé -
Glossary
getData Client Glossary
Gestion de la souscription
Logs
Export du Thésaurus/logs
Connexion à mon système
Une solution non
intrusive pour se
connecter au monde !
ecoRelevé Glossary
Un système de gestion de vocabulaires
Une solution pour se connecter aux vocabulaires
En développement !
Besoin de sensibiliser les acteurs du domaine à
l’annotation dans le contexte du partage de données
http://ecoreleveglossary.natural-solutions.eu/
Conclusion
Acteurs du domaine prêts
Données disponibles ***** • EOL
• GBIF
• wikidata
• …
Outil d’exploration • Datahub
Outil d’annotation sémantique • ecoRelevé Glossary
Merci !
Amandine Sahl [email protected]
www.natural-solutions.eu
http://www.ecobalade.fr/
http://sauvagesdepaca.fr/
http://www.natural-
solutions.eu/biodiversity-game