sémantisation des données pour le monde environnemental
DESCRIPTION
Sémantisation des données pour le monde environnemental. Danielle Ziébelin Philippe Genoud LIG STEAMER Université de Grenoble [email protected]. Données environnementales. Que sont les données environnementales : Collections : spécimens, échantillons, prélèvements … Études Écologiques - PowerPoint PPT PresentationTRANSCRIPT
1
Sémantisation des données pour le monde
environnemental
Danielle ZiébelinPhilippe Genoud
LIG STEAMER Université de [email protected]
2
Données environnementales
• Que sont les données environnementales :– Collections : spécimens, échantillons, prélèvements …– Études Écologiques– Séquences génomiques– Analyses d’images, LIDAR– Monitoring de la biodiversité
• Quels sont les traitements :– identifier, comparer, évaluer les populations ou des
quantités, localiser et dater des données et/ou des analyses
• Les données de la biodiversité sont – Globalement distribuées et volumineuses– Hautement hétérogènes au niveau de leur structure et leur
contenu– Augmentent rapidement
3
Le web sémantique peut aider à l’intégration et au partage de données
• Métadonnées– Directive Inspire– Directive SEIS (Shared Environmental Information System )– Iso 19115, 19119,19110 …
• Vocabulaires contrôlés– LTRE (Linked Thesaurus fRamework for Environement), – EARTh (Environmental Applications)– Thésaurus Ecoplanète (ministère Ecologie), – Thesaurus AnaEE-France, – EnVoc (en relation avec Convention sur la biodiversité),– …
• Ontologies– OBOE (Extensible Observation Ontology)– SERONTO (Socio-Ecological Research and Observation oNTOlogy)– SWEET (Semantic Web for Earth and Environmental Terminology)– SSN ontology (Semantic Sensor Network Ontology)– Envo (Environment Ontology),– …
4
Charactéristiques communes des architectures du web sémantiques (1)
Collecter de nouvelles données
Web
Applications WEB applications pour des utilisateurs avec un GUI adapté
Accéder à des ressources :
données ou des connaissances
Services WEB configurés pour ajouter de l’information
Quelles sont les ressources en eaux
que je peux allouer à un projet d’extraction pétrolière et gazière ?
Quelle est l’évolution de
cet écosystème
(eau, sol) par rapport au
réchauffement climatique ?
5
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
Exemple d’Architecture MAP-EON
6
RDF Graph
MapEON serverLOD Cloud
Query Processor (SPARQL)
Adaptator1 Adaptatorn
…
…
Data Loader
Ontology manager
Ontology Loader
OWL reasonerOWL DL
ontologies
MapEON Client
Triplestore
7
Exemple d’architecture ObsBD
“Lightweight Ontology-Based Tools for Managing Observational Data” Shawn Bowers, Riley Englin, Carlos Fonseca, Paul Jewell, Lauren Joplin, Patrick Mosca, Tyler Pacheco, Jacob Troxel, Tyler Weeks, Proceedings of the First International Workshop on Semantics for Biodiversity Montpellier, France, May 27, 2013
8
Technologies de Web Sémantique
•Données et Ontologies– Ontologies (RDFS/OWL )– Annotations (RDF)– Déduction (Pellet, Hermit,
BraidComposer …)– Requêtes (SPARQL)
• Services– WFS - WPS– Web services sémantiques
9
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
10
Données de MAP-EON • tabular data (excel file)
Measure
MeasureDescriptor
location
site type
Site Measures Set
Region
11
Modèle de données de l’application
Quelques classes et relations qui décrivent les concepts utilisés dans l’application
Owl class defining the rdf:type of the individual
Graphe RDFLes données sont transformées en un graphe RDF qui utilise le
vocabulaire défini dans le modèle d’application.
12
subject predicate objectobject property
individual(resource
identified by an URI)
RDF Resource Description Framework (W3C standard)
individual
literal valuedata property
rdf:type
:region
:has
Mea
sure
Set
:contains
:value
:descriptor
:symbol:unit
wgs84_pos:lon
wgs84_pos:lat
rdf:type
rdf:type
rdf:type
rdf:type
rdf:type
RDFS and OWL add semantic to RDF
13
Exemple d’ontologie de Domaine
Hydrologic Ontology for Discovery (http://his.cuahsi.org/ontologyfiles.html)The purpose of this ontology is to support the discovery of time-series data collected at a fixed point, including physical, chemical, and biological measurements.
• Le graphe peut être enrichi en exploitant une ontologie de domaine
14
Modèle de l’application + Ontologie de domaine
:region
:has
Mea
sure
Set
:contains
:value
:descriptor
:symbol:unit
wgs84_pos:lon
wgs84_pos:lat
rdf:type
rdf:type
rdf:type
rdf:type
rdf:type
domain ontology
rdf:type
• Le graphe peut être enrichi par des éléments de l’ontologie de domaine
Weight Mass Unit
Biomass
usesStandard
Gram
is-a
Bio.EntityTree
Leaf LitterTree Leaf Wet Weight Dry Weight
Observation
Measurement
Site Species Ind Mass
GCE6 Picea Rubens 1 75.13
GCE6 Picea Rubens 2 179.81
GCE7 Picea Rubens 1 443.20
… … … …
Data
Structural Metadata
<attribute id=“att.4”> <attributeName> Mass </attributeName></attribute>
hasMeasurement
OBOE Semantic Annotation
Domain-Specific Ontology
is-a is-ais-a
is-a
has-part
hasCharacteristicis-a
part-of is-a
ofEntity
usesStandardofCharacteristic
SONet: Scientific
Observations Network
Dr. Mark SchildhauerDirector of Computing
NCEAS, UCSB USA
Ontologie d’observations : OBOE
16
hasValue
Multiples modèles pour les observations : Exemples O&M, PATO/EQ, ODM, OBOE“core concepts” décrit : Entities, properties measured, units, protocols, etc.
Extensible OBservation Ontology (OBOE)
Entity
Characteristic
Observation
Measurement
Protocol Standard
hasMeasurement
ofCharacteristic
usesProtocol usesStandard
ofEntity
hasContext
1..1*
1..1
*
*
*
1..11..1
1..1**
**
Value
1..1
Observations et mesures : ISO 19156O&M : dépences directes • Feature ISO 19109• Geometry ISO 19107• Temporal ISO 19108• Coverage (fields) ISO 19123• Metadata ISO 19115-12• Meta-model ISO 19150-2• Basic datatypes ISO 19103
O&Min OWL | Simon CoxCox, OGC Abstract Specification – Topic 20: Observations and Measurements 2.0ISO 19156:2011 Geographic Information – Observations and measurements
17
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
18
Types d’ontologies : différents objectifsCatherine Roussey (ISTREA)
• Ontologies terminologiques :– Interopérabilité lexicale
• Ontologies de données : – Interopérabilité sur les données
• Ontologie Logique – Interopérabilité d’objets
19
Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)
• Ontologies terminologiques : Interopérabilité lexicale
Concept/ Class
Term
Object/Instance
Relation
hasLabel
Property
Semantic Relation
Object Relation
Linguistic Relation
Textual DefinitionLogical Definition
isInstanceOf
hasArgument
hasName hasArgument
hasArgument
hasN
ame
hasName
*
*
*
1
** 11
* *
**
*
20
Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)
Concept / Class
Term
Object/Instance
Relation
hasLabel
Property
Semantic Relation
Object Relation
Linguistic Relation
Textual DefinitionLogical Definition
isInstanceOf
hasArgument
hasName hasArgument
hasArgument
hasN
ame
hasName
*
*
1
** 11
* *
**
*
• Ontologies de données : Interopérabilité sur les données
21
Types d’ontologies : différents objectifsCatherine Roussey (IRSTEA)
• Ontologie Logique : Interopérabilité d’objets / de concepts
Concept / Class
Term
Object/Instance
Relation
hasLabel
Property
Semantic Relation
Object Relation
Linguistic Relation
Textual DefinitionLogical Definition
isInstanceOf
hasArgument
hasName hasArgument
hasArgument
hasN
ame
hasName
*
*
*
1
** 11
* *
**
22
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
23
:region
:has
Mea
sure
Set
:contains
:descriptor
Individual :region Object Property
Owl class defining the rdf:type of the individual Data Property
legend
Lier les données au LOD cloud• Lien avec l’ontologie de domaine• Lien avec des jeux de données ouvertes
domain ontology
application ontology
rdfs:seeAlso
corresponding geonames resource
rdfs:seeAlso
corresponding DBpedia resource
24
Lien avec le LOD cloud• Liens avec les descriptions RDF de geonames
http://sws.geonames.org/5892587/
resource URI
RDF description
geonames resourcedescribing Northwest Territories
25
Lier des données de différentes sources
• Lier des entités et les caractéristiques de 2 ontologies : Utilise des axiomes d’inclusion et d’équivalence de OWL– Équivalence :
• propriété owl:equivalentClass • propriété owl:equivalentProperty• propriété owl:sameAs• …
• Généralisation/Spécialisation : • rdfs:subClassOf• rdfs:subPropertyOf
26
Querying Data trough Ontology
Query
MultiMedia Source
Observation Data Base
Observation Data Base
Mapping
LocalSchema
LocalSchema
LocalOntology
GlobalOntology
27
Caractéristiques communes des architectures du web sémantique
• Intéroperabilité et intégration de différentes ressources
• Données structurées ou non structurées– Documents– Data-bases
• Données spatio-temporelles hétérogènes– Multi-sites avec multi-acteurs– Multi-modèles – Multi-formats
28
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
29
Requêtes sémantiques• Accéder à des informations inférées depuis l’ontologie de
domaine• Accéder à des informations supplémentaires au travers de
données liées (linked data)
30
Requêtes sémantiques
• Interroger les données avec des données inférées (SPARQL)
31
Plan
• Introduction et objectifs• Architecture• Données et modèles de données• Ontologies• Lier les données• Requêtes sémantiques• Conclusions
32
Retour d’expérience sur les pratiques
• Au niveau local : sources de données : – Amélioration de la qualité des données– Publication des sources de donnée avec les
métadonnées– Recherche de documentation et de liaison des
données– Architecture complexe avec des modules
nouveaux : cartographie et du spatio-temporel
• Au niveau communautaire– Standards ISO, OGC– Propriété intellectuelle, information privée et
partagée, accès publique, VGI, licences.– Infrastructures et portails.
33
Retour d’expérience : les outils
• Recherche et création de liens– outils existants
• e.g. SILK A Link Discovery Framework for the Web of Data, http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/)
– exploitation de l’information spatiale et temporelle
• Publication des données– outils génériques pour transformer des jeux de
données en RDF• dataLift http://datalift.org/ , • open refine (former google refine) http://openrefine.org/ )
34
Travaux connexes
– GEO BON Biodiversity Observation Network within GEOSS Global Earth Observation System of Systems, Portal (global)
• Worldwide voluntary effort • GEOSS Earth Observation infrastructure
– GEO portal : web portal, search registries– GEOSS components and services registry (catalogue)– GEOSS clearinghouse (connects the differents
components)– GEOSS standards and interoperability (catalologue of
standards)– http://www.geoportal.org/web/guest/– http://wiki.ieee-earth.org/Documents/GEOSS_Tutorials/
• GEOSS Water Services
35
Travaux connexes
• Shared Environmental Information System (Europe) http://ec.europa.eu/environment/seis/
• Semantic Web for Earth and Environmental Terminology (SWEET), http://sweet.jpl.nasa.gov/sweet/
• Extensible Observation Ontology (OBOE) https://code.ecoinformatics.org/code/semtools/trunk/dev/oboe/oboe.1.1rc1/oboe-core.owl
• SemantEco/SemantAqua : Rensselaer Polytechnic Institute (D. McGuinness) http://tw.rpi.edu/web/project/SemantEco
• ObsDB : Gonzaga University Washington