JOURNÉES IGEC – NOVEMBRE 2011
GESTION DE DONNÉES MULTI-ECHELLES
Pascal Neveu (INRA MISTEA – équipe Gamma)
Anne Tireau (INRA MISTEA – équipe Gamma)
Mathias Chouet (INRA EGFV / MISTEA – équipe Gamma)
Contact : [email protected]
OBSERVATIONS MULTI-ECHELLES
Site
Serre
PotZone, Placettebloc
Parcelle
OBSERVATIONS MULTI-ECHELLES
Site
Serre
PotZone, Placettebloc
PlanteOrgane
Tissus
Parcelle
OBSERVATIONS MULTI-ECHELLES
Site
Serre
PotZone, Placettebloc
PlanteOrgane
Tissus
Cellule
Génome
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
BASES DE DONNÉES EXISTANTES
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
SUITE D’OUTILS MUTUALISÉS
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
COUCHE LOGIQUE « ESPÈCE »
Plante
Cellule
Génome
Site
SerrePotZone, Placette
Parcelle
QUELQUES CARACTÉRISTIQUES DES DONNÉES MULTI-ÉCHELLES
La même donnée peut être observée à différents niveaux (simultanément ou pas)
« Priorité » au niveau le plus proche
Le nombre de niveaux peut varier
QUELQUES CARACTÉRISTIQUES DU MULTI-ÉCHELLES
Illustration :
Quel est le cumul d’eau entre deux stades phénologiques ?
Quel est le nombre de jours dépassant 35 degrés entre les dates de semis et de récolte ?
Quelles sont les situations où des plantes ont reçu moins de 10 mm d'eau, durant les 200 degrés jours avant la date de floraison ?
QUELLES SONT LES SITUATIONS OU DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
Pour chaque année et chaque plante observée en parcelle ou en serre :
1. Obtenir le génotype2. Obtenir la date de floraison 3. Déterminer la période pour 200 degrés
jours 4. Calculer le cumul d’eau sur cette période5. Filtrer les plantes qui ont reçu moins de
10 mm d’eau6. Retourner la liste des plantes…
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
Pour chaque année et chaque plante observée en parcelle ou en serre :
1. Obtenir le génotype2. Obtenir la date de floraison 3. Déterminer la période pour 200 degrés jours 4. Calculer le cumul d’eau sur cette période5. Filtrer les plantes qui ont reçu moins de 10
mm d’eau6. Retourner la liste des plantes…
Problème : à quel niveau ces données sont observées
comment y accéder dans des bases de données relationnelles !
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
Site
PlacetteSous-placette
Plante
Parcelle
Date de Floraison Irrigation
Pluie
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
Pour une base de données relationnelles :o Nécessite des développements
informatiques
Pour plusieurs bases de données relationnelles : une bonne généricité Appréhender de nombreuses sources de
données Gérer des volumes de données importants
=> Devient problème informatique difficile
MÉTHODE PROPOSÉE : UNE APPROCHE PAR GRAPHE SÉMANTIQUE
Parcelle Plante
Organe
Cellule
Tissus
MÉTHODE PROPOSÉE : UNE APPROCHE PAR GRAPHE SÉMANTIQUE
Parcelle Plante
Organe
Cellule
contient
estConstitué
estConstitué
Tissus
estConstitué
INFÉRENCE ( UTILISATION DE LA TRANSITIVITÉ)APPROCHE PAR GRAPHE SÉMANTIQUE
Parcelle Plante
Organe
Cellule
contient
estConstitué
estConstitué
Tissus
estConstitué estConstitué
estConstitué
Site
Parcelle
Placette
Plante
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
Pluie
IrrigationDate de floraison
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE ENTRE LES ÉCHELLES
Site
Parcelle
Placette
Plante
contient
contient
contient
Pluie
IrrigationDate de floraison
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : LES ÉVÉNEMENTS
Site
Parcelle
Placette
Plante
contient
contient
contient
Pluie
IrrigationDate de floraison
se produit
se produitse produit
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE
Pech-Rouge
La Clape
contient
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE
Pech-Rouge
La Clape
PLA_18
contient
contient
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE
Pech-Rouge
La Clape
PLA_18
PL_P18_22
contient
contient
contient
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE
Pech-Rouge
La Clape
PLA_18
PL_P18_22
contient
contient
contient
Floraison_PLA_18
se produit
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : EXEMPLE DE PECH-ROUGE
Pech-Rouge
La Clape
PLA_18
PL_P18_22
contient
contient
contient
Pluie_11/04/11
Irrig_15/06/11Floraison_PLA_18
Irrig_10/05/11
se produit
se produit
se produitse produit
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
GÉNÉRATION DU GRAPHE SÉMANTIQUE : APRÈS INFÉRENCE
Pech-Rouge
La Clape
PLA_18
PL_P18_22
contient
contient
contient
Pluie_11/04/11
Irrig_15/06/11Floraison_PLA_18
Irrig_10/05/11
Irrig_15/06/11
Irrig_10/05/11
Pluie_11/04/11
Floraison_PLA_18
se produit
se produit
se produitse produit
se produit
se produit
se produit
se produit
GRAPHE EST FORMALISÉ (RDF/RDF-S/OWL)
Etapes :
Le moteur Corese (INRIA) charge graphe Les règles suivantes sont appliquées : Transitivité de contient Si un Evénement E se produit sur A et A
contient B Alors E se produit sur B.
Production du graphe inféré
Interrogation du graphe inféré (SPARQL)
QUELLES SONT LES SITUATIONS OÙ DES PLANTES ONT REÇU MOINS DE 10 MM D'EAU, DURANT LES 200 DEGRÉS JOURS AVANT LA DATE DE FLORAISON ?
Approche « graphe sémantique »1. Pour chaque plante et année :
1. Obtenir le génotype2. Lire la date de floraison au niveau de la plante3. Déterminer la période pour 200 degrés jours 4. Calculer le cumul d’eau sur cette période au niveau de
la plante5. Filtrer les plantes qui ont reçu moins de 10 mm d’eau6. Retourner la liste des plantes…
PL_P18_22
Irrig_15/06/11
Irrig_10/05/11
Pluie_11/04/11
Floraison_PLA_18
se produit
se produit
se produit
se produit
PERSPECTIVES
Affiner les concepts et les relations sémantiques
Elargir le nombre de concepts
Passer d’un prototype à un produit diffusable
Valoriser rapidement au sein de projets et de réseaux
Accompagner la diffusion
Implémenter des fonctionnalités pour permettre la répartition.
CONCLUSIONS
Généricité grâce à la séparation entre connaissance et traitements(formalisation des concepts et des règles)
Méthode pour sources hétérogènes
Favorise la mutualisation et les collaborations
Précision et efficacité accrues des interrogations dans un contexte multi-échelles.