certification du service de catalogue vizier
TRANSCRIPT
Certification du service de catalogue VizieR
Journées Nationales de la Science Ouverte
Paris, 05/11/2018
Gilles Landais
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 2
What is VizieR ?
Le service VizieR est le service “catalogue” du CDS
Le service VizieR existe depuis 1995. ● Services web libre d’accès à des données publiques● Prend en charge le préservation des données pour
le long terme
Le CDS (Centre de Données de Strasbourg) existe depuis 1972. Il a pour mission de collecter des données utiles sur des objets astronomique et de les distribuer à la communauté scientifique.
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 3
Contenu de VizieR
Services en lignes
● Comprend un moteur de recherche
● Des services d’accès aux données interopérables dans la communauté
● Développe des outils d’extraction : interrogation des tables, visualisation (images, série temporelles)
Origines des données
● Données issues des journaux de référence en astronomie (soumis à referee)
● Données issues des centres spatiaux
VizieR en chiffres
~17,900 catalogues, ~39,000 tables
Données associées
~500 cat. avec des spectres ~200 cat. avec des images
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 4
Le principe FAIR dans le processusd’ingestion VizieR
Principes appliqués au processus d’ingestion des données ciblé par la certification
● Préservation des données : format, redondance, métadonnées minimales
● Contrôle de qualité
● Ajout des métadonnées en cours de la discipline pour l’interopérabilité
● Indexation globale des données
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 5
Le context
Contextefavorable
Préservation des données
Communauté prête au partage
Formats
- Sites miroirs- Backup local
- Format pérenne: ascii, FITS- Homogénisation des formats
Documentation
- Identifiant pérenne- Métadonnées (tables, colonnes, ..)
Certification
Soutient des autorités
- CNRS/INSU et l’Université - Conseil Scientifique
- WDS- DSA (2014-2017)
Longévité du CDS
- Observatoire VirtuelFAIR
FAIR
FAIR
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 6
La certification CTS
Pourquoi la certification CTS?
● Le CTS est le produit de la fusion de WDS et du DSALe CDS est membre de WDS (2012), VizieR est certifié par le DSA (2014)
● Réponse aux exigences de préservations s’imposant aux projets scientifiques(16 critères adaptés - ex : licences, mission, expertise scientifiques...)
● Certification reconnuePeut figurer dans les “Data Management Plans”
● Réponse au concept FAIR
● Processus de certification adapté avec les capacités du CDS (plus léger à mettre en œuvre qu’une norme ISO)
+
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 7
Mise en oeuvre de la demande de certification
Pour VizieR, la certification est essentiellement un travail de rédaction et de documentation du Système d’Information.
Un travail d’équipe qui a rassemblé les différents métiers du CDS :
● documentalistes
● ingénieurs (système et logiciel)
● astronomes
● la direction
Rédaction des réponses accompagnées d’une description du Système d’Information selon la norme OAIS
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 8
Description du Système d’Information
OAIS: Open Archive Information System (norme OAIS, ISO 14721)
Définit un modèle de référence ainsi qu’un cadre rédactionnel pour décrire un système d’information (inclus la description de l’architecture, de l’organisation des données et des ressources humaines).
Concepts OAIS
● Les paquets d’informations : contiennent les données + les métadonées
– SIP : Submit Information Package
– AIP : Archival Information Package
– DIP : Diffusion Information Package
● Cartographie du SI en 6 domaines fonctionnels : les entités OAIS
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 9
Le Système d’information VizieR traduit en modèle OAIS
RDA - Certification du service de catalogue VizieR - 5 déc. 2018 10
Conclusion
● Un travail qui permet de se poser de bonnes questions
● Amélioration du Système d’Information : page de crédits, checksum, nouveaux identifiant pérennes (ORICID, DOI), ...mais aussi des amélioration technique pour la gestion des backup/miroirs...
● Les données préservées pour le long terme n’évoluent pas, mais les métadonnées évoluent : la durée de certification limitée à 3 ans est en accord avec le principe de préservation des données dans un contexte changeant
● Les (nouveaux) critères du CTS s’adaptent bien à VizieR et au contexte global de réutilisation et d’interopérabilité en astronomie
● Le modèle OAIS présente un bon cadre rédactionnel,notamment pour décrire le cycle du couple données/métadonnées