evolution des catalogues : métadonnées, interopérabilité, web sémantique, frbr et rda ens lyon...
TRANSCRIPT
Evolution des catalogues :Métadonnées, Interopérabilité, web sémantique, FRBR et RDA
ENS Lyon
17 au 19 juin 2013Thierry Clavel et Philippe Bourdenet
Programme
Introduction : le contexte
1. Problématique de l’interopérabilité des données en bibliothèque Paysage applicatif Exemple d’interopérabilité : le SCD du Maine Pourquoi changer ? : Enjeux du Web de données pour les
bibliothèques
2. Métadonnées : jeux et formats Expression des données en XML Dublin Core, MODS, ONIX, TEI, EAD METS, LOMFR
3. Interopérabilité des systèmes Notion de modèle conceptuel
4. Web sémantique et Web de données
5. FRBR et FRAD
6. RDA et le catalogage FRBerisé
Introduction : Le contexte
Bibliothèque scientifique numérique (BSN)
Une « très grande infrastructure de recherche » créée en 2009
Un projet qui fédère l’action des acteurs de l’enseignement supérieur et de la recherche basé sur la coopération
9 segments (axes) BSN 1 à BSN9
Projet d’établissement de L’ABES 2012-2015
Le projet compte 8 axes dont : Missions de l’ABES : mutualisation « acquérir, signaler,
diffuser » Signalement des ressources électroniques
« priorité absolue » Projet SGBM Hub de métadonnées de la recherche Faire évoluer les catalogues
2012 : Lancement de 2 études en parallèle
Etude du cabinet pléiade sur les outils découverte Conclusions : La mutualisation devrait porter sur les données : base
de connaissances nationale intégrée à GOKB Se doter d’un localisateur national
Etude du groupe de travail SGBM 3 scénarios
Choix du CA de l’ABES du 31/5/2013
SGBM : Choix du scénario 2 Migration des établissements volontaires vers le
SGBM Maintien de CBS pour le catalogage (transferts
réguliers vers le SGBM) Étude complémentaire de 6 mois pour le
remplacement de CBS Etude Pléiade
Développement d’un localisateur national
Hub de métadonnées de la recherche
•Partenariat ABES-CNRS
•Récupération des métadonnées commerciales ou institutionnelles sous n’importe quel format
•Dédoublonnage, Conversion et Redistribution des métadonnées « enrichies » vers les bibliothèques du réseau
•Partenariat ABES-CNRS
•Récupération des métadonnées commerciales ou institutionnelles sous n’importe quel format
•Dédoublonnage, Conversion et Redistribution des métadonnées « enrichies » vers les bibliothèques du réseau
que dit le projet sur FRBR et RDA et les données ?
« L’ABES poursuivra dans la voie de l’ouverture et de l’interopérabilité de ses données sur le web. Elle expérimentera la mise en oeuvre du modèle FRBR en concertation avec la BnF dans la perspective de l’implémentation du code de catalogage RDA »
Ouverture des données (open data) vers une interopérabilité technique et juridique
Mouvement international Plateforme française d'ouverture des données publiques
data.gouv.fr Exposition des données en RDF ABES : licence ouverte (LO) recommandée par la
mission ETALAB pour les données produites par le réseau
BnF : idem pour : Catalogues Gallica Data.BnF.fr
Le comité stratégique bibliographique (CSB)
Composition : ABES, BnF et leurs tutelles Nouvelles orientations du paysage bibliographique
français : Exposer les métadonnées des catalogues nationaux
sur le Web de données FRBRiser les catalogues (BnF et SUDOC) Permettre un catalogage FRBRisé en révisant les
normes AFNOR (2015) Préparer l’adoption de RDA pour ne pas s’isoler du
contexte international et européen rapport d'orientation du 13 novembre 2012
FIN de l’introduction
Open URL et les résolveurs de liens
OPEN URL : protocole de métadonnées permettant de faitre des liens contextuels
Résolveur de liens : outil informatique implémentant la norme OpenURL et faisant le lien entre une citation bibliographique et le texte intégral, en fonction des abonnements de l'établissement.
Discovery tools (outil découverte)
Logiciel avec fonctions de recherche et facettes Réservoir unique
Rapidité des résultats Indexe texte intégral et métadonnées de différentes
bases Base de connaissance Autres fonctions : fourniture de documents, résolveur de
liens Problème récurrent : bruit et pertinence des résultats
Pourquoi changer nos catalogues ?
ou
Les enjeux du Web de données pour les bibliothèques
Les catalogues de bibliothèques, monde merveilleux ?
On a déjà des normes de catalogage (ISBD, AFNOR…) des formats MARC pour saisir et récupérer des
notices… Des SIGB qui fonctionnent… Des OPAC et des catalogues
collectifs accessibles sur le Web…
Alors, pourquoi vouloir changer ?
Mais d’abord, est ce que nos catalogues conviennent aux usagers?
1 – changer pour l’usager1 – changer pour l’usager
Source : Sylvain Machefert
Source : Sylvain Machefert
1 - changer pour L’usager
L’usager est avant tout un internaute : Il veut tout et tout de suite Il veut des contenus précis (un article, une chanson, etc.) Il recherche en priorité sur le Web (et pas spécialement dans des
catalogues) Il consulte les catalogues en recherche simple à la « google »
Il faut donc : Faire évoluer nos catalogues pour les adapter à l’usager
Ils ramènent trop de réponses (bruit) sans les classer Il faut structurer les résultats de recherche pour afficher des
réponses pertinentes Aller vers l’usager Pousser les contenus et les données des bibliothèques vers les
usagers/internautes donc sur le Web
Data.bnf.fr
Autre exemple
catalogue collectif ciné-ressources
http://www.cineressources.net/recherche_t.php
« Super » Notice d'autorité « nom de personne »
C'est pas merveilleux,Cette page de résultats ?!
Expérimentation OPENCAT
Pourquoi Les catalogues de bibliothèques ne sont ils pas visibles sur le Web ?
Le Web ne parle pas MARC Le Web a ses propres normes
Et surtout …
2 – changer pour être sur le Web
2 – changer pour être sur le Web
http://www.flickr.com/photos/markhillary/3774707075/
http://www.flickr.com/photos/markhillary/3774707075/
http://www.flickr.com/photos/75905404@N00/5088208539/
http://www.flickr.com/photos/75905404@N00/5088208539/
Les catalogues sont dans le Web profond
Les catalogues sont dans le Web profond
Les catalogues de bibliothèques sont dans des bases de données (silos) qui ne sont pas indexées par les moteurs de recherche
Les catalogues de bibliothèques sont dans des bases de données (silos) qui ne sont pas indexées par les moteurs de recherche
2 - Changer pour être sur le Web
Pourquoi adopter les standards du Web sémantique ? pour sortir du Web profond et de notre « niche » technologique
des formats MARC pour évoluer avec le Web pour que la maintenance
de nos catalogues coûte moins cher
Interopérabilité
+++Interopérabilité
+++
3 - Changer pour rationaliser et enrichir le travail de catalogage
Récupérer des données produites ailleurs Par exemple les biographies de Wikipedia
pour les auteurs
Ne pas avoir à répéter les mêmes informations Réutiliser les données du catalogue
Par exemple : l’indexation matière
Indexation matière dans le SUDOC :
Une indexation-matièrerecréée pour chaque notice
4- Changer pour que nos données soient réutilisées
créer des « Données liées ouvertes »
Eclater nos notices en données réutilisables
pour que n’importe qui puisse réutiliser n’importe lesquelles de nos données de n’importe quelle manière
Quels outils pour le changement ?
Un code de catalogageUn code de catalogage
Des modèles conceptuels pour Structurer l’information bibliographique
Des modèles conceptuels pour Structurer l’information bibliographique
Des Technologies et normes garantissant l’Interopérabilité du Web de données
Des Technologies et normes garantissant l’Interopérabilité du Web de données
Un espace global d’information, ouvert, qui permet de lier, exploiter, mettre à disposition,réutiliser les données sur le Web
Un espace global d’information, ouvert, qui permet de lier, exploiter, mettre à disposition,réutiliser les données sur le Web
Web de donnéesWeb de données
Métadonnées : Tentative de définition
- données sur (à propos) d’autres données
- Information structurée qui sert à décrire, trouver, localiser, gérer, ,,, des ressources
Types de Métadonnées
Métadonnées descriptives Titre, auteur, résumé, mots clés, etc,
Métadonnées de structure Chapitres d’un livre, organisation d’un texte
Métadonnées de gestion (administratives) gestion des droits (propriété intellectuelle) Archivage et conservation Techniques : format, type, accès aux ressources, etc,
37
Métadonnées ou notice ?
Métadonnées internes ou externes à une ressource
Formats de Métadonnées
- Métadonnées existent dans tous les secteurs d’activité
- Nombreux formats- Problème d’interopérabilité
Dublin core : un exemple de métadonnées
Dublin Core
Jeu de métadonnées descriptives normalisées : devenu une norme ISO (15836) en 2003, maintenu par le DCMI (Dublin Core Metadata Initiative).
Objectif d’origine:décrire les ressources électroniques sur Internet dans un contexte HTML pour faciliter la recherche , avoir des métadonnées communes à plusieurs communautés
Caractéristiques du Dublin Core :
Simplicité : 15 éléments seulement
Souplesse d’utilisation : tous les éléments sont facultatifs et répétables
Utilisable dans différents formats : HTML, XML, etc.
Les 15 éléments de base du Dublin Core
1. Title : titre de la ressource2. Subject : mots-clés ou language documentaire3. Description : présentation du contenu (résumé, table des matières,
etc;)4. Source : référence à une ressource dont la ressource décrite est
dérivée5. Language : langue utilisée dans la ressource6. Relation : référence à une ressource apparentée7. Coverage : couverture spatio-temporelle (périmètre ou domaine
d’application de la ressource)8. Creator : auteur principal9. Contributor : responsabilité secondaire10. Publisher : éditeur (mise à disposition de la ressource)11. Rights : gestion des droits12. Date : date d’un événement dans le cycle de vie de la ressource13. Type : catégorie, fonction ou genre de la ressource (contenu
sémantique)14. Format : format, taille de la ressource15. Identifier : identifiant (URL, ISSN etc.)
Dublin Core qualifié et non qualifié
Dublin Core non qualifié : utilisation des 15 éléments seulement
Dublin Core qualifié : Utilisation d’un Référentiel plus complet : Dubin Core metadata termsPossibilité de choisir d’autres éléments et des schémas d’encodage.
• http://dublincore.org/documents/dcmi-terms/
Exemples de DC qualifié: 1. qualificatifs de raffinement (création de nouveaux éléments)
<meta name="dc.identifier.URI" content=« http://www.enssib.fr">
2. schéma d’encodage (association d’un élément à un référentiel) <meta name="dc.subject" scheme = « DDC » content= « 025.314 »>
Exemple pour un site Web
Exemple de notice OAI (métadonnées Dublin Core)
<record>
<identifier>oai: 2450</identifier>
<dc:title> Accueillir, orienter informer </dc:title>
<dc:creator> Bertrand Calenge</dc:creator>
<dc:type>Monographie imprimée</dc:type>
…
</record>
DC Profil bibliothèques
http://dublincore.org/documents/library-application-profile/
Avantages du Dublin core
Simplicité Reconnaissance internationale : norme ISO Utilisation grandissante grâce au protocole OAI
PMH
Limites du Dublin Core
Globalement encore peu utilisé à l’échelle du Web
simplicité à double tranchant 15 éléments de base : insuffisant pour décrire des
ressources complexes
Exercice Dublin Core
Transposer en DC simple la notice MARC suivante
MODS Metadata Object Description Schema
MODS
Schéma XML développé par la Bibliothèque du Congrès pour décrire tout type de ressource
Métadonnées descriptives Adaptation simplifiée du MARC 21 Indépendant d’un code de catalogage Plus riche que le Dublin Core Mappings facilités vers différents jeux de
métadonnées : MARC, DC, RDA, ONIX
MODS
Exemples : http://www.loc.gov/standards/mods/userguide/
examples.html
Vocabulaire MODS en RDF http://www.loc.gov/standards/mods/modsrdf/
MODS
A quoi sert MODS ? Décrire des ressources Échanger des métadonnées MARC avec d’autres
jeux de métadonnées Compatibilité OAI PMH et SRU
Qui utilise MODS en France ? DAPHNE (Données en Archéologie, Préhistoire et
Histoire sur le NEt) Portail Musique contemporaine
ONIX Online Information eXchange
Format de métadonnées en XML de la chaîne éditoriale commerciale éditeurs, diffuseurs libraires
2 schémas ONIX for books ONIX for serials
Fait pour l’échange
ONIX for books
Guide ONIX avec aperçu et éléments (version en français 2009)
200 éléments : En tête : expéditeur et destinataire 6 blocs :
description du produit Enrichissement marketing Détail du contenu Conditions de publication Matériels liés (dont autres œuvres) Conditions d’approvisionnement
ONIX
Utilisation d’ONIX en France : Electre / cercle de la librairie
Produit ses données en ONIX
ONIX, FRBR RDA et le Web sémantique Mapping RDA/ONIX framework Production de données FRBrisées en ONIX possible ONIX n’est pas disponible sur le Web de données (en
juin 2013)