jabes 2015 - convergences ead : ourils, référentiels, interopérabilité / jean-marie feurtet...
TRANSCRIPT
Convergences EAD
Journées ABESMercredi 27 mai 2015
1
Au sommaire
• Contexte et existant : usages et outils EAD dans les bibliothèques françaises
• Convergences BnF-ABES : – bonnes pratiques EAD– hypothèse d’outil national EAD– données : interopérabilité de l’EAD et dialogue
avec d’autres communautés usagères
2
3
I. Contexte et existant
• Intérêt de l’EAD pour décrire certaines collections majeures conservées en France
• Du point de vue des fonds• Du point de vue des usages• Une pratique désormais bien implantée en France et à
l’étranger• Nécessité d’un dispositif de signalement à la hauteur de
cette « maturité » de l’EAD.
L’EAD, pour quoi faire ?
Jalons historiques : avant EAD
5
• Informatisation précoce en bibliothèques : besoin de décrire des corpus documentaires organisés1983 : norme APPM (Archives, personal papers and
manuscripts)1986 : format MARC AMC (Archives and Manuscript
Control) pour décrire des corpus (uniquement de manière globale)
• Normalisation plus tardive en archives 1993 - 1998 : groupe de travail SAA (Society of American
Archivists), choix du métalangage SGMLEAD V 1.0 (SGML) publiée en 1998EAD V. 2.0 (XML) en 2002, respect complet de la norme
ISAD(G)
Jalons historiques : EAD
• Naissance d’une DTD :– 1993 - 1995 : projet mené à la Bibliothèque de l’Université
de Californie à Berkeley par un groupe informel d’experts– 1998 : première version– 2002 : deuxième version, actuellement utilisée
• Arrivée en France : – 1999 : premiers tests dans les services d’archives– 2002 : en archives, recommandations de la DAF sur XML et
EAD ; en bibliothèques, choix de l'EAD pour la conversion du CGM (Catalogue Général des Manuscrits des bibliothèques publiques de France)
L’EAD aujourd’hui• Maintenance technique : par la Bibliothèque du congrès
– Héberge le site officiel de l’EAD http://www.loc.gov/ead/
– Met à disposition les outils nécessaires pour travailler en EAD:– fichiers correspondant à la DTD– dictionnaire des balises en anglais– liste de diffusion, etc.
• Maintenance intellectuelle : par le sous-comité technique EAD de la Société des archivistes américains (SAA) : mises à jour de l’EAD
• En France : le groupe AFNOR de l’EAD : – Correspondant national du sous-comité EAD de la SAA– Traduit la documentation
Projets pionniers en France : rétroconversions CGM et Palme• CGM : Catalogue général des
manuscrits des bibliothèques publiques de France – 106 tomes en 116 volumes
(1849-1993)– 72 000 pages : 182 000 notices,
près d’1 million d’entrées d’index– 519 institutions représentées :
BM, BU, grands établissements, dépôts d’archives
• Palme : Base bibliographique des manuscrits littéraires français du 20ème siècle – 122 000 notices rendues en 461
fichiers (pour 439 institutions), dont 1/3 ESR (42 775 notices)
8
Cliché BnF
L’outillage EAD existant (BnF, ABES…)
- Pixml et BnF Archives & Manuscrits- Calames, double interface- Le CCFr (Manuscrits)- Autres usages d’EAD : interfaces de
publication Pleade, Arkheia, ICA-Atom, prise en compte de l’EAD par certains SIGB…
- Usages d’EAD par certaines bibliothèques numériques (mnesys, e-corpus)
9
Un « triptyque » numérique issu de la rétroconversion du CGM :
1. CCFr Manuscrits http://www.ccfr.bnf.fr (portail d’interrogation fédérée national)…
2. BnF Archives et Manuscritshttp://archivesetmanuscrits.bnf.fr …
3. Calames http://www.calames.abes.fr/pub/
ESR : le projet et l’application Calames
• Projet Calames lancé début 2006 (commande SDBIS)• Conception et développements : mars 2006 – nov. 2007• Ouverture du catalogue en ligne : déc. 2007• Mise en service de l’outil de catalogage : avril 2008• Fin de la phase projet : 2009• Adaptations et développements post-projets (liens
numérisation, interfaces personnalisées, exports professionnels, service OAI-PMH, version anglaise, exports PDF)
• Calames Plus : comptes, commentaires, dépôts et visionneuse d’images (juin 2012)
• Un réseau : 50 éts. déployés
Calames aujourd’hui
• Etude sur l’avenir de l’EAD à la BnF (2013)• Echanges avec l’Equipex Biblissima (immersion avril
2014)• Etude Calames « Bilan et perspectives » et journée du
réseau Calames (27 mai 2014)• Lancement d’un GT Outil national EAD (19 juin 2014)• Evolutions du Sudoc (étude Sudoc 2)… ?
Réflexions communes BnF – ABES sur l’avenir de l’EAD en leurs seins, intensification du dialogue ABES-BnF sur des projets communs ou à mutualiser (ex. référentiel d’autorités national)
BnF Archives et Manuscrits
BnF Archives et Manuscrits
Cataloguegénéral
BAM dans l’écosystème BnF
BnF Archives et Manuscrits
Cataloguegénéral Contrôle
d’autorité commun
BAM dans l’écosystème BnF
BnF Archives et Manuscrits
Cataloguegénéral
Renvoi entre
notices
Contrôled’autorité commun
BAM dans l’écosystème BnF
BnF Archives et Manuscrits
Cataloguegénéral
Renvoi entre
notices
Contrôled’autorité commun
BAM dans l’écosystème BnF
BnF Archives et Manuscrits
Cataloguegénéral
Renvoi entre
notices
Contrôled’autorité commun
BAM dans l’écosystème BnF
• De plus en plus de producteurs• De plus en plus d’utilisateurs • Passage d’un outil expérimental à un
catalogue • Mais les outils ont peu évolué dans leur
structure depuis la période expérimentale
BAM aujourd’hui
• Des orientations fortes actées fin 2013– Une étude de référence– Des arbitrages clairs, portés au contrat de performance– Une mise en œuvre nécessairement phasée
• Des investissements programmés au plan de développement logiciel– Maintenance des applications existantes– La refonte de l’outil de consultation– Un outil national pour la production?
• Une communauté de pratiques à animer– Des enjeux de plus long terme– Une organisation et des pratiques à développer
• Intégrer l’EAD et ses outils plutôt que les isoler– Dans l’architecture informatique et dans l’organisation– Dans des réseaux de coopération et de données
BnF : Un engagement stratégique
• … Un petit avant-goût ?
– Index :tous mots, titres d’œuvres, intitulés de dossiers, noms propres, toponymes, sujets, types de documents, langues, dates, cotes
– Introduction de facettes
– Éditorialisation : état des fonds, les nouveautés du mois, mise en avant des outils de valorisation
Refondre BAM
22
II. Mutualiser, interopérer
Encoder en convergeant
- Convergence des pratiques : Rédaction (2007-2013) d’un guide national « Bonnes pratiques EAD en bibliothèques françaises »
- Convergence des outils : Etude de faisabilité d’un outil national EAD (2014-2015 : en cours) groupes de travail interministériels
- Convergence des données : Web de données, données d’autorité
23
Bonnes pratiques EAD
24
• Groupe AFNOR constitué en 2000- Dictionnaire des balises (2004)- Manuel d’encodage d’un inventaire en EAD (2005, rév. 2009)
• EAD s’est imposé comme le standard de description des archives et des manuscrits, et s’étend parfois aux collections muséales, iconographiques…
• Besoin particulier d’harmonisation des usages pour un partage efficace des données en bibliothèques :- Guide des bonnes pratiques EAD en bibliothèque (publié début 2013)- Règles suivies et complétées par le manuel du réseau Calames et le guide du catalogueur de la BnF
25
26
Hypothèse d’outil national
de productio
n en EAD
GT Outil national EAD
- Réunion de lancement et déclaration d’intention (19/06/2014)
- Définition de 7 catégories de besoins fonctionnels : - imports et exports de données- ergonomie et convivialité, facilité d'installation- gestion des droits d’utilisation de l’outil- contrôle XML, DTD et bonnes pratiques- gestion commune des autorités- gestion des unités physiques (informations internes et vie
des documents, numérisations…)- gouvernance et maintenance, assistance et formation
27
GT Outil national EAD
- Des acteurs aux besoins divers et un phasage à définir
- Plusieurs outils d’édition en lice (XMetal dont le plugin est partagé par BnF et ABES, XmlMind, oXygen)
- Comité de pilotage en septembre 2015
28
• Utilisation d’un outil XML développé par la MRSH de Caen (XXE)
• Besoin premier : édition numérique
• Utilisable en EAD et en TEI
• Outil d’interrogation de VIAF
• Souplesse d’utilisation : formulaire ou XML natif
Convergence des données
- Parler aux archivistes : les enjeux de l’EAD 3- Parler au monde de la recherche : les enjeux
des humanités numériques et l’exemple de Biblissima
- Parler aux utilisateurs du Web : les enjeux du Web de données et l’exemple de data.bnf.fr
- Un levier : les données d’autorité - Entrées et sorties de données EAD : exemple
de Calames30
Productions et réexploitations des données
de Calames
31
Base de catalogage (encodage EAD + indexation IdRef)
Imports XML (encodages oXygen, ICA-Atom… /
moulinettes XML)
OAI-DC
CERL Portal
Portails d’éts. (BDIC)
Exports professionnels
Bibliothèques numériques (MNHN)
SIGB du réseauUnimarc
Natifs (EAD)
Autres portails gérant l’EAD
(Flora, Pleade…)
RDFaIsidore
CCFr
Web services natifs
Indexation : catalogue public
Rétroconversions nationales(CGM, Palme)
Catalogage natif (443.000 <c> créés
en 2008-2013)
Moissonnages
Calames : exporter et réexploiter des données
• Exports professionnels (natif, html, Marc) : l’instance EAD stockée est l’unité de base – question des arborescences Calames (liaisons/inclusions)
• Service OAI-PMH : niveaux descriptifs publiés transformés à la volée en Dublin Core (sets : établissements)– appauvrissement et mise à plat des données EAD
• Calames et le web : – Référencement par les moteurs : sitemap– Web services natifs de l’interface publique, réutilisés par le
CCFR manuscrits pour moissonnage– Usage encore expérimental de RDFa
32
Calames : importer des données
• Fonction « Importer » de l’outil de catalogage
• Transformer des données Marc, Excel… en EAD ? – Via des schémas XML ad hoc– Nombreuses limites
• Co-gestion Calames – systèmes locaux (portails, bases Pleade…) circuit de création et de migration des données à définir dans
chaque établissement
33
Vers l’EAD 3
Þ Cohérence sémantique de l’EAD avec d’autres langages (ex : EAC-CPF)
Þ Structuration renforcée des élémentsÞ Mais logique de la base de données
• Finalisation en cours par le TS-EAD international
• Publication prévue à l’occasion du congrès annuel de la SAA en août
• Question de la conversion des notices en EAD 2002
• Question de l’application en France
« Améliorer l’efficience de l’EAD comme standard de représentation électronique de description
archivistique et comme outil pour la préservation et la présentation de ces
données et de leur échange entre systèmes »
• Les corpus de données préexistants : – Projets de numérisation
et d’encodage des sources utilisables par les chercheurs
– => aligner des entrepôts de métadonnées et d’images numériques existants
L’observatoire Biblissima :
Création d’un système de gestion et d’analyse d’informations historiques permettant de comprendre les circonstances et les modalités de la diffusion des connaissances, à travers l’étude de la transmission des livres et de leurs mouvements
Þ Entrepôt d’images numériques Þ Cluster de bases de données
Les partenaires fondateurs de Biblissima
L’ontologie Biblissima : exemple
Prototype alignement Initiales (IRHT)-Mandragore (BnF)
BAM
Gallica
EAD et le Web de données
- Problématiques de l’EAD voisines de celles du MARC :- Format structuré - Dans des silos de données- Spécifique à une communauté donnée
Catalogue général (15,3 M)
Collections numérisées (3 M) Pages Web pour les Humains
Données structurées Pour les machines (RDF)
Instruments de recherche (EAD)
Pages Web pour les humains et les machines
Traitements automatiques : alignements, regroupements
1xx(créateur de)
0070(auteur)
OEUVRE
MANIFESTATION
PERSONNE
INTERMARC
INTERMARC
INTERMARC
FRBNF11896956
FRBNF11967514
FRBNF37465618
Liens Identifiants pérennes Codage des relations
EAD
Utiliser les données d’autorité comme levier
• Pour un rapprochement vers les archives : – Les potentialités de l’EAC-CPF
• Pour un rapprochement entre les bibliothèques, les archives, l’interprofession du livre – Le projet d’un référentiel national commun
Notice d’autorité
Contrôle d’autorités et notion de contexte
• Un projet de données d’autorité de type archivistiques
• Norme de contenu des notices : ISAAR(CPF) – Norme internationale sur les Autorités archivistiques: collectivités, personnes, familles
• Modèle de données et format de saisie : EAC-CPF Contexte archivistique encodé : collectivités, personnes et familles (un schéma XML)
• S’inscrit dans la réflexion sur le périmètre des données d’autorité• Notion de « contexte »
Projet « Bibliothèque 1368-2015 » 45
Données d’autorités contextuelles
Conçu comme une étape vers le web de données
http://eac.staatsbibliothek-berlin.de
• ISAAR-CPF est centré sur la notion de provenance (producteur de fonds d’archives)
• EAC-CPF s’applique à toutes les personnes mentionnées dans les instruments de recherche(information contextuelle nécessaire à la compréhension du contexte)
• Deux points majeurs:• La question de l’identité (identifier correctement les personnes)• Rendre explicites les relations (dans un contexte donné)
• Orienté données• Identifiants• Autres espaces de noms • Linking mechanisms
46
47http://eac.staatsbibliothek-berlin.de
eac-cpf
control
cpfDescription
multipleIdentities
identity
description
relations
alternativeSet
entityID
entityType
nameEntry
nameEntryParallel
descriptiveNote
existDates
localDescriptions
places
legalStatus
functions
languageUsed
place
legalStatuses
languagesUsed
occupation
occupations
mandate
mandates
structureOrGenealogy
biogHist
generalcontext
cfpRelation
resourceRelation
functionRelation
placeplace
place
legalStatuslegalStatus
legalStatus
languageUsedlanguageUsed
occupationoccupation
mandatemandate
chronList
functionfunction
function
ses lieux de vie, de passage…ses lieux de vie, de passage…ses amisses amis
ses archivesses archivesses romansses romans
ses enregistrementsses enregistrements
ses compositionsses compositions
ses interprétationsses interprétations
des images sur…des images sur…
des adaptations de ses oeuvresdes adaptations de ses oeuvres
des critiques de ses oeuvresdes critiques de ses oeuvres
des oeuvres sur…des oeuvres sur…
les textes de ses chansonsles textes de ses chansons
des émissions sur…des émissions sur…
les interprétations de ses compositions
les interprétations de ses compositions
ses peinturesses peintures…etc.
Intégrer et interconnecter l’informationQue veut-on faire avec l’EAC-CPF ?
bibliothèques et musées oeuvrent pour:
archives se préoccupent de mettre:
l’intégration, la médiation et l’échange de l’information bibliographique et muséale
réalisation d’un modèle orienté-objet "FRBRoo"
les relations au cœur des systèmes d’information
Documents d’archives
Documents d’archives
PersonnesCollectivité
sFamilles
PersonnesCollectivité
sFamilles
Fonctions Fonctions
exercent
sont produits et gérés par
sont créés en exerçant des
Intégrant toute l’Information sur le patrimoine culturel
souci d’interopérabilité interdomaine
…mais sans renoncer à l’originalité de chaque domaine !
Toiles d’informations
• La BnF, ses entités successives, ses unités constitutives ont une histoire • à mettre en lumière• à rendre accessible aux chercheurs• à relier avec d’autres ressources/projets à la BnF et à l’extérieur
(national, international)
• Réaliser un outil d’aide • à la gestion de la production documentaire • et à son archivage à la BnF
Projet « Bibliothèque 1368-2015 » 50
Ex. d’utilisation de l’EAC : le projet «Bibliothèque 1368-
2015»
Une première réalisation : le « dictionnaire de la BnF »
• Croiser les données décrivant les producteurs de fonds de la BnF et des Archives nationales :– Alignements utilisant des identifiants communs
(ISNI)– Autour d’un format commun (EAC-CPF)
• Projet d’un prototype de visualisation dans un graphe des données d’autorité produites par la BnF et par les AN se rapportant à la même personne ou collectivité
…pour s’intégrer dans un projet plus large : Proto-AN
(2016)
Autorités
MARC
Autorités BnF
(MARC)
(DC)
Reliures<XML TEI>
Autorités<XML>
<XML EAD>
Mandragore
<XML EAD>
Catalogue(MARC)
Autres bibliothèques françaises
Pas d’autorités
Réutilisation et enrichissement
SUR LE WEB
ON THE W E B
SUR LE WEB (SOUVENT)
Autorités BnF
(MARC)
<XML TEI>
Authority records, linked
Authorities, Exported, locally used
Bib records, finding aids linked
Base commune mais les deux fichiers évoluent indépendamment
Données BnF et données ABES
Autorités
MARC
Autorités BnF
(MARC)
(DC)
Reliures<XML TEI>
Autorités<XML>
<XML EAD>
MARC<MARC-XML>
Mandragore
Pas d’autorités
<XML EAD>
Catalogue(MARC)
Autres bibliothèques françaises
LE WEB DE DONNÉES
<XML>
Pas d’autorités
Réutilisation et enrichissement
SUR LE WEB
ON THE W E B
SUR LE W E B
SUR LE WEB (SOUVENT)
Autorités BnF
(MARC)
<XML TEI>
Authority records, linked
Authorities, Exported, locally used
Bib records, finding aids linked
• L’existant : – Des puits de données multiples– Un rapprochement normatif– Des alignements déjà faits entre la BnF et l’ABES (VIAF,
ISNI) – Outils nationaux de production (EAD)
• Le projet à terme : un référentiel national de production de données d’autorités
• Une première étape : rapprochement BnF-ABES-autres partenaires (DILA, SGDL…)
Vers un référentiel national ?