metadonnees -- une typologie
DESCRIPTION
Présentation générale de ce que sont les métadonnées, de quelques questions qu'elles soulèvent, suivie d'une proposition de typologie des standards de métadonnées. Manquent les animations Version 1.1TRANSCRIPT
Métadonnées
François-Xavier Boffy
SID – SCD Lyon 1
M. Jourdain et les métadonnées
DATA META
Les métadonnées sont« des données sur des données » (data about data, cf. Martin).
On pourrait dire aussi,« des données sur du donné »(y compris sur les objets sensibles).
Quand on utilise des données portant sur un objet, on utilise des méta-données.
M. Jourdain et les métadonnées
Villeurbanne 69100
Sous-préfecture
138 000 hab.
On fait des métadonnées depuis très longtemps sans s'en rendre forcément compte...
Exemples de métadonnées
Votre numéro de sécurité sociale – les machines peuvent gérer votre dossier
Vos prénoms – on peut vous identifier plus précisément qu'avec un seul (alternative : date voire lieu de naissance)
Votre taille – on peut savoir quel vêtement (= une autre donnée) pourrait « s'agencer » avec vous; mais elle varie !
La cuisson de la viande au restaurant – question de vocabulaire (bleu, à point...) !
Approche classique
Les métadonnées sont des données sur les données, donc on peut classer les métadonnées selon le type des données
Distinction entre Métadonnées descriptives (du contenu) Métadonnées administratives (droits) Métadonnées de structure (relations) Métadonnées sur les métadonnées
Exemple en Dublin Core qualifié et LOM
title signale le nom d'usage du contenu rights signale des droits sur le document hasPart signale une sous-partie du doc metametadata/contribute (ou 3.2, en
LOM) signale l'origine des métadonnées
Changer de format...
title en DC = champ 240 en MARC embargoDate en PRISM =? en DC
(n'existe pas) creator en DC ≈ %A en Endnote contributor en Zotero ≠ contributor en DC
La conversion d'un format de métadonnées en un autre est déjà délicate à cause de la « grammaire » utilisée par chacun.
Transférer des données...
Titre = La pie voleuse / La Pie voleuse / The Thieving Magpie / ...
Date = “02/12/1977” / “2 décembre 77” / “12/02/1977”
La conversion des métadonnées est rendue difficile aussi à cause des vocabulaires plus ou moins bien contrôlés employés par les utilisateurs / créateurs de métadonnées.
Des questions restent ouvertes, sur la théorie et la pratique :
Quel équilibre entre la richesse des métadonnées et leur interprétabilité ?
Quelles relations entre les différents formats ?
Qui choisit les noms des champs, qui choisit ce qu'on peut y mettre (usagers, éditeurs, instituts de normalisation) ?
Une norme de stockage ou de transmission, un codage de caractères (ex : Unicode) sont-il aussi des standards de métadonnées ?
Si on élargissait le traitement ?
Non seulement DC DC Terms MODS MARC EAD RDF / XML METS RIS...
Mais aussi RAMEAU Z3950 DOCX Endnote (.enl) XML Microformat RFC3361 RDF...
Mon approche La méta-information est un processus de
transmission qu'on peut modéliser de différentes façons
La dialectique entre les fonctionnements du web et les essais de normalisation / standardisation rompt les limites entre données et métadonnées
Dans le cas des données, les FRBR ont proposé une modélisation intéressante
Attention ! Les diapositives qui suivent sont des propositions de modélisation qui n'engagent que leur auteur.
Rappel FRBR
On distingue l'oeuvre (exemple : l'histoire des Misérables
de Victor Hugo) l'expression de l'oeuvre (exemple : le film Les
Misérables inspiré de l'oeuvre d'Hugo) la manifestation de l'oeuvre (exemple : le film
Les Misérables sur DVD édité en 2004) l'item (exemple : 1 exemplaire du DVD)
Et les standardsde métadonnées ?
Pourquoi pas... Règles de conception de métadonnées Règles d'organisation de métadonnées Règles d'expression de métadonnées
Règles grammaticales Règles du vocabulaire
Standard de conception
Standard d'organisation
Standard d'expression grammaticale
Standard d'expressiondu vocabulaire
4 niveaux de régulation des métadonnées
Langages à balise Formats bibliographiques
XMLHTML
TEIDC
MARC
LCSH
RFC3361MeSH
DC-HAL
LOM
La place qu'on peut attribuer à certains standards de méta-information
DC Abstract model
Langages à balise
XML
DC TermsDC
DC-HAL
EuropeanaRFC3361
LCSH
Le DC abstract model contrôle l'emploi des grammaires et des vocabulaires, mais reste sur la conception du XML
RDF
RDF/XML
Langages à balise
XMLMETS
MODS
DC Terms
MADS
LCSHMIX
Le METS peut structurer toutes les organisations et les expressions de métadonnées sur la base du XML
PREMIS
TextMD
Formats bibliographiques
MARC
UNIMARC
MARC21
MARCXML
Langages à balise
XML
Le MARCXML est l'adaptation de MARC21 à la conception des langages à balises de type XML
Microformats
hCardhCal W3CDTF
Les Microformats, standards sans organisation (en caricaturant un peu)
Enveloppe demétadonnées
XMP
Métadonnéesembarquées
EXIF
L'enrichissement des métadonnées des PDF ou images peut se faire avec une enveloppe de métadonnées en XMP
Fils de métadonnées
RSS PAM
Transmission par lots
Z3950
La transmission des métadonnées peut elle-même être standardisée de diverses manières.
RSS 1.0
RDF
SRU / SRW
CQL
RDF XML
RDF / XML
Mais au fait, où se placerait RDF dans cette modélisation ?
SPARQL
Pourquoi cette typologie ?
Mieux montrer les implications des choix de standard de métadonnées
Mieux évaluer les possibilités de conversion entre les standards à partir des ensembles qu'ils encadrent ou qui leur sont liés
Mieux distinguer ce qui relève d'un choix conceptuel, d'organisation ou de vocabulaire
Garder la possibilité d'inventer de nouveaux modes de méta-information, avec des organisations identiques ou diférentes
Merci
C'est tout... pour le moment !
Continuer vers Ali Sabieh ©2010 Visocrea