inha in visu-metadonnees-12 septembre 2012
TRANSCRIPT
INHA - InVisuParis – mercredi 12 septembre 2012
http://culturevisuelle.org/dejavu
Autour des métadonnées des images numériques
standards, technologies, pratiques
Patrick PeccatteChercheur associé au Laboratoire d'histoire visuelle contemporaine
(Lhivic/EHESS)
Twitter: @ppeccatte
Facebook: patrick.peccatte
Google+: Patrick PeccatteFlickr: patrickpeccatte et photosnormandie
Tumblr: dubruitausignal.tumblr.com
wenzday01/FlickrCreative Commons
Il était une fois...L'album de photos
Une histoireancienneet bien connue
lizjones112/FlickrCreative Commons
on ajoutait des légendesaux photos...
Yume Photo/FlickrCreative Commons
mais attentionau déclassement...
Guanatos Gwyn/FlickrCreative Commons
la solution ?la légende au verso
Mario Groleau/FlickrCreative Commons
Le système Autographicde Kodak permettait
au photographe d’ajouterdes informations écrites sur le film au moment
de l’exposition
Documenterla photo"au plus près",une préoccupationconstante
Mario Groleau/FlickrCreative Commons
Photo légendée selon le procédéAutographic (Nico Redlich, 1931).
Trois-Rivières, Canada
Avec le numérique...
Une métadonnée est littéralement une donnée sur une donnée✔ Dans le domaine des métadonnées [metadata], on parle de
données sur une ressource Plus précisément, c'est un ensemble structuré de
données décrivant une ressource quelconque Une métadonnée peut être utilisée à des fins
diverses…✔ la description et la recherche de ressources✔ la gestion de collections de ressources✔ la préservation des ressources
Légendes Métadonnées
Métadonnées "métiers" [1/2]
Les ressources décrites par des métadonnées ne sont pas nécessairement sous forme digitale✔ un catalogue de bibliothèque ou de musée contient
aussi des métadonnées qui référencent des objets physiques
De nombreuses communautés s'intéressent aux métadonnées✔ bibliothécaires, documentalistes, archivistes,
iconographes, conservateurs de musées, …✔ …gèrent de nombreux types de ressources
ressources: monographies, publications en série, articles, photos, archives, pièces de musée, séquences audio ou vidéo, etc.✔ on ne décrit pas toutes ces variétés de ressources de la même façon
apparition de standards de métadonnées "métiers"…
Métadonnées "métiers" [2/2]
IPTC/IIM (Information Interchange Model) Exif (Exchangeable Image File Format) MARC (Machine-readable cataloging) ISBD (International Standard Bibliographic Description) Dewey Decimal Classification system EAD (Encoded Archival Description) CIMI consortium (Computer Interchange of Museum Information) RKMS (Recordkeeping Metadata Schema) MPEG-7 (Multimedia Content Description Interface) ID3 (tags des fichiers audio MP3) standard "de fait " LOM (IEEE - Learning Object Metadata) SCORM (Sharable Content Object Reference Model)
bibliothèques
archives
musées
audio
éducation
catalogage (Marc) indexation (ISBD) classification (Dewey)
images
Où sont les métadonnées ?
Considérons la ressource suivante :http://www.liberation.fr/medias,62
Cette ressource contient plusieurs métadonnées✔ site liberation.fr✔ page Web de la rubrique medias
Les noms informatiques sont des métadonnées✔ Plus généralement :
nom, chemin d'accès, extension, taille, attributs, date decréation, date de modification, propriétaire, droits d'accès, etc. sont des métadonnées
Mais cela ne suffit pas, d'autres informations sont nécessaires :description longue, mots-clés, copyright, etc.
nom ≈ descriptionchemin d'accès ≈ plan de classement
Où sont les métadonnées ?Dans une base de données ou un fichier indépendant
associé aux données (sidecar file).Les métadonnées sont externes aux ressources.
Titre principal: El Greco, Begräbnis des Conde de OrgazDescription: El Greco, Domenikos Theotokopoulos, dit ; 1541-1614. .- 'L'Enterrement du comte d'Orgaz', v. 1586. (Saint Augustin et saint Etienne enterrent Don Gonzalo Ruyz de Toledo, Conde de Orgáz, mort en 1327). Huile sur toile, H. 4,60 ; L. 3,60. Tolède, église Santo Tomé. Année de l'évènement: 1586. Année de l'oeuvre: 1586.Mots-clés: 16E SIECLE; AME; ANGE; ART; ART ESPAGNOL; CHRIST; ENTERREMENT; ESPAGNE; GRECO, LE; HUILE SUR TOILE; INHUMATION; MANIERISME; MORT; ORGAZ, DON GONZALO RUYZ; PEINTURE; PERSONNE; ROYAUME DES CIEUX; SAINT AUGUSTIN D'HIPPONE; SAINT ETIENNE; SAINT JEAN-BAPTISTE; TABLEAU; TOLEDE; VIERGE MARIE; DEESIS, vertical
Fichier El Greco.docFichier El Greco.jpg
Où sont les métadonnées ?
Dans les données elles-mêmes.Les métadonnées sont internes, "embarquées" dans les ressources numériques.
Les informations EXIF (et GPS) et IPTC/IIM des images numériques sont des métadonnéesinternes
Les métadonnées XMP peuvent êtreinternes ou externes
Fichier image numérique
Où sont les métadonnées ?
Exif IPTC/IIM
GPS
Autres informations...
XMP XMP
Vignetteintégrée
exploitationcopie externe
contexte depublication
(sans métadonnées)
Contexte de publication ... pas besoin de métadonnées – le cas de Google Images
Çà marche...
Contexte de publication ... pas besoin de métadonnées [really ?]
Les informations du contexte de publication ne suffisent pas
Contexte de publication ... pas besoin de métadonnées [really ?]
C'est mieux.Mais même avec le Sort by subject
les informations généréesà partir du contexte de publication
ne suffisent pas!
Contexte de publication ... pas besoin de métadonnées [really ?]
Catégories ignorées
Avantage et inconvénientdes métadonnées internes
AvantageL'échange est facilité; la ressource numérique transporte avec elle ses propres métadonnées lorsqu'elle est téléchargée, copiée, renommée, compactée, etc.
✔ Facilite l'interopérabilité, c'est-à-dire la capacité d’échanger des données entre systèmes différents
InconvénientIl est nécessaire de copier les métadonnées dans une base de données pour exploiter une grande collection de ressources numériques.
● Pas besoin d'outils onéreux ou compliqués
● Sur le Web, il n'est même pas nécessaire de télécharger l'image, utiliser Jeffrey's Exif Viewer http://regex.info/exif.cgi
Exemple sur une image de Wikimedia Commonshttp://commons.wikimedia.org/wiki/File:Statue_Berthold-Brecht-Platz_(Mitte)_Berthold_Brecht.jpg
Lire les métadonnées internes des images
http://regex.info/exif.cgi appliqué sur l'image
Métadonnées textuelles
Coordonnées GPS
Vignetteintégrée
Image analysée
Une métadonnée n'est pas obligatoirement textuelle
Une vignette intégrée peut (parfois)fournir beaucoup d'informations.
C'est une métadonnée...
Métadonnées textuellesVignetteintégrée
Image analysée
Éditeurs de métadonnéesIPTC/IIM et XMP
http://www.iptc.org/cms/site/photometadatasupportlist.html
etc.
XnView (Win/Mac, gratuit)
Ce que les métadonnéesne sont pas....
● Contrôle des usages et droits,DRM [Digital Rights Management]
● Tatouage invisible [watermarking]● Stéganographie: dissimuler un message dans un
autre message (en particulier une image numérique)
● Digital forensics: analyse technique des retouches, examen de l'authenticité ["diplomatique numérique"]
MétadonnéesExif (et GPS)
Métadonnées et images – EXIF EXIF est une abréviation de EXchangeable Image File. Ce format définit les
informations d'ordre technique contenues dans les fichiers des images.Ce sont donc des métadonnées de type interne.
Le format EXIF a été développé en octobre 1995 par le JEIDA(Japan Electronic Industry Development Association).La version 2.0 date de novembre 1997, la révision 2.1 de juin 1998 et la révision 2.2 d'avril 2002.
Ce n'est pas un standard, mais il est supporté par tous les fabricants d'APN (avec des variantes propriétaires)
Les informations EXIF concernent les paramètres de prise de vue et lesréglages de l'appareil au moment de la capture numérique :
✔ fabricant et modèle de l'appareil✔ hauteur et largeur de l'image✔ date et heure de la prise de vue✔ orientation✔ résolution, temps d'exposition, ouverture✔ présence d'un flash✔ coordonnées GPS sur certains appareils hauts de gamme récents✔ etc. [30 éléments environ]
Géolocalisation des images ? Très simple...
adresse postaleLe Mont-Saint-Michel, 50116, Manche, France
latitude / longitude48° 38' 10'' N, 1° 30' 41'' W
localisation
geotags
Opérationsdocumentaireséquivalentes ?
Pour exprimer en geotags cette localisation:✔ Distinguer entre localisation du sujet et localisation de la prise de vue✔ Utiliser d'autres geotags également indispensables: altitude et direction
Crédit El Guanche sur FlickrLicence Creative Commons
Le Mont-Saint-Michel et le rocher de Tombelaine vus d'avion
Géolocalisation des images ? Pas si simple...
Sujet : descriptions multiplesAvant-plan et arrière-plan sont distants de 100 km environ
La tour de Tokyo (35° 41' N, 139° 46' E)et le mont Fuji (35° 21' 29" N, 138° 43' 52" E)
Crédit mafleen sur FlickrLicence Creative Commons
Géolocalisation des images ? Pas si simple...
MétadonnéesIPTC/IIM
Métadonnées et images – IPTC/IIM
L'IPTC (International Press and Telecommunications Council) est une organisation internationale qui développe des standards d'échange de données pour la presse
L'IPTC et la NAA (Newspaper Association of America) ont créé en 1991 le modèle global de données appelé Information Interchange Model [IIM]
Sous-ensemble de l'IIM utilisé par Adobe dès 1994 pour définir dans Photoshop les informations associées à une image
C'est ce sous-ensemble composé de 33 champs qui est communément appelé métadonnées IPTC
Métadonnées IPTC = ensemble de champs textuels (Titre, Légende, Mots-clés, Copyright, etc.) stockés dans le fichier image
Chaque champ est identifié par un numéro et un nom normalisé (en anglais)
Très utilisé dans la presse et l'édition
Métadonnées et images – IPTC/IIM
Métadonnées et images – IPTC/IIM
Privilégier un ensemble restreint de champs gérés par la plupart des programmes d'édition IPTC. Par exemple:
✔ n° 25, Keywords (Mots-clés) champ répétable
✔ 55, Date Created (Date de création)
✔ 80, By-line (Auteur)
✔ 90, City (Ville)
✔ 101, Country/Primary Location Name (Pays)
✔ 105, Headline (Titre)
✔ 120, Caption/Abstract (Description/Légende)le plus long champ du standard (2000 caractères maximum)
Respecter le standard en ce qui concerne la répétabilité et la longueur maximale des champs
Métadonnées et images – IPTC/IIM et Exif
IPTC/IIM : métadonnées ayant trait à la sémantique de l'image et nécessitant l'intervention d'un opérateur humain pour être renseignées
EXIF : métadonnées techniques relatives à la prise de vue et fournies automatiquement par un appareil numérique Éviter de modifier
Modifiablepar définition
Pratique des métadonnées IPTC/IIML'exemple des photos d'agence
Deux grandes catégories Photos d'actualités
Editorial, News✔ titre, description/légende, (parfois mots-clés)
Photos d'illustrationCreative, Illustration, Documentaire, Stocken général atemporelles✔ mots-clés, (parfois légendes)
Les historiques sont traitées comme l'éditorial
Photo d'actualité ou photo historique
Champs IPTClégende (Caption/Abstract n° 120)mots-clés (Keywords n° 25)
Photo d'illustration
Attention à l'indexation!
Attention à l'indexation!
surindexation
Attention à l'indexation!
Indexation à l'aide devocabulaires contrôlés
générant des termes associésinappropriés
MétadonnéesXMP
Dublin Core Metadata Initiative
Le Dublin Core est un ensemble de 15 éléments de métadonnées ayant trait :✔ au Contenu
Title, Description, Subject, Source,Coverage, Type, Relation
✔ à la Propriété intellectuelleCreator, Contributor, Publisher, Rights
✔ à la VersionDate, Format, Identifier, Language
DC définit un vocabulaire de métadonnées commun à plusieurs communautés
Creator et non pas Author
Le Dublin Core ne prétend pas répondre aux besoins et à la complexité de tous les métiers
Le Dublin Core est un ensemble simple et très utilisé de métadonnées, mais il n'est passuffisant
Dans la plupart des besoins professionnels, il doit être complété par d'autres schémas demétadonnées
Le Dublin Core est une norme ISO (n° 15836) Pour en savoir plus: www.dublincore.org
Dublin Core Metadata Initiative
XMP – Extensible Metadata Platform
Créé par Adobe en septembre 2001 Pas réservé aux images.
Le format PDF par exemple supporte XMP Utilise une version simplifiée de RDF
(Resource Description Framework)● Développé par le W3C, base du Web sémantique
● Permet d'encoder, échanger et réutiliser des métadonnées structurées
● Peut s'exprimer en XML (sérialisation)
Utilise le schéma Dublin Core comme fondation(préfixe de l'espace de noms XML: dc:)
XMP est un standard ISO depuis mars 2012● ISO 16684-1:2012, Graphic technology – Extensible metadata platform
(XMP) specification – Part 1: Data model, serialization and core properties
XMP – Extensible Metadata Platform
Les espaces de noms XMP sont des conteneurs
Source: Fotoware
XMP – Extensible Metadata Platform
Les champs appartiennent à un espace de noms
Source: Fotoware
XMP – Extensible Metadata Platform
Les espaces de noms permettent d'éviter les collisions
Source: Fotoware
Panneaux standards sur Photoshop [ancienne version (CS) ; semblable sur les versions plus récentes]
Le panneau Avancé
Organisation des métadonnéespar espaces de noms:
Dublin Core (préfixe dc)Photoshop (héritage IPTC/IIM)
etc.
Ne pas utiliser des outils non XMPaprès avoir travaillé avec des outils XMP
Bien connaître vos outils dans les workflows complexes
IPTC n°120: ChatonsXMP dc:description: Chatons
Indexation avec un outil XMP
IPTC n°120: Deux chatonsXMP dc:description: Chatons
Modification à l'aide d'un outil uniquement IPTC/IIM (non XMP)
IPTC n°120: Deux chatonsXMP dc:description: Chatons
Retour à un outil XMP
Perspectives ouvertes par XMPEn quoi XMP est-il plus performant que l'IIM ?
Adapté aux légendesmultilingues
Inadapté aux légendesmultilingues
XMPIPTC/IIM
Extensible et évolutifStatique
Extensibilité documentée (Namespaces)
Extensibilité non documentée (champs non standards)
Types de données et types structurés
Pas de types de données
Pas de problèmes d'accents (codage Unicode)
Problèmes d'accents
Lisible (XML)Binaire (non facilement lisible)
La transition du standard IPTC/IIM vers XMPIPTC Photo Metadata
IPTC Photo Metadata est une initiative de l'IPTC qui regroupe deux schémas XMP :IPTC Core et IPTC Extension
But définir des éléments de métadonnées dans le but de proposer une correspondance non ambiguë et une transition en douceur depuis les métadonnées IPTC/IIM (dit legacy) vers une technologie XMP
La transition du standard IPTC/IIM vers XMPIPTC Photo Metadata
IPTC Core reprend sous forme XMP la plupart des métadonnées de l'IIM (mais pas toutes). Son préfixe d'espace de noms est iptc4xmp
✔ IIM Contact n'est pas repris tel quel
IPTC Core comporte aussi des métadonnées supplémentaires par rapport à l'IIM :
✔ Structure Contact : nom, adresse, téléphone, etc.
✔ Localisation (seuls Pays, Code Pays, Ville existent en IIM)
✔ NewsCodes : sujet, scène, genre
La transition du standard IPTC/IIM vers XMPIPTC Photo Metadata
IPTC Extension 1.1
Distingue entre la Localisation de la prise de vue et laLocalisation du sujet photographié
Gestion des droits : Copyright Owner, Copyright Owner Name, etc.
Informations concernant le modèle photographié :Model Age, Minor Model Age Disclosure, etc.
Informations concernant la propriété des "contenus"photographiés
Informations concernant l'œuvre ou l'objet figurant sur l'image :Artwork or Object in the Image
Exemple avec Photoshop
Ajouter des panneaux (Custom panels) pour afficher et/ou modifier les métadonnées Astronomy Visualization Metadata Standard
Observer le panneau Avancé
Extensibilité XMP
Panneaux standards sur Photoshop [version CS ; semblable sur les versions plus récentes]
Le panneau Avancé
Le panneau Avancé. Détail des informations dans l'espace de nom avm
Extensibilité. Ajout de panneaux personnalisés [Custom panels]. Liste des panneaux.
Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Creator.
Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Content.
Pratique des métadonnées internes des images numériques
Ne pas modifier les métadonnées Exif, à l'exception des coordonnées GPS et parfois de la date de prise de vue (si l'appareil était mal réglé)
Utiliser toujours des standards éprouvés:Dublin Core, IPTC/IIM et équivalent en XMP
Ne pas être top "ambitieux", se contenter d'un jeu de métadonnées cruciales et que l'on maîtrise
Se conformer aux pratiques documentaires habituelles et éviter la surindexation
Si vous utilisez IPTC/IIM, maintenir la cohérence avec les équivalents XMP
N'utiliser l'extensibilité XMP que s'il existe un schéma documenté et soutenu par une organisation reconnue
Pour en savoir plus
Métadonnées: une initiationpeccatte.karefil.com/software/Metadata.htmLe site de l'IPTCwww.iptc.orgAdobe Extensible Metadata Platform (XMP)www.adobe.com/products/xmp/main.htmlControlled Vocabularywww.controlledvocabulary.com
La légende ne deviendra-t-elle pas l’élément essentiel du cliché ?
Walter BenjaminPetite histoire de la photographie (1931)