information numérique : défintions et enjeux
TRANSCRIPT
Information numérique : définitions et enjeux
Gautier [email protected]://www.lespetitescases.net@lespetitescases
Bilan de 4 ans de réflexions sur l’information numérique (2006-2010)
Le document numérique : caractéristiques et enjeux
L’OAIS : un cadre normatif
Du signe à la connaissance : quelques définitions
En guise de conclusion
Moyens pour assurer la maîtrise de son information
Voici un signe
Signifiant
Code d’écriture / Alphabet / Syntaxe
Signifié
Représentation mentale / Concept / Sens
Du signe à la connaissance : le signe
ne possède pas ne comprend paspossède comprend
Voici un signe
Signifiant
Code d’écriture / Alphabet / Syntaxe
Signifié
Représentation mentale / Concept / Sens
Du signe à la connaissance : le signe
ne possède pas ne comprend paspossède comprend
Une série de signes reliées forme une donnée
Du signe à la connaissance : données et information
Chien Animal
Une série de signes reliées forme une donnée
Du signe à la connaissance : données et information
Chien Animal
Un ensemble de données organisé et verbalisé forme une information
Un message qui possède une grammaire (une structure)
Le chien est un animal qui peut être domestiqué
Du signe à la connaissance : le document
Une information inscrite sur un support constitue un document
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum pellentesque auctor tortor non venenatis. Mauris risus ipsum, mollis vitae vulputate vitae, hendrerit non magna. Sed sagittis elit sagittis nisi convallis tempus. Etiam pharetra rhoncus enim, sit amet gravida dolor ullamcorper ut. Quisque pellentesque tristique elit, sed mollis mauris convallis ut. Cras non est dolor. In hac habitasse platea dictumst. Etiam fermentum purus ante, porttitor tincidunt sem. Quisque lacinia sem eget ipsum fringilla ac scelerisque leo tempus. Nullam vehicula, magna non pharetra scelerisque, mi ligula adipiscing elit, ut sodales justo sem vel libero. Fusce sed diam eget augue tempor tempus. Morbi leo dolor, suscipit vitae vehicula blandit, congue sit amet lacus. Suspendisse potenti. Praesent consectetur ligula a leo varius lacinia. Phasellus auctor lacinia viverra.
Du signe à la connaissance : le document
Une information inscrite sur un support constitue un document
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum pellentesque auctor tortor non venenatis. Mauris risus ipsum, mollis vitae vulputate vitae, hendrerit non magna. Sed sagittis elit sagittis nisi convallis tempus. Etiam pharetra rhoncus enim, sit amet gravida dolor ullamcorper ut. Quisque pellentesque tristique elit, sed mollis mauris convallis ut. Cras non est dolor. In hac habitasse platea dictumst. Etiam fermentum purus ante, porttitor tincidunt sem. Quisque lacinia sem eget ipsum fringilla ac scelerisque leo tempus. Nullam vehicula, magna non pharetra scelerisque, mi ligula adipiscing elit, ut sodales justo sem vel libero. Fusce sed diam eget augue tempor tempus. Morbi leo dolor, suscipit vitae vehicula blandit, congue sit amet lacus. Suspendisse potenti. Praesent consectetur ligula a leo varius lacinia. Phasellus auctor lacinia viverra.
ContenuSupport
Du signe à la connaissance : le document
Une information inscrite sur un support constitue un document
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum pellentesque auctor tortor non venenatis. Mauris risus ipsum, mollis vitae vulputate vitae, hendrerit non magna. Sed sagittis elit sagittis nisi convallis tempus. Etiam pharetra rhoncus enim, sit amet gravida dolor ullamcorper ut. Quisque pellentesque tristique elit, sed mollis mauris convallis ut. Cras non est dolor. In hac habitasse platea dictumst. Etiam fermentum purus ante, porttitor tincidunt sem. Quisque lacinia sem eget ipsum fringilla ac scelerisque leo tempus. Nullam vehicula, magna non pharetra scelerisque, mi ligula adipiscing elit, ut sodales justo sem vel libero. Fusce sed diam eget augue tempor tempus. Morbi leo dolor, suscipit vitae vehicula blandit, congue sit amet lacus. Suspendisse potenti. Praesent consectetur ligula a leo varius lacinia. Phasellus auctor lacinia viverra.
ContenuSupport
Un document se conçoit comme un ensemble logique fini d’informations (contenu)
délimité par des caractéristiques physiques (support)
Du signe à la connaissance : la connaissance
Une connaissance est un ensemble d’informations sur lequel un humain peut exercer un raisonnement
Est-ce-qu’il fait beau à Agadir au mois de Février ?
Oui, c’est très agréable.
Du signe à la connaissance : la connaissance
Une connaissance est un ensemble d’informations sur lequel un humain peut exercer un raisonnement
Ma femme va pouvoir m’offrir des vacances !
Du signe à la connaissance : la connaissance
Une connaissance est un ensemble d’informations sur lequel un humain peut exercer un raisonnement
Super, le chef va partir !...
Du signe à la connaissance : Synthèse
Ne pas confondre : La gestion des données (SGBDR, Système de gestion des graphes, BD XML…)
La gestion de l’information (Portail, Moteur de recherche)
La gestion de contenu (CMS, wiki)
La gestion des supports de l’information (Système de fichiers, Système de stockage)
La gestion des documents (GED, Archivage/Records management)
La gestion des connaissances (le cerveau humain !)
Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :
Vocabulaire contrôlé
Mammifère
Animal
Reptile
PrimatesHomme
Chimpanzé
Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :
Vocabulaire contrôlé Taxinomie
Mammifère
Animal
Reptile
PrimatesHomme
Chimpanzé
Animal
Reptile
Mammifère
PrimatesHomme
narrower
Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :
Vocabulaire contrôlé Taxinomie
Mammifère
Animal
Reptile
PrimatesHomme
Chimpanzé
Thésaurus
Animal
Reptile
Mammifère
PrimatesHomme
Pays de langue française
Afrique Francophone
Europe Francophone
France
Suisse RomandeFrancophonie
narrower
narrower
related
Un vieux rêve : classer le mondePour appréhender au mieux les connaissances, les hommes ont cherché des moyens de classer et contenir les informations du monde :
Vocabulaire contrôlé Taxinomie
Mammifère
Animal
Reptile
PrimatesHomme
Chimpanzé
Thésaurus Ontologie
Animal
Reptile
Mammifère
PrimatesHomme
Personne
Animal Lieu
possède habite
est originaire de
Pays de langue française
Afrique Francophone
Europe Francophone
France
Suisse RomandeFrancophonie
narrower
narrower
related
Le document numérique : caractéristiques et enjeux
L’OAIS : un cadre normatif
Du signe à la connaissance : quelques définitions
En guise de conclusion
Moyens pour assurer la maîtrise de son information
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Dématérialisation Ubiquité Sérendipité DéstructurationDécontextualisation Push / Pull
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
Dématérialisation Ubiquité Sérendipité DéstructurationDécontextualisation Push / Pull
Le document numérique se caractérise par une séparation de la mise en forme
et du contenu
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
Il n’existe qu’un exemplaire, mais il est accessible à tout moment par
plusieurs personnes en même temps.
Ubiquité Sérendipité Déstructuration Push / PullDématérialisation Décontextualisation
Le document numérique se caractérise par une séparation de la mise en forme
et du contenu
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
Sérendipité Déstructuration
Le document existe en dehors de son usage par un utilisateur
Il n’existe qu’un exemplaire, mais il est accessible à tout moment par
plusieurs personnes en même temps.
UbiquitéDématérialisation Décontextualisation
Le document numérique se caractérise par une séparation de la mise en forme
et du contenu
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Push / Pull
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
La structure du document numérique ne subit pas les
mêmes contraintes
Déstructuration
La naviguation à l’écran entraîne une perte des repères cognitifs
Sérendipité
Le document existe en dehors de son usage par un utilisateur
Il n’existe qu’un exemplaire, mais il est accessible à tout moment par
plusieurs personnes en même temps.
UbiquitéDématérialisation Décontextualisation
Le document numérique se caractérise par une séparation de la mise en forme
et du contenu
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Push / Pull
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
Les points d’accès à l’information sont multipliés
Push / Pull
La structure du document numérique ne subit pas les
mêmes contraintes
Déstructuration
La naviguation à l’écran entraîne une perte des repères cognitifs
Sérendipité
Le document existe en dehors de son usage par un utilisateur
Il n’existe qu’un exemplaire, mais il est accessible à tout moment par
plusieurs personnes en même temps.
UbiquitéDématérialisation Décontextualisation
Le document numérique se caractérise par une séparation de la mise en forme
et du contenu
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Caractéristiques du document numérique sur le Web
Imaginons un livre numérisé et accessible sur Gallica
Assurer l’accès à l’information numérique Assurer la continuité de l’accès
Ces différentes caractéristiques imposent deux contraintes
Les points d’accès à l’information sont multipliés
Push / Pull
La structure du document numérique ne subit pas les
mêmes contraintes
Déstructuration
La naviguation à l’écran entraîne une perte des repères cognitifs
Sérendipité
Le document existe en dehors de son usage par un utilisateur
Il n’existe qu’un exemplaire, mais il est accessible à tout moment par
plusieurs personnes en même temps.
UbiquitéDématérialisation Décontextualisation
Le document numérique se caractérise par une séparation de la mise en forme
et du contenu
Le document numérique n’est pas auto-porteur : le document en lui-même est séparé
du support de lecture
Assurer l’accès à l’information numérique : la granularité
Document Volume, tome, fascicule... Page
CollectionVue de détail
Cas des livres
Le terme « granularité » renvoie aux niveaux d’accès d’une ressource
Assurer l’accès à l’information numérique : la granularité
Document Volume, tome, fascicule... Page
CollectionVue de détail
Image(légende)
LotCollection
Cas des livres
Cas des lots d’image
Vue de détail
Le terme « granularité » renvoie aux niveaux d’accès d’une ressource
Assurer l’accès à l’information numérique : la granularité
Document Volume, tome, fascicule... Page
CollectionVue de détail
Image(légende)
LotCollection
Cas des livres
Cas des lots d’image
Vue de détail
Cas des archives du Web
Collection Résultat d’une collecte
Une page Web / une URL
Vue de détail
Le terme « granularité » renvoie aux niveaux d’accès d’une ressource
Assurer l’accès à l’information numérique : le document
Il existe plusieurs niveaux d’appréhension d’un document numérique
Cas d’un document issu d’un support physique traditionnel
Assurer l’accès à l’information numérique : le document
L’objet
Cas d’un document issu d’un support physique traditionnel
Pages
Structure physique
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : le document
Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre. Ceux qui dormaient se réveillèrent, et chacun se leva comme surpris dans son travail.
Première partie
L’objet
Cas d’un document issu d’un support physique traditionnel
Pages
Structure physique
Le contenu
Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre.
Chapitre 1 Une nuit, vers onze heures, ils furent réveillés par le bruit d'un cheval qui s'arrêta juste à la porte. La bonne ouvrit la lucarne du grenier et parleme
Chapitre 2
Deuxième partie
Yonville-l'Abbaye (ainsi nommé à cause d'une ancienne abbaye de Capucins dont les ruines n'existent même plus) est un bourg à huit lieues de Rouen
Chapitre 1Emma descendit la première, puis Félicité, M. Lheureux, une nourrice, et l'on fut obligé de réveiller Charles dans son coin, où il s'était endormi
Chapitre 2
Structure logique
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : le document
Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre. Ceux qui dormaient se réveillèrent, et chacun se leva comme surpris dans son travail.
Première partie
L’objet
Cas d’un document issu d’un support physique traditionnel
Pages
Fichiers
Structure physique
Le contenu
Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre.
Chapitre 1 Une nuit, vers onze heures, ils furent réveillés par le bruit d'un cheval qui s'arrêta juste à la porte. La bonne ouvrit la lucarne du grenier et parleme
Chapitre 2
Deuxième partie
Yonville-l'Abbaye (ainsi nommé à cause d'une ancienne abbaye de Capucins dont les ruines n'existent même plus) est un bourg à huit lieues de Rouen
Chapitre 1Emma descendit la première, puis Félicité, M. Lheureux, une nourrice, et l'on fut obligé de réveiller Charles dans son coin, où il s'était endormi
Chapitre 2
Structure logique
Structure numérique
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : le document
Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre. Ceux qui dormaient se réveillèrent, et chacun se leva comme surpris dans son travail.
Première partie
L’objet
Cas d’un document issu d’un support physique traditionnel
Pages
Fichiers
Structure physique
Le contenu
Nous étions à l'Étude, quand le Proviseur entra, suivi d'un nouveau habillé en bourgeois et d'un garçon de classe qui portait un grand pupitre.
Chapitre 1 Une nuit, vers onze heures, ils furent réveillés par le bruit d'un cheval qui s'arrêta juste à la porte. La bonne ouvrit la lucarne du grenier et parleme
Chapitre 2
Deuxième partie
Yonville-l'Abbaye (ainsi nommé à cause d'une ancienne abbaye de Capucins dont les ruines n'existent même plus) est un bourg à huit lieues de Rouen
Chapitre 1Emma descendit la première, puis Félicité, M. Lheureux, une nourrice, et l'on fut obligé de réveiller Charles dans son coin, où il s'était endormi
Chapitre 2
Structure logique
Structure numérique
Il est nécessaire de refléter et de mettre en relation ces différentes structures qui sont autant de point d’accès à l’information
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : le document
Cas d’un document nativement numérique
WARC
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : le document
Cas d’un document nativement numérique
Ressource / URL
WARC
Structure physique
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : le document
Cas d’un document nativement numérique
Il est nécessaire de refléter et de mettre en relation ces différentes structures qui sont autant de point d’accès à l’information
Ressource / URL
WARC
Fichiers
Structure physique
Structure numérique
Structure logique
Il existe plusieurs niveaux d’appréhension d’un document numérique
Assurer l’accès à l’information numérique : la collection
Catalogue de données structurées
Plusieurs méthodes d’accès à un document appartenant à une collection
Je recherche le document dont le titre est Madame Bovary et l’auteur
Gustave Flaubert
Assurer l’accès à l’information numérique : la collection
Catalogue de données structurées
Plusieurs méthodes d’accès à un document appartenant à une collection
Je recherche le document dont le titre est Madame Bovary et l’auteur
Gustave Flaubert
Moteur de recherche
Je recherche le document qui contient « bovary » dans méta ou
le texte intégral
Assurer l’accès à l’information numérique : la collection
Catalogue de données structurées
Plusieurs méthodes d’accès à un document appartenant à une collection
Je recherche le document dont le titre est Madame Bovary et l’auteur
Gustave Flaubert
Moteur de recherche
Je recherche le document qui contient « bovary » dans méta ou
le texte intégral
Je souhaite naviguer dans une collection particulière
Système de navigation
Assurer l’accès à l’information numérique : synthèse
La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection
Représentation numérique de la structure physique
Assurer l’accès à l’information numérique : synthèse
Structure physique
La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection
Assurer l’accès à l’information numérique : synthèse
Structure logique
La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection
Assurer l’accès à l’information numérique : synthèse
Description du document pour une mise en contexteDescription du document pour une mise en contexte
La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection
Assurer l’accès à l’information numérique : synthèse
Navigation dans le document
La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection
Assurer l’accès à l’information numérique : synthèse
Navigation dans la collection
La page Web doit refléter les différentes structures, contenir les éléments pour la navigation dans le document et dans la collection
Assurer l’accès à l’information : la méta-collection
Agréger
Pour faciliter la recherche de l’utilisateur, des portails constituent des méta-collections, véritable hub de collections de documents numériques, un exemple : Europeana
Exposer / Partager Donner accès
OAI-PMH est un protocole qui permet ce genre d’usages
Assurer l’accès à l’information numérique : Synthèse
Usage Informations nécessaires
Rechercher dans la collection, naviguer dans la collection, contextualiser la consultation de l’utilisateur
Informations descriptives et/ou bibliographiques (titre, auteur, année de création, sujets…)
Reconstituer un objet complexe (un livre), naviguer dans le document, situer l’utilisateur dans le document
Informations de structure (arborescence ou carte des différents niveaux de granularité et des relations)
Proposer une représentation numérique de l’objet, relier une représentation numérique à un nivaeau de granularité physique ou logique
Informations sur la structure numérique (liste des fichiers)
Localiser et identifier les différents niveaux de granularité
Information de référence (identifiants, URI…)
Quelles sont les informations nécessaires pour assurer l’accès à l’information numérique ?
Assurer la continuité de l’accès : problèmes de la vision actuelle du SI
Les architectes techniques, les concepteurs et les développeurs les traduisent pour
déployer
L’infrastructure matérielle et logicielle
Les utilisateurs finaux du système d’informationexpriment leurs besoins
Les experts fonctionnelsrédigent les spécifications fonctionnelles
Conception du SI
L’application est orientée processusIl n’a jamais été question de l’information
Assurer la continuité de l’accès : problèmes de la vision actuelle du SI
Les architectes techniques, les concepteurs et les développeurs les traduisent pour
déployer
L’infrastructure matérielle et logicielle
Les utilisateurs finaux du système d’informationexpriment leurs besoins
Les experts fonctionnelsrédigent les spécifications fonctionnelles
Conception du SI Conséquencessur le SI
SI = Boîte noire
L’organisationdélègue la gestion
et le stockagedes données au SI
Les utilisateurs créent l’information
L’organisation n’a aucune maîtrise de ces données, sur leur cycle de vie, sur leur évolution et sur leur pérennisation.
L’évolution des usages impose l’évolution des données et donc le changement du SI.
Les applications l’exploitent
L’application est orientée processusIl n’a jamais été question de l’information
Traditionnellement, la modélisation d’un SI est basée sur les besoins des utilisateurs.
Les processus : la partie émergée de l’iceberg• Besoins primaires : production, stockage et restitution ;• Modélisation des processus-métiers ; • Réponse directe aux besoins des utilisateurs.• Entraîne une multiplication des applications• A chaque application, sa logique propre, son format de données, ses propres mécanismes d’accès
Assurer la continuité de l’accès : problèmes de la vision actuelle du SI
Traditionnellement, la modélisation d’un SI est basée sur les besoins des utilisateurs.
Les processus : la partie émergée de l’iceberg• Besoins primaires : production, stockage et restitution ;• Modélisation des processus-métiers ; • Réponse directe aux besoins des utilisateurs.• Entraîne une multiplication des applications• A chaque application, sa logique propre, son format de données, ses propres mécanismes d’accès
Les données : la partie immergée de l’iceberg
• Les données du SI dépendent de la modélisation des processus ;• Les données sont enfermées dans chaque application formant des silos de données ;• Absence de cohérence technique et sémantique entre les silos ;• Le modèle physique de stockage des données peut être très éloigné du modèle logique ce qui rend difficile la migration, la maintenance et la compréhension du modèle ;
Assurer la continuité de l’accès : problèmes de la vision actuelle du SI
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Imaginez de conduire une voiture sans frein et avec des pneus lisses sur une route glissante
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Imaginez un entrepôt de magasin sans un inventaire
Alors, pourquoi ce serait différent avec l’information d’un SI ?
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Données
Formats
Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Données
Formats
Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.
Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.
L’environnement applicatif
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Données
Formats
Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.
Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.
L’environnement applicatifL’environnement de stockage
Maîtriser les conditions de stockage et assurer l’intégrité des données stockées
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Données
Formats
Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.
Cycle de vie
Maîtriser les processus de création, modification, accès.Tracer l’ensemble des opération sur les données
Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.
L’environnement applicatifL’environnement de stockage
Maîtriser les conditions de stockage et assurer l’intégrité des données stockées
Assurer la continuité de l’accès : maîtriser les informations du SI
« Sans maîtrise, la puissance n’est rien »
Données
Pour maîtriser au mieux les données, il faut construire le SI autour des données avec une approche orientée données
Formats
Maîtriser les spécifications du format et son utilisation.Connaître le format, les spécificités d’utilisation pour chaque objet-données.
Cycle de vie
Maîtriser les processus de création, modification, accès.Tracer l’ensemble des opération sur les données
Maîtriser les conditions de création et d’utilisation des données pour prévoir l’évolution et/ou assurer l’exploitabilité.
L’environnement applicatifL’environnement de stockage
Maîtriser les conditions de stockage et assurer l’intégrité des données stockées
Assurer la continuité de l’accès : Synthèse
Usage Informations nécessaires
savoir quels sont les caractéristiques précises de mes données numériques
Informations techniques (format de données, caractéristiques de mon fichier)
Auditer régulièrement, assurer l’intégrité des données
Informations d’intégrité (taille du fichier, empreintes, état des support de stockage)
Assurer la traçabilité de mes données numériques
Informations de provenance
Assurer la réutilisation et l’exploitabilité des données numériques
Information de contexte et d’environnement matériel et logiciel
Quelles sont les informations nécessaires pour assurer la continuité de l’accès à l’information numérique ?
Rappel de l’ensemble des enjeux
Voici un document numérique que j’ai créé en 1998.
De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?
Métadonnées descriptives
Rappel de l’ensemble des enjeux
Voici un document numérique que j’ai créé en 1998.
Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?
De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?
Métadonnées descriptives
Support
Rappel de l’ensemble des enjeux
Voici un document numérique que j’ai créé en 1998.
Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?
Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?
De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?
Métadonnées descriptives
Support
Environnement matériel
Rappel de l’ensemble des enjeux
Voici un document numérique que j’ai créé en 1998.
Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?
Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?
J’ai créé ce document avec Claris Works. Comment vais-je retrouver ce logiciel ?
De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?
Métadonnées descriptives
Support
Environnement matériel
Environnement logiciel /Formats du fichier
Rappel de l’ensemble des enjeux
Voici un document numérique que j’ai créé en 1998.
Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?
Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?
J’ai créé ce document avec Claris Works. Comment vais-je retrouver ce logiciel ?
J’ai trouvé le logiciel, mais puis-je l’installer et l’utiliser sous Windows XP ?
De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?
Métadonnées descriptives
Support
Environnement matériel
Environnement logiciel /Formats du fichier
Système d’exploitation
Rappel de l’ensemble des enjeux
Voici un document numérique que j’ai créé en 1998.
Je l’ai enregistré sur une disquette, est-elle toujours en bon état ?
Mon portable, acheté en 2004, n’a pas de lecteur de disquette. Où en trouver un ?
J’ai créé ce document avec Claris Works. Comment vais-je retrouver ce logiciel ?
J’ai trouvé le logiciel, mais puis-je l’installer et l’utiliser sous Windows XP ?
Ça marche ! Mais j’ai perdu toute ma mise en forme …
De quoi s’agit-il, déjà ? Est-ce bien ce qui est indiqué sur la disquette ?
Métadonnées descriptives
Support
Environnement matériel
Environnement logiciel /Formats du fichier
Système d’exploitation
Authenticité / Intégrité
Le document numérique : caractéristiques et enjeux
L’OAIS : un cadre normatif
Du signe à la connaissance : quelques définitions
En guise de conclusion
Moyens pour assurer la maîtrise de son information
Moyens pour maîtriser l’information numérique
Moyensorganisationnels
Contratde service
Moyenstechniques
Systèmede gestion
Moyensréglementaires
NormesStandards
Moyenshumains
Organisationpluri-disciplinaire
Moyensstratégiques
Gestiondes risques
Moyensinformationnels
MétadonnéesRéférentiels
Les moyens stratégiques
La maîtrise de la collection numérique sur le long terme passe par une gestion des risques d’obsolescence en fonction des besoins des communautés d’utilisateurs cibles.
Une gestion des risques
Besoin des communautésd’utilisateurs cibles
Les moyens stratégiques
Une gestion des risques
Objectif : définir des politiques de préservation
Besoin des communautésd’utilisateurs cibles
Veiller à
l’adéquation
Stratégies pour pallier aux risques d’obsolescence
La maîtrise de la collection numérique sur le long terme passe par une gestion des risques d’obsolescence en fonction des besoins des communautés d’utilisateurs cibles.
Les moyens organisationnelsAfin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent
Un contrat portant sur
Les données
• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats
Les moyens organisationnels
Un contrat portant sur
Les données Les processus
• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats
• le nombre maximum de chaque type de processus sur une période de temps• le temps maximum d’exécution d’une instance de chaque type de processus• les utilisateurs autorisés à lancer chaque type de processus
Afin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent
Les moyens organisationnels
Un contrat portant sur
Les données Les processus Les modalités de stockage
• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats
• le nombre maximum de chaque type de processus sur une période de temps• le temps maximum d’exécution d’une instance de chaque type de processus• les utilisateurs autorisés à lancer chaque type de processus
• le nombre de copies• les supports de stockage• les conditions de lecture et d’écriture• les particularités de stockage (par exemple, cryptage ou compression)
Afin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent
Les moyens organisationnels
Un contrat portant sur
Les données Les processus Les modalités de stockage
La politique de préservation
• la structure des données• les formats des fichiers• les modalités d’accès aux données (formes et autorisations)• les différentes métadonnées utiles et leurs formats
• le niveau de préservation :• stockage sécurisé• possibilité de migration• conditions d’émulation
• le niveau d’attention et de surveillance (fréquence d’audit)• les durées de rétention
• le nombre maximum de chaque type de processus sur une période de temps• le temps maximum d’exécution d’une instance de chaque type de processus• les utilisateurs autorisés à lancer chaque type de processus
• le nombre de copies• les supports de stockage• les conditions de lecture et d’écriture• les particularités de stockage (par exemple, cryptage ou compression)
Afin de déterminer la structure des données à maîtriser, les responsabilités et les moyens à mettre en œuvre, le producteur des données, l’utilisateur et le gestionnaire signent
Les moyens informationnels
des métadonnées et des référentiels
La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer
Exemple : un livre numérisé
1ère question : Quel est ce livre ?Métadonnées descriptives
Les moyens informationnels
des métadonnées et des référentiels
Fichiers
Structure numérique
Exemple : un livre numérisé
1ère question : Quel est ce livre ?Métadonnées descriptives
2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?
Structure numérique
La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer
Les moyens informationnels
des métadonnées et des référentiels
Fichiers
Structure numérique
Exemple : un livre numérisé
1ère question : Quel est ce livre ?Métadonnées descriptives
3ème question : Quels sont les formats des fichiers ?Métadonnées techniques
2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?
Structure numérique
La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer
Les moyens informationnels
des métadonnées et des référentiels
Fichiers
Structure numérique
Exemple : un livre numérisé
1ère question : Quel est ce livre ?Métadonnées descriptives
3ème question : Quels sont les formats des fichiers ?Métadonnées techniques
2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?
Structure numérique
4ème question : l’organisation maîtrise-t-elle ces formats ?
Référentiel de formats
Formats
La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer
Les moyens informationnels
des métadonnées et des référentiels
Fichiers
Structure numérique
Exemple : un livre numérisé
1ère question : Quel est ce livre ?Métadonnées descriptives
3ème question : Quels sont les formats des fichiers ?Métadonnées techniques
2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?
Structure numérique
4ème question : l’organisation maîtrise-t-elle ces formats ?
Référentiel de formats
Formats
5ème question : Quand a eu lieu la numérisationet quel est le nom du scanner ?Métadonnées de provenance
La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer
Les moyens informationnels
des métadonnées et des référentiels
L’objet
Pages
Fichiers
Structure physique
Structure numérique
Exemple : un livre numérisé
1ère question : Quel est ce livre ?Métadonnées descriptives
3ème question : Quels sont les formats des fichiers ?Métadonnées techniques
2ème question : Quels sont tous les fichiersqui résultent de la numérisation ?
Structure numérique
4ème question : l’organisation maîtrise-t-elle ces formats ?
Référentiel de formats
Formats
5ème question : Quand a eu lieu la numérisationet quel est le nom du scanner ?Métadonnées de provenance
6ème question : A quelle page correspond chaque fichier ?Métadonnées de structure
La maîtrise de la collection numérique passe par une parfaite connaissance des données qui la composent et de toutes leurs caractéristiques, c’est-à-dire disposer
Les moyens techniquesAfin d’assurer les termes du contrat et les niveaux de services attendus,
le gestionnaire s’appuie sur
Un système de gestion de la collection numérique composé de
Outils de contrôle qualité,d’audit et de surveillance
Système destockage sécurisé
http://www.flickr.com/photos/zigazou76/3603710759/
Outils de planificationsd’actions en masse
Objectif : Assurer une stricte indépendance entre les données et le système
Outils de récupérationet de transformation
des données
Système d’indexationet d’interrogation des
métadonnées
Outils d’enrichissementdes métadonnées
Outil de gestion des référentiels
Les moyens humainsLe système ne constituant qu’un outil de gestion, son exploitation,
son évolution et l’application concrète des termes du contrat sont assurés par
Une organisation humaine pluri-disciplinaire
Les administrateurs Les experts de préservation
• Veiller au bon fonctionnement du système• Assister le producteur en cas de problème de qualité des données• Traiter les alertes renvoyées par le système • Assurer le maintien en condition opérationnelle de l'infrastructure de stockage• Valider/programmer/lancer les planifications des tâches opérationnelles (audit, migration…)• Négocier avec le producteur• Développer les évolutions du système
Professionnels de l’exploitationdes systèmes d’information
• Gérer les risques• Accompagner les producteurs dans l‘établissement de leur politique de préservation• Gérer les référentiels• Effectuer une veille sur les formats pour engager les réflexions sur les migrations• Veiller à l’adéquation des moyens mis en œuvre avec les besoins des communautés d’utilisateur cibles• Spécifier les évolutions fonctionnelles et du modèle de données
Professionnels de l’informationspécialistes de la conservation numérique
Les moyens réglementairesAfin d’assurer la transparence nécessaire pour donner confiance aux producteurs et l’interopérabilité sur le long terme, l’ensemble des moyens mis en œuvre doivent se baser sur
les normes et standards en vigueur
Exploitationdes donnéesModèles et cadres Structuration
des données
OAIS (ISO 14721)
Le document numérique : caractéristiques et enjeux
L’OAIS : un cadre normatif
Du signe à la connaissance : quelques définitions
En guise de conclusion
Moyens pour assurer la maîtrise de son information
L’OAIS : Penser le management de l’information numérique
Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :
Open Archival Information System, norme ISO 14721:2003
Mode d’emploi sous la forme d’une fusée à trois étages
L’OAIS : Penser le management de l’information numérique
Open Archival Information System, norme ISO 14721:2003
Mode d’emploi sous la forme d’une fusée à trois étages
Un modèle d’informations pour décrire la structure des
données
Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :
L’OAIS : Penser le management de l’information numérique
Open Archival Information System, norme ISO 14721:2003
Mode d’emploi sous la forme d’une fusée à trois étages
Un modèle d’informations pour décrire la structure des
données
Un modèle fonctionnel pour décrire les processus
subis par les données
Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :
L’OAIS : Penser le management de l’information numérique
Open Archival Information System, norme ISO 14721:2003
Mode d’emploi sous la forme d’une fusée à trois étages
Un modèle d’informations pour décrire la structure des
données
Un modèle fonctionnel pour décrire les processus
subis par les données
Pour mettre en place desstratégies de préservation
Face à l’enjeu scientifique, stratégique et économique que représente le défi d’assurer l’accès à la documentation obtenue par les explorations spatiales, les agences spatiales du monde entier ont mis au point un modèle conceptuel pour gérer l’information numérique sur le très long terme :
+ +
Objet physique
Le modèle d’informations : la notion de paquet
Dans la plaine rase, sous la nuit sans étoiles, d'une obscurité et d'une épaisseur d'encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé, coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n'avait la sensation de l'immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d'avoir balayé des lieues de marais et de terres nues.
Contenu Paratexte
Support
Connaissance
+ +
+ +
Objet physique
Objet numérique
Le modèle d’informations : la notion de paquet
Train de bits Information de représentation
Dans la plaine rase, sous la nuit sans étoiles, d'une obscurité et d'une épaisseur d'encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé, coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n'avait la sensation de l'immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d'avoir balayé des lieues de marais et de terres nues.
Contenu Paratexte
Information de pérennisation
Paquet
Support
Connaissance
+ +
+ +
Objet physique
Objet numérique
Le modèle d’informations : la notion de paquet
Train de bits Information de représentation
Dans la plaine rase, sous la nuit sans étoiles, d'une obscurité et d'une épaisseur d'encre, un homme suivait seul la grande route de Marchiennes à Montsou, dix kilomètres de pavé, coupant tout droit, à travers les champs de betteraves. Devant lui, il ne voyait même pas le sol noir, et il n'avait la sensation de l'immense horizon plat que par les souffles du vent de mars, des rafales larges comme sur une mer, glacées d'avoir balayé des lieues de marais et de terres nues.
Contenu Paratexte
Information de pérennisation
Paquet
Le paquet contient toutes les informations nécessaires pour appréhender et exploiter l’objet numérique
Support
Connaissance
Paquet d’archivage
Paquet de dissémination
Paquet de versement
Le modèle d’informations : le cycle de vie du paquet
La structure et le contenu du paquet évolue en fonction de l’étape dans son cycle de vie pour prendre la forme la plus appropriée à une gestion et une maîtrise optimales de l’information.
PRODUCTEUR
UTILISATEUR
MANAGEMENT
entrées
données
stockage
SIPAIP accès
DIP
ADMINISTRATION
PLANIFICATION DE LA PRESERVATION
Le modèle fonctionnel : processus et organisation
Le modèle fonctionnel définit les processus d’une archive et les responsabilités afférentes
Objectif de l’OAIS : maîtriser sur le long terme
Pour assurer la continuité de l’accès à une information intelligible, il faut prendre soin des objets-données et des informations nécessaires à leur exploitation.
Développer des stratégies de préservation
MigrationRafraîchissement de support
Renouvellement de support
Transformation Émulation
Migration de format Simuler l’environnement matériel et logiciel
Le modèle OAIS : une synthèse
L’OAIS est un modèle conceptuel pour construire un SI, un cadre, un guide de bonnes pratiques pour gérer l’information sur le très long terme
Il ne définit pas
Formats Application techniqueou informatique
Il définitde nombreux termes sont trop génériques ou trop
ambigusIl constitue
Référentiel commun
Le modèle OAIS : une synthèse
L’OAIS est un modèle conceptuel pour construire un SI, un cadre, un guide de bonnes pratiques pour gérer l’information sur le très long terme
Il ne définit pas
Formats Application techniqueou informatique
Il définitde nombreux termes sont trop génériques ou trop
ambigusIl constitue
Référentiel commun
À établir la responsabilité de la conservation : notion de mission, de contrat
À surveiller les documents avant que les dégradations ne se produisent (en général, avec le numérique, « après »= trop tard)
À garantir l’intégrité des documents, vérifier qu’ils ne sont pas altérés, et s’ils le sont, expliquer pourquoi
À organiser l’activité de conservation autour d’un référentiel commun pour faciliter les évolutions
La vision du SI dans le cadre de l’OAIS
La pérennisation passe par une attention sur les données dans la conception
expriment leurs besoins
Les utilisateurs
Expert fonctionnel
décrivent leurs données
Prennent en compte lesaspects fonctionnels
Rédigent les spécifications fonctionnelles
L’infrastructure matériel et logicel
modélisent les données
Les architectes techniques, les concepteurs et les développeurs traduisent les
spécifications et le modèle de données pour déployer
L’architecte de données
La vision du SI dans le cadre de l’OAIS
La pérennisation passe par une attention sur les données dans la conception et l’architecture du SI
expriment leurs besoins
Les utilisateurs
Expert fonctionnel
décrivent leurs données
Prennent en compte lesaspects fonctionnels
Rédigent les spécifications fonctionnelles
L’infrastructure matériel et logicel
modélisent les données
Les architectes techniques, les concepteurs et les développeurs traduisent les
spécifications et le modèle de données pour déployer
L’architecte de données
En plaçant les données au cœur du SI, les problématiques de la pérennisation débouche sur une nouvelle vision du SI : « Data first » et une nouvelle compétence : l’architecte de données.
L’organisation se donne les moyens demaîtriser ses données.
Les utilisateurs créent l’information
Les applications l’exploitent
Le document numérique : caractéristiques et enjeux
L’OAIS : un cadre normatif
Du signe à la connaissance : quelques définitions
En guise de conclusion
Moyens pour assurer la maîtrise de son information
En guise de conclusion…
Données
constituent la richesse des organisations
Mais, ils n’existentpas de politique globalede gestion des données du système d’information
http://www.flickr.com/photos/library_of_congress/2178285893/
En guise de conclusion…
Données
constituent la richesse des organisations
Mais, ils n’existentpas de politique globalede gestion des données du système d’information
et les donnéessont l’objet
d’obsolescences diverses http://www.flickr.com/photos/library_of_congress/2178285893/
En guise de conclusion…
Données
constituent la richesse des organisations
Mais, ils n’existentpas de politique globalede gestion des données du système d’information
et les donnéessont l’objet
d’obsolescences diverses
Pour en assurer l’accès et l’utilisabilité sur le long terme
Il faut les maîtriser
http://www.flickr.com/photos/library_of_congress/2178285893/
En guise de conclusion…
Moyensorganisationnels
Contratde service
Moyenstechniques
Systèmede gestion
Moyensréglementaires
NormesStandards
Moyenshumains
Organisationpluri-disciplinaire
Moyensstratégiques
Gestiondes risques
Données
constituent la richesse des organisations
Mais, ils n’existentpas de politique globalede gestion des données du système d’information
et les donnéessont l’objet
d’obsolescences diverses
Pour en assurer l’accès et l’utilisabilité sur le long terme
Il faut les maîtriser
Pour lesil faut déployer
maîtriser,une architecture de moyens
Moyensinformationnels
MétadonnéesRéférentiels
http://www.flickr.com/photos/library_of_congress/2178285893/