los archivos y linked open data: normativa de europeana y del w3c, de xavier agenjo
DESCRIPTION
Ponencia presentada en el ciclo de conferencias "Los archivos diocesanos: nuevos retos ante la era virtual" que tuvo lugar en la Sala de Conferencias de la Facultad de Filosofía y Letras de la Universidad Autónoma de Madrid (Campus de Cantoblanco), durante los días 11 y 12 de diciembre de 2012 y que fueron organizadas por la Universidad Autónoma de Madrid y el Archivo Diocesano de Madrid y patrocinadas por diversas empresas colaboradoras, entre las que figuraba DIGIBÍS.TRANSCRIPT
Los Archivos y Linked Open Data: normativa de Europeana y del W3C
Xavier Agenjo BullónFundación Ignacio [email protected]
Los Archivos Diocesanos: nuevos retos ante la era virtualMadrid, 11 y 12 de diciembre de 2012
Universidad Autónoma de Madrid / Archivo Diocesano de Madrid
1
4
5
6
El Grupo Incubador de Datos Vinculados de Bibliotecas del W3C
mayo de 2010 hasta agosto de 2011
contribuir a incrementar la interoperabilidad global de los datos de las bibliotecas en la Web
reunir a personas implicadas en actividades de la Web Semántica —centradas en los Datos Vinculados— en bibliotecas e instituciones afines
examinar las iniciativas en curso e identificar futuras vías de colaboración
7
8
Informe final
El informe final del Grupo Incubador examina cómo pueden utilizarse las normas de la Web Semántica y los principios de
Datos Vinculados para que los valiosos activos de información que las bibliotecas crean y tratan — recursos tales como datos
bibliográficos, autoridades y esquemas conceptuales — sean más visibles y reutilizables más allá de su contexto bibliotecario
original, en toda la extensión de la Web.
9
Biblioteca
Abarca la gama completa de las instituciones de memoria y de patrimonio cultural, lo que comprende a las bibliotecas, los museos y los archivos.
Hace referencia a tres conceptos distintos, pero relacionados: la colección de objetos físicos o abstractos (incluyendo
potencialmente los "digitales");
el sitio donde se localizan las colecciones;
y el agente que conserva la colección y administra el sitio.
Las colecciones pueden ser públicas o privadas, grandes o pequeñas, y no se limitan a ningún tipo de recurso en particular.
10
Datos de Bibliotecas
El término "Datos de bibliotecas" se refiere a cualquier tipo de información digital producida o conservada por las bibliotecas y que describe recursos o sirve para su localización.
El informe distingue, a efectos prácticos, tres tipos de datos de bibliotecas según su uso habitual:
conjuntos de datos,
conjuntos de elementos
vocabularios de valores
11
Datos vinculados
Datos Vinculados. son datos publicados según los principios establecidos para facilitar el enlace entre conjuntos de datos, conjuntos de elementos y vocabularios de valores [LINKEDDATA].
Los Datos Vinculados utilizan Uniform Resource Identifiers (URIs) como identificadores únicos globales para cualquier clase de recurso, de forma análoga a como se utilizan los identificadores en el tradicional proceso biblioteconómico de control de autoridades [URI].
Los Datos Vinculados se expresan por medio de estándares como Resource Description Framework (RDF)
12
Datos vinculados de bibliotecas
"Datos Vinculados" se refieren a la interoperabilidad técnica de los datos,
"Datos Abiertos" se centran en el aspecto legal de la interoperabilidad. Según las definiciones de Open Bibliographic Data [Datos Bibliográficos Abiertos], los Datos Abiertos son esencialmente algo utilizable libremente, reutilizables y redistribuibles, sujetos, como máximo, a los requisitos de reconocimiento y de compartir igual.
"Datos Vinculados de Bibliotecas" son cualquier tipo de datos de bibliotecas (como se ha definido antes) expresados en forma de Datos Vinculados.
13
Limitaciones de los datostradicionales de bibliotecas
Las normas de las bibliotecas están diseñadas únicamente para la comunidad bibliotecaria
Los datos de bibliotecas se expresan primordialmente en lenguaje natural textual
La comunidad bibliotecaria y la comunidad de la Web Semántica utilizan una terminología diferente para conceptos similares sobre metadatos
Los cambios tecnológicos en las bibliotecas dependen del desarrollo de sistemas comerciales
14
Recomendaciones
Identificar los conjuntos de datos candidatos a exponerse inmediatamente como Datos Vinculados
Fomentar el debate sobre Datos Abiertos y los derechos de propiedad
Incrementar la participación de las bibliotecas en la estandarización de la Web Semántica
Desarrollar normas sobre datos de bibliotecas compatibles con Datos Vinculados
Desarrollar y difundir mejores prácticas en el diseño de modelos ajustadas a Datos Vinculados de bibliotecas
Diseñar y probar servicios para los usuarios basados en las capacidades de Datos Vinculados
15
Recomendaciones
Crear URIs para los ítems de los conjuntos de datos de bibliotecas
Desarrollar políticas de gestión de vocabularios de Datos Vinculados y de sus URIs
Expresar los datos de bibliotecas por medio de la reutilización o del mapeo de vocabularios de Datos Vinculados
Preservar los conjuntos de elementos y los vocabularios de valores de Datos Vinculados
Aplicar la experiencia bibliotecaria en el tratamiento de los conjuntos de datos y su preservación a largo plazo en Datos Vinculados
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Modelización de EDM para Archivos
41
42
1.4 Ingestion (Annelies van Nispen)
Museums
Li
br
aries
Ar
chi
ves
PublishersCreative Industries
Roundtripping
Objective: to improve the ingestion workflow and to be completely EDM compliant
quality
control
All objects with rights labelsAll objects with preview
UIM
training and infoEDM
UIM and EDM fully implemented in ingestion
workflow
10 training days
43
KPIs
Advocate with the Europeana Network to improve access to cultural heritage material through open--oriented rights--related policies and regulatory initiatives that affect digitisation
Promote adoption of the Europeana licensing framework regarding Open Metadata aamong Europeana’s providers with EA WP5
Together with the Europeana Network and IFS develop advocacy positions to influence rights-related policies that affect mass digitisation and online access to and digital re-use of cultural information
2.2 Advocacy (Georgia Angelaki)
KPI 11: Ensure that all metadata in the Europeana Repository referring to Public Domain objects are correctly labelled
Tasks
KPI 12: The idea of the Cultural Commons has been successfully developed during two Presidency Events
44
45
46
47
48
Lo más importante
• Proporcionar información útil – Cualquier dato en LOD no es bueno por sí mismo: la granularidad
importa
• Incluir vínculos a otras URIs para que se pueden encontrar
más cosas – No se trata de convertir a RDF registros Dublin Core básicos, lo
que realmente son importantes son las relaciones con otros recursos y vocabularios (VIAF, DBpedia, WGS84, etc.).
– Vocabularios locales (LEM, DBpedia.es, GeoLinkedData, etc.
• [Incluir LOD en el proceso real de descripción]
49
50
51
Influenced
dc:creator dc:subject
Escepticismo
is related to
dc:subject
sameAs
skos:closeMatch
influenced
influenced
influenced
influenced
influenced
skos:closeMatch
sameAs
Influenced
is related tois related to
is related to
is related to
influenced
52
53
54
55
56
57Archivos y gestión de documentos ante la web semántica 57
58
59
60
Archivos y gestión de documentos ante la web semántica
6161
Archivos y gestión de documentos ante la web semántica
62
63
64
65
66
67
68
ArchivosRDF
BibliotecasRDF
MuseosRDF
PUC
Modelo Conceptual Simplificado LOD-LAM
URI
URI
URI
HTTP
HTTP
HTTP
69
LOD-LAM, nuevos objetivos profesionales
70
71
72
73
Los registros de autoridad son la base de LOD y EDM
El proceso de descripción debe cambiar para incorporar LOD
Cómo pasar a EDM y LOD sin perder un solo dato y sin duplicar o triplicar tareas
74