san-lod: el sistema archivístico nacional italiano como datos abiertos enlazados por alessandro...
TRANSCRIPT
Istituto Centrale per gli Archivi Istituto Centrale per gli Archivi
1
SAN-LODEl Sistema Archivístico Nacional Italiano como
Datos Abiertos Enlazados
http://dati.san.beniculturali.it
Alessandro Chiaretti
InnovaTICS, agosto 2014
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 2
Istituto Centrale per gli Archivi – ICAR
• Mandato institucional:
• Promover soluciones innovadoras para conseguir la interoperabilidad tecnológica y semántica entre los sistemas archivísticos del país;
• Realizar herramientas para la interoperabilidad tecnológica y semántica, y ofrecer servicios de uso avanzado dirigidos a distintos niveles de usuarios.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 3
Datos Abiertos Enlazados
• ¿Qué son? http://vimeo.com/album/2072014/video/49231112
• La Web Semántica y las iniciativas relacionadas con Datos Abiertos Enlazados estimulan a las instituciones para que publiquen, compartan y conecten sus datos;
• Gran potencial para las instituciones de memoria, proveedores de contenidos muy valiosos, en la medida que puedan complementar los propios datos con fuentes externas.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 4
LOD en Bibliotecas
• Las bibliotecas han reconocido este potencial, y ya son varias las que han abierto o están abriendo sus datos.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 5
LOD en archivos
• Todavía pocos ejemplos:– LOCAH y Linking Lives (Reino Unido);– ReLoad - Repository for Linked open archival data (Italia).
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 6
SAN - Sistema Archivistico Nazionale
• Sistema Archivístico Nacional de Italia;• Inaugurado en diciembre de 2011, gestionado por ICAR;• Portal aglutinador de recursos archivísticos: punto de acceso
integrado al patrimonio archivístico italiano, que pone a disposición descripciones de archivos y recursos digitales de naturaleza heterogénea;
• 553.214 recursos archivísticos y digitales, provenientes de 21 sistemas de archivos (estatales y privados);
• www.san.beniculturali.it
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 7
Catálogo de los recursos archivísticos - CAT
• Repositorio de datos archivísticos:• Conjuntos archivísticos;• Productores;• Instrumentos de descripción;• Conservadores;
• Los sistemas adheridos a SAN envían los datos en base a un formato de intercambio (XML schema) definido a nivel central en el año 2009 (Sottocommissione tecnica per la definizione dei metadati relativi alle risorse archivistiche rese accessibili attraverso il Sistema Archivistico Nazionale).
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 20148
SAN-LOD: objetivos
• Convertir los datos de SAN en Datos Abiertos Enlazado para:
• Poner a disposición recursos visibles y reusables en la web, también fuera de su contexto original de utilización y de creación;
• Permitir nuevas conexiones entre sujetos, personas, organizaciones y lugares, con la finalidad de promover la investigación interdisciplinaria y enriquecer el conocimiento histórico.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 9
SAN-LOD: objetivos
schemaEAD.xsd
SAN-LOD.owl
schemaEAC.xsd
strumenti.xsd
scons.xsd
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 10
Primera fase: la ontología
• Ontología: representación de un conjunto de conceptos y relaciones entre ellos en un dominio determinado, estructurada formalmente;
• OWL (Ontology Web Language) para formalizar el modelo conceptual SAN de descripción de objetos archivísticos, correspondiente a la estructura de los XML schema;
• Extensión de la estructura a través de introducción de nuevas entidades y relaciones (contextos históricos, perfiles de instituciones, tesauros SKOS).
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 11
La Ontología SAN:27 class y subclass, 50 data properties, 35 object properties
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 12
Tesauro SAN
• Tesauro en formato SKOS (Simple Knowledge Organisation System) que reúne a los diccionarios controlados del CAT SAN, y además agrega la posibilidad de asociar temas a los conjuntos archivísticos;
• Herramienta de soporte al control de la descripción archivística, que puede seguir integrando datos de varias proveniencias y convertirse en un marco de informaciones indispensables para contextualizar los datos.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 14
Segunda fase: los datos
• Transformación de los datos en OWL, en base a la ontología;
• Agregación a los datos originales de las propiedades más usadas en LOD (Dublin Core, Foaf…);
• Interlinking de los recursos SAN con recursos externos, de dominio archivístico (ReLoad) o más general (DBpedia, GeoNames…).
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 15
Soggetto produttore
Soggetto Conservatore
Complesso Archivistico
Tematismo
Luogo
Strumenti di ricerca
Profilo istituzionale
Contesto storico
istituzionale
GeoNames
DBpedia
Dominio GGASI
Otros dominios externos
SISTATIstat
Dominio SIAS
Datos Abiertos Enlazados SAN
ToponimiStorici
Persona
ente
famigliaRelazione
CPF
Sito web
Luogo Cons
Tesauro SAN
Dominio SAN
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 16
Publicación de los datos SAN-LOD
• http://dati.san.beniculturali.it;
• Licencia Italian Open Data Licence V.2.0;
• Todos los datos disponibles para la descarga, la navegación y la reutilización:
• 4.607.024 tripletas en Endpoint Sparql (Virtuoso rdf store);
• 97 datasets para descarga en formatos RDF/XML, TTL, CSV;
• Consulta Html.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 18
www.san.beniculturali.it
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 1919
http://dati.san.beniculturali.it
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 20
RAW DATA
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 201421
http://lodlive.it/
DBpedia
SAN
ReLoad
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 22
Próximas evoluciones: Atlas Histórico Institucional (ASI)
• Ulterior extensión de la ontología SAN-LOD;• Datos sobre la historia del territorio italiano, que van a ampliar
y profundizar el conocimiento; • Repertorio histórico administrativo-territorial, que pretende
poner a disposición de la comunidad un catálogo de autoridades de topónimos a nivel nacional;
• Los topónimos históricos de ASI van a constituir un marco de referencia en el entorno LOD, tanto para el SAN como para cualquier futura operación descriptiva de tipo histórico-geográfica.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014 23
Beneficios
• Aumento considerable de la visibilidad de los datos archivísticos, gracias a la publicación en formatos abiertos y a la interconexión con otras fuentes de información;
• Con la publicación centralizada de los datos por parte del SAN, todos los sistemas que lo componen se ven beneficiados, sin necesidad de hacer nuevas inversiones en tecnología;
• Los datos del SAN, como en general los datos de bibliotecas y archivos, son manejados por profesionales de la información y tienden a ser de muy alta calidad. Por ello, tienen el potencial de convertirse en una indispensable columna vertebral de la creciente Web Semántica.
SAN-LOD: El Sistema Archivístico Nacional Italiano como Datos Abiertos Enlazados
InnovaTICS 2014
Contactos
ICAR (Istituto Centrale per gli Archivi)Direttore: Marina Giannettovia di Castro Pretorio 105, 00185 Roma
[email protected]; [email protected];
http://www.icar.beniculturali.it/
24
Alessandro Chiaretti