módulo 9 – repositorios de acceso abierto: tecnologías, estándares y plataformas remedios...
TRANSCRIPT
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Remedios Melero, (CSIC, España)[email protected]
Alicia López Medina (UNED, España)[email protected]
Publicaciones Científicas y Repositorios de Acceso AbiertoBogotá, Colombia, 9-11 de noviembre de 2010
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
“Con el fin de hacer realidad la visión de una representación global y accesible del conocimiento, la futura Web tiene que ser sostenible, interactiva y transparente. El contenido y las herramientas de software deben ser libremente accesibles y compatibles”
“Una versión completa del trabajo […] se deposita […] en por lo menos un repositorio online, que utilice estándares técnicos adecuados […] que busque la implementación del acceso abierto […] interoperabilidad […]”
Declaración de Berlín, 2003
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
La promesa de que los repositorios institucionales servirán de soporte a la realización del “Open Access” y mejorarán la comunicación científica depende de su capacidad para exponer sus contenidos de manera que sea posible crear servicios a escala global sobre esos contenidos.
Si se logra que el movimiento universal de acceso abierto se asiente sobre el sólido cimiento de una infraestructura de la información interconectada en una red internacional de repositorios, existen posibilidades reales de consolidar una nueva estructura de comunicación científica.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
La infraestructura global de redes de repositorios de acceso abierto como soporte a la investigación y la comunicación científica en el
mundo digital
¿Cómo la construimos?
No es sólo cuestión de tecnología, es también cuestión política, económica, social
Ahora, hablamos de tecnología
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Repositorio de Acceso Abierto
(se refiere a una propiedad de sus contenidos)
‘sus contenidos están accesibles libremente, sin restricciones y de forma permanente a través de Internet para ser usados”
Repositorio abierto (interoperable)
(se refiere a una propiedad del propio sistema)
“… que puede intercambiar procesos, servicios o datos con otros sistemas de manera que puedan trabajar juntos de forma eficiente”
Un primer nivel de interoperabilidad
R3
R4
R2
R1
?
Islas de información
Problema: difícil saber quépublicaciones tienen los repositoriosde acceso abierto. Las islas de información contrarrestan el objetivo de acceso abierto de mejorar la visibilidad y difusión de los resultados de la investigación científica.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Open Archive Initiative (OAI)
La interoperabilidad de los repositorios recibe un fuerte impulso con la Open Archive Initiative.
Sus orígenes están ligados al movimiento de Acceso Abierto . Uno de sus objetivos es desarrollar e impulsar estándares de interoperabilidad que faciliten una eficiente búsqueda y visibilidad de las publicaciones científicas distribuidas en diferentes repositorios, tanto institucionales como temáticos.
Es independiente de cualquier aplicación
La Open Archive Initiative ha creado un protocolo fundamental para conseguir un nivel básico de interoperabilidad entre los repositorios: el protocolo OAI-PMH
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
El protocolo OAI-PMH(Open Archive Initiative-Protocol for Metadata Harvesting)
Es un protocolo que permite a los repositorios exponer sus metadatos de manera que otros sistemas puedan recolectarlos y agregarlos para construir nuevos y más eficientes y útiles servicios que los que podría ofrecer cada repositorio individualmente.
Proporciona funcionalidades que son esenciales para las propuestas del movimiento por el Acceso Abierto a las publicaciones científicas
Si un repositorio es conforme con el protocolo, será un repositorio abierto, es decir, capaz de responder a las peticiones de sus metadatos que le hace otra máquina.
La interoperabilidad se produce en el nivel de los metadatos, no de los contenidos. De hecho, un archivo puede ser “abierto” en términos OAI y, sin embargo, no permitir el acceso libre al texto completo del documento.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
El modelo del protocolo OAI-PMH
Proveedor de datos: sistema (por ejemplo, un archivo digital) que ha implementado este protocolo, es decir, es capaz de responder a las peticiones de los metadatos de sus documentos por otra máquina.
Proveedores de servicios: organización que solicita y almacena en su base de datos los metadatos recolectados y ofrece servicios de valor añadido sobre esos metadatos: búsqueda, estadísticas, citas, etc.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Cómo funciona el protocolo OAI-PMH
R3
R4
R2
R1
Usuario
Capa de servicio
Servicios
Ya hemos creado un nivel básico de red repositorios de acceso abierto
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Servicios soportados por el OAI-PMH
Portales nacionales de acceso abierto a la producción científica: RCAAP, RECOLECTA, NARCIS, BDCOL en Colombia…
Portales internacionales: DRIVER, el proyecto CoLaBoRa, de red federada de repositorios latinoamericanos…
Motores de búsqueda científicos en la web: Google Scholar, Scientific Commons, OAISTER, BASE….
Revistas “overlay”
Portales especializados: el portal europeo de tesis DART
Colecciones temáticas virtuales
Servicios de citas: Citebase
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Pero para que se puedan crear servicios de calidad y útiles, no basta con ser conformes con el protocolo OAI-PMH
Los servicios requieren convenciones, que los repositorios acuerden cómo van a implementar el protocolo según los servicios que se pretenden crear.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Dublin Core – Elementos
Dublin Core es un pequeño y simple lenguaje –rudimentario- para encontrar recursos en Internet a través de diferentes dominios.
– Title– Subject– Description– Creator– Publisher– Contributor– Date
– Type– Format– Identifier– Source– Language– Relation– Coverage– Rights
Gracias a Maurice Vanderfeesten
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Esto no sería un problema si nuestro repositorio fuera el centro del universo...
Pero se convierte en un inconveniente tremendo si lo que queremos es agregar nuestros metadatos para crear servicios
útiles CON OTROS REPOSITORIOS
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Directrices DRIVER
Para guiar a los administradores de repositorios de forma que se garantice la interoperabilidad y compatibilidad con los servicios DRIVER
Basadas en mejores prácticas: resultado de la colaboración a nivel europeo de gestores de repositorios, proveedores de servicios y expertos en metadatos
Versión actual 2.0 (noviembre de 2008)
Traducidas al español, portugués y japonés; version en español: http://www.driver-support.eu/documents/DRIVER_2_1_Guidelines_Spanish.pdf
No son un estándar: se necesitan para normalizar las diferentes interpretaciones de los estándares OAI-PMH y DC en las implementaciones locales
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Directrices DRIVER
-Uso de OAI-PMH -Uso de los metadatos OAI_DC -Uso de mejores prácticas para OAI_DC-Uso del empaquetado de objetos compuestos -Uso de vocabularios y semántica -Uso de etiquetas de calidad -Uso de identificadores persistentes-Uso de Intercambio de Estadísticas-Uso de los derechos de Propiedad Intelectual (IPR)
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Hacia la creación de una infraestructura
Nueva unidad de información, más compleja y heterogénea.
Necesidad de integrar nuestros servicios con otras aplicaciones (donde ellos trabajan, llevan a cabo sus procesos, comparten….)
Ya no se trata sólo de poner cosas en el repositorio, ahora que exponerlas en la web
Todo ello implica la aparición en nuestro mundo de repositorios de nuevas tecnologías que tenemos que tener en cuenta.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Las publicaciones complejas o “enriquecidas”
La evolución del paisaje de la comunicación científica en el mundo digital hace posible que los investigadores depositen en los repositorios no sólo sus artículos sino también los datos sobre los que han basado su investigación y otros materiales complementarios, haciendo que los contenidos de los repositorios sean cada vez más heterogéneos y más complejos.
El acceso a estas publicaciones complejas (que incluyen con frecuencia diferentes ficheros de diferentes formatos, a veces archivados en diferentes lugares) es una cuestión prioritaria en la agenda de los repositorios
Metodos
Lab Books
Preprints
DataVideo
Blogs
Podcasts
Códigos
Algorithms
Modelos
Presentaciones
La revistaResultadosintermedios
Artículosrelacionados Comentarios
Planes
Modelos
Thanks to Carole Goble
Gente
La publicación
científica convertida
en una red en si
misma
La publicación
científica convertida
en una red en si
misma
Gracias a Sandy Payette
Necesidad de ser capaces de expresar relaciones legibles por maquinas entre los objetos en la web
No estamos solos en la web
Cada vez más importante relacionar la publicación con los datos
Im ag e O b jectW e b r e so ur c e
G ra ph ite O v e rla y Fra g m e n t
L A N LR e p o s i t o r y
S erv ice-B
U R I-1 0
T yp eU R I-1
T yp eU R I-3
T yp eU R I-4
T ypeU R I-7T ypeU R I-8
arX iv F ed ora
T yp eU R I-6
T ypeU R I-2
U R I-1
U R I-4
U R I-7
U R I-9
Gr id da t a se t
U R I-2
D o cu m en t
T yp eU R I-5
U R I-8
U R I-6
U R I-5
U R I-3
Cornell University and Los Alamos Nat’l Labhttp://www.infosci.cornell.edu/pathways
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
OAI-ORE: Open Archive Initiative-Open Reuse and Exchange: http://www.openarchives.org/ore/
OAI-ORE es un nuevo esfuerzo de interoperabilidad de la OAI
Su objetivo son los Objetos complejos (agregaciones) en la web
Su ámbito es más amplio que el ámbito de los repositorios
Open Archives Initiative Object Reuse and Exchange (OAI-ORE) define estándares para la descripciòn e intercambio de agregaciones de los recursos en la web. El objetivo de estos estándares es exponer el contenido de estas agregaciones a aplicaciones que soportan la creación, el depósito, intercambio visualización, reutilización y preservación de contenidos digitales.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Identificadores persistentes
Un elemento esencial para apoyar la infraestructura global de comunicación científica en Internet
Necesitamos una infraestructura global interoperable de identificadores persistentes
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Recursos
Persistent identifiershttps://repinf.pbworks.com/w/page/Persistent-identifiers
Author identificationhttps://repinf.pbworks.com/Author-identification
DRIVER Annex Use of Persistent Identifiershttp://wiki.surffoundation.nl/display/DRIVERguidelines/Annex+Use+of+Persistent+Identifiers
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Una organizacón sin ánimo de lucro cuyo objetivo es encontrar una solución para el problema de la ambiguedad de los nombres de los autores en la investigación científica.
Cómo:Crear un registro central de identificadores persistentes para investigadores individuales y un mecanismo abierto y transparente para enlazar el registro ORCID con otros sistemas de Identificador Persistente de Autor existentes.
Estos identificadores y las relaciones entre ellos se vincularían con los resultados científicos del investigador de manera que se mejoraría el proceso de descubrimiento científico y la eficiencia de la financiación de la investigación así como la colaboración entre la comunidad científica.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
El depósito transparente
No existe una interfaz estándar para transferir objetos digitales entre repositorios
No se puede depositar en más de un repositorio con un único ‘click’
No se puede iniciar un proceso de depósito desde fuera de un sistema de repositorio
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword - Introducción
(Simple Web-services Offering Repository Deposit)
Un protocolo para depositar objetos digitales en lugares diferentes
Proyecto financiado por JISC iniciado en 2007 Creado por encima del protocolo Atom Publishing Protocol
(APP o ATOMPUB)
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword – Implementaciones
Interfaces SWORD en varios repositorios Dsapce, Eprints,FedoraOpen Journal Systems Plugin: SWORD 1.2 Repository DepositMicrosoft Article Authoring Add-in for Word 2007SWORD Widget - For Netvibes, IgoogleFacebook clientArXivOpen Repository de Biomedcentral
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword – Casos de uso
Depositar desde una herramienta de Escritorio en línea Depósito múltiple: en un repositorio institucional, en un repositorio
de un financiador (mandato) y en un repositorio temático con una sola acción
Depósito automáticao desde una máquina, por ejemplo desde una máquina de laboratorio
Depositarlo en OJS y en el repositorio Migración/transferencia, por ejemplo a un servicio de preservación Depósito mediado, por ejemplo por un bibliotecario, a repositorios
adicionales.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword – información y contacto
SWORD Website:http://www.swordapp.org
Preguntas generales:Adrian [email protected]
Preguntas técnicas:Sword sourceforge [email protected]
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Actúa localmente
Piensa en internacional
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Las plataformas de repositorios
La decisión sobre qué plataforma vamos a escoger para nuestro repositorio debe estar basada no sólo en la naturaleza de nuestras colecciones y en las capacidades técnicas y funcionales del sistema sino también en determinar cuál encaja mejor con la estrategia tecnológica de la organización y con la disponibilidad del esfuerzo local de desarrollo del software
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Opciones:
Plataformas de código abiertoDSpaceEprintsFedora
Plataformas gratuitas, pero no de código abiertoZentity (Microsoft)
Plataformas comerciales
Plataformas como SAAS (Software as a service)Eprints Services: http://www.eprints.org/services/Open Repository: http://www.openrepository.com/
Directorio de plataformas de
repositorios:-http://repinf.pbworks.com/Repository-s
oftware
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
DuraSpace es una organización sin ánimo de lucro que nace como resultado de la fusión de las dos organizaciones Dspace Foundation y Fedora Commons. Su objetivo es sostener y mejorar ambas plataformas que continúan su desarrollo respectivo aunque buscando sinergias y alianzas que mejoren en el futuro sus funcionalidades.http://www.duraspace.org/
DSpacehttp://www.dspace.org/Grupo de usuarios Dspace España GUDEhttp://sod.upc.es/gude/index.php/Portada
Fedora Commonshttp://fedora-commons.org/
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Cómo elegir una plataforma de software para nuestro repositorio
(2009) El RSP (Repository Support Project, JISC) realizó una encuesta entre los proveedores de software para repositorios cuyos resultados pueden verse en una tabla comparativa (http://www.rsp.ac.uk/software/surveyresults2010) que analiza 50 funcionalidades con enlaces a hojas informativas para cada producto: Contentdm, Digital Commons, Digitool, Dspace, EPrints, Equella, FEDORA, IntraLibrary, Open Repository, VITAL, Zentity.
La última actualización incluye cuestiones adicionales que cubren nuevas tecnologías como la web 2.0 así como mayor detalle en los costes de los productos.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Development of a Digital Repository for NLM Digitized Collections and Born-Digital Resourceshttp://www.nlm.nih.gov/digitalrepository/index.html
El Instituto Nacional de Salud (NIH) junto con la Biblioteca Nacional de Medicina (NML), llevaron a cabo un proyecto para evaluar, examinar y recomendar una plataforma para la gestión y preservación de las colecciones y diversos objetos digitales de la NLM.
Código abiertoDAITSSDSpace EprintFedoraGreenstoneKeystone DLS.
Comercial: ArchivalWare , CONTENTdm , DigiTool , VITAL.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
"Master Evaluation Criteria que elaboró el Grupo de Trabajo de la NML
Funcionalidad – Grado de satisfacción con los requerimientos enumerados en las especificaciones de requerimientos funcionales definidos por la NML Escalabilidad – Capacidad del repositorio de escalar para manejar grandes colecciones de objetos digitales.Extensibilidad – Capacidad para integrar herramientas externas para extender la funcionalidad del repositorio, vía APIs o modificando el código baseInteroperabilidad – Capacidad del repositorio para interoperar con otros repositorios (tanto dentro de la NML como externos) y con el sistema integrado de bibliotecas de la NMLFácil despliegue– Simplicidad de instalación y fácil integración con otros software que se necesiten .Seguridad del sistema– Capacidad del sistema de cumplir con los requisitios de seguridad de NIH/NLM .Rendimiento del sistema - El rendimiento global y el tiempo de respuesta (realizada a través de pruebas de carga). Sistema de disponibilidad (24x7 tanto interna como externamente).
Apoyo de la plataforma – Sistema operativo y requerimientos de base de datos. Conocimientos del persona para tratar con la infraestructura requerida.Despliegues con éxito demostrados – Número relativo de usuarios y organizaciones satisfechos.Apoyo del sistema – Calidad de la documentación y respuesta y responsabilidad del personal de mantenimiento o desarrolladores de la comunidad de usuarios (código abierto) para asistir con los problemas.Fuerza del desarrollo de la comunidad – Fiabilidad y constancia del apoyo de la empresa proveedora del software, o el tamaño, la productividad y la cohesión de la comunidad de código abierto de desarrollo.Estabilidad del desarrollo de la organización – La viabilidad de la empresa proveedora del software, o la estabilidad de las fuentes de financiación y organizaciones que desarrollan software de código abierto.Fuerza de la hoja de ruta tecnológica para el futuro– Hoja de ruta tecnológica que defina la evoluTechnology roadmap que defina una ruta de evolución del sistema que incorpore las innovaciones y las "prácticas siguiente" que puedan aportar valor.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
http://blogs.lib.purdue.edu/rep/
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 License.
Muchas gracias por su atención
Reme Melero
Alicia López Medina
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas