acceso abierto al conocimiento científico, repositorios...
TRANSCRIPT
Acceso Abierto al conocimiento científico, Repositorios digitales y adopción de
estándares desde el SIU.
TICAL 2012. Lima, Perú, 2 de Julio de 2012.
Contexto de trabajo: sistema universitario estatal
• 48 Universidades estatales autónomas
• Ingreso irrestricto • Gratuitas • Organismo de evaluación y
acreditación CONEAU • Más de 1.300.000 de
alumnos • 220.000 mil personas
trabajando (docentes, administrativos, técnicos, etc.)
¿Qué es el SIU? • Es un consorcio de 46 Universidades Nacionales
Públicas que desarrolla sistemas para la toma de decisiones, el análisis institucional y la gestión en el ámbito del Sistema Universitario.
• El objetivo es dotar al sistema universitario de elementos que permitan mejorar la confiabilidad, completitud, disponibilidad e integridad de la información. Esto incluye desarrollo de software, apoyo a la implementación, capacitación y fortalecer la inteligencia colectiva.
Algunas decisiones
La Tecnología acompañando las estrategias y polí5cas del sistema universitario
Trabajo colabora5vo – Comunidades de Prác5ca
Adopción del so@ware libre en el año 2002. Desarrollo de una infraestructura de desarrollo propia
SIU Toba
El obje5vo es que los sistemas sean implementados y u5lizados como único so@ware para llevar
adelante la ges5ón
Sistemas de gestión o transaccionales
Seguimiento de graduados
Gestión de compras y contrataciones
Gestión económica financiera, presupuestaria y contable
Gestión de recursos humanos
Gestión académica
Gestión edilicia
Gestión de becas
Bibliotecas
Sistemas para la toma de decisiones
SIU-‐Wichi Sistema de Información Gerencial
Personal Presupuesto Alumnos Oferta
académica Infraestructura
No5cias Proyectos
Títulos legalizados Becas
CV de Docentes
Infraestructura Edilicia
Infouniversidades Voluntariado Incen5vos
Proceso categorización
Convalidaciones
Legalizaciones
PPUA -‐Proyectos
PPUA -‐Cine Nacional
Transferencias
Encuesta Alemania
Seg, de Becas
Bicentenario
CPRES Convenios
RHUN
Importador Presupuesto
Seg. De Expedientes
Becas
Encuesta a Graduados
Alumnos y Graduados
Presupuest. Contable Financiero
Contrat. Y
Patrimonio
Personal y sueldos
Sistema Universitario Nacional
Estadís5co De
Alumnos
Sistemas para la toma de decisiones
SIU-‐Wichi Sistema de Información Gerencial
Comunidades de Prácticas
Unas 10.000 personas conforman la
Comunidad SIU
Motiva Sensibiliza
Genera sentido de pertenencia Entusiasma Ejemplifica
Brinda conocimiento
¿Que es el Acceso Abierto?
2 modelos en la comunicación
formal de la ciencia
Tradicional:
• Publicaciones periódicas de editoriales comerciales. • Ni los autores, ni las instituciones académicas, ni los evaluadores reciben retribución económica por las actividades de creación, evaluación o sustento de la investigación por parte de las editoriales. • Produce una transferencia gratuita del conocimiento científico desde estas instituciones hacia las editoriales privadas. • Posteriormente, y a través de las suscripciones a las publicaciones periódicas, estas instituciones deben pagar para acceder al conocimiento que ellas mismas producen. (Gómez y Arias, 2002)
Movimiento de Acceso Abierto (1990’s)
• Surgido de la misma comunidad científica • Disponer de los resultados de la investigación en forma libre, inmediata y permanente • Dos vías: Repositorios institucionales y temáticos y las revistas de Acceso Abierto . • En el caso de los repositorios, las instituciones se reapropian de lo que producen y conservan derechos que les permiten la difusión abierta de la ciencia. (Kuramoto, 2006).
Repositorios de acceso abierto
Gestionan, centralizan, facilitan el acceso y preservan sus contenidos.
Los Repositorios de Acceso Abierto, cuyo nombre ha ido en aumento, son un componente importante de la infraestructura de e-investigación. El valor real de los repositorios recae en el potencial de interconexión para crear una red de repositorios, una red que puede proveer un acceso unificado a los resultados de la investigación y son (re-) utilizados por las máquinas y los investigadores.
Los repositorios deben resultar interoperables
COAR, 2011
Tipos de Repositorios
• Repositorio Temático. – Colaboran varias instituciones. – Subdivisiones o colecciones por temas, división
geográfica o institucional. – Puede ser multitemático (caso arxiv.org)
• Repositorio Institucional. – Institucionalmente definido / Oficialmente
reconocidos – Abarcan la áreas de conocimiento de la
institución • Para tipos específicos de material
– Tesis y disertaciones. – De Datos Básicos insumo de investigaciones
científicas
METADATOS - definiciones
“Los metadatos o datos representacionales son definidos como el dato sobre los datos,es un conjunto de elementos que poseen una semántica comúnmente aceptada, o sea tratan de representar la información electrónica tan dispersa y representan a la descripción bibliográfica de recursos electrónicos”
Rosa San Segundo Manuel
“Es un conjunto de atributos de catalogación de los documentos que permiten su identificación sin tener que ejecutarlos”
Ana Pavani
Esquemas de METADATOS - ¿Cuáles existen?¿Para que se usan?
Cs de la Salud HCE / HL7
Fotografía Exif / Picasa
Videos / Caso HTML 5
Contenidos Educativos
LOM / IEEE 1484.12.1:2002
De propósito general
Dublin Core, QDC MODS
Microformatos FOAF
DOAC Description of a Career
Ciencias Agrarias Agris XML
ODRL
Datos Biológicos Darwin Core
Repositorios de Acceso Abierto. Interoperabilidad
“…La interoperabilidad se define como la capacidad de intercambiar y compartir datos entre dos sistemas o componentes informáticos sin la intervención de un tercer sistema, de modo que la información o datos compartidos puedan ser utilizados sin requerir una comunicación previa…”
15 niveles!
• Sintáctica • Semántica • Técnica / Estructural • Pragmática • Organizacional • Conceptual • Dinámica • Legal • Social • Esquemática o Estructural • Intracomunitaria • Política-Humana • Internacional • Empírica y Física
The Police InformationTechnology Organisation añade a la definición de interoperabilidad, la capacidad de proporcionar o recibir servicios de otros sistemas
Protocolos de Interoperabilidad habitualmente soportados por las plataformas más comunes de RI
Solo algunos… y dependiendo de la plataforma…
• OAI-PMH • OAI-ORE • SWORD • Open Search • RSS Channels • Webservices accesibles a través de REST, http o SOAP • Protocolos de autenticación tales como LDAP, Shibboleth
Aplicaciones de estos protocolos • Servicios centralizados • Front-ends Drupal Islandora, WordPress • Ingesta automatizada a partir de instrumentos de medición • Single Sign On
OAI-PMH. Un modelo de interoperabilidad entre repositorios Es un protocolo que permite el intercambio de información referencial (OAI-PMH) texto completo / objeto digital (OAI-ORE / DIDL) acerca de recursos de información libremente disponibles a través de la web.
RI 1 RI 2 RI 3 Mi servidor
Harvesting (cosechar)
Funciona usando el protocolo http y devuelve resultados en XML. Puede devolver las referencias en los distintos tipos de metadato admitidos por el servidor
Datos & admision protocolo
Iniciativa Open Archives. Conceptos.
¿Como es un “registro” OAI?
<dc:title>Limits on the cosmological abundance of supermassive compact objects from a millilensing search in gamma-ray burst data</dc:title> <dc:creator>Nemiroff, Robert J.</dc:creator> <dc:creator>Marani, Gabriela F.</dc:creator> <dc:creator>Norris, Jay P.</dc:creator> <dc:creator>Bonnell, Jerry T.</dc:creator> <dc:description> A new search for the gravitational lens effects of a significant cosmological density of supermassive compact objects (SCOs) on gamma-ray bursts has yielded... </dc:description> <dc:description>Comment: 14 pages including 3 figures, appeared 2001 January 22</dc:description> <dc:date>2001-01-26</dc:date> <dc:type>text</dc:type>
<dc:identifier>http://arXiv.org/abs/astroph/0101488</dc:identifier>
<dc:identifier>Phys.Rev.Lett. 86 (2001) 580</dc:identifier> </oai_dc:dc> </metadata>
Datos para consulta
Datos para acceder al recurso digital
Se puede probar con la URL: http://arxiv.org/oai2?verb=ListRecords&from=2004-06-16&metadataPrefix=oai_dc
Michael Nelson (Old Dominion University). Valparaíso. Chile. Noviembre 2003
Directrices. ¿Que misión cumplen y cuales existen?
• Un conjunto de “mejores prácticas” para cubrir las interpretaciones que pueden darse a los estándares de interoperabilidad.
– Se cubren dos capas de interoperabilidad (sintáctica en el uso de OAI-PMH y OAI_DC) y semántica, en el uso de vocabularios.
– DRIVER 2.0, OpenAire 1.0, BDCol, SNRD, etc.
• Sirven de orientación a las instituciones que cuentan con un Repositorio o estén el proceso de implementarlo y deseen ofrecer su contenido.
• Permitirá la normalización y estandarización en los metadatos, facilitando la recuperación y ubicación de la producción científica de su institución
Tomado parcialmente de BDCOL y DRIVER
Servicios centralizados
Como una de las aplicaciones de las características de interoperabilidad de los Repositorios, los servicios centralizados consumen la información de los mismos brindando una interfaz única de acceso para el usuario final.
• Cosechadores • Agregadores • Repositorios centralizados
Acceso Abierto en Argentina.
• En la investigación llevada a cabo por Miguel, Gómez y Bongiovani se habla en números del estado del “Acceso abierto real y potencial de la producción científica argentina”.
• Los resultados de este estudio muestran que, en promedio, y para el conjunto de las temáticas estudiadas, el 70% de la producción científica argentina del período 2008-2010 incluida en Scopus se publica en revistas que se adhieren de una u otra forma al movimiento OA real y potencial “.
• A través de este estudio se concluye que en Argentina existen condiciones favorables para el crecimiento de los repositorios con literatura científica generada bajo la modalidad de acceso abierto
Situación de Argentina en relación a los Repositorios Institucionales.
• Proyecto de Ley de Creación de Repositorios Digitales abiertos de Ciencia y Tecnología. Media sanción de la Cámara de Diputados, en paso al Senado de la Nación.
“…Los organismos e instituciones públicas que componen el Sistema Nacional de Ciencia, Tecnología e Innovación (SNCTI) y que reciben financiamiento del Estado Nacional, deberán desarrollar repositorios digitales institucionales de acceso abierto, propios o compartidos, en los que se depositará la producción científico tecnológica resultante del trabajo, formación y/o proyectos, financiados con fondos públicos, de sus investigadores, tecnólogos, docentes, becariosde postdoctorado y estudiantes de maestría y doctorado…
• Creación del Sistema Nacional de Repositorios Digitales en el ámbito del MINCyT. Comisiones de Metadatos, Interoperabilidad, preservación digital, propiedad intelectual, etc-
• 29 Repositorios institucionales listados en el sitio ROAR. • 19 repositorios actualmente cosechados a través del protocolo OAI-
PMH.Portal de consultas único. Cosechador SIU-BDU2. • Directrices SNRD basadas en DRIVER • Varias iniciativas para la implementación de nuevos repositorios.
Ámbito de reunión, Ministerio de Ciencia, Tecnología e Innovación Productiva (MINCyT)
Situación de la Región en relación a los Repositorios de acceso abierto
Comparativo región con “mapa-mundi”
No tomar como único indicador número de Repositorios
Situación en América Latina en relación a los Repositorios
Institucionales. Redes Regionales Red Regional de Repositorios “La Referencia”
– El proyecto surge de RedClara, OUI Financiado por un proyecto BID.
– Creada para generar una estrategia Regional, Marco de acuerdos y Políticas comunes para la interoperabilidad y la gestión de la información científica, un Modelo Operativo desarrollado en torno al Piloto de la red federada de repositorios en la región y Una estrategia de Capacitación regional.
– Adhiere a directrices DRIVER. – Hasta el momento 8 países (Argentina, Brasil, Chile, Colombia,
Ecuador, México, Perú y Venezuela). – Interacción con otras redes, tales como COLABORA. Comunidad
Latinoamericana de Bibliotecas y Repositorios Digitales.
Rol del SIU con los Repositorios Institucionales en Argentina.
• Módulo Bibliotecas del SIU creado en 1997 a instancias de los Rectores Universitarios. Administra el catálogo referencial más importante y actualizado del país (2.5M registros, 82 contribuyentes).
• SIU adhiere a la corriente de acceso abierto y lleva adelante tareas de capacitación en el tema. En 2004 se realiza el taller del software TEDE.
• Año 2009, 7 RI en producción en Argentina contemplando el protocolo OAI-PMH. Se inicia un desarrollo aprovechando módulos de Perl pre-existentes para generar el módulo de cosecha, transformación de los metadatos.
• Se realiza un sitio web para la consulta de los metadatos obtenidos en el proceso de cosecha basado en la transformación de los XMLs obtenidos ingestados a Apache Solr.
• Se participa activamente en diferentes comisiones del SNRD-MINCyT.
Web semántica y los Repositorios Institucionales
Asistimos a diario a iniciativas importantes que se desarrollan en paralelo.
– Open Data: Las organizaciones (principalmente gubernamentales) se hallan en el proceso de publicar los datos que generan con la finalidad de posibilitar nuevos servicios y aplicaciones a partir de ellos. Un ejemplo: Periodismo basado en datos.
– Muchas de estas iniciativas liberan sus datos en formatos tales como CSV, texto plano, XML.
– En estos portales comienza a tomar relevancia la utilidad / necesidad de publicar sus instancias de datasets bajo los 4 principios de Linked Open Data (URIS para dataset propio, http, RDF, linkear con otras URIs de datasets externos).
– Se comienza a trabajar con nuevas tecnologías tales como endpoints SPARQL en implementaciones reales de la Web Of Data o Web Semántica.
Un ejemplo (hipótético) posible aplicable a los RI
Registro OAI con
esteroides RDF (Artículo)
Datos académicos de
sus autores (ej: CV) Proyectos de investigación financiados
en una disciplina
BDD Terminológica
Específica
RDF
RDF
RDF
Patentes para esa disciplina Datos geoespaciales
Datos Básicos insumo
o producto Investigación
Repositorios de datos
RDF
¿Como se podrían integrar los RI al cloud?
OAI2LOD Server. Experiencia
Como experiencia inicial hemos querido consumir servicios de DBPedia como recurso terminológico para encontrar términos relacionados con una expresión de consulta.
Se podrían consumir las imágenes de composición química de drogas, artículos relacionados de PubMed o IEEE, se podrían utilizar otros recursos terminológicos tales como Agrovoc, y muchos etc.
Convenio SIU-MINCyT (I) • El MinCyT realiza un convenio marco con el Consorcio
SIU para la transferencia de la/s tecnología/s relacionada/s con BDU2.
• Adicionalmente se realiza un relevamiento de los requerimientos para determinar las necesidades para la solución adecuada al SNRD-MINCyT. MINCyT-SNRD como entidad promotora y financiadora para la creación de repositorios en el ámbito nacional.
• Implementar las características de interoperabilidad técnica, sintáctica y semántica de las directrices SNRD
• Necesidad de llevar información estadística sobre el crecimiento de los repositorios, evolución en la aplicación de las directrices, proveer un servicio de validación para los repositorios que los ayude a transitar el proceso de aplicación de las directrices.
Evaluación y selección de la solución para el SNRD-MINCyT
• Se efectúa un relevamiento de las soluciones disponibles y el avance de las herramientas de base para la problemática.
• Se toman en cuenta las experiencias previas de agregadores a nivel nacional como el caso de Recolecta en España o el portal DRIVER.
• Opciones: Re-ingeniería del desarrollo BDU2 o contribuir con adaptaciones a un proyecto OSS pre-existente.
• Solución seleccionada: D-NET DRIVER.
Algunos aspectos tecnológicos de D-NET
Tareas realizadas hasta el momento
• 2 instalaciones realizadas con la supervisión del equipo de desarrollo de D-NET.
• Comunicaciones mantenidas por correo con el grupo de desarrollo de D-NET (Ene/Abril 2012).
• CNR-ISTI (Italia) • Universidad de Atenas (Grecia) • Universidad de Bielefield (Alemania)
• Videoconferencia con todos los integrantes del equipo, participa Recolecta y COAR contribuyendo con su experiencia en la implementación de la solución.
• Documentación / artefactos obtenidos como resultado.
• Manual de internacionalización sobre la plataforma web pública.
• Configuración deseable como infraestructura de TI para el deploy de la plataforma D-NET. Instrucciones para la configuración de cosecha de repositorios que representan casos particulares. Acceso al código fuente de la plataforma. (URL/ password)
Comunidad de práctica
en formación
Validador de directrices SNRD
• Validará aspectos de interoperabilidad estructural o técnica relacionados con el cumplimiento del protocolo OAI-PMH y de las directrices SNRD.
• Validará la existencia de metadatos obligatorios definidos por las directrices.
• Validará algunos aspectos de interoperabilidad semántica tales como vocabularios para los tipos de material, estándar ISO para los idiomas y las fechas, verificación de las URLs indicadas como destino del objeto digital y otras.
Herramienta destinada a facilitar a los RI aplicar para integrar el SNRD-MINCyT
Conclusiones
• El SIU a través del Módulo Bibliotecas, ha acompañado en los temas de relevancia actuales a las Bibliotecas Universitarias, actuando como un facilitador técnico, proveyendo productos tecnológicos concretos, capacitación y espacios de comunicación y debate para que las mismas puedan abordar tareas que representan desafíos para los cuales en muchos casos, no cuentan con recursos humanos o tecnológicos locales suficientes.
• En el caso de los Repositorios Institucionales, se ha trabajado desde el año 2004 ofreciendo la primera capacitación sobre el tema y en el 2009 presentando las ventajas de la adopción de estándares, de la normalización de los datos, del control de calidad de los mismos, de la interoperabilidad sintáctica y semántica. En el marco de dicha tarea es que se crearon los productos como BDU2, los eventos de capacitación y experimentos sobre la web semántica.
Conclusiones (II)
• Como corolario de dichas realizaciones, otras instituciones de orden nacional, reconocen estos esfuerzos y nos convocan a la labor de profundizarlas, exigiendo tareas de estudio y de investigación hasta alcanzar resultados óptimos. Esto resulta posible dado el grado de sinergia interno del staff SIU: Las implementaciones han sido posibles por el grado de experticia repartido entre áreas internas tales como IT, especialistas en bases de datos, especialistas en arquitectura de software, y el rol del Módulo como especialista en la temática específica.
• Por último es importante destacar la propuesta de fortalecer un proyecto de software libre pre-existente aportando desde documentación hasta modificaciones funcionales y adherir completamente a la cultura de compartir conocimiento, piedra fundacional del acceso abierto en el conocimiento científico
¿Preguntas?
TICAL 2012. Lima, Perú, 2 de Julio de 2012.
Lic.Luján Gurmendi Directora Ejecutiva Consorcio SIU
Isabel Piñeiro Coordinadora Módulo Bibliotecas
Consorcio SIU [email protected]
Emiliano Marmonti Informático Módulo Bibliotecas
Consorcio SIU [email protected]
TICAL 2012. Lima, Perú, 2 de Julio de 2012.