Download - Tema 4 Repositorios De InformacióN
Repositorios de información
Salvador González Sánchez
Definición
• Un repositorio, depósito o archivo es un sitio centralizado donde se
almacena y mantiene información digital, habitualmente bases de datos
o archivos informáticos.
Definición• El origen de la palabra española repositorio
deriva del latín repositorium, que significaba armario, alacena. Este significado se
generalizó (por metonimia) en español y es recogido en el Diccionario de la Real
Academia (DRAE) como: "Lugar donde se guarda algo", y de ahí se aplicó al léxico
específico de la informática para designar los depósitos de información digital.
Definición• Los depósitos están preparados para
distribuirse habitualmente sirviéndose de una red informática como Internet o en un
medio físico como un disco compacto. Y pueden ser de acceso público, o pueden
estar protegidos y necesitar de una autentificación previa. Los depósitos más
conocidos son los de carácter académico y los institucionales.
Definición
• A diferencia de las computadoras personales o de las pc de escritorio,
los depósitos suelen contar con sistemas de Backup y mantenimiento
preventivo y correctivo, lo que hace que nuestra información se pueda recuperar en el caso que nuestra máquina o pc quede inutilizable.
• Consisten en grandes volúmenes de datos que contienen documentos de texto o imágenes,
representan un caso de bases de datos no estructuradas. El usuario localiza documentos y
objetos haciendo una descripción de ellos. • Un usuario que busca información en un repositorio,
describe de manera breve el documento que quiere obtener como respuesta. El resultado es que el
usuario ``navega'' en el repositorio realizando consultas y refinando resultados hasta que queda
satisfecho.
Repositorios de información
Repositorios de información
• La información contenida en los repositorios es volátil, y por este motivo no es posible definir una estructura,
aún cuando en principio sería posible utilizar una base de datos relacional.
• La información se almacena sin restricciones, pero de la misma manera se desecha, la única manera de
controlar los datos almacenados dentro de un repositorio, es mediante su tiempo de permanencia;
es decir, cuando llega información y no es consultada dentro de un margen de tiempo se borra.
Situación actual• La lógica evolución del Web desde hace
más de 10 años ha ido produciendo la sustitución de páginas y documentos estáticos por documentos generados
dinámicamente, gracias a la interacción del usuario con la lógica de procesos y flujos de
trabajo definida por los creadores del servicio y a la disponibilidad de cada vez
mayores repositorios de información.
• Los servicios de información y documentación accesibles a través de
Internet, más concretamente mediante servidores Web, están
aumentando de una forma exponencial.
Situación actual
Sistemas de Gestión de Contenidos
• Las herramientas para este trabajo han recibido la denominación de
sistemas de gestión de contenidos (o Content Management Systems,
CMS), y se han integrado con los sistemas de gestión documental y con
los de recuperación de información.
Sistemas de Gestión de Contenidos• La concepción actual de la gestión de
información, el control de los procesos es un elemento nuclear, por lo que se acompañan de sistemas de
workflow , o de flujos de trabajo.
Sistemas de Gestión de Contenidos
• Con todo ello se puede delinear un paisaje en el cual las herramientas de
gestión documental han ido incorporando a sus prestaciones las
capacidades necesarias para gestionar los procesos que crean,
almacenan, tratan y presentan información, en entorno digital.
Sistemas de Gestión de Contenidos• En la parte humana, las herramientas
para gestión de contenidos sólo se pueden entender en un entorno de
trabajo en colaboración y distribuido, ya que es en este tipo de ambientes donde se puede aprovechar todo su
potencial.
Actividades y procesos de gestión de contenidos
• La gestión de contenidos debe definirse desde la perspectiva de su
objetivo y actividades.
Actividades y procesos de gestión de contenidos
• Frente a la gestión de documentos, que tiene como objeto de trabajo
documentos, como su propio nombre indica, la gestión de contenidos está
orientada a gestionar objetos que actúan como componentes de
documentos virtuales, en el contexto de lo que llama segmentación.
Actividades y procesos de gestión de contenidos• Los objetos son tratados mediante un
conjunto de procesos estructurados con la finalidad de producir
publicaciones digitales basadas en la metáfora del documento.
Actividades y procesos de gestión de contenidos
• Como en otros métodos y técnicas directamente relacionados con el
desarrollo de la Sociedad de la Información y del Conocimiento, las
formulaciones teóricas han seguido a la necesidad y a su resolución
tecnológica, o han discurrido en paralelo.
Actividades y procesos de gestión de contenidos
• En este sentido, la gestión de contenidos se ha beneficiado de las técnicas y procesos de producción y edición de publicaciones digitales en
un primer momento.
Actividades y procesos de gestión de contenidos
• El proceso de publicación digital más sencillo define un proceso en el cual
se diseña un marco de integración para un conjunto de objetos, cuyo
resultado final es la publicación del documento digital.
Actividades y procesos de gestión de contenidos
• Evidentemente, este proceso, que puede reflejar el esquema más simple de
funcionamiento de un weblog, se complica si se sitúa en el contexto de una unidad o sistema de información que debe crear
información digital más compleja, y que, además, debe servir a comunidades de usuarios especializados, o a diferentes
comunidades de usuarios.
Actividades y procesos de gestión de contenidos
• Los objetos que componen los documentos pueden proceder de
diferentes fuentes y tener diferentes formatos, con lo que es necesario
controlar repositorios de información.
Especialidades de la Gestión de Contenidos
• Esta complejidad ha producido el desarrollo de dos especializaciones
principales de la gestión de contenidos:
• Web Content Management , WCM, y Enterprise Content Management , ECM.
Web Content Management
• Se centra en el entorno Web, y su objetivo principal y sus métodos se
orientan a la producción de documentos e información digitales
para el Web, especialmente para portales y Webs corporativos.
Enterprise Content Management
• Encuentra su fundamento en la idea de gestión total de la información en
las organizaciones mediante la integración de toda la información
necesaria para alcanzar los objetivos de la organización proveniente no
sólo de sistemas de publicación, sino también de sistemas ERP, gestión de
documentos, datawarehouses, etc.
Bibliotecas Digitales
• Otro enfoque especializado es el que considera las herramientas
para desarrollo de bibliotecas digitales como Sistemas de Gestión de
Contenidos
Gestión de Contenidos• Los trabajos sobre gestión de contenidos
coinciden en señalar que un sistema de este tipo debe ofrecer, como mínimo, una
aplicación nuclear CMS que soporte los procesos de publicación, flujo de trabajo y
repositorios de información; un repositorio de información; herramientas de integración de información externa; y modelos y templates
para productos finales.
Content Management Systems
• Un CMS se compone de varios subsistemas que interaccionan entre ellos:
• Colección: subsistema encargado de la creación y/o adquisición de información. Debe dar soporte a los
procesos de creación de contenidos, soporte a flujos de trabajo, sindicación e integración de fuentes
externas. Además, debe ofrecer soporte a procesos de conversión entre formatos diversos, y a la
agregación de contenidos de fuentes diversas en estructuras específicas.
Content Management Systems
• Gestión: subsistema encargado de la gestión y control de los repositorios de
información, de los grupos de usuarios, y de los procesos de soporte para los otros subsistemas. Se encarga de definir y controlar los flujos de trabajo que son
utilizados por los otros subsistemas, y de la definición de parámetros para el
funcionamiento del sistema.
Content Management Systems
• Publicación: subsistema encargado de la producción final de publicaciones o
productos de información digital, de manera automática o casi automática. Utiliza un
modelo basado en templates y deberá ofrecer posibilidades de personalización
para usuarios y la posibilidad de producir para diferentes tipos de plataformas y/o
clientes.
Plataformas para desarrollo de gestión de contenidos
• Zope, http://www.zope.org/• Typo3, http://www.typo3.org/
• Midgard Project, http://www.midgard.project.org/• OpenCMS, http://www.opencms.org/
• Apache Lenya, http://lenya.apache.org/
Plataformas para desarrollo de gestión de contenidos
Plataformas para desarrollo de gestión de contenidos
Portales para la gestión de contenidos
• Funcionan como soporte y herramienta básica de los servicios de
información Web, es una de las funciones principales que
desempeñan los sistemas de gestión de contenidos para portales
Portales para la gestión de contenidos
• Su funcionalidad, administración y mecanismos de control están especialmente orientados a ofrecer a sus usuarios un portal
con diferentes tipos de contenidos y de servicios, desde la publicación de noticias, al
repositorio de documentos, pasando por foros, encuentras, sindicación de contenidos, creación de perfiles y de grupos de usuarios,
personalización de la información y de su presentación, etc.
Portales para la gestión de contenidosLos más extendidos son:
• PHP Nuke, http://phpnuke.org/• Drupal, http://www.drupal.org/
• Mambo, http://www.mamboserver.com/• Plone, http://www.plone.org/
Aula Virtual
• Son entornos que ofrecen las prestaciones necesarias para crear
contenidos para aprendizaje en línea, y ciertos mecanismos de interacción,
como foros, chats, evaluación interactiva, etc.
Aula Virtual
• En realidad, la mayoría de ellos siguen esquemas de aula clásica,
traspasados al entorno Web, más que ser entornos de aprendizaje virtual
proactivo.
Aula Virtual
• Este tipo de plataformas han ajustado las prestaciones de gestión de
contenidos a las características del material docente en formato digital.
Aula Virtual
Las plataformas más conocidas son:• Claroline, http://www.claroline.net/
• Moodle, http://www.moodle.org/
Bibliotecas digitales
• Son el paradigma para los servicios de información de finales del siglo XX
y comienzos del siglo XXI, organizadas alrededor del terceto que forman los usuarios, las colecciones,
y los servicios de valor añadido, se configuran como un espacio
altamente especializado para la gestión de contenidos.
Bibliotecas digitales
• El desarrollo de colecciones digitales, la organización y creación de los
mecanismos de acceso o la gestión de metadatos se benefician de la combinación de los procesos de
publicación digital, y de los principios de gestión de información.
Bibliotecas digitales
• Además, tienden a configurar espacios de colaboración, mediante el
acceso y la gestión de colecciones distribuidas.
Bibliotecas digitales
• El estado actual de las principales herramientas es diverso, así como
sus enfoques, ya que van desde repositorios federados de documentos
(como Fedora), hasta herramientas de usuario final (como Greenstone).
Bibliotecas digitales
Este tipo de herramientas es más exigente, en sus requerimientos, que los otros tipos indicados en este texto.
• Fedora, http://www.fedora.info/• Dspace, http://www.dspace.org/
• Greenstone, http://www.greenstone.org/
Bibliotecas digitales
Estas son solo algunas• Library and Information Science http://eprints.rclis.org/
Publicaciones digitales • son plataformas especialmente diseñadas
teniendo en cuenta las necesidades de las publicaciones digitales, tales como
periódicos, revistas, etc. En consecuencia, sus prestaciones están orientadas al control
de los procesos de edición, creación y publicación de contenidos, más que al desarrollo de aplicaciones o portales.
Publicaciones digitales
• De especial interés van a resultar en los próximos años todos los sistemas
dedicados a la publicación de revistas científicas que den soporte al proceso
de envío, revisión y publicación.
Publicaciones digitales
• Aunque no es exactamente un sistema de publicación de revistas se
ha incluido en el listado ePrints por su interés para el ámbito académico y su
posibilidad de ser adaptado para publicaciones.
Publicaciones digitales
• Cofax, http://www.cofax.org/• Open Journal Systems, http://
www.pkp.ubc.ca/ojs/• ePrints, http://www.eprints.org/
Entornos para colaboración
• Corresponderían a la clásica definición de groupware, herramientas
para trabajo en grupo. • Su objetivo es dar a grupos de
usuarios especializados las prestaciones necesarias para llevar a cabo trabajos y proyectos en común.
Entornos para colaboración
• En este tipo de entornos, los flujos de trabajo, los usuarios, los puntos de
control y los documentos entregables (deliverables) son los contenidos
clave a gestionar.
Entornos para colaboración
• Además, se necesitan herramientas de control de tiempos y actividades
junto a posibilidades de comunicación síncrona y asíncrona.
• Se trata, entonces, de una especialización evidente de la gestión de contenidos que se relaciona con la
gestión de proyectos.
Entornos para colaboración
• Un entorno colaborativo muy conocido y extendido es wiki , sobre todo destinado a la
elaboración de documentos para comunidades de interés.
• Existen gran número de plataformas wiki que han ido aumentando progresivamente sus
prestaciones, de manera que unos autores las sitúan entre las herramientas
Entornos para colaboración
• eGroupware, http://www.egroupware.org/• phpCollab, http://www.php-collab.org/
• Wiki (web de referencia), http://www.wiki.org/
Entornos para colaboración WIKI• Wikipedia • Wikidiccionario• Wikisource• Wikilibros• Wikiquote• Wikinoticias• Wikimediacommons• Wikiespecies• Wikiversidad• Wikilearning• Wiki.mailxmail• Wikimapia
Wikipedia
• Es la aplicación Web 2.0, más conocida. Se trata de una enciclopedia libre, que se escribe en forma libre por voluntarios,
permitiendo que la gran mayoría de los artículos sea modificados por cualquier
persona con acceso mediante un navegador Web
• http://es.wikipedia.org
Wikidiccionario
• Como su nombre lo indica es un diccionario con sinónimos, en línea.
http://es.wikitionary.org/wiki
Wikibiblioteca
• Recopila libros con licencia GFDL (licencia copyleft que permite copiar y redistribuir su
contenido, con o sin modificaciones) o de dominio publico.
• http://es.wikisource.org
Wikilibros
• Se pone a disposición de quien lo desee libros de texto, manuales,
tutoriales u otros textos de carácter pedagógico.
• http://es.wikibooks.org
Wikiquote
• Wiki citas, agrupa un compendio de frases celebres
• http://es.wikiquote.org
Wikinoticias
• Es una fuente de noticias de contenido libre
• http://es.wikinews.org
Wiki Media Commons
• Es un deposito de imágenes y contenido multimedia
• http://commons.wikimedia.org
Wikiespecies
• Desarrolla un repertorio de especies biologicas
• http://species.wikimedia.org
Wikiversidad
• Consiste en un plataforma educativa on-line libre y gratuita. Donde se
pueden crear contenidos didácticos, trabajos cooperativos, exámenes,
ejercicios teóricos o prácticos, foros de discusión sobre las diferentes
materias.• http://es.wikiversity.org
Wikilearning
• Es un portal que ofrece la formación libre, otorgando documentos y objetos
de estudio.• http://wikilearning.org
Wiki.mailxmail
• Portal que permite crear y alojar paginas Wiki (que pueden ser
visitadas y editadas por cualquier usuario), con enlaces, imágenes y
cualquier tipo de contenido.• http://wiki,mailxmail.org
Wikimapia
• Es una Web en la que se presentan los mapas del buscador Google junto
con un sistema Wiki, que permite a cualquier usuario insertar información
en forma de anotaciones• http://wikimapia.org
Blogs o bitácoras
• Son el fenómeno, ya consolidado, que ha dado un verdadero potencial
democrático a la Web, a pesar de los inconvenientes que pueda conllevar.
Blogs o bitácoras
• Los blogs muestran un modelo de gestión de contenidos bastante simplificado, ya que suelen ser
monousuario, y con un sencillo flujo de trabajo, lo que ha facilitado su
expansión entre amplios grupos de usuarios sin conocimientos técnicos
profundos.
Blogs o bitácoras
• A pesar de que los grandes servidores de blogs dan al usuario la
solución ya implementada, existen herramientas para blogs, que puede
ser instalados y operados bajo licencia libre.
Blogs o bitácoras
• Debe indicarse, en cambio, una tendencia a aumentar las
prestaciones de los blogs, intentando dotarlos de parecidas características a las disponibles en las herramientas
para portales.
Blogs o bitácoras• WordPress, http://wordpress.org/• Blogger, http:/www.blogger.com/
• MySpace, http://wordpress.org/• Yahoo! 360º, http://360.yahoo.com/
• Windows Live Spaces, http://spaces.live.com/• Technorati, http://technorati.com/
Algunos repositorios diversos
• Monografias, www.monografias.com• Universia, www.universia.net
• El Prisma, www.elprisma.com• Ministerio de Educación de España
http://recursos.cnice.mec.es