sistema de circulación automatizado por internet para la biblioteca de la fundación arturo...
DESCRIPTION
Sistema de automatización de bibliotecas, describe los problemas técnicos de crear un sistema web, opac, sistema de reservas y circulación bibliotecario.Explica conceptos sobre las aplicaciones cliente /servidor, uml web, CDS/ISIS, recuperación de la informaciónTRANSCRIPT
-
ESTUDIOS CON RECONOCIMIENTO DE VALIDEZ OFICIAL SEP NMERO 972142 DE FECHA 10 DE JUNIO DE 1997
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO
ROSENBLUETH
TESIS
QUE PARA OBTENER EL TTULO DE
INGENIERO EN COMPUTACIN
PRESENTA:
ARTURO FRAPP MUOZ
ASESOR: ING. ABELARDO HERRERO PEREZRUL
MEXICO, D.F. ABRIL 2004
-
4
Contenido Introduccin. .................................................................................................................... 7
Descripcin del Problema............................................................................................. 8 Importancia de este trabajo. ......................................................................................... 9 Planteamiento del problema de Investigacin. ............................................................. 9 Posibles soluciones.................................................................................................... 10 Planteamiento de la solucin...................................................................................... 10 Alcance y limitaciones de soluciones planteadas....................................................... 12 Resultados deseables de esta tesis. .......................................................................... 12 Aplicabilidad de la solucin. ....................................................................................... 12 Desarrollo de la tecnologa nacional en este campo. ................................................. 13 Perspectivas de venta. ............................................................................................... 13 Descripcin breve del contenido de este trabajo........................................................ 14
Captulo I Fundamentos de Bibliotecologa................................................................... 15
1.1 Los servicios que ofrece una biblioteca................................................................ 16 1.1.1 Servicios al Pblico. .......................................................................................... 16 1.1.2 Procesos Tcnicos. ........................................................................................... 20 1.2 Automatizacin de Bibliotecas.............................................................................. 24 1.2.1 Los servicios de la biblioteca bajo la ptica de la automatizacin. .................... 25 1.3 Formato de datos MARC..................................................................................... 26 1.3.1 Ventajas del Formato de datos MARC. ............................................................. 28 1.4 Recuperacin de Informacin.............................................................................. 29 1.4.2 Recuperacin de Informacin basada en texto. ................................................ 31 1.4.3 Catlogos Automatizados de Bibliotecas y la Recuperacin de Informacin. ... 32
Captulo II Fundamentos de Computacin.................................................................... 35
2.1 Plataforma de bases de datos.............................................................................. 36 2.1.1 La tecnologa CDS/ISIS..................................................................................... 39 2.2 Modelo cliente / servidor....................................................................................... 42 2.2.1 Bloques del modelo cliente / servidor. ............................................................... 43 2.2.2 Procesamiento cooperativo cliente / servidor. .................................................. 45 2.2.3 Componentes del Middleware World Wide Web. ............................................. 45 2.3 Aplicaciones Web................................................................................................. 48
Captulo III Desarrollo del SCAI-BIBFAR. ..................................................................... 50
3.1 Introduccin.......................................................................................................... 51 3.2 Ingeniera de Software Web. ................................................................................ 51 3.2.1 Problemtica de la Ingeniera de Software Web. .............................................. 52 3.3 Programacin Orientada a Objetos. ..................................................................... 52 3.3.1 UML................................................................................................................... 53 3.3.2 UML y El desarrollo de Aplicaciones WEB. ....................................................... 54 3.5 Anlisis. ................................................................................................................ 55
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
5
3.5.1 Anlisis de Requerimientos. .............................................................................. 56 3.5.2 Anlisis de Casos de Uso.................................................................................. 60 3.5.4 Glosario del Sistema. ........................................................................................ 71 3.6.1 Artefactos de la Experiencia del Usuario........................................................... 76 3.7 Diseo. ................................................................................................................. 79 3.7.1 Diagramas de Estructura esttica o Vista Lgica. ............................................. 80 3.7.2 Diagramas de Componentes............................................................................. 84
-
6
Introduccin.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
7
Descripcin del Problema.
La Biblioteca de la Fundacin Arturo Rosenblueth (en adelante BIBFAR), inicia
operaciones en 1981, por la necesidad de tener un centro de referencia que apoyara a
las actividades acadmicas realizadas en ella; actualmente (en el 2003) cuenta con un
acervo de aproximadamente 1500 ttulos, sumando mas de 2000 ejemplares, que en su
mayora son colecciones especializadas en Ciencias de la Computacin e Informtica;
tambin cuenta con una computadora personal conectada a Internet y al grupo de
trabajo de la FAR; en su reglamento interno se contemplan dos tipos de usuarios:
Internos o Externos.
Los usuarios internos son todas aquellas personas que tienen relacin directa con la
institucin, (empleados o alumnos).
Los usuarios externos son los visitantes de ocasin. Su misin consiste en conservar,
difundir y proveer informacin para el desarrollo cientfico y tecnolgico de la Institucin.
Para dar cumplimiento a esa misin tiene asignadas dos personas que cubren 2 turnos
en los que se prestan los siguientes servicios:
- Prstamo en sala.- Tanto para usuarios internos como para usuarios externos.
- Prstamo a domicilio.- Slo para usuarios internos con credencial vigente, consiste en
gestionar los pasos que involucran la autorizacin para extraer un libro por una cantidad
razonable de tiempo, y asegurar su regreso a los estantes de la biblioteca.
- Prstamo interbibliotecario.- Se realiza a travs de convenios que se establecen con
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
8
diferentes instituciones, consiste en gestionar los pasos que involucran la autorizacin
para extraer un libro de otra biblioteca por una cantidad razonable de tiempo.
- Prstamo solo por una noche.- Slo para usuarios internos, abarca libros de consulta,
tesis y materiales especiales; este servicio es especial, pues consiste en prestar libros
que normalmente no se prestan por ms de 24 horas.
- Atencin a usuarios.- Involucra a cualquier tipo de usuario, consiste en asistir a los
usuarios en su bsqueda de informacin, ya sea hojeando el catlogo o revisando los
estantes.
Esta biblioteca presenta varios problemas que son comunes a toda biblioteca:
a) Robo o prdida de volmenes, y por lo tanto desconocimiento del acervo actual.
b) Deficiencia en los servicios que se prestan.
c) Por el tamao de la misma biblioteca, es escaso el presupuesto asignado.
d) No existen registros bibliogrficos confiables.
Importancia de este trabajo.
Debido a que no existen muchos trabajos vigentes sobre el tema en Mxico y
Latinoamrica, es importante desarrollar sistemas adaptados al mbito local, usando las
tecnologas disponibles, a travs de una investigacin y un desarrollo, cuyo resultado
ayude a resolver los problemas antes mencionados. Un sistema como el que aqu se
expone satisface las necesidades especficas de la biblioteca Dr. Arturo Rosenblueth.
Planteamiento del problema de Investigacin.
Se trata de una investigacin que propone una accin y un diseo, que conduce a la
obtencin de un software de automatizacin de bibliotecas, el cual se adapta a
necesidades especficas.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
9
Posibles soluciones.
Existen diferentes alternativas en la automatizacin de bibliotecas, segn la
clasificacin de Herrero1, mostrada en la tabla 1.
La solucin ms adecuada para este caso en particular, segn este autor, es un
Sistema Pblico en Lnea de carcter Acadmico, pues es el que mejor se adapta al
contexto de la BIBFAR.
Tabla 1. Soluciones de automatizacin para bibliotecas. Soluciones de automatizacin para bibliotecas.
Por su forma de obtencin. Por su arquitectura.
Sistemas comerciales. Sistemas Locales.
Sistemas pblicos. Sistemas en Lnea.
Sistemas Propietarios. Sistemas Hbridos.
Soluciones de automatizacin por niveles de obtencin. Sistemas de alto nivel (Aleph, Unicorn, Logicat). - Caros.
- Poderosos. - Llenos de caractersticas.
Soluciones acadmicas (SIABUC). - Accesibles. - Limitados. Sistemas propietarios.
- Hechos a la medida. - Costo elevado.
Planteamiento de la solucin.
La solucin propuesta consiste en crear un sistema propietario en lnea, de tipo
acadmico, que por su bajo costo se adapte a las necesidades de la biblioteca, que
como ya se indic anteriormente pertenece al entorno acadmico.
La solucin propuesta contempla la creacin de una aplicacin web en dos mdulos
1 HERRERO, Abelardo.: Diapositivas del Curso Pblico de Informtica Aplicada en Bibliotecas., 24 de Septiembre 2001.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
10
conectados mediante 4 diferentes bases de datos (fig. 1).
Catlogo Automatizado.- Mdulo que almacena los datos esenciales para describir un
libro, que permite hacer bsquedas sobre esos datos.
Circulacin Automatizada.- Mdulo que registra los movimientos de materiales
(prstamos, devoluciones, prdidas, etc.) dentro de una biblioteca.
1. Esquema general de la aplicacin.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
11
Alcance y limitaciones de soluciones planteadas.
a) Alcance.
Los servicios al pblico deben estar disponibles a travs de Internet
(aplicacin web).
La biblioteca debe contar con un servidor dedicado al sistema.
La biblioteca debe contar con una terminal remota con acceso al sistema.
La base de datos debe ser abierta, es decir que puede ser manipulable desde el
exterior del sistema.
b) Limitaciones.
Los datos del catlogo pueden ser exportados a diferentes formatos
(XML, ISO2709, etc.). |
La cantidad de ejemplares de la biblioteca es reducido.
El nmero de usuarios del sistema es reducido.
Las necesidades de la biblioteca en 2003 limitan el sistema a la automatizacin del
sistema de circulacin y al catlogo en lnea.
Resultados deseables de esta tesis.
Creacin e implantacin de una aplicacin web (aplicacin que cae dentro de la
clasificacin de sistemas cliente / servidor) para circulacin automatizada de materiales
de una biblioteca.
Experiencia para futuros proyectos.
Aplicabilidad de la solucin.
La solucin que aqu se plantea, adems de satisfacer las necesidades de la
Fundacin, puede ser aplicada a cualquier biblioteca de tamao pequeo a mediano en
idioma espaol, con acceso a una red de punto a punto como requisito mnimo y que no
requiera de mayor procesamiento administrativo.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
12
Desarrollo de la tecnologa nacional en este campo.
Desde hace tiempo, hay quienes realizan esfuerzos en este campo, existen referencias
de desarrollos mexicanos galardonados por la misma Fundacin Arturo Rosenblueth2
La Universidad de Colima, lleva cerca de 15 aos desarrollando un sistema integral de
automatizacin de bibliotecas, denominado SIABUC (Sistema Integral de Automati-
zacin de Bibliotecas de la Universidad de Colima).
La empresa Sistemas Lgicos comercializa un sistema llamado Logicat, el cual es
ampliamente difundido en Mxico y Amrica Latina. ientras se escriba esta tesis, una
empresa mexicana lanz al mercado un sistema de automatizacin de bibliotecas sobre
Internet, llamado ALTAIR.
Existe tambin el antecedente de la tecnologa CDS/ISIS que aunque no es exclusiva
para bibliotecas, ha sido adoptada en Mxico y Latinoamrica como tecnologa de
automatizacin de bibliotecas, inclusive forma parte de los planes de estudio de las
escuelas de Bibliotecologa y Archivonoma de la SEP y por el Colegio de Estudios
Bibliotecolgicos de la UNAM.
Perspectivas de venta.
Tanto en Mxico como en Latinoamrica se percibe la existencia de un nicho de
mercado para un sistema de bajo costo, orientado a pequeas bibliotecas que cuenten
con un mnimo de hardware, como el que se plantea en esta tesis.
Para una posible comercializacin del producto de esta investigacin ser necesario
transformar el sistema para que sea adaptable a las necesidades especficas de otros
usuarios, as como tambin crear la documentacin necesaria para su distribucin
pblica.
2 La Fundacin Arturo Rosenblueth entreg sus primeros premios. En: Revista Ciencia y Desarrollo. CONACYT, 1980 Nm. 30., pp. 84-85.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
13
Descripcin breve del contenido de este trabajo.
Introduccin.
En esta seccin se plantea el contexto del problema sobre el cual se desarrolla la
investigacin que da origen a la tesis.
Captulo I. Fundamentos de Bibliotecologa.
Introduce los conceptos pertinentes a la Bibliotecologa en lo relacionado con los
servicios que se ofrecen en las bibliotecas, es aqu donde se traza una lnea entre la
Bibliotecologa, y una disciplina conocida como Recuperacin de Informacin
que tiene relacin directa con las Ciencias de la Computacin y las Ciencias de la
Informacin (de donde se deriva la Bibliotecologa).
Captulo II. Fundamentos de Computacin.
Trata sobre la definicin de los conceptos relacionados a las ciencias de la
computacin, estos conceptos se refieren a Bases de Datos, Ingeniera de Software,
Arquitecturas Cliente / servidor e Internet.
Captulo III. Desarrollo del SCAI-FAR.
En este captulo se desarrollan las actividades concernientes al desarrollo del software
que se plantea en esta investigacin, a travs de tcnicas de ingeniera web (web
engineering). Se plantea el anlisis y diseo orientado a objetos del modelo conceptual
del sistema, tambin se consideran los aspectos tecnolgicos concernientes a la
arquitectura web necesarios para plantear la distribucin a nivel lgico de los
componentes del sistema.
Resultados y Conclusiones
En este apartado se analizan los resultados obtenidos, as como tambin se enuncian
las posibles lneas de investigacin para continuar este proyecto.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
14
Captulo I Fundamentos de Bibliotecologa.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
15
1.1 Los servicios que ofrece una biblioteca.
Comprenden los servicios que se brindan al pblico y los procesos que involucran la
preparacin de los materiales para el prstamo.
1.1.1 Servicios al Pblico.
Los servicios al pblico desde el punto de vista de la biblioteca de la FAR, a su vez se
dividen en:
2. Los servicios al pblico.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
16
a) Prstamo.- Consiste en permitir la salida de un material de la biblioteca al domicilio
de un usuario. Este servicio involucra una metodologa que consiste generalmente en
registrar el prstamo de materiales, y que se le conoce como sistema de cargo.
Desde que existen las bibliotecas pblicas han existido diversos sistemas de cargo,
incluyendo el Dickman, el Detroit, el Newark, el Browne, el Gaylord, de auto servicio,
fotogrfico, de doble registro, de doble papeleta, y el de tarjetas perforadas.
La lista anterior no es exhaustiva, existen casos en los que se dan combinaciones de
varios sistemas de cargo, as mismo algunos autores sugieren que no hay
implantaciones al pie de la letra.
En la tabla 1 se muestran los objetivos y caractersticas de los sistemas de circulacin,
de acuerdo con la Asociacin Americana de Bibliotecas (ALA por sus siglas en ingls)
y recopilados en un estudio sobre sistemas de circulacin publicado en 1961 [Study,
1961].
Tabla 1. Objetivos y caractersticas de los sistemas de circulacin.
Objetivos y Caractersticas de los Sistemas de Circulacin. (Clasificacin de la American Library Association)
Objetivos Mnimos Tener la capacidad de identificar los materiales en prstamo. Tener la capacidad de identificar al prestatario. Asegurar el regreso de los materiales, en caso de no ser devueltos en un perodo de tiempo razonable despus de su expiracin.
Caractersticas Mnimas El sistema debe ser simple para el pblico en cuanto a operacin se refiere y para el personal de la biblioteca deber ser fcil de entender y operar. El sistema debe ser flexible para adaptarse a las operaciones principales de la biblioteca.
Objetivos Adicionales Proveer informacin adecuada de prestatarios con adeudos. Permitir la disponibilidad de libros solicitados a los lectores tan pronto como sea posible a travs de un sistema eficiente de reservaciones.
Caractersticas Adicionales
El sistema debe ser flexible para variar los perodos de prstamo. El sistema no debe requerir costos excesivos para su operacin, ni causar problemas.
El sistema de circulacin adoptado por la BIBFAR es una variacin del sistema Newark
y reconoce a las siguientes entidades:
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
17
Usuarios Internos.- Son todas aquellas personas (empleados o alumnos) que tienen
relacin directa con la institucin.
Staff: Personal que trabaja en la biblioteca.
Prestatario.- Usuario interno con credencial vigente que puede solicitar el prstamo de
libros.
E involucra las siguientes rutinas:
Registro de lectores.- Se requiere un registro de los usuarios internos, con sus datos de
identificacin. El personal de la biblioteca genera una credencial de prstamo, con la
fotografa del usuario.
Rutinas de cargo.- El prestatario anota en una papeleta, el nmero de clasificacin,
autor, ttulo abreviado, nombre del lector, telfono, y fecha de devolucin.
El personal revisa la legibilidad de la papeleta, as como los datos del usuario y del
libro. El personal archiva la papeleta, junto con la credencial del usuario.
Rutinas de descargo.- El prestatario presenta el libro ante el personal. El personal
verifica la fecha de vencimiento, si sta ya se venci se calcula la multa. Si el
prestatario no puede pagar la multa, es anotado en una lista de deudores. El prestatario
coloca el libro en el estante correspondiente.
Vencimientos.- El personal, revisa las papeletas con fechas de vencimiento que han
expirado, y lo notifica a los prestatarios para que se normalice esa situacin.
Reservaciones.- En la BIBFAR, no existe un procedimiento definido para establecer la
reservacin de un libro.
b) Consulta.- Este servicio es de suma importancia para la biblioteca, pues como
seala Morales 3 coadyuva a que se haga un uso exhaustivo, pleno y propio de la
biblioteca, de sus servicios y de los materiales bibliotecarios.
3 MORALES, Estela.: El Servicio de Consulta., p. 15.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
18
La Consulta consiste en ayudar al usuario lector a localizar libros que respondan a sus
necesidades de informacin; este servicio inicia con la pregunta del usuario, sobre la
existencia de un libro o libros que le interesa consultar; el bibliotecario debe entonces
responder a esa pregunta ubicando los libros que requiere ese usuario.
En algunos casos encontrar la respuesta a las preguntas del usuario es una tarea difcil,
pues puede ocurrir que el bibliotecario no entienda la terminologa de la pregunta; en
ese caso, los bibliotecarios recurren a una enciclopedia o a algn material de
referencia, para trasladar los trminos importantes de la pregunta a un lenguaje
relevante para el sistema bibliogrfico en el que se va a realizar la bsqueda
(encabezamientos, descriptores, etc.).
Es en este proceso donde se requiere que la calidad de la catalogacin y clasificacin
sean ptimas, pues de ello depende el xito de la consulta.
Segn un anlisis realizado por la ALA en 1942 citado por Morales4, las actividades
relacionadas con el servicio de consulta, se dividieron en cinco:
1) Supervisin.- Consiste en supervisar y coordinar el servicio de consulta con los
dems departamentos de la biblioteca.
2) Informacin.- Esta funcin consiste en responder las preguntas que formulen los
usuarios, en relacin con sus necesidades de consulta.
3) Instruccin.- Consiste en ensear al usuario a usar una biblioteca, a fin de que el
usuario sea autosuficiente.
4) Bibliografa.- Consiste en ayudar en la elaboracin de las citas bibliogrficas de los
materiales consultados.
5) Evaluacin.- Contempla dos aspectos: la evaluacin del servicio que se presta en la
biblioteca y la evaluacin de las obras de Consulta.
En el caso de la BIBFAR, el servicio de consulta ocurre cuando un usuario pregunta al
4 Ibdem., p. 15.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
19
encargado sobre algn tema en especial, es entonces cuando el encargado recorre los
estantes en busca del libro que satisface las necesidades de informacin del lector.
1.1.2 Procesos Tcnicos.
Son las tareas que preparan a los materiales para colocarlos en los estantes,
representan la mayor parte del trabajo de un biblioteclogo:
a) Organizacin bibliogrfica.
La organizacin bibliogrfica segn [Quio, 2002] se refiere a la disposicin y arreglo de
los materiales bibliogrficos relacionada con el ordenamiento y control de los mismos.
La funcin primordial de la organizacin bibliogrfica es lograr que todo documento sea
adecuadamente publicado, almacenado y registrado, y su objetivo es permitir la
identificacin, seleccin y localizacin de los documentos segn las necesidades de los
usuarios, para su comprensin se divide en tres fases:
1) Catalogacin.- Segn Granados5 es la transcripcin de los datos caractersticos de
un material documental en fichas, siguiendo un orden determinado.
Actualmente la catalogacin se regula a travs de varias normas, algunas de alcance
regional y otras con alcance internacional.
En Mxico las reglas que se siguen son las de la 2a. edicin de las Reglas de
Catalogacin Anglo Americanas 6.
Como lo indican las AACR2, dependiendo de los propsitos perseguidos al redactar un
catlogo, existen tres niveles de descripcin bibliogrfica:
5 GRANADOS Xolapa Eleazar y Luz Mara Mendoza Bentez.: Manual de Informacin Bsica en Bibliotecologa., p. 249
6 Por sus siglas en ingls Anglo American Cataloging Rules 2nd edition.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
20
1er. nivel:
/ .
.
: .
: ; .
2o. nivel:
= : / ; .
/ .
: , .
: ; .
( / , ; . ; ) - -
3er. nivel:
Para el tercer nivel se incluyen todos los elementos sealados en las AACR2 que sean
aplicables al material que se describe.
Generalmente este nivel de descripcin es el utilizado para la bibliografa nacional de
cada pas.
b) Indizacin.
La indizacin u organizacin del conocimiento es un proceso que se ha requerido
durante miles de aos. Conforme aumenta la cantidad de conocimiento, la necesidad
de organizarlo se ha vuelto ms importante, principalmente en aquellas disciplinas
relacionadas con la informacin.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
21
La organizacin del conocimiento o indizacin es una actividad preliminar, esencial para
la eficaz explotacin de la informacin; para [Arriola,2001] el objetivo general de la
indizacin consiste en permitir que la informacin o el conocimiento pueda ser
localizado cuando se le necesite, de tal forma que su organizacin y su posterior
consulta puedan entenderse como dos partes del mismo proceso.
Indizacin es la asignacin de palabras que expresan el contenido intelectual de un
libro y bajo el cual se agrupan todos aquellos que tratan sobre el mismo tema. [Gimeno,
1996] , menciona que la UNESCO define la indizacin bajo dos perspectivas: como
proceso y como finalidad. Como proceso, consiste en describir y caracterizar un
documento con la ayuda de representaciones de los conceptos contenidos en dicho
documento. Su finalidad es la de permitir una bsqueda eficaz de las informaciones
contenidas en un fondo documental
A juicio de Gimeno, Garca Gutirrez 7 quin ofrece una definicin mucho ms completa
y precisa del concepto la indizacin documental es la operacin intelectual de aplicar
tcnicas especficas normalizadas -anlisis- a un colectivo documentario con el fin de
hacerlo controlable y utilizable -recuperacin-.
Guinchat y Menou 8 establecen cuatro criterios fundamentales a considerar en el
proceso de indizacin:
1) Exhaustividad.- Se deben reflejar todos los temas y conceptos de relevancia
informativa incluidos en el documento.
2) Selectividad.- El indizador debe hacer una seleccin previa de aquellos conceptos
relevantes, excluyendo los repetidos y aquellos que carecen de utilidad informativa.
3) Especificidad.- Se han de utilizar significantes precisos de los conceptos, rechazando
los muy generales, ambiguos, abstractos o muy especficos, que no reflejen la exactitud
del mensaje informativo.
7 Garca Gutirrez, Antonio citado por Javier Gimeno. Tratado Bsico de Biblioteconoma., p. 200 8 Guinchat y Menou, citados por Javier Gimeno. Ibdem., p.204.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
22
4) Uniformidad.- Los trminos de la indizacin deben observar criterios formales y
contenidos homogneos.
Lenguajes Documentales.
Actualmente existen sistemas de informacin basados en sustitutos, los ms comunes
se encuentran en disciplinas como la bibliotecologa, documentacin o ciencias de
la informacin; en ellos los sustitutos son usados como los componentes bsicos en
el almacenamiento y recuperacin de la informacin, es decir, el usuario recupera el
sustituto y ste lo conduce al documento buscado.
De lo anterior se deduce la importancia que para los profesionales de la informacin
tienen los procesos dedicados a la creacin de estos sustitutos, es por ello que hace
uso de lenguajes documentales, los cuales pueden ser de dos tipos:
1) Lenguajes Libres.- Se refieren a aquellos lenguajes que utilizamos en nuestra vida
diaria para comunicarnos.
Estos lenguajes estn representados por los diccionarios de las lenguas.
v.gr: El Diccionario de la Lengua Espaola o El Diccionario del espaol usual en
Mxico.
2) Lenguajes Controlados.- Tambin conocidos como lenguajes artificiales, son
aquellos que controlan la sinonimia, la polisemia, la homonimia, etc.
Estos lenguajes estn representados por:
2.1) Tesauros y Listas de Encabezamientos de Materia:
A travs del uso de vocabularios controlados se representa con una palabra o frase el
contenido del documento.
v. gr: Un libro que trate sobre bases de datos documentales y sus aplicaciones en la
industria, tendra la siguiente representacin:
Bases de Datos DocumentalesAplicacin
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
23
Con esta forma garantizamos que la informacin siempre se presentar de una sola
forma, tanto para su almacenamiento como para su recuperacin. Descartando la
palabra: Industria.
2.2) Sistemas de Clasificacin:
La mayora de los sistemas de clasificacin que existen, intentan representar de una
manera lgica el conocimiento humano. Existen sistemas que usan notaciones
numricas o alfanumricas para lograr su objetivo.
Clasificacin, en palabras de Arguinzniz 9, denota la colocacin de los libros en los
estantes; consiste en la asignacin de un lugar exacto de los libros dentro de un
estante considerando algn criterio.
Dos de los sistemas ms conocidos y usados en el mundo son:
La Clasificacin Decimal de Dewey y la clasificacin de la Biblioteca del Congreso de
los Estados Unidos (LC por sus siglas en ingls). En la BIBFAR, se usa un sistema de
clasificacin propio que no se apega a ninguna norma aceptada internacionalmente.
1.2 Automatizacin de Bibliotecas.
Existen diferentes definiciones de Automatizacin de Bibliotecas (LA por sus siglas en
ingls de Library Automation), Herrero 10 define LA como El cmputo aplicado a los
procesos y servicios de tipo tcnico - bibliotecolgico y administrativo de la biblioteca.
Herrera 11 sugiere que la automatizacin de bibliotecas consiste en aplicar las
tecnologas de informacin y computacin en los procesos primordiales de una
biblioteca.
La introduccin de tecnologa a las bibliotecas comenz a finales de la dcada de 1960,
cuando las bibliotecas norteamericanas decidieron dar el paso de las fichas de papel
9 ARGUINZNIZ, Mara de la Luz.: Gua de la Biblioteca., p. 49. 10 HERRERO, Abelardo.: op. cit. 11 HERRERA, Jos Romn.: Software de Acceso a la Biblioteca Digital., p.1.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
24
a los registros de computadora.
La Biblioteca del Congreso de los Estados Unidos de Norteamrica, form un comit de
varios especialistas en las reas de Bibliotecologa y Ciencias de la Computacin,
para desarrollar un formato de catalogacin legible por computadora MARC 12.
Bajo la ptica de la Automatizacin de Bibliotecas y como lo sugiere Herrero 13
Una biblioteca debe automatizar la mayor cantidad posible de procesos y mecanismos
para aumentar la eficiencia del trabajo, reducir tiempos y mejorar el control.
Hasta principios de la dcada de 1990, [Cohn,1998] la automatizacin de bibliotecas
involucraba generalmente las mismas caractersticas propuestas desde el surgimiento
de MARC en 1960:
- Las bibliotecas crearon sistemas integrados en los cuales las funciones tradicionales
de una biblioteca (circulacin, catalogacin, catlogo pblico, etc.) se computarizaban a
travs de la base de datos de la biblioteca.
- Los sistemas funcionaban usualmente en poderosas computadoras supermicro,
mini o mainframes.
- Los sistemas estaban basados en texto, no incorporaban grficas, sonido u otros
componentes multimedia.
- Los sistemas eran locales fundamentalmente, con nfasis en el control de acceso a
los recursos dentro de una discreta red local, sin posibilidades de acceso a bases de
datos remotas o catlogos de otras bibliotecas.
1.2.1 Los servicios de la biblioteca bajo la ptica de la automatizacin.
La Consulta.- La automatizacin de la funcin de Informacin del servicio de consulta,
12 Machine Readable Cataloging por sus siglas en ingls. 13 HERRERO, Abelardo.: op. cit.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
25
se realiza a travs de un Catlogo Pblico en Lnea, OPAC 14 y como lo advierte
[Peters,1999] un catlogo en lnea es la parte ms visible de la automatizacin de
bibliotecas, es el reemplazo eficiente del catlogo de tarjetas.
Los catlogos en lnea son una clase de sistemas que se hayan entre los denominados
Sistemas de Almacenamiento y Recuperacin de la Informacin.
El Prstamo.- Para este proceso, [Peters,1999] seala que los procedimientos de
bsqueda en bases de datos y de circulacin automatizada, ambos se ven afectados
por el catlogo en lnea.
El prstamo automatizado de libros requiere de un catlogo pblico en lnea conectado
con una base de datos de inventarios que registre el control de las existencias de
ejemplares, as como sus entradas y salidas de la biblioteca.
1.3 Formato de datos MARC.
El acrnimo MARC resulta de MAchine Readable Cataloging (catalogacin legible a
travs de computadora) o generacin de registros catalogrficos legibles a travs de
computadora. Gredley, citado por Arriola 15 comenta que MARC es: un grupo de
formatos que emplean un conjunto particular de convenciones para la identificacin y
manejo de datos bibliogrficos por computadora.
El nmero de formatos que integran al estndar MARC son cinco:
1. Bibliogrfico o integrado.
2. Autoridades.
3. Clasificaciones.
4. Holdings.
14 Por sus siglas en ingl, de Online Public Accesa Catalog. 15 ARRIOLA, Oscar.: Diapositvas del Curso Pblico de Informtica Aplicada en Bibliotecas., 24 de Septiembre.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
26
5. Informacin comunitaria.
En esta investigacin solo nos ocuparemos del formato MARC Bibliogrfico.
La estructura del formato MARC Bibliogrfico (fig. 2) est basada en la norma ANSI
Z39.2 de la American National Standard for Bibliographic Information Interchange,
misma que sirvi como base para implementar la norma ISO 2709 Format for
Bibliographic Information Interchange on Magnetic Tape.
2. Registro de datos MARC Bibliographic. (Cortesa de El Colegio de Mxico).
Dicha estructura consta de los siguientes elementos:
Lder.- Est integrado por un nmero finito de 24 caracteres en los que se consigna la
informacin general del registro catalogrfico.
Directorio.- Est integrado por campos de longitud fija de 12 caracteres, cada uno
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
27
contiene la etiqueta de identificacin, la longitud y la posicin del primer carcter en
el registro de cada etiqueta en el campo variable.
Elementos de longitud fija.- Estos campos consignan informacin catalogrfica la cual
determina el contenido del registro. Para su identificacin se utilizan cdigos ya
establecidos, estos datos se ubican en una longitud de posiciones fijas del 0 al 39.
Campos de longitud variable.- La informacin contenida en estos campos se
representa a travs de etiquetas numricas, cada campo tiene sus propios indicadores
de subcampo y tanto los campos como los indicadores de subcampo pueden repetirse
en un mismo registro.
Etiquetas.- Los campos de longitud variable son identificados por etiquetas numricas y
se encuentran agrupados en nueve bloques:
0XX Nmero de control, clasificacin, etc.
1XX Asiento principal.
2XX Ttulos, ediciones, rea de publicacin.
3XX Descripcin fsica.
4XX Mencin de serie.
5XX Notas.
6XX Temas o materias.
7XX Asientos secundarios.
8XX Asientos secundarios series, acceso y localizacin de recursos
electrnicos.
1.3.1 Ventajas del Formato de datos MARC.
El uso del formato MARC ofrece muchas ventajas, por que:
- Permite el intercambio de informacin catalogrfica con otras bibliotecas.
- Todos los sistemas comerciales de automatizacin bibliotecaria manejan el formato.
- Ofrece una forma estructurada para almacenar registros catalogrficos, cuyas
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
28
caractersticas esenciales consiten en la repetibilidad de campos y el tamao no
determinado de sus registros.
- Existe una correspondencia entre las reas de una ficha catalogrfica generada con
las AACR2 y MARC, de manera que es posible transcribir un catlogo en papel a
MARC.
El standard MARC (ANSI Z39.2) tan solo es un formato, una especificacin de como
deben ser almacenados los registros bibliogrficos dentro de una computadora, es decir
que MARC no es un programa de computadora.
La verdadera incorporacin de tecnologa se da, cuando un software es capaz de
procesar, transformar, buscar o administrar estos datos estructurados con formato
MARC.
Con la informacin catalogrfica con que se cuenta en la BIBFAR, no es posible
generar registros apegados 100% al estndar MARC, por lo tanto slo se usarn
algunas etiquetas de los campos de longitud variable.
1.4 Recuperacin de Informacin.
La Recuperacin de Informacin o IR 16, una disciplina relativamente joven,
perteneciente a las Ciencias de la Informacin, su tema central est relacionado con la
estructura, el anlisis, organizacin, almacenamiento y bsqueda de informacin.
Actualmente, esta disciplina tiene un enfoque ms orientado hacia el cmputo, sin
embargo el tema de esta disciplina tiene sus orgenes algunos siglos atrs.
Segn [Meadow,1992], existe una diferencia entre Information Retrieval e Information
Recovery, en espaol es posible confundir ambas con Recuperacin de Informacin.
Meadow, explica que mientras el primer trmino involucra bsqueda de informacin en
algn depsito de informacin o base de datos, va acompaada implcitamente del
16 Por sus siglas en ingls, de Information Retrieval.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
29
concepto de selectividad; el segundo trmino, no es idntico al primero a no ser que
exista una selectividad de por medio, como ejemplo, menciona que copiar un archivo
completo de un disco a otro no es Recuperacin de Informacin.
En general, el trmino Recuperacin de Informacin debe entenderse en el sentido de
Consulta de Informacin.
Meadow 17 concluye su explicacin con el siguiente ejemplo:
Una biblioteca es el mejor ejemplo de una institucin dedicada a la recuperacin
selectiva. Uno asiste y no lee toda la coleccin. Uno asiste y busca algo
selectivamente, frecuentemente alguna cosa satisfacer un conjunto de necesidades de
informacin altamente individualizadas.
1.4.1 Aplicaciones de la Recuperacin de Informacin.
Herrero 18 en su tesis de maestra sugiere que desde 1950 - 1960, principalmente en el
sector militar de USA, se aplic y us tecnologa de Recuperacin de Informacin,
tecnologa que posteriormente se traslad y utiliz en otros mbitos, como el
acadmico, dentro del cual las bibliotecas ocuparon un nicho de aplicacin muy
importante.
Los sistemas de IR tienen muy diversas aplicaciones entre las que se cuentan:
- Motores de bsqueda en Internet (Google19, htdig 20, Microsoft Index Server 21).
- Sistemas policiales de inteligencia.
- Sistemas de decodificacin e identificacin de ADN.
17 MEADOW, Charles T : Text Information Retrieval Systems., p. 2. 18 HERRERO, Abelardo.: Borrador de Tesis de Maestra. p. 5. 19 Google Press Center.: Google Technology Overview www.google.com/press/overview_tech.html 20 ht://Dig Introduction. www.htdig.org 21 Microsoft.: Index Server A Technical Overview. www.microsoft.com/NTServer/techresources/IndServ.asp
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
30
- Catlogos de bibliotecas (Star 22).
- Utileras de sistema operativo como Norton File Find, Midnight Commander, fgrep, etc.
1.4.2 Recuperacin de Informacin basada en texto.
Existen diversas variantes de Recuperacin de Informacin que dependen del
paradigma de datos de que se trate ya sea texto, datos numricos, imgenes,
secuencias de DNA, sonido, msica etc., una de ellas merece especial mencin por
relacionarse con el tema de esta tesis:
La Recuperacin de Informacin basada en texto.
Segn Herrero, la recuperacin basada en texto es la que tiene un campo de aplicacin
ms amplio y creciente, puesto que la representacin informtica de letras y palabras y
las operaciones involucradas en el proceso de recuperacin, tales como comparacin y
ordenamientos estn lo suficientemente sistematizadas en trminos de cmputo, para
poder desarrollar sistemas muy evolucionados.
Sugiere que otro tipo de informacin, como las imgenes, presentan problemas de
mayor complejidad: la simple comparacin de imgenes, o los mecanismos de
formulacin de peticiones, constituyen retos monumentales en trminos de
instrumentacin de software.
Los sistemas de texto pueden dividirse en dos tipos:
a) Sistemas de recuperacin de texto completo.- Se les llama tambin, sistemas de
recuperacin de documentos, pues recuperan documentos completos.
b) Sistemas de recuperacin de texto referenciales.- La funcin de los sistemas de texto
22 Cuadra Associates.: STAR. www.cuadra.com/products/star.html
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
31
referenciales consiste en recuperar referencias a textos, es decir, indican la referencia
de textos en algn entorno; son de extrema importancia, pues son los mas usados dado
que, en la mayora de los sistemas de informacin se guarda una referencia a objetos o
situaciones del mundo real en forma de texto controlado.
Los motores de bsqueda de Internet son el ejemplo ms clsico de sistemas de texto
referenciales. Otro ejemplo de sistemas de texto referencial, son los catlogos de
biblioteca, que son sistemas que permiten buscar los materiales de un acervo a travs
de una base de datos bibliogrfica.
Segn Hildreth, citado por Herrero 23, La IR, plantea dos estrategias o acercamientos
para la consulta de texto: la bsqueda (search) y el hojeo (browse). De stos, la
bsqueda es el ms utilizado, aunque existen intentos notables para desarrollar
sistemas de hojeo poderosos.
1.4.3 Catlogos Automatizados de Bibliotecas y la Recuperacin de
Informacin.
Como lo sugiere Herrero: Hasta avanzado el siglo XX, los sistemas de Recuperacin de
Informacin en bibliotecas estaban basados en catlogos de tarjetas. La administracin
de grandes cantidades de tarjetas en ficheros de gran tamao constituyeron un caldo
de cultivo excepcional para la automatizacin y ms especficamente, para la aplicacin
de las bases de datos y de la Recuperacin de Informacin.
Cuando el sector militar de EUA liber la tecnologa de cmputo (restringida hasta
entonces) a las universidades y centros acadmicos para que estas pudieran aplicar
libremente la computacin, las bibliotecas se vieron beneficiadas, porque de entre ellas
las mas importantes y con capacidad de aplicar innovaciones tecnolgicas, se
encuentran precisamente en universidades y otros centros de investigacin
acadmicos.
23 HERRERO Abelardo.: op. cit., p. 5.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
32
Una de las primeras aplicaciones del cmputo en Recuperacin de Informacin fueron
los catlogos automatizados, que mas tarde se reconoceran internacionalmente como
OPAC.
En su tesis de maestra, Herrero, apunta que el ncleo de un OPAC, es un sistema de
recuperacin de texto referencial, de manera que el contenido completo de los libros,
revistas y otros materiales no se almacena, slo se almacenan apuntadores, datos
bsicos, trminos clasificatorio entre otros.
Toda esta informacin referencial es preparada mediante reglas y lenguajes especiales
y es tratada en la bibliotecologa por varias disciplinas.
3. Componentes de un OPAC.
En trminos de software, los componentes de un OPAC (fig. 3) son los siguientes:
- Sistema Manejador de Bases de Datos.
- Motor de Bsquedas.
- Intrprete de Bsquedas.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
33
- Interfaz de Captura de Peticiones.
- Interfaz de Manejador de Resultados.
Los problemas de un OPAC pueden dividirse hipotticamente en dos tipos:
Problemas asociados a la Recuperacin de Informacin.
Problemas generados por el entorno de la aplicacin (en este caso las bibliotecas).
Estos se presentan solos o combinados, en diversas situaciones de los procesos
asociados a la consulta, por la extensin de esta tesis, no se tratarn aqu.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
34
Captulo II Fundamentos de Computacin.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
35
2.1 Plataforma de bases de datos.
Existen muchas acepciones del concepto bases de datos, por lo que ser mejor hacer
una distincin entre algunas de ellas:
Segn Date 24 es un sistema computarizado para llevar registros .
Para Yarger 25 simplemente una coleccin organizada de datos, es as que base de
datos se diferenca de sistema manejador de bases de datos (DBMS por sus siglas en
ingls), cuya definicin segn Yarger un programa de computadora que permite al
usuario, crear, mantener y administrar bases de datos electrnicas.
[Feiler,1999] indica que el concepto Base de Datos puede tener tres acepciones, las
cuales estn bien diferenciadas unas de otras:
- Una base de datos puede ser un cuerpo de datos, -frecuentemente un gran cmulo de
informacin- usualmente almacenados e indizado en una computadora o en un
dispositivo electrnico.
- Una base de datos puede ser el software (y algunas veces el hardware), que se usa
para almacenar, consultar y manipular datos.
- Una base de datos puede ser una combinacin de datos, software y programas
hechos a la medida que resuelven determinado problema.
Feiler, finaliza su explicacin aclarando que, una base de datos, se refiere a la primer
24 DATE, C.J.: Introduccin a los Sistemas de Bases de Datos., p.2. 25 Yarger, R. et al.: mSql & MySQL., p. 6.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
36
definicin, un sistema manejador de bases de datos DBMS 26 corresponde a la segunda
definicin, y un proyecto de bases de datos, corresponde a la tercera definicin.
Como sugiere [Tenopir,1989], los manejadores de bases de datos ms comunes son
manejadores de registros, los cuales en su mayora no han sido diseados para
manejar registros bibliogrficos, de cualquier manera los sistemas comunes de bases
de datos imponen severas restricciones en el diseo y en la capacidad de bsqueda.
As mismo Tenopir sugiere evaluar los manejadores de bases de datos, considerando
las caractersticas nicas de las bases de datos bibliogrficas, caractersticas que no se
presentan comnmente en aplicaciones de negocios, estas caractersticas son:
- Las bases de datos bibliogrficas o textuales se componen principalmente de registros
alfanumricos, en vez de datos numricos o claves, los cuales se ocupan en cualquier
tipo de clculo.
- En el caso de que incluyan nmeros, estos son tratados frecuentemente como
cadenas de caracteres (v. gr.: nmeros de volumen, pginas, etc.).
- Cada registro tiende a tener muchos campos, pero el mismo campo o campos
similares estn presentes en la mayora de los registros de la base de datos.
- Existen campos que son frecuentemente largos (v.gr.: ttulos o resmenes), pero el
largo de cada campo puede variar de un registro a otro.
- Algunos campos tienen valores que deben tratarse por separado, pero representan
datos equivalentes (v. gr.: descriptores, autores mltiples).
La frecuencia o repeticin es generalmente impredecible de un registro a otro.
- Muchas aplicaciones requieren acceso de bsqueda en la mayora de los campos.
Las capacidades de bsqueda son importantes, (v. gr.: Lgica booleana, proximidad
26 Por sus siglas en ingls Data Base Management System.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
37
de palabras, bsqueda en un campo especfico o en varios campos especficos y la
capacidad de realizar bsquedas truncadas).
La informacin no cambia rpidamente y el nmero de registros tiende a crecer
continuamente.
Tabla 2. Opciones de software para bases de datos bibliogrficas segn Tenopir.
Opciones de software para bases de datos bibliogrficas.
Software de propsito general. Software de propsito especfico.
Diseados para resolver diferentes necesidades. - Fciles de obtener. - Ampliamente difundidos. - Fciles de usar.
- Se adaptan ms a las necesidades de una base de datos bibliogrfica. - Son escasos, por lo tanto, no hay mucha documentacin al respecto. - No todos han sido diseados tomando en cuenta las necesidades de una base de datos bibliogrfica, pero los que las toman en cuenta resuelven la mayora de los problemas asociados a ellas.
DBMS Programas de almacenamiento y recuperacin de
informacin (IS & R por sus siglas en ingls). A Favor: - Pueden manejar mas de una tabla a la vez. - Pueden relacionar diferentes archivos (o tablas). - Cuentan con suficiente documentacin. En Contra: - Son limitados para uso bibliogrfico. - Campos de longitud fija. - Por lo general no pueden manejar mas de un valor por campo (no existen mltiples ocurrencias). - En algunos casos, hay restricciones en el nmero de campos y en el tamao de los registros. - La bsqueda de datos se realiza a travs de un lenguaje limitado. - Hay que invertir muchas horas para adaptarlos a el funcionamiento de una aplicacin bibliogrfica. Ejemplos: dBase, mSQL, MySQL, DB/2, PostgreSQL, FileMaker, MS-Access.
A Favor: - Diseados para modelar bsquedas y consultas poderosas. - Incluyen algoritmos de bsqueda booleana, por truncamiento, bsqueda por proximidad, construccin de conjuntos, entre otras. - Permiten definir formatos de impresin a los resultados de las bsquedas. - La mayora de los paquetes funcionan con una PC comn. - Permiten estructurar campos. - Permiten longitud variable. - Permiten repetibilidad de campos. En contra: - Generalmente crean archivos invertidos (ndices) para facilitar y acelerar las bsquedas lo cual produce overheads. Ejemplos: CDS/ISIS, OpenIsis.
Software de Recuperacin de Texto Aplicaciones Bibliotecarias A Favor: - No requieren de estructuracin de archivos (no hay informacin separada en campos). - Ofrecen poderosas caractersticas de bsqueda (bsqueda booleana, truncada, proximidad de palabras, etc.). En Contra: - Por no usar estructuras, existen problemas al combinar el software con datos estructurados bibliogrficamente. - Por la misma razn, cuando realizan bsquedas tienen que recorrer toda la base de datos, lo cual no es ptimo. Ejemplos: Folio 4.1, dtSearch.
A Favor: - Funcionan bien si la biblioteca se adapta a las caractersticas del sistema. En Contra: - Ofrecen menor flexibilidad que los IS&R. - Los formatos de impresin y la estructura de los datos ya estn predefinidos. - Resuelven otros problemas como el prstamo de materiales. Ejemplos: BiblioScape (www.biblioscape.com)
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
38
Estas caractersticas tienen un efecto directo en la adopcin de un software apropiado
para una base de datos bibliogrfica. En la tabla 2, se muestra una propuesta de las
diferentes opciones de software de bases de datos que puede usarse en una biblioteca.
Segn Tenopir, el software que se ha adoptado exitosamente para el uso de
aplicaciones bibliogrficas puede dividirse en dos categoras, las cuales a su vez
pueden subdividirse en diferentes tipos de software.
Para el desarrollo del catlogo automatizado que se propone en este trabajo, se opt
por el uso de un software llamado CDS/ISIS (Computarized Documentation
System/Integrated Set of Information System por sus siglas en ingls), conocido
simplemente como ISIS, este software esta dentro de la clasificacin de los llamadas
Aplicaciones de Almacenamiento y Recuperacin de la Informacin.
La decisin de usar CDS/ISIS se basa en el argumento de que la mayora de los
motores de bases de datos (DBMS) carecen de funcionalidades de Recuperacin de
Informacin como la capacidad de bsqueda y estructuracin de informacin que ISIS
ofrece, ya que tratar de incorporar alguna de esas caractersticas a un DBMS
Relacional dara lugar a una nueva tesis.
Al respecto de este argumento, [Manzanos,1999] realiza una comparacin suficiente
entre una base de datos relacional y CDS/ISIS, las conclusiones a las que llega son
contundentes. Si se desea saber sobre esta comparacin el interesado puede remitirse
al apndice D.
2.1.1 La tecnologa CDS/ISIS.
CDS/ISIS es uno de los llamados manejadores de bases de datos bibliogrficas o
textuales, sus inicios nos llevan a los aos 60, perteneca a la Organizacin
Internacional del Trabajo, en sus inicios solo era ISIS (Integrated Set of
Information System), posteriormente el desarrollo fue tomado por la UNESCO, y
programado por Gian Paolo del Bigio, mas tarde adquiri el nombre de CDS/ISIS
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
39
(Computarized Documentation System/Integrated Set of Information System).
La idea de UNESCO era brindar software gratuito a las bibliotecas del mundo con
escasos recursos. En el tiempo presente se autoriza su uso bajo licencia, sin cargo,
con el compromiso de no cederlo ni comercializarlo; para ello nombr en cada pas a
un distribuidor nacional, que en el caso de Mxico es el Consejo Nacional de
Ciencia y Tecnologa (CONACYT).
En un documento conocido como Elements for a charter of the ISIS-Coordination
Group 27 UNESCO declara que ISIS es una familia de software capaz de
manejar diferentes estndares propietarios:
ISIS Master File (MST) .- El formato de organizacin de archivos que permite el
almacenamiento de informacin.
ISIS Inverted File (IF) .- El formato de organizacin de archivos que permite indizar la
informacin almacenada por el archivo MST.
ISIS Query Language (IQL).- El lenguaje de consulta de ISIS.
ISIS Formatting Language (IFL).- El lenguaje de formato de ISIS.
Hacia 2003, la familia de software CDS/ISIS (fig. 4) se compona de:
Micro CDS/ISIS.- Es un software basado en consola de texto que funciona en
ambientes MS-DOS, UNIX y VAX.
WinISIS.- Como su nombre lo indica, es una versin modificada de Micro CDS/ISIS
para ambientes Windows, funciona para Windows 3.1 y superiores.
CISIS.- Es una interfaz de rutinas escritas en C, desarrollada por Bireme que ofrece las
funcionalidades bsicas de CDS/ISIS.
ISIS_DLL.- Es una librera DLL que permite a los programadores habilitar aplicaciones
para acceder a bases de datos ISIS, tambin ha sido desarrollada por Bireme y
27 SMET, Egbert de.: Elements for a charter of the ISIS-Coordination Group., p. 1
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
40
funciona en plataformas Win32 y Linux.
WWWISIS.- Es una aplicacin diseada para funcionar como un CGI esttico que
ofrece acceso a bases de datos ISIS desde Web.
JavaIsis .- Es una aplicacin desarrollada en Java que hace uso de WWWIsis para
acceder a bases de datos ISIS.
4. La familia de Software ISIS.
Las caractersticas principales de la tecnologa CDS/ISIS son:
- Manejo de un nmero indefinido de distintas bases de datos, con una informacin de
hasta 500 millones de caracteres, estructurados en registros.
- Capacidad para contener un mximo de 16 millones de registros de hasta 8.000
caracteres, codificados en cdigo ASCII, desagregables en un mximo de 200 campos
diferentes, a su vez, divisibles en subcampos.
- Campos de longitud variable: No requiere predefinir una longitud del campo, sta es
variable de registro en registro, pudiendo ser nula o extenderse hasta completar la
longitud mxima del registro.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
41
- Campos repetibles: Un determinado campo puede repetirse mltiples veces en un
mismo registro.
- Potentes recursos de recuperacin (bsqueda) de registros seleccionados de acuerdo
a su contenido en determinados campos con uso de operadores booleanos y otras
expresiones condicionales.
-Las bsquedas se pueden efectuar por el contenido completo de un campo, por
palabras aisladas o secuencia de caracteres.
- Salidas en formato ISO 2709 (norma internacional para el intercambio de informacin
documental).
- Capacidad de convertir el contenido de un campo determinado.
Las razones para elegir CDS/ISIS como software de base para el catlogo de la
BIBFAR son :
- Posee la capacidad de almacenar elementos de longitud variable compatibles con el
Formato de datos bibliogrficos MARC.
- Posee las funciones caractersticas de un OPAC.
2.2 Modelo cliente / servidor.
El modelo cliente / servidor es un caso especial de sistemas de cmputo
distribuidos. Segn [Berson,1996], el trmino cliente / servidor aplica para la
arquitectura de software que describe el procesamiento entre dos programas: una
aplicacin (cliente) y un servicio de soporte (servidor), sin importar que el cliente y el
servidor estn separados fsicamente.
El modelo cliente / servidor implica el procesamiento cooperativo de solicitudes
enviadas por un cliente, al servidor el cual procesa las solicitudes y regresa
los resultados al cliente.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
42
Segn [Umar,1997] las caractersticas principales del modelo cliente/servidor son:
1. Clientes y servidores son mdulos funcionales con interfaces bien definidas.
2. Cada relacin cliente / servidor es establecida entre dos mdulos funcionales cuando
un modulo (el cliente) inicia una peticin de servicio y el otro (el servidor) elige
responder a la peticin de servicio.
3. El intercambio de informacin entre clientes y servidores es estrictamente a travs de
mensajes (no existen variables globales).
4. Los mensajes intercambiados entre clientes y servidores son tpicamente
interactivos.
5. Tanto clientes como servidores residen en diferentes mquinas conectadas a travs
de una red.
2.2.1 Bloques del modelo cliente / servidor.
En la interpretacin de [Umar,1997] (fig. 5), los sistemas cliente/servidor se construyen
a partir de bloques:
Procesos del Cliente.- (comnmente referidos como cliente) comprenden desde
interfaces de usuario, hojas de clculo hasta aplicaciones completas. Cada vez ms los
procesos del cliente se estn convirtiendo en aplicaciones basadas en Internet.
Procesos del Servidor.- (Comnmente referidos como servidor) proveen los servicios al
cliente, ofrecen funcionalidades desde muy simples hasta muy sofisticadas. Idealmente
ocultan informacin interna que los clientes no deben conocer.
Middleware28.- Provee un amplio rango de funcionalidades tales como el establecer
sesiones entre los procesos del cliente y del servidor, conexiones a bases de datos,
28 Software que conecta otras piezas de software.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
43
etctera.
Umar reconoce un caso particular de middleware:
El World Wide Web, que en el tiempo presente (ao 2004), consiste en Navegadores
Web, Servidores Web, motores de bsqueda, lenguaje de marcacin de hipertexto
(HTML), el protocolo de transferencia de hipertexto (HTTP), y puentes (Gateways) que
permiten acceder a bases de datos (todos estos componentes se detallarn mas
adelante).
5. Bloques del modelo cliente / servidor segn Umar.
Middleware del cliente.- Esencialmente es un conjunto de mdulos de software los
cuales pueden ser invocados desde el cliente a travs de una interfaz de programacin
(API por sus siglas en ingls).
Middleware del servidor.- Su funcin es monitorear las peticiones de los clientes e
invocar los procesos apropiados.
Servicios de Red.- Redes de comunicacin o redes, proveen el ms bajo nivel de
servicio, para comunicar el Middleware de clientes y servidores. En este contexto una
red es una coleccin de equipos, mdulos de software y medios fsicos vistos como un
todo autnomo, que interconecta dos o ms computadoras.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
44
Los servicios de Red, estn basados en alguna arquitectura de red como el modelo de
referencia OSI, o la pila de protocolos TCP/IP.
2.2.2 Procesamiento cooperativo cliente / servidor.
Dentro del modelo cliente / servidor existen diferentes enfoques que tratan la
distribucin de una aplicacin dentro de una red, un ejemplo de estos enfoques es el
Procesamiento Cooperativo cliente / servidor que propone [Berson,1996], en el que
una aplicacin se divide en cuatro componentes:
a) Lgica de Presentacin.- Es la parte que interacta con el usuario y la terminal.
Solo se encarga del despliegue de datos y de las entradas del usuario.
b) Lgica de Negocio.- Usa las entradas del usuario o de la base de datos para realizar
las tareas del negocio.
c) Lgica de Manipulacin de datos.- Es la parte de la aplicacin que manipula datos,
los datos son manejados por un DBMS.
d) Procesamiento de datos.- Es la parte de la aplicacin que accede a los datos a bajo
nivel.
2.2.3 Componentes del Middleware World Wide Web.
En la opinin de Umar, el middleware World Wide Web es un middleware que opera en
la capa de aplicacin del protocolo TCP/IP.
El middleware Web esta basado en los siguientes conceptos y tecnologas:
- Servicio de Nombres de Dominio (DNS).
- Servidores Web (Web Servers).
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
45
- Navegadores Web (Web Navigator).
- Localizador Uniforme de Recursos (URL).
- Protocolo de Transferencia de Hipertextos (HTTP).
- Lenguaje de Marcacin de Hipertextos (HTML).
- Puentes (Gateways).
Localizador Uniforme de Recursos (URL).- Es una secuencia de caracteres que
identifica a un recurso dentro de la Internet, su sintaxis est definida en el documento
RFC - 1738 [ Berners-Lee,1994].
La sintaxis se divide en dos partes, un esquema y su correspondiente parte especfica,
la notacin BNF de una URL es:
:
La notacin BNF de es:
//:@:/
Donde:
es una secuencia de caracteres del alfabeto ingls que identifica a un
protocolo de comunicacin (v.gr.: ftp, http, https).
y son una secuencia de caracteres nmericos o del alfabeto
ingls que determinan el nombre de un usuario y su correspondiente clave de acceso
ante un servidor determinado.
es una secuencia de caracteres numricos o del alfabeto ingls, separados
por puntos, que hacen referencia a una direccin de internet en la que se encuentra un
servidor.
es una secuencia de caracteres numricos que representa algn nmero
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
46
comprendido entre el 1 y el 65535.
es una secuencia de caracteres numricos o del alfabeto ingls que
representa un recurso disponible en el servidor.
Protocolo de Transferencia de Hipertexto (HTTP).- Actualmente definido en el
documento RFC 2616 [Fielding,1999] es un protocolo de nivel de aplicacin para
sistemas de informacin de hipermedia distribuidos y colaborativos. Es un protocolo
genrico y no orientado a la conexin (no maneja sesiones).
Lenguaje de Marcacin de Hipertextos (HTML).- Comentado en el documento RFC
2854 [Connolly,2000] y por [Ragget ,1997]. Es un lenguaje que define documentos de
hipertexto, es usado como lenguaje de presentacin de pginas adems de que permite
definir hiperligas mediante los URL. Este lenguaje es interpretado por un Navegador, lo
que provoca que la presentacin de las pginas dependa del navegador que se use
para mostrar dicha pgina.
Anteriormente solo se limitaba a describir la estructura y contenido de un documento y
no el formato de la pgina ni su apariencia, actualmente (en el ao 2003), ha
evolucionado a tal grado que las pginas empiezan a parecerse a documentos
compuestos en programas de autoedicin.
Puentes (Gateways).- Son enlaces a recursos que no pertenecen a la Web. Para Umar
son mecanismos que enlazan navegadores web con recursos que no son pginas web.
Los enlaces son usados para acceder a informacin desde orgenes de datos
heterogneos (bases de datos relacionales, sistemas de informacin propietarios, u
otros servicios del servidor).
La idea principal es que los Navegadores slo pueden mostrar HTML, los gateways son
usados para acceder a la informacin no-HTML y convertirla al formato HTML para
mostrarla en el Navegador.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
47
Los gateways son programas que corren generalmente en el servidor.
En el presente (en el ao 2004) continan vigentes los diferentes enfoques que segn
Perrochon 29 consisten en:
- CGI.- Common Gateway Interface.
- SSI.- Server Side Includes.
- Servidores Especficos.- Programados a travs de un API especfico del web server.
- Sistemas de cdigo mvil.- Gateways Java.
El desarrollo de la aplicacin planteada en esta tesis est basado en la programacin
de una variante de SSI.
Un SSI consiste en una secuencia especial de caracteres (etiquetas) dentro de una
pgina HTML.
Estas etiquetas son procesadas por el servidor en el instante en que enva el
documento al navegador. Cuando el servidor encuentra una etiqueta SSI interpreta las
instrucciones contenidas dentro de la etiqueta y efecta una accin apropiada.
As mientras el HTML es interpretado por los navegadores (clientes), los SSI son
interpretados por el servidor.
2.3 Aplicaciones Web.
Se trata de un concepto de aplicaciones cliente / servidor en el que se usa la
infraestructura de Internet como software intermedio entre clientes y servidores.
En palabras de Conallen 30, una aplicacin de software web o aplicacin web, es un
sistema web donde la entrada del usuario (navegacin y entrada de datos) afecta el
estado del sistema.
29 PERROCHON, citado por Umar Ajmad.: Object Oriented Client/Server Internet Environments., p. 178. 30 CONALLEN, Jim.: Modeling Web Application Architectures with UML., p. 1.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
48
La definicin de Gellersen 31, es mas general: definimos una aplicacin web, como
cualquier aplicacin de software que depende de la web para su correcta ejecucin.
A diferencia de las aplicaciones cliente/servidor tradicionales, las aplicaciones web
tienen muchas ventajas, tanto econmicas como tecnolgicas: A nivel tcnico, la
programacin de este tipo de aplicaciones es ms fcil, en comparacin a las
aplicaciones cliente/servidor tradicionales, en las que los programadores deban
involucrarse en detalles como el desarrollo de protocolos de comunicacin, el escribir
un servidor que escuchara las peticiones de los clientes y atendiera a esas peticiones.
En opinin de Gellersen, las aplicaciones web gozan de acceso a plataforma cruzada,
esto es que pueden correr en sistemas operativos diferentes a los que se desarroll la
aplicacin, Gellersen contina mencionando que la distribucin o instalacin de una
aplicacin web recae sobre el concepto de clientes ligeros y en el concepto de
mantenimiento centralizado.
Algunas desventajas asociadas a las aplicaciones web se presentan en el ciclo de
desarrollo de las mismas, razn por la cual los lectores interesados debern remitirse al
Captulo III , apartado 3.2 Ingeniera de Software Web.
31 GELLERSEN, Hans-W.: Object-Oriented Web Application Development. , IEEE Internet Computing Magazine, Enero-Febrero 1999. p. 61
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
49
Captulo III Desarrollo del SCAI-BIBFAR.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
50
3.1 Introduccin.
Este captulo trata sobre las actividades necesarias para construir una aplicacin web
de calidad; para ello se hace una breve introduccin del concepto de Ingeniera de
Software, as como tambin del concepto de Ingeniera de Software Web.
En seguida se justifica el uso de programacin orientada a objetos para resolver el
sistema de software, continuando con la justificacin del modelo de desarrollo.
Por ltimo, se describen a detalle los entregables del anlisis, diseo de la experiencia
de usuario, diseo, implementacin y pruebas relativas al desarrollo del sistema.
3.2 Ingeniera de Software Web.
La Ingeniera del Software, disciplina que Pressman 32 describe como : el uso de
principios de la Ingeniera a fin de obtener un software que sea fiable y que funcione
eficientemente en el mundo real; involucra principios tales como anlisis, diseo,
implementacin, pruebas y mantenimiento.
La Ingeniera de Software Web, o Ingeniera Web 33 es una especializacin de la
Ingeniera de Software, en la que, en opinin de [Kirda,2001] incluye otras
actividades adicionales de anlisis de datos, estructuracin de informacin,
administracin de navegacin y organizacin de datos; este mismo autor advierte sobre
lo inadecuado y difcil que resulta usar un proceso de ingeniera de software tradicional .
32 PRESSMAN, Roger.: Ingeniera de Software, un enfoque prctico., p. XXIX 33 Del concepto de la lengua inglesa, Web Engineering.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
51
3.2.1 Problemtica de la Ingeniera de Software Web.
La problemtica de la Ingeniera Web se refiere a la no existencia de metodologas
estndar, es decir, que el desarrollo de aplicaciones web se caracteriza, en opinin de
algunos autores, por su anarqua y por el uso de metodologas ad hoc.
La falta de metodologas para desarrollo de aplicaciones web, como sugiere
[Gellersen,1999], se debe al origen de la web como un medio de informacin en lugar
de una plataforma de aplicaciones, as, el desarrollo de aplicaciones web es visto como
un problema de autoedicin, en lugar de un problema de desarrollo de software, al cual
se le deberan aplicar principios de Ingeniera de software.
Otra razn que explica la falta de metodologas, es la naturaleza del middleware de la
Web, no es homogneo, ni en clientes ni en servidores, pues involucra diferentes
tecnologas (Java, ActiveX, JavaScript, PHP, etc.) y diferentes enfoques de
programacin (declarativos, estructurados, basados en clases, en eventos, orientados a
objetos, etc).
En aos recientes, se han propuesto varias metodologas [Enguix, 1999] para facilitar el
desarrollo de aplicaciones web, sin embargo, no se ha creado alguna metodologa
estndar que cubra las necesidades de un enfoque sistemtico y metodolgico para el
desarrollo dinmico y complejo de aplicaciones web .
3.3 Programacin Orientada a Objetos.
Las razones para aplicar tcnicas de programacin orientada a objetos estn
relacionadas con la reutilizacin de cdigo, la reduccin en el tiempo de desarrollo y
la existencia de un lenguaje para especificacin, visualizacin y construccin de
elementos de software orientado a objetos [Joyanes,1998], lenguaje conocido como
UML (Unified Modeling Language), que estandariza la forma en que un ingeniero de
software expresa el anlisis y diseo de software orientado a objetos.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
52
3.3.1 UML
En palabras de Sinan Si Alhir 34 UML es un lenguaje que unifica las mejores prcticas
de la industria del software para el modelado de sistemas.
UML no es simplemente una notacin para dibujar diagramas, es un lenguaje completo
para capturar el conocimiento (semntico) acerca de un tema y expresar ese
conocimiento (sintaxis) para propsitos de comunicacin.
Los diagramas de UML son productos entregables que junto con otros documentos
constituyen lo que en UML se conoce como artefactos.
Las metas del UML son:
- Ser un lenguaje visual y expresivo de modelado listo para usarse, que sea simple y
extensible.
-Tener mecanismos de extensibilidad y especializacin, en vez de modificar los
conceptos principales.
- Formalizar un conjunto bsico de conceptos que constituyen el paradigma orientado a
objetos, de manera que las extensiones no requieran de la reimplementacin de los
conceptos bsicos.
- Permitir agregar nuevos conceptos y notacin mas all de los ya definidos por la base.
- Permitir varias interpretaciones de los conceptos existentes para los cuales no existe
un consenso claro.
- Permitir la especializacin de conceptos, notacin y restricciones para dominios en
particular.
UML es un lenguaje de modelado que comunica una conceptualizacin o
especificacin, no es un lenguaje de programacin visual.
34 SI ALHIR Sinan.: UML in a nutshell. A Desktop Reference., p. 3.
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
53
La especificacin de UML es parte de la OMG (Object Management Group), quien
constantemente hace revisiones al documento original y publica cambios, por este
hecho es importante remarcar que los diagramas que se presentan en esta tesis
corresponden a la especificacin 1.1 de UML.
3.3.2 UML y El desarrollo de Aplicaciones WEB.
Cuando se trata de modelar aplicaciones web con UML, resulta que algunos de los
componentes de las aplicaciones Web no encajan a la perfeccin en los elementos de
modelado de UML. Para resolver este problema [Conallen,1999], ha propuesto una
extensin de UML para modelar los elementos arquitectnicos de las aplicaciones
Web; es as que esta extensin se ha usado en el anlisis y diseo del sistema
propuesto.
En la literatura especializada, se le conoce como WAE-UML35.
No es tema de esta tesis tratar los detalles de cmo y en que consiste la extensibilidad
de UML, slo cabe mencionar que en UML es posible definir nuevos estereotipos y
reglas para extender su semntica y as solventar los problemas que pudieran no estar
cubiertos con la especificacin estndar de UML.
El modelo de desarrollo del sistema o modelo de ciclo de vida de un sistema, se refiere
a la secuencia con que se realizan las actividades concernientes a la Ingeniera del
Software: especificacin, diseo, implementacin, revisin, mantenimiento, prueba, etc..
En opinin de [McConell, 1998], dependiendo del modelo elegido se pueden maximizar
o minimizar algunos de los factores involucrados en el desarrollo.
En este caso los factores esenciales del proyecto son los siguientes:
- Bajo costo.
- No hay necesidad de estimar tiempos requeridos.
35 Por sus siglas en ingls Web Application Extension for UML, es una extensin al lenguaje UML, propuesta en 1999 por Jim Conallen.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
54
-Se requiere un producto final cuya operacin se realice 24 horas al da y 365
das del ao.
- Se cuenta con una definicin estable del producto final.
Tras la revisin de los diversos mtodos disponibles [McConell, 1996] se eligi el
modelo de desarrollo iterativo en cascada (fig. 6) considerando las siguientes razones:
- Es ms fcil de seguir.
- Genera una mejora contina al sistema en cada iteracin.
- Requiere poca comprensin de la arquitectura del sistema.
- Ataca el riesgo mostrando resultados en cada iteracin.
6. Modelo de desarrollo en cascada.
3.5 Anlisis.
Se entender por anlisis a la investigacin necesaria para describir un problema de
software, que para el caso de este desarrollo en particular, se expresar mediante
cuatro entregables o artefactos:
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
55
1) Anlisis de Requerimientos.- El anlisis ordenado y clasificado de las necesidades
del usuario, expresadas en un lenguaje que evita tecnicismos en el mayor grado de lo
posible.
2) Anlisis de Casos de Uso.- La traduccin de las necesidades del usuario en
operaciones del producto final, identificando a los principales involucrados.
3) Glosario del Sistema.- Un glosario que describe en lenguaje no tcnico todos los
trminos usados para describir los casos de uso.
4) Modelo Conceptual.- La identificacin de unidades de funcionalidad independientes
(posiblemente clases) que componen el producto final como sistema.
3.5.1 Anlisis de Requerimientos.
En las metodologas de desarrollo orientado a objetos, como la propuesta
por [Larman, 1999], se inicia con un diagnstico de las necesidades del usuario, es en
este primer acercamiento donde quedan definidas todas las caractersticas y
operaciones que el sistema deber realizar. El anlisis de requerimientos que se
presenta esta basado en un modelo que ayuda en la categorizacin y agrupamiento de
requerimientos conocido como FURPS+36; el formato usado para expresar los
requerimientos consiste en un listado numerado usando notacin decimal.
En el mbito de este sistema se han considerado como una fuente de requerimientos
esenciales toda la informacin vertida en los apartados 2.1, 2.2, 2.3, 2.4, 2.5 y 2.6 del
Captulo I de esta tesis.
1. Requerimientos funcionales.
1.1 El sistema deber tener un catlogo pblico en lnea (OPAC).
36 Por sus siglas en ingls Funcionality Usability Reliability Performance Supportability, es una propuesta de Robert Grady, citado por Peter Eles.: Capturing Architectural Requirements., The Rational Edge, November 2001 , Rational.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
56
1.2 El sistema permitir hojear el OPAC.
1.3 El sistema almacenar registros catalogrficos basados en MARC.
1.4 El OPAC almacenar mas de un catlogo.
1.5 El OPAC estar disponible en Internet.
1.6 El sistema de circulacin (SC) identificar los materiales en prstamo.
1.7 El SC identificar a los prestatarios.
1.8 El SC asegurar el regreso de los materiales dentro de un periodo razonable de
tiempo, despus de su expiracin.
1.9 El SC proveer informacin adecuada de prestatarios con adeudos.
1.10 El SC permitir la disponibilidad de materiales tan pronto como sea posible, a
travs de un sistema eficiente de reservaciones.
1.11 El SC ser flexible para variar los perodos de prstamo.
1.12 El SC no requerir de costos excesivos para su operacin.
1.13 El SC permitir hacer reservaciones por Internet.
1.14 El SC permitir consultar el expediente de un usuario, por Internet.
1.15 El SC notificar por correo electrnico a los usuarios cuando una fecha de
prstamo expire.
1.16 El SC mostrar el nmero de ejemplares disponibles para prstamo.
1.17 El SC permitir establecer perfiles para los prestatarios donde se especifique el
nmero de ejemplares de prstamo, el monto de multa por da de retraso, y el nmero
mximo de renovaciones que se le permiten.
1.18 El SC permitir establecer perfiles para los materiales donde se especifique el
-
SISTEMA DE CIRCULACIN AUTOMATIZADO POR INTERNET PARA LA BIBLIOTECA DE LA FUNDACIN ARTURO ROSENBLUETH
57
nmero mximo de das de prstamo permitidos, el nmero de ejemplares que se
pueden prestar y el tipo de perfil de prestatario a quin aplica ese perfil.
1.19 El SC calcular automticamente la fecha de expiracin en das hbiles, de un
prstamo y una reservacin.
1.20 El SC calcular en base a los perfiles prestatario / material los das de prstamo y
el nmero mximo de das que un prestatario puede conservar un ejemplar.
1.21 El sistema ayudar en la generacin de bibliografas para los usuarios.
1.22 El sistema permitir evaluar el servicio prestado en la biblioteca.
1.23 El sistema proteger el acceso a la informacin de prestamos y reservaciones.
1.24 El sistema contar con ayuda en lnea.
1.25 El OPAC podr exportar sus datos a otros formatos como XML.
1.26 El OPAC estar conectado lgicamente con el SC, por cada registro catalogrfico
existente en el OPAC, habr al menos un registro en el SC.
1.27 El SC permitir hacer renovaciones de cargos que estn vigentes.
2. Requerimientos de Usabilidad.
2.1 El SC deber ser simple para el pblico en cuanto a operacin se refiere, y para el
personal de la biblioteca deber ser fcil de entender y operar.
2.2 El OPAC deber verse en la mayora de los navegadores.
2.3 El OPAC no usar FRAMES de HTML para facilitar la visualizacin en todos los
navegadores.
2.4 El OPAC no depender de JavaScript para su funcionamiento bsico.
2.5 El OPAC usar hojas de estilo en cascada CSS para mostrar los resultados de
las bsquedas.
-
TESIS QUE PARA OBTENER EL TTULO DE INGENIERO EN COMPUTACIN PRESENTA: ARTURO FRAPP MUOZ
58
3. Requerimientos de Confiabilidad.
3.1 El OPAC asegurar los mejores resultados en cada bsqueda.
3.2 El OPAC deber estar en lnea 24 horas al da durante los 7 das de una semana.
4. Requerimientos de Desempeo.
4.1 El tiempo de respuesta del sistema para pginas estticas ser menor o igual a 3
segundos.
4.2 El tiempo de respuesta del sistema para pginas generadas dinmicamente ser
menor o igual a 8 segundos.
4.3 El tiempo de respuesta del sistema para consultas a base de datos relacional ser
menor o igual a 2 segundos.
4.4 El tiempo de respuesta del sistema para consultas a b