PLATAFORMA PARA EL ANÁLISIS DE LA OPINIÓN DE LOS CONSUMIDORES Y CIUDADANOS
Subprograma INNPACTO
Ministerio de Economía y Competitividad
E1.1 Casos de uso y requerimientos del sistema
Fecha de la entrega del entregable: 30/09/2011
Fecha real del envío del entregable: 31/12/2011
Comienzo del proyecto: 01/07/2011 Duración: 24 meses
Institución responsable de este entregable: Agoranet
Índice i
Contents
1 Descripción del entregable.................................................................................................... 3
2 Catálogo de usuarios ............................................................................................................. 4
2.1 Definición de usuarios ................................................................................................... 4
2.1.1 Administrador global del sistema .......................................................................... 4
2.1.2 Administrador de la empresa ................................................................................ 4
2.1.3 Usuario/cliente final .............................................................................................. 4
3 Catálogo de casos de uso ...................................................................................................... 5
3.1 Casos de uso de la capa de adquisición ......................................................................... 5
3.1.1 CS-AD-01: Gestión de políticas y reglas de acceso a contenidos Web .................. 5
3.1.2 CS-AD-02: Establecimiento de las preferencias de gestión de cluster .................. 6
3.1.3 CS-AD-03: Gestión de almacenamiento de los datos ............................................ 7
3.1.4 CS-AD-04: Gestión y control de usuarios ............................................................... 7
3.2 Casos de uso de la capa de análisis ............................................................................... 8
3.2.1 CS-AN-01: Modificación de parámetros de análisis de texto ................................ 8
3.2.2 CS-AN-02: Modificación de parámetros de análisis de imagen ............................. 9
3.2.3 CS-AN-03: Modificación de parámetros de análisis de video.............................. 10
3.2.4 CS-AN-04: Modificación de parámetros de análisis de audio ............................. 10
3.2.5 CS-AN-05: Modificación de criterios de valoración ............................................. 11
3.3 Casos de uso de la capa de visualización e interacción ............................................... 11
3.3.1 CS-VI-01: Consulta de sentimiento sobre marca o producto .............................. 11
3.3.2 CS-VI-0: 2Interacción con la interfaz y petición de nueva consulta ..................... 12
3.3.3 CS-VI-03: Incorporación de resultados de otro producto .................................... 13
3.3.4 CS-VI-04: Obtención de indicadores para ayuda a la toma de decisiones .......... 14
3.3.5 CS-VI-05: Creación de un nuevo tipo de perfil de consulta ................................. 14
4 Catálogo de requisitos del sistema ..................................................................................... 16
4.1 Requisitos funcionales (RF) y no funcionales (RNF) ................................................... 16
4.2 Requisitos funcionales específicos .............................................................................. 20
4.2.1 Adquisición de contenido .................................................................................... 21
4.2.2 Análisis lingüístico ............................................................................................... 23
4.2.3 Análisis de imágenes ........................................................................................... 25
Índice ii
4.2.4 Análisis de video .................................................................................................. 26
4.2.5 Análisis de audio .................................................................................................. 27
4.2.6 Visualización analítica ......................................................................................... 28
Índice iii
Índice de figuras
Figura 3.1 Caso de uso CS-AD-01. ................................................................................................. 5
Figura 3.2 Caso de uso CS-AD-02. ................................................................................................. 6
Figura 3.3 Diagrama caso de uso CS-AD-03. ................................................................................. 7
Figura 3.4 Diagrama de casos de uso CS-AD-04. ........................................................................... 8
Figura 3.5 Diagrama de casos de uso CS-AN-01. .......................................................................... 9
Figura 3.6 Diagrama de casos de uso CS-AN-02. .......................................................................... 9
Figura 3.7 Diagrama de caso de uso CS-AN-03. .......................................................................... 10
Figura 3.8 Diagrama de caso de uso CS-AN-04. .......................................................................... 11
Figura 3.9 Caso de uso de consulta de sentimiento. .................................................................. 12
Figura 3.10 Diagrama de secuencias del caso de usoCS-VI-02. .................................................. 13
Figura 3.11 Diagrama de secuencias asociado al caso de uso CS-VI-03. .................................... 14
Figura 3.12 Diagrama de caso de uso CS-VI-04. .......................................................................... 14
Figura 3.13 Diagrama de caso de uso CS-VI-05. .......................................................................... 15
E1.1 Casos de uso y requerimientos del sistema 1
Resumen del entregable
Este entregable describe los casos de uso y requerimientos funcionales del proyecto. En primer
lugar, se describen los distintos actores que participan en el proyecto: el administrador global
del sistema, que se encarga del mantenimiento y gestión de la plataforma ePOCA
(configuración, puesta a punto, mantenimiento); el administrador de la empresa, que define
los parámetros de búsqueda asociados para obtener una opinión; y el usuario o cliente final,
que interpreta los resultados de la plataforma.
En segundo lugar, se detallan los casos de uso del proyecto, que se han dividido siguiendo la
estructura de tres grandes capas de la arquitectura del proyecto ePOCA (capa de adquisición,
capa de análisis y capa de visualización e interacción).
Capa de adquisición
Esta capa es la encargada de rastrear la Web para la adquisición de contenidos y de
almacenarlos temporalmente hasta que sean analizados. Entre los casos de uso asociados a
esta capa, pueden mencionarse las acciones y funcionalidades necesarias para establecer las
políticas y reglas para la adquisición de contenidos Web, las acciones y funcionalidades
necesarias para el correcto funcionamiento del clúster y su mantenimiento, las funcionalidades
relacionadas con el almacenamiento y gestión de todos los datos manejados dentro de la
plataforma ePOCA, y el control del sistema de seguridad y acceso a todas las funcionalidades
de la plataforma ePOCA.
Capa de análisis
Esta capa es la encargada de realizar los diferentes análisis sobre los datos previamente
adquiridos por la capa de adquisición. Los casos de uso asociados incluirán la configuración de
algunos parámetros específicos del módulo de procesamiento de texto, la modificación de
algunos parámetros y variables del módulo de imágenes en función de las necesidades
específicas de las consultas o debido a incidencias observadas durante el funcionamiento del
sistema, la modificación de los parámetros de la técnica de secuenciación utilizada
directamente relacionada con el número de frames en función del tiempo de respuesta y la
carga de los ordenadores del sistema, la modificación de los parámetros referentes al
algoritmo de extracción de audio a partir de los contenidos originales para su conversión a
texto y la modificación de los criterios de valoración utilizados para la ponderación de los
resultados intermedios.
Capa de visualización e interacción
Esta capa es la encargada de visualizar los resultados obtenidos en el análisis e interactuar con
el usuario final. Entre los casos de uso definidos, se pueden mencionar la búsqueda de
sentimiento sobre una marca o producto determinado a partir de una petición de consulta
bajo demanda sobre los dominios examinados, nombre de la marca o producto y tipo de
funcionalidad, la solicitud de una nueva visualización sobre la base de los resultados
mostrados, la forma de complementar una consulta con otra consulta similar de otros
productos o marcas para fines comparativos en términos de estudio de la competencia y en el
establecimiento de “rankings” de valoración, la obtención de indicadores básicos que
E1.1 Casos de uso y requerimientos del sistema 2
presenten un resumen de los resultados de la consulta para la toma de decisiones y la
modificación de perfiles para obtener nuevos resultados.
Finalmente, se detallan los diferentes requisitos de usuario asociados a los casos de uso. Estos
requisitos se presentan en formato tabla indicando su identificador, una breve descripción, su
prioridad alta/media/baja, y la relación con otros requisitos. Los requisitos se agrupan en tres
categorías:
Requisitos funcionales (RF) que representan la funcionalidad deseada por parte de la
plataforma.
Requisitos no funcionales (RNF) los cuales representan requisitos deseables de la
plataforma, pero que no se corresponden con ninguna funcionalidad específica sino
con el comportamiento general de la plataforma (p.e. escalabilidad del sistema).
Requisitos restrictivos (RRE) que describen restricciones generales que debe cumplir la
plataforma.
E1.1 Casos de uso y requerimientos del sistema 3
1 Descripción del entregable
En primer lugar, este entregable describe los distintos actores que participan en el proyecto,
así como los casos de uso y requerimientos funcionales del proyecto.
Listado de acrónimos
CS: Caso de uso
RF: Requisito Funcional
RNF: Requisito No Funcional
RRE: Requisito Restrictivo
URL: Uniform Resource Locator
Bots: Sinónimo de robots o en el caso de adquisición de contenidos de rastreador Web.
E1.1 Casos de uso y requerimientos del sistema 4
2 Catálogo de usuarios
2.1 DEFINICIÓN DE USUARIOS
Se han definido tres tipos de usuarios para el proyecto ePOCA, donde cada uno de ellos tiene
responsabilidades bien diferenciadas.
2.1.1 Administrador global del sistema
El administrador global del sistema es el encargado del mantenimiento y gestión de la
plataforma ePOCA. Se encarga de todos los aspectos relacionados con la definición de los
parámetros de configuración de la plataforma y su puesta a punto. Se considera que es una
persona especializada y con conocimientos avanzados de la plataforma.
2.1.2 Administrador de la empresa
De forma similar, el administrador de la empresa tiene un rol similar en la empresa con
funcionalidades más limitadas. Se encarga de definir los parámetros de búsqueda asociados a
marca, producto, URLs de sitios Web a incluir y otros parámetros relacionados con la
obtención de opinión. No debe tratarse de una persona experta en la plataforma, aunque debe
tener algún conocimiento sobre ella y conocer bien los requisitos deseados en cuanto a las
consultas de opiniones a realizar.
2.1.3 Usuario/cliente final
Se trata del usuario consumidor de los resultados proporcionados por ePOCA. En general, se
tratará de un usuario no especializado y sin conocimientos de la plataforma. Este usuario
conoce el entorno empresarial del producto/marca y por lo tanto, es capaz de interpretar los
resultados presentados e interactuar con ellos para mejorar el conocimiento de la opinión del
entorno bajo estudio.
Tabla 2.1 Funcionalidades por cada tipo de usuario.
Configuración
ePOCA
Gestión
adquisición
Gestión
consultas
Acceso
resultados
Gestión
perfiles
Administrador
global ● ● ● ●
Administrador
empresa ● ●
Usuario final ●
E1.1 Casos de uso y requerimientos del sistema 5
3 Catálogo de casos de uso
Los casos de uso se han dividido siguiendo la estructura de tres grandes capas de la
arquitectura del proyecto ePOCA (capa de adquisición, capa de análisis y capa de visualización
e interacción). Este documento únicamente refleja la interacción de los diferentes usuarios con
las funcionalidades accesibles para cada uno de ellos, ya que la arquitectura y las
funcionalidades internas se detallan en los entregables E2.1 Arquitectura de sistema y E2.2
Componentes e interfaces del sistema.
3.1 CASOS DE USO DE LA CAPA DE ADQUISICIÓN
Esta capa es la encargada de rastrear la Web para la adquisición de contenidos y de
almacenarlos temporalmente hasta que sean analizados. Los casos de uso asociados a esta
capa son los siguientes:
3.1.1 CS-AD-01: Gestión de políticas y reglas de acceso a contenidos Web
Este caso de uso describe las acciones y funcionalidades necesarias para establecer las políticas
y reglas para la adquisición de contenidos Web, incluyendo la definición de la frecuencia de
actualización de los sitios Web a ser adquiridos, velocidad de acceso por dominios, número
máximo de rastreadores por dominio, etc. La modificación de estas políticas y reglas de acceso
permitirá la interacción y rastreo de los sitios Web sin causarles molestias o inconvenientes en
sus servicios. En caso contrario, se podría provocar una denegación de servicios y bloqueo a los
rastreadores.
Figura 3.1 Caso de uso CS-AD-01.
El único actor involucrado en esta tarea es el administrador global del sistema, quien
dispondrá de permisos suficientes para el establecimiento de políticas y reglas. Este actor
definirá y mantendrá la configuración óptima de la plataforma de acuerdo a las normas y
disposiciones legales en este tipo de servicios de rastreo.
Las funcionalidades asociadas a este caso de uso son las siguientes:
Establecimiento de frecuencia de actualización de páginas.
Establecimiento de número de “bots” (i.e. procesos de rastreo) por sitio/dominio.
E1.1 Casos de uso y requerimientos del sistema 6
Establecimiento de URLs a monitorizar.
Alta/baja/modificación de direcciones URL o dominios para la adquisición de
contenidos.
Este caso de uso se ejecutará únicamente en la configuración inicial de la plataforma, cuando
se efectúen modificaciones en el hardware/software, o cuando se requiera por algún tipo de
incidencia.
3.1.2 CS-AD-02: Establecimiento de las preferencias de gestión de cluster
Este caso de uso describe las acciones y funcionalidades necesarias para el correcto
funcionamiento del clúster y su mantenimiento. Clúster es un término que se refiere a un
conjunto de unidades de proceso (i.e. máquinas) que trabajan conjuntamente para ofrecer
mayores prestaciones, aunque puede tratarse también de una máquina sencilla, dado que la
plataforma será escalable. Dentro de las funcionalidades de este caso de uso, se incluyen la
definición de todos los parámetros de configuración del cluster relacionados con el número de
“bots” a ejecutar por cada máquina, su número total, máximo número de procesos,
localización de las diferentes máquinas y sus funcionalidades (análisis o adquisición), etc.
Administrador_Sistema
Gestión_Bots
Gestión_Procesos
Gestión_Computadore
s
Añadir_Computador
Gestión_Cluster
«uses»
«uses»
«uses»
«uses»
«uses»
«uses»
«uses»
«uses»
Figura 3.2 Caso de uso CS-AD-02.
El único actor involucrado en esta tarea es el administrador global que será el único con
permisos suficientes para la modificación de la configuración del cluster. El administrador de la
empresa sólo accederá a la funcionalidad necesaria para el mantenimiento, aunque no podrá
generar nuevas funcionalidades. La gestión del cluster a nivel interno se basará en la
arquitectura HADOOP.
Las funcionalidades que se realizan en este caso de uso son:
Establecimiento/modificación del número de “bots” totales a ejecutar.
Establecimiento de reglas de coordinación de “bots” distribuidos.
E1.1 Casos de uso y requerimientos del sistema 7
Establecimiento de máximo número de análisis por ordenador.
Establecimiento de perfiles de las distintas máquinas del sistema.
Añadir nuevas máquinas al sistema.
Este caso de uso se ejecutará únicamente durante la configuración de la plataforma, cuando se
efectúen modificaciones en el hardware/software, o por algún tipo de incidencia que así lo
requiera.
3.1.3 CS-AD-03: Gestión de almacenamiento de los datos
Este caso de uso representa las funcionalidades relacionadas con el almacenamiento y gestión
de todos los datos manejados dentro de la plataforma ePOCA. Estos datos se corresponden
tanto con la adquisición de contenidos como con los resultados obtenidos tras realizar los
diferentes análisis. Dichos datos deberán estar accesibles en todo momento para su uso y se
proporcionarán una serie de funcionalidades que permitan su correcta gestión para tenerlos
accesibles y seguros.
Administrador_Sistema
Gestión_Backup
«uses»
Gestión_Repositorio
s
«uses»
Gestión_BBDD
«uses»
«uses»
Gestión_Cluster
«uses»
Figura 3.3 Diagrama caso de uso CS-AD-03.
El administrador global del sistema será el único actor que disponga de permisos sobre todas
estas funcionalidades asociadas a este caso de uso, que serán las siguientes:
Gestión de backup y almacenamiento temporal.
Gestión de repositorios.
3.1.4 CS-AD-04: Gestión y control de usuarios
Este módulo se encarga de controlar el sistema de seguridad y acceso a todas las
funcionalidades de la plataforma ePOCA. Permitirá la inclusión de nuevos roles de
clientes/usuarios para definir consultas específicas a la plataforma así como su baja y
modificación. Los tipos de usuarios que se utilizarán son tres:
Administrador del sistema ePOCA. Se encarga del control global del sistema ePOCA.
Tiene acceso a todas las funcionalidades tanto desde el punto de vista de usuario
como de la gestión del sistema. Este usuario pertenece a la empresa que mantiene el
sistema y ofrece los servicios de ePOCA.
E1.1 Casos de uso y requerimientos del sistema 8
Administrador de la empresa. Es el encargado de representar a la empresa frente a
cambios sustanciales en el perfil de las consultas asociadas a dicha institución. Tiene
acceso a funcionalidades referentes a la modificación de los parámetros de la consulta
solicitada y al acceso a resultados. Las modificaciones se notificarán al administrador
de ePOCA o de manera automática a través de funcionalidad específica del sistema.
Usuario final. Este perfil será meramente el consumidor de los resultados.
Administrador_Sistema
Alta_Usuario
Baja_Usuario
Modificación_Usuari
o
«uses»
«uses»
«uses»
Gestión_Sistema
«uses»
«uses»
«uses»
Gestión_BBDD
«uses»
Figura 3.4 Diagrama de casos de uso CS-AD-04.
Todas estas funcionalidades serán únicamente accesibles por el administrador global del
sistema. En cuanto a las funcionalidades a realizar en este caso de uso, se engloban en los
siguientes:
Alta/baja/modificación de usuarios/roles para el acceso al sistema ePOCA.
Modificación de permisos de usuarios/roles.
Establecimiento de control de acceso a los datos por perfiles/roles de usuario.
3.2 CASOS DE USO DE LA CAPA DE ANÁLISIS
Esta capa es la encargada de realizar los diferentes análisis sobre los datos previamente
adquiridos por la capa de adquisición. Los casos de uso asociados a esta capa son los
siguientes.
3.2.1 CS-AN-01: Modificación de parámetros de análisis de texto
El módulo de análisis de texto de la plataforma ePOCA lleva asociado algunos parámetros
configurables que pueden depender del tipo de consulta a realizar. Este caso de uso permitirá
configurar dichos parámetros específicos.
E1.1 Casos de uso y requerimientos del sistema 9
Administrador_Sistema
Gestión_Diccionario
s
Selección_Parseador
Modificación_Param.
Análisis
«uses»
«uses»
«uses»
«uses»
Análisis_Texto
«uses»
«uses»
Figura 3.5 Diagrama de casos de uso CS-AN-01.
Excepto en casos excepcionales, todas estas funcionalidades estarán únicamente accesibles
para el administrador global del sistema. Entre otras funcionalidades, se pueden destacar las
siguientes:
Gestión de léxicos.
Selección de tipo de parseador.
Modificación de los parámetros de análisis (términos, palabras adyacentes, etc.).
3.2.2 CS-AN-02: Modificación de parámetros de análisis de imagen
De forma similar al módulo de texto, el módulo de imagen de la plataforma ePOCA depende
de varios parámetros y variables necesarios para su correcto funcionamiento dependiendo de
los resultados deseados. Este caso de uso contempla la modificación de estos parámetros en
función de las necesidades específicas de las consultas o debido a incidencias observadas
durante el funcionamiento del sistema (p.e. tiempos de respuesta muy lentos).
Administrador_Sistema
Seleccion_Mod.
BBD_Referencia
Modificación_Param.
Análisis
Análisis _Imagen
«uses»
«uses»
«uses»
«uses»
Figura 3.6 Diagrama de casos de uso CS-AN-02.
E1.1 Casos de uso y requerimientos del sistema 10
Salvo en casos especiales, todas estas funcionalidades serán únicamente accesibles por el
administrador global del sistema. Las principales funcionalidades de este caso de uso son los
siguientes:
Selección/Modificación de bases de datos de imágenes de referencia.
Modificación de parámetros de algoritmos.
3.2.3 CS-AN-03: Modificación de parámetros de análisis de video
El análisis de video de la plataforma ePOCA contempla principalmente el caso de su
secuenciación para la posterior transferencia de las imágenes más representativas al módulo
de análisis de imagen. Este caso de uso contempla la modificación de los parámetros de la
técnica de secuenciación utilizada directamente relacionada con el número de frames
obtenidos para su posterior análisis. Este parámetro se ajustará en función del tiempo de
respuesta y la carga de los ordenadores del sistema.
Administrador_Sistema
Establecimiento _NºF
rames
Modificación _Param.
Algo.
Análisis_Video
«uses»
«uses» «uses»
«uses»
Figura 3.7 Diagrama de caso de uso CS-AN-03.
En general, todas las funcionalidades asociadas a este caso de uso serán únicamente accesibles
por el administrador global del sistema. Las funcionalidades asociadas a este caso de uso son
las siguientes:
Establecimiento de número de frames a analizar por unidad de tiempo.
Modificación de los parámetros del algoritmo.
3.2.4 CS-AN-04: Modificación de parámetros de análisis de audio
Los datos de audio pueden provenir de videos o de ficheros audio para ser posteriormente
analizados por el módulo de análisis de texto. Este caso de uso representa la modificación de
los parámetros referentes al algoritmo de extracción de audio a partir de los contenidos
originales.
E1.1 Casos de uso y requerimientos del sistema 11
Administrador_Sistema
Modificación_Param.
Audio
Modificación_Param.
Anal.Texto
Análisis_Audio
Análisis_Texto
«uses»
«uses»
«uses»
«uses»
«uses»
Figura 3.8 Diagrama de caso de uso CS-AN-04.
En general, todas estas funcionalidades serán únicamente accesibles por el administrador
global del sistema. Las funcionalidades incluidas en este caso de uso son:
Modificación de los parámetros del algoritmo de audio.
Modificación de algoritmo de análisis de texto asociado.
Modificación del formato del texto transcrito.
3.2.5 CS-AN-05: Modificación de criterios de valoración
Este caso de uso refleja la modificación de los criterios de valoración utilizados para la
ponderación de los resultados intermedios. Este caso de uso sólo se ejecutará cuando así lo
requiera algún tipo de consulta específica o por mal funcionamiento de los criterios actuales.
Esta funcionalidad estará sólo accesible para el administrador global del sistema ePOCA.
Entre las funcionalidades de este caso de uso, se pueden mencionar las siguientes:
Aplicación de distintas técnicas de valoración según el diseño del parseador (e.g.
títulos, comentarios, etc.) de los parámetros del algoritmo de audio.
Conciliación entre las valoraciones de texto, audio, video e imágenes.
Priorización de términos y otros elementos de mayor importancia.
3.3 CASOS DE USO DE LA CAPA DE VISUALIZACIÓN E INTERACCIÓN
Esta capa es la encargada de visualizar los resultados obtenidos en el análisis e interactuar con
el usuario final. Los casos de uso asociados a esta capa son los siguientes.
3.3.1 CS-VI-01: Consulta de sentimiento sobre marca o producto
El usuario final podrá realizar una petición de consulta bajo demanda sobre los dominios
examinados, nombre de la marca o producto y tipo de funcionalidad. En este caso, la
funcionalidad asociada es la de la búsqueda de sentimiento sobre una marca o producto
determinado. Cabe resaltar que este mismo caso de uso puede incluir también otras
funcionalidades como la búsqueda de menciones de la marca o producto durante un periodo
de tiempo determinado. Estos otros casos de uso no están especificados en este documento
pero su diagrama será similar al mostrado en la Figura 3.9.
E1.1 Casos de uso y requerimientos del sistema 12
Usuario_Final
Petición de
consutla tendencia
«uses»
Valoración
Sentimiento
«uses»
Análisis Texto
Calibrado Imagen
«uses»
«uses»
Parseador Texto
Analizador de
lingüístico
«uses»
«uses»
Calibrado Imagen
AlgoritmoExtracción
«uses»
«uses»
Representación
Visual
«uses»
Interacción H-M«uses»
PETICIÓN Y VISUALIZACIÓN DE CONSULTA
EVOLUCIÓN SENTIMIENTO
Obtener DatosTexto(Concepto)
Obtener Datos de
Imagen(Concepto)
«uses»
«uses»
Figura 3.9 Caso de uso de consulta de sentimiento.
Este caso de uso y su funcionalidad asociada podrá ejecutarse por el usuario final y el
administrador de la empresa. Las funcionalidades asociadas a este caso de uso son:
Consulta de sentimiento asociada a un perfil en el sistema ePOCA.
Consulta de histórico de sentimientos.
Consulta de opinión sobre marca o producto.
Consulta de tendencias sobre marca o producto.
Consulta de variaciones de tendencia, etc.
3.3.2 CS-VI-02: Interacción con la interfaz y petición de nueva consulta
Este caso de uso muestra esta interacción donde el usuario final solicita una nueva
visualización en base a los resultados mostrados. La interacción persona-dispositivo en la
plataforma ePOCA va a permitir la interacción constante con los resultados, de modo que se
garantice una retroalimentación continua que ayude a un proceso de razonamiento lógico
guiado para mejorar el conocimiento sobre el contexto de la consulta realizada.
E1.1 Casos de uso y requerimientos del sistema 13
Usuario_Final Interfaz H/M Valoración_Sentimiento
Petición_Consulta(1)
Petición_Valoración(1)
Resultados_Valoración(1)
Visualización _Resultados(1)
Petición_Consulta(2)
Petición_Valoración(2)
Retroalimentación
Resultados_Valoración(2)
Visualización _Resultados(2)
Figura 3.10 Diagrama de secuencias del caso de usoCS-VI-02.
Este caso de uso podrá ser ejecutado por el usuario final y el administrador de la empresa.
3.3.3 CS-VI-03: Incorporación de resultados de otro producto
El proceso de visualización permitirá no sólo la realización de consultas, sino también el
tratamiento “inteligente” de las mismas. Este caso de uso muestra la forma de complementar
una consulta con otra consulta similar de otros productos o marcas para fines comparativos en
términos de estudio de la competencia y en el establecimiento de “rankings” de valoración. La
Figura 3.11 muestra el diagrama de secuencias de este caso de uso, incluyendo las consultas
sobre diferentes tipos de producto/marca con el índice A o B.
E1.1 Casos de uso y requerimientos del sistema 14
Usuario_Final Inter faz H/M Valoración_Sentimiento
Petición_Consulta_A
Petición_Valoración_A
Resultados_Valor ación_A
Visualización _Resultados _A
Petición_Consulta_B
Petición_Valoración_B
Retroalimentación
Resultados_Valoración_B
Visualización _Resultados _B
Figura 3.11 Diagrama de secuencias asociado al caso de uso CS-VI-03.
Este caso de uso y su funcionalidad asociada podrá ser ejecutado por el usuario final y el
administrador de la empresa.
3.3.4 CS-VI-04: Obtención de indicadores para ayuda a la toma de decisiones
Este caso de uso permitirá que el usuario final obtenga indicadores básicos que presenten un
resumen de los resultados de la consulta para la toma de decisiones.
Valoración_Sentimie
nto
Conocimiento_Expert
o
«uses»
«uses»
«uses»
Análisis_Texto_Imag
en_Video
«uses»
Gestión_BBDD_Conoci
miento
Modelado_Decision
«uses»
Top Package::Usuario_Final
Figura 3.12 Diagrama de caso de uso CS-VI-04.
Este caso de uso estará ejecutado por el usuario final y el administrador de la empresa.
3.3.5 CS-VI-05: Creación de un nuevo tipo de perfil de consulta
Cada consulta realizada por un usuario final está asociada a un perfil determinado. Estos
perfiles pueden modificarse para establecer nuevas configuraciones en la consulta y por tanto
E1.1 Casos de uso y requerimientos del sistema 15
obtener nuevos resultados (p.e. modificar las URLs monitorizadas). Este caso de uso permitirá
la modificación de perfiles para obtener nuevos resultados.
Top Package::Usuario_Final
Modificar_Perfil
«uses» Gestión_Sistema«uses»
Gestión_BBDD
«uses»
Crear_Consulta
«uses»
Gestion_Adquisición
«uses»
Figura 3.13 Diagrama de caso de uso CS-VI-05.
Este caso de uso y su funcionalidad asociada puede ser ejecutado por el administrador de la
empresa.
E1.1 Casos de uso y requerimientos del sistema 16
4 Catálogo de requisitos del sistema
Esta sección describe los diferentes requisitos de usuario asociados a los casos de uso. Estos
requisitos se presentan en formato tabla indicando su identificador, una breve descripción, su
prioridad alta/media/baja, y la relación con otros requisitos. Los requisitos se agrupan en tres
categorías:
Requisitos funcionales (RF) que representan la funcionalidad deseada por parte de la
plataforma.
Requisitos no funcionales (RNF) los cuales representan requisitos deseables de la
plataforma, pero que no se corresponden con ninguna funcionalidad específica sino
con el comportamiento general (p.e. escalabilidad del sistema).
Requisitos restrictivos (RRE), que describen restricciones generales que debe cumplir la
plataforma.
4.1 REQUISITOS FUNCIONALES (RF) Y NO FUNCIONALES (RNF)
ID RF-01
Descripción El administrador global podrá modificar las reglas de acceso a las
diferentes páginas web que se están monitorizando.
Prioridad Alta
Relación con otros
requisitos
ID RF-02
Descripción El administrador global podrá modificar las preferencias de gestión del
cluster.
Prioridad Media
Relación con otros
requisitos
ID RF-03
Descripción El administrador global podrá gestionar el almacenamiento de datos.
Prioridad Alta
Relación con otros
requisitos
ID RF-04
Descripción El sistema permitirá la gestión de diferentes roles para realizar
monitorizaciones personalizadas.
Prioridad Media
E1.1 Casos de uso y requerimientos del sistema 17
Relación con otros
requisitos
ID RF-05
Descripción La plataforma permitirá la creación y gestión de los usuarios.
Prioridad Alta
Relación con otros
requisitos
RF-04
ID RF-06
Descripción El administrador global podrá gestionar los parámetros del módulo de
análisis de texto.
Prioridad Media
Relación con otros
requisitos
ID RF-07
Descripción El administrador global podrá gestionar los parámetros del módulo de
análisis de imagen.
Prioridad Media
Relación con otros
requisitos
ID RF-08
Descripción El administrador global podrá gestionar los parámetros de análisis del
módulo de vídeo.
Prioridad Media
Relación con otros
requisitos
ID RF-09
Descripción El administrador global podrá gestionar los parámetros de análisis del
módulo de audio.
Prioridad Media
Relación con otros
requisitos
E1.1 Casos de uso y requerimientos del sistema 18
ID RF-10
Descripción El administrador global podrá realizar modificaciones sobre los criterios
de valoración.
Prioridad Media
Relación con otros
requisitos
ID RF-11
Descripción El usuario final y/o el administrador del sistema puede visualizar el
resultado de sentimiento sobre la marca o producto
Prioridad Alta
Relación con otros
requisitos
RF-06, RF-07, RF-08 y RF-09
ID RF-12
Descripción El usuario final y el administrador de la empresa pueden realizar
consultas para visualizar el resultado.
Prioridad Alta
Relación con otros
requisitos
RF-11
ID RF-13
Descripción El usuario final y el administrador de la empresa pueden incorporar
resultados de otro producto a la consulta que está visualizando.
Prioridad Media
Relación con otros
requisitos
RF gestión de productos o marcas
ID RF-14
Descripción El usuario final y el administrador de la empresa pueden obtener una
serie de indicadores en base a los datos recogidos.
Prioridad Media
Relación con otros
requisitos
RF-12
E1.1 Casos de uso y requerimientos del sistema 19
ID RF-15
Descripción El administrador de la empresa puede crear un nuevo tipo de consulta.
Prioridad Media
Relación con otros
requisitos
ID RNF-06
Descripción Sólo el administrador de la empresa podrá crear nuevas consultas.
Prioridad Media
Relación con otros
requisitos
ID RF-16
Descripción El administrador de la empresa puede gestionar diferentes productos o
marcas para realizar comparaciones.
Prioridad Media
Relación con otros
requisitos
ID RF-17
Descripción El administrador global podrá configurar el cluster de ordenadores
modificando sus parámetros de configuración.
Prioridad Media
Relación con otros
requisitos
ID RNF-01
Descripción La plataforma deberá ser escalable en cuanto a sus capacidades
hardware.
Prioridad Media
Relación con otros
requisitos
ID RRE-01
Descripción Sólo el administrador global podrá cambiar los parámetros referentes a
la configuración interna de la plataforma ePOCA.
E1.1 Casos de uso y requerimientos del sistema 20
Prioridad Alta
Relación con otros
requisitos
RF-01.
ID RNF-02
Descripción La plataforma se implementará utilizando estándares de Open Source
siempre que sea posible.
Prioridad Media
Relación con otros
requisitos
ID RNF-03
Descripción La plataforma se implementará siguiendo un paradigma de
programación orientada a objetos incluyendo documentación de las
clases.
Prioridad Media
Relación con otros
requisitos
ID RNF-04
Descripción La plataforma se limitará a realizar búsquedas de textos en 4 idiomas:
castellano, euskara, inglés y francés.
Prioridad Media
Relación con otros
requisitos
ID RNF-05
Descripción La plataforma debe ser compatible con diferentes bases de datos
usando estándares de acceso y consulta.
Prioridad Media
Relación con otros
requisitos
RF-03
4.2 REQUISITOS FUNCIONALES ESPECÍFICOS
Esta sección describe las distintas funcionalidades y características técnicas que se deben
implementar a alto nivel para alcanzar los objetivos tecnológicos del proyecto. Los requisitos
están ordenados sobre la base del área tecnológica al que pertenecen.
E1.1 Casos de uso y requerimientos del sistema 21
4.2.1 Adquisición de contenido
Titulo Componente de búsqueda en Web
ID AC-01
Descripción Implementación de un motor de búsqueda Web Open Source, que
manejará la búsqueda, rastreo y parseo de formatos comunes.
Prioridad Alta
Relación con otros
requisitos
Titulo Interfaces a Web API
ID AC-02
Descripción Componente extensible que proporcione acceso a portales Web 2.0
mediante Web APIs públicas.
Prioridad Media
Relación con otros
requisitos
Titulo Parseador de Twitter
ID AC-03
Descripción Agregador y parseador de Twitter capaz de captar mensajes con
HashTags específicos.
Prioridad Alta
Relación con otros
requisitos
Titulo Parseador de Microformatos
ID AC-04
Descripción Parseo de contenido albergado en Micro Formatos disponibles on-line
dentro de las páginas Web.
Prioridad Baja
Relación con otros
requisitos
Titulo Parseador de RSS/Atom
ID AC-05
Descripción Parseo y rastreo de contenido sindicado por RSS y Atom. Componente
E1.1 Casos de uso y requerimientos del sistema 22
integrado en el módulo de adquisición de contenido general.
Prioridad Media
Relación con otros
requisitos
Titulo Herramienta de generación de parseadores específicos
ID AC-06
Descripción Componente integrable en el navegador Web para el diseño
interactivo de parseadores de páginas Web y su asociación con reglas
de análisis y valoración de contenido.
Prioridad Alta
Relación con otros
requisitos
Titulo Parseador de Web genérico
ID AC-07
Descripción Parseador genérico capaz de realizar MIME Marshalling y la separación
de imágenes y textos de cualquier página Web.
Prioridad Alta
Relación con otros
requisitos
Titulo Control de política de rastreo y revisita
ID AC-08
Descripción Control de las políticas de revisita, latencia, profundidad de parseo, etc,
configurable mediante la plataforma general. Incluye la lista maestra
de fuentes a monitorizar
Prioridad Alta
Relación con otros
requisitos
Titulo Conjunto de interfaces basadas en Servicios Web
ID AC-08
Descripción Interfaces del módulos accesible mediante Servicios Web tipo WI-SOAP
para su integración en la plataforma general.
Prioridad Alta
Relación con otros
E1.1 Casos de uso y requerimientos del sistema 23
requisitos
Titulo Definición y control de consultas
ID AC-09
Descripción Componente de control de las consultas a realizar y fuentes a
monitorizar
Prioridad Alta
Relación con otros
requisitos
Titulo Base de Datos de control de configuración
ID AC-10
Descripción Base de datos donde se almacenan los datos de configuración y de las
monitorizaciones definidas por los usuarios que desempeñen un rol en
el que se establezcan parámetros de funcionamiento de la plataforma.
Prioridad Alta
Relación con otros
requisitos
Titulo Componente de conversión de caracteres y patrones sensible a
configuración específica de idioma, dialecto y región.
ID AC-11
Descripción Media
Prioridad Componente de detección de codificación de caracteres y su conversión
a Unicode para un tratamiento específico dentro de la plataforma.
También se deben tratar patrones de datos sensibles a locales.
Relación con otros
requisitos
4.2.2 Análisis lingüístico
Titulo Base de datos léxica multilingüe
ID LN-01
Descripción Base de datos léxica multilingüe (EN, FR, ES, EU) con anotaciones
léxicas. Recursos léxicos con un mínimo de 15.000 entradas para cada
idioma, de un dominio lingüístico general capaz de reflejar los
conceptos de los escenarios de aplicación del proyecto ePOCA.
Prioridad Alta
Relación con otros
E1.1 Casos de uso y requerimientos del sistema 24
requisitos
Titulo Lematizador
ID LN-02
Descripción Implementación de un lematizador de palabras para EU, ES, FR y EN.
Prioridad Alta
Relación con otros
requisitos
Titulo Asignación de categoría gramatical
ID LN-03
Descripción Implementación de un POS Tagger basado en métodos estadísticos
entrenados mediante corpus anotados en EN, FR, EU y ES.
Prioridad Alta
Relación con otros
requisitos
Titulo Procesamiento morfológico
ID LN-04
Descripción Reglas para el procesamiento de morfología, nominal y verbal, de
textos en EN, FR, ES y EU.
Prioridad Alta
Relación con otros
requisitos
Titulo Reconocimiento de sintagmas
ID LN-05
Descripción Chunking de texto y reconocimiento de sintagmas nominales y
verbales.
Prioridad Media
Relación con otros
requisitos
Titulo Relaciones semánticas
ID LN-06
Descripción Implementación de rasgos semánticos para vincular conceptos dentro
E1.1 Casos de uso y requerimientos del sistema 25
del léxico mediante sinonimia e hiperonimia.
Prioridad Media
Relación con otros
requisitos
Titulo Interfaces basadas en Servicios Web
ID LN-07
Descripción Conjunto de interfaces basadas en Servicios Web.
Prioridad Alta
Relación con otros
requisitos
Interfaces de los módulos accesibles mediante Servicios Web tipo WI-
SOAP para su integración en la plataforma general.
4.2.3 Análisis de imágenes
Titulo Pre-filtro y conversión
ID IM-01
Descripción Técnicas de filtrado y conversión a formato normalizado de las
imágenes adquiridas.
Prioridad Media
Relación con otros
requisitos
Titulo Base de datos de descriptores
ID IM-02
Descripción Base de datos que guarda los descriptores de las imágenes de
referencia subidas a la plataforma para su posterior comparación con
las imágenes adquiridas. Se debe incluir la asociación de palabras claves
(Visual Words) con las imágenes.
Prioridad Alta
Relación con otros
requisitos
Titulo Normalización de imágenes
ID IM-03
Descripción Reducción de ruido, escalado etc. de las imágenes antes de procesarlas
para asegurar que son del formato y calidad necesarios para efectuar
un análisis fiable.
Prioridad Media
E1.1 Casos de uso y requerimientos del sistema 26
Relación con otros
requisitos
Titulo Cálculo de descriptores
ID IM-04
Descripción Implantación del algoritmo SURF, acelerado por GPGPU y el algoritmo
de Fast Nearest Neighbor para detección de regiones de interés.
Prioridad Alta
Relación con otros
requisitos
Titulo Clusterización y matching
ID IM-05
Descripción Implementación de los algoritmos de comparación de características
entre imágenes mediante análisis de imágenes de referencia.
Prioridad Media
Relación con otros
requisitos
4.2.4 Análisis de video
Titulo Interfaces basadas en Servicios Web
ID VI-01
Descripción Conjunto de interfaces basadas en Servicios Web
Prioridad Alta
Relación con otros
requisitos
Interfaces de los módulos accesibles mediante Servicios Web tipo WI-
SOAP para su integración en la plataforma general.
Titulo Normalización de video
ID VI-02
Descripción Antes del análisis de video, será necesario tratar el contenido para
normalizarlo efectuando una reducción de ruido y estabilización de los
planos de color.
Prioridad Media
Relación con otros
requisitos
Titulo Detección de formatos, conversión y extracción de contenido
E1.1 Casos de uso y requerimientos del sistema 27
ID VI-03
Descripción Antes de procesar los videos, se convertirán de un formato original a un
formato único específico para su posterior tratamiento por parte del
sistema. Se aplicarán FFMpeg y MediInfo para tal fin.
Prioridad Alta
Relación con otros
requisitos
Titulo Detección de bordes de escenas
ID VI-04
Descripción Implementación de algoritmos de detección de cortes y transiciones
entre escenas para su marcado como segmentos lógicos de un video.
Prioridad Media
Relación con otros
requisitos
Titulo Detección del frame más representativo
ID VI-05
Descripción Algoritmo y técnicas de extracción de los frames de una escena de
video que sea contemplada como lo más representativa. Dichos frames
se procesarán posteriormente como imágenes.
Prioridad Media
Relación con otros
requisitos
4.2.5 Análisis de audio
Titulo Motor comercial de reconocimiento de Voz (ASR)
ID AU-01
Descripción Implementación de una interfaz para un motor comercial de
reconocimiento de voz, en este caso, Microsoft Speech Recognizer 8.1.
Prioridad Alta
Relación con otros
requisitos
Titulo Diarización de locutor
ID AU-02
Descripción Detección de prosodia y pausa en pista de voz que se puede interpretar
E1.1 Casos de uso y requerimientos del sistema 28
como puntación para la transcripción a texto (Pseudo puntuación).
Implementación de los modelos acústicos apropiados.
Prioridad Media
Relación con otros
requisitos
Titulo Seguimiento del locutor
ID AU-03
Descripción Detección de locutores y su seguimiento para distinguir entre los
distintos participantes de la conversación.
Prioridad Media
Relación con otros
requisitos
Titulo Transcripción y formateo de salida
ID AU-03
Descripción Componente de transcripción a texto de los elementos de audio
previamente analizados. Técnicas flexibles de formato y presentación
de los textos transcritos para su integración sencilla en la plataforma.
Prioridad Alta
Relación con otros
requisitos
Titulo Interfaces basadas en Servicios Web
ID AU-04
Descripción Conjunto de interfaces basadas en Servicios Web.
Prioridad Alta
Relación con otros
requisitos
Interfaces de los módulos accesibles mediante Servicios Web tipo WI-
SOAP para su integración en la plataforma general.
4.2.6 Visualización analítica
Titulo Homogenización de datos
ID VA-01
Descripción Es necesario implementar técnicas para poder homogenizar los
distintos tipos de datos analizados y evaluados por la plataforma para
crear conjuntos de datos adecuados para su posterior visualización.
Prioridad Alta
E1.1 Casos de uso y requerimientos del sistema 29
Relación con otros
requisitos
Titulo Inferencia de datos ausentes
ID VA-02
Descripción En el caso que un conjunto carezca de suficientes datos como para
permitir una correcta visualización o tratamiento de los datos, será
necesaria la inferencia de los datos que falten.
Prioridad Media
Relación con otros
requisitos
Titulo Implementación de modelos de visualización
ID VA-03
Descripción Diseñar e implementar modelos de visualización de datos pertinentes
para el dominio de aplicación de ePOCA.
Prioridad Alta
Relación con otros
requisitos
Titulo Integración de funcionalidad interactiva
ID VA-04
Descripción Integración de un modelo de interfaz que permita la interacción y el
análisis de los datos visualizados con la plataforma global.
Prioridad Media
Relación con otros
requisitos
Titulo Interfaces basadas en Servicios Web
ID VA-05
Descripción Conjunto de interfaces basadas en Servicios Web.
Prioridad Alta
Relación con otros
requisitos
Interfaces de los módulos accesibles mediante Servicios Web tipo WI-
SOAP para su integración en la plataforma general.