análisis multidimensional de datos
DESCRIPTION
Cubos OLAP Bodegas de DatosTRANSCRIPT
TEMA CINCO
ABRIL
ANALISIS MULTIDIMENSIONAL
En muchas ocasiones interesa
estudiar el comportamiento de más
de una característica (2 o más) en
una población. Pero puede resultar
necesario analizar, también el
comportamiento conjunto de 2 o más
de las características observadas,
con el fin de dilucidar la influencia de
una en otra u otras, determinar las
relaciones existentes entre ellas, etc.
Una base de datos multidimensional, es aquella
que almacena sus datos con varias dimensiones,
es decir que en vez de un valor, encontramos
varios dependiendo de los "ejes" definidos. En
una base de datos multidimensional, la
información se representa como matrices
multidimensionales, cuadros de múltiples
entradas o funciones de varias variables sobre
conjuntos finitos. Cada una de estas matrices se
denomina cubo.
CUBOS
N INE NALYTICAL ROCESSING
OLAP es el acrónimo en inglés de
procesamiento analítico en línea (On-Line
Analytical Processing). Es una solución
utilizada en el campo de la Inteligencia de
Negocios, la cual consiste en consultas a
estructuras multidimensionales (cubos OLAP).
Se conforma realizando una disposición de los datos en vectores para permitir un
análisis rápido. Estos vectores son llamados cubos. Disponer los datos en cubos
evita una limitación de las bases de datos relacionales, que no son muy
adecuadas para el análisis instantáneo de grandes cantidades de datos.
Un cubo OLAP es una base de datos multidimensional, en la cual el
almacenamiento físico de los datos se realiza en un vector multidimensional. Los
cubos OLAP se pueden considerar como una ampliación de las dos dimensiones
de una hoja de cálculo.
CUBOS
CUBOS CARACTERISTICAS
PRINCIPALES
Estos se implementan en informes de negocios de ventas, marketing, informes de
dirección, minería de datos y áreas similares; porque las respuestas a consultas
complejas se obtienen muy rápidamente y además porque puede obtener los datos
tanto de una fuente externa como de una base interna.
Organizan la información según los parámetros que se consulten, de manera tal que a
partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas
Transaccionales, conocidos como OLTP (Online Transactional Processing) o de
grandes bases, se obtendrá la información requerida.
En un sistema OLAP puede haber más de tres dimensiones, por lo que a los cubos OLAP
también reciben el nombre de hipercubos. La estructura básica de un hipercubo está
compuesta por dos elementos: un conjunto de dimensiones y una función que mapea
coordenadas formadas por valores de cada una de las dimensiones en tuplas o
booleanos.
Facilidad de uso. Una vez
construido el cubo, el usuario de
negocio puede consultarlo con
facilidad, incluso si se trata de un
usuario con escasos o nulos
conocimientos técnicos. La
estructura jerárquica es
sumamente fácil de comprender.
Rapidez de respuesta.
Habitualmente, el cubo tiene pre-
calculados las distintas
agregaciones, por lo que los
tiempos de respuesta son muy
cortos.
El cubo es estructura adicional de datos
que mantener y actualizar, eso supone un
gasto extra de recursos.
Una vez poblada la base de datos ésta no
puede recibir cambios en su estructura.
Para ello sería necesario rediseñar el cubo.
El modelo de negocio no siempre se
adapta bien en un modelo jerárquico. Por
poner algunos ejemplos típicos: Una
semana no pertenece a un único mes, o las
zonas de venta corporativas no tienen
porqué coincidir con la estructura
provincial de cada país…Todos estos
casos dificultan enormemente la
construcción y uso de los cubos OLAP.
SOFTWARE PARA EL DESARROLLO
La alternativa a los cubos son las habituales bases de datos relacionales. En estos
casos, se suele hablar de cubos o herramientas ROLAP, donde el usuario tiene la
sensación de estar trabajando con un cubo, aunque internamente existe una base
de datos normal y corriente. Existen distintos softwares especializados para crear
Cubos OLAP como:
EJEMPLOS APLICACION
1. Ejemplo sencillo: Esta señora
selecciona su pizza filtrando todas las
pizzas posibles a través de sus
características relevantes. (ANEXO
VIDEO).
2. una empresa podría analizar algunos datos financieros por producto, por
período, por ciudad, por tipo de ingresos y de gastos, y mediante la
comparación de los datos reales con un presupuesto. Para acceder a los
datos sólo es necesario indexarlos a partir de los valores de las dimensiones o
ejes.
EJEMPLOS APLICACION
3. Un analista financiero podría querer ver los datos de diversas formas, por ejemplo,
visualizándolos en función de todas las ciudades (que podrían figurar en el eje de
abscisas) y todos los productos (en el eje de ordenadas), y esto podría ser para un
período determinado, para la versión y el tipo de gastos.
Después de haber visto los datos de esta forma particular el analista podría
entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata.
El cubo podría adoptar una nueva orientación para que los datos aparezcan
ahora en función de los períodos y el tipo de coste.
Debido a que esta reorientación implica resumir una cantidad muy grande de
datos, esta nueva vista de los datos se debe generar de manera eficiente para no
malgastar el tiempo del analista, es decir, en cuestión de segundos, en lugar de las
horas que serían necesarias en una base de datos relacional convencional.
Rápidamente surgió la necesidad de contar con un sistema de administración para controlar tanto los datos como los usuarios. La administración de bases de datos se realiza con un sistema llamado DBMS (Database management system [Sistema de administración de bases de datos]). El DBMS es un conjunto de servicios (aplicaciones de software) para administrar bases de datos, que permite: Un fácil acceso a los datos El acceso a la información por parte
de múltiples usuarios La manipulación de los datos
encontrados en la base de datos (insertar, eliminar, editar)
El DBMS puede dividirse en tres subsistemas:
El sistema de administración de archivos: para almacenar información en un medio físico
El DBMS interno: para ubicar la información en orden
El DBMS externo: representa la interfaz del usuario
Los principales sistemas de administración
de bases de datos son: Borland Paradox,
Filemaker, IBM DB2, Ingres, Interbas,
Sybase, MySQL , PostgreSQL ,mSQL, SQL
Server 11, Microsoft SQL server, Microsoft
Access, Microsoft FoxPro, Oracle.
,
EJEMPLOS
BODEGA
Un sistema típico OLTP se caracteriza por grandes números de usuarios simultáneos
que adicionan y modifican datos. La base de datos representa el estado de un
negocio determinado en un momento dado.
Un sistema OLTP típico tiene muchos usuarios que
aumentan los datos de la base de datos, mientras
que un número menor de usuarios genera los informes
a partir de la misma base de datos. A medida que el
volumen de datos aumenta, se requiere más tiempo
para generar los informes.
Una bodega de datos es una herramienta
empresarial utilizada por los negocios que
consolida los datos de fuentes internas y externas
de una entidad, institución o negocio, en un solo
sitio, con el objetivo de facilitar las tareas de
consulta y análisis de la información.
Cuando una bodega de datos contiene datos específicos de una dependencia
(dirección, coordinación o grupo) es llamada también data mart; si la bodega
de datos integra datos de varias dependencias es llamada también data
warehouse.
Su objetivo es soportar la toma de decisiones en un negocio (no las operaciones
del negocio) y centralizar una gran variedad de datos e información, interpretar
dicha información y darle un valor agregado para beneficio del negocio todo
ello por supuesto, con un fácil acceso y visualización por parte de los usuarios.
Las bodegas de datos Le permite a los usuarios ascender a esa información
importante de los clientes, para buscar relaciones y efectuar consultas.
Para establecer una bodega de datos siempre se debe tener presente:
El DISEÑO: este debe basarse en un estudio profundo tanto de la empresa
como de las personas o áreas que van a utilizar la bodega, todo con el fin
de que adecuar la información dependiendo sus necesidades.
El MANTENIMIENTO: este debe elaborarse periódicamente. Significa hacer
una actualización constante de la información para estar al tanto de todos
los sucesos y aprovechar las oportunidades.
El USO de la bodega de datos: para sacar un completo provecho de las
bodegas de datos es necesario establecer que personas las van a utilizar y a
estas mismas darle las instrucciones más adecuadas para agilizar los procesos
de búsqueda en las bodegas ya que el éxito no depende solo de la bodega
y de su información sino también del correcto manejo de las personas que
estén a su cargo.
PARA TENER
GRACIAS
POR SU
FIN