análisis multidimensional de datos

13
TEMA CINCO ABRIL

Upload: guillermo-rodriguez

Post on 15-Mar-2016

228 views

Category:

Documents


1 download

DESCRIPTION

Cubos OLAP Bodegas de Datos

TRANSCRIPT

Page 1: Análisis Multidimensional de Datos

TEMA CINCO

ABRIL

Page 2: Análisis Multidimensional de Datos

ANALISIS MULTIDIMENSIONAL

En muchas ocasiones interesa

estudiar el comportamiento de más

de una característica (2 o más) en

una población. Pero puede resultar

necesario analizar, también el

comportamiento conjunto de 2 o más

de las características observadas,

con el fin de dilucidar la influencia de

una en otra u otras, determinar las

relaciones existentes entre ellas, etc.

Una base de datos multidimensional, es aquella

que almacena sus datos con varias dimensiones,

es decir que en vez de un valor, encontramos

varios dependiendo de los "ejes" definidos. En

una base de datos multidimensional, la

información se representa como matrices

multidimensionales, cuadros de múltiples

entradas o funciones de varias variables sobre

conjuntos finitos. Cada una de estas matrices se

denomina cubo.

CUBOS

N INE NALYTICAL ROCESSING

Page 3: Análisis Multidimensional de Datos

OLAP es el acrónimo en inglés de

procesamiento analítico en línea (On-Line

Analytical Processing). Es una solución

utilizada en el campo de la Inteligencia de

Negocios, la cual consiste en consultas a

estructuras multidimensionales (cubos OLAP).

Se conforma realizando una disposición de los datos en vectores para permitir un

análisis rápido. Estos vectores son llamados cubos. Disponer los datos en cubos

evita una limitación de las bases de datos relacionales, que no son muy

adecuadas para el análisis instantáneo de grandes cantidades de datos.

Un cubo OLAP es una base de datos multidimensional, en la cual el

almacenamiento físico de los datos se realiza en un vector multidimensional. Los

cubos OLAP se pueden considerar como una ampliación de las dos dimensiones

de una hoja de cálculo.

CUBOS

Page 4: Análisis Multidimensional de Datos

CUBOS CARACTERISTICAS

PRINCIPALES

Estos se implementan en informes de negocios de ventas, marketing, informes de

dirección, minería de datos y áreas similares; porque las respuestas a consultas

complejas se obtienen muy rápidamente y además porque puede obtener los datos

tanto de una fuente externa como de una base interna.

Organizan la información según los parámetros que se consulten, de manera tal que a

partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas

Transaccionales, conocidos como OLTP (Online Transactional Processing) o de

grandes bases, se obtendrá la información requerida.

En un sistema OLAP puede haber más de tres dimensiones, por lo que a los cubos OLAP

también reciben el nombre de hipercubos. La estructura básica de un hipercubo está

compuesta por dos elementos: un conjunto de dimensiones y una función que mapea

coordenadas formadas por valores de cada una de las dimensiones en tuplas o

booleanos.

Page 5: Análisis Multidimensional de Datos

Facilidad de uso. Una vez

construido el cubo, el usuario de

negocio puede consultarlo con

facilidad, incluso si se trata de un

usuario con escasos o nulos

conocimientos técnicos. La

estructura jerárquica es

sumamente fácil de comprender.

Rapidez de respuesta.

Habitualmente, el cubo tiene pre-

calculados las distintas

agregaciones, por lo que los

tiempos de respuesta son muy

cortos.

El cubo es estructura adicional de datos

que mantener y actualizar, eso supone un

gasto extra de recursos.

Una vez poblada la base de datos ésta no

puede recibir cambios en su estructura.

Para ello sería necesario rediseñar el cubo.

El modelo de negocio no siempre se

adapta bien en un modelo jerárquico. Por

poner algunos ejemplos típicos: Una

semana no pertenece a un único mes, o las

zonas de venta corporativas no tienen

porqué coincidir con la estructura

provincial de cada país…Todos estos

casos dificultan enormemente la

construcción y uso de los cubos OLAP.

Page 6: Análisis Multidimensional de Datos

SOFTWARE PARA EL DESARROLLO

La alternativa a los cubos son las habituales bases de datos relacionales. En estos

casos, se suele hablar de cubos o herramientas ROLAP, donde el usuario tiene la

sensación de estar trabajando con un cubo, aunque internamente existe una base

de datos normal y corriente. Existen distintos softwares especializados para crear

Cubos OLAP como:

Page 7: Análisis Multidimensional de Datos

EJEMPLOS APLICACION

1. Ejemplo sencillo: Esta señora

selecciona su pizza filtrando todas las

pizzas posibles a través de sus

características relevantes. (ANEXO

VIDEO).

2. una empresa podría analizar algunos datos financieros por producto, por

período, por ciudad, por tipo de ingresos y de gastos, y mediante la

comparación de los datos reales con un presupuesto. Para acceder a los

datos sólo es necesario indexarlos a partir de los valores de las dimensiones o

ejes.

Page 8: Análisis Multidimensional de Datos

EJEMPLOS APLICACION

3. Un analista financiero podría querer ver los datos de diversas formas, por ejemplo,

visualizándolos en función de todas las ciudades (que podrían figurar en el eje de

abscisas) y todos los productos (en el eje de ordenadas), y esto podría ser para un

período determinado, para la versión y el tipo de gastos.

Después de haber visto los datos de esta forma particular el analista podría

entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata.

El cubo podría adoptar una nueva orientación para que los datos aparezcan

ahora en función de los períodos y el tipo de coste.

Debido a que esta reorientación implica resumir una cantidad muy grande de

datos, esta nueva vista de los datos se debe generar de manera eficiente para no

malgastar el tiempo del analista, es decir, en cuestión de segundos, en lugar de las

horas que serían necesarias en una base de datos relacional convencional.

Page 9: Análisis Multidimensional de Datos

Rápidamente surgió la necesidad de contar con un sistema de administración para controlar tanto los datos como los usuarios. La administración de bases de datos se realiza con un sistema llamado DBMS (Database management system [Sistema de administración de bases de datos]). El DBMS es un conjunto de servicios (aplicaciones de software) para administrar bases de datos, que permite: Un fácil acceso a los datos El acceso a la información por parte

de múltiples usuarios La manipulación de los datos

encontrados en la base de datos (insertar, eliminar, editar)

El DBMS puede dividirse en tres subsistemas:

El sistema de administración de archivos: para almacenar información en un medio físico

El DBMS interno: para ubicar la información en orden

El DBMS externo: representa la interfaz del usuario

Los principales sistemas de administración

de bases de datos son: Borland Paradox,

Filemaker, IBM DB2, Ingres, Interbas,

Sybase, MySQL , PostgreSQL ,mSQL, SQL

Server 11, Microsoft SQL server, Microsoft

Access, Microsoft FoxPro, Oracle.

,

EJEMPLOS

Page 10: Análisis Multidimensional de Datos

BODEGA

Un sistema típico OLTP se caracteriza por grandes números de usuarios simultáneos

que adicionan y modifican datos. La base de datos representa el estado de un

negocio determinado en un momento dado.

Un sistema OLTP típico tiene muchos usuarios que

aumentan los datos de la base de datos, mientras

que un número menor de usuarios genera los informes

a partir de la misma base de datos. A medida que el

volumen de datos aumenta, se requiere más tiempo

para generar los informes.

Una bodega de datos es una herramienta

empresarial utilizada por los negocios que

consolida los datos de fuentes internas y externas

de una entidad, institución o negocio, en un solo

sitio, con el objetivo de facilitar las tareas de

consulta y análisis de la información.

Page 11: Análisis Multidimensional de Datos

Cuando una bodega de datos contiene datos específicos de una dependencia

(dirección, coordinación o grupo) es llamada también data mart; si la bodega

de datos integra datos de varias dependencias es llamada también data

warehouse.

Su objetivo es soportar la toma de decisiones en un negocio (no las operaciones

del negocio) y centralizar una gran variedad de datos e información, interpretar

dicha información y darle un valor agregado para beneficio del negocio todo

ello por supuesto, con un fácil acceso y visualización por parte de los usuarios.

Las bodegas de datos Le permite a los usuarios ascender a esa información

importante de los clientes, para buscar relaciones y efectuar consultas.

Page 12: Análisis Multidimensional de Datos

Para establecer una bodega de datos siempre se debe tener presente:

El DISEÑO: este debe basarse en un estudio profundo tanto de la empresa

como de las personas o áreas que van a utilizar la bodega, todo con el fin

de que adecuar la información dependiendo sus necesidades.

El MANTENIMIENTO: este debe elaborarse periódicamente. Significa hacer

una actualización constante de la información para estar al tanto de todos

los sucesos y aprovechar las oportunidades.

El USO de la bodega de datos: para sacar un completo provecho de las

bodegas de datos es necesario establecer que personas las van a utilizar y a

estas mismas darle las instrucciones más adecuadas para agilizar los procesos

de búsqueda en las bodegas ya que el éxito no depende solo de la bodega

y de su información sino también del correcto manejo de las personas que

estén a su cargo.

PARA TENER

Page 13: Análisis Multidimensional de Datos

GRACIAS

POR SU

FIN