introducción a pentaho analysis lic. ana smail año 2010
TRANSCRIPT
![Page 1: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/1.jpg)
Introducción a Pentaho Introducción a Pentaho AnalysisAnalysis
Lic. Ana Smail
Año 2010
![Page 2: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/2.jpg)
“La comunidad de código abierto se nutre de la participación y la cooperación. Hay varios canales de comunicación disponibles donde las personas pueden ayudar, pero no están obligados a hacerlo. Usted es responsable de su propio éxito, lo que requerirá tiempo, esfuerzo y una pequeña cantidad de capacidad técnica.
Si prefiere tener una relación con un proveedor conocido que responderá a preguntas por teléfono, le ayudará durante su evaluación y lo apoyará en la producción, por favor visite www.pentaho.com.” (Pentaho Coporation)
Introducción a Pentaho Analysis
Año 2010
![Page 3: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/3.jpg)
HowTo Pentaho 3.5 & Cubo Mondrian en GNU/Linux – por Alvarez Sebastián Matias – 2009Pasos para crear Cubos con Mondrian Schema WorkBench – por Ing. Dennos Alba Infante para la comunidad Open Business IntelligenceMondrian 3.0.4 - Technical Guide - Developing OLAP solutions with Mondrian – 2009Mondrian Schema WorkbenchPentaho Solutions - Business Intelligence and Data -Warehousing with Pentaho and MySQL – de Roland Bouman Jos van Dongen
Introducción a Pentaho Analysis
Año 2010
BibliografíaBibliografía
![Page 4: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/4.jpg)
http://mondrian.pentaho.org/documentation/schema.php
http://assets.en.oreilly.com/1/event/2/Creating%20Interactive%20OLAP%20Applications%20with%20MySQL%20Enterprise%20and%20Mondrian%20Presentation.ppt#351,1,Diapositiva 1
http://programacionbizarra.blogspot.com/2009/04/olap.html - Herramientas Libres para OLAP: Mondrian y JPivot Java
Introducción a Pentaho Analysis
Año 2010
Bibliografía webBibliografía web
![Page 5: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/5.jpg)
Introducción a pentaho Analysis Mondrian WorkBench Jpivot – Análisis Ad-hoc
Desarrollo de un cubo OLAP
Introducción a Pentaho Analysis
Año 2010
Qué veremos en este módulo ?Qué veremos en este módulo ?
![Page 6: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/6.jpg)
Pentaho Analysis ServicePentaho Analysis Service
Año 2010
Introducción a Pentaho Analysis
PAS consiste de los siguientes 4 componentes:
JPIVOT analisys en el front end: interface de usuario basada en Java.
Mondrian ROLAP Engine: motor OLAP, recibe queries MDX desde una herramienta en el front-end como JPIVOT, y responde enviando un result-set multidimensional.
Shema Workbench: es una interface visual para diseñar y testear schemas de Mondrian. Mondrian usa Schemas para interpretar MDX y trasladar a queries SQL que pueda ser interpretado por un RDBMS.
Agregate Designer: una herramienta visual para analizar la performance y generar tablas agregadas.
![Page 7: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/7.jpg)
Componentes Componentes OLAP en PentahoOLAP en Pentaho
Año 2010
Introducción a Pentaho Analysis
(extraído de Pentaho Solutions - Business Intelligence and Data -Warehousing with Pentaho and MySQL)
![Page 8: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/8.jpg)
Qué es OLAP ?Qué es OLAP ?
Año 2010
Introducción a Pentaho Analysis
(extraído de HEFESTO del Ing. Bernabeu Ricardo Dario)
El procesamiento analítico en línea OLAP (On Line Analytic Processing), es la componente más poderosa del Data Warehousing, ya que es el motor de consultas especializado del depósito de datos. Permite recolectar y organizar la información analítica necesaria para los
usuarios y disponer de ella en diversos formatos, tales como tablas, gráficos, reportes, tableros de control, etc.
Soporta análisis complejos de grandes volúmenes de datos. Complementa las actividades de otras herramientas que requieran
procesamiento analítico en línea. Presenta al usuario una visión multidimensional de los datos (matricial) para
cada tema de interés del negocio. Es transparente al tipo de tecnología que soporta el DW, ya sea ROLAP,
MOLAP u HOLAP. No tiene limitaciones con respecto al número máximo de dimensiones
permitidas. Permite a los usuarios, analizar la información basándose en más criterios que
un análisis de forma tradicional. Al contar con muestras grandes, se pueden explorar mejor los datos en busca
de respuestas. Permiten realizar agregaciones y combinaciones de los datos de maneras
complejas y específicas, con el fin de realizar análisis más estratégicos.
![Page 9: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/9.jpg)
Qué es OLAP ?Qué es OLAP ?
Año 2010
Introducción a Pentaho Analysis
(extraído de HEFESTO del Ing. Bernabeu Ricardo Dario)
Reporte de análisis OLAP en JPIVOTReporte de análisis OLAP en JPIVOT
![Page 10: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/10.jpg)
Qué es OLAP ?Qué es OLAP ?
Año 2010
Introducción a Pentaho Analysis
(extraído de “Herramientas libres para OLAP” de Héctor Francisco Hernández)
Bases de Datos OLAPBases de Datos OLAP
Conceptualmente, una base de datos multidimensional utiliza la idea de "cubos". Un cubo posee N dimensiones y en él están registrados "hechos" de un determinado tipo. Los hechos podrían ser, por ejemplo, desde las ventas realizadas por una empresa (según estudios la utilización de OLAP para el análisis de ventas es la aplicación más popular) hasta los defectos que reportan los usuarios de un sistema informático, según cuál fuese la finalidad de la aplicación.Un ejemplo de consulta MDX es el siguiente:
SELECT { [Measures].[Importe] } ON COLUMNS, { [Tiempo].[2002], [Tiempo].[2003] } ON ROWSFROM VentasWHERE ( [Sucursal].[Zona Oeste].[Tablada] )
![Page 11: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/11.jpg)
MondrianMondrian
Año 2010
Introducción a Pentaho Analysis
(La última versión de Mondrian y su documentación se encuentra en http://mondrian.pentaho.org/)
Mondrian está compuesto por un conjunto de archivos "jar", que proveen una API inspirada en JDBC pero diseñada para trabajar con una base multidimensional. El sistema necesita que escribamos en un archivo "xml" cómo se corresponden los elementos de esta base con la base relacional.
Las estructuras comunmente usadas son tres:
Una única tabla para el cubo donde existe un registro por cada hecho (por ejemplo, un registro por cada venta). El registro tendrá un código único, un campo o más por cada dimensión y un campo por cada valor del hecho (un campo con el importe de la venta, otro con la cantidad de artículos vendidos, etc.).
![Page 12: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/12.jpg)
MondrianMondrian
Año 2010
Introducción a Pentaho Analysis
(La última versión de Mondrian y su documentación se encuentra en http://mondrian.pentaho.org/)
Una estructura de estrella
![Page 13: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/13.jpg)
MondrianMondrian
Año 2010
Introducción a Pentaho Analysis
(La última versión de Mondrian y su documentación se encuentra en http://mondrian.pentaho.org/)
Una estructura de copo de nieve
![Page 14: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/14.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
Ejemplo de mapeo Ejemplo de mapeo
Supongamos un cubo llamado "Ventas" que posee todas las ventas de una pequeña cadena de mercados.
Este cubo tendrá tres dimensiones: "Rubro", "Sucursal" y "Tiempo", y también un valor, el "Importe" de la venta.
Previamente crearíamos una base de datos en algún servidor que tenga conectividad con JDBC, por ejemplo MySQL.
Nuestra arquitectura será la típica estrella, con la tabla de hechos "venta" y una tabla adicional por cada dimensión.
![Page 15: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/15.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
Ejemplo de mapeo Ejemplo de mapeo Para mapear el cubo con la tabla, creamos un archivo llamado "olapmercado.xml" con el siguiente contenido:
![Page 16: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/16.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
Cómo funciona ? Cómo funciona ? Mondrian es un motor ROLAP con caché. ROLAP significa que en mondrian no residen datos (salvo en la caché) sino que estos residen en una Sistema de Gestion de Bases de Datos externo.Es en esta base de datos en la que residen las tablas que conforman la información multidimensional con la que mondrian trabaja (los modelos en estrella de nuestros data marts por ejemplo). MOLAP es el nombre quereciben los motores olap en los que los datos residen en una estructura dimensonal.
(extraído de “Análisis del estod de Mondrian” de Javier Giménez para Stratebi)
(extraído de HEFESTO)
![Page 17: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/17.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
Flujo de ejecuciónFlujo de ejecución
![Page 18: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/18.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
Tablas agregadasTablas agregadas
En el caso de que tengamos tablas agregadas en nuestro modelo en estrella (versión de las tablas de hechos reducidas con el fin de acelerar las queries), Mondrian es capaz de aprovecharlas. Ejemplo: Disponemos de dos tablas de hechos, una básica con un millon de registros e información a nivel de día y una versión agregada con información a nivel de mes y 20.000 registros (HECHOS y HECHOS_AGG).Si el usuario lanza una consulta MDX que solicita la información de este cubo Mondrian hará lo siguiente:
Verá si tiene la información en la caché (opción más rápida) Ver si para el nivel jerárquico para el que piden los datos puede obtenerlos
con una SQL contra la tabla HECHOS_AGG, si puede lo hace. (ej. La consulta pedía agregados para los 4 primeros meses).
Si la sentencia MDX pedía información a nivel de día, Mondrian obtendrá lo que pueda de la caché, lo que pueda de la tabla agregada y para los niveles de detalle irá a la tabla de HECHOS principal.
![Page 19: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/19.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
Tablas agregadasTablas agregadas
Para informar a Mondrian de que tablas agregadas hay disponible hay dos opciones:
Definirlas explicítamente (todas las que haya) en los metadatos (Esquema de Mondrian con las definiciones de cubos).
Utilizar una nomenclatura para los nombres de las tablas de forma que Mondrian (con una reglas gramaticales que tiene definidas y que son customizables) pueda saber automáticamente que tabla agregada puede utilizar en cada caso.
![Page 20: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/20.jpg)
MondrialMondrial
Año 2010
Introducción a Pentaho Analysis
CachéCaché
El objeto de esta memoria intermedia es almacenar información del cubo de forma que se pueda responder a queries (o partes de las queries) más rápidamente no siendo necesario lanzar consultas SQL contra la base de datos. Mondrian, permite desactivar la caché (para entornos en los que el rendimiento no sea crítico pero si lo sea disponer siempre del dato residente en la base de datos) y además (a partir de la versión 2.3) gestionarla de un modo sofisticado.
![Page 21: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/21.jpg)
Cómo diseñar un cubo en Mondrian ?Cómo diseñar un cubo en Mondrian ?
Año 2010
Introducción a Pentaho Analysis
Archivos de SchemaArchivos de Schema
Modelo LógicoModelo Lógico
Dimensiones, Jerarquías y NivelesDimensiones, Jerarquías y Niveles
![Page 22: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/22.jpg)
JPivotJPivot
Año 2010
Introducción a Pentaho Analysis
(extraído de “ ” de Héctor Francisco Hernández)
JPivot se puede descargar de la página del proyecto en SourceForge, http://jpivot.sourceforge.net/. La distribución binaria incluye el archivo ".war" listo para ser colocado en algún servidor JEE y funcionar.
![Page 23: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/23.jpg)
JPivotJPivot
Año 2010
Introducción a Pentaho Analysis
(extraído de “ ” de Héctor Francisco Hernández)
Las operaciones que se pueden realizar sobre modelos multidimensionales y que son las que verdaderamente les permitirán a los usuarios explorar e investigar los datos en busca de respuestas, son:
![Page 24: Introducción a Pentaho Analysis Lic. Ana Smail Año 2010](https://reader036.vdocuments.pub/reader036/viewer/2022081504/5665b4581a28abb57c90ba3f/html5/thumbnails/24.jpg)
JPivotJPivot
Año 2010
Introducción a Pentaho Analysis
(extraído de “ ” de Héctor Francisco Hernández)