bi pentaho

20
 Universidad Católica del Maule Facultad de Ciencias de la Ingeniería Escuela de Ingeniería Civil Informática PENTAHO Business analytics and business intelligence leaders Matias Chamorro - Patricio Sepúlveda - Joaquín Medel - Miguel Ortega Dra. Angélica Urrutia Jueves, 4 de Junio de 2015

Upload: matias-chamorro-villar

Post on 04-Nov-2015

26 views

Category:

Documents


0 download

DESCRIPTION

trabajo gestion 2

TRANSCRIPT

  • UniversidadCatlicadelMauleFacultaddeCienciasdelaIngenieraEscueladeIngenieraCivilInformtica

    PENTAHOBusinessanalyticsandbusiness

    intelligenceleaders

    MatiasChamorroPatricioSeplvedaJoaqunMedelMiguelOrtega

    Dra.AnglicaUrrutia

    Jueves,4deJuniode2015

  • Introduccin Business Intelligence es la habilidad para transformar los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. La cantidad de informacin con la cual cuentan las empresas est en constante crecimiento, y con ello aumenta la complejidad a la hora de sintetizar o procesar aquella cantidad de data, impidiendo as la toma de decisiones. La utilidad que prestan los BI, se centra mayoritariamente en dos puntos:

    1. Ayuda en la toma de decisiones estratgicas. 2. Mejora continua de sistemas de informacin de las empresas, y

    como consecuencia genera un impulso para la mejora de resultados de la organizacin.

    El estudio o implementacin de BI, en las empresas u organizaciones se hace mediante instrumentos que proveen de las herramientas necesarias para generar la informacin que la empresa necesita. En el mercado existe una variada lista de software que ayudan a hacer este tipo de tareas, los existen tanto de de cdigo libre como privativo, todas estas herramientas estn clasificadas en una tabla llamada Magic Quadrant for Business Intelligence and Analytics Platforms, en la cual es posible ver como todas los software existentes se posicionan ya sea como leaders, challengers, niche players y por ltimo visionaries. Los ejes de calificacin en el cuadrante, estn dados en el eje x, por completeness of vision (integridad de visin) y viene a representar el conocimiento de los proveedores sobre cmo se puede aprovechar el momento actual del mercado para generar valor tanto para sus clientes como para ellos mismos. Por otro lado en el eje Y trata sobre ability to execute(Capacidad de ejecutar) y trata de medir la habilidad de los proveedores para ejecutar con xito su visin del mercado. Para el desarrollo de este informe, se dispuesto estudiar el BI Pentaho, herramienta BI, que se encuentra en el cuadrante de niche player(jugadores de nicho), definido por la misma empresa como una plataforma de BI orientada a la solucin y centrada en procesos que incluye todos los principales componentes requeridos para implementar

  • soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos. Entre las herramientas BI se encuentran :

    Dashboards. Paneles de control digital. OLAP ( incluido HOLAP, ROLAP y MOLAP). Aplicaciones de informes. Minera de datos.

  • Desarrollo Pentaho es una herramienta BI basada en el lenguaje de programacin Java lo que permite un alto grado de flexibilidad realizando trabajos de Anlisis de Datos y la generacin de informes empresariales. Arquitectura de Pentaho:

    Cabe destacar que Pentaho se encuentra disponible para mltiples Sistemas operativos:

    Windows Linux/GNU Mac OS

    Este utiliza APACHE Java Application Server. Pentaho posee mltiples submdulos de trabajo, entre ellos podemos encontrar: Reporting: Mdulo de reportes e informes que ofrece una solucin adecuada a las necesidades de los distintos tipos de usuarios del mercado. Este permite la generacin de reportes e informes de forma gil y manipulando gran cantidad de informacin. Esta herramienta permite exportar documentos en mltiples formatos tales como; PDF; XLS; HTML; Texto; entre otros. Adems este permite realizar programacin de tareas

  • y la ejecucin automatizada de informes por periodos de tiempo ( con una determinada periodicidad).

    Anlisis: Este es un sistema avanzado de anlisis de informacin. Este permite el trabajo directamente con tablas dinmicas. El usuario puede navegar por los datos realizando distintos tipos de ajustes que permiten realizar dicho anlisis, tales como, ajuste de visin de datos, filtros de visualizacin, ajustes de campos de agregacin, etc.. En este caso los datos pueden ser representados de distintas formas, tanto de forma SVG como Flash, mediante dashboards widgets, o tambin integrados con los sistemas de minera de datos y portales web. Este permite una interaccin para la realizacin de anlisis con Microsoft Excel Analysis Services, aplicado a datos dinmicos vistos en Microsoft Excel ( usando una conexin a OLAP server Mondrian). Dashboards: Un dashboard puede estar compuesto de todos los componentes del mdulo Pentaho Reporting y Pentaho Anlisis. En este es posible integrar una mltiple variedad de tipos de datos, para representarlos de forma grfica, utilizando tablas, velocmetros, grficos, anlisis OLAP, etc.

  • Data Mining ( Minera de Datos ): Para realizar el trabajo de Minera de datos, Pentaho utiliza la herramienta Weka. Weka posee una coleccin de herramientas de visualizacin y algoritmos para anlisis de datos y modelado predictivo. Weka posee un una interfaz de usuario para facilitar el acceso a sus mltiples funcionalidades. Como principales caractersticas de Weka se encuentran:

    Este es un software libre.

    Es un software portable, implementado en Java ( con gran grado de Flexibilidad ), lo que permite que sea una herramienta que puede correr en mltiples plataformas.

    Contiene una gran coleccin de tcnicas para el procesamiento de

    datos y modelado.

    La utilizacin de una interfaz de usuario, permite un fcil aprendizaje, adems de mayor versatilidad para el usuario.

    Integracin de Datos: Este utiliza una herramienta Kettle ETL ( Pentaho Data Integration ), esta permite implementar procesos ETL ( Extraccin, Transformacin y Carga). Pentaho Data Integration todava se encuentra en crecimiento, por ello cada vez se vuelve una herramienta ms potente para el apoyo de BI y herramientas comerciales.

  • Productos Data Integration: la integracin de datos de pentaho se encarga de preparar e integrar los datos de la empresa, con el fin de crear un imagen completa de la empresa de modo que esta informacin pueda ser procesable. La plataforma proporciona anlisis de datos que le son precisos al usuario, independiente de la fuente que estos tengan, por lo tanto pentaho pone a disposicin del usuario una gran cantidad de datos de modo que al usuario le sea de fcil interpretacin. Es posible la creacin de ETL, de una forma natural y sencilla. Business Analytics: pentaho posee o implementa un enfoque moderno el cual permite a los usuarios de negocio acceder, descubrir y mezclar todos los tipos y tamaos de datos, donde es posible extraer informes bsicos para el modelado predictivo, adems de que los usuarios pueden analizar y visualizar los datos a travs de mltiples dimensiones , a la vez que minimiza la dependencia de TI . Al mismo tiempo es una plataforma diseada tambin para plataformas mviles lo que garantiza que los usuarios sean productivos sin importar dnde se encuentren. Big Data Analytics: Pentaho permite el anlisis de distintas fuentes de datos y de distinto tamao, lo cual permite a su vez transformar grandes volmenes de datos en grandes ideas de negocio.

  • Embedded Analytics: la plataforma debido al potente anlisis que efecta y adems a su arquitectura extensible, permite que sta est preparada para la integracin con otras plataformas por ejemplo en la nube, lo cual permite introducirse rpidamente en el mercado, con lo que en consecuencia acapara una mayor cantidad de clientes y por lo tanto mejora el futuro de la organizacin. Cloud Analytics: Ms y ms organizaciones estn buscando a la nube para sus guardar sus datos y proyectos de anlisis , tratando de aprovechar su infraestructura elstica , escalable y rentable, sin la necesidad de adquirir o mantener el hardware interno. Con la creciente adopcin del big data y cloud computing , las empresas necesitan una plataforma robusta que puede ofrecer valor tanto en las instalaciones y organizado de datos a escala de la empresa. Internet of Things Analytics: Pentaho ofrece la posibilidad de combinar los datos operacionales con los datos de sistemas informticos de registro y adems entregar anlisis inteligentes, puesto que estos tipos de datos presentan retos significativos relacionados con el volumen y la variedad de datos, as como tambin el modelado predictivo. Mobile BI: Pentaho Mobile, permite realizar trabajos de Pentaho como anlisis interactivo, visualizaciones especiales, tablas ejecutivas, y presentacin de informes en las distintas plataformas mviles como Tablets, Ipads o Smartphones. Esta posee una interfaz adaptada a los sistemas operativos mviles como IOS o Android. Este permite una exploracin de los datos con un amplio abanico de opciones grficas, para trabajar con grficos interactivos, diagramas, Geo-Maps, entre otros. Adems de permitir construir y editar el anlisis multidimensional a travs de una interfaz touch.

  • Servicios: Custom Visualizations & UI Design: Pentaho ofrece las herramientas y servicios necesarios para crear visualizacin personalizadas y diseos de interfaz de usuario para hacer que el anlisis sea lo ms natural posible. Consulting Services: Pentaho ofrece programas personalizados que ayudarn a desarrollar , disear e implementar sus proyectos de anlisis rpidamente. Training and Education: Cada cursos est diseado para llevar a los usuarios la formacin necesaria para impulsar la adopcin , la productividad y especializacin. Certification Program: Para quienes sean consultores de BI, pentaho ofrece la posibilidad de obtener una certificacin, la cual permite al usuario, aprovechar de la mejor forma posible la herramienta de BI. Enterprise Support: La integracin que permite el trabajo en un solo punto de contacto para proporcionar orientacin en curso, las mejores prcticas y la gestin de peticiones y casos de manutencin. Este en general, crea un apoyo para la alineacin con las necesidades que el mismo negocio posea, permitiendo a los clientes acelerar la planificacin de proyectos.

  • Tabla comparativa entre el servicio Enterprise y el servicio Premium:

    Technical Support: la herramienta permite un apoyo constante para con el usuario, con el fin de que logre el xito esperado para su empresa, la cual parte con la identificacin de los problemas existentes y su posterior resolucin.

  • Big Data Blueprints Optimize the Data Warehouse: reducir la cantidad de carga y descarga de datos es una de la ventajas que tiene pentaho, puesto que hace la transformacin mediante Hadoop, lo que implica no tener que programar ni tampoco tomar scripts heredados de otros consultores BI, ni tampoco depender de los ETL. Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Monetize My Data: Potente herramienta de procesamiento de datos de Pentaho y anlisis incrustables, pensado para trabajar con grandes cantidades de datos. Esto permite mejorar el acceso, enriquecer y identificar conjuntos de datos para ser empaquetados, de tal manera de satisfacer las necesidades de los clientes. Streamlined Data Refinery: Pentaho ofrece a sus clientes la accin de mezclar, enriquecer y perfeccionar cualquier fuente de datos. El uso de Hadoop como centro de procesamiento ms los procesos de integracin de datos Pentaho,producen un refinamiento de datos especficos, lo que cual con un solo clic, el conjunto de datos se modela, se publican y estn listos para que el usuario, pueda hacer los anlisis pertinentes. Customer 360-Degree View: Pentaho ofrece a sus usuarios poder mezclar fuentes de datos operacionales, con fuentes de datos grandes, con el fin de crear una vision analitica bajo demanda a travez de puntos de contacto con el cliente clave.

  • Comparativa entre pentaho y qlikview Pentaho Qlickview

    Replica el modelo de Suite BI completa ofrecida tradicionalmente por Business Objects, Cognos, Microstrategy, etc... pero basado en el Open Source.

    Utiliza la "lgica asociativa" (AQL), tcnica que realiza los anlisis y clculos en memoria obteniendo con ello un tiempo de respuesta excelente.

    Es muy til para la elaboracin de prototipos rpidos, con un Modelo de Datos sencillo y enfoque de Cuadro de Mando pero pierde eficiencia cuando se desea pasar a un sistema BI ms completo con Informes, anlisis OLAP, Data Mining, etc .

    Su versin Community, la ms

    extendida y utilizada, no tiene coste.

    Su precio es sensiblemente inferior respecto a Business Objects, Cognos, Microstrategy, etc.

    Utiliza una aproximacin de metadatos y un modelo multidimensional centralizado.

    Sus Cuadros de Mando son elegantes y sencillos de usar, sin embargo, carece de la variedad y cantidad de mdulos que posee Pentaho.

    Carece de metadatos centralizados.

    Carece de sistema Molap, pero si existe la solucin PALO Open Source, con conectores ETL con Pentaho de forma que pueden usarse conjuntamente.

    Necesita que todos los datos a consultar sean cargados en memoria.

    Carece de sistema Molap que permita establecer presupuestacin, forecasts, simulacin, reglas de negocio, etc.

    Dispone de cubos OLAP, que permiten manejar fcilmente grandes volmenes de informacin.

    No dispone de cubos OLAP y ofrece a cambio su tecnologa asociativa que permite integrar nuevas fuentes de datos fcil y rpidamente.

  • Dispone de una completa suite ETL, llamada Pentaho Data Integration

    Al usar logica asociativa, no dispone de una suite ETL.

    El tiempo de implementacin es bastante superior a 3 meses, por lo tanto, el costo de consultora es mayor.

    El tiempo de implementacin suele ser inferior a 3 meses, por lo tanto, el costo de consultora es menor.

    Curva de aprendizaje de 1 a 2 semanas

    Curva de aprendizaje inferior a 1 semana.

    Accesible y dispone de visualizacin desde iPad, Android, entre otros.

    Accesible y dispone de visualizacin desde iPad, Android, entre otros.

    Ambas herramientas han tenido un crecimiento espectacular. Pentaho es ms reciente.

    Ambas herramientas han tenido un crecimiento espectacular en los ltimos aos En el caso de Qlikview el crecimiento ms fuerte se produjo hace unos pocos aos.

    Tiene wizards e interfaces grficos

    muy intuitivos.

    Tiene wizards e interfaces grficos muy intuitivos.

  • Comparativa entre distintos BI de software libre (JasperSoft, Pentaho y SpagoBI).

  • Ejemplos en latinoamrica. Banelco: La mayor red de cajeros automticos en Argentina. Retos empresariales (1)

    La empresa necesitaba incluir nuevas fuentes de informacin que no estaban en los sistemas transaccionales, como las respuestas por correo electrnico y los contratos de venta.

    Banelco no tena un control adecuado sobre el rendimiento. Tena que hacer una verificacin manual de datos a travs de la programacin de SQL que era costoso y propenso a errores.

    La compaa tambin necesitaba mejorar la calidad de datos causada por la falta de integridad referencial, cargas de datos no vlidos y estructuras tridimensionales incompletos.

    La compaa recibi actualizaciones de procesamiento de datos a travs de secuencias de comandos SQL que resulta en un desarrollo lento, mantenimiento complejo y arquitectura rgida.

    Solucin Pentaho (1)

    Pentaho Data Integration es una solucin flexible que permite a Banelco extraer, transformar y cargar datos desde mltiples fuentes de datos ms rpido, ms fcil y ms rentable.

    Datalytics, Pentaho Oro Reseller Socio y servicios profesionales firme que cubre Latinoamrica, implement la solucin.

    Valor Aadido (1)

    Aumento del nmero de fuentes de datos en un factor de cinco, la incorporacin de la informacin de los acuerdos y comisiones con terceros, entregas de tarjetas de dbito, la disponibilidad de dinero en efectivo, el funcionamiento de los cajeros automticos y las respuestas de los usuarios a los mensajes. Adems cuenta con Pentaho Data Integration, que incorpora el Diseador de informes para generar informes operacionales.

  • Dramticamente aument la cantidad de datos procesados diariamente a ms de siete millones de registros y tablas de hechos con ms de dos mil millones de registros, mientras que disminuye el tiempo necesario para procesar los registros de varias horas a varios minutos.

    Procesos migrados a travs de Pentaho Data Integration eliminando todo scripting SQL y el aumento de rendimiento.

    Por qu Pentaho? (1)

    Producto maduro utilizado y probado en mltiples y reconocidos clientes globales.Es una solucin escalable basado en la arquitectura J2EE y su bajo costo total de propiedad (TCO)

    -Fundacin Telefnica: Programa de accin social que tiene como objetivo erradicar el trabajo infantil en Amrica Latina. Caso de uso general Retos empresariales (2):

    Desde su creacin en 2004, Fundacin Telefnica creci rpidamente en trminos de la cantidad de nios, escuelas y organizaciones no gubernamentales que participan en el programa. Con este crecimiento, las herramientas de anlisis de edad llegaron a sus lmites, por lo que es casi imposible hacer un seguimiento del progreso de cada nio o evaluar las medidas de xito.

    Su aplicacin Pronio necesitaba una arquitectura de anlisis que podran apoyar a ms de 400 trabajadores sociales en 13 pases que tenan poca experiencia en software empresarial, entre ellos, muchos tambin fueron resistentes a los cambios tecnolgicos.

    Pronio tambin tendra que realizar un seguimiento de mltiples puntos de datos acerca de cada nio en el programa, tales como las actividades realizadas con las escuelas, las familias, las comunidades y las organizaciones no gubernamentales.

  • Solucin Pentaho (2)

    Para ayudar a Pronio lograr sus objetivos, la Fundacin Accenture recomienda Pentaho Business Analytics.

    Pronio utiliza el acceso a los datos y la integracin, descubrimiento, anlisis y capacidades de visualizacin en Pentaho Business Analytics Enterprise Edition.

    Fundacin Telefnica trabaj con un socio local de Pentaho para proporcionar un alto nivel de apoyo en el idioma local y les ayuda a llevar la instalacin al siguiente nivel.

    Valor Aadido (2)

    Intercambio de datos global consistente con la capacidad de intercambiar informacin y experiencias a travs de los 13 pases, los trabajadores sociales tienen una visin ms completa del programa y los temas de trabajo infantil ms all de sus localidades.

    La satisfaccin del usuario final durante talleres con trabajadores sociales, Fundacin Telefnica inform retroalimentacin entusiasta cuando se trabaja con Pentaho.

    La mejora continua del programa, con Pentaho, Fundacin Telefnica ahora puede mostrar el progreso del programa respecto a los objetivos, medir su eficacia y hacer cursos-correcciones para mejorar la calidad de la intervencin social en forma permanente.

    El descubrimiento de oportunidades, con Pentaho Business Analytics, los trabajadores sociales tienen la oportunidad de explorar y visualizar los datos en tiempo real, lo que les permite comprender mejor los contextos en que se plantea el trabajo infantil, descubren los desafos nuevos y desconocidos y tomar las medidas correctivas que se adaptan mejor a diversas situaciones.

    Por qu Pentaho? (2)

    La flexibilidad y la escalabilidad,End-to-end capacidades de BI y la eficiencia de costes.

  • Algunas organizaciones que utilizan Pentaho en Chile.

  • Conclusin Existe una amplia gama de herramientas BI, que apoyan a la alta direccin, y justamente una de ellas es Pentaho. Las herramientas BI son de vital importancia dentro de cualquier organizacin, y para cada una de sus reas y niveles de trabajo, pues permiten apoyar la toma de decisiones y conocer el cumplimiento de las diversas metas que posea la organizacin.Estas especficamente tratan un conjunto de herramientas que asisten en distintos procesos detrabajocomolosonelanlisisypresentacindelosdatos.