pentaho jug vale 2012

Post on 28-Nov-2014

952 Views

Category:

Education

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Pentaho is the best open source suite for Business Intelligence and Analytics

TRANSCRIPT

@fmasanori http://www.slideshare.net/fmasanori

• Conhecendo o palestrante

• Conhecendo os assistentes

• Business Intelligence

• Pentaho

• Big Data and NoSQL

• Perguntas

• IME-USP e Mestrado ITA

• ed e lint Cobra Tecnologia

• Software Express

• Credicard Mastercard

• PriceWaterhouseCoopers

• ITAU BankBoston

• Docente FATEC (amo dar aulas)

• Interesses: Python, NoSQL, Google Technology, Facebook

Conhecendo os assistentes • Estudantes

• Docentes

• Java Dev

• Conhece Sang Shin (JavaPassion)

• Sun Tech Days, JavaOne

• Business Intelligence

• Pentaho

Business Intelligence

Business Intelligence

Business Intelligence

Gartner's 2012 CIO survey showed that analytics and BI is the No. 1 technology priority for CIOs in 2012

Analytics no mercado mundial, Gartner:

• 2010: +13.4%

• 2011: +16.4% == $12.2 billion

• 2º em crescimento software market

América Latina:

• 2010: +19.5%

FONTE DE DADOS PROCESSO DE ETL DATA WAREHOUSE APRESENTAÇÃO

ERP

SGBD

Arquivos

ETL SGBD

Arquivos

SGBD

ETL

DASHBOARDSCENTRAL

WAREHOUSE

ÁREA DE ESTÁGIO

ETL

DOCUMENTOS

DATA MARTS

DATA

MININGDSS

OLAP

CRM

(Luiz H. N. Lorena, 2011)

BI architecture

(Luiz H. N. Lorena, 2011)

Star Schema

VENDAS

CLIENTE

TEMPO

PRODUTO

LOJAPROMOÇÃO

(Kimball, 2002)

Denormalization

(Kimball, 2002)

Denormalization

Aggregation performance

Operacional x Analytics

Operacional Analítico

Propósito Executar um processo Avaliar um processo

Estilo interação Insert, update, delete, query Query (read-only)

Escopo interação Transação individual Agregação

Padrão query Previsível e estável Imprevisível

Foco temporal Atual Histórico e atual

Otimização Update concorrente Query (agregação)

Projeto ER na 3FN Star Schema ou Cubo

(Adamson, 2010)

Open Source == comunidade ativa

Pentaho == BI suite

• Reporting, OLAP, Pivot Tables, Dashboarding, Data Mining

• Requisito: Java (JRE + JDK)

• JAVA_HOME, JRE_HOME, PATH E CLASSPATH

• Download community.pentaho.com

BI-Server

• Extrair biserver-ce para c:\program files\pentaho (exemplo)

• Adionar o user com full control no properties security do diretorio

• start-pentaho.bat ou start-pentaho.sh

• http://localhost:8080/pentaho/Login

• User == joe e Senha == password

• Não esquecer: stop-pentaho.bat

Demo

Administration Console

• start-pac.bat

• http://massa-pc:8099/

• User == admin e Senha == password

• Não esquecer: stop-pac.bat

Demo

Pentaho Data Integration

• ETL: Extract, Transform, Load

• Extrair pdi-ce no mesmo diretório pentaho

• spoon.bat

• Inicialmente não usaremos o repositório

• Ferramenta gráfica, mas os scripts são executados em lote quando em produção

Demo

BigData and NoSQL • Dados crescem exponencialmente

• Wallmart == 1M transactions/hour • Facebook == 40B photos

• Escalabilidade para leituras num banco

relacional: trabalhoso

• Escalabilidade para escritas num banco relacional: MUITO, MUITO, trabalhoso

(se conseguir ele deixou de ser relacional...)

Escalabilidade vertical

Escalabilidade vertical

Escalabilidade horizontal

Not Only SQL

• JSON oriented • Autosharding • Full featured indexes

Cassandra: • Linearly Scalable • Column based

Pentaho BigData

Demo http://wiki.pentaho.com/display/BAD/Write+Data+To+MongoDB

http://wiki.pentaho.com/display/BAD/Read+Data+From+MongoDB

Bibliografia

Bibliografia

Perguntas? fmasanori@gmail.com

facebook.com/fmasanori

twitter.com/fmasanori

top related