pentaho jug vale 2012

35
@fmasanori http://www.slideshare.net/fmasanori

Upload: fernando-masanori

Post on 28-Nov-2014

952 views

Category:

Education


3 download

DESCRIPTION

Pentaho is the best open source suite for Business Intelligence and Analytics

TRANSCRIPT

Page 1: Pentaho JUG Vale 2012

@fmasanori http://www.slideshare.net/fmasanori

Page 2: Pentaho JUG Vale 2012

• Conhecendo o palestrante

• Conhecendo os assistentes

• Business Intelligence

• Pentaho

• Big Data and NoSQL

• Perguntas

Page 3: Pentaho JUG Vale 2012

• IME-USP e Mestrado ITA

• ed e lint Cobra Tecnologia

• Software Express

• Credicard Mastercard

• PriceWaterhouseCoopers

• ITAU BankBoston

• Docente FATEC (amo dar aulas)

• Interesses: Python, NoSQL, Google Technology, Facebook

Page 4: Pentaho JUG Vale 2012

Conhecendo os assistentes • Estudantes

• Docentes

• Java Dev

• Conhece Sang Shin (JavaPassion)

• Sun Tech Days, JavaOne

• Business Intelligence

• Pentaho

Page 5: Pentaho JUG Vale 2012

Business Intelligence

Page 6: Pentaho JUG Vale 2012

Business Intelligence

Page 7: Pentaho JUG Vale 2012

Business Intelligence

Gartner's 2012 CIO survey showed that analytics and BI is the No. 1 technology priority for CIOs in 2012

Page 8: Pentaho JUG Vale 2012

Analytics no mercado mundial, Gartner:

• 2010: +13.4%

• 2011: +16.4% == $12.2 billion

• 2º em crescimento software market

América Latina:

• 2010: +19.5%

Page 9: Pentaho JUG Vale 2012

FONTE DE DADOS PROCESSO DE ETL DATA WAREHOUSE APRESENTAÇÃO

ERP

SGBD

Arquivos

ETL SGBD

Arquivos

SGBD

ETL

DASHBOARDSCENTRAL

WAREHOUSE

ÁREA DE ESTÁGIO

ETL

DOCUMENTOS

DATA MARTS

DATA

MININGDSS

OLAP

CRM

(Luiz H. N. Lorena, 2011)

BI architecture

Page 10: Pentaho JUG Vale 2012

(Luiz H. N. Lorena, 2011)

Star Schema

VENDAS

CLIENTE

TEMPO

PRODUTO

LOJAPROMOÇÃO

Page 11: Pentaho JUG Vale 2012

(Kimball, 2002)

Denormalization

Page 12: Pentaho JUG Vale 2012

(Kimball, 2002)

Denormalization

Aggregation performance

Page 13: Pentaho JUG Vale 2012

Operacional x Analytics

Operacional Analítico

Propósito Executar um processo Avaliar um processo

Estilo interação Insert, update, delete, query Query (read-only)

Escopo interação Transação individual Agregação

Padrão query Previsível e estável Imprevisível

Foco temporal Atual Histórico e atual

Otimização Update concorrente Query (agregação)

Projeto ER na 3FN Star Schema ou Cubo

(Adamson, 2010)

Page 14: Pentaho JUG Vale 2012
Page 15: Pentaho JUG Vale 2012

Open Source == comunidade ativa

Page 16: Pentaho JUG Vale 2012

Pentaho == BI suite

• Reporting, OLAP, Pivot Tables, Dashboarding, Data Mining

• Requisito: Java (JRE + JDK)

• JAVA_HOME, JRE_HOME, PATH E CLASSPATH

• Download community.pentaho.com

Page 17: Pentaho JUG Vale 2012

BI-Server

• Extrair biserver-ce para c:\program files\pentaho (exemplo)

• Adionar o user com full control no properties security do diretorio

• start-pentaho.bat ou start-pentaho.sh

• http://localhost:8080/pentaho/Login

• User == joe e Senha == password

• Não esquecer: stop-pentaho.bat

Page 18: Pentaho JUG Vale 2012

Demo

Page 19: Pentaho JUG Vale 2012

Administration Console

• start-pac.bat

• http://massa-pc:8099/

• User == admin e Senha == password

• Não esquecer: stop-pac.bat

Page 20: Pentaho JUG Vale 2012

Demo

Page 21: Pentaho JUG Vale 2012

Pentaho Data Integration

• ETL: Extract, Transform, Load

• Extrair pdi-ce no mesmo diretório pentaho

• spoon.bat

• Inicialmente não usaremos o repositório

• Ferramenta gráfica, mas os scripts são executados em lote quando em produção

Page 22: Pentaho JUG Vale 2012

Demo

Page 23: Pentaho JUG Vale 2012

BigData and NoSQL • Dados crescem exponencialmente

• Wallmart == 1M transactions/hour • Facebook == 40B photos

Page 24: Pentaho JUG Vale 2012

• Escalabilidade para leituras num banco

relacional: trabalhoso

• Escalabilidade para escritas num banco relacional: MUITO, MUITO, trabalhoso

(se conseguir ele deixou de ser relacional...)

Escalabilidade vertical

Page 25: Pentaho JUG Vale 2012

Escalabilidade vertical

Page 26: Pentaho JUG Vale 2012

Escalabilidade horizontal

Page 27: Pentaho JUG Vale 2012

Not Only SQL

Page 28: Pentaho JUG Vale 2012

• JSON oriented • Autosharding • Full featured indexes

Page 29: Pentaho JUG Vale 2012

Cassandra: • Linearly Scalable • Column based

Page 30: Pentaho JUG Vale 2012
Page 31: Pentaho JUG Vale 2012

Pentaho BigData

Page 32: Pentaho JUG Vale 2012

Demo http://wiki.pentaho.com/display/BAD/Write+Data+To+MongoDB

http://wiki.pentaho.com/display/BAD/Read+Data+From+MongoDB

Page 33: Pentaho JUG Vale 2012

Bibliografia

Page 34: Pentaho JUG Vale 2012

Bibliografia