módulo 5. implementando cubos...

22
Página 1 de 22 Módulo 5. Implementando Cubos OLAP Objetivos Compreender a importância da manipulação correta da segurança nos dados. Conhecer as operações que podem ser realizadas na consulta de um cubo. Entender o uso da tabela dinâmica como ferramenta de exploração. Conteúdo do módulo 5.1 Introdução 5.2 Segurança 5.3 Consultas 5.4 Ferramentas de visualização 5.4.1 A Tabela Dinâmica 5.4.2 O Painel de Controle 5.5 Conclusões 5.6 Check List

Upload: nguyendiep

Post on 21-Nov-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Página 1 de 22

Módulo 5. Implementando Cubos OLAP

Objetivos

� Compreender a importância da manipulação correta da segurança nos dados.

� Conhecer as operações que podem ser realizadas na consulta de um cubo.

� Entender o uso da tabela dinâmica como ferramenta de exploração.

Conteúdo do módulo

5.1 Introdução

5.2 Segurança

5.3 Consultas

5.4 Ferramentas de visualização

5.4.1 A Tabela Dinâmica

5.4.2 O Painel de Controle

5.5 Conclusões

5.6 Check List

Página 2 de 22

5.1 Introdução

Como parte final do curso veremos como os usuários podem acessar a informação do cubo, para isso, descreveremos primeiramente alguns aspectos de segurança para mostrar os dados e mostraremos os diferentes modos existentes para navegar um cubo.

No final do módulo será apresentada uma conclusão sobre o aprendido ao longo do curso e será realizado um Check List que servirá de guia no processo de criação de uma solução de BI.

5.2 Segurança

No momento de desenhar o modelo multidimensional, é fundamental definir a segurança adequada sobre os diferentes componentes e níveis da solução, devido à importância para a organização da informação manipulada por esse tipo de aplicativo.

Da mesma forma que nos bancos de dados dos sistemas transacionais, no OLAP podem ser manipulados diferentes níveis de segurança.

A segurança no OLAP apresenta uma arquitetura hierárquica, partindo do cubo e chegando ao nível de célula dentro do cubo.

Desta forma, podemos definir as autorizações de:

� Cubo

� Dimensão

� Célula (Medida)

Página 3 de 22

Cubo: esta restrição de segurança é realizada sobre todo o cubo, podendo permitir ou negar o acesso ao cubo.

Dimensão: Podemos permitir que o usuário veja a dimensão, acesse apenas uma parte dela ou que não tenha autorização para visualizá-la.

Célula: Em uma célula ou medida podemos permitir o acesso ou personalizá-lo utilizando expressões que verifiquem alguma condição para acessar os dados.

Outra opção para limitar os acessos pode ser o uso de cubos virtuais. Podemos criar um cubo virtual apenas com as medidas que desejamos que o usuário tenha acesso e determinar as autorizações no cubo virtual e negar ou não permitir acesso ao cubo original.

Por exemplo, se apenas um grupo de usuários puder visualizar o valor dos salários dos funcionários, então podemos definir uma restrição de acesso na célula, na medida Salário ou criar um cubo virtual que não mostre esta medida.

5.3 Consultas

Após montar o cubo, os usuários podem realizar diferentes operações para poder visualizar e analisar seus dados.

As operações que podem ser realizadas são:

� Drill - Down

� Drill - Up

� Slice e Dice (Filtro)

Negado Permitido

Permitido Apenas uma Negado

Página 4 de 22

� Rotação

� Consolidação

Drill Down – Drill Up: É uma técnica pela qual o usuário pode navegar entre as hierarquias de uma dimensão agrupando (Drill-up) ou desagrupando (Drill-down) os dados.

O drill down e o dril up servem para navegar pelas dimensões do cubo; com o drill up vai do detalhe para o geral e com o drill down do geral para o detalhado.

Slice: Ao selecionar um membro em particular de uma dimensão forma-se uma espécie de "fatia" (slice) do cubo original.

Dril

l - U

p

Dril

l - D

ow

n

Página 5 de 22

Dice: Ao selecionar vários membros de várias dimensões forma-se um sub-cubo, cubo menor ou dado (dice). Tanto o Slice quanto o Dice são formas particulares de Filtro.

Rotação: Seleciona a ordem de visualização das dimensões, gira o cubo de acordo com as suas dimensões.

Consolidação (Roll-Up): Calcula as medidas em função de agrupamentos, realiza o recálculo da medida de acordo com os ajustes de escala.

Página 6 de 22

5.4 Ferramentas de visualização

A navegação é o termo utilizado para descrever a possibilidade dos usuários percorrerem as diferentes dimensões e seus cruzamentos, visualizando os valores resultantes das medidas em cada caso.

Estes são alguns tipos de ferramentas que podem ser utilizadas para navegar pelo cubo:

� Planilhas de Cálculo: As planilhas de cálculo podem ser conectadas com a estrutura dimensional e alimentar uma tabela dinâmica com a informação retirada dos cubos.

� Painel de Controle: Os painéis de controle conectam-se com a estrutura dimensional e geram indicadores que permitem uma rápida visão do status atual das variáveis básicas e sua relação com os objetivos da empresa.

� Desenvolvimentos próprios: Soluções ou aplicativos desenvolvidos sob medida especialmente para a empresa. Estas soluções podem ser desenvolvidas pela área de Sistemas da empresa o um Provedor externo, mas sempre baseadas nos requerimentos da empresa.

� Software especializado: Soluções ou aplicativos criados por empresas dedicadas principalmente ao desenvolvimento de visualizadores de informação orientada para a análise. Existe uma grande variedade de ferramentas com diversidade de prestações e custos, que podem ser tanto genéricas quanto orientadas para algum mercado em particular.

� Geradores de Relatórios: Ferramentas especializadas na elaboração de relatórios que podem ser conectadas na estrutura dimensional e gerar relatórios com a informação retirada dos cubos.

Existe uma grande variedade de ferramentas de visualização da informação armazenada em uma estrutura multidimensional. Deve ser estudado cada conjunto de necessidade – recurso para decidir qual utilizar.

Geralmente, os fatores que influenciam na escolha de uma ferramenta são:

� Tipo de consultas ou análise.

� Orçamento.

� Valor do desenvolvimento ou das licenças.

� Usuário destino da ferramenta.

� Outras ferramentas existentes na empresa.

� Capacidade de desenvolvimento de aplicativos próprios.

Página 7 de 22

Se não for incluída a análise da ferramenta de visualização que será utilizada entre as tarefas de desenho, corre-se o risco de ter a informação correta e em tempo, porém com os usuários descontentes.

5.4.1 A Tabela dinâmica

A tabela dinâmica é uma ferramenta gráfica que permite que os usuários explorem facilmente as dimensões e medidas do cubo. Desta forma, o usuário pode construir seus próprios relatórios.

A tabela dinâmica é utilizada através de uma planilha de cálculo conectada ao modelo multidimensional. Com ela é possível realizar todas as operações vistas no ponto 5.3 Consultas.

Uma Tabela dinâmica apresenta as seguintes áreas:

� Área de Filtros: Na parte superior da tabela. Podem ser incluídas uma ou mais dimensões. É possível filtrar a informação selecionando níveis em geral ou membros em particular. Quando são realizadas seleções múltiplas dentro de uma dimensão, elas são relacionadas através do operador OR. Se as seleções forem realizadas em várias dimensões, serão vinculadas com o operador AND. Nesta área é implementada exclusivamente a operação Filtro; baseado nas seleções realizadas forma-se um conjunto reduzido de dados que atendem os valores escolhidos.

� Área de Filas: Na parte esquerda são definidas quais dimensões cruzam a tabela como filas. Nesta zona podem ser arrastadas as dimensões, navegar por elas e decidir quais níveis mostrar e o grau de abertura da informação. Também é possível selecionar qual a informação apresentada. Nesta área são implementadas as operações Drill-Up, Drill-Down e Filtro.

Página 8 de 22

� Área de Colunas: Na parte superior da tabela, debaixo da área de filtros. Nela são definidas quais dimensões cruzam a tabela como colunas. Nesta zona podem ser arrastadas as dimensões, navegar por elas e decidir quais níveis mostrar e o grau de abertura da informação. Também é possível selecionar qual a informação apresentada. Nesta área são implementadas as operações Drill-Up, Drill-Down e Filtro.

� Área de Dados: No centro da tabela e podem ser incluídas apenas medidas. Quando arrastamos uma medida, obtemos o resultado da intersecção com as dimensões escolhidas como filas e colunas, para o subconjunto que define o Filtro.

� Lista de Campos: Contém a lista das dimensões e as medidas do cubo.

� Notas:

o Uma dimensão pode estar em Filtros, Filas ou Colunas, mas em apenas uma área de cada vez.

o Geralmente na área de Filtros não é mostrada a seleção realizada. Se desejar filtrar por um nível ou membro e mostrá-lo ao mesmo tempo, deve ser incluído nas Filas ou Colunas.

Neste exemplo são apresentadas as unidades vendidas (Vendas Unidades) de cadernos quadriculados no mês de Maio de 2006, detalhadas por Filial.

Página 9 de 22

Estudo de Caso

Restrições de segurança

� Cada Filial pode ver exclusivamente os seus dados, não podendo acessar os dados das demais filiais.

� Os Vendedores podem ver as vendas por Seção ou Filial, porém não devem poder acessar o detalhamento por Vendedor.

� Os Vendedores não podem ter acesso ao custo das unidades vendidas.

Página 10 de 22

Operações no cubo

Veremos algumas das operações que podem ser realizadas no cubo, exemplificando-as com o nosso cubo de Vendas da Contoso. Para a visualização utilizaremos uma tabela dinâmica, por ser uma ferramenta de fácil manipulação e disponibilidade.

Drill Down: Se o usuário está analisando os dados de vendas do Brasil e deseja ver como estão formados, pode realizar drill-down na dimensão da Filial, que mostrará São Paulo, Minas Gerais, Espírito Santo, Paraná e Rio de Janeiro.

Se desejar explorar São Paulo, com outro drill-down a tabela mostrará São Paulo (a capital), Sorocaba e Campinas.

Drill Up: Se o usuário esta vendo em detalhe o nível Cidade (São Paulo, Sorocaba e Campinas) e deseja ver um nível mais geral pode realizar drill up. Esta operação agrupará a informação por País e mostrará o total do Brasil.

Página 11 de 22

A vantagem de ter estruturas definidas previamente é não ser necessário que o analista saiba a qual país corresponde cada província ou a qual província corresponde uma cidade para agregar ou detalhar. A estrutura indica o caminho.

Dice: Com esta operação é montado um SubCubo de três dimensões com as dimensões Produto, Filial e Tempo, deixando de fora da nossa seleção as dimensões Cliente e Vendedor.

Slice: Selecionando a dimensão tempo definimos uma fatia do cubo.

Filtro: Um exemplo de filtro pode ser selecionar o valor “Detergente Cristal 1 Litro” para a dimensão Produto.

Página 12 de 22

Rotação: Neste exemplo utilizamos as dimensões produtos e filial e realizamos a rotação.

Relatórios: A seguir serão mostrados alguns relatórios simples orientados para a análise da informação.

a- Deseja ver a evolução do lucro nas vendas dos hipermercados, para os totais dos anos de 2005 e 2006, detalhados por País.

� Filtro: Tipo de Filial Hipermercado.

� Filas: Dimensão Filial

� Colunas: Dimensão Tempo

� Dados: Medida Vendas Lucro

Será obtido o seguinte resultado:

b- Agora deseja comparar o Valor das Vendas do Mês de Setembro de 2006, por País e Família de Produtos, explodindo cada família por Departamento e Categoria.

� Filtro: Setembro 2006

� Filas: Dimensão Produto e seus níveis Família, Departamento e Categoria

� Colunas: Filial

� Dados: Medida Vendas Valor

Página 13 de 22

O resultado obtido foi:

c- Se deseja conhecer como é distribuído o lucro das vendas em cada país deve ser elaborado um gráfico que permita visualizar claramente esta distribuição:

� Filtro: -

� Filas: Dimensão Filial

� Colunas: -

� Dados: Medida Vendas Lucro

Vendas Lucro

d- Agora deseja comparar as unidades vendidas de cada produto durante 2005 e 2006 em um gráfico de barras.

� Filtro: -

Página 14 de 22

� Filas: Dimensão Produto

� Colunas: Dimensão Tempo

� Dados: Medida Vendas Unidades

5.4.2 O Painel de Controle

O Painel de Controle é uma ferramenta gráfica que permite que a diretoria se concentre em indicadores fundamentais que apresentam relação direta com os objetivos de negócio da empresa. O Painel de Controle não é um repositório de dados, é basicamente uma ferramenta que apresenta indicadores relacionando os resultados esperados com os reais, sendo uma forma de analisar a evolução do negócio.

Um Painel de Controle mostra, com poucos indicadores, dados transcendentes que refletem a natureza da empresa e o seu futuro. Estes indicadores devem mostrar a informação de forma objetiva, simples e integrada, além de serem claros e confiáveis.

Um Painel de Controle não garante o sucesso de uma empresa, portanto deve ser realizado o esforço necessário para a sua efetiva utilização e gerar uma transformação na cultura de trabalho empresarial.

Finalmente, deve estar muito claro que um Painel de Controle não gerencia nem administra; os indicadores mostram os problemas aos gestores, mas a análise das causas e a sua solução depende das decisões tomadas por eles. O Painel de Controle indica aos gestores se a organização está cumprindo os objetivos ou não, porém em momento algum gera uma solução automática. Para que serve então o Painel de Controle? Basicamente, o Painel de Controle permite uma

Página 15 de 22

rápida leitura do status atual das variáveis básicas e a sua relação com os objetivos da empresa, alertas sobre a existência de problemas atuais e facilita a visão da evolução esperada, ajudando a detectar os desvios nos objetivos e tomar decisões oportunas para corrigi-los em tempo.

O Painel de Controle é uma ferramenta excelente, porém apenas a mudança da cultura empresarial pode tornar o negócio um sucesso.

Neste exemplo são apresentados dois modelos de Semáforo, que são indicadores gráficos característicos dos Painéis de Controle.

Para definir os semáforos são manipuladas, basicamente, as seguintes variáveis:

� Modelo do Semáforo: Existem vários estilos com diferentes quantidades de níveis. O número de níveis de um semáforo está diretamente relacionado com a sensibilidade ou capacidade de detalhe que ele apresenta.

� Valor Real: É a variável que deseja monitorar.

� Valor Destino: É o elemento de contraste utilizado para monitorar os valores reais e a partir do qual são calculadas as diferenças ou desvios.

� Limiares: Valores porcentuais que definem a passagem de um status do semáforo a outro (do verde ao amarelo, por exemplo). A quantidade de limiares que devem ser definidos depende da quantidade de níveis do modelo de semáforo.

Semáforo tradicional de 3 cores: É um semáforo com a forma, as cores e a lógica tradicional. A cor Verde indica a situação ideal, enquanto o Vermelho indica a pior situação.

Semáforo de cinco níveis: É um semáforo que combina uma barra, no estilo das barras de status, com um índice. A barra completa, com o índice no quadro da direita, representa a situação ideal, enquanto a barra com apenas o quadro da esquerda e o índice sobre ele, mostra a pior situação.

Página 16 de 22

Estudo de Caso

Painel de Controle

A seguir são apresentados dois exemplos de Painel de Controle aplicados ao nosso Estudo de Caso.

a- Deseja ver a evolução do Valor das Vendas, para os meses de Janeiro, Fevereiro e Março de 2006, detalhada por Produto. Deseja ver os dados agrupados por Família e Departamento.

O primeiro a ser visualizado no Painel de Controle são os semáforos. à primeira vista, principalmente se a pessoa contar com a experiência suficiente no uso destas ferramentas, pode saber o volume das Vendas com relação aos Objetivos para cada mês e a evolução ocorrida no trimestre. De forma complementar são apresentados os valores numéricos como elemento de suporte.

b- Deseja ver a evolução das Vendas (Valor e Unidades), para os meses de Janeiro, Fevereiro e Março de 2006, detalhada por Estado.

O primeiro que pode ser visto no Painel de Controle é a possibilidade de analisar, de forma simultânea, vários aspectos do negócio. Podem ser combinadas diferentes variáveis para analisar e semáforos de diferente sensibilidade.

Neste caso é possível ver a evolução das vendas comparando como variam as

Página 17 de 22

unidades e os valores ao longo do tempo, com apenas uma olhada.

� Devemos considerar as restrições de segurança para proteger a informação dos cubos.

� As autorizações de acesso podem ser determinadas para diferentes elementos do modelo (cubos, dimensões, células).

� As consultas de um cubo envolvem diferentes operações (rotação, drill-down, slice, etc.).

� A tabela dinâmica é uma planilha de cálculo que permite navegar pelos cubos.

Página 18 de 22

� Existe uma política de segurança institucional?

� Podem ser definidos grupos de usuários com atribuições similares para facilitar a administração da segurança?

� Todos os requerimentos de controle de acesso aos dados serão manipulados administrando a segurança ou estes pontos serão considerados no desenho dos objetos da estrutura multidimensional?

� Existem ferramentas corporativas para a visualização dos cubos?

� Existe capacidade (habilidades e tempo disponível) para desenvolver ferramentas próprias?

� As ferramentas de mercado atendem as necessidades da empresa? São acessíveis?

5.5 Conclusões

As principais conclusões obtidas durante o curso são:

� Um sistema de BI é uma necessidade para a correta gestão do negócio.

� Os sistemas de BI representam uma excelente ferramenta para apoiar a evolução e o crescimento do negócio e devem ser desenhados de forma que possam acompanhar essa evolução e crescimento.

� Os sistemas de BI influenciam em toda a empresa, não sendo privilégio de um setor.

� Qualquer empresa que se proponha a cumprir seus objetivos deve ter um sistema de BI. Os sistemas de BI não são apenas para as grandes empresas.

� Os sistemas de BI não são máquinas de fabricar relatórios.

� Ter um sistema de BI não é um luxo para a empresa, é atender uma necessidade.

� Os sistemas de BI são válidos para qualquer processo no qual devem ser tomadas decisões, não sendo exclusividade das áreas comerciais ou financeiras.

� Os sistemas de BI não são máquinas de fabricar resumos, pois oferecem as informações com o grau de detalhe necessário para cada análise.

� Os sistemas de BI não são uma ferramenta da área de Sistemas para manter os usuários cativos. Pelo contrário, com um sistema de BI os usuários conseguem mais independência pois podem realizar as consultas de forma intuitiva e flexível.

Página 19 de 22

� Construir um sistema de BI apresenta como valor agregado ter que revisar onde e como estão sendo armazenados os dados dos sistemas transacionais (OLTP). É uma excelente oportunidade de incluir nos processos as manipulações dos dados que estejam sendo realizadas manualmente e sem nenhum suporte.

� O desenvolvimento de um sistema de BI não começa pela escolha da ferramenta de visualização. Como em todo desenvolvimento, é necessário determinar as necessidades da empresa, consultar os usuários, fixar o alcance e as restrições e, finalmente, desenhar, desenvolver e testar cada etapa.

� O desenvolvimento de um sistema de BI não termina com a criação de um cubo multidimensional. Devem ser definidos e implementados os trabalhos de processamento dos cubos (periodicidade, horário, tratamento de erros, etc.).

� Existe uma grande variedade de ferramentas de visualização de dados. Deve ser oferecida a usuário a mais conveniente, sem esquecer o orçamento. A ferramenta de visualização não deve ser uma barreira entre o usuário e o sistema de BI.

5.6 Check List (Lista de Verificação)

� A empresa está preparada para trabalhar com BI?

� É possível contar com o comprometimento da alta gerência para encarar um projeto de criação de um sistema de BI?

� Está consciente que deverá capacitar os usuários na disciplina associada a BI?

� Estão definidos claramente os objetivos de negócio associados ao sistema de BI?

� Foram analisados os Fatos que são de interesse?

� Foram executadas as aberturas pelas quais será analisada a informação?

� Foram determinadas as medidas ou indicadores que serão utilizadas para avaliar os Fatos?

� Qual é a granularidade necessária para visualizar a informação no sistema OLAP?

� Foram definidas as fontes de onde serão retirados os dados?

Página 20 de 22

� Foram definidos os formatos dos arquivos de transferência e dos dados que eles incluem?

� Foram desenhados os processos de extração, transformação e carga de dados (ETL)?

� Os requerimentos estão claramente definidos?

� Conhecemos os fatos que desejamos analisar, os indicadores e as aberturas pelas quais desejamos realizar a análise?

� Esta definição está de acordo com as tabelas auxiliares criadas e carregadas com dados dos sistemas OLTP?

� Sabemos se os usuários utilizarão as dimensões para navegar ou para filtrar?

� As dimensões desenhadas atendem as necessidades dos usuários de forma intuitiva e com facilidade de manipulação?

� Já temos todas as medidas naturais com as aberturas requeridas?

� Está definida a forma de agregação, ao sair da granularidade mínima, para todas as medidas naturais?

� Estão definidas as fórmulas ou critérios de todas as medidas calculadas?

� Estão documentadas corretamente todas as definições?

� Os tempos de resposta das consultas são fatores chave? Estão definidos os valores mínimos ou máximos que devem ser atendidos?

� Está estimado o volume de dados que deve ser manipulado, tanto hoje quanto no futuro?

� A freqüência e o tempo de processamento são fatores críticos?

� Possui o equipamento adequado para a situação atual e a estimativa futura? Foi considerado este fator com relação ao armazenamento e à velocidade de processamento?

Página 21 de 22

� Existem critérios preestabelecidos para a definição da % de pré-agregação?

� Será necessário criar cubos virtuais?

� Existe uma idéia clara da quantidade e qualidade das consultas habituais? Existe algum padrão de filtragem repetido, como mês ou cidade?

� Existe uma política de segurança institucional?

� Podem ser definidos grupos de usuários com atribuições similares para facilitar a administração da segurança?

� Todos os requerimentos de controle de acesso aos dados serão manipulados administrando a segurança ou estes pontos serão considerados no desenho dos objetos da estrutura multidimensional?

� Existem ferramentas corporativas para a visualização dos cubos?

� Existe capacidade (habilidades e tempo disponível) para desenvolver ferramentas próprias?

� As ferramentas de mercado atendem as necessidades da empresa? São acessíveis?

Página 22 de 22

Referência Bibliográfica

� Kimball Ralph, "The Data Warehouse Toolkit " - John Wiley & Son, Inc. � Thomsen E., Spofford G., Chase D., “Microsoft OLAP Solutions“ - John

Wiley & Son, Inc.

� Laudon Kenneth C.; Laudon Jane Price. “Sistemas de información gerencial

: administración de la empresa digital” - Pearson Educación

� Curso 2074A: Designing and Implementing OLAP Solutions with Microsoft SQL Server 2000.

� Facultad de Ciencias Exactas – UNICEN

http://www.exa.unicen.edu.ar/catedras/dwhouse/

� Facultad de Ingeniería – Universidad de la República de Uruguay http://www.fing.edu.uy/inco/grupos/csi/esp/Cursos/cursos_act/2003/DAP_SistDW

� Facultad Tecnología Informática - Universidad Abierta Interamericana Disciplina: Base de Datos Aplicada I � Artigo “Bajo el paraguas Business Intelligence”, Jorge Fernández González,

Abril 2006.