Download - Kimball Vs Inmon
10-04-23 1
Abordagem Abordagem Kimball Vs. Kimball Vs. Abordagem Abordagem
InmonInmonAna Henriques n.º 50247Ana Henriques n.º 50247
10-04-23 2
InformaçãoInformação
Empresas (a partir da década de 90):Empresas (a partir da década de 90): Necessidade de lidar com informações de Necessidade de lidar com informações de
forma a conseguir vantagem competitiva.forma a conseguir vantagem competitiva. Aprender a colectar e processar os dados Aprender a colectar e processar os dados
gerados pelas suas operações.gerados pelas suas operações. Primeiras Propostas:Primeiras Propostas:
DSS (Decision Support Systems)DSS (Decision Support Systems) EIS (Executive Information Systems)EIS (Executive Information Systems)
Trabalhavam com dados oriundos dos sistemas Trabalhavam com dados oriundos dos sistemas transaccionais da empresa -> optimizava o processo transaccionais da empresa -> optimizava o processo operacional, mas não o de análise de dados.operacional, mas não o de análise de dados.
10-04-23 3
Solução: Data Warehouse Solução: Data Warehouse (DW)(DW)
Definição inicial – “uma estrutura de Definição inicial – “uma estrutura de armazenamento central de dados, armazenamento central de dados, estruturada segundo um modelo Entidade-estruturada segundo um modelo Entidade-Associação (EA) e não-questionável”. Associação (EA) e não-questionável”. (Inmon, 1996)(Inmon, 1996)
Colecção de dados relacionados a alguma Colecção de dados relacionados a alguma área da empresa, organizados para dar área da empresa, organizados para dar suporte à decisão e baseados nas suporte à decisão e baseados nas necessidades de um determinado necessidades de um determinado departamento. (Inmon, 1998)departamento. (Inmon, 1998)
Fonte de dados para consulta da Fonte de dados para consulta da organização (Kimball, 1998)organização (Kimball, 1998)
10-04-23 4
Diferentes Abordagens Data Diferentes Abordagens Data Warehouse/MartsWarehouse/Marts
Inmon:Inmon: Data Warehouses e Data Marts (DM) têm Data Warehouses e Data Marts (DM) têm
estruturas essencialmente diferentes.estruturas essencialmente diferentes. Difícil integrar um conjunto de Data Marts e Difícil integrar um conjunto de Data Marts e
mesmo que se consiga não resultará num Data mesmo que se consiga não resultará num Data Warehouse. (1998)Warehouse. (1998)
Data Mart deriva do Data Warehouse.Data Mart deriva do Data Warehouse.
Kimball:Kimball: ““O Data Warehouse é constituído pela união O Data Warehouse é constituído pela união
de todos os seus Data Marts”. (Kimball de todos os seus Data Marts”. (Kimball 1997)1997)
10-04-23 5
Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts
Ambos concordam que:Ambos concordam que: A solução completa é muito complexa A solução completa é muito complexa
para ser feita de uma só vez.para ser feita de uma só vez. A sustentação do projecto depende da A sustentação do projecto depende da
entrega rápida de uma solução parcial entrega rápida de uma solução parcial que:que: agrade aos utilizadores;agrade aos utilizadores; justifique o seu investimento. (Gallas, 1999) justifique o seu investimento. (Gallas, 1999)
10-04-23 6
Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts
Kimball:Kimball: Prévia modelagem da organização.Prévia modelagem da organização. Implementação de um Data Mart de cada Implementação de um Data Mart de cada
vez.vez. Conformados de acordo com a modelagem.Conformados de acordo com a modelagem.
Inmon:Inmon: Prévia modelagem da organização.Prévia modelagem da organização. Implementação iterativa do Data Warehouse.Implementação iterativa do Data Warehouse.
O sistema começa pequeno e evolui O sistema começa pequeno e evolui progressivamente em espaços curtos de tempo. progressivamente em espaços curtos de tempo. (Inmon, 1998)(Inmon, 1998)
10-04-23 7
ConclusõesConclusões
A diferença de abordagem é mais A diferença de abordagem é mais relativa à terminologia utilizada do relativa à terminologia utilizada do que propriamente conceptual.que propriamente conceptual. Inmon:Inmon:
Refere-se ao Data Mart como uma colecção Refere-se ao Data Mart como uma colecção de dados derivada do Data Warehouse.de dados derivada do Data Warehouse.
Kimball:Kimball: O Data Mart é a própria unidade lógica do O Data Mart é a própria unidade lógica do
Data Warehouse.Data Warehouse. Estão a falar de coisas diferentes.Estão a falar de coisas diferentes.
10-04-23 8
Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts
Kimball:Kimball: Elementos Básicos de um DW :Elementos Básicos de um DW :
1.1. Fontes Operacionais de DadosFontes Operacionais de Dados2.2. Área de Retenção (Área de Retenção (Staging AreaStaging Area))3.3. Servidores de ApresentaçãoServidores de Apresentação4.4. Nível de Acesso do Utilizador FinalNível de Acesso do Utilizador Final
Ciclo de Vida Dimensional do Negócio:Ciclo de Vida Dimensional do Negócio: Planeamento e Gestão de ProjectoPlaneamento e Gestão de Projecto Definição dos Requisitos de NegócioDefinição dos Requisitos de Negócio Tracking:Tracking:
Data TrackData Track Technology TrackTechnology Track Application TrackApplication Track
InstalaçãoInstalação Melhoria e AmpliaçãoMelhoria e Ampliação
10-04-23 9
Elementos Básicos do Data Elementos Básicos do Data Warehouse - KimballWarehouse - Kimball
10-04-23 10
Ciclo de Vida Dimensional Ciclo de Vida Dimensional do Negócio - Kimballdo Negócio - Kimball
10-04-23 11
Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts
Inmon:Inmon: Recenseamento dos dadosRecenseamento dos dados Definição dos requisitosDefinição dos requisitos
Ciclo totalmente distinto da metodologia de Kimball.Ciclo totalmente distinto da metodologia de Kimball. Abordagem Top-Down centrada nos dados.Abordagem Top-Down centrada nos dados.
Actualmente:Actualmente: Introdução de uma fase de Organização Inicial do Projecto.Introdução de uma fase de Organização Inicial do Projecto.
Suaviza a excessiva dependência dos dados presente na proposta Suaviza a excessiva dependência dos dados presente na proposta inicial.inicial.
Âmbito, objectivos, áreas de assunto, abordagem e arquitectura.Âmbito, objectivos, áreas de assunto, abordagem e arquitectura. Em paralelo:Em paralelo:
Definição da Infra-Estrutura TécnicaDefinição da Infra-Estrutura Técnica Desenho PreliminarDesenho Preliminar Modelização dos DadosModelização dos Dados
As três fases anteriores convergem para a fase do Desenho As três fases anteriores convergem para a fase do Desenho Físico:Físico:
Processo iterativo de desenvolvimento do DW com um fluxo em Processo iterativo de desenvolvimento do DW com um fluxo em espiral.espiral.
10-04-23 12
Metodologia de Metodologia de Desenvolvimento de DW - Desenvolvimento de DW -
InmonInmon
10-04-23 13
Implementação de Data Implementação de Data Warehouses/MartsWarehouses/Marts
Inmon:Inmon: Ampliação do Modelo de Dados Corporativo:Ampliação do Modelo de Dados Corporativo:
Modelo de Dados de Alto Nível ou Diagrama Modelo de Dados de Alto Nível ou Diagrama Entidade - Associação.Entidade - Associação.
Modelo de Dados de Nível Intermédio.Modelo de Dados de Nível Intermédio. Modelo de Dados de Baixo Nível.Modelo de Dados de Baixo Nível.
O autor admite que os modelos dimensionais O autor admite que os modelos dimensionais constituem as estruturas mais adequadas ao constituem as estruturas mais adequadas ao acesso e integração dos utilizadores com os acesso e integração dos utilizadores com os conteúdos de um DW.conteúdos de um DW.
Acentua a actual convergência observada entre as Acentua a actual convergência observada entre as metodologias de Kimball e Inmon.metodologias de Kimball e Inmon.
10-04-23 14
Operational Data Store Operational Data Store (ODS)(ODS)
Inmon:Inmon: ““uma estrutura de armazenamento dos valores uma estrutura de armazenamento dos valores
actuais dos dados, orientada a um assunto, actuais dos dados, orientada a um assunto, integrada, volátil, contendo apenas dados integrada, volátil, contendo apenas dados corporativos detalhados.corporativos detalhados.
É em essência um sistema operacional, separado do DW.É em essência um sistema operacional, separado do DW. Suporta constantes acessosSuporta constantes acessos Actualizações operacionaisActualizações operacionais
Kimball:Kimball: O ODS contém dados integrados com O ODS contém dados integrados com
granularidade mais detalhada.granularidade mais detalhada. Pode ser utilizado para suporte do nível mais baixo do Pode ser utilizado para suporte do nível mais baixo do
DW.DW. É de facto parte do DW: constitui o front page de um DW É de facto parte do DW: constitui o front page de um DW
de Kimball. (Kimball 1998, 1997b) de Kimball. (Kimball 1998, 1997b)
10-04-23 15
Kimball Vs. Inmon Kimball Vs. Inmon (vantagens) (vantagens)
Bill InmonBill Inmon Ralph KimballRalph Kimball
Melhor definição estratégica do Melhor definição estratégica do projecto.projecto.
Infra-Estrutura mais adequada às Infra-Estrutura mais adequada às exigências de um SAD.exigências de um SAD.
DW Corporativo (DWC) modelizado DW Corporativo (DWC) modelizado segundo um modelo normalizado (EA):segundo um modelo normalizado (EA):
simplificação nos simplificação nos procedimentos de ETL;procedimentos de ETL; menor taxas de crescimento do menor taxas de crescimento do volume de dados.volume de dados.
DWC modelizados segundo modelo DWC modelizados segundo modelo desnormalizado (esquemas em desnormalizado (esquemas em galáxia):galáxia):
estrutura mais flexível, estrutura mais flexível, comportando mais facilmente as comportando mais facilmente as alterações nos sistemas fonte;alterações nos sistemas fonte; Desenvolvimento de modelos Desenvolvimento de modelos mais intuitivos e com melhor mais intuitivos e com melhor desempenho.desempenho.
Proporciona um recenseamento Proporciona um recenseamento integral dos sistemas fonte e integral dos sistemas fonte e conteúdos existentes na organização. conteúdos existentes na organização.
Abordagem Iterativa centrada nas Abordagem Iterativa centrada nas necessidades de informação.necessidades de informação.
Permite antecipar a entrega de Permite antecipar a entrega de resultados.resultados.
Desenvolve uma abordagem Desenvolve uma abordagem sistematizada e completa sobre os sistematizada e completa sobre os processos de integração.processos de integração.
Garante o maior envolvimento dos Garante o maior envolvimento dos utilizadores.utilizadores.
Metodologia mais vocacionada para Metodologia mais vocacionada para definição das componentes de back-definição das componentes de back-end.end.
Permite fasear os custos de Permite fasear os custos de investimento em infra-estrutura.investimento em infra-estrutura.
Proporciona um melhor Proporciona um melhor time to time to market market (maior ROI).(maior ROI).
Abordagem de implementação Abordagem de implementação totalmente integrada.totalmente integrada.
10-04-23 16
Kimball Vs. Inmon Kimball Vs. Inmon (desvantagens) (desvantagens)
Bill InmonBill Inmon Ralph KimballRalph Kimball
Abordagem Top-Down centrada nos dados, Abordagem Top-Down centrada nos dados, mais morosa e dispendiosa.mais morosa e dispendiosa.
Dificuldade em definir as dimensões e Dificuldade em definir as dimensões e factos conformes (consenso nos aspectos factos conformes (consenso nos aspectos essenciais à criação de um modelo de dados essenciais à criação de um modelo de dados corporativo segundo um esquema em corporativo segundo um esquema em galáxia).galáxia).
Maiores custos iniciais em TI.Maiores custos iniciais em TI. Esquemas em galáxia do DWC -> Esquemas em galáxia do DWC -> vertiginoso crescimento do volume de vertiginoso crescimento do volume de dados armazenado.dados armazenado.
Abordagem excessivamente centrada nos Abordagem excessivamente centrada nos dados (todo o processo de desenvolvimento dados (todo o processo de desenvolvimento depende da prévia conclusão do modelo depende da prévia conclusão do modelo corporativo dos dados:corporativo dos dados:
inviabiliza o envolvimento dos inviabiliza o envolvimento dos utilizadores no projecto;utilizadores no projecto; prolonga o período de ausência de prolonga o período de ausência de resultados.resultados. relega para segundo plano a relega para segundo plano a identificação das reais necessidades de identificação das reais necessidades de informação dos utilizadores.informação dos utilizadores.
Conduz à obtenção de procedimentos de Conduz à obtenção de procedimentos de ETL, mais complexos:ETL, mais complexos:
modelos dimensionais requerem modelos dimensionais requerem operações adicionais de transformação operações adicionais de transformação e agregação dos dados dos sistemas e agregação dos dados dos sistemas operacionais (usualmente operacionais (usualmente representados em modelos representados em modelos normalizados);normalizados); alterações ao nível dos sistemas alterações ao nível dos sistemas operacionais implicam alterações em operacionais implicam alterações em procedimentos dedicados a diferentes procedimentos dedicados a diferentes esquemas em estrelas de diferentes esquemas em estrelas de diferentes granularidades.granularidades.
Modelos normalizados -> Modelos normalizados -> pior pior desempenho analítico, sendo menos desempenho analítico, sendo menos adequados e intuitivos para os SAD.adequados e intuitivos para os SAD.
Processo de desenvolvimento fragmentado:Processo de desenvolvimento fragmentado: primeiro o DWC.primeiro o DWC. depois os Data Marts – dependem depois os Data Marts – dependem dos índices de utilização verificados no dos índices de utilização verificados no DWC.DWC.
10-04-23 17
BibliografiaBibliografia Tese Mestrado) Sistema de Apoio à Decisão para a Info Académica Tese Mestrado) Sistema de Apoio à Decisão para a Info Académica
do IST, Elsa Cardoso, 2003 (Cap. 3)do IST, Elsa Cardoso, 2003 (Cap. 3) (Livro) The Data Warehouse Lifecycle Toolkit: pratical techniques (Livro) The Data Warehouse Lifecycle Toolkit: pratical techniques
for building dimensional data warehouse , R. Kimball, Wiley 1996for building dimensional data warehouse , R. Kimball, Wiley 1996 (Livro) The Data Warehouse Lifecycle Toolkit: experts methods for (Livro) The Data Warehouse Lifecycle Toolkit: experts methods for
designing, developing, and deploying data warehouses, R. Kimball, designing, developing, and deploying data warehouses, R. Kimball, Wiley 1998Wiley 1998
(Livro) Building the data warehouse, W.H. Inmon, 3rd Edition, (Livro) Building the data warehouse, W.H. Inmon, 3rd Edition, Wiley, 2002Wiley, 2002
(Livro) Data Marts Does Not Equal Data Warehouse, 2 ed. New (Livro) Data Marts Does Not Equal Data Warehouse, 2 ed. New York: John Wiley & Sons , 1996. York: John Wiley & Sons , 1996.
(Artigo) (Artigo) Inmon vs KimballInmon vs Kimball, S. Gallas, DM Review 1999, , S. Gallas, DM Review 1999, http://www.dmreview.com/article_sub.cfm?articleID=1400http://www.dmreview.com/article_sub.cfm?articleID=1400
(Artigo) (Artigo) Differences of OpinionDifferences of Opinion, R. Kimball, M. Ross, March, 2004, , R. Kimball, M. Ross, March, 2004, cc (URL) (URL) www.dmreview.com (URL) (URL) http://www.inmoncif.com/ (URL) (URL) http://www.intelligententerprise.com/ (URL) (URL) http://www.dw-institute.com/