curso modelagem de dados

Download Curso Modelagem de Dados

If you can't read please download the document

Upload: leandro-araujo

Post on 03-Jul-2015

599 views

Category:

Documents


1 download

TRANSCRIPT

Tcnicas de anlise de dados A anlise de dados um conjunto de tcnicas com o objetivo de identificar, conceituar e estruturar os dados de uma empresa, de uma parte da empresa ou de um sistema. A anlise de dados nos ajuda a: Obter um melhor conhecimento do problema. Projetar adequadamente a base de dados. Organizar o compartilhamento dos dados e a integrao dos sistemas. Unificar a viso que a empresa tem dos dados. A anlise de dados forcene uma viso alternativa para analisarmos um sistema. // importante observar que existem dois pontos de vistas: viso das funes / viso dos dados. Os dados que um sistema processa so armazenados num conjunto de arquivos interrelacionados, ao qual damos o nome de base de dados. Para projetar adequadamente esta base de dados importante conhecer a estrutura e a natureza dos dados que devero ser armazenados. O enfoque convencional visa organizar as bases de dados de forma independente, com um nico banco de dados.. J no enfoque moderno, todos os sistemas compartilham de um nico banco de dados, de forma relacionada/ corporativa. No enfoque moderno, existe a preveno da inconsistncia dos dados. Muito tempo e esforo se perdem com discusses em torno de conceitos e, na hora da manuteno, aparecem problemas pelo desconhecimento do conchecimento do conceito que foi utilizado durante a modelagem. A anlise de dados se preocupa em conseguir um consenso entre os usurios a respeito do conceito dos dados no plano corporativo. A anlise de dados utiliza duas tcnicas: Normalizao dos dados uma tcnica formal, rigorosa e simples, de fcil aplicao, que visa a simplificao dos arquivos, mas no ajuda muito na investigao do problema. Modelagem entidade relacionamento uma tcnica menos formal, mas extremamente til para investigar as necessidades dos usurios em relao aos dados.

Normalizao dos Dados Pra que serve a normalizao? A tcnica de normalizao, usada para produzir arquivos mais simples e mais estveis. O que um arquivo normalizado? um arquivo dividido em diversos arquivos, afim de no haver problemas de inconsistncia, e ou alterao no mesmo.

Conceitos de Normalizao Para utilizar a tcnica de normalizao, preciso antes conhecer alguns conceitos fundamentais em que esta tcnica se baseia. Atributo: So os dados armazenados em um arquivo. Alguns atributos so opcionais, isto , em alguns casos, podem no estar presentes em um arquivo. Pode ser opcional no caso em que no interfere no cadastro. Ex: Em um arquivo de pedidos, pode ser que o pedido tenha sido feito diretamente pelo cliente, sem a interveno de um vendedor. Exemplo de atributo: Em um arquivo de funcionrios, um atributo poderia ser "Nome de solteira". Chave: um atributo ou um conjunto de atributos que identifica, de forma nica, cada registro do arquivo. Todo arquivo deve possuir uma chave. A funo da chave garantir a unicidade dos registros. Por exemplo, o cadastro de motoristas no Detran tem como chave o nmero da carteira de motoristas. No h dois motoristas com o mesmo nmero de carteira. A chave de um arquivo deve ser: nica. Universal. Imutvel. Chave nica: Uma chave deve ser nica, no podem existir dois registros com o mesmo valor para a chave. s vezes, ns precisamos utilizar uma combinao de atributos para garantir a unicidade da chave. Exemplo: Em um arquivo de pedidos, o nmero do pedido atribudo em sequncia em cada filial. Isto significa que em duas filiais diferentes podem existir pedidos com o mesmo nmero. Por isso, a chave, para ser nica, precisa ser a combinao do nmero da filial com o nmero do pedido. Chave Universal: Uma chave dita universal se existem valores para ela em todos os registros do arquivo. Por exemplo, se queremos utilizar o nmero do CNPJ como chave do nosso cadastro de clientes, devemos perguntar: Nossos clientes so somente pessoas jurdicas? No vendemos para pessoas fsicas? Todos os nossos clientes ts registro na Receita Federal? Possuem um nmero de CNPJ? Todos os nossos clientes so empresas brasileiras? Empresas estrangieras no so cadastradas no CNPJ. Chave Imutvel A outra caracterstica de uma boa chave que ela seja imutvel. Isto significa que se um valor para a chave atribudo a um registro, este valor no ser mais alterado. Por exemplo, se um cdigo dado a um vendedor quando ele cadastrado este nmero deve permanecer inalterado durante todo o tempo em que o mesmo permanecer no arquivo. Dependncia funcional: Dizemos que um atributo depende de outro (ou de outros) quando o seu valor deteminado pelo valor do outro. Por exemplo: o salrio de um funionrio depende da matrcula do funcionrio. "Isto , para determinar o salrio de um funionrio precisamos saber de que funionrio se tratam ou seja, precisamos saber qual a matrcula do funcionrio". A data de concluso de um curso feito por um funcionrio depende da matrcula do

funcionrio e do cdigo do curso. "Isto , a data de concluso do curso s pode ser determinada se soubermos de que funcionrio se trata e de que curso estamos falando. Um funcionrio pode ter realizado diversos cursos e o mesmo curso pode ter sido concludo por diversos funionrios." Aplicao de Regras Normalizando um arquivo. Eliminando atributos calculveis. Separando os atributos multivalorados. Definindo as chaves dos arquivos criados. Fazendo cada atributo depender da chave. Para normalizar um arquivo, seguimos um roteiro de trs passos: 1. Eliminar todos os atributos que possam ser calculados em funo de outros. 2. Implementar um arquivo, separando os atributos que ocorrem mais de uma vez. 3. Dividir o arquivo de tal maneira que cada atributo dependa exclusivamente da chave do arquivo a que pertence. Eliminando atributos calculveis Atributos calculveis mantidos em um arquivo so uma fonte de problemas. Cada vez que um dos dados que entram na frmula de clculo alterado, esses precisam ter os seus valores recalculados. O primeiro passo determina que devemos eliminar os atrivutos que possam ser calculados a partir dos demais atributos. Ex: Restante a pagar = valor total do pedido sinal. (Elimina-se o atributo restante a pagar) O arquivo de pedidos pode apresentar at 15 itens. Os dados que se repetem (referentes aos pedidos, ex: cdigo do produto; descrio do produto; quantidade; preo unitrio; etc...) precisam ser separados em outro arquivo.

Arquivo no normalizado Arquivo de pedidos Identificao do pedido Nmero da filial Nmero do pedido Data do pedido Nome da filial Endereo da filial Cdigo do vendedor Nome do vendedor CNPJ do cliente Nome do cliente Endereo do cliente Itens solicitados (15 itens por pedido) Cdigo do item Descrio do item Quantidade Preo unitrio Prelo total Valor total do pedido Imposto a recolher Sinal Restante a pagar

Arquivo normalizado Arquivo de pedidos Identificao do pedido Nmero da filial/ Nmero do pedido Descrio do item Data do pedido Cdigo do vendedor CNPJ do cliente Sinal Arquivo de itens solicitados Identificao do item solicitado Nmero da filial/ Nmero do pedido Cdigo do item Quantidade Arquivo de filiais Identificao da filial Nmero da filial Nome da filial Endereo da filial Arquivo de vendedores Identificao do vendedor Cdigo do vendedor Nome do vendedor Arquivo de clientes Identificao do cliente Nome do cliente Endereo do cliente Arquivo de itens Identificao do item Cdigo do item Descrio do item Preo unitrio

Se um arquivo est normalizado, observe que: Ele no contm nenhum atributo que possa ser calculado a partir de outros atributos. Ele no contm atributos que possam conter mais de um valor. Ele no possui nenhum atributo que no dependa exclusivamente de sua chave.

Exerccio: Locadora Normalizada Pedidos ID pedido Nmero do pedido ID DVD ID cliente Data de retirada Data de Devoluo Devolvido Clientes ID cliente Nmero de RG/ CPF/ Nmero do cadastro scio Nome do cliente Endereo do cliente Telefone/ Celular DVD ID DVD Ttulo Nmero de cadastro DVD ID Genero Duplo? Genero ID Genero Descrio

Clientes DVD -> Genero

MER O que a modelagem entidade-relacionamento? uma tcnica de anlise de dados que estabele a estrutura dos dados a partir da identificao dos objetos a respeito dos quais necessrio guardar informaes. Os principais componentes utilizados por sta tcnica so: As entidades Os relacionamentos entre as entidades os atributos das entidades e dos relacionamentos O produto final desta tcnica o modelo entidade-relacionamento. Este diagrama representa os objetos sobre os quais guardamos dados e os relacionamentos que existem entre eles.

O que so entidades? Os objetos ou "coisas" sobre os quais precisamos guardar dados so chamados entidades. Utilizando o exemplo do arquivo de pedidos das aulas anteriores, teramos como entidades: Os clientes Os pedidos Os produtos Os vendedores Descobrimos as entidades perguntando: "Sobre que coisas vamos precisar guardar informaes?" O que so relacionamentos: Os objetos ou entidades que ocorrem, na realidade, no ocorrem isolados. Eles se vinculam

uns aos outros, naquilo que chamamos relacionamentos. O que so atributos? Atributos so as propriedades das entidades e dos relacionamentos. Representam os dados que so armazenados a respeito dos objetos da realidade. Por exemplo, so atributos do cliente: Cdigo do cliente Nome do cliente Endereo do cliente Os atributos do pedido so, entre outros: Nmero do pedido Nmero da filial Data do pedido O modelo entidade relacionamento mostra as entidades representadas pelos retngulos, ligadas entre si pelos relacionamentos representados pelos losangos. Por exemplo, o modelo entidade relacionamento correspondente ao problema do arquivo de pedidos analisado nas aulas anteriores seria desta maneira: Cliente

Faz

Vendedor

tira

Pedido

recebe

Filial

solicita

Item

Conceito de Entidade: Entidades so objetos a respeito dos quais guardamos dados. Estes objetos podem ser: Pessoas; Coisas; Einstituies; Lugares; Conceitos; Quando analisamos um problema, ficamos atentos aos substantivos e aos nomes que aparecem. Eles so entidades potenciais. Identificando uma entidade: Para cada substantivo ou nome que julgarmos ser uma entidade, devemos fazer as seguintes perguntas: 1. H necessidade de guardar informaes sobre cada objeto? 2. H mais de um objeto deste tipo? 3. Existe uma chave capaz de identificar cada objeto unicamente? Para que um substantivo seja considerado uma entidade, a resposta a estas trs perguntas deve ser positiva. Exerccio Entidades: 1. Equipe; (Letra E+Nmero da carteirinha do tcnico) 2. Scio (n da carteirinha de scio) 3. Quadro de rbitros; 4. Juzes; (Letra J+N Carteirinha Juz)/* 5. Bandeirinhas; (Letra B+N Carteirinha Bandeirinha)/* Atributos e Chaves Conceito de Atributo - Cada um dos dados que guardamos a respeito de uma entidade Conceito de chave - Um ou mais atributos que possam identificar, de forma nica, cada objeto da Entidade. //A chave deve ser nica, universal e imutvel. Conceito de dependncia funcional O conceito de dependncia funcional que utilizamos na tcnica de normalizao, vale aqui tambm! Isso significa que todo atributo deve depender unicamente da chave da entidade, considere, por exemplo, a entidade jogador do probema do torneio. Critrios de identificao de atributos

Subentidades e Entidades Fracas Introduo aos conceitos de: Subentidades Uma entidade considerada subentidade de outra se a primeira um subconjunto da segunda entidade. Por exemplo, se para ser jogador, tcnico ou rbitro for necessrio primeiro ser scio do clube, ento jogador, rbitro, e tcnico so subentidades da entidade scio. Por outro lado, podemos dizer que um scio pode ser um scio titular ou um scio dependente. Quando definimos os atributos de uma subentidade, consideramos os atributos da qual ela deriva. Por exemplo, se a entidade jogador um subconjunto da entidade scio, todos os jogadores so scios. Portanto, todos os atributos de scio so tambm atributos de jogador. Ns s temos de nos preocupar com os atributos especficos de um jogador. Exemplo: Atributos de scio Nmero do scio Nome do scio Endereo do scio Data de nascimento Sexo Estado Civil Atributos de jogador Nmero do scio (chave) Equipe a que pertence Gols marcados Cartes amarelos Cartes vermelhos Gols sofridos (se for goleiro)

Todo jogador tem um nome, mas o atributo nome do jogador no necessrio porque jogador uma subentidade de scio e todos os atributos de scio so tambm, atributos de jogador. Repare que a chave de jogador "nmero do scio". Isso porque a chave de uma subentidade sempre a chave da entidade da qual ela derivada. /* //Modelo criado por mim Atributos de rbitro Nmero do scio (chave) Equipe de arbitragem Nmero de partidas em que atuou como rbitro Avaliao geral de atuaes em partidas */ Entidades Fracas Uma entidade fraca uma entidade cuja chave contm a chave de outra entidade. Por exemplo, a entidade pedido tem como chave: Nmero da filial Nmero do pedido O nmero da filial faz parte da chave para torn-la nica, uma vez que o nmero do pedido atribudo em cada filial. Mas, o nmero da filial a chave de outra entidade, filial. Por isso, dizemos que a entidade uma entidade fracam porque precisa usar a chave de outra entidade para tornar nica a sua chave. Atributos de tcnico Nmero do scio (chave) Equipe a que pertence Avaliao geral de atuao em partidas Status de satisfao da torcida

Processos de: Generalizao Este processo funciona no sentido inverso. Neste caso, examinamos duas ou mais entidades, descobrimos que vrios de seus atributos so comuns. Ento, consideramos que estas entidades so subconjuntos de uma mesma entidade. Exemplo: No caso do Aristocrata Country Club existem duas entidades: Cobrador Vendedor Observando melhor podemos notar que, tanto cobrador como vendedor tm atributos comuns, ou seja, so so subconjuntos de uma entidade maior. Tanto cobradores como vendedores so profissionais autnomos que trabalham para o clube recebendo comisso. Especializao Conceito de: Particionamento Relacionamentos Conceito de relacionamentos Relacionamento Os objetos do mundo real no ocorrem isolados. Eles se associam ou se vinculam uns aos outros. Esses vnculos so chamados de relacionamento. Por exemplo, cada ttulo pode estar vinculado a um ou mais scios e cada scio pode estar vinculado a um ou mais ttulos - Padro de nomeao de relacionamentos. Nome dos relacionamentos O nome que ns damos a um relacionamento sempre uma expresso que envolve os nomes das entidades e um verbo que indica a natureza do vnculo, no seguinte formato: entidade verbo entidade Por exemplo, o relacionamento entre scios e ttulos pode receber o nome: scio possui ttulo ou ttulo pertence a scio - Processo de identificao de relacionamentos Identificando Relacionamentos Para determinar se entre duas entidades existe um relacionamento, perguntamos: Existe um vnculo entre os objetos destas entidades? A partir de um objeto de uma entidade somos capazes de localizar um objeto associado na outra entidade? Exemplo: Dado um scio, eu sou capaz de localizar um ttulo? Resposta: Sim, preciso saber que ttulo ele possui. Dado um ttulo, eu sou capaz de localizar um scio? Resposta: Sim, quero saber a que scio este ttulo pertence.

Exerccio propostoTtulos - emitidos; - vendidos; Scios - titulares - ID scio; - ttulo; - inadimplente? - dependentes; Mensalidade - emisso; - pagamento; Autnomos - vendedores; - cobradores; Cobrana - titulares; - inadimplente? - carta de cobrana; Cadastro - Nome completo; - Nome da me; - Endereo; - Endereo de correspondncia; - Telefone Res/Cel; - ID scio;