modulo 5 - estatistica.pdf
TRANSCRIPT
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 1/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil1
MÓDULO DE:
ESTATÍSTICA
AUTORIA:
FREDERICO GOMES CARVALHAES
Copyright © 2008, ESAB – Escola Superior Aberta do Brasi l
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 2/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil2
Módulo de: Estatística
Autoria: Frederico Gomes Carvalhaes
Primeira edição: 2009
CITAÇÃO DE MARCAS NOTÓRIAS
Várias marcas registradas são citadas no conteúdo deste módulo. Mais do que simplesmente listar esses nomes
e informar quem possui seus direitos de exploração ou ainda imprimir logotipos, o autor declara estar utilizando
tais nomes apenas para fins editoriais acadêmicos.
Declara ainda, que sua utilização tem como objetivo, exclusivamente na aplicação didática, beneficiando e
divulgando a marca do detentor, sem a intenção de infringir as regras básicas de autenticidade de sua utilização
e direitos autorais.
E por fim, declara estar utilizando parte de alguns circuitos eletrônicos, os quais foram analisados em pesquisas
de laboratório e de literaturas já editadas, que se encontram expostas ao comércio livre editorial.
Todos os direitos desta edição reservados à
ESAB – ESCOLA SUPERIOR ABERTA DO BRASIL LTDA
http://www.esab.edu.brAv. Santa Leopoldina, nº 840/07
Bairro Itaparica – Vila Velha, ES
CEP: 29102-040
Copyright © 2008, ESAB – Escola Superior Aberta do Brasil
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 3/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 4/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil4
Ementa
Histórico, conceitos, profissão e aplicações; Métodos Estatísticos; Variáveis Estatísticas;População e Amostra; Amostragem; Séries e Gráficos Estatísticos; Distribuição deFrequência; Medidas de Posição e Variabilidade; Assimetria e Curtose; Probabilidades;Distribuições de Probabilidade; Correlação e Regressão Linear.
Sobre o Autor
Frederico Gomes Carvalhaes é mineiro, natural de Belo Horizonte, residente em Vitória,
Espírito Santo. É graduado em Engenharia Elétrica e Matemática, pós-graduado em Gestão
de Negócios e Tecnologia da Informação e Mestre em Ciências Contábeis (Área
Administração Estratégica / Finanças). É aluno de Doutorado na COPPE/UFRJ, no Programa
de Planejamento Energético (Área Modelos Matemáticos aplicados à Energia). Possui vasta
experiência no Setor Elétrico, tendo trabalhado em empresas como CEMIG, ESCELSA e
ECOCEL. É consultor em energia, atuando na gestão da energia elétrica para grandes
indústrias, buscando otimizar seu uso e reduzir custos para as empresas. É tutor de
Educação à Distância, Professor Universitário e Coordenador de Curso de Pós-Graduação,
responsável por ministrar disciplinas como Matemática Aplicada, Matemática Financeira,
Estatística, Cálculo Atuarial, Métodos Quantitativos e Gestão de Energia Elétrica. Também
atua desenvolvendo projetos educacionais e ministrando palestras e cursos relacionados às
Ciências Exatas e Energia.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 5/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil5
SUMÁRIO
UNIDADE 1 ........................................................................................................... 8
Histórico da Estatística ....................................................................................... 8
UNIDADE 2 ......................................................................................................... 11
Métodos Estatísticos ........................................................................................ 11
UNIDADE 3 ......................................................................................................... 14
Fases do Método Estatístico ............................................................................ 14
UNIDADE 4 ......................................................................................................... 17
Variáveis Estatísticas ....................................................................................... 17
UNIDADE 5 ......................................................................................................... 20
Amostragem ..................................................................................................... 20
UNIDADE 6 ......................................................................................................... 25
Principais técnicas da Amostragem ................................................................. 25
UNIDADE 7 ......................................................................................................... 29
Séries Estatísticas ............................................................................................ 29
UNIDADE 8 ......................................................................................................... 32
Gráficos Estatísticos ........................................................................................ 32
UNIDADE 9 ......................................................................................................... 39
Distribuição de Frequência .............................................................................. 39
UNIDADE 10 ....................................................................................................... 43
Elementos de uma Distribuição de Frequência ............................................... 43
UNIDADE 11 ....................................................................................................... 47
Cálculo do número de classes (k) e intervalo de classes (hi) ......................... 47
UNIDADE 12 ....................................................................................................... 49
Medidas de Posição ......................................................................................... 49
UNIDADE 13 ....................................................................................................... 55
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 6/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil6
Medidas Separatrizes ...................................................................................... 55
UNIDADE 14 ....................................................................................................... 57
Medidas Separatrizes ...................................................................................... 57
UNIDADE 15 ....................................................................................................... 60
Medidas Separatrizes ...................................................................................... 60
UNIDADE 16 ....................................................................................................... 61
Medidas de Dispersão ou Variabilidade .......................................................... 61
UNIDADE 17 ....................................................................................................... 64
Medidas de Dispersão ou Variabilidade .......................................................... 64
UNIDADE 18 ....................................................................................................... 66
O coeficiente de variação (CV) ........................................................................ 66
UNIDADE 19 ....................................................................................................... 67
Escore padronizado (zi) ................................................................................... 67
UNIDADE 20 ....................................................................................................... 69
Medidas de Assimetria ..................................................................................... 69
UNIDADE 21 ....................................................................................................... 74
Medidas de Curtose ......................................................................................... 74
UNIDADE 22 ....................................................................................................... 78
Noções de Probabilidades ............................................................................... 78
UNIDADE 23 ....................................................................................................... 81
Probabilidade ................................................................................................... 81
UNIDADE 24 ....................................................................................................... 84
Exercícios resolvidos envolvendo o cálculo de Probabilidades ...................... 84
UNIDADE 25 ....................................................................................................... 93
Distribuições de Probabilidade ........................................................................ 93
UNIDADE 26 ....................................................................................................... 98
Distribuição Binomial ........................................................................................ 98
UNIDADE 27 ..................................................................................................... 100
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 7/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil7
Distribuição Normal ........................................................................................ 100
UNIDADE 28 ..................................................................................................... 106
Correlação ...................................................................................................... 106
UNIDADE 29 ..................................................................................................... 109
Correlação Linear ........................................................................................... 109
UNIDADE 30 ..................................................................................................... 114
Regressão Linear ........................................................................................... 114
GLOSSÁRIO ..................................................................................................... 119
BIBLIOGRAFIA ................................................................................................ 120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 8/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil8
UNIDADE 1
Objetivo: Apresentar e discutir o Histórico da Estatística e sua origem
Histórico da Estatística
Embora a palavra “Estatística” ainda não existisse, há indícios de que desde 3000 A.C. já se
faziam censos na Babilônia, China e Egito.
Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos,
de óbitos, faziam estimativas das riquezas individuais e sociais, distribuíam equitativamente
terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que,
hoje, chamaríamos de “estatísticas”.
A palavra “censo” deriva do latim “censere”, que significa taxar.
A palavra “estatística” deriva do latim “status”, que significa estado.
Assim, a Estatística servia como ferramenta administrativa nas mãos do Estado. Na Idade
Média colhiam-se informações, geralmente com a finalidade tributária ou bélica.
Já a partir do século XVI começaram a surgir os primeiros controles sistemáticos de fatos
sociais, como nascimentos, batizados, casamentos e funerais, dando origem às primeiras
tábuas e tabelas e aos primeiros números relativos.
Foi no século XVIII que os estudos de tais fatos foram adquirindo forma verdadeiramente
científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de
Estatística, determinando o seu objetivo e suas relações com as ciências.
No início do século XIX, os estudos estatísticos ganharam a contribuição de grandes
matemáticos. Nos trabalhos de dois deles, o francês Simon Laplace e o alemão Carl
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 9/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil9
Friedrich Gauss (1777-1855), surge a ideia de “Distribuição Normal de Frequência”. Essa
ideia levou a uma teoria muito útil para fazer previsões.
A teoria da distribuição normal foi usada pelo astrônomo e matemático belga Adolphe
Quételet (1796-1874), no estudo estatístico de diversas características das populações
humanas: altura, peso, natalidade, mortalidade, renda mensal, etc.
Ronald Aylmer Fisher (1890-1962), geneticista e estatístico britânico, concentrou seus
estudos na genética das populações, campo em que obteve importantes resultados, sendo
considerado um dos grandes criadores do neodarwinismo. Na Estatística trabalhou com
ajustes de curvas de frequências, com coeficientes de correlação, os chamados coeficientes
de Fisher, na análise de variância e nas técnicas de estimação de um parâmetro.
Influenciado pelos trabalhos de Karl Pearson, outro importante geneticista e estatístico
britânico, Fisher utilizou os resultados que obteve na Estatística como ferramentas para
aplicação nos seus estudos de genética, sendo hoje considerado um dos maiores nomes na
Teoria de Estatística e na Estatística aplicada à Biologia.
Assim, as tabelas tornaram-se mais completas, surgiram às representações gráficas e o
cálculo das probabilidades, quando a Estatística deixou de ser simples catalogação de dados
numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo
(população), partindo da observação de partes desse todo (amostras).
Atualmente o público leigo (leitor de jornais e revistas) se posiciona em dois extremos
divergentes e igualmente errôneos quanto à validade das conclusões estatísticas: ou crê em
sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os
objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, seja teórica ou
prática, ou a conhecem muito superficialmente.
A Estatística em diversas áreas vem avançando muito rapidamente e, com seus processos e
técnicas, tem contribuído para a organização dos negócios e para a evolução do mundo
moderno.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 10/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil10
A profissão do Estatíst ico
O Estatístico promove o levantamento de pesquisas estatísticas em suas aplicações técnicas
e científicas, investigando, elaborando e testando métodos matemáticos e sistema de
amostragem, bem como coletando, analisando e interpretando os dados relacionados com
os fenômenos estatísticos, e ainda estudando e renovando a metodologia estatística a fim de
estabelecer a sua evolução e desenvolvimento.
As especializações da profissão vinculam-se aos campos profissionais que exigem ou
permitem o exercício do estatístico. Elas resultam da prática profissional e decorrem quase
sempre da demanda decorrente no mercado de trabalho. São elas:
Demografia
Bioestatística
Estatístico Matemático
Estatístico de Estatística Aplicada
Principais cargos procurados:
Estatístico
Estatístico Matemático
Estatístico de Estatística Aplicada
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 11/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil11
UNIDADE 2
Objetivo: Apresentar e discutir os principais Métodos Estatísticos existentes.
Métodos Estatísticos
O método c ientífico
Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, pornecessidades práticas, sem aplicação de um método.
Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo.
Embora muito desse conhecimento possa ter sido observado inicialmente por acaso, a
verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais
conhecimentos.
Podemos então dizer que:
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim
que se deseja.
Dos métodos científicos, destacaremos o método experimental e o estatístico.
O método experimental
O método experimental consiste em manter constantes todas as causas (fatores), menos
uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso
existam.
É o método preferido no estudo da Física, da Química etc.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 12/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil12
O Método Estatístico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o método
experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o
fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa
que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinação das causas que definem o preço de uma
mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade
da mercadoria e verificar se tal fato iria influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores.
Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos
consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos
preços das outras necessidades, etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso,
denominado método estatístico.
O método estatístico, diante da impossibilidade de manter as causas constantes,
admite todas essas causas presentes variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
A Estat ística
Exprimindo por meio de números as observações que se fazem de elementos com, pelomenos, uma característica comum (por exemplo: os alunos do sexo masculino de uma
comunidade), obtemos os chamados dados referentes a esses elementos.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 13/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil13
Podemos dizer, então, que:
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados, para a utilização dos
mesmos na tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,
enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou
Inferencial.
Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da
organização e descrição dos dados (estatística do Ministério da Educação, estatística dos
acidentes de tráfego, etc.), desconhecendo que o aspecto essencial da Estatística é o de
proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados
obtidos inicialmente.
Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de
uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições
de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamentoobjetivo de ação.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 14/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil14
UNIDADE 3
Objetivo: Apresentar e discutir as Fases do Método Estatístico.
Fases do Método Estatístico
São verificadas no método estatístico as seguintes fases:
1. Coleta de dados
Após cuidadoso planejamento e a devida determinação das características mensuráveis do
fenômeno que se quer pesquisar, damos início à coleta dos dados numéricos necessários à
sua descrição.
A coleta pode ser direta ou indireta.
A coleta é direta quando feita sobre elementos informativos de registro obrigatório
(nascimentos, casamentos e óbitos, importação e exportação de mercadorias, etc) ou, ainda,quando os dados são coletados pelo próprio pesquisador através de inquéritos e
questionários, como é o caso das notas de verificação e de exames, do censo demográfico,
etc.
A coleta direta dos dados pode ser classificada relativamente ao fator tempo em:
Contínua (registro) → Quando feita continuamente, tal como a de nascimentos e
óbitos, frequência de alunos às aulas, etc.
Periódica → Quando feita em intervalos constantes de tempo, como os censos (de 10
em 10 anos), avaliações mensais dos alunos, etc.
Ocasional → Quando feita extemporaneamente, a fim de atender a uma conjuntura ou
a uma emergência, como no caso de epidemias, acidentes naturais, etc.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 15/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil15
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do
conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo,
podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos
por uma coleta direta.
2. Crítica dos dados
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas
e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam
influenciar sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou
má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os
elementos originais dos dados da coleta.
3. Apuração dos dados
É a operacionalização algébrica e o processamento dos dados obtidos e a disposição
mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.
4. Apresentação dos dados
Independentemente da finalidade da pesquisa, os dados devem ser apresentados sob forma
adequada através de tabelas ou gráficos, tornando mais fácil a análise daquilo que está
sendo objeto de tratamento estatístico para posterior obtenção de medidas típicas.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 16/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil16
5. Análise dos resultados
O objetivo da Estatística é tirar conclusões sobre o todo (população), a partir de informações
fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores
(Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da
Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos
desses resultados conclusões e previsões.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 17/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil17
UNIDADE 4
Objetivo: Apresentar e discutir as Variáveis Estatísticas, População e Amostra.
Variáveis Estatísticas
Variável é o conjunto de resultados possíveis de um fenômeno.
Pode ser classificada em:
Qualitativa => quando seus valores são expressos por atributos. Exemplo:
Sexo (masculino ou feminino)
Cor da pele (branca, preta, amarela, vermelha, parda, etc.)
Quantitativa => quando seus valores são expressos em números. Exemplo:
Salário
Idade
Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limitesrecebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes
a um conjunto enumerável recebe o nome de variável discreta ou descontínua.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 18/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil18
Exemplos:
Variável contínua =>Peso dos alunos de uma sala de aula
Variável discreta => Nº de alunos de uma sala de aula
Outros exemplos:
Cor dos olhos variável qualitativa
Índice de liquidez nas indústrias brasileiras variável quantitativa contínua
Produção de café no Brasil variável quantitativa contínua
Número de defeitos em aparelhos de TV variável quantitativa discreta
Comprimento dos pregos de uma caixa variável quantitativa contínua
O ponto obtido em cada jogada de um dado variável quantitativa discreta
População e Amostra
Ao conjunto finito ou infinito de elementos que possuem PELO MENOS UMA característica
comum denominamos população estatística ou universo estatístico.
Assim, os jogadores de futebol, por exemplo, constituem uma população, pois apresentam
pelo menos uma característica comum: são aqueles que jogam futebol.
Entretanto, na maioria das vezes, por impossibilidade ou inviabilidade econômica ou
temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma
parte da população. A essa parte proveniente da população em estudo denominamos
amostra.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 19/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil19
Assim, amostra é qualquer conjunto finito e não vazio de uma população, ou seja, uma
subcoleção.
Verificamos, então, que a Estatística Indutiva tem por objetivo tirar conclusões sobre as
populações, baseada em resultados verificados nas amostras retiradas destas populações.
Entretanto, para que as inferências estejam corretas, é necessário garantir que a amostra
seja representativa da população, isto é, a amostra deve possuir as mesmas características
básicas da população, no que diz respeito ao fenômeno que será pesquisado. Dessa forma,
é necessário que a amostra a ser usada seja obtida por processos adequados.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 20/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil20
UNIDADE 5
Objetivo: Apresentar e discutir Amostragem e as principais técnicas existentes.
Amostragem
É a técnica utilizada para recolher amostras, que garante, tanto quanto possível, o acaso na
escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o
que garante à amostra o caráter de representatividade. Isto é muito importante pois as
conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras
dessa população.
Principais técnicas da Amost ragem
1. Amostra casual ou aleatór ia simples
Este tipo de amostragem é equivalente a um sorteio de loterias.
É realizada numerando-se a população de 1 a n e sorteando-se por meio de um dispositivo
aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos
pertencentes à amostra.
Exemplo:
Obter uma amostra representativa de 10% da população para a pesquisa de salários dos 90
funcionários de uma empresa.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 21/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil21
Procedimentos:
1. Numera-se os funcionários da empresa de 01 a 90;
2. Escreve-se os números, de 01 a 90, em pedaços iguais de um mesmo papel,
colocando-os dentro de uma caixa. Agita-se sempre a caixa para misturar bem os
pedaços de papel e retira-se, um a um, nove números que formarão a amostra, neste
caso, 10% da população.
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muitotrabalhoso. A fim de facilitá-lo, foi elaborada uma tabela - TABELA DE NÚMEROS
ALEATÓRIOS, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso
nas linhas e colunas.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 22/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil22
Para obtermos os elementos da amostra usando a tabela, escolhemos ao acaso um
algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou
6 3 1 2 4 4 4 2 7 0 9 2 6 1 0 6 6 3 9 4 4 3 5 0 1 8 8 7 8 2 4 9 4 6 0 1 8 7 4 3 3 5 6 2 6 2 0 4 3 1 9 3 6 0
1 1 1 9 7 1 3 8 9 8 7 5 6 6 8 3 2 3 8 4 1 0 2 3 4 6 4 3 4 1 9 9 8 4 0 1 2 4 5 8 1 5 7 7 1 4 2 5 6 8 1 8 3 5
8 4 1 9 1 8 5 3 8 2 4 0 7 9 7 6 2 9 0 4 9 5 4 9 9 8 5 7 8 1 0 5 8 1 0 4 7 0 8 7 6 6 9 6 7 5 5 0 1 5 9 6 3 9
3 5 9 9 6 9 1 8 9 9 4 2 2 0 8 7 9 1 6 3 1 1 6 1 4 2 3 6 5 1 6 5 9 9 2 9 8 5 7 2 2 3 5 3 9 3 0 4 4 8 9 9 2 2
0 9 2 2 5 4 0 0 3 2 1 5 1 6 4 8 0 3 9 4 4 9 7 8 9 5 3 6 7 0 0 0 4 0 9 6 5 5 1 8 7 2 0 3 6 1 8 6 9 9 2 1 2 9
6 2 1 8 5 4 6 6 0 6 6 8 9 5 6 6 0 9 1 4 9 7 6 1 0 4 2 1 3 5 3 4 6 8 5 5 5 8 7 4 8 5 9 6 2 3 4 5 9 4 8 2 9 2
9 1 1 2 4 4 4 1 6 6 1 5 9 1 5 9 2 9 4 0 3 1 8 1 7 7 8 3 4 3 7 8 2 8 7 4 0 1 0 5 8 7 4 1 0 2 1 2 2 7 2 3 2 4
2 0 6 5 2 2 3 8 7 2 1 6 9 4 8 4 1 0 5 0 8 5 1 0 8 4 7 5 0 4 0 5 4 3 8 5 7 7 0 1 1 5 5 4 6 4 2 5 0 1 3 2 4 3
5 9 0 2 4 8 4 2 0 3 2 8 2 4 0 3 0 7 9 3 6 8 7 2 5 9 6 2 4 4 0 5 6 6 2 4 3 2 8 5 7 9 8 0 7 0 1 4 3 4 3 4 9 2
1 8 1 1 7 3 4 7 4 4 2 2 8 6 2 7 1 6 1 9 9 9 3 8 9 8 7 8 8 9 1 6 7 1 9 0 1 3 5 5 0 0 0 0 6 9 3 6 2 2 8 2 4 7
8 4 1 5 0 9 6 0 5 0 9 5 6 7 1 5 3 4 2 2 6 8 4 2 9 7 5 8 7 6 6 5 6 4 8 9 6 4 0 7 7 1 3 0 7 3 4 0 3 2 1 5 9 4
5 8 7 1 3 4 5 8 2 2 2 7 2 9 6 5 0 0 2 2 9 3 7 8 3 3 4 8 7 3 7 1 7 8 1 5 7 0 0 4 8 8 6 1 8 1 8 1 8 3 7 2 6 77 8 2 4 7 9 9 7 5 3 1 0 1 4 8 1 9 9 6 5 8 2 6 8 4 6 0 5 8 6 5 5 9 0 7 9 5 3 2 0 2 7 7 1 1 2 4 0 6 8 7 7 3 2
8 7 0 4 6 8 8 2 8 6 5 3 5 2 6 9 6 9 3 6 2 9 2 5 5 0 5 8 7 3 8 0 1 3 0 7 2 7 6 6 4 1 6 8 1 1 4 8 3 4 2 6 3 0
8 8 2 4 9 8 2 5 4 1 8 3 2 7 1 9 2 6 6 2 6 3 6 4 4 9 0 4 6 9 5 9 2 0 2 3 7 9 1 2 1 1 9 1 8 3 2 5 0 8 3 8 0 3
1 9 8 6 2 0 0 2 6 9 0 8 1 2 6 7 4 8 5 1 7 8 8 9 8 6 1 3 1 2 4 4 0 2 0 6 3 4 1 7 6 7 8 8 8 9 3 6 6 0 9 8 0 7
8 0 0 7 8 4 5 9 2 1 7 0 5 6 3 0 0 2 9 7 2 3 4 6 8 6 8 8 1 8 1 0 7 1 5 5 6 6 1 2 3 0 3 8 6 2 1 8 8 8 2 6 9 8
5 5 9 8 5 3 5 5 5 0 6 3 6 0 1 4 1 3 2 6 9 3 4 3 0 7 3 2 6 7 6 0 4 3 7 0 5 4 7 0 7 6 2 7 8 1 5 4 3 4 2 3 4 1
0 3 7 1 1 4 2 4 1 3 2 7 8 3 6 4 2 4 6 2 5 6 2 3 4 0 2 9 6 0 6 8 4 9 1 0 3 9 5 9 5 1 3 5 7 3 5 6 1 2 7 5 0 2
1 9 2 5 1 7 7 2 9 7 4 1 8 0 9 9 4 7 0 9 3 4 3 7 1 3 8 3 8 4 7 3 7 9 4 6 9 6 5 6 1 7 9 7 2 1 9 7 7 4 3 9 3 3
9 5 6 3 7 3 3 3 1 7 4 9 5 8 4 8 6 4 2 8 6 3 4 7 6 4 2 4 5 6 9 0 8 7 5 8 1 9 7 5 5 7 7 7 9 0 8 9 4 2 0 3 9 5
3 6 0 6 0 7 2 6 1 5 2 0 3 9 1 2 8 4 6 7 4 3 8 0 2 1 1 9 9 6 1 3 3 2 5 1 9 4 9 1 0 6 1 1 7 9 2 7 1 6 4 8 3 6
7 7 0 6 5 5 8 6 0 3 6 4 7 9 0 3 1 0 1 3 8 8 3 2 2 1 1 9 2 6 3 5 5 2 9 5 0 1 0 2 5 3 7 0 3 4 0 9 5 4 2 3 2 4
9 7 9 5 1 5 2 9 6 7 7 7 0 6 3 7 7 2 3 0 0 5 1 7 5 8 0 9 8 1 6 4 6 2 6 9 8 1 7 8 3 0 3 4 6 2 9 0 9 3 5 7 6 4
2 3 5 0 4 0 0 0 1 2 8 1 7 3 5 7 0 9 8 3 8 2 6 0 9 7 4 6 3 2 2 1 0 2 5 5 4 7 4 8 2 1 1 3 7 5 2 4 1 4 1 4 2 0
2 6 3 7 2 3 0 3 1 2 5 6 7 0 7 6 0 7 7 8 1 1 5 7 4 4 9 1 2 7 7 8 0 9 7 3 8 7 6 6 6 6 4 1 0 2 6 9 1 4 2 5 4 3
5 2 2 1 2 6 5 0 5 0 4 3 2 2 9 0 5 2 4 2 8 0 0 4 9 1 9 9 9 7 9 6 4 7 8 2 7 6 5 3 4 6 7 8 4 9 1 7 6 6 0 6 0 5
0 9 6 6 2 1 7 9 5 9 9 9 6 6 2 1 6 8 5 3 9 4 0 0 0 5 0 8 9 0 9 2 5 3 1 3 6 2 5 8 4 7 9 0 2 4 4 5 3 4 3 8 4 34 9 7 9 9 4 7 9 0 7 8 5 9 8 9 7 9 8 5 5 2 4 6 5 7 6 3 3 1 9 0 8 6 2 3 2 7 2 4 5 4 1 5 0 9 7 2 2 3 5 6 8 8 6
5 1 1 5 9 6 0 5 9 0 4 2 4 9 9 0 5 4 4 2 0 6 0 0 1 1 8 6 9 9 0 9 0 5 2 7 5 1 8 0 1 5 0 7 9 5 9 0 6 2 6 5 6 3
6 7 5 5 9 8 1 2 3 1 6 8 2 1 6 2 1 5 0 5 9 8 5 3 3 6 6 5 3 6 5 2 9 0 4 1 8 3 9 3 1 0 6 1 8 7 5 6 5 1 3 4 0 5
5 5 0 0 9 8 2 6 7 4 1 2 8 7 4 4 4 0 2 9 4 3 3 4 7 8 9 5 9 6 4 8 4 1 2 8 6 8 3 9 3 1 4 3 8 5 2 6 3 3 3 5 8 4
4 2 0 6 2 4 8 0 5 8 4 5 5 0 4 0 0 5 3 3 0 2 2 4 8 1 5 7 2 3 4 6 4 6 4 0 7 8 3 7 9 5 0 4 7 4 2 4 8 0 6 9 2 5
8 2 5 6 9 4 7 8 0 5 6 1 6 0 7 3 0 5 9 3 9 1 3 7 4 3 9 7 5 8 5 9 6 0 3 3 2 0 8 1 8 7 2 9 1 6 5 9 3 4 3 5 9 9
9 3 1 1 8 8 0 2 0 9 8 6 5 6 3 8 9 1 3 4 9 1 8 7 5 2 9 4 5 9 9 5 4 3 5 3 0 2 4 0 3 6 5 8 8 0 1 7 5 7 5 7 1 2
0 4 6 6 1 2 3 4 4 6 0 2 9 8 6 3 5 1 1 3 7 2 5 2 7 1 5 9 5 3 4 2 8 6 1 9 7 3 0 8 9 1 8 7 4 9 6 2 5 2 9 2 4 2
1 9 0 2 7 7 5 9 2 3 4 0 8 1 0 6 4 7 0 7 5 8 7 8 8 1 6 4 8 0 9 6 0 8 5 1 4 4 6 6 4 3 0 3 1 0 9 6 0 0 5 6 3 9
5 9 0 5 6 4 6 9 9 4 2 5 8 8 5 1 8 7 6 8 5 3 5 3 1 3 0 2 1 6 8 8 1 5 3 0 2 1 7 4 8 3 1 2 8 0 6 2 7 3 9 2 5 2
9 6 5 7 6 9 3 2 5 6 1 8 1 6 6 5 0 3 7 9 0 8 4 0 5 8 9 3 7 8 7 2 4 9 3 7 7 3 6 6 8 4 6 1 5 0 7 4 3 8 0 3 2 4
7 6 7 3 0 6 3 9 9 8 7 9 6 6 3 9 8 4 5 3 7 5 8 0 1 0 2 1 6 6 5 4 9 5 5 2 8 8 7 1 0 4 6 3 7 5 7 7 4 4 2 7 8 2
6 3 7 5 0 1 6 5 9 9 9 1 8 4 2 4 8 3 2 6 8 2 2 8 1 6 1 3 8 3 5 8 5 9 0 9 6 3 3 4 0 0 8 7 6 7 7 4 2 4 8 8 6 8
0 5 1 3 2 6 4 2 8 7 5 6 5 9 5 8 1 0 3 7 9 4 9 3 8 0 7 1 3 3 8 8 2 2 1 5 0 6 6 6 9 7 8 3 8 6 5 4 7 4 0 1 4 1
0 5 6 2 0 3 8 3 7 4 9 5 7 2 3 5 0 5 0 2 5 8 2 4 1 4 6 1 0 1 0 5 3 7 5 7 3 7 8 7 5 1 0 4 6 5 9 2 4 1 7 7 6 5
5 4 9 8 8 6 3 0 7 4 1 7 0 2 9 6 3 9 4 6 4 3 5 2 0 8 8 5 3 4 9 5 5 3 9 3 6 4 8 9 2 2 0 8 1 8 8 4 7 4 6 5 9 2
1 8 8 0 5 9 4 3 5 7 1 0 9 6 7 9 8 5 1 1 9 6 1 3 2 1 9 0 9 0 0 6 9 2 9 2 1 6 4 4 7 0 3 9 1 9 0 6 7 1 0 6 5 9
4 6 4 1 6 3 4 7 7 4 6 0 6 1 7 5 7 4 2 3 3 6 3 7 1 5 2 0 9 0 7 2 3 1 9 6 8 6 5 1 5 5 3 4 9 5 4 6 0 5 8 0 2 1
6 2 2 3 8 4 6 3 0 6 7 7 7 1 9 5 1 6 0 3 7 9 5 1 0 4 4 6 2 0 8 2 7 0 6 4 7 0 2 2 4 6 4 0 3 3 6 5 3 2 2 9 9 2
6 2 6 8 2 3 7 5 7 9 3 0 5 3 2 2 2 3 7 0 2 5 2 9 8 5 5 4 6 3 9 5 1 3 9 2 2 8 9 0 8 3 9 7 5 1 5 6 2 9 4 2 2 1
4 2 0 4 7 9 3 4 5 0 1 9 9 7 6 8 4 6 5 0 1 1 3 0 7 5 8 5 7 1 7 3 4 1 4 6 8 9 7 9 2 8 7 0 3 1 1 4 4 2 0 3 5 7
5 1 3 2 3 5 3 9 9 8 4 4 4 3 7 5 8 9 2 6 2 0 6 3 9 7 0 8 3 5 0 3 8 7 2 3 2 1 2 9 1 0 5 9 7 5 5 0 5 2 8 9 7 7
6 6 5 3 3 6 0 3 0 4 3 2 1 4 8 2 8 1 5 1 6 9 5 2 6 6 4 1 6 6 7 4 3 2 5 3 7 2 2 4 5 9 4 1 1 8 6 9 8 4 4 6 3 8
6 8 8 0 8 7 3 6 8 6 7 4 0 2 8 6 0 8 3 3 4 4 9 5 6 9 1 0 4 2 0 5 3 2 2 7 9 2 1 8 7 2 0 8 4 3 5 0 5 5 7 4 1 7
6 4 6 7 5 9 2 4 4 5 4 5 0 7 4 1 9 8 2 4 5 8 1 6 8 9 6 9 9 5 4 0 0 6 3 5 1 6 9 3 0 1 5 5 1 1 2 4 8 7 6 5 9 8
TABELA DE NÚMEROS ALEATÓRIOS
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 23/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil23
mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita
antes de iniciado o processo.
O primeiro passo é definir o critério da leitura da tabela. Assim, consideremos, por exemplo,
a 6ª linha, tomando os números de dois algarismos (tantos algarismos quantos formam o
maior número da população), da esquerda para direita e de cima para baixo, e assim
sucessivamente. Obtivemos então:
62 18 54 66 06 68 95 66 09 14 97 61
Evidentemente, os numerais 95 e 97 serão desprezados, pois não constam da população,
como também será abandonado um numeral que já tenha aparecido, no caso o 66. Tem-se,
então:
62 18 54 66 06 68 95 66 09 14 97 61
Ou, reescrevendo:
62 18 54 66 06 68 09 14 61
Organizando os dados em uma ordem crescente, temos:
06 09 14 18 54 61 62 66 68
Estas foram as pessoas escolhidas para o critério adotado. Com base na listagem dos
funcionários, deve- se buscar posteriormente as informações salariais de cada um. Anota-se,
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 24/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil24
assim, os salários das pessoas correspondentes aos números sorteados, obtendo-se uma
amostra de 10% dos salários dos 90 funcionários da empresa.
Observe que não houve direcionamento na escolha (aleatoriedade) e todos os 90
funcionários tiveram a mesma chance de serem escolhidos, garantindo assim, a
representatividade da amostra.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 25/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil25
UNIDADE 6
Objetivo: Apresentar e discutir as principais técnicas de Amostragem.
Principais técnicas da Amostragem
2. Amostragem proporcional estratificada
Muitas vezes a população se divide em subpopulações - estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um
comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo,
convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional
estratificada, que, além de considerar a existência dos estratos, obtém os elementos da
amostra proporcional ao número de elementos dos mesmos.
Exemplo:
Supondo que no exemplo anterior, dos 90 funcionários, 54 sejam do sexo masculino e 36
sejam do sexo feminino, vamos obter a amostra proporcional estratificada de 10% da
população. São, portanto, dois estratos: sexo masculino e sexo feminino.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 26/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil26
Logo, teremos:
Sexo População 10% Amostra
Masculino 54 4,5100
5410
5
Feminino 36 6,3100
3610
4
TOTAL 90 0,9100
9010
9
Numera-se os funcionários da empresa de 01 a 90, sendo que de 01 v a 54 corresponderão
ao sexo masculino e de 55 a 90 ao sexo feminino. Como critério, estabeleceremos na
Tabela de Números Aleatórios a 3ª e 4ª colunas, de cima para baixo e da esquerda para a
direita, e assim sucessivamente.
Obtivemos então:
12 19 19 99 22 18 12 65 02 11 15 71 24 04
24 86 07 98 71 25 63
Da mesma forma, deveremos desprezar todos os numerais que não constam da população,
bem como aqueles que já tiverem sido selecionados. Também devemos parar a seleção para
um estrato quando já tiver sido preenchida sua quantidade de elementos necessários. Dessa
forma:
12 19 19 99 22 18 12 65 02 11 15 71 24 04
24 86 07 98 71 25 63
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 27/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil27
Ou, separando por estratos:
12 19 22 18 02 => Para o sexo masculino
65 71 86 63 => Para o sexo feminino
Organizando os dados em uma ordem crescente, teremos:
02 12 18 19 22 => Para o sexo masculino
63 65 71 86 => Para o sexo feminino
Estas foram as pessoas escolhidas para o critério adotado em cada estrato. Com base na
listagem dos funcionários, deve-se buscar posteriormente as informações salariais de cada
um. Anota-se, assim, os salários das pessoas correspondentes aos números sorteados em
cada estrato, obtendo-se uma amostra proporcional estratificada de 10% dos salários dos 90
funcionários da empresa, separados por sexo. Também pode ser verificada a aleatoriedade
na determinação da amostra, o que garante sua representatividade.
3. Amost ragem Sistemática
É uma seleção feita por algum critério preestabelecido, como, por exemplo, intervalos de
tempo para coleta, peças de uma linha de montagem, etc.
Quando os elementos da população já se acham ordenados, não há necessidade de
construir o sistema de referência.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 28/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil28
Exemplos:
Prontuários médicos de um hospital
Prédios de uma rua
Linhas de produção
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.
Assim, no caso de uma linha de produção, podemos, por exemplo, a cada dez itens
produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso,estaríamos fixando o tamanho da amostra em 10% da população.
Exemplo:
Suponha-se uma avenida contendo 900 prédios, dos quais desejamos obter uma amostra
formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como
1850
900
, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o
primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente
considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado
direito da rua, o 4º prédio, o 22º, o 40º, etc. , até voltarmos ao início da avenida, pelo lado
esquerdo.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 29/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil29
UNIDADE 7
Objetivo: Apresentar e discutir as principais Séries Estatísticas.
Séries Estatísticas
Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de
dados estatísticos em função da época, do local ou da espécie.
Numa série estatística, observamos a existência de três elementos ou fatores: o tempo, o
espaço e a espécie. Conforme varie um dos elementos da série, podemos classificá-la em
Histórica, Geográfica, Específica ou Mista.
1. Séries Temporais, Históricas, Cronológicas ou Marchas
São aquelas onde os dados são observados conforme época de ocorrência. Descrevem os
valores da variável em determinado local, discriminados segundo intervalo de tempo variável.
Exemplo:
Ano Vendas (RS)2001 22.600,002002 39.870,002003 51.240,002004 63.850,00
2005 90.730,002006 100.540,002007 123.190,002008 139.820,00
Vendas da Companhia "Vale Tudo"2001 - 2008
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 30/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil30
2. Séries Geográficas, Espaciais, Territoriais ou de Localização
São aquelas onde os dados são observados conforme a localidade de ocorrência.Descrevem os valores da variável em determinado instante, discriminados segundo regiões.
Exemplo:
3. Séries Específ icas ou Categóricas
São aquelas onde os dados são observados em determinado tempo e local, discriminados
conforme especificações ou categorias.
Exemplo:
Região QuantidadeNorte 542.863
Nordeste 947.321
Sudeste 1.589.647
Sul 754.294
Centro-Oeste 349.612
Vacinação contra doença "X"Brasil - 2006
Setor Industr ial Quantidade produzida (ton) Aço 789
Papel 247
Açúcar 6.587
Café 5.421
Chocolate 23.144Trigo 1.239
Soja 1.024
Carne 456
Granito 872
Produção média de cada operário por setor País " Z" - 2007
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 31/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil31
4. Séries Mistas ou Conjugadas
São aquelas onde os dados provenientes de duas ou mais séries são colocados em uma
única série.
Exemplo:
Região 2005 2006 2007Norte 11.300.493 12.989.073 15.463.182
Nordeste 20.800.020 23.908.069 28.461.987
Sudeste 38.413.867 44.153.870 52.564.131
Sul 26.074.207 29.970.352 35.678.991
Centro-Oeste 17.808.678 20.469.745 24.368.744
Aparelhos celulares em serviço no país " ÔMEGA"2005 - 2007
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 32/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil32
UNIDADE 8
Objetivo: Apresentar e discutir os principais tipos de Gráficos Estatísticos.
Gráficos Estatísticos
É um conjunto de figuras geométricas representativas dos fenômenos. O gráfico estatístico é
uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir uma
impressão mais rápida e viva do fenômeno em estudo.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais
para ser realmente útil:
Simplicidade => o gráfico não deve conter detalhes de importância secundária, assim
como de traços desnecessários que possam levar o leitor a uma análise demorada ou
errônea.
Clareza => o gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
Veracidade => o gráfico deve expressar a verdade sobre o fenômeno em estudo.
DIAGRAMAS são representações gráficas de séries estatísticas por intermédio de linhas e
superfícies. Dentre os principais diagramas, destacam-se:
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 33/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil33
1. Gráfico em linha ou em curva
É a representação gráfica de uma série estatística por meio de uma linha poligonal e constituiuma aplicação do processo de representação das funções num sistema de coordenadas
cartesianas. É a melhor representação para uma série temporal, onde se deve observar a
ordem cronológica das informações. É usada para mostrar a variação entre os valores de
uma série.
Exemplo:
Vendas (R$) da Companhia "Sucesso S/A"
100.000
110.000
120.000
130.000
140.000
150.000
160.000
170.000
180.000
190.000
200.000
2001 2002 2003 2004 2005 2006 2007 2008
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 34/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil34
2. Gráfico em colunas ou em barras
É a representação gráfica de uma série estatística por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais
aos respectivos dados.
Dessa forma, asseguramos a proporcionalidade entre as áreas dos retângulos e os dados
estatísticos.
Exemplos:
a. Gráfico em Colunas
Produção de Soja do País " Omega"
020.00040.00060.00080.000
100.000120.000140.000160.000180.000200.000
1990 1991 1992 1993 1994 1995 1996 1997
M i l T o n e l a d a s
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 35/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil35
b. Gráfico em Barras
Observações:
1. Sempre que as informações escritas das legendas forem extensas, devemos dar
preferência ao gráfico em barras (séries geográficas ou específicas). Porém, mesmo
assim for escolhido o gráfico em colunas, as informações das legendas devem ser
dispostas de baixo para cima, jamais o contrário.
2. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se
for geográfica ou categórica.
Exportações Brasileiras - Ano XX
0 500 1.000 1.500 2.000 2.500
Goiás
Santa Catarina
Pernambuco
Paraná
Espírito Santo
Ceará
Bahia
Rio de Janeiro
Minas Gerais
São Paulo
US$ milhões
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 36/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil36
3. Para uma melhor apresentação e visualização de informações, a distância entre as
colunas (ou barras) não deverá ser menor que a metade nem maior que dois terços da
largura (ou da altura) dos retângulos.
3. Gráfico em colunas ou em barras múltip las
É geralmente empregado quando queremos representar, simultaneamente, dois ou mais
fenômenos estudados com o propósito de comparação.
Exemplo:
Balança Comercial do País "Ômega"
0
10.000
20.000
30.000
40.000
2000 2001 2002 2003 2004
U S $ m i l h õ e s
Exportações Importações
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 37/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil37
4. Gráfico em setores ou circular (pizza)
É a representação gráfica de uma série estatística por meio de superfícies setoriais. É usado
para comparar os valores de uma série com a soma total.
O gráfico é construído com base em um círculo dividido em partes, onde cada ângulo central
é proporcional à frequência de cada variável.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total
da série corresponde à 360º.
Exemplo:
Região QuantidadeNorte 542.863
Nordeste 947.321
Sudeste 1.589.647
Sul 754.294
Centro-Oeste 349.612
TOTAL 4.183.737
Vacinação contra doença "X"Brasi l - 2006
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 38/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil38
Observações:
1. Para uma melhor apresentação e interpretação dos dados, o gráfico em setores sódeve ser empregado quando há, no máximo, sete dados.
2. Se a série já apresenta os dados percentuais, obtemos os respectivos valores em
graus multiplicando o valor do percentual por 3,6.
Vacinação contra doença "X" - Brasil - 2006
13%
23%
38%
18%
8%
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 39/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil39
UNIDADE 9
Objetivo: Apresentar e discutir os conceitos relacionados à Distribuição de Frequência.
Distribuição de Frequência
Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 alunos, que
compõem uma amostra dos alunos de uma Faculdade brasileira, resultando a seguinte
tabela de valores, dados em centímetros (cm):
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
A esse tipo de tabela, cujos elementos não foram numericamente organizados,denominamos tabela primitiva.
Partindo dos dados acima, é difícil averiguar em torno de que valor tende a se concentrar as
estaturas, qual a menor e qual é a maior estatura ou, ainda, quantos alunos se acham abaixo
ou acima de uma dada estatura.
Dessa forma, conhecidos os valores de uma variável, é difícil formarmos uma ideia exata do
comportamento do grupo como um todo, a partir dos dados não ordenados.
A maneira mais simples de se organizar os dados é através de certa ordenação (crescente
ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 40/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil40
Assim, obtemos o seguinte rol para os dados apresentados:
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Agora podemos obter com relativa facilidade qual é a menor estatura (150 cm) e qual é a
maior (173 cm). Podemos também determinar qual foi a amplitude de variação (173 - 150 =
23 cm) e, ainda, a ordem que um valor em particular da variável ocupa no conjunto.
Observamos também que há uma concentração das estaturas em algum valor entre 160 cm
e 165 cm e, mais ainda, existem poucos valores abaixo de 155 cm e acima de 170 cm.
Com base nas informações anteriores, podemos organizar o que chamamos de “Quadro de
Distribuição de Frequências”.
Definindo arbitrariamente, por exemplo, 6 classes, com intervalos de 4 cm, teremos:
ESTATURAS DE 40 ALUNOS
O símbolo “ ⌐ “ é um intervalo fechado à esquerda e aberto à direita. Por exemplo, na classe
2, em 154 ⌐ 158 , teremos todas as frequências de 154 (inclusive) até 158 (exclusive).
i Estaturas (cm) Freqüências (f i)
1 150 ⌐ 154 4
2 154 ⌐ 158 9
3 158 ⌐ 162 11
4 162 ⌐ 166 8
5 166 ⌐ 170 5
6 170 ⌐ 174 3
Σ f i = 40
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 41/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil41
Assim, ao invés de dizermos que a estatura de 1 aluno é 154 cm; de 4 alunos é de 155 cm;
de 3 alunos é de 156 cm; e de 1 aluno é de 157 cm, diremos que 9 alunos têm estaturas
entre 154, inclusive, e 158 cm, exclusive. Estaremos desse modo, agrupando os valores da
variável em intervalos, chamados em Estatística de classes.
Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas
perdemos em pormenores. Nos dados originais (chamados de dados desagrupados),
podemos verificar que 4 alunos têm 161 cm de altura e que não existe nenhum aluno com
171 cm de altura. Entretanto, no quadro acima (dados agrupados) não podemos ver se
algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que 11 alunos
têm a estatura compreendida entre 158 e 162 cm.
O que se pretende com a construção deste quadro é realçar o que há de essencial nos
dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição.
Recorde que a Estatística tem por finalidade específica analisar o conjunto de valores,
desinteressando-se por casos isolados.
A partir do quadro anterior, podemos elaborar um quadro mais completo, pelo qual será
possível extrair um maior volume de informações sobre a variável em estudo. Este quadro é
conhecido na Estatística como “Quadro de Distribuição de Frequências”, conforme abaixo:
QUADRO DE DISTRIBUIÇÃO DE FREQUÊNCIAS
i Classes (cm) x i f i fr i (%) Fi Fr i (%)
1 150 ⌐ 154 152 4 10,00 4 10,00
2 154 ⌐ 158 156 9 22,50 13 32,50
3 158 ⌐ 162 160 11 27,50 24 60,00
4 162 ⌐ 166 164 8 20,00 32 80,00
5 166 ⌐ 170 168 5 12,50 37 92,506 170 ⌐ 174 172 3 7,50 40 100,00
40 100TOTAL
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 42/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil42
Com este quadro, podemos observar, por exemplo, que existem 27,5% dos alunos com
estaturas entre 158 e 162 cm. Verificamos também que existem 80% dos alunos com
estaturas até 166 cm e que existem 33 alunos com estaturas entre 154 e 170 cm. Cada um
dos “elementos” deste quadro será detalhado a seguir.
Relação Estatística x Profissão
Como vimos, a Estatística possui grande importância para nossa formação. Dessa forma,
relacione a Estatística com sua profissão, destacando os principais pontos onde sua
aplicação é (ou poderia ser) relevante.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 43/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil43
UNIDADE 10
Objetivo: Apresentar e discutir os principais Elementos de uma Distribuição de Frequência.
Elementos de uma Distribuição de Frequência
1. Classes (i)
Classes de frequência ou simplesmente classes são intervalos de variação da variável.
São representadas simbolicamente por i, sendo i = 1, 2, 3, ... , k, onde k é o número total declasses da distribuição.
2. Limi tes de Classe
Denominamos limites de classe os extremos de cada classe.
O menor número é o limite inferior da classe ( i
) e o maior número, o limite superior daclasse (Li).
3. Ampl itude de um intervalo de classe (hi)
Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do
intervalo que define a classe.
É obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi.
Assim:
hi = Li - i
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 44/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil44
4. Amplitude total da distr ibuição (AT)
É a diferença entre o limite superior da última classe (limite superior máximo) e o limiteinferior da primeira classe (limite inferior mínimo):
AT = Lmáx - mín
5. Amplitude Amostral (AA)
É a diferença entre o valor máximo e o valor mínimo da amostra.
AA = xmáx - xmín
6. Ponto médio de uma classe (xi)
Como o próprio nome indica, é o ponto que divide o intervalo de classe em duas partes
iguais. Para obtermos o ponto médio de uma determinada classe, calculamos a soma doslimites da classe e dividimos por 2, ou seja:
2
Lx iii
O ponto médio de uma classe é o valor que a representa.
7. Frequência simples ou absoluta (fi)
Frequência simples ou frequência absoluta ou, simplesmente, frequência de uma classe ou
de um valor individual é o número de observações correspondentes a essa classe ou a esse
valor.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 45/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil45
Obviamente, a soma de todas as frequências é igual ao número total de observações n.
8. Frequência relativa (fri)
É o valor da razão entre a frequência simples e a frequência total.
9. Frequência acumulada (Fi)
É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma
dada classe.
10. Frequência acumulada relativa (Fri)
Frequência acumulada relativa de uma classe é a frequência acumulada da classe, dividida
pela frequência total da distribuição.
nf k
1i i
n
if
if
if
ifr
Fi = f 1 + f 2 + f 3 + ... + f k
niF
if iFiFr
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 46/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil46
Antes de dar continuidade aos seus estudos é fundamental que você acesse sua
SALA DE AULA e faça a Atividade 1 no “link” ATIVIDADES.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 47/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil47
UNIDADE 11
Objetivo: Apresentar e calcular o Número de Classes e Intervalo de Classes de umaDistribuição.
Cálculo do número de classes (k) e intervalo de classes (hi)
É a primeira preocupação na construção de uma distribuição de frequências. No exemplo
anterior, foi o valor de k foi arbitrariamente usado como sendo 6 e hi como 4 cm. Entretanto,vamos agora aprender a calcular estes valores, o que não necessariamente será o mesmo
valor arbitrado anteriormente.
Para determinação do nº de classes de uma distribuição podemos utilizar a Regra de
Sturges, que nos dá o nº de classes em função do número de valores da variável:
Em que k é o número de classes e n é o número total de dados.
Quando o resultado não for exato, iremos sempre arredondá-lo para mais,
independentemente do valor decimal encontrado.
Uma vez encontrado o número de classes da distribuição, devemos determinar a amplitude
do intervalo de classes (hi). Obtemos o valor de hi dividindo o valor da amplitude amostral
(AA) pelo valor de k.
2
n1k
log
log
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 48/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil48
Assim, temos:
Também iremos manter o critério de arredondamento para mais para facilitar nossos
cálculos, na medida do possível.
Para o exemplo das estaturas dos alunos, temos:
n = 40 alunos
7321928093,51
301029996,0
602059991,1
2log
40log1k
Observe que foi feito um arredondamento matemático para mais, independente do valor
decimal encontrado.
Para o cálculo de hi, temos:
AA = 173 - 150 = 23 cm
4285714286,3723
kAA
hi
Observe que também foi feito um arredondamento matemático para mais, independente do
valor decimal encontrado.
Assim, teríamos para o exemplo anterior os valores calculados de k = 7 classes e hi = 4 cm.
Conforme foi dito, inicialmente não existia a preocupação em se calcular k, que havia sido
arbitrariamente definido como 6.
Sempre que for solicitada a aplicação da Fórmula de Sturges, deverão ser considerados k e
hi calculados.
k
AAih
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 49/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil49
UNIDADE 12
Objetivo: Apresentar e discutir as principais Medidas de Posição.
Medidas de Posição
O estudo que fizemos sobre as distribuições de frequências, até agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma variável pode assumir. Dessa
forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é,
se ela se localiza no início, no meio ou no final, ou ainda, se há uma distribuição por igual.
Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou
em confronto com outras, necessitamos introduzir conceitos que se expressem através de
números, que nos permitam traduzir essas tendências.
As medidas de posição são dados que nos orientam quanto à posição da distribuição em
relação ao eixo horizontal (eixo das abscissas).
Dentre as medidas de posição mais importantes estão as medidas de tendência central, que
recebem tal nome pelo fato dos dados observados tenderem, em geral, a ser agrupar em
torno dos valores centrais.
Destacamos:
Média Aritmética;
Mediana;
Moda.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 50/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil50
As outras medidas de posição são as separatrizes, que englobam:
A própria mediana;
Os quartis;
Os decis;
Os percentis.
1. Média Aritmética ( x )
É o quociente da divisão da soma dos valores da variável pela quantidade de variáveis.
Para dados não agrupados, temos:
nx
x i
Para dados agrupados, temos:
i
ii
f f x
x
Sendo:
x => média aritmética
xi => cada valor da variável, de ordem i
n => número de valores
fi => frequência simples, de ordem i
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 51/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil51
A média é utilizada quando desejamos obter a medida de posição que possui maior
estabilidade
2. Moda (Mo)
É o valor que ocorre com maior frequência em uma série de valores.
Por exemplo, o salário modal de uma empresa é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados desta empresa.
Nos dados não agrupados, podemos encontrar séries que não possuam valor modal (série
amodal). Em contra-partida, podem haver dois ou mais valores de concentração de uma
variável. Nestes casos, a série é chamada de bimodal, trimodal, tetramodal, etc .
Para dados agrupados, a moda é o ponto médio da classe modal, ou seja, da classe de
maior frequência.
A moda é utilizada quando:
Desejamos obter uma medida rápida e aproximada de posição;
A medida de posição deve ser o valor mais típico da distribuição.
3. A mediana ( Md )
É definida como o número que se encontra no centro de uma série de números, estando
estes dispostos segundo uma ordem.
É o valor situado de tal forma no conjunto de dados que o separa em dois subconjuntos de
mesmo número de elementos.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 52/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil52
Para dados não agrupados, se a série tiver número ímpar de elementos, a mediana é,
obviamente, o valor central da série, disposta em uma determinada sequência.
Se a série tiver um número par de elementos, a mediana será, por definição, qualquer dos
números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o
ponto médio dos valores centrais.
3.1 Mediana para dados agrupados
O problema consiste em determinar o ponto do intervalo em que está compreendida a
mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha à mediana - classe
mediana. Tal classe será, evidentemente, àquela correspondente à frequência acumulada
imediatamente superior a 2
f i
.
Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os
valores se distribuam uniformemente em todo o intervalo de classe.
Interpolação => Inserção de uma determinada quantidade de valores entre dois números
dados.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 53/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil53
Veja o exemplo:
ESTATURAS DE 40 ALUNOS DE UMA FACULDADE
i Classes (cm) x i f i fr i (%) Fi Fr i (%)
1 150 ⌐ 154 152 4 10,00 4 10,002 154 ⌐ 158 156 9 22,50 13 32,503 158 ⌐ 162 160 11 27,50 24 60,004 162 ⌐ 166 164 8 20,00 32 80,005 166 ⌐ 170 168 5 12,50 37 92,506 170 ⌐ 174 172 3 7,50 40 100,00
40 100TOTAL
Classe mediana
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20 lugar, a partir do início da série, vemos que este deve
estar localizado na terceira classe (i = 3), supondo que as frequências destas classes
estejam uniformemente distribuídas.
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a
partir do limite inferior, a distância:
54,21128
7114
1320114
A mediana será dada por: Md = 158 + 2,54 = 160,54 cm
Na prática, executamos os seguintes passos:
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 54/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil54
1. Determinamos as frequências acumuladas;
2. Calculamos2
if
;
3. Marcamos a classe correspondente à frequência acumulada imediatamente superior à
2if
(classe mediana) e, em seguida, empregamos a fórmula:
Na qual:
*
é o limite inferior da classe mediana;
F(ant) é a frequência acumulada da classe anterior à classe mediana;
f* é a frequência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.
Empregamos a mediana quando:
1. Desejamos obter o ponto que divide a distribuição em partes iguais;
2. Há valores extremos que afetam a média de uma maneira acentuada;
3. A variável em estudo é salário.
*f
*h)ant(F2
if
*Md
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 55/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil55
UNIDADE 13
Objetivo: Apresentar e discutir as Medidas Separatrizes – Quartis.
Medidas Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No
entanto, ela apresenta outra característica, tão importante quanto à primeira: ela separa a
série em dois grupos que apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana
relativamente à sua segunda característica, já que se baseiam em sua posição na série.
Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana,
conhecidas pelo nome genérico de medidas separatrizes.
1. Os quart is
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há,
portanto, três quartis:
O primeiro quartil (Q1)
Valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e
as três quartas partes restantes (75%) são maiores.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 56/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil56
O segundo quartil (Q2)
Evidentemente, coincide com a mediana (Q2 = Md ).
O terceiro quartil (Q3)
Valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores
que ele e uma quarta parte (25%) é maior.
Quando os dados estão agrupados, para determinar os quartis usamos a mesma técnica do
cálculo da mediana, bastando substituir, na fórmula da mediana, 2
if
por:
sendo k o número de ordem do quartil.
Assim, temos:
*f
*h)ant(F4
if k
*kQ
4if k
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 57/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil57
UNIDADE 14
Objetivo: Apresentar e discutir as Medidas Separatrizes – Decis.
Medidas Separatrizes
2. Os decis
Denominamos decis os valores de uma série que a dividem em dez partes iguais. Há,portanto, dez decis:
O primeiro decil (D1)
Valor situado de tal modo na série que 10% dos dados é menor que ele e 90% restantes são
maiores.
O segundo decil (D2)
Valor situado de tal modo na série que 20% dos dados é menor que ele e 80% restantes são
maiores.
O terceiro decil (D3)
Valor situado de tal modo na série que 30% dos dados é menor que ele e 70% restantes são
maiores.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 58/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil58
O quarto decil (D4)
Valor situado de tal modo na série que 40% dos dados é menor que ele e 60% restantes são
maiores.
O quinto decil (D5)
Valor situado de tal modo na série que 50% dos dados é menor que ele e 50% restantes são
maiores. Evidentemente, coincide com a mediana (D5 = Q2 = Md ).
O sexto decil (D6)
Valor situado de tal modo na série que 60% dos dados é menor que ele e 40% restantes são
maiores.
O sétimo decil (D7)
Valor situado de tal modo na série que 70% dos dados é menor que ele e 30% restantes sãomaiores.
O oitavo decil (D8)
Valor situado de tal modo na série que 80% dos dados é menor que ele e 20% restantes são
maiores.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 59/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil59
O nono decil (D9)
Valor situado de tal modo na série que 90% dos dados é menor que ele e 10% restantes são
maiores.
O décimo decil (D10)
Valor situado de tal modo na série que 100% dos dados é menor que ele e 0% restantes são
maiores (ou seja, nenhum é maior).
O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém a fórmula 2if
será substituída por:
Sendo k o número de ordem do decil.
Assim, temos:
*f
*h)ant(F10
if k
*kD
10if k
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 60/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil60
UNIDADE 15
Objetivo: Apresentar e discutir as Medidas Separatrizes – Percentis.
Medidas Separatrizes
3. Os percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes
iguais.
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula
2if
será substituída por:
sendo k o número de ordem do percentil.
Assim, temos:
*f
*h)ant(F100
if k*
kP
100if k
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 61/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 62/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil62
Calculando a média aritmética de cada um desses conjuntos, obtemos:
705
350nx
x i
;
705
350ny
y i
;
705
350nz
z i
;
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que
todos os valores são iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação
entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de
uma variável em torno de um valor de tendência central tomado como ponto de comparação,
podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto
Y apresenta uma dispersão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística
recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficientede variação.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 63/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil63
Ampl itude Total
Para dados não agrupados
É a diferença entre o maior e o menor valor observado.
Para dados agrupados
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da
série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a
idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou
variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um
dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a
compreensão popular é mais importante que a exatidão e a estabilidade.
AT = x(máx) – x(mín)
AT = L(superior) – (inferior)
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 64/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil64
UNIDADE 17
Objetivo: Apresentar e discutir as Medidas de Dispersão ou Variabilidade – Variância eDesvio Padrão.
Medidas de Dispersão ou Variabilidade
Variância e Desvio Padrão
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos,
que são, na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em
consideração a totalidade dos valores da variável em estudo, o que faz delas índices de
variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a
média aritmética dos quadrados dos desvios. Assim, representando a variância por s 2,temos:
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um nº em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é uminconveniente.
n
xxf
xxs
2i
i
2i2
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 65/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil65
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,
denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:
Assim, teremos que:
Desvio padrão:
n
xxs
2i
(Para população)
Quando nosso interesse não se restringe à descrição dos dados, mas, partindo da amostra,
visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em utilizarmos o divisor n - 1 no lugar de n.
Assim, teremos:
Desvio padrão:
1n
xx
s
2i
(Para amostra)
Desvio padrão para dados agrupados
Analogamente ao caso da média, o desvio padrão de um conjunto de dados agrupados é
dado por:
Desvio padrão na amostra:
2ss
1n
x.nf .xs
2i
2i
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 66/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil66
UNIDADE 18
Objetivo: Apresentar e discutir o Coeficiente de Variação.
O coefic iente de variação (CV)
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas
unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 300;
no entanto, se a média for igual a 30, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade de medida dos dados
limita o seu emprego quando desejamos comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou
variabilidade dos dados em termos relativos a seu valor médio. Toma-se então uma medida
relativa da variabilidade, comparando o desvio padrão com a média. Esta medida é ocoeficiente de variação (CV).
Já vimos que o desvio padrão tem a mesma unidade de medida que os dados, de modo queo coeficiente de variação é adimensional.
A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de
diferentes conjuntos de dados.
100xs
CV
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 67/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil67
UNIDADE 19
Objetivo: Apresentar e discutir o Escore Padronizado.
Escore padronizado (zi)
No contexto de um único conjunto de dados, o desvio padrão pode ser interpretado
intuitivamente como unidade natural de dispersão de dados. Esta interpretação é utilizada na
construção de “escores padronizados”, de larga aplicação em medidas educacionais.
Por exemplo, em uma escala de 0 a 10, a nota 6 em uma prova em que a nota máxima foi
6 é muito mais do que a mesma nota 6 em uma prova em que a nota máxima foi 9. Uma
forma de captar essa diferença é considerar a nota do aluno como a sua posição relativa no
grupo, medida por:
, onde zi é o que se chama “escore padronizado”
Dessa forma, estamos comparando a nota do aluno com a média do grupo, ou seja, estamos
considerando o afastamento da nota em relação à média, tomando esta como origem. Ao
dividirmos aquela diferença pelo desvio padrão s, estamos tomando o desvio padrão como
unidade ou padrão de medida. Daí o nome desvio padrão.
s
xxz i
i
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 68/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil68
Aplicação das Ferramentas no dia a dia
De acordo com o que você aprendeu, como poderíamos aplicar as ferramentas e métodos
estatísticos em seu dia a dia ? Quais rotinas ou processos poderiam ser melhorados? Como?
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 69/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil69
UNIDADE 20
Objetivo: Apresentar, discutir e calcular as Medidas de Assimetria.
Medidas de Assimetria
Você já ouviu falar dessas medidas ? Sabe como calculá-las? Vamos estão estudá-las nesta
unidade.
Chamamos de assimetria o grau de desvio ou afastamento da simetria de uma distribuição
(média e moda).
As medidas podem ser simétricas ou assimétricas. Elas são simétricas quando os valores da
Média e Moda se coincidem. Quando a média é menor que a moda, a medida é assimétrica
à esquerda ou negativa. Quando a média é maior que a moda, a medida é assimétrica à
direita ou positiva. Naturalmente, quanto mais próxima de zero for a medida de assimetria,
mais simétrica será a distribuição.
Os conceitos de assimetria de uma curva de frequência estão ilustrados nos gráficos abaixo:
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 70/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil70
Baseando-se nas relações entre a Média e a Moda, podemos determinar o tipo de
assimetria.
Se tivermos:
x – Mo = 0 => assimetria nula ou distribuição simétrica
x – Mo < 0 => assimetria negativa ou à esquerda
x – Mo > 0 => assimetria positiva ou à direita
onde:
x = Média
Mo = Moda
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 71/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil71
Exemplos:
1. Suponhamos os seguintes valores: x = 18 e Mo = 18.
Temos nesse caso uma distribuição simétrica, pois x – Mo = 18 – 18 = 0
2. Suponhamos os seguintes valores: x = 14,3 e Mo = 17.
Temos nesse caso uma distribuição assimétrica negativa, pois x – Mo = 14,3 – 17 = –
2,7
3. Suponhamos os seguintes valores: x = 15,1 e Mo = 12.
Temos nesse caso uma distribuição assimétrica positiva, pois x – Mo = 15,1 – 12 =
3,1
Coeficiente de Assimetria de Pearson
Nessa medida de coeficiente, podemos verificar se a assimetria é moderada, fraca ou forte,por meio da fórmula:
s
Mdx3As
, em que:
As = Coeficiente de Assimetria de Pearson
x = Média
Md = Mediana
s = Desvio-padrão
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 72/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil72
Após calcular os valores da média, mediana e desvio-padrão, basta aplicar na fórmula
anterior para se obter o Coeficiente de Assimetria de Pearson.
A assimetria é considerada moderada se o módulo do resultado encontrado estiver entre
0,15 e 1, ou seja, se 0,15 < |As| < 1. Se 0 < |As| ≤ 0,15 , temos uma assimetria fraca e,
caso |As| ≥ 1, então a assimetria é considerada forte.
Assim, temos:
As = 0 ⇒ temos uma simetria
0 < |As| ≤ 0,15 ⇒ temos uma assimetria fraca
0,15 < |As| < 1 ⇒ temos uma assimetria moderada
|As| ≥ 1 ⇒ temos uma assimetria forte
Exemplos:
1. Considere os valores: x = 10, Md = 10 e s = 4,8. Calcule o coeficiente de assimetria.
s
Mdx3As
0
8,403
8,410103
As
Como As = 0, temos neste caso uma simetria.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 73/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil73
2. Considere os valores: x = 14,5 , Md = 15,2 e s = 4,2. Calcule o coeficiente de
assimetria.
s Mdx3As
5,0
2,41,2
2,47,03
2,42,155,143
As
Como As = – 0,5 e 0,15 < |As| < 1, temos neste caso uma assimetria negativa moderada.
3. Considere os valores: x = 11,6 , Md = 10,62 e s = 2,1. Calcule o coeficiente de
assimetria.
s
Mdx3As
4,1
1,294,2
1,298,03
1,262,106,113
As
Como As = 1,4 e |As| ≥ 1, temos neste caso uma assimetria positiva forte.
Antes de dar continuidade aos seus estudos é fundamental que você acesse suaSALA DE AULA e faça a Atividade 2 no “link” ATIVIDADES.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 74/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil74
UNIDADE 21Objetivo: Apresentar, discutir e calcular as Medidas de Curtose.
Medidas de Curtose
Você já ouviu falar dessas medidas ? Sabe como calculá-las ? Vamos estão estudá-las nesta
unidade.
Chamamos de Curtose o grau de achatamento de uma distribuição em relação a uma
distribuição padrão, denominada Curva Normal, que é uma curva correspondente a uma
distribuição teórica de probabilidade.
Quando a distribuição apresentar uma curva de frequência mais aberta que a normal (ou
mais achatada em sua parte superior), ela receberá o nome de Platicúrtica.
Se a distribuição em estudo apresentar uma curva de frequência mais fechada que a normal
(ou mais aguda em sua parte superior), ela receberá o nome de Leptocúrtica.
A curva normal, que é a nossa base referencial, recebe o nome de Mesocúrtica.
Curva Normal ou Curva de Gauss
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 75/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil75
Os tipos de curvas de frequência em termos de curtose estão mostrados abaixo:
Coeficiente de Curtose
Uma fórmula para medir a curtose é mediante o cálculo do Coeficiente Percentílico de
Curtose, conforme abaixo:
1090
13
PP2
QQC
onde:
C = Coeficiente Percentílico de Curtose ou Coeficiente de Curtose
Q1 = 1º Quartil da Distribuição
Q3 = 3º Quartil da Distribuição
P10 = 10º Percentil da Distribuição
P90 = 90º Percentil da Distribuição
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 76/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil76
Para o caso especial da Curva Normal, temos que C = 0,263.
Assim:
Se C = 0,263 => Curva Mesocúrtica
Se C < 0,263 => Curva Leptocúrtica
Se C > 0,263 => Curva Platicúrtica
Exemplos:
1. Sabendo que uma distribuição apresenta as seguintes medidas:
Q1 = 21,84 cm ; Q3 = 45,32 cm
P10 = 18,69 cm ; P90 = 53,24 cm
Calcule o coeficiente de curtose e classifique a distribuição em relação à curva normal.
Solução:
1090
13
PP2
QQC
3398,0
10,6948,23
55,34248,23
69,1824,53284,2132,45
C
Como 0,3398 > 0,263 , temos uma distribuição Platicúrtica em relação à normal.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 77/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil77
2. Uma distribuição salarial de uma empresa apresentou os seguintes valores:
Q1 = R$ 925,36 ; Q3 = R$ 2.043,75
P10 = R$ 658,31 ; P90 = R$ 2.983,87
Calcule o coeficiente de curtose e classifique a distribuição em relação à curva normal.
Solução:
1090
13
PP2
QQC
2405,0
12,651.439,118.1
56,325.2239,118.1
31,65887,983.2236,92575,043.2
C
Como 0,2405 < 0,263 , temos uma distribuição Leptocúrtica em relação à normal.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 78/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil78
UNIDADE 22
Objetivo: Apresentar e discutir os principais elementos relacionados às Probabilidades.
Noções de Probabilidades
É conveniente dispormos de uma medida que exprima a incerteza presente em afirmações
tais como: “É possível que chova amanhã”, ou “Não há chance de vitória”, em termos de uma
escala numérica que varie do impossível ao certo. Esta medida é a probabilidade.
O conceito de probabilidade é fundamental para o estudo de situações onde os resultados
são variáveis, mesmo quando mantidas inalteradas as condições de sua realização.
Experimento Aleatório
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “éprovável que o meu time ganhe a partida de hoje” pode resultar:
que, apesar do favoritismo, ele perca;
que, como pensamos, ele ganhe;
que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados
fenômenos aleatórios ou experimentos aleatórios.
Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 79/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil79
É o processo de coleta de dados relativos a um fenômeno que acusa variabilidade em seus
resultados.
Espaço Amostral
É o conjunto de todos os resultados possíveis de um experimento. Vamos representá-lo por
S. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer
coroa. Logo, temos:
S = {CARA , COROA}
Já ao lançarmos um dado, há seis resultados possíveis. Assim, temos:
S = {1, 2, 3, 4, 5, 6}
Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto
universo, representado por S.
Do mesmo modo, como em dois lançamentos sucessivos de uma moeda podemos obter
cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e
cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é:
S = {(Ca, Ca) , (Ca, Co) , (Co, Ca) , (Co, Co)}
Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto
amostral. Assim:
2 S 2 é um ponto amostral de S
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 80/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil80
Eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento
aleatório, representado por E.
Assim, qualquer que seja E, se E S (E está contido em S), então E é um evento de S.
Se E = S, E é chamado evento certo.
Se E S e E é um conjunto unitário, E é chamado evento elementar.
Se E = , E é chamado evento impossível.
Exemplo:
No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
A = {2, 4, 6} S; logo, A é um evento de S.
B = {1, 2, 3, 4, 5, 6} S; logo, B é um evento certo de S (B = S).
C = {4} S; logo, C é um evento elementar de S.
D = S; logo, D é um evento impossível de S.
Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser
definidos pelas sentenças:
“Obter um número par na face superior.”
“Obter um número menor ou igual a 6 na face superior.”
“Obter o número 4 na face superior.”
“Obter um número maior que 6 na face superior.”
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 81/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil81
UNIDADE 23
Objetivo: Apresentar e calcular as Probabilidades.
Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os
elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto
equiprovável.
Chamamos de probabilidade de um evento A (A S) o número real P(A), tal que:
Onde:
n(A) é o número de elementos de A ou número de vezes que A ocorreu;
n(S) é o número de elementos de S ou número total de repetições do experimento;
Assim, pelos exemplos anteriores podemos concluir que, sendo n(S) = n:
A probabilidade do evento certo é igual a 1 =>
)(
)()(
Sn
AnAP
P(S) = 1
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 82/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil82
A probabilidade do evento impossível é igual a zero =>
A probabilidade de um evento E qualquer (E S) é um número real P(E), tal que:
A probabilidade de um evento elementar E qualquer é, lembrando que n(E) = 1:
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento
existe sempre a relação:
Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não realização de
um dos eventos não afeta a probabilidade da realização do outro e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
0 P(E) 1
n1
)E(P
pqqp 11
P(
) = 0
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 83/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil83
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de
realização do segundo evento, a probabilidade de que tais eventos se realizem
simultaneamente é dada por:
Eventos Mutuamente Exclusivos
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de umexclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é
igual à soma das probabilidades de que cada um deles se realize:
21 ppp
21 ppp
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 84/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil84
UNIDADE 24
Objetivo: Exercícios resolvidos envolvendo o cálculo de Probabilidades.
Exercícios Resolvidos Envolvendo o Cálculo de Probabilidades
1. Qual a probabilidade de sair o valete de espadas quando retiramos uma carta de um
baralho de 52 cartas ?
Solução :
Evento A = {sair valete de espadas em um baralho de 52 cartas}
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de valetes de espadas existentes no baralho de 52 cartas
n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do
baralho.
Logo, temos:
%92,10192308,0521
)S(n)A(n
)A(P
Resposta: A probabilidade de sair o valete de espadas quando retiramos uma carta de
um baralho de 52 cartas é de aproximadamente 1,92%.
2. Qual a probabilidade de sair uma dama quando retiramos uma carta de um baralho de 52
cartas ?
Solução :
Evento A = {sair dama em um baralho de 52 cartas}
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de damas existentes no baralho de 52 cartas
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 85/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil85
n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do
baralho.
Logo, temos:
%69,70769231,0524
)S(n)A(n)A(P
Resposta: A probabilidade de sair uma dama quando retiramos uma carta de um
baralho de 52 cartas é de aproximadamente 7,69%.
3. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 7.
Solução :
O evento “obter soma igual a 7” é formado pelos elementos (1, 6) , (6, 1) , (2, 5) , (5, 2) ,
(3, 4) , (4, 3). Como o número de elementos do Espaço Amostral S é 36 (pois existem ao
todo 6 x 6 = 36 possíveis combinações no lançamento de dois dados), temos que:
≈366
=)S(n)A(n
=)A(P 16,67%
4. Em um lote de 18 peças, 5 são defeituosas. Sendo retirada uma peça, calcule:
a) A probabilidade de essa peça ser defeituosa;
b) A probabilidade de essa peça não ser defeituosa;
Solução :
a) Evento A = {sair peça defeituosa}
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 86/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil86
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de peças defeituosas existentes no lote.
n(S) = Quantidade de total de peças do lote.
Logo, temos:
%78,27≈277777778,0=185
=)S(n)A(n
=)A(P
b) Evento B = {sair peça não defeituosa}
P(B) = Probabilidade de ocorrer o Evento B
n(B) = Quantidade de peças não defeituosas existentes no lote.
n(S) = Quantidade de total de peças do lote.
Logo, temos:
%22,72≈722222222,0=1813
=)S(n)B(n
=)B(P
Como os eventos A e B são eventos complementares, também poderíamos fazer
neste problema:
P(A) + P(B) = 1
P(B) = 1 – P(A) = 1 – 0,277777778 = 0,722222222 ≈ 72,22%
Resposta: A probabilidade de se retirar uma peça defeituosa é de aproximadamente
27,78% e de se retirar uma não defeituosa é de aproximadamente 72,28%.
5. Uma urna A contém: 5 bolas brancas, 3 pretas, 3 verdes; uma urna B contém: 4 bolas
brancas, 2 pretas, 2 verdes; uma urna C contém: 3 bolas brancas, 2 pretas, 4 verdes.
Uma bola é retirada de cada urna. Qual a probabilidade de as três bolas retiradas da
primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde ?
Solução :
p1 = { sair bola branca na primeira urna }
p2 = { sair bola preta na segunda urna }
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 87/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil87
p3 = { sair bola verde na terceira urna }
Como são três acontecimentos simultâneos e independentes (uma urna não afeta
outra), temos que:
pTotal = p1 x p2 x p3
≈
995
=79240
=94
×82
×115
=pTotal 5,05%
6. De dois baralhos retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser uma dama e a
do segundo ser o 6 de copas ?
Solução :
p1 = { sair dama }
p2 = { sair 6 de copas }
Como são dois acontecimentos simultâneos e independentes (um baralho não afeta
outro), temos que:
pTotal = p1 x p2
≈
6761
=2704
4=
521
×524
=pTotal 0,15%
7. De um baralho retiram-se, ao acaso, duas cartas sem reposição. Qual a probabilidade
de a primeira carta ser o rei de espada e a segunda ser o valete de ouros ?
Solução :
p1 = { sair rei de espada }
p2 = { sair valete de ouros }
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 88/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 89/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil89
p2 = { sair dama } =524
=131
p3 = { sair valete } =
52
4 =
13
1
Como os três eventos são mutuamente exclusivos (ou sai rei, ou sai dama ou sai
valete – uma opção exclui a outra), temos que:
pTotal = p1 + p2 + p3
≈
=13
1
+13
1
+13
1
=pTotal 13
3
23,08%
Também poderíamos resolver este problema da seguinte forma:
Como em um baralho temos 12 figuras (4 reis, 4 damas e 4 valetes), teríamos que:
≈
13
3=
52
12=pTotal 23,08%
10. Qual a probabilidade de sair uma carta de paus ou de copas quando retiramos uma carta
de um baralho ?
Solução :
p1 = { sair paus } =5213
=41
p2 = { sair copas } = 5213
= 41
Como os dois eventos são mutuamente exclusivos (ou sai paus ou sai copas – uma
opção exclui a outra), temos que:
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 90/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 91/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil91
Como estes quatro eventos são mutuamente exclusivos (ou sai soma 9, ou soma 10,
ou soma 11 ou soma 12 – uma opção exclui a outra), temos que:
pTotal = p1 + p2 + p3 + p4
≈
185
=3610
=361
+362
+363
+364
=pTotal 27,78 %
12. São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de tirarmos um 4 e um 7, não
necessariamente nesta ordem ?
Solução :
p1 = { sair quatro } =524
=131
p2 = { sair sete } =524
=131
Vamos calcular a probabilidade de termos um quatro no primeiro baralho e um sete no
segundo baralho. Como são dois acontecimentos simultâneos e independentes (um
baralho não afeta outro), temos que:
p3 = p1 x p2 → 169
1=
131
×131
=p3
A probabilidade de tirarmos um sete no primeiro baralho e um quatro no segundo
baralho é a mesma, ou seja:
p4 = p1 x p2 → 169
1=
131
×131
=p4
Como estes dois eventos são mutuamente exclusivos (ou sai a sequência 4 – 7 , ou
sai a sequência 7 – 4 , pois uma opção exclui a outra), temos que:
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 92/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil92
pTotal = p3 + p4
≈
1692=
1691+
1691=pTotal 1,18 %
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 93/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil93
UNIDADE 25
Objetivo: Apresentar e discutir as principais Distribuições de Probabilidades.
Distribuições de Probabilidade
Serão apresentados dois modelos teóricos de Distribuição de Probabilidade, aos quais um
experimento aleatório estudado possa ser adaptado, o que permitirá a solução de grande
número de problemas práticos.
1. Variável Aleatória
Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número.
Fica, então, definida uma função chamada VARIÁVEL ALEATÓRIA, indicada por uma letra
maiúscula, sendo seus valores indicados por letras minúsculas.
Assim, se o espaço amostral relativo ao “lançamento simultâneo de duas moedas” é S =
{(Ca,Ca) , (Ca,Co) , (Co,Ca) , (Co,Co)} e se X representa “o número de caras” que
aparecem, a cada ponto amostral podemos associar um número para X, de acordo com a
tabela abaixo:
Ponto Amost ral X
(Ca,Ca) 2
(Ca,Co) 1
(Co,Ca) 1
(Co,Co) 0
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 94/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil94
2. Distribuição de Probabilidade
Consideremos a distribuição de frequências relativa ao número de acidentes diários em um
estacionamento:
Número de Acidentes Frequências
0 22
1 5
2 2
3 1
TOTAL 30
Em um dia qualquer, a probabilidade de:
Não ocorrer acidente é:73,0
3022p
Ocorrer um acidente é:17,0
305
p
Ocorrerem dois acidentes é:07,0
302
p
Ocorrem três acidentes é:03,0
301
p
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 95/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 96/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil96
Logo, para o caso do lançamento de duas moedas, teremos:
Ponto Amostral X P(X)
(Ca,Ca) 241
21x
21
(Ca,Co) 141
21
x21
(Co,Ca) 14
1
2
1x
2
1
(Co,Co) 041
21
x21
Assim, poderemos escrever:
Número de Caras (X) P(X)
241
142
041
1
Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca
entre os valores da variável aleatória X e os valores da variável P. Esta correspondência
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 97/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil97
define uma função; os valores xi ( i = 1, 2, 3, ... , n) formam o domínio da função e os valores
pi ( i = 1, 2, 3, ... , n) formam o seu conjunto imagem.
Esta função, assim definida, é denominada função de probabilidade e é representada por:
A função P (X = xi) determina a distribuição de probabilidade da variável aleatória X.
Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de um dado”, pode
tomar os valores 1, 2, 3, 4, 5 e 6.
Como a cada um destes valores está associada uma e uma só probabilidade de realização e
1)x(P i ·, fica definida uma função de probabilidade, da qual resulta a seguinte
distribuição de probabilidade:
X P(X)
161
261
361
461
5 61
661
1
f(x) = P (X = x i)
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 98/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 99/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 100/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil100
UNIDADE 27
Objetivo: Apresentar e discutir a Distribuição Normal.
Distribuição Normal
Curva Normal
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é aDISTRIBUIÇÃO NORMAL.
Muitas variáveis analisadas em pesquisas socioeconômicas correspondem à distribuição
normal ou dela se aproximam.
O aspecto gráfico de uma distribuição normal é o da figura abaixo:
Curva Normal ou Curva de Gauss
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 101/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 102/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil102
Vamos determinar a probabilidade de um parafuso ter diâmetro com valor entre 2 e 2,05 cm.
Essa probabilidade é indicada por: P(2 < X < 2,05) , correspondente à área hachurada na
figura abaixo:
Se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, então avariável z tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e
desvio padrão 1, onde z é o escore padronizado, calculado da seguinte forma:
As probabilidades associadas à distribuição normal padronizada são encontradas em
tabelas, não havendo necessidade de serem calculadas.
Observe a curva e tabela a seguir:
Área subentendida pela Curva Normal reduzida de 0 a Z:
sxx
z i
sxxz i
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 103/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil103
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 104/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil104
A probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z é:
Temos, então, que se X é uma variável aleatória com distribuição normal de média x e
desvio padrão s, podemos escrever:
P ( x < X < x ) = P ( 0 < Z < z ), com sxx
z i .
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, devemos calcular o valor
de z que corresponde a x = 2,05 (x = 2 z = 0, pois x = 2). Temos, então:
Onde:
P(2 < X < 2,05) = P(0 < X < 1,25)
Olhando na tabela o valor de z = 1,25, temos:
Na primeira coluna encontramos o valor de 1,2. Em seguida, encontramos, na primeira linha,
o valor 5, que corresponde ao último algarismo do número 1,25. Na interseção da linha e
coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever:
P(0 < Z < z)
P(0 < Z < 1,25) = 0,3944
25,104,005,0
04,0205,2
sxx
z i
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 105/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil105
Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro
entre a média x = 2 e o valor x = 2,05 é 0,3944.
Escrevemos, então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 106/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil106
UNIDADE 28
Objetivo: Apresentar e discutir os conceitos principais relacionados à Correlação.
Correlação
Nosso estudo anterior se preocupava em descrever a distribuição de valores de uma única
variável. Entretanto, quando consideramos observações de duas ou mais variáveis, surge um
novo problema: as relações que podem existir entre as variáveis estudadas.
Quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro
e a incidência de câncer, vocabulário e compreensão da leitura, dominância e submissão,
procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e
qual o grau dessa relação. Para isso, é necessário o conhecimento de novas medidas.
Sendo esta relação de natureza quantitativa, o instrumento adequado para descobrir e medir
essa relação denomina-se CORRELAÇÃO.
Uma vez caracterizada esta relação, procuraremos descrevê-la através de uma função
matemática. A REGRESSÃO é o instrumento adequado para determinar os parâmetros
dessa função.
Relação Funcional x Relação Estatística
Já sabemos que o perímetro e o lado de um quadrado estão relacionados. A relação que os
liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática:
4
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 107/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil107
Onde é o perímetro e é o lado do quadrado.
Ao atribuirmos um valor qualquer a , é possível determinar exatamente o valor de .
Consideremos, agora, a relação que existe entre o peso e a estatura de um grupo de
pessoas. É evidente que essa relação não é do mesmo tipo da anterior; ela é bem menos
precisa. Pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a
estaturas iguais correspondam pesos diferentes. Porém, em média, quanto maior a estatura,
maior o peso.
As relações do tipo perímetro-lado são conhecidas como relações funcionais e as do tipo
peso-estatura, como relações estatísticas.
Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe
correlação entre elas.
Diagrama de Dispersão
Consideremos uma amostra aleatória formada por 10 dos 98 alunos de uma determinada
Faculdade A e pelas notas por eles obtidas nas disciplinas de Matemática e Estatística.
Vejamos os valores obtidos:
Matemática (xi) Estatísti ca (yi)
01 5,0 6,008 8,0 9,024 7,0 8,038 10,0 10,0
44 6,0 5,058 7,0 7,059 9,0 8,072 3,0 4,080 8,0 6,092 2,0 2,0
NOTASNº doaluno
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 108/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil108
Representando os pares ordenados (xi , yi) em um sistema coordenado cartesiano ortogonal,
obtemos uma nuvem de pontos que denominamos Diagrama de Dispersão. Este diagrama
nos fornece uma ideia grosseira, porém útil, da correlação existente entre as variáveis:
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 109/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil109
UNIDADE 29
Objetivo: Apresentar e discutir Correlação Linear, calculando o Coeficiente de Correlação.
Correlação Linear
Os pontos obtidos anteriormente, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for à elipse, mais ela se aproximará de uma reta.
Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por
isso, denominada correlação linear.
É possível verificar que a cada correlação está associada como “imagem” uma relação
funcional. Por este motivo, as relações funcionais são chamadas relações perfeitas.
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 110/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 111/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil111
Coeficiente de Correlação Linear
O instrumento empregado para medir a correlação linear é o coeficiente de correlação. Esse
coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o
sentido dessa correlação (positivo ou negativo).
Faremos o uso do Coeficiente de Correlação de Pearson ( r ) , que é dado por:
Onde n é o número de observações.
Os valores limites de r são -1 e +1.
Se r = +1 , há uma correlação perfeita e positiva entre as variáveis;
Se r = -1 , há uma correlação perfeita e negativa entre as variáveis;
Se r = 0 , ou não há correlação entre as variáveis, ou a relação que porventura possa
existir não é linear;
Para que uma relação possa ser descrita por meio do Coeficiente de Correlação de Pearson
é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de
verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse
apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de
correlação curvilínea.
Para podermos tirar conclusões significativas sobre o comportamento simultâneo das
variáveis analisadas, é necessário que:
0,6 ≤ | r | ≤ 1
2i
2i
2i
2i
iiii
yynxxn
yxyxnr
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 112/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil112
Se 0,3 ≤ | r | < 0,6 , há uma correlação relativamente fraca entre as variáveis.
Se 0 < | r | < 0,3 , a correlação é muito fraca e praticamente nada podemos concluir
sobre a relação entre as variáveis em estudo.
Vejamos o exemplo anterior:
Para o cálculo do coeficiente de coeficiente de correlação linear r, devemos calcular colunas
auxiliares xi.yi ,
2
ix e
2
iy . Posteriormente devemos calcular o somatório de cada coluna.
Assim, teremos:
Matemática (x i) Es tat ís tica (yi)
01 5,0 6,008 8,0 9,024 7,0 8,0
38 10,0 10,044 6,0 5,058 7,0 7,059 9,0 8,072 3,0 4,080 8,0 6,092 2,0 2,0
NOTASNº doaluno
Matemática (x i) Estat ís tica (yi) x i . y i x2i y2
i
5,0 6,0 30,0 25,0 36,0
8,0 9,0 72,0 64,0 81,0
7,0 8,0 56,0 49,0 64,0
10,0 10,0 100,0 100,0 100,0
6,0 5,0 30,0 36,0 25,0
7,0 7,0 49,0 49,0 49,0
9,0 8,0 72,0 81,0 64,03,0 4,0 12,0 9,0 16,0
8,0 6,0 48,0 64,0 36,0
2,0 2,0 4,0 4,0 4,0
Σ 65 65 473 481 475
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 113/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 114/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil114
UNIDADE 30
Objetivo: Apresentar, discutir e calcular Regressão Linear e Equação da Reta.
Regressão Linear
Ajus tamento da Reta
Sempre que desejamos estudar determinada variável em função de outra, fazemos umaanálise de regressão.
Ela tem por objetivo descrever, através de um modelo matemático, a relação entre duas
variáveis, partindo de n observações das mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável
dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a variável dependente, vamos determinar oajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função
definida por:
Onde a e b são os parâmetros da equação e:
2i
2i
iiii
xxn
yxyxna xayb
Y = a.X + b
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 115/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 116/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 117/120
Copyright © 2007, ESAB – Escola Superior Aberta do Brasil117
Interpolação e Extrapolação
Observando os dados do exercício anterior, podemos facilmente verificar que não temos a
nota 4,0 entre as notas de Matemática.
Entretanto, obtida a equação estimada da reta, podemos estimar a nota correspondente em
Estatística, fazendo X = 4,0 na equação estimada Ŷ.
Eis uma das grandes aplicações da Regressão Linear !!
Assim, temos que:
Ŷ = 0,8632 X + 0,8889
Ŷ = 0,8632 . 4,0 + 0,8889
Ŷ = 4,34
Isso significa dizer que, com base nas notas apresentadas do grupo, por meio da equação da
reta de Regressão Linear, podemos estimar a nota de Estatística. Uma pessoa que por
ventura tirasse 4,0 em Matemática, dentro daquele grupo, essa nota estimada seria 4,34.
Como a nota 4,0 pertence ao intervalo de notas de Matemática do grupo (que vai de 2,0 a
10,0), dizemos que foi feita uma Interpolação.
E qual seria a nota estimada de Estatística de uma pessoa que tirasse 1,0 em Matemática?
De forma análoga, podemos também fazer uma estimativa para a nota de Estatística,
fazendo X = 1,0 na equação estimada Ŷ.
Assim, temos que:
Ŷ = 0,8632 X + 0,8889
Ŷ = 0,8632 . 1,0 + 0,8889
Ŷ = 1,75
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 118/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 119/120
8/9/2019 Modulo 5 - Estatistica.pdf
http://slidepdf.com/reader/full/modulo-5-estatisticapdf 120/120
BIBLIOGRAFIA BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 5a ed. São Paulo: Saraiva,
2003.
BUSSAB, Wilton O, MORETTIN, Pedro A. Métodos quantitativos: Estatística Básica.
Editora Atual, 1987.
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo: Saraiva, 2002..
HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo: Livraria Pioneira Editora,1980.
LEVIN, J. Estatística Aplicada a Ciências Humanas. São Paulo: Harbra, 1987.
LEVINE, David M., STEPHAN, David, KREHBIEL, Timothy C., BERENSON, Mark L.
Estatística - Teoria e Aplicações usando o Microsoft Excel em Português . Rio de
Janeiro: LTC, 2005.
MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy C. B.Lourenço Filho. Rio de Janeiro: LTC, 1978.