Download - ESTATÍSTICA PARA ENGENHARIA DE MATERIAIS I
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIENCIAS EXATAS E DA TERRA
DEPARTAMENTO DE ESTATÍSTICA
NOTAS DE AULAS
DISCIPLINA: ESTATÌSTICA PARA ENGENHARIA DE MATERIAIS I
PROFESSORA: LUCIANA MARIA DE OLIVEIRA
NATAL/RN - 2010
1
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
UNIDADE I
ESTATISTICA DESCRITIVA
1.1 - NARUREZA E CAMPO DA ESTATÍSTICA
Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal
forma que seja possível efetuar julgamentos sobre os mesmos.
Ramos da Estatística:
a) Estatística descritiva trata da observação de fenômenos de mesma natureza, da coleta de
dados numéricos referentes a esses fenômenos, da sua organização e classificação através de
tabelas e gráficos, bem como da análise e interpretação.
b) Probabilidade estatística · utilizada para analisar situações que envolvem o acaso
(aleatoriedade).
c) Inferência estatística estuda as características de uma população com base em dados obtidos
de amostras.
OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva estuda as
características de uma população, com base em dados obtidos de amostras.
Inferência = Indução + Margem de Erro
1.2 - O MÉTODO ESTATÍSTICO
A realização de uma pesquisa deve passar, necessariamente pelas fases apresentadas abaixo:
1) Definição do problema Saber exatamente o que se pretende pesquisar, ou seja, definir
corretamente o problema.
2
Coletas dos
Dados
Definição do
problemaPlanejamento
Crítica dos
Dados
Apresentação dos dados Tabelas e
Gráficos
Análise e interpretação
dos dados
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
2) Planejamento determinar o procedimento necessário para resolver o problema, como levantar
informações sobre o assunto objeto do estudo. É importante a escolha das perguntas em um questionário,
que na medida do possível, devem ser fechadas.
O levantamento de dados pode ser de dois tipos: Censitário e Amostragem.
Outros elementos do planejamento de uma pesquisa são:
Cronograma das atividades;
Custos envolvidos;
Exame das informações disponíveis;
Delineamento da amostra.
3) Coleta de Dados consite na busca ou compilação dos dados . Pode ser classificado, quanto ao
tempo em:
Contínua (inflação, desemprego, etc);
Periódica (Censo);
Ocasional (pesquisa de mercado, eleitoral)
4) Crítica dos dados objetiva a eliminação de erros capazes de provocar futuros enganos. Faz-
se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.
5) Apresentação dos dados a organização dos dados denomina-se “Série Estatística”. Sua
apresentação pode ocorrer por meio de tabelas e gráficos.
6) Análise e Interpretação dos Dados consite em tirar conclusões que auxiliem o pesquisador a
resolver seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas,
especialmente as de posição e as de dispersão.
1.3 - REPRESENTAÇÃO TABULA E GRÁFICA
- REPRESENTAÇÃO TABULA
Consiste em dispor os dados em linhas e colunas , distribuídas de modo ordenado, segundo algumas
regras práticas e obedecendo à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho Nacional de
Estatística.
3
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
As tabelas devem apresentar:
a) Título O quê? Onde? Quando?
b) Cabeçalho especifica o conteúdo das colunas
c) Coluna indicadora especifica o conteúdo das linhas
d) Corpo caselas onde são registrados os dados
e) Rodapé notas e identificação da fonte dos dados
Séries Estatísticas
São os dados organizados em forma de tabelas. De acordo com o fenômeno, local e a época de
ocorrência classificam-se, respectivamente, em : Temporal, Especificativa e Geográfica.
a) SérieTemporal (históricas ou cronológicas): os dados são observados segundo a época de sua
ocorrência
4
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
b) Série Geográfica (espaciais, territoriais ou de localização): os dados são observados segundo o local
onde ocorreram.
c) Série Especificativa (categóricas): os dados são agrupados segundo a modalidade (espécie) de
ocorrência.
d) Série Mista ou de Dupla Entrada: é a fusão de duas ou mais séries simples.
TELEFONES INSTALADOS - 1987-89REGIÃO 1987 1988 1989Norte 373.312 403.712 457.741Nordeste 1.440.531 1.567.006 1.700.467Sudeste 8.435.308 8.892.409 8.673.660Sul 2.106.145 2.192.762 2.283.581Centro -oeste 803.013 849.401 944.075Total 13.158.309 13.905.290 14.059.524
5
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
- POPULAÇÃO E AMOSTRA
Inferência Obtenção de resultados para uma população com base em observações
Estatística extraídas a partir de uma amostra retirada desta população.
POPULAÇÃO:
É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada característica.
Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o número de
vezes que se pode jogar um dado.
AMOSTRA:
É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos é
chamada de Amostragem.
- NOÇÕES DE AMOSTRAGEM
População (N) Amostra (n)
X X: determinada característica de
interesse da população;
: parâmetro populacional;
Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma população
tendo como base as informações extraídas através de uma amostra. Neste contexto, o estudo dos mais
diversos tipos de procedimentos de amostragem se faz necessário.
As técnicas de amostragem podem ser classificadas em dois grandes grupos: a amostragem probabilística
e a amostragem não probabilística.
6
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
a) Amostragem Probabilística: neste grupo encontram-se os planos amostrais que utilizam mecanismos
aleatórios de seleção dos elementos da amostra, atribuindo a cada um deles uma probabilidade,
conhecida à priori, de pertencer a amostra.
b) Amostragem Não Probabilística: neste grupo encontram-se os planos amostrais que não utilizam
mecanismos aleatórios de seleção dos elementos da amostra, e dessa forma, não existe nenhuma
probabilidade associada a seleção desses elementos.
Ambos os procedimentos têm vantagens e desvantagens. A grande vantagem das amostras probabilísticas
é medir a precisão da amostra obtida. Tais medidas já são bem mais difíceis para os procedimentos do
outro grupo. Diante disso, amostras probabilísticas são comumente utilizadas na prática. Os tipos de
planos de amostragem probabilísticos são os seguintes:
1. Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou
probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso, tabelas
de números aleatórios são freqüentemente utilizadas. Por exemplo, selecionar 5 alunos de uma turma.
2. Amostragem Estratificada: a população é dividida em estratos (ou grupos) homogêneos, sendo
selecionada uma amostra aleatória simples de cada estrato. Por exemplo, selecionar alunos de 5ª a 8ª
série de uma determinada escola. Neste caso, cada série corresponde a um estrato, e de cada estrato
uma amostra aleatória simples dos alunos é extraída.
3. Amostragem Sistemática: os elementos são selecionados segundo um regra pré-definida. É bastante
utilizada quando os elementos da população estão arranjados um ordem. Por exemplo, selecionar um
aluno a cada 15 que forem sorteados.
É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem ser
estudados. Portanto, a variabilidade é uma característica comum a dados de observação e experimentos.
Um atributo sujeito à variação é descrito em Estatística por uma variável.
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
7
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por
exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sangüíneo, etc..
Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura, peso,
etc..
Exercícios
1. De acordo com informações do IBGE, em 31.12.99, o pessoal administrativo ocupado em
estabelecimentos públicos, era, segundo o tipo de ocupação: Administração, 41.371; Serviço pessoal,
6.067; Contabilidade, 2.989; Estatística, 5.481; Limpeza e Conservação, 26.520; Almoxarifado,
3.970; Serviços Gerais, 46.073; e Outros, 15.689. Nos estabelecimentos da rede particular, nas
mesmas ocupações anteriores, as quantidades respectivas eram: 45.392, 4.555, 6.627, 3.112, 42.155,
4.019, 49.038 e 17.302. Dispor os dados acima em uma tabela, utilizando valores absolutos e
percentuais
2. Os prontuários de um paciente de um hospital estão organizados por ordem alfabética, em um
arquivo. Qual é a maneira mais rápida de amostrar 1/3 do total de prontuários?
3. Um pesquisador tem dez gaiolas que contém , cada uma, seis ratos. Como o pesquisador pode
selecionar uma amostra de dez ratos?
4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio, usando
amostragem sistemática. O pesquisador visitará cada domicílio selecionado. Se não tiver nenhuma
pessoa na ocasião da visita, o pesquisador excluirá o domicílio da amostra. Este fato introduz
tendenciosidade?
5. Dada uma população de 8 elementos {A, B, C, D, E, F, G, H, G} descreva três formas diferentes de
obter uma amostra sistemática de 4 elementos.
- Distribuições de Freqüências
Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do
fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de distribuição de
freqüências.
8
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Distribuição de Freqüências: série estatística em que os dados são agrupados em classes, com suas
respectivas freqüências absolutas, relativas e percentuais, com o objetivo de
facilitar ao analista o seu estudo.
Construção de uma Distribuição de Freqüências:
Para a construção de uma distribuição de freqüências os seguintes componentes são necessários:
Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados.
Rol: são os dados apresentados em ordem crescente.
Os seguintes componentes são utilizados apenas em distribuição de freqüências em classes:
Amplitude Total (A): é a diferença entre o maior valor do rol (LS) e o menor valor (LI).
A = LS - LI
Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os elementos
do rol. Para determinar c, utiliza-se a fórmula de Sturges:
c = 1 + (3,33333.....).log(n)
onde n = número de elementos do rol.
Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através da
fórmula:
i = A/c
Outros elementos da tabela:
Li = limite inferior de cada classe;
Ls = limite superior de cada classe;
x = ponto médio de cada classe x = Li + (i/2);
f = freqüência absoluta = número de ocorrências de cada classe;
fr = freqüência relativa ;
9
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
f % = freqüência percentual f % = 100.fr;
= freqüência absoluta acumulada "abaixo de";
= freqüência absoluta acumulada "acima de";
= freqüência percentual acumulada "abaixo de";
= freqüência percentual acumulada "acima de";
Exemplos
1) (Dados Simples) Numa pesquisa feita para detectar o número de filhos de empregados de uma
multinacional, foram encontrados os seguintes valores:
1 4 2 5 3 2 0 3 2 1
5 4 2 5 0 3 2 4 2 3
2 3 2 1 4 2 1 3 4 2
Solução:
Rol (dados em ordem crescente):
0 0 1 1 1 1 2 2 2 2
2 2 2 2 2 2 3 3 3 3
3 3 4 4 4 4 4 5 5 5
Tabela de Distribuição de Freqüências:
X f fr f %
0 2 0,067 6,7 2 30 6,7 100
1 4 0,133 13,3 6 28 20 93,3
2 10 0,333 33,3 16 24 53,3 80
3 6 0,2 20 22 14 73,3 46,7
4 5 0,167 16,7 27 8 90 26,7
5 3 0,1 10 30 3 100 10
Total 30 1 100 - - - -
Algumas considerações ou conclusões:
Quantos empregados têm "x" filhos? A resposta é dada através de f (freqüência absoluta simples). a) Quantos empregados têm menos de "x" filhos? A resposta é dada através de (freqüência absoluta
acumulada "abaixo de").
10
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
b) Quantos empregados têm mais de "x" filhos? A resposta é dada através de (freqüência absoluta
acumulada "acima de").
2) (Dados Agrupados em Classes) Um determinado hospital está interessado em analisar a quantidade de
creatinina (em miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes
internados com problemas renais. Os dados são os seguintes:
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
Solução:
Rol (dados em ordem crescente):
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,681,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
Amplitude Total (dá uma idéia do campo de variação dos dados):
A = LS - LI = (2,34) - (1,08) = 1,26
Analisando-se a quantidade creatinina encontrada na urina dos 84 pacientes verificou-se que, ocorreu a
variação de 1,26 no seu campo (de 1,08 a 2,34).
Estabelecer o Número de Classes (c):
c = 1 + (3,3333.....).log(n) = 1 + (3,3333....).log(84) = 7,414 c = 7
11
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Estabelecer o Intervalo de Classe (i): i = A / c = (1,26) / 7 = 0,18
Construção da Tabela:
Classes fi Pm fr f %
1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
OBS:
(1) O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém pela fórmula:
Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2
(2) fi : número de elementos de cada classe.
fr : mede o quanto cada valor significa e relação a unidade.
f%: mede o quanto cada valor significa com relação a 100.
(3) 1,08 -- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao extremo inferior) e
aberto à direita (não pertencem a classe valores iguais ao extremo superior).
Algumas considerações ou conclusões:
12
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
a) Quantos pacientes têm quantidade de creatinina no intervalo de "x"? A resposta é dada através de f
(freqüência absoluta simples). Ex.: Quantas pacientes tem quantidade de creatinina no intervalo [1,44;
1,62)? R.: 32 pacientes.
b) Quantas pacientes tem quantidade de creatinina inferior ao intervalo "x"? A resposta é dada através de
(freqüência absoluta acumulada "abaixo de"). Ex.: Quantas crianças tem quantidade de creatinina
inferior ao intervalo [1,80; 1,98)? R.: 68 pacientes.
c) Quantas pacientes tem quantidade de creatinina superior ao intervalo "x"? A resposta é dada através
de (freqüência absoluta acumulada "acima de"). Ex.: Quantas crianças tem quantidade de
creatinina superior ao intervalo [1,80; 1,98)? R.: 5 pacientes.
3) Construir uma distribuição de freqüências, utilizando a fórmula de Sturges e analisá-la com base nos
elementos abaixo, correspondente ao faturamento bruto mensal (US$ mil) de 38 pequenas empresas:
2,1 4,4 2,7 32,3 9,9 9,0 2,0 6,6 3,9 1,6 14,7 9,6 16,7 7,4
8,2 19,2 6,9 4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3
0,3 1,3 14,1 1,0 2,4 2,4 18,0 8,7 24,0 1,4 8,2 5,8 1,6 3,5
11,4 18,0 26,7 3,7 12,6 23,1 5,6 0,4
– REPRESENTAÇÃO GRÁFICA
Gráfico é um recurso visual da Estatística utilizado para representar um fenômeno. Sua utilização em larga escala nos meios de comunicação social, técnica e científica, devem-se tanto à sua capacidade de refletir padrões gerais e particulares do conjunto de dados em observação, como à facilidade de interpretação e a eficiência com que resume informações dos mesmos.
Embora os gráficos forneçam menor grau de detalhes que as tabelas, estes apresentam um ganho na compreensão global dos dados, permitindo que se aperceba imediatamente da sua forma geral sem deixar de evidenciar alguns aspectos particulares que sejam de interesse do pesquisador.
Uma representação gráfica coloca em evidência as tendências, as ocorrências ocasionais, os valores mínimos e máximos e também as ordens de grandezas dos fenômenos que estão sendo observados.
Todo gráfico, em sua versão final deve primar pela simplicidade, clareza e veracidade nas informações. Para atingir tal objetivo, a construção de um gráfico exige muito trabalho e cuidados. Segundo Silva (apud WALLGREN, 1996), a escolha da representação gráfica e, conseqüentemente, a escolha do tipo de gráfico mais adequado para representar um conjunto de dados deve ser feita com base nas respostas de questões como:- Um gráfico realmente é a melhor opção?- Qual é o público-alvo?- Qual é o objetivo do gráfico?- Que tipo de gráfico deve ser usado?- Como o gráfico deve ser apresentado?- Que tamanho o gráfico deve ter?- Deverá ser usado apenas um gráfico?
13
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
- A qual meio técnico se deve recorrer?Ao incluir um gráfico em um trabalho, sua identificação deve aparecer na parte inferior,
precedido pela palavra Gráfico seguida de seu número de ordem de ocorrência no texto (algarismos arábicos), de seu respectivo título e/ou legenda explicativa de maneira breve e clara (dispensando a leitura do texto) e da fonte de onde se extraiu os dados. Uma regra básica para a elaboração adequada do título de qualquer gráfico, é verificar se o mesmo responde a três exigências: o quê, onde e quando.
- GRÁFICOS PARA TABELAS SIMPLES
a) Gráfico de barrasÉ um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles
representa a intensidade de uma modalidade ou atributo.O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis cujas
categorias tenham designações extensas.
b) Gráfico de colunasÉ o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de barras por
serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as designações das categorias são breves. O número de colunas ou barras do gráfico não deve ser superior a 12 (doze).
Ao se descrever simultaneamente duas ou mais categorias para uma variável, é conveniente fazer uso dos gráficos de barras ou colunas justapostas (ou sobrepostas), chamados de gráficos comparativos. De acordo com as normas contidas em Gráficos (UFPR, 2001), este tipo de gráfico só deve ser utilizado quando apresentar até três elementos para uma série de no máximo quatro valores.
14
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
c) Gráfico de setoresTipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em
setores com áreas proporcionais às freqüências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de categorias não é grande e não obedecem a alguma ordem específica.
Para encontrarmos a medida dos ângulos (em graus) de cada setor do círculo (de cada fatia da
pizza), devemos estabelecer a seguinte regra de três:
De onde vem a relação:
Total observado X = (cada parcela) 360º
De onde obtemos que:
d) Gráfico de linhasSua aplicação é mais indicada para representações de séries temporais sendo por tal razão,
conhecidos também como gráficos de séries cronológicas. Sua construção é feita colocando-se no eixo vertical (y) a mensuração da variável em estudo e na abscissa (x), as unidades da variável numa ordem crescente. Este tipo de gráfico permite representar séries longas, o que auxilia detectar suas flutuações tanto quanto analisar tendências. Também podem ser representadas várias séries em um mesmo gráfico.
15
1 Total observado 360º
2 Cada parcela X
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
- REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO(TABELAS COM INTERVALO DE CLASSE)a) Histograma:
Os histogramas são gráficos construídos para representar dados agrupados em
intervalos de classes e podem ser utilizados, considerando qualquer tipo de freqüência, simples
ou acumuladas, absolutas ou percentuais.
Assim, há histogramas com diversos contornos, informando sobre distintos aspectos do
comportamento dos dados.
Horas de Trabalho Nº de Crianças (fi) fi % F% Pm
10 |-- 15 4 10,52 10,52 12,5
15 |-- 20 5 13,15 23,67 17,5
20 |-- 25 8 21,10 44,77 22,5
25 |-- 30 12 31,56 76,33 27,5
30 |-- 35 6 15,78 92,11 32,5
35 |--| 40 3 7,89 100 37,5
Total 38 100,00 - -
Distribuição Simétrica: ocorre quando a concentração dos dados está no centro da figura.
16
0
2
4
6
8
10
12
14
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |--| 40
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Distribuição assimétrica: quando a concentração dos dados está localizada para a
direita ou para a esquerda da figura. Dividindo-se em:
Assimetria positiva: quando a concentração dos dados se localiza à esquerda do centro da
figura e a cauda à direita é alongada.
Assimetria negativa: quando a concentração dos dados se localiza à direita do centro da
figura e a cauda à esquerda é alongada.
b) Polígono de freqüênciaÉ um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas
correspondentes aos pontos médios de cada classe e as ordenadas, às freqüências absolutas ou relativas dessas mesmas classes.O polígono de freqüência é um gráfico que deve ser fechado no eixo das abscissas. Então, para finalizar sua elaboração, deve-se acrescentar à distribuição, uma classe à esquerda e outra à direita,
17
0
2
4
6
8
10
12
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45
0
2
4
6
8
10
12
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45
0
2
4
6
8
10
12
10 |-- 15 15 |-- 20 20 |-- 25 25 |-- 30 30 |-- 35 35 |-- 40 40 |--| 45
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
ambas com freqüências zero. Tal procedimento permite que a área sob a linha de freqüências seja igual à área do histograma.
Uma das vantagens da aplicação de polígonos de freqüências é que, por serem gráficos de linhas, permitem a comparação entre dois ou mais conjuntos de dados por meio da superposição dos mesmos.
c) Gráfico da freqüência acumulada ou Ogiva de GaltonÉ um gráfico que permite descrever dados quantitativos por meio da freqüência acumulada.A ogiva é um gráfico de linha que une os pontos cujas abscissas são os limites superiores das
classes, e, ordenadas suas respectivas freqüências acumuladas. Convém observa-se que o ponto inicial desse gráfico é o limite inferior do primeiro intervalo, com freqüência acumulada zero, pois não existe qualquer valor inferior a ele.
Exercício
Construa os gráficos representativos da distribuição de freqüência do exercício 2 (quantidade de
creatinina presente na urina de 84 pacientes).
Construção da Tabela:
18
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Classes fi Pm fr f %
1,08 - 1,26 5 1,17 0,059 5,9 5,9 100 5 84
1,26 - 1,44 13 1,35 0,155 15,5 21,4 94,1 18 79
1,44 - 1,62 32 1,53 0,381 38,1 59,5 78,6 50 66
1,62 - 1,80 18 1,71 0,214 21,4 80,9 40,5 68 34
1,80 - 1,98 11 1,89 0,131 13,1 94,0 19,1 79 16
1,98 - 2,16 2 2,07 0,024 2,4 96,4 6,0 81 5
2,16 - 2,34 3 2,25 0,036 3,6 100 3,6 84 3
Total 84 - 1 100 - - - -
Os dados quantitativos, apresentados em tabelas e gráficos, constituem a informação básica do problema.
Mas é conveniente apresentar medidas que mostrem a informação de maneira resumida.
1.4 – MEDIDAS DE TENDÊNCIA CENTRAL, DISPERÇÃO E ACHATAMENTO
– Medidas de Tendência Central
São medidas que tendem para o centro da distribuição e têm a capacidade de representá-la como
um todo. Dão o valor do ponto em torno do qual os dados se distribuem. As principais são: Média
Aritmética, Mediana e Moda e algumas.
Média, Mediana e Moda
Média Aritmética
A média aritmética pode ser definida em dois tipos: populacional ( ) e amostral ( ). Nos dois casos
existem três situações quanto aos cálculos.
1. Dados apresentados em forma de rol:
A média será:
Ex.: Peso em gramas de ratos (50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74) = 67
Análise: o peso médio dos 12 ratos observados é de 67 gramas.
Exercício: Um gerente de supermercado quer estudar a movimentação de pessoas em seu estabelecimento, constata que 195, 1.002, 941, 768, 1.283 pessoas entraram no seu estabelecimento nos últimos cinco dias. Descubra o número médio de pessoas que entraram diariamente neste estabelecimento nos últimos cinco dias.
2. Dados apresentados em forma de distribuição de freqüência simples:
19
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
A média será:
Ex.: Número de cáries em crianças
X 0 1 2 3 4 Total
f 2 4 10 6 5 27
Análise: Verifica-se que o número médio de cáries das 27 crianças observadas no estudo é de 2,3.
Exercício: As informações abaixo apresentam a idade dos usuários de drogas internos numa clínica
para tratamento. Determine a idade média dos internos.
Idade fi
17 6
18 4
19 8
20 12
21 10
22 7
23 3
Total 50
3. Dados apresentados em forma de distribuição de freqüência em classes:
A média será:
Ex.: Nascidos vivos segundo o peso ao nascer, em kg.
20
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Classes Pm fi
1,5 - 2,0 1,75 3
2,0 - 2,5 2,25 16
2,5 - 3,0 2,75 31
3,0 - 3,5 3,25 34
3,5 - 4,0 3,75 11
4,0 - 4,5 4,25 4
4,5 - 5,0 4,75 1
Total
Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.
Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é, é o
valor que ocupa o centro da distribuição, de onde conclui-se que 50% dos elementos ficam abaixo dela e
50% ficam acima.
Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou população,
em duas partes iguais.
0 Med 100%
a) Variável Discreta: os dados estão dispostos em forma de rol ou em uma distribuição de freqüência
simples.
Se "n" for ímpar:
Med = elemento central (de ordem [(n + 1)/2]º)
Se "n" for par:
Med = média aritmética dos dois elementos centrais (de ordem (n/2)º e [(n/2) + 1]º)
Ex1.: Seja a amostra: 1, 2, 3, 4, 5 Med = 3
21
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Ex2.: Seja a amostra: 1, 2, 3, 4 Med = (2 + 3)/2 = 2,5
Ex3.: Suponha a seguinte distribuição de freqüência simples.
X fi
1 1 1
2 3 4
3 5 9
4 2 11
Total 11 -
n = 11 (ímpar)
Elemento mediano: [(n+1)/2]º = 6º elemento
3ª classe contém o 6º elemento Med = 3
Ex4.: Suponha a seguinte distribuição de freqüência simples.
X fi
82 5 5
85 10 15
87 15 30
89 8 38
90 4 42
Total 42 -
n = 42 (par)
Elemento mediano: (n/2)º = 21º elemento
(n/2)º + 1 = 22º elemento
3ª classe contém o 21º e o 22º elemento
Med = (87 + 87)/2 = 87
b) Variável Contínua: os dados estão agrupados em uma distribuição de freqüências em classes, então:
(1º Passo) Calcular a ordem (n/2)º. Como a variável é contínua não importa se é par ou ímpar.
(2º Passo) Através da identificar a classe que contém a mediana, isto é, a posição da mediana.
22
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
(3º Passo) Utilizar a fórmula:
LIMed = limite inferior da classe que contém a mediana;
PMed = posição da mediana = = xº elemento;
= freqüência absoluta acumulada "abaixo de" da classe anterior a classe que contém a mediana;
fMe = freqüência absoluta da classe que contém a mediana;
iMe = intervalo da classe que contém a mediana;
Ex.: No exemplo acima (nascidos vivos segundo peso ao nascer, em kg) a mediana é dada por:
Classes Pm fi
1,5 - 2,0 1,75 3 3
2,0 - 2,5 2,25 16 19
2,5 - 3,0 2,75 31 50
3,0 - 3,5 3,25 34 84
3,5 - 4,0 3,75 11 95
4,0 - 4,5 4,25 4 99
4,5 - 5,0 4,75 1 100
PMe = 50º elemento 3ª classe: [2,5; 3,0)
Moda
É o valor que ocorre com maior freqüência, ou seja, aquele que mais se repete.
Ex.: Na série 3, 4, 5, 7, 7, 7, 9, 9 Mo = 7
Série Unimodal (tem uma única moda)
Ex.: Na série 3, 5, 6, 6, 6, 7, 8 Mo = 6
23
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Série Bimodal (ocorrem duas modas)
Ex.: Na série 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Mo1 = 5 e Mo2 = 9
Série Trimodal (ocorrem três modas)
Ex.: Na série 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Mo1 = 4, Mo2 = 7 e Mo3 = 9
Série Polimodal (ocorrem quatro ou mais modas)
Ex.: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 M o1 = 0, Mo2 = 3, Mo3 = 9, Mo4 = 12 e Mo5
= 13
Série Amodal (não existe moda)
Ex.: Na série 0, 1, 3, 4, 7, 8, não existe moda
a) Dados Apresentados em uma Distribuição de Freqüência Simples
Mo = elemento que tenha maior freqüência
Ex1.:
X f
1 13
3 15
6 25
10 8
Total 61
Mo = 6
Ex2.:
Tipo de Sangue f
O 547
A 441
B 123
AB 25
Total 1136
24
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Mo = sangue do tipo "O"
b) Dados Apresentados em uma Distribuição de Freqüência Classes.
Nesse caso, a moda pode ser determinada através de quatro processos.
1. Moda Bruta (MoB)
Corresponde ao ponto médio da classe modal, ou seja, MoB = (li + ls)/2
Ex.: Quantidade de Creatinina
Classes fi
1,08 - 1,26 5
1,26 - 1,44 13
1,44 - 1,62 32
1,62 - 1,80 18
1,80 - 1,98 11
1,98 - 2,16 2
2,16 - 2,34 3
2. Moda de Pearson (MoP)
Utilizada mais especificamente, juntamente com e Med, para mostrar o comportamento da
distribuição, em relação a concentração ou não de seus elementos.
Utiliza-se a MoP para a análise da assimetria.
25
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Assimetria à esquerda: (concentração à direita ou nos valores maiores)
Assimetria à direita: (concentração à esquerda ou nos valores menores)
Simétrica: (concentração no centro)
Ex.: Calcule a moda de Pearson para os seguintes dados = 1,61 e Med = 1,57.
= 3.(1,57) - 2.(1,61) = 1,49
Análise: , o que indica uma assimetria à direita, isto é, uma maior concentração à
esquerda (ou em direção aos valores menores).
3. Moda de King (MoK)
liMo = limite inferior da classe modal;
fpost = freqüência absoluta da classe posterior à classe modal;
fant = freqüência absoluta da classe anterior à classe modal;
iMo = ls - li = intervalo da classe modal;
4. Moda de Czuber (MoC)
onde
Ex.: Baseado no exemplo da distribuição de freqüência apresentada no primeiro processo (moda bruta)
calcule as modas de King e de Czuber.
Moda de King:
26
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Classe Modal = 3ª classe [1,44; 1,62) com fi = 32
fant = 13
fpost = 18
iMo = (1,62) - (1,44) = 0,18
Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.
Moda de Czuber:
Classe Modal = 3ª classe [1,44; 1,62) com fi = 32
fant = 13 fmáx = 32
fpost = 18 d1 = 32 - 13 = 19
iMo = (1,62) - (1,44) = 0,18 d2 = 32 - 18 = 14
Análise: valores próximos ou iguais a 1,54 ocorrem com maior freqüência.
– MEDIDAS DE DISPERSÃO
Introdução
Utilizaremos o termo dispersão para indicar o grau de afastamento de um conjunto de números em
relação a sua média, pois ainda que consideremos a média como um número que tem a faculdade de
representar uma série de valores ela não pode por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõem o conjunto. O nosso objetivo é construir
medidas que avaliem a representatividade da média para isto usaremos as medidas de dispersão.
27
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são
suficientes para caracterizar totalmente uma seqüência numérica.
Se observarmos as seguintes seqüências:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a média aritmética de cada um desses conjuntos, obtemos:
Observamos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
No entanto, são seqüências completamente distintas do ponto de vista da variabilidade de dados.
Na seqüência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor da série.
Na seqüência Y, a média 70 representa bem a série, mas existem elementos da série levemente
diferenciados da média 70.
Na seqüência Z, existem muitos elementos bastante diferenciados da média 70.
Concluímos que a média 70 representa otimamente a seqüência X, representa bem a seqüência Y, mas
não representa bem a seqüência Z.
Nosso objetivo é construir medidas que avaliem a representatividade da média. Para isto,
usaremos as medidas de dispersão.
Observe que na seqüência X os dados estão totalmente concentrados sobre a média 70, não há
dispersão de dados. Na seqüência Y, há forte concentração dos dados sobre a média 70, mas há fraca
dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte dispersão
de dados em relação à média 70.
As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e
coeficiente de variação.
Variância
28
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma dos
quadrados dos desvios e o número de elementos. É classificada em dois tipos:
Variância Populacional ( )
Variância Amostral (s2)
Exemplo: Calcular a variância das notas obtidas por quatro alunos em cinco provas
Alunos Notas
Variância
Amostral(S2)
Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25)2 /5] = 0
João 6 4 5 4 6 129 1
José 10 5 5 5 0 25 =1/4. [( 175) – (25)2/5]= = 12,5
Pedro 10 10 5 0 0 225 25
(preencha os espaços em branco realizando os cálculos necessários)
Comentários:
As notas de Antônio não variaram s2 = 0;
As notas de João variaram menos que as notas de José;
As notas de Pedro variaram mais que as outras.
IMPORTANTE: Quando os dados estão dispostos em uma tabela de distribuição de freqüência, utiliza-
se a fórmula:
1º Caso – Freqüência Simples
2º Caso – Freqüência em Classes
ATENÇÃO: “Desvantagem” do uso da variância
No cálculo da variância, quando elevamos ao quadrado a diferença , a unidade de medida
da série fica também elevada ao quadrado.
Portanto, a variância é dada sempre no quadrado da unidade de medida da série.
29
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Se os dados são expressos em metros, a variância é expressa em metros quadrados.
Em algumas situações, a unidade de medida da variância nem faz sentido. É o caso, por exemplo,
em que os dados são expressos em litros. A variância será expressa em litros quadrados.
Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou seja:
variância não tem interpretação.
Desvio Padrão
Medida de dispersão que apresenta as propriedades da variância e tem a mesma unidade de
medida dos dados. É a raiz quadrada da variância.
Notações: 1) Quando a seqüência de dados representa uma população a variância será denotada por e
o desvio padrão correspondente por .
2) Quando a seqüência de dados representa uma amostra a variância será denotada por e o
desvio padrão correspondente por .
Desvio Padrão Populacional ( )
Desvio Padrão Amostral (s)
OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos em torno da
média.
Exemplo: Calcular o desvio padrão das notas obtidas por quatro alunos em cinco provas
Alunos Notas
Desvio padrão
amostral ( )
Antônio 5 5 5 5 5 25 =1/4 . [(125)-(25)2 /5] = 0 0
João 6 4 5 4 6 129 =1
José 10 5 5 5 0 25
=1/4. [(175) -
(25)2/5]=5
Pedro 10 10 5 0 0 225 =25 5
(preencha os espaços em branco realizando os cálculos necessários)
30
Solução: Utilizar o DESVIO PADRÃO como medida
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Interpretação do Desvio Padrão
O desvio padrão é, sem dúvida, a mais importante das medidas de dispersão.
É fundamental que o interessado consiga relacionar o valor obtido do desvio padrão com os dados
da série. Quando uma curva de freqüência representativa da série é perfeitamente simétrica (
), podemos afirmar que os intervalos
contém aproximadamente 68% dos valores da série.
contém aproximadamente 95% dos valores da série.
contém aproximadamente 99% dos valores da série.
Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas
variações para mais ou para menos, segundo o caso.
Exemplo: Suponha uma série com média e desvio padrão , podemos interpretar estes valores
da seguinte forma:
1. Os valores da série estão concentrados em torno de 100.
2. O intervalo [95, 105] contém aproximadamente 68% dos valores da série.
O intervalo [90, 110] contém aproximadamente 95% dos valores da série.
3. O intervalo [85, 115] contém aproximadamente 99% dos valores da série.
Coeficiente de Variação (CV)
Quando as medidas de duas ou mais variáveis são expressas em unidades diferentes como
peso/altura, capacidade/comprimento, etc. não se pode compara-las através do desvio padrão, por este ser
uma medida absoluta de variabilidade. Usa-se então o CV, que é uma medida relativa, que expressa o
desvio padrão como uma porcentagem da média aritmética. Quanto mais próximo de zero, mais
homogênea é a distribuição. Quanto mais distante, mais dispersas.
31
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O
resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja dado em
porcentagem.
OBS.: um CV alto indica que a dispersão dos dados em torno da média é muito grande.
Exemplo: Calcule a média, o desvio padrão e o coeficiente de variação dos dados apresentados na tabela
abaixo. Comente os resultados, apontando quais os dados que apresentaram maior variabilidade, ou seja,
qual a variável mais homogênea (peso ou comprimento).
Peso (em kg) e comprimento (em cm) de 10 cães
Peso Comprimento X2 Y2
23,0 104 529 10816
22,7 107
21,2 103
21,5 105
17,0 100
28,4 104
19,0 108
14,5 91
19,0 102
19,5 99
Fonte: Araújo e Hossne (1997)
Solução:
a) Para a variável PESO (x)
Média
Variância
32
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Desvio padrão
Coeficiente de variação
b) Para a variável COMPRIMENTO (y)
Média
Variância
Desvio padrão
Coeficiente de variação
Conclusão:
33
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
EXERCÍCIOS:
1 – Calcule a variância, o desvio padrão e o coeficiente de variação dos dados apresentados nas tabelas
abaixo:
Tabela 01 – Taxa de glicose, em miligramas por 100 ml de sangue,
em ratos machos da raça Wistar, com 20 dias de idade
100 97,5
100 85
97,5 85
80 80
Fonte: Guimarães et all (1979)
Tabela 02 – Peso fresco, em gramas, de pulmões de cobaias machos de 90 dias de idade
Pulmão
Direito Esquerdo
1,66 1,48
2,15 1,58
2,03 1,59
2,35 1,92
1,9 1,55
Fonte: HOSSNE et all (1990)
Medição
• MEDIÇÃO: conjunto de operações que tem por objetivo determinar um valor de uma
grandeza.
• Medição é fundamental para quem trabalha com movimento humano
• Avaliar um sujeito, um atleta, uma classe, uma equipe...
• Uma avaliação correta depende da seleção, aplicação e interpretação correta dos resultados
de uma medição...
Lembre-se, para tomar uma decisão adequada, primeiro obtenha informações válidas...
34
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Metrologia
• METROLOGIA: Ciência da medição.
• GRANDEZA: Atributo de um fenômeno, corpo ou substância que pode ser qualitativamente
distinguido e quantitativamente determinado.
• PRINCÍPlO DE MEDIÇÃO: Base científica de uma medição.
• MÉTODO DE MEDIÇÃO: Seqüência lógica de operações, descritas genericamente, usadas
na execução das medições.
• PROCEDIMENTO DE MEDIÇÃO: Conjunto de operações, descritas especificamente, usadas
na execução de medições particulares, de acordo com um dado método.
• MENSURANDO: Objeto da medição. Grandeza específica submetida à medição.
• RESULTADO DE UMA MEDIÇÃO: Valor atribuído a um mensurando obtido por medição
(medida).
Unidades de medida
• UNIDADE DE MEDIDA: Grandeza específica, definida e adotada por convenção, com a qual
outras grandezas de mesma natureza são comparadas para expressar suas magnitudes em
relação àquela grandeza.
• O resultado da medição de uma grandeza é expresso pelo número de vezes que a unidade
de medida, tomada como referência, está contida na grandeza a ser determinada.
• O resultado da medição é composto por duas partes: o número e a unidade padrão em que a
grandeza foi expressa.
• Claramente, a informação de que uma pessoa saltou “15” de distância está incompleta,
porque se foram 15 cm, 15 polegadas ou até 15 m, é completamente diferente.
Sistema Internacional de Unidades
Sistema coerente de unidades adotado e recomendado pela Conferência Geral de Pesos e
Medidas (CGPM)
35
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Medida & erro
• Toda medida está sujeita à erro: erro instrumental, erro na aplicação do teste, variabilidade do
que está sendo medido (por exemplo, desempenho do sujeito).
36
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
• Para determinar corretamente um valor de uma grandeza é necessário então não só
conhecer o resultado da medição mas também o erro associado.
VALOR (DE UMA GRANDEZA): Expressão quantitativa de uma grandeza específica,
geralmente sob a forma de uma unidade de medida multiplicada por um número.
• VALOR VERDADEIRO (DE UMA GRANDEZA): Valor consistente com a definição de uma
dada grandeza específica.
• Idealmente, o objetivo de uma medição é determinar o valor verdadeiro de uma grandeza;
• Mas o resultado de uma medição é o valor observado;
• Devido ao erro no resultado da medição, o valor observado consiste no valor verdadeiro mais
o valor do erro.
• INCERTEZA DE MEDIÇÃO: Parâmetro, associado ao resultado de uma medição, que
caracteriza a dispersão dos valores que podem ser fundamentadamente atribuídos a um
mensurando.
Tipos de erro
• ERRO DE MEDIÇÃO: Resultado de uma medição menos o valor verdadeiro do mensurando.
• ERRO ALEATÓRlO: Resultado de uma medição menos a média que resultaria de um infinito
número de medições do mesmo mensurando efetuadas sob condições de repetitividade.
• ERRO SISTEMÁTICO: Média que resultaria de um infinito número de medições do mesmo
mensurando, efetuadas sob condições de repetitividade, menos o valor verdadeiro do
mensurando.
Medida e erro
Em geral em teoria de erros assume-se que:
1. O valor verdadeiro é independente do valor de erro;
2. A média dos valores de erro é zero (descontados os erros sistemáticos);
3. Os valores de erro de diferentes resultados de medição são independentes.
Como reportar o valor de uma medida
• Algarismos significativos: todos os algarismos do valor de uma medida dos quais se tem
certeza mais o primeiro algarismo de incerto da medida.
• Em geral, quantidade de algarismos significativos indica a precisão de uma medida.
37
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
– Por exemplo, é errado reportar a massa de uma pessoa determinada por uma balança
analógica (de ponteiro, com resolução de 1 kg) como sendo 70,215 kg. O correto seria 70,2 kg
(são 3 algarismos significativos e 2 é o algarismo de incerteza pois esse valor é estimado já
que não havia uma escala com essa resolução).
– A medida e o erro da medida poderia ser reportado como: 70,2±0,5 kg.
Como reportar o valor de uma medida II
• Suponha que foram feitas medidas da massa de vários indivíduos e pretende-se reportar o valor central e a dispersão dessas medidas. Para tanto, é usual reportar média e desvio padrão. Por exemplo, se as medidas foram 60,1; 65,0; 73,7; 68,5 kg, a média e desvio padrão são: m = 66.8250 kg e dp = 5.7337 kg ou 66.8250±5.7337 kg.• Esta forma de reportar média e dispersão de uma medida está errada. Não faz sentido
reportar tantos algarismos significativos considerando o erro da medida. Uma regra geral é
reportar a medida até a primeira casa decimal que já tem erro (desvio padrão nesse caso):
67±6 kg (com arredondamento).
• É aceitável reportar até a segunda casa decimal de erro e também seria correto: 66.8± 5.7 kg.
Repetitividade (de resultados de medição)
Grau de concordância entre os resultados de medições sucessivas de um mesmo
mensurando efetuadas sob as mesmas condições de medição.
Observações:
1. Estas condições são denominadas condições de repetitividade.
2. Condições de repetitividade incluem:
• mesmo procedimento de medição;
• mesmo observador;
• mesmo instrumento de medição, utilizado nas mesmas condições;
• mesmo local;
• repetição em curto período de tempo.
3. Repetitividade pode ser expressa, quantitativamente, em função das características da
dispersão dos resultados.
Reprodutibilidade (de resultados de medição)
Grau de concordância entre os resultados das medições de um mesmo mensurando
efetuadas sob condições variadas de medição.
Observações:
38
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
1. Para que uma expressão da reprodutibilidade seja válida, é necessário que sejam
especificadas as condições alteradas.
2. As condições alteradas podem incluir:
• Princípio, método e instrumento de medição;
• observador;
• padrão de referência;
• condições de utilização;
• local e tempo;
3. Reprodutibilidade pode ser expressa, quantitativamente, em função das características da
dispersão dos resultados.
Exatidão e Precisão
• EXATIDÃO (ACURÁCIA) DE MEDIÇÃO: Grau de concordância entre o resultado de uma
medição e um valor verdadeiro do mensurando. Exatidão é um conceito qualitativo.
• PRECISÃO DE MEDIÇÃO: Grau de concordância entre resultados de medição obtidos sob as
mesmas condições (repetitividade). Precisão é um conceito qualitativo.
Propriedades do resultado de uma medição
FIDEDIGNIDADE/CONFIABILIDADE (reliability) & VALIDADE
• Estas duas propriedades são comumente atribuídas como as mais importantes do resultado
de uma medição (ou da medição em si).
• Infelizmente, há várias definições diferentes para estas duas propriedades.
Boas definições são:
39
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
• FIDEDIGNIDADE: grau de repetitividade e reprodutibilidade do resultado de uma medição
(precisão).
• VALIDADE: grau de exatidão (acurácia) do resultado de uma medição (o quanto o resultado
se refere ao que se queria medir ou se pensava estar medindo).
Estimativas de fidedignidade/confiabilidade
• TESTE/RETESTE: aplicação do mesmo teste mais de uma vez nos mesmos sujeitos e
comparar os resultados.
• CONSISTÊNCIA INTERNA: aplicação de subgrupos do teste que medem o mesmo conceito.
Por exemplo, aplicar dois grupos de questões que avaliam o mesmo conceito e comparar os
resultados.
Tipos de validade
Validade pode ser dividida em:
1. Lógica
2. De conteúdo
3. De critério
4. De constructo
Validade lógica
• Diz-se de uma medição que utiliza na medição a própria variável que está sendo
determinada.
• Por exemplo, um teste de força muscular, que consiste em medir com um dinamômetro a
força que uma pessoa produz, tem validade lógica.
• Não há teste estatístico para esta propriedade.
Validade de conteúdo
• As medidas do teste devem estar relacionadas ao que se pretende avaliar.
• Exemplo: uma prova de um curso deve avaliar todo o conteúdo do curso. Uma peneira no
futebol deve ser um teste que avalie domínio de bola, posicionamento no campo, chute, e não
um teste que avalie número de flexões.
• Não há teste estatístico para esta propriedade.
40
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Validade de critério
• Relação do resultado de uma medição com um padrão ou critério reconhecidamente aceito
• Validade concorrente: validade de duas medidas que estão sendo aplicadas ao mesmo
tempo. Exemplo: validação do teste de cooper em relação ao teste de VO2 (referência, padrão
ouro).
• Validade preditiva: validade de uma medida como preditora de um resultado. Exemplo:
detecção de talento, predição da gordura corporal por dobras cutâneas.
Validade de constructo
• Grau que um teste mede uma variável que não pode ser observada diretamente, um
contructo (por exemplo, inteligência, ansiedade).
• A validade de constructo é estabelecida relacionando o resultado do teste com o
comportamento esperado.
41
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
UNIDADE II
INTRODUÇÃO A PROBABILIDADE
A Estatística está ligada à Teoria da Probabilidade e vice-versa. Ela se faz presente em várias
situações, como por exemplo, nas técnicas de amostragem. Na Estatística Indutiva, a probabilidade é um
ferramental indispensável, pois todo o processo de inferência ocorre com uma determinada margem de
incerteza. Sendo assim, se faz necessário aos usuários de Estatística adquirir pelo menos, noções básicas
sobre essa teoria.
1.1 – Conceitos fundamentais
a) Experimentos aleatórios e determinísticos.
Podemos distinguir dois tipos de experimentos. Observe as seguintes situações:
E.1) Experimentos do tipo 1:
i) Uma injeção contendo uma substância letal, altamente eficaz, que tem efeito em apenas 10 minutos, é
aplicada em 10 cobaias. Após duas horas, o número de sobreviventes é contado.
ii) Um recipiente com água é colocado para ferver, na cidade de Santos (ao nível do mar). A temperatura
de ebulição da água é registrada.
E. 2) Experimentos do tipo 2:
i) Jogar uma moeda e observar a face voltada para cima.
ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.
Podemos dizer que nos experimentos do tipo I, os resultados são conhecidos à priori, ou seja,
antes de se realizar o experimento. Assim, fatalmente não haverá sobreviventes no primeiro exemplo,
assim, como se sabe que água ferve a 100º C, ao nível do mar. Esses experimentos são chamados de
deterministicos e não são de interesse do ponto de vista da probabilidade. Já os experimentos do tipo 2,
são chamados aleatórios e, por mais que nos esforcemos em prever o resultado, ele só e determinado após
a realização do experimento. Portanto, os experimentos aleatórios são aqueles que repetidos sob as
mesmas condições podem, levar a resultados distintos. Estes sim, são objeto de interesse da Teoria da
Probabilidade.
42
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
b) Espaço Amostral e eventos
Embora nos experimentos aleatórios não seja possível identificar com exatidão o resultado à priori
, é possível descrever todos os possíveis resultados. A esse conjunto, da-se o nome de espaço amostral.
Aqui, denotaremos espaço amostral pela letra grega .
i) E = jogar um dado e observar o número da face superior
= cara, coroa
ii) Medir o tempo de sobrevida de um paciente com câncer, após aplicação de quimioterapia.
Evento e qualquer subconjunto de , incluindo , evento impossível e o próprio , evento certo.
Exemplos (relacionados com os experimentos anteriores).
Evento 1 – “ocorre cara”
A = cara
Evento 2 – “ o paciente não sobrevive”
Eventos complementares
Dado um evento A de , o evento complementar de A, denotado A, é formado por todos os
elementos de , que não estão em A .
Considerando os exemplos anteriores temos:
É imediato observar que:
i) A A =
ii) A A =
Esquema ilustrativo
43
AA
A
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Eventos mutuamente exclusivos (ou excludentes)
Dois eventos A e B de um mesmo espaço amostral , são considerados mutuamente exclusivos se
a ocorrência de um deles exclui a ocorrência do outro. Por outras palavras, os dois não podem ocorrer
simultaneamente, ou simplesmente se A B = .
Exemplo: No lançamento de um dado honesto, os eventos “número par” e “número ímpar” são mutuamente exclusivos.
Utilizando operações com conjuntos, podem-se formar novos eventos:
i) (A B) é o evento que ocorre se A ocorre ou se B ocorre ou ambos ocorrem;
ii) (A B) é o evento que ocorre se A ocorre e B ocorre;
iii) ( ) é o evento que ocorre se A não ocorre;
iv) Dois eventos A e B são denominados mutuamente exclusivos, se eles não puderem ocorrer
simultaneamente, isto é, (A B) = .
v) Eventos complementares são sempre mutuamente excludentes, mas a recíproca nem sempre é
sempre verdadeira.
c) Conceito clássico
Probabilidade – É o grau de confiança que se tem na ocorrência de um determinado evento.
Seja um espaço amostral finito e A um evento qualquer, então a probabilidade de ocorrer A é:
Onde, #A é o nº de maneiras que ocorre o evento "A"
# nº de maneiras que ocorre o espaço amostral
ou ainda,
Onde, N.C.F. é o nº de casos favoráveis
N.T.C. nº total de casos
Essa probabilidade deve satisfazer as seguintes condições:
a) 0 P(A) 1;
b) P () = 1
c) Se A e B são eventos mutuamente exclusivos, então: P (A B) = P (A) + P (B)
44
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Exemplos:
1) Lança-se um dado. Qual é a probabilidade de sair um número ímpar? Qual é a probabilidade de sair o
número 2?
2) Uma carta é extraída ao acaso de um baralho com 52 cartas. Qual é a probabilidade de sair um às?
NOTAS:
a) A probabilidade varia entre 0 e 1 ou entre 0 e 100%;
b) Se é certo de ocorrer determinado evento, a P (desse evento) = 1 ou 100%. Se é impossível ocorrer
determinado evento a P (desse evento) = 0. Exemplo, lança-se um dado:
P (ocorrer um nº menor que 8) =
P (ocorrer um nº maior que 8) =
TEOREMAS:
1 – Se é o conjunto vazio, então P() = 0
2 – Se é complementar do evento A, então P( ) =1 – P(A)
3 – Se A B, então P(A) P(B)
4 – Teorema da soma: se A e B são dois eventos quaisquer, então,
P(A B) = P(A) + P(B) – P(A B)
P(A B C) = P(A) + P(B) + P(C) – P(A B) – P(A C) – P(B C) + P(A B C)
Exercício: lance um dado.
Verifique o espaço amostral;
Considere os eventos: A = um nº par ocorre;
B = o número 5 ocorre;
C = um nº maior que 3 ocorre.
Calcule: P(A), P(B), P(C), P(A B), P(A C), P(B C),
45
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
1 2 - Probabilidade Condicional:
Definição: denomina-se probabilidade condicional à probabilidade de ocorrer determinado evento sob
uma dada condição. Sejam A e B dois eventos, denota-se a probabilidade condicionada do
evento quando tiver ocorrido por,
ou
Exemplo:
Dois dados são lançados, registrando-se os resultados com (x1, x2 ). Considere os seguintes eventos:
= { (x1, x2); x1 + x2 = 10} e = { (x1, x2); x1 > x2}
Calcule , , e
Espaço amostral:
Espaço amostral de A:
Espaço amostral de B:
Qual a P(A B) ?
Resp.: (A B) = { (x1, x2); x1 + x2 = 10 e x1 > x2}
(A B) = {(6,4)} P(A B) = 1/36.
A partir da definição de "Probabilidade Condicional" pode-se enunciar o TEOREMA DO PRODUTO:
P(A\B ) = P(A B) / P(B) P(A B) = P(B) . P(A\B )
P(B\A ) = P(A B) / P(A) P(A B) = P(A) . P(B\A )
46
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
1 3 - Independência Probabilística
Dois eventos A e B, de , são independentes se e somente se:
Ou seja, a ocorrência de um deles não condiciona a ocorrência do outro e vice-versa. Desse modo, temos
também que:
Como por exemplo, considere o experimento aleatório do lançamento simultâneo de um dado e
uma moeda e sejam os eventos:
A = (cara, 1); (cara,3); (cara,4); (cara,4); (cara,5); (cara,6) [“ocorrer cara”
B = (cara, 6); (coroa,6) [“ocorrer número 6”
Será que os eventos A e B são independentes
É imediato verificar que P(A\B) = P(A) =1/2, assim como, P(B\A) =P(B) = 1/6, portanto os eventos A e B
são independentes. E, nesse contexto, a probabilidade de ocorrer a e B simultaneamente é dada por:
1 4 - Teorema de Bayes
Seja o espaço amostral associado a um experimento aleatório e uma partição de
. De tal forma que e seja A um evento qualquer de . Suponha que
sejam conhecidas todas as probabilidades condicionais do tipo bem como todas as
probabilidades de cada um dos eventos da partição de . Desejando-se saber qual é a probabilidade de
ocorrer dado que ocorreu A .
Esse resultado é dado pelo teorema da Bayes também conhecido como “regra das probabilidades
das hipóteses” e é uma das relações mais importantes envolvendo probabilidades condicionais:
Exemplo: Numa Faculdade funcionam três cursos C1, C2, C3. Sabe-se que a proporção de alunos
fumantes nos três cursos é de 0,25; 0,55 e 0,40; respectivamente. Um aluno é selecionado ao acaso e
sabe-se que ele é fumante. Nessas condições, qual é a probabilidade de que ele seja do curso C3?
47
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Trata-se de um problema típico para a aplicação do Teorema de Bayes. Costuma ser elucidativo,
nesses casos, a árvore das possibilidades da situação descrita:
P (C1) Curso Fuma?
Então;
Esquema ilustrativo da partição do espaço amostral em 3 eventos exaustivo
UNIDADE III
PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADE
48
1/3
1/3
1/3
C1
C3
C2 11/20
9/20
Sim
Não1/4
3/4
2/5
3/5
Sim
Não
Sim
Não
A
C3
C1 C2
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Em muitas situações de interesse pratico que consideramos, queremos estudar o comportamento
de uma ou mais variáveis. Assim, podemos estar interessados em estudar a distribuição das alturas e
pesos de pessoas de uma população. Escolhida uma pessoa ao acaso, desta população, obtemos o seu peso
e a sua altura e estamos, pois considerando duas variáveis. Em muitas situações, como a descrita, a
associação pode ser arbitrária. Por exemplo, considere o caso de um questionário, em que uma pessoa é
indagada a respeito de uma proposição e as respostas possíveis são “sim” ou “não”, respectivamente.
(Mais adiante estudaremos com pormenores este tipo de variável).
2.1 - VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTINUAS
As variáveis aleatórias (que descrevemos de modo abreviado: v. a .) podem ser de dois tipos:
discretas ou continuas. Uma v.a. é dita discreta quando ela assume somente valores num conjunto
enumerável de pontos do conjunto real. Ela é uma v.a . continua se for do tipo que pode assumir qualquer
valor em um intervalo real.
2 .1 - Definição: Sejam e um experimento e um espaço amostral associado ao experimento. Uma
função , que associe a cada elemento um número real, , é denominada variável aleatória.
É toda variável influenciada pelo acaso.
Ex. 1: Consideremos o experimento aleatório: extraem-se duas bolas, sem reposição, de uma urna
que contem: 2 bolas brancas (B) e 3 vermelhas (V). Vamos definir a v. a . X como:
= “o numero de bolas vermelhas obtidas nas duas extrações”. Portanto os valores possíveis que a v. a.
X pode assumir são :
= 0, se ocorre o evento: “BB”, (duas bolas brancas)
=1, se ocorre o evento: “VB” ou “BV” (Vermelha e branca ou branca e vermelha)
= 2, se ocorre o evento: “VV” (Duas bolas Vermelhas)
49
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
2.2 - Valor Esperado de Variáveis Aleatórias Discretas
Definição: Se são os possíveis valores de v. a. , e
são as respectivas probabilidades então o valor esperado, (ou esperança matemática ou media), de ,
denotado por ou , é definido por:
para v. a’ s discretas para v. a’ s contínuas
Ex. 4: Consideremos o novamente o exemplo da urna com 3 bolas vermelhas e 2 brancas, de onde se
extraem sem reposição duas bolas.
A v. a . é definida como:
= “o numero de bolas vermelhas obtidas nas duas extrações”.
Portanto:
O valor esperado ou média da v. a. será:
Ex. 5: Consideremos o novamente o exemplo do lançamento de uma moeda “honesta” duas vezes. Seja a
v. a. , definida como:
= “nº de ”caras” obtidas nos dois lançamentos”. . Portanto temos:
Então que a média desta v.a. (seu valor esperado) será:
2.3 – Propriedades
1) A média de uma constante é a própria constante:
50
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
2) Multiplicando uma v.a. X por uma constante, sua média fica multiplicada por essa constante:
3) Somando ou subtraindo uma constante a uma v.a. a sua média fica somada ou subtraída da mesma
constante.
4) A média da soma ou da diferença de duas v. a.’s é a soma ou a diferença das médias.
5) A média do produto de duas v. a’s independentes é o produto das médias.
Estas propriedades também são válidas para as variáveis contínuas.
Ex. 6: Seja o experimento: Lançar um dado “honesto” e observar o número que ocorre na face superior.
Então temos, . Sejam as variáveis aleatórias e , definidas como:
= “duas vezes o numero que aparece na face superior do dado” e,
= 1, se ocorre um número ímpar na face superior do dado.
= 3, se ocorre um número par na face superior do dado.
Portanto,
Então temos as distribuições de probabilidade e os respectivos cálculos de suas esperanças:
a) v. a. b) v. a.
2 1/6 2/64 1/6 4/6 6 1/6 6/68 1/6 8/6
10 1/6 10/612 1/6 12/6 1 42/6=7
Logo: e
Seja a constante real e v. a. dada por , isto é, . Segundo a propriedade
(2) devemos ter que:
1 1/2 1/23 1/2 3/2 1 42/6=7
51
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
desde que .
vamos confirmar se realmente . Os valores possíveis da v. a. dada por
serão:
portanto temos a distribuição e o respectivo calculo da media da v. a. Z.
4 1/2 4/212 1/2 12/2 1 16/2 = 8
Logo, portanto , realmente o resultado as propriedade (2) foi verificado.
Tomemos agora a v. a . como sendo .
Pela propriedade (3) devemos ter que
Vamos verificar se realmente . Analogamente ao procedimento anterior, temos que, se
é definida como , então os possíveis valores da v. a serão:
Portanto temos:
5 1/2 5/27 1/2 7/2 1 12/2 = 6
Logo, Desta forma se verifica o resultado da propriedade (3).
Tomemos agora a v. a . , definida como: .. Pela propriedade (4) devemos ter:
52
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Vamos verificar se, de fato, . Temos que, se é dada por:
, então os possíveis valores da v.a serão:
Assim, v. a. tem distribuição e média conforme a tabela:
3 1/6 3/67 2/6 14/6
11 2/6 22/615 1/6 15/6 1 54/6 = 9
E, concluímos que o resultado da propriedade (4) se verifica para os valores deste exemplo.
2.4 – Variância de uma Variável Aleatória
Definição: Seja uma v.a.. Definimos a variância de , denotada por ou , da seguinte
maneira:
2.5 – Propriedades
1) Se for uma constante
2) Se for uma constante
3) Se for uma v. a. bidimensional, e se forem independentes então:
53
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
.
Em muitos problemas teóricos e aplicados, e a primeira vista, sob diversas condições, várias
funções de densidade (ou distribuição) de probabilidade aparecem com tanta freqüência que merecem ser
estudadas.
2.7 - Principais Distribuições Discretas
2.7.2 Distribuição Binomial
Consideremos n tentativas de um mesmo experimento aleatório. Cada tentativa admite apenas
dois resultados: fracasso com probabilidade q e sucesso com probabilidade p, p + q = 1. As
probabilidades de sucesso e fracasso são as mesmas para cada tentativa.
Seja X: nº de sucessos de n tentativas independentes.
Determine a função de probabilidades da variável X, isto é, P(X = k).
Um resultado particular (RP):
Logo,
P(RP) = P(SSS ... SFFF ... F) =
Considerando todas as n-úplas com k sucessos temos:
P(X = k) =
A variável X tem distribuição Binomial, com parâmetros n e p, e indicaremos pela notação X~B(n,p).
Ex. Uma prova tipo teste tem 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma
das alternativas é a correta. Se um aluno resolve a prova respondendo as questões, qual a probabilidade de
tirar nota 5, sabendo-se que a prova vale 10?
Solução: X = nº de acertos. X = 0, 1, .........., 50
p = P( acerto ) = 1/5 X : B( 50, 1/5 )
P( X = 25 ) =
54
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Esperança (média) e Variância
Se X ~ B( n, p ) P(X = k) = , logo ;
E(X) = n.p
Var(X) = n.p.q
2.7.3 Distribuição Hipergeométrica
Consideremos uma população com N elementos, dos quais r tem uma determinada característica
(a retirada de um desses elementos corresponde ao sucesso). Retiramos dessa população, sem reposição,
uma amostra de tamanho n.
Seja X: nº de sucessos na amostra (saída do elemento com a característica). Qual a P(X = k)?
Podemos tirar amostras sem reposição. Os sucessos na amostra podem ocorrer de maneiras e
fracassos de modos.
Logo,
, 0 k n e k r
A variável X assim definida tem distribuição Hipergeométrica.
Esperança (média) e Variância
E( X ) = n.p
Var( X ) = n.p.(1-p) onde p =
Ex.: Pequenos motores são guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada
caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa é aceita.
Se pelo menos um for defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa
caixa. Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa?
Solução: X: nº de motores defeituosos da amostra.
N = 50; r = 6; n = 5
55
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
P(X 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 - = 1 – 0,5126 = 0,4874
2.7.4 Distribuição de Poisson
Consideremos a probabilidade de ocorrência de sucessos em um determinado intervalo.
A probabilidade da ocorrência de um sucesso no intervalo é proporcional ao intervalo. A
probabilidade de mais de um sucesso nesse intervalo é bastante pequena com relação à probabilidade de
um sucesso. Por exemplo: automóveis que passam numa esquina. Poderemos num determinado intervalo
de tempo anotar o nº de carros que passaram, porém, o nº de carros que deixaram de passar pela esquina
não poderá ser determinado.
Seja X o nº de sucessos no intervalo então:
Esperança (média) e Variância
E( X ) =
Var( X ) =
Ex.: Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade de que uma página
contenha pelo menos 3 erros?
Solução: X: nº de erros por página e = 1
P(X 3) = 1 – P(X < 3) = 1- {P(X = 0) + P(X = 1) + P(X = 2)} =
= 1 - = 1 - {0,367879 + 0,367879 + 0,183940} =
= 1 – 0,919698 = 0,080302
EXERCÍCIOS
56
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
1) A probabilidade de um menino ser daltônico e 6%. Qual é a probabilidade de serem daltônicos
todos os 4 meninos que se apresentaram, em determinado dia, para um exame oftalmológico?
2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual a
probabilidade de se obter:
a) exatamente duas caras?
b) Pelo menos uma cara?
c) Mais de uma cara?
2) Seja X uma v. a. correspondente ao número de caras em quatro lançamentos de uma moeda. Qual
a probabilidade de se obter:
d) exatamente duas caras?
e) Pelo menos uma cara?
f) Mais de uma cara?
3) Se o número de chamadas telefônicas que um operador recebe entre 9:00 e 9:05 segue uma
distribuição de Poisson com = 2, qual é a probabilidade de que o operador não receba nenhuma
chamada amanhã, no mesmo intervalo?
4) Em estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A
e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos
pesquisadores através de capturas periódicas. Determinar a probabilidade de, em três jacarés capturados
de uma vez, obtemos:
a) Todos da espécie ª
b) Nem todos serem da espécie B.
c) A maioria ser da espécie A.
5) Um laboratório estuda a emissão de partículas de certo material radioativo. Seja N: número de
partículas emitidas em 1 minuto. O laboratório admite que n tem função de probabilidade Poisson com
parâmetro 5, isto é,
a) Calcule a probabilidade de que em um minuto não hajam emissões de partículas.
b) Determine a probabilidade de que pelo menos uma partícula seja emitida em um minuto.
57
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
c) Qual a probabilidade que, em um minuto, o número de partículas emitidas esteja entre 2 e
5 (inclusive)?
2.8 - Principais Distribuições Contínuas
As variáveis aleatórias contínuas são muito usadas para descrever fenômenos físicos, principalmente aqueles que envolvem o tempo. Este capítulo apresentará as distribuições de probabilidade mais usadas para descrever a funcionalidade entre as variáveis aleatórias contínuas.
As distribuições contínuas de probabilidade discutidas aqui são: distribuição normal ou gaussiana, distribuição exponencial, distribuição uniforme
2.8.2 - A Distribuição Normal
A distribuição normal (ou Gaussiana) é a mais importante distribuição de probabilidade na
estatística. Isto porque para amostras grandes vários fenômenos estudados convergem para uma curva
normal.
Como se sabe, as variáveis contínuas resultam, em geral, de mensurações (medidas) e podem
assumir quaisquer valores em um intervalo real. Assim, comprimento, área, altura, volume, peso,
pressão, renda familiar, etc, são alguns exemplos de variáveis contínuas. Vimos na Estatística Descritiva
que a apresentação gráfica dessas variáveis pode ser feita através de um histograma ou polígono de
freqüências. Em grande parte dos casos, esses gráficos têm aspecto similar, sugerindo uma distribuição
para os dados em foram de sino, como mostra a figura abaixo:
58
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
A curva sob o gráfico acima pode ser interpretada como um limite teórico para a descrição dos
dados, pois à medida que aumentamos o tamanho da amostra mais as características amostrais se
aproximam dos parâmetros populacionais, de tal sorte que podemos supor uma linha totalmente polida,
simétrica e mesocúrtica para o verdadeiro tamanho da população. A essa curava dá-se o nome de curva
normal ou curava gausiana e os dados que aderem a ela seguem a chamada distribuição normal.
A distribuição normal, como já foi dito, é a principal distribuição de variável aleatória contínua.
A caracterização de distribuições contínuas se dá através de uma função densidade de probabilidade. É
através dessas funções, por exemplo, que podemos calcular a probabilidade de uma variável aleatória
pertencer a um determinado intervalo.
Dizemos que a v. a. X tem distribuição normal, com parâmetros e 2,
, se sua f.d.p. é dada por:
, para todo x R,
em que os parâmetros e 2 referem-se respectivamente a média e a variância da variável
aleatória X.
Notação: X~N( , 2)
Gráfico: A figura abaixo ilustra uma particular curva normal, determinada por valores particulares
de e 2.
59
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Pode-se demonstrar que:
a) E(X) =
b) Var(X) = 2
c) f(x) 0 quando x
d) - e + são pontos de inflexão de f(x);
e) x = é ponto de máximo de f(x), e o valor máximo é ;
f) f(x) é simétrica ao redor de x = , isto é, f( + x) = f( - x), para todo
g) a variável aleatória (x) pode assumir qualquer valor real.
h) o gráfico é uma curva em forma de sino, simétrica em torno da média .
i) a área total sob a curva vale 1, porque essa área corresponde à probabilidade de a variável
aleatória assumir qualquer valor real.
j) como a curva é simétrica em torno da média, os valores maiores do que a média e os valores
menores do que a média ocorrem com igual probabilidade.
PROBLEMAS para o cálculo das probabilidades:
1. integração de f (x), pois para o cálculo é necessário o desenvolvimento em séries;
2. elaboração de uma tabela de probabilidades, pois f (x) depende de 2 parâmetros , μ e μ, o que
acarretaria um grande trabalho para tabelar essas probabilidades considerando-se as várias
combinações de μ e μ.
60
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
SOLUÇÃO: transformação de variáveis (x em z)
A Normal-Padrão
Para o cálculo das probabilidades, surgem dois grandes problemas: primeiro, para integração de
f(x), pois para o cálculo é necessário o desenvolvimento em séries; segundo, seria a elaboração de uma
tabela de probabilidades, pois f(x) depende de dois parâmetros, fato este que acarretaria um grande
trabalho para tabelar essas probabilidades considerando-se as várias combinações de e 2.
Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim, a
distribuição normal padronizada ou reduzida:
Quando = 0 e 2 = 1, temos uma normal padrão ou reduzida, e escrevemos: N(0,1).
Se X~N(, 2), então a v.a. Z definida por
terá uma distribuição N(0,1).
É fácil demonstrar que Z tem média 0 e variância 1. A normalidade de Z já não é imediata e não
será provada aqui. A figura abaixo ilustra a N(0,1).
Suponha, então, que X~N(, 2) e queiramos determinar
61
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
P(a X b) = . (Ver figura)
A integral acima não pode ser calculada exatamente, por métodos numéricos. No entanto, para
cada valor de e cada valor de , teríamos que obter P(a X b) para diversos valores de a e b. Esta
tarefa é facilitada através do uso de , de sorte que somente é necessário construir uma tabela
para a distribuição normal padrão N(0,1).
Vejamos, então, como obter probabilidades a partir da Tabela da Distribuição Normal Reduzida.
Esta tabela dá as probabilidades sob uma curva normal padrão que nada mais são do que as
correspondentes áreas sob a curva. A figura ao abaixo ilustra a probabilidade fornecida pela tabela , a
saber,
P(0 Z zc),
sendo Z~N(0,1). Assim, se zc = 1,73, segue-se que
P(0 Z 1,73) = 0,4582.
62
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Exercícios:
1) Usando a tábua da Normal padrão, ou seja, se Z ~ N(0,1) estabeleça as seguintes probabilidades:
a) P (0<Z<2,13)
b) P (-2,13<Z<0)
c) P ((-2,13<Z<2,13)
d) P (Z 2,13)
e) P (Z< -2,13)
2) Numa população, o peso dos indivíduos é uma variável aleatória X que segundo estudos anteriores
segue o modelo normal com média 78 kg e desvio-padrão 10 kg. Uma pessoa é escolhida ao acaso
nessa população. Determine a probabilidade de que seu peso:
a) Seja maior que 60 kg;
b) Esteja entre 62kg e 72 kg
c) Seja inferior a 90 kg
d) Seja superior a 90 kg
DISTRIBUIÇÃO DE PROBABILIDADES GAMA
Seja X uma variável aleatória que representa o número de chegadas no intervalo de
tempo (0, t) e que segue uma distribuição de Poisson. Suponha que o tempo a v-ésima
chegada seja dada pela f.d.p.
para valores inteiros de ν.
Veja que quando ν = 1....
63
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Ou seja, a Distribuição Exponencial é um caso particular da Distribuição Gama.
DISTRIBUIÇÃO GAMA:
Idéias gerais:
Muitas variáveis atmosféricas são distintamente assimétricas, e possuem uma
assimetria para a direita. Muitos de vocês encontraram essas distribuições quando analisaram
seus dados para o seminário. Um dos exemplos mais comuns dessa situação é a precipitação.
Sabemos que não existem precipitações negativas, certo? Então vamos analisar a seguinte
situação: suponha que uma certa localidade tenha uma média de precipitação diária de 1.96 in
e desvio-padrão de 1.12 in. Utilizando a tabela de distribuições acumuladas Gaussiana
podemos calcular a probabilidade de precipitações negativas como Pr { Z ≤ (0.00 – 1.96)/1.12}
= Pr{Z≤ -1.75} = 0.040. Esta probabilidae calculada não é especialmente grande, mas por outro
lado não pode ser considerada zero. AGORA, SABEMOS PELA NATUREZA QUE
PRECIPITAÇÕES NEGATIVAS SÃO IMPOSSÍVEIS!
Uma escolha comum para representar distribuições contínuas que são assimétricas é utilizar a
distribuição GAMMA. Esta distribuição é definida pela PDF:
, onde x, α, β > 0
Os dois parâmetros da distribuição são α, chamado PARÂMETRO DE FORMA , e β O
PARÂMETRO DE ESCALA. A quantitdade Γ(α) é o valor da função matemática padrão
conhecida como FUNÇÃO GAMMA, definida pela integral:
64
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Fig. 5.3. Funções densidade de probabilidade GAMMA para 4 valores do parâmetro de forma α
(adaptado de Wilks, cap 5)
Em geral, a função gamma precisa ser avaliada numericamente, ou aproximada usando
valores tabulados como os dados acima. A função gamma satisfaz a recorrência fatorial:
Isto permite que a tabela distribuída em sala de aula seja utilizada indefinidamente. Por
exemplo, Γ(3.5)= Γ(2.5) Γ(2.5)=(2.5)(1.5) Γ(1.5)=(2.5)(1.5)(0.8862)=3.323.
A PDF da distribuição Gamma pode apresentar uma grande variedade de formas, dependendo,
portanto, do parâmetro de forma α. Para valores de α muito altos, a distribuição gamma tende à
Gaussiana
O parâmetro de escala β, tem a função de ESTICAR OU ENCOLHER (isto é escalonar) a
função de densidade gamma para a direita ou esquerda, dependendo das magnitudes gerais
dos valores dos dados representados.
Existem 2 aproximações para os estimadores da distribuição Gamma que são fáceis de
calcular à mão. Ambas empregam a estatística:
, (5.14)
1) A primeira das duas aproximações (conhecida por estimadores de Thom – Thom (1958))
para o parâmetro de forma é dada por:
65
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
(5.15)
(5.16)
2) A segunda aproximação é polinomial e utilizamos as seguintes equações:
(5.17)
Para 0≤ D ≤0.5772,
Ou
(5.18)
Para 0.5772 ≤ D ≤ 17
O parâmetro de escala é medido como na Eq. 5.16.
Como no caso da distribuição Gaussiana, a função densidade de probabilidade Gama não é
analiticamente integrável. A distribuição Gama precisa portanto ser obtida pelo calculo das
aproximações da CDF (isto é, a integral da 5.11) ou a partir das probabilidades tabuladas. A
tabela de distribuição de probabilidades Gama será fornecida em sala de aula (ou pode ser
encontrada no final do livro texto – tabela B-2). Em qualquer caso, a distribuição de
probabilidades gama será disponível para uma distribuição gama padrão com β=1. Portanto, é
sempre necessário fazer uma transformação para re-escalonar a variável X de interesse
(caracterizada por uma gama com parâmetro de escala arbitrário β) para a variável
(5.19)
Que segue uma distribuição gama com β=1. A variável padrão ζ é admensional (lembre-se que
β possui a dimensão de seus dados). O parâmetro de forma α será o mesmo para X ou para ζ.
66
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Veja que este procedimento é equivalente à transformação para a variável padronizada z no
caso da distribuição Gaussiana.
Entretanto, as PROBABILIDADES CUMULATIVAS para a distribuição gama padrão são dadas
pela função matemática conhecida como “FUNÇÃO GAMMA INCOMPLETA, P(α,ζ )= Pr
{Θ≤ζ}=F(ζ). Esta é a função que foi utilizada para calcular as probabilidades que aparecem na
tabela B.2. Ou seja, as probabilidades cumulativas para a distribuição gama padronizada na
tabela B.2 estão arranjadas de forma INVERSA DO QUE É FEITO COM AS
PROBABILIADDES GAUSSIANAS. Quer dizer, os quantis (ou valores transformados ζ) é que
estão apresentados no corpo da tabela, enquanto as probabilidades cumulativa é que estão
sendo mostradas na primeira linha da tabela. Na primeira coluna da tabela, a entrada é o valor
de alfa.
Vamos analisar o exemplo dado pelo Wilks. Considere a tabela de dados da precipitação de
Janeiro para a cidade de Ithaca durante 50 anos (1933-1982). Queremos avaliar o quão ‘não
usual” foi a precipitação observada em Ithaca em 1987 (fornecida numa tabela separada). Para
esta finalidade, procedemos da seguinte maneira:
1) Calculamos a média aritmética como de costume (no presente caso, a média é igual a
1.96in)
2) Calculamos o valor da média dos logaritmos dos totais mensais (igual a 0.5346)
3) Obtemos o valor de D como na Eq. 5.14 (igual a 0.139)
4) O método de Thom (Eq. 5.15 e 5.17) estimam α=3.76 e β=0.52in.
5) Avaliamos qual usual foi a precipitação em janeiro de 1987 (=3.15in) com a ajuda da
Tab. B2 para os parâmetros da Gama que obtivemos anteriormente. Para esta
finalidade, vamos primeiro fazer a transformação de variáveis indicado na Eq. 5.19. No
presente caso, ζ=3.15in/0.52in= 6.06.
6) O passo seguinte é encontrar no corpo da tabela onde se encontra a probabilidade 6.06
para α=3.76. O valor mais próximo de entrada de α é α=3.75. Vamos olhar na linha
correspondente onde está a probabilidade 6.06. Esta se encontra entre os valores
tabulados F(5.214)=0.90 e F(6.354)=0.90. A interpolação nos dá F(6.06)=0.874. Ou seja,
a probabilidade de chover em janeiro menos ou igual a 3.15 in em Ithaca é de 0.874. O
complementar (1- 0.874) = 0.126 é a probabilidade de chover mais do que esse valor (a
qual é equivalente a aproximadamente 1 chance em 8 (1/8).
A tabela B2 pode também ser utilizada para inverter a CDF gama para encontrar valores de
precipitação correspondendo a probabilidades cumulativas ζ=F-1(p). Valores dimensionais de
67
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
precipitação são então recuperados para reverter a transformação na Eq. 5.19. Por exemplo,
vamos considerar a estimativa da mediana para a precipitação de janeiro em Ithaca. Esta
corresponderá ao valor de ζ satisfazendo F(ζ) =0.50, o qual, na coluna correspondente a α=3.5
na Tab. B2 é 3.425. O correspondente valor dimensional da precipitação é dado pelo produto ζ
β=(3.425)(0.52in)=1.78in. Por comparação, a mediana amostral da precipitação obtida da
tabela com os dados é igual a 1.72in. Não é surpresa que a mediana é menos que a média de
1.96in, uma vez que a distribuição é alongada para a direita. (positivamente alongada ou
skewed). O engraçado nesta idéia (o que está intimamente ligado às características de uma
distribuição Gama) é que valores mais baixos do que a média são mais prováveis de ocorrer do
que valores acima da média (ou normal).
68
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
69
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
70
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
UNIDADE IV
INFERENCIA ESTATÍSTICA
ESTATÍSTICA: Ciência que diz respeito à coleta, apresentação, análise e interpretação de dados
experimentais.
ESTATÍSTICA DESCRITIVA
PROBABILIDADE ESTATISTICA
INFERÊNCIA ESTATÍSTICA
1. Introdução
Nas últimas unidades vimos como construir modelos probabilísticos para descrever alguns fenômenos.
Nessa parte, iremos estudar um ramo muito importante da Estatística conhecido como Inferência
Estatística, ou seja, como fazer afirmações sobre características de uma população, baseando-se em
resultados de uma mostra.
Inferência Estatística é o ramo da Estatística que refere-se ao processo de obter informações sobre
uma população a partir de resultados observados na amostra.
POPULAÇÃO (N) AMOSTRA (n)
Inferência Estatística
POPULAÇÃO: conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum observável.
Pode ser finita como o conjunto de alunos de uma escola em um determinado ano, ou infinita, como o
número de vezes que se pode jogar um dado.
AMOSTRA: qualquer subconjunto da população
71
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
CASOS GERAIS:
Verificar o sabor de um bolo;
Verificar a temperatura da água de uma piscina;
Avaliar a qualidade de um livro;
A grande maioria das pesquisas realizadas nas mais variadas áreas do conhecimento humano são
feiras com amostras. O pesquisador, no entanto, almeja generalizar seus resultados, ou seja, saber se o
que obteve com amostras é válido para toda a população. Essa é, sem dúvida, a essência da inferência
estatística. Formalmente, a Inferência ou Estatística Indutiva é a parte da Estatística que estuda a
estimação e os testes sobre os parâmetros populacionais.
ALGUNS CONCEITOS IMPORTANTES
AMOSTRA ALEATÓRIA: Seja X uma variável populacional. Uma amostra aleatória é o conjunto de
n variáveis aleatórias independentes, , extraídas de uma população, tal que cada tem a
mesma característica, ou distribuição da variável X.
PARÂMETRO: medida usada para descrever uma característica da população [ ].
ESTIMADOR (ESTATÍSTICA): medida usada para descrever uma característica da amostra [
]
ESTIMATIVA: é o valor numérico do estimador. Por exemplo, é uma estimativa da média
populacional .
ESTIMAÇÃO (Pontual e Intervalar)
INFERÊNCIA
ESTATÍSTICA
TESTES DE HIPÓTESES
(Paramétricos e Não-Paramétricos)
ESTIMAÇÃO PONTUAL
A partir da amostra procura-se obter um único valor de um certo parâmetro populacional.
72
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
Em geral é INSUFICIENTE!
Exemplo: A média amostral ( ) é um estimador pontual da média populacional ( ).
ESTIMAÇÃO INTERVALAR
A partir da amostra procura-se construir um intervalo de variação, , com uma certa
probabilidade de conter o verdadeiro parâmetro populacional.
TESTES PARAMÉTRICOS
A hipótese é formulada com respeito ao valor de um parâmetro populacional.
TESTES NÃO-PARAMÉTRICOS
A hipótese é formulada com respeito à natureza da distribuição da população.
ESTIMAÇÃO INTERVALAR
INTERVALOS DE CONFIANÇA
É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com determinada
probabilidade.
A probabilidade de o intervalo conter o parâmetro estimado é denominado nível de confiança
associado ao intervalo. A notação mais usual para o nível de confiança associado ao intervalo é 1 - .
Assim como as estimações pontuais, os intervalos de confiança podem ser vistos como uma técnica
para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído com os
elementos amostrais, pode-se inferir sobre um parâmetro populacional.
Fundamenta-se nas distribuições amostrais
: Parâmetro populacional
: Estimador de
73
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
A partir da distribuição de probabilidade de é possível construir um intervalo , que
contém , e exigir que a probabilidade do intervalo seja de .
O valor da probabilidade que usualmente assume os valores 90%, 95%, 98%, etc., é
denominado NÍVEL DE CONFIANÇA, e o valor é chamado NÍVEL DE SIGNIFICÂNCIA, isto é,
representa o erro que se está cometendo quando se afirma que a probabilidade do intervalo, ,
conter o verdadeiro valor do parâmetro populacional é .
VANTAGEM:
Permite uma idéia da precisão com que foi calculada a estimativa do parâmetro, pois expressa o
erro aceito ao calculá-la.
1 - Intervalo muito pequeno ALTA PRECISÃO DA ESTIMATIVA DO PARÂMETRO
2 - Quanto maior o grau de confiança MENOR PRECISÃO DA ESTIMATIVA DO PARÂMETRO
Suponha,
n = 25, e
: amplitude = 0.98
: amplitude = 1.36
INTERVALO DE CONFIANÇA PARA A MÉDIA
Neste caso, existem 2 métodos para estimativa de através do intervalo de confiança; as
utilizações desses métodos dependem do tamanho da amostra ou do fato de ter ou não conhecimento do
valor do desvio-padrão populacional. Se n 30 e a variância populacional é conhecida utiliza-se o
método da distribuição normal (a variável utilizada será a Z). No entanto, para amostras pequenas (n <
74
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
30) e variância populacional desconhecida utiliza-se o método da distribuição t-Student (a variável
utilizada será a t).
FatoresMétodos
Distribuição Normal Distribuição t-Student
Tamanho da amostra n 30 n < 30
Variância conhecida
Variável utilizada Z T
A Distribuição t de Student
Trata-se de um modelo de distribuição contínua que se assemelha à distribuição normal padrão, N(0,1).
É utilizada particularmente, quando se tem amostras com tamanhos inferiores a 30 elementos.
Possui um parâmetro chamado "grau de liberdade"
Se a distribuição de uma população é essencialmente normal (com a forma aproximadamente de
um sino), então a distribuição de
, com (n-1) graus de liberdade,
é essencialmente uma distribuição t de Student para todas as amostras de tamanho n. A distribuição t de
Student, geralmente conhecida como distribuição t, é utilizada na determinação de valores críticos
denotados por .
A tabela da t relaciona valores da distribuição t juntamente com áreas denotadas por . Os valores
de são obtidos localizando o número adequado de graus de liberdade ((n-1) gruas de liberdade).
OBS: O número de graus de liberdade para um conjunto de dados corresponde ao número de valores que
podem variar após terem sido impostas certas restrições a todos os valores.
75
EST319 – Estatística para Engenharia de Materiais I – Profa. Luciana Maria de Oliveira
PROPRIEDADES IMPORTANTES DA DISTRIBUIÇÃO t DE STUDENT:
1. A distribuição t de Student tem a mesma forma geral simétrica (curva em forma de sino)que a
distribuição normal, mas reflete maior variabilidade que é esperada em pequenas amostras.
2. A distribuição t de Student tem média t = 0 (tal como a normal padronizada, com média Z = 0).
3. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, mas é superior a 1 (ao
contrário da distribuição normal padronizada).
4. Na medida em que aumenta o tamanho da amostra, a distribuição t de Student se aproxima mais e
mais da distribuição normal padronizada. Para valores n > 30, as diferenças são tão pequenas que
podemos utilizar os valores críticos Z.
CONDIÇÕES PARA A UTILIZAÇÃO DA DISTRIBUIÇÃO t DE STUDENT:
1. O tamanho da amostra é pequeno ;
2. é desconhecido;
3. A população original tem distribuição essencialmente normal (como a distribuição da população
original normalmente é desconhecida, estimamo-la construindo um histograma dos dados amostrais).
GRAUS DE LIBERDADE DE UMA ESTATÍSTICA:
Sabe-se que, a variância de uma amostra deve ser calculada pr, s2 (x)= . A
necessidade dessa correção esta relacionada com o número de G.L, por exemplo: e
.
são estatísticas com "n" graus de liberdade, pois existem n valores xi livres que devem ser considerados
para podermos calcular o valor da estatística.
A estatística s2(x), por usar ao invés de , tem um grau de liberdade a menos. Isso ocorre porque para
o cálculo de s2(x) é necessário que se tenha calculado , ou seja, já utilizamos uma vez todo os valores da
amostra; estes estiram sendo usados pela Segunda vez para o cálculo de s2.
Exercício: Com base na tabela t de Student determine o valor da distribuição nos seguinte casos:
a) t (5; 1%)
b) t (6; 2%)
c) t (19; 5%)
d) t (21; 10%)
e) t (28; 5%)
f) t (12; 1%)
76
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
CASO 1:
INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA
POPULACIONAL CONHECIDA
Seja . Sabe-se que o estimador de , (média amostral), tem distribuição de
probabilidade dada por:
, para populações infinitas
, para populações finitas
Então,
Fixando-se um nível de confiança tem-se:
www.estatistica.ccet.ufrn.br 78
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
Exemplo: O departamento de Recursos Humanos de uma grade empresa informa que o tempo de
execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o
desvio padrão permanece aproximadamente constante em 3 min. Uma nova tarefa está sendo
implantada na empresa. Uma amostra aleatória do tempo de execução de 50 dessas novas tarefas
forneceu o valor médio de 15 min. Determine o intervalo de confiança de 95% para o tempo
médio de execução dessa nova tarefa.
CASO 2:
INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL COM A VARIÂNCIA
POPULACIONAL DESCONHECIDA
www.estatistica.ccet.ufrn.br 79
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
Estimar com base na amostra, S.
Como S é uma variável aleatória a substituição só é verificada para amostras grandes (n
30)
S é um estimador viesado para , mas aumentando o tamanho da amostra o viés tende a
desaparecer; portanto o IC para pode ser construído.
Quanto menor a amostra mais necessária se torna a introdução de uma correção: t(n-1) ao
invés de Z.
Sabe-se que, e
Então,
Para o caso de populações finitas, utilizar:
www.estatistica.ccet.ufrn.br 80
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
OBS: Quanto menor o tamanho da amostra, mais necessário se torna a introdução de uma
correção, a qual consiste em usar a variável t-Student (t(n-1)) ao invés de usar a variável Z.
Exemplo: A amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população normal.
Construir um intervalo de confiança para a média ao nível de 95%.
Solução:
Média amostral:
Desvio padrão amostral:
Variável: t(n-1) = t(9; 5%) = 2.2622
Interpretação:
Podemos afirmar que o intervalo [7.27; 10.13] contém a verdadeira média com 95% de
confiança;
A precisão dessa estimativa nos permite afirmar , com 95% de certeza, de que não
estamos errando por mais de 1,43 nessa estimação.
www.estatistica.ccet.ufrn.br 81
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
INTERVALO DE CONFIANÇA PARA A PROPORÇÃO
Sabendo que a distribuição amostral da proporção é:
, para populações infinitas.
, para populações finitas.
Quando n for grande, n 30 a distribuição binomial se aproxima da Normal, então:
Fixando-se um nível de confiança tem-se:
Exemplo: Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade revelou que
128 pessoas apresentavam insuficiência respiratória. Determine um intervalo de confiança de
95% para a proporção de habitantes dessa cidade que apresentaram insuficiência respiratória.
TESTES DE HIPÓTESES
www.estatistica.ccet.ufrn.br 82
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
Suponha que numa determinada região, o peso de crianças aos 12 anos, seja modulado
pela distribuição normal, tal que X ~N (48, 16). Um pesquisador da área médica desconfia que
devido a mudanças nos hábitos alimentares, o peso médio seja maior. Para tentar comprovar sua
suposição o pesquisador seleciona, por processo aleatório, uma amostra de 100 crianças dessa
população, obtendo como peso amostral = 51,3 kg. Será que ele tem razão? A resposta deve
ser analisada cuidadosamente e uma decisão mais segura só é possível depois de submeter seu
dados a um teste estatístico, também conhecido como teste de hipóteses.
Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada
em função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor
do parâmetro populacional, e pelos elementos amostrais faz-se um teste que indicará a rejeição,
ou não, da hipótese nula (H0).
HIPÓTESE ESTATÍSTICA
Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma
probabilidade de uma variável populacional.
TIPOS DE HIPÓTESES
: é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;
hipótese nula. É formulada com base nos dados populacionais.
: é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do
experimento amostral; hipótese alternativa.
OBS: a aceitação de H0 implica na rejeição de H1, e a rejeição de H0 implica na aceitação de H1.
TIPOS DE TESTES
a)
www.estatistica.ccet.ufrn.br 83(Teste bicaudal)
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
b)
c)
TIPOS DE ERROS:
Erro Tipo I : P(rejeitar | é verdadeira)
Erro Tipo II : P(aceitar | é falsa)
RealidadeDecisão
Aceitar Rejeitar
é verdadeira Decisão Correta Erro Tipo I
é falsa Erro Tipo II Decisão Correta
ERRO TIPO I cometido quando rejeitamos H0 , quando na verdade, ela é verdadeira. Esse
tipo de erro é o mais importante a ser evitado. A probabilidade de se cometer um erro tipo I é o
que se chama de nível de significância de um teste. =P(erro tipo I)
ERRO TIPO II cometido quando não rejeitamos H0, quando na verdade ela é falsa.
Deseja-se: reduzir ao mínimo as probabilidades dos erros.
TAREFA DIFÍCIL: para uma amostra de tamanho n a probabilidade de se incorrer em
um erro tipo II aumenta à medida que diminui a probabilidade do erro tipo I (vice-versa)
www.estatistica.ccet.ufrn.br 84
(Teste unicaudal à esquerda)
(Teste unicaudal à direita)
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
REDUÇÃO SIMULTÂNEA AUMENTO DO
DOS ERROS TAMANHO DE n
PROCEDIMENTO PARA CONSTRUÇÃO DO TESTE DE HIPÓTESE:
1. Estabelecer as hipóteses de nulidade e alternativa ;
2. Escolhe um nível de significância , em geral, usa-se: 0,05; 0,01 ou 0,001
3. Selecionar uma estatística apropriada e determinar as RA e RC para , com o auxílio
das tabelas estatísticas, considerando e a variável do teste.
4. Com os elementos amostrais, calcular o valor da variável do teste.
5. Concluir pela aceitação ou rejeição de pela comparação do valor obtido no 4º passo
com RA e RC, ou seja, rejeitar Ho sempre que a estatística calculada pertencer à região
crítica, caso contrário, não rejeitar.
TESTES PARAMÉTRICOS
TESTES PARA A MÉDIA
1. Enunciar as hipóteses:
2. Fixar o nível de significância . Admitindo desconhecida, a variável do teste será .
www.estatistica.ccet.ufrn.br 85
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
3. Determinar RA e RC através da tabela t.
4. Calcular a variável do teste
5. Conclusões
a) Se , não se pode rejeitar .
Se ou , rejeita-se .
b) Se , não se pode rejeitar .
Se , rejeita-se .
c) Se , não se pode rejeitar .
Se , rejeita-se .
Exemplo:
www.estatistica.ccet.ufrn.br 86
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
Os registros de um colégio atestam para calouros admitidos uma nota média de 115. Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se ao acaso, uma amostra de 20 notas, obtendo-se média 118 e desvio padrão 20. Admitir =5% para efetuar o teste.
Solução:
, , , e
1. Enunciar as hipóteses
2. =5%
Variável: =
3. Determinar RA e RC:
4. Calcular a estatística do teste:
5. Conclusão: como não se pode rejeitar com esse nível de significância. Logo, a média da nova turma é a mesma.
TESTES PARA PROPORÇÕES
1. Enunciar as hipóteses:
www.estatistica.ccet.ufrn.br 87
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
2. Fixar o nível de significância . A variável escolhida é Z, normal padrão.
3. Determinar RA e RC através da tabela da distribuição normal padrão.
4. Calcular a variável do teste
5. Conclusões
a) Se , não se pode rejeitar .
Se ou , rejeita-se .
b) Se , não se pode rejeitar .
Se , rejeita-se .
c) Se , não se pode rejeitar .
Se , rejeita-se .
Exemplo:
As condições de mortalidade de uma região são tais que a proporção de nascidos vivos
que sobrevivem até 60 anos é 0.6. Testar essa hipótese ao nível de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.
Solução:
www.estatistica.ccet.ufrn.br 88
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
, , e
1. Enunciar as hipóteses
2.
Variável: = 1.96
3. Determinar RA e RC:
4. Calcular a estatística do teste:
5. Conclusão: como , rejeita-se , concluindo-se ao nível de significância de 5%
que .
TESTES NÃO-PARAMÉTRICOS
TESTE QUI-QUADRADO
Teste de Adequação do Ajustamento
Teste de Associação
www.estatistica.ccet.ufrn.br 89
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
CAS0 1: TESTE QUI-QUADRADO DE ADEQUAÇÃO
Suponha que em uma determinada amostra de tamanho n, observou-se que um conjunto
de eventos possíveis, , ocorreram com as freqüências observadas ; e
que de acordo com as regras de probabilidade, era de se esperar que esses eventos ocorressem
com freqüências esperadas, .
Eventos ...
Freqüências
Observadas ...
Freqüências
Esperadas ...
Objetivo: verificar de modo significativo se as freqüências observadas diferem das
esperadas.
CONCEITOS IMPORTANTES:
EVENTO: qualquer ocorrência associada a um fenômeno aleatório.
FREQÜÊNCIA OBSERVADA: é a freqüência que se observa através da realização de um
determinado experimento aleatório.
FREQÜÊNCIA ESPERADA: é a freqüência que se espera que aconteça sem a realização de determinado experimento aleatório.
PROCEDIMENTO PARA A CONSTRUÇÃO DO TESTE:
1. Enunciar as hipóteses
: não há discrepâncias entre as freqüências e .
: há discrepâncias entre as freqüências e .
www.estatistica.ccet.ufrn.br 90
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
2. Fixar o nível de significância . A variável escolhida é , onde k é o número de eventos.
3. Determinar RA e RC através da tabela .
4. Calcular a variável do teste
5. Conclusões
a) Se , não se pode rejeitar .
Se , rejeita-se .
Exemplo:
Em 100 lances de uma moeda, observaram-se 65 coroas e 35 caras. Testar a hipótese de a moeda ser honesta adotando-se = 5%.
Solução:
1. Enunciar as hipóteses
: A moeda é honesta
: A moeda não é honesta
2. = 5%.
Variável:
3. Determinar RA e RC através da tabela .
4. Calcular a variável do teste
Eventos Cara Coroa
www.estatistica.ccet.ufrn.br 91
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
Freq. Observada 35 65
Freq. Esperada 50 50
5. Conclusão: Como , rejeita-se , concluindo-se com risco de 5%, que a moeda não é honesta.
CASO 2: TESTE QUI-QUADRADO DE ASSOCIAÇÃO
Objetivo: estudar a associação ou dependência, entre duas variáveis.
Tabela de Contingência: representação das freqüências observadas.
Cálculo das freqüências esperadas tem como base a definição de variáveis aleatórias independentes.
(X e Y independentes: P(Xi, Yj) = P(Xi).P(Yj))
PROCEDIMENTO PARA A CONSTRUÇÃO DO TESTE:
1. Enunciar as hipóteses
: as variáveis são independentes (as variáveis não estão associadas).
: as variáveis são dependentes (as variáveis estão associadas).
2. Fixar o nível de significância . A variável escolhida é , onde L é o número de linhas da tabela de contingência e C é o número de colunas.
3. Determinar RA e RC através da tabela .
www.estatistica.ccet.ufrn.br 92
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
4. Calcular a variável do teste
onde, eij = ((soma da linha i)(soma da coluna j))/(total de obs.)
5. Conclusões
a) Se , não se pode rejeitar .
Se , rejeita-se .
Exemplo:
Testar ao nível de 5% se há discrepância entre as preferências por sabor da pasta de dentes e o bairro.
Sabor da PastaBairros
A B C
Limão 70 44 86 200
Chocolate 50 30 45 125
Hortelã 10 06 34 50
Outros 20 20 85 125
150 100 250 500
Solução:
1. Enunciar as hipóteses
: A preferência pelo sabor independe do bairro
: A preferência pelo sabor depende do bairro
2. = 5%.
Variável:
3. Determinar RA e RC através da tabela .
www.estatistica.ccet.ufrn.br 93
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
4. Calcular a variável do teste
Tabela de Freqüências Esperadas
Sabor da PastaBairros
A B C
Limão 60 40 100
Chocolate 37.5 25 62.5
Hortelã 15 10 25
Outros 37.5 25 62.5
5. Conclusão: Como , rejeita-se , concluindo-se com risco de 5%, que há
dependência entre o sabor da pasta de dentes e o bairro.
Distribuição Qui-Quadrado
Em uma população distribuída normalmente com variância , escolhemos aleatoriamente
amostras independentes de tamanho n e calculamos a variância amostral S2 para cada amostra. A
estatística amostral
www.estatistica.ccet.ufrn.br 94
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
tem uma distribuição chamada Distribuição Qui-quadrado, onde:
n = tamanho da amostra;
s2 = variância amostral;
= variância populacional;
Os valores críticos são encontrados a partir da tabela da distribuição qui-quadrado, cujo número
de graus de liberdade é definido como sendo (n-1).
PROPIREDADES DA DISTRIBUIÇÃO DA ESTATÍSTICA QUI-QUADRADO:
1. A distribuição qui-quadrado não é simétrica, ao contrário das distribuições normal e t de
Student. Na medida em que o número de graus de liberdade aumenta, a distribuição vai se
tornando menos assimétrica.
2. Os valores de qui-quadrado podem ser zero ou positivos; nunca podem ser negativos.
3. Há uma distribuição qui-quadrado diferente para cada número de graus de liberdade que é gl
= (n-1). À medida que o número de graus de liberdade aumenta, a distribuição qui-quadrado
tende para uma distribuição normal.
BIBLIOGRAFIA
MEYER, Paul L. Probabilidade: aplicações à estatística. 2ed. Rio de Janeiro, LTC S/A, 1984.
BUSSAB, W. O e MORETTIN, P. A Estatística Básica. São Paulo: Atual, ed. 4, 1987.
STONE, Hoel Port. Introduction to stochastic process. Boston, Houghton Misslyn Company,
1972.
VIEIRA, Sônia. Planejamento de Experimentos.
VIEIRA, Sônia. Princípios de estatística. São Paulo, pioneira, 1999.
www.estatistica.ccet.ufrn.br 95
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
LISTA DE EXERCÍCIOS
1. Um levantamento do tempo de execução de uma determinada tarefa manual realizadas por
idosos apontou, a partir de uma amostra de 100 idosos, um tempo médio de 2,40 min. Sabe-
se, por experiência anterior, que a variância para esse tipo de tarefa e aproximadamente
constante e valor 0,16. Construa um intervalo de confiança de 90% para o tempo médio
desta tarefa sabendo de que se trata de uma população normal.
2. Um psicólogo que trabalha com a situação do problema anterior deseja verificar qual é o
tempo máximo de realização dessa tarefa ao nível de confiança de 80%. Qual foi o valor
obtido por ele?
3. Uma revista semanal, em artigo sobre a participação das mulheres em curso superior de
Ciências Biológicas, afirmou que a proporção de mulheres neste curso é superior à dos
homens. Uma pessoa interessada em testar essa afirmação levantou uma amostra ao acaso de
100 estudantes de Ciências Biológicas e obteve na amostra uma porcentagem de 40% de
mulheres.
a) Qual é o IC para a proporção de mulheres não população ao nível de 98%?
b) Baseando-se nesse IC, a afirmação da revista é certamente falsa?
4. Para estudar o grau de satisfação com o setor de serviço em uma empresa, um consultor
levantou uma amostra aleatória de 50 pessoas na empresa. Sabe-se, por experiências
anteriores, que o desvio padrão para o grau de satisfação com o setor de serviço é
aproximadamente constante e igual a 40. O grau médio de satisfação amostral foi calculado
em 245. Determine um intervalo de confiança de 94% para o grau médio de satisfação nesta
empresa.
www.estatistica.ccet.ufrn.br 96
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
5. Uma amostra aleatória de 15 estudantes do curso de Biologia forneceu um desempenho
médio no curso de 20 pontos, com desvio padrão de 0,1 pontos. Supondo que o desempenho
no curso tem distribuição normal de probabilidades, determine um intervalo de confiança de
95% para o desempenho médio dos estudantes do curso de psicologia.
6. Uma amostra aleatória de 60 elementos obtidos de uma população normal apresentou média
de 46 e desvio padrão de 8. Calcular:
a) O erro padrão de estimação da média populacional, ao nível de 90%.
b) O intervalo de confiança para a média populacional ao nível de 98%.
7. Um guarda de trânsito vistoriou 200 carros em um bairro de uma cidade e constatou que 25
motoristas não estavam usando o conto de segurança no momento da vistoria. Determine um
intervalo de confiança de 95% para a proporção de motoristas que usam regularmente o
cinto de segurança neste bairro.
8. Uma amostra de 90 pessoas foi selecionada ao acaso de um grupo de 1.000 pessoas,
fornecendo uma proporção de fumantes equivalente a 0,24. Calcular o intervalo de confiança
ao nível de 92% para a proporção de fumantes nas 1.000 pessoas.
9. Um vendedor consegue entrevistar 120 pessoas num dia, e resolve testar a aceitação de um
novo produto. Para isso, escolheu 32 pessoas e mostrou o produto, conseguindo uma
proporção de respostas positivas de 25%. Qual seria a estimativa da proporção de respostas
positivas entre as 120 pessoas, ao nível de 85%?
10. Uma população normalmente distribuída apresenta média histórica de 6 unidades e desvio
padrão de 0,5 unidades. Uma amostra de 15 elementos selecionados ao acaso forneceu
média 4 e desvio padrão 1. Teste ao nível de 5% o valo da média histórica, contra a
alternativa em que a média diminuiu.
11. De uma população normal com média histórica de 18 unidades, 12 elementos forma
selecionados ao acaso, fornecendo média de 17 unidades e desvio padrão de 3 unidades.
Teste ao nível de significância 10% a hipótese =18.
www.estatistica.ccet.ufrn.br 97
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
Um fabricante de inseticida afirma no rótulo da embalagem que sua eficiência é de 70% contra
todos os tipos de insetos. Um agente da Secretaria de Defesa do Consumidor encomenda a um
laboratório um teste de toxicidade do inseticida, e quer testar a hipótese de que a eficiência é de
70% contra a alternativa de ser maior que 70%. O laboratório informou que de 120 insetos
tratados com este inseticida 32 sobreviveram. A toxicidade do inseticida está controlada ao nível
de 2,5% de significância?
www.estatistica.ccet.ufrn.br 98
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
= graus de liberdade
TABELA - Distribuição t de Student (Unicaudal e Bicaudal)
25% 10% 5% 2,5% 1% 0,5% 25% 10% 5% 2,5% 1% 0,5%
1 1,0000 3,0777 6,3138 12,7062 31,8207 63,6574 46 0,6799 1,3002 1,6787 2,0129 2,4102 2,6870 2 0,8165 1,8856 2,9200 4,3027 6,9646 9,9248 47 0,6797 1,2998 1,6779 2,0117 2,4083 2,6846 3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8409 48 0,6796 1,2994 1,6772 2,0106 2,4066 2,6822 4 0,7407 1,5332 2,1318 2,7764 3,7469 4,6041 49 0,6795 1,2991 1,6766 2,0096 2,4049 2,6800 5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0322 50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778 6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074 51 0,6793 1,2984 1,6753 2,0076 2,4017 2,6757 7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995 52 0,6792 1,2980 1,6747 2,0066 2,4002 2,6737 8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554 53 0,6791 1,2977 1,6741 2,0057 2,3988 2,6718 9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498 54 0,6791 1,2974 1,6736 2,0049 2,3974 2,6700 10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693 55 0,6790 1,2971 1,6730 2,0040 2,3961 2,6682
11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058 56 0,6789 1,2969 1,6725 2,0032 2,3948 2,6665 12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545 57 0,6788 1,2966 1,6720 2,0025 2,3936 2,6649 13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123 58 0,6787 1,2963 1,6716 2,0017 2,3924 2,6633 14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768 59 0,6787 1,2961 1,6711 2,0010 2,3912 2,6618 15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467 60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603
16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208 61 0,6785 1,2956 1,6702 1,9996 2,3890 2,6589 17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982 62 0,6785 1,2954 1,6698 1,9990 2,3880 2,6575 18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784 63 0,6784 1,2951 1,6694 1,9983 2,3870 2,6561 19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609 64 0,6783 1,2949 1,6690 1,9977 2,3860 2,6549 20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453 65 0,6783 1,2947 1,6686 1,9971 2,3851 2,6536
21 0,6864 1,3232 1,7207 2,0796 2,5177 2,8314 66 0,6782 1,2945 1,6683 1,9966 2,3842 2,6524 22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188 67 0,6782 1,2943 1,6679 1,9960 2,3833 2,6512 23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073 68 0,6781 1,2941 1,6676 1,9955 2,3824 2,6501 24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7969 69 0,6781 1,2939 1,6672 1,9949 2,3816 2,6490 25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874 70 0,6780 1,2938 1,6669 1,9944 2,3808 2,6479
26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787 71 0,6780 1,2936 1,6666 1,9939 2,3800 2,6469 27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707 72 0,6779 1,2934 1,6663 1,9935 2,3793 2,6459 28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633 73 0,6779 1,2933 1,6660 1,9930 2,3785 2,6449 29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564 74 0,6778 1,2931 1,6657 1,9925 2,3778 2,6439 30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500 75 0,6778 1,2929 1,6654 1,9921 2,3771 2,6430
31 0,6825 1,3095 1,6955 2,0395 2,4528 2,7440 76 0,6777 1,2928 1,6652 1,9917 2,3764 2,6421 32 0,6822 1,3086 1,6939 2,0369 2,4487 2,7385 77 0,6777 1,2926 1,6649 1,9913 2,3758 2,6412 33 0,6820 1,3077 1,6924 2,0345 2,4448 2,7333 78 0,6776 1,2925 1,6646 1,9908 2,3751 2,6403 34 0,6818 1,3070 1,6909 2,0322 2,4411 2,7284 79 0,6776 1,2924 1,6644 1,9905 2,3745 2,6395 35 0,6816 1,3062 1,6896 2,0301 2,4377 2,7238 80 0,6776 1,2922 1,6641 1,9901 2,3739 2,6387
36 0,6814 1,3055 1,6883 2,0281 2,4345 2,7195 81 0,6775 1,2921 1,6639 1,9897 2,3733 2,6379 37 0,6812 1,3049 1,6871 2,0262 2,4314 2,7154 82 0,6775 1,2920 1,6636 1,9893 2,3727 2,6371 38 0,6810 1,3042 1,6860 2,0244 2,4286 2,7116 83 0,6775 1,2918 1,6634 1,9890 2,3721 2,6364 39 0,6808 1,3036 1,6849 2,0227 2,4258 2,7079 84 0,6774 1,2917 1,6632 1,9886 2,3716 2,6356 40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045 85 0,6774 1,2916 1,6630 1,9883 2,3710 2,6349
41 0,6805 1,3025 1,6829 2,0195 2,4208 2,7012 86 0,6774 1,2915 1,6628 1,9879 2,3705 2,6342 42 0,6804 1,3020 1,6820 2,0181 2,4185 2,6981 87 0,6773 1,2914 1,6626 1,9876 2,3700 2,6335 43 0,6802 1,3016 1,6811 2,0167 2,4163 2,6951 88 0,6773 1,2912 1,6624 1,9873 2,3695 2,6329 44 0,6801 1,3011 1,6802 2,0154 2,4141 2,6923 89 0,6773 1,2911 1,6622 1,9870 2,3690 2,6322 45 0,6800 1,3006 1,6794 2,0141 2,4121 2,6896 90 0,6772 1,2910 1,6620 1,9867 2,3685 2,6316 100 0,677 1,290 1,660 1,984 2,364 2,626
120 0,677 1,289 1,658 1,980 2,358 2,617
0,674 1,282 1,645 1,960 2,326 2,576
www.estatistica.ccet.ufrn.br 99
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
www.estatistica.ccet.ufrn.br 100
EST319 – Estatística para Engenharia Têxtil I – Profa. Luciana Maria de Oliveira
www.estatistica.ccet.ufrn.br 101
Assimétrica NegativaSimétricaAssimétrica Positiva