ementa da disciplina utfpr conceitos e definições ...webdrive.guilst.com/data/eng comp utfpr/28...
TRANSCRIPT
1
Prof: Amaral 1
UTFPR
Engenharia Elétrica
Probabilidade e Estatística
Prof: Amaral 2
Ementa da disciplina
Conceitos e Definições;
Distribuição de Frequências;
Medidas de Tendência Central ou de Posição;
Medidas de Dispersão ou de Variabilidade;
Medidas de Assimetria e Curtose;
Teoria Elementar da Probabilidade;
Distribuições Discretas de Probabilidade;
Distribuições Contínuas de Probabilidade;
Teoria da Estimação;
Teoria da Decisão Estatística;
Teste Qui-Quadrado;
Controle Estatístico de Processo (CEP);
Análise de Variância (ANOVA);
Análise de Correlação e de Regressão.
Prof: Amaral 3
Referências Bibliográficas
Básicas:
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6.ed. São Paulo: Edusp, 2005.
MEYER, P. L. Probabilidade: aplicações à estatística. 2.ed. Rio de Janeiro: LTC, 1983.
MONTGOMERY, D. C. e RUNGER, George C. Estatística Aplicada e Probabilidade para engenheiros. 2.ed. Rio de Janeiro: LTC, 2003.
Complementares:
COSTA NETO, Pedro L. O. Estatística. 2.ed. São Paulo: Blücher, 2002.
DEVORE J. L. Probabilidade e Estatística para Engenharia e Ciências. São Paulo: Pioneira Thomson, 2006.
LARSON, R. et al. Estatística Aplicada. São Paulo: Pearson Education, 2004.
LEVINE, David. M. et al. Estatística: teoria e aplicações usando MICROSOFT EXCEL em português. Rio de Janeiro: LTC, 2000.
Prof: Amaral 4
Introdução
A estatística é uma ciência exata do conhecimentohumano que surgiu da necessidade de manipulaçãode dados coletados (coleta, organização, análise einterpretação), afim de extrair informações deinteresse dos mesmos para testar uma hipótese.
Origem na Roma Antiga: levantamentos quebuscavam o registro de todos os indivíduos de algumacamada social, bem como inventário de suaspropriedades, com a finalidade de se determinar comoe quem deveria ser taxado e/ou convocado ao serviçomilitar.
Prof: Amaral 5
Definição
População: São casos, dados, objetos ou grupos depessoas que apresentam característica comum observável.Corresponde ao sistema ou ao todo que se quer descrever.Seu tamanho, em geral, é expresso pela letra N(maiúscula).
Amostra: É um subgrupo ou parte representativa de umapopulação e deve representar qualitativa equantitativamente o todo de que foi extraída, em geral, éexpresso pela letra n (minúscula).
Censo: É um conjunto de dados estatísticos que informadiferentes características de uma população, em relação auma ou mais variáveis descritoras.
Prof: Amaral 6
Definição
O censo ou recenseamento demográfico é uma pesquisarealizada pelo IBGE a cada dez anos. Através dele, reunimosinformações sobre toda a população brasileira.
Esse estudo é realizado, normalmente, de dez em dez anos,na maioria dos países.
Início: 1872->1890->1900->1920->1940->1950->1960->1970->1980->1991->2000->2010.
IBGE: Criado em 1936
Contagem da população: O censo seguinte foi previsto para
2015, ao custo de R$ 1 bilhão. Entretanto, em razão decontenção orçamentária, foi adiado para 2016 e, depois,adiado novamente, por tempo indeterminado.
2
Prof: Amaral 7
Conceitos
Amostragem: estudo das relações existentes entre a amostra e a população de onde se foi extraída.
Objetivo: estimar parâmetros da população;
Parâmetros: valor desconhecido associado a uma característica da população, média, variância.
Estimador: função que estima o valor de um parâmetro
baseando-se nas observações de uma amostra;
n
i
ixn
x1
1
Prof: Amaral 8
Conceitos
Tipos de amostragem:
Amostragem simples: é aquela retirada de uma
população de tal forma que cada possível amostra de um dado tamanho tem chance igual de ser selecionada. (homogênea)
Slide_Amostragem.xlsx
Amostragem estratificada: são populações heterogêneas, mas podemos distinguir nela subpopulações mais ou menos homogêneas.
Amostragem sistemática: é aquela onde a população
está naturalmente ordenada.
Antes da análise é necessário definir a(s) característica(s) de interesse que deverão ser verificadas.
Variáveis qualitativas: resulta de uma classificação por tipo ou atributos, qualidade ou característica.
Nominal;
Não tem ordenação no atributo.
Ordinal.
Com ordenação no atributo
Variáveis quantitativas: Aquelas que dão sentido de contagem, medida ou mensuração.
Discreta;
Conjunto finito e infinito numerável de valores.
Contínua.
Conjunto infinito de valores.
Prof: Amaral 9 Prof: Amaral 10
Variáveis Qualitativas
Nominal:
Exemplos:
1. População: Peças produzidas por uma máquina. Variável: qualidade (perfeita ou defeituosa).
2. População: Moradores de Curitiba. Variável: cor dos cabelos (loiro, preto, ruivo acobreado, loiro platinado, chocolate, loiro dourado, vermelho, castanho escuro, preto perolado).
3. População: Candidatos a um exame de vestibular. Variável: sexo (feminino, masculino).
Prof: Amaral 11
Variáveis Qualitativas
Ordinal:
Exemplos:
1. População: Candidatos em concurso. Variável: grau de instrução (fundamental, médio ou superior).
2. População: Clientes de uma loja de sapatos. Variável: classe social (baixa, média ou alta).
3. População: População brasileira. Variável: questionário sobre a economia do país (péssima, má, regular, boa ou excelente).
Prof: Amaral 12
Variáveis Quantitativas
Discreta:
Exemplos:
1. População: Casais residentes em uma cidade. Variável: número de filhos.
2. População: Peças produzidas por uma certa máquina. Variável: número de peças produzidas por hora.
3. População: Aparelhos produzidos em uma linha de produção. Variável: número de defeitos por unidade.
3
Prof: Amaral 13
Variáveis Quantitativas
Contínua:
Exemplos:
1. População: Peças produzidas por uma certa máquina. Variável: Dimensão do diâmetro externo.
2. População: funcionários de uma empresa. Variável: Salários.
3. População: Pregos produzidos por uma máquina. Variável: Comprimento.
Prof: Amaral 14
Resumo da classificação das variáveis
Distribuição de frequências (Tabelas)
Prof: Amaral 15
Tabelas de valores para dados qualitativo nominal
Tabela 1: Variação dos Produtos Agrícolas na Região Sul.
Fonte: O autor (2017).
Distribuição de frequências (Tabelas)
Prof: Amaral 16
Tabelas de valores para dados qualitativo ordinal
Tabela 2: Nível de Ensino da Faculdade “X”, na cidade de
Curitiba, em 2001.
Fonte: O autor (2017).
Distribuição de frequências (Tabelas)
Prof: Amaral 17
Tabelas de valores para dados quantitativo discreto
Tabela 3: População do Brasil, em 2017.
Tabela 4: População da França, em 2017.Fonte: O autor (2017).
Fonte: O autor (2017).
Distribuição de frequências (Tabelas)
Prof: Amaral 18
Tabelas de valores para dados quantitativo contínuo
Tabela 5: Salários dos Funcionários da Empresa “Z” na
cidade de Curitiba, em 2001.
Fonte: O autor (2017).
4
Prof: Amaral 19
Tabela
É uma apresentação de dados numéricos de modo resumido e é utilizada principalmente para a apresentação de comparações.
A tabela compõe-se de:
Corpo: É o espaço que contém as informações sobre o estudo
propriamente dito;
Cabeçalho: É a parte superior da tabela, que especifica o conteúdo das
colunas;
Coluna indicadora: parte da tabela que especifica o conteúdo das linhas;
Linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;
Casa ou célula: espaço destinado a um só número;
Título: É a indicação que precede a tabela e contém a identificação de três fatores do estudo: a época a qual se refere, o local onde o mesmo ocorreu e o estudo que é descrito;
Fonte: É a indicação da responsabilidade pelas informações sobre o estudo, contidas no corpo da tabela.
Prof: Amaral 20
Séries estatísticas
ANOS TONELADAS
1997 85498
1998 32548
1999 42358
Produção de Borracha Natural na cidade “Y”.
Fonte: IBGE 2001.
CABEÇALHO
TÍTULO
COLUNA INDICADORA
CORPO
COLUNA INDICADORA
LINHAS
CASA OU CÉLULA
RODAPÉ
Prof: Amaral 21
Distribuição de Frequência
Tabela de Distribuição de frequência: são tabelas que relacionam cada medida possível em uma observação à frequência com que ocorreu nos dados.
Dados Brutos: são os dados coletados, que ainda não foram numericamente organizados.
Rol: é a organização dos dados brutos em ordem crescente ou decrescente de grandeza.
Prof: Amaral 22
Distribuição de Frequência
Elementos de uma distribuição de frequência:
1. Classe de frequência: são intervalos de variação da variável.
2. Limites de classe: são os valores extremos de cada classe. O menor número é o limite inferior da classe (Li) e o maior número, o limite superior da classe (Ls).
3. Amplitude amostral: é a diferença entre o valor máximo e o valor mínimo da amostra e indicada por A :
A = xmáx – xmin
4. Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo).
Prof: Amaral 23
Distribuição de Frequência
5. Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por c.
c = Ls – Li
6. Ponto Médio de uma classe (PM): é o ponto médio que divide o intervalo de classe em duas partes iguais.
PM = (Li + Ls)/2
7. Frequência simples ou absoluta de uma classe: é o número de observações correspondentes a essa classe ou a esse valor.
Prof: Amaral 24
Tabela de Distribuição de Frequência
Primeiro Roteiro (utilizado por Scott, 1979).
1. Determinar o nº de classes (k): em geral, até 100 dados usa-se tomar o inteiro mais próximo da raiz do nº de dados (n). Para mais que 100 observações, usa-se o inteiro mais próximo de 5.log(n).
2. Determinar a amplitude de cada classe (c): toma-se a amplitude total dos dados (representada por AT), e divide-se tal valor pelo nº de classes menos 1.
c = AT / (k - 1)
5
Prof: Amaral 25
Tabela de Distribuição de Frequência
3. Determinar o limite inferior da primeira classe Li1 e os demais limites de classe:
Li1= menor valor da amostra – (c / 2)
Ls1= Li2= Li1 + c
4. Determinar a frequência de dados observados em cada classe (por meio da contagem simples dos dados que caem entre os limites da classe) e construir a tabela.
Prof: Amaral 26
Exemplo
49 48 55 49 46 52 49 49 57 48
47 50 53 52 54 45 52 50 46 49
46 55 52 50 61 50 53 51 50 50
60 43 46 47 49 52 45 45 51 51
50 50 48 46 53 47 45 40 61 47
54 39 46 44 53 49 50 50 50 47
44 51 52 48 51 46 50 47 60 45
48 51 52 50 57 48 50 46 54 52
47 52 47 51 53 49 45 49 54 51
56 56 55 51 53 51 51 50 51 50
Quadro 5 – Dados referentes ao salário semanal, em dólares, de 100 trabalhadores.
Fonte: Hoel, 1986.
Prof: Amaral 27
Resolução do exemplo utilizando o roteiro de Scott
1º Passo:
K=10
2º Passo:
A = 61 – 39 = 22
3º Passo:
c = 22 / (10 - 1) 2,44
4º Passo:
Li1 = 39 – (2,44 / 2) = 37,78
Ls1 = Li2 = 37,78 + 2,44 = 40,22
Ls2 = Li3 = 40,22 + 2,44 = 42,66
5° Passo:
Construção da tabela de distribuição de frequência
Prof: Amaral 28
Distribuição de frequência dos salários semanais de 100 trabalhadores
Prof: Amaral 29
Tabela de distribuição de frequência
20 Roteiro (utilizado pelo Excel).
1. Determina-se o nº de classes (k): Não há uma regra exata para determinar o número de classes, apenas orientações práticas para o analista.
maior.ou menor inteiro valor o para resultado o doArredondan
2
.)log(322,31
n
nk
nk
k
Prof: Amaral 30
Tabela de distribuição de frequência
20 Roteiro (utilizado pelo Excel).
2. Determina-se o cálculo da amplitude amostral (A):
A=maior valor da amostra subtraído do seu menor valor
3. Determina-se o cálculo da amplitude de classe (c):
c = AT / k
4. Encontra-se os limites da tabela:
Li1 = menor valor da amostra
Ls1= Li1+c = Li2
6
Prof: Amaral 31
Tabela de distribuição de frequência
20 Roteiro (utilizado pelo Excel).
5. Determina-se a frequência de dados observados em cada classe (por meio da contagem simples dos dados que caem até o limites da classe) e constrói a tabela.
Prof: Amaral 32
Distribuição de frequência dos salários semanais de 100 trabalhadores
49 48 55 49 46 52 49 49 57 48
47 50 53 52 54 45 52 50 46 49
46 55 52 50 61 50 53 51 50 50
60 43 46 47 49 52 45 45 51 51
50 50 48 46 53 47 45 40 61 47
54 39 46 44 53 49 50 50 50 47
44 51 52 48 51 46 50 47 60 45
48 51 52 50 57 48 50 46 54 52
47 52 47 51 53 49 45 49 54 51
56 56 55 51 53 51 51 50 51 50
Prof: Amaral 33
Exercícios
Dado as tabelas abaixo, construa:
A tabela de distribuição de frequência utilizando as funções do Excel.
A tabela de distribuição de frequência utilizando a ferramenta análise de dados do Excel.
37 41 36 40 40
39 42 40 40 45
44 41 39 42 40
46 43 41 35 40
40 14 41 40 40
40 39 38 38 41
48 35 30 36 33
53 41 39 38 47
Quadro 2 - Estatura de 40 Alunos da Escola A (cm)
Quadro 1 - Grau Alcoólico (°GL) em Aguardente de Cana, UFLA, 1999
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Prof: Amaral 34
Dado o quadro abaixo, construa a distribuição de frequência.
58 62 80 57 8 126 136 96 144 19
90 86 38 94 82 75 148 114 131 28
66 95 121 158 64 105 118 73 83 91
50 92 60 52 89 58 10 90 94 74
9 75 72 157 125 76 88 78 84 36
Consumo Mensal de Energia Elétrica, por 50 Usuários Particulares - KWH
Exercícios
Prof: Amaral 35
Tipos de frequências
Frequência Simples ou Absoluta (f) são os valores que realmente representam o número de dados de cada classe.
Frequência Percentual: é cada um dos valores representado pela sua porcentagem em relação ao total.
Frequência Acumulada: é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma classe.
Frequência Percentual Acumulada: é o total das frequências percentuais de todos os valores inferiores ao limite superior do intervalo de uma dada classe.
Tipos de gráficos
Dados quantitativos
Dispersão unidimensional e multidimensional;
Histograma;
Linha;
Polígono de frequência;
Dados qualitativos
Barras;
Setores (Pizza).
Prof: Amaral 36
7
Tipos de gráficos
Gráfico de barras;
Para variáveis qualitativa e quantitativa;
Todo gráfico de barras parte de uma tabela de
frequência;
Podem ser usados com a frequência absoluta ou com a frequência relativa (%).
Exemplo: Slide 16.
Prof: Amaral 37 Prof: Amaral 38
Séries estatísticas
Quando realizamos um levantamento estatístico, o que obtemos como resultado é chamado de série estatística.O modo de condensação ou apresentação
das informações pode ser na forma de tabelas ou de gráficos que facilitam a visualização do fenômeno, permitem a comparação com outros elementos ou,
ainda, fazer previsões.
Diferenças de Séries Estatísticas:
A época: (fator temporal ou cronológico) a que se refere o fenômeno observado;
O local: (fator geográfico) onde o fenômeno acontece;
O fenômeno: (fator específico) que é descrito.
Prof: Amaral 39
Tipos de Séries
ANOS HABITANTES
1960 70.070
1970 93.139
1980 118.562
1990 155.822
Fonte: IBGE
Série histórica, cronológica, temporal ou marcha:
quando os resultados das observação do fenômeno são
registrados ao longo do tempo.
População do Brasil
Prof: Amaral 40
Tipos de Séries
Regiões Área (%)
Norte 45,25
Nordeste 18,28
Sudeste 10,85
Sul 6,76
Centro - Oeste 18,86
Série geográfica, espacial, territorial ou de
localização: o local varia, permanecendo fixos o tempo
e o fenômeno.
Fonte: IBGE, 2001.
Área Terrestre – Brasil
Prof: Amaral 41
Tipos de Séries
Processos Quantidade
Oxigênio Básico 30.698
Forno Elétrico 10.567
EOF 1.245
Fonte: IBS.
Série específica ou categórica: quando o fenômeno é
observado segundo algumas categorias, permanecendo
fixos o tempo e o local.
Produção Brasileira de Aço Bruto, em 1999.
Prof: Amaral 42
Tipos de Séries
Distribuição de Frequências: neste tipo de série estatística o tempo, o local e o fenômeno permanecem fixos. O fenômeno considerado é uma variável quantitativa (discreta ou contínua) e seus valores observados são descritos considerando o número de vezes que ocorreram na série (frequência).
Classe Frequência
0 |— 1 12
1 |— 2 10
2 |— 3 8
3 |— 4 4
4 |— 5 1
Fonte: IBS
Dados referentes ao número de filhos por casais no Departamento de Matemática na
cidade de Curitiba no ano de 2010.
8
Prof: Amaral 43
Gráficos estatísticos
Os principais tipos de gráficos são:
1. Diagramas: são figuras geométricas dispostas em duas dimensões. São os mais usados na representação de séries estatísticas.
2. Cartogramas: gráficos representadas em cartas geográficas, largamente difundidas em geografia e história.
3. Pictogramas: gráficos que tem por objetivo despertar a atenção do público em geral.
Veja nos próximos slides alguns exemplos de gráficos:
Prof: Amaral 44
Cartograma
Prof: Amaral 45
Pictograma
Prof: Amaral 46
Medidas de Tendência central
VALOR ESPERADO (MÉDIA - ): é a mais utilizada.
MÉDIA ARITMÉTICA: soma de todos os valores
dividida pelo número de valores.
_
x
n
x
x
n
i
i 1
47
28
7
3466432
x 4,32,3,4,6,6,
:abaixo valoresdos média a Determine :Ex
Prof: Amaral 47
n
i
i
n
i
ii
f
xf
x
1
1
• Média ponderada: se dá pela frequência de ocorrência de
cada ponto médio de classe.
5,324
)1*7(...)5*3()4*2()3*1(
x
Medidas de Tendência central
Prof: Amaral 48
n
i
i
n
i
ii
f
Pm*f
x
1
1
2,721
)3*11()6*9()5*7()4*5()3*3(
x
Medidas de Tendência central
• Média ponderada: se dá pela frequência de ocorrência de
cada ponto médio de classe.
9
Prof: Amaral 49
Valor central (Mediana - Md ): é a mais utilizada quando os dados estão dispostos em ordem crescente ou decrescente.
Se n é impar, a mediana é o valor de posição central (1+n)/2;
Md=x(1+n)/2
Se n é par, a mediana é a média entre os dois valores centrais:
Md=(xn/2+xn/2+1)/2
Medidas de Tendência central
Prof: Amaral 50
Mediana - Exemplos
É o valor situado de tal forma que separa em dois
subconjuntos de mesmo número de elementos.
Ex1: 5, 13, 10, 2, 18, 15, 6, 16, 9
Rol crescente: 2, 5, 6, 9, 10, 13, 15, 16, 18
Md = 10
Ex2: 2, 6, 7, 10, 12, 13, 18, 21
Md = (10+12)/2 = 11
Prof: Amaral 51
Tabela de dados agrupados
Encontre a mediana da tabela de distribuição abaixo:
Como temos 34 valores, nossa mediana será a média
entre os termo que ocupam o 17° e o 18º lugar, ou seja,
posição 2.
Mediana - Exemplos
Prof: Amaral 52
Expressão para o cálculo:
série. da valoresde totalNúmeron
mediana; a contém que classe da Amplitudec
mediana; a contém que classe da Frequência
mediana; a contém que classe aanterior acumulada FrequênciaF
mediana; a contém que classe dainferior LimiteLi
.2
Md
Md
AA
Md
f
cf
Fn
LiMd Md
Md
AA
Md
Medidas de Tendência central
Prof: Amaral 53
Tabela de dados agrupados
Encontre a mediana da tabela de distribuição.
13F 11,F
4,c 158,Li 20,P
AA
5,16011
4*)1320(581Md
Mediana - Exemplos
Prof: Amaral 54
Moda: é o valor que ocorre com maior frequência em uma série de valores.
Ex1: 7, 8, 9, 10, 10, 11, 12, 13, 15
A moda é 10.
Ex2: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
A moda é 4, 7.
Medidas de Tendência central
10
Prof: Amaral 55
Moda: é o valor que ocorre com maior frequência em uma série de valores.
Moda igual a 3.
Medidas de Tendência central
Prof: Amaral 56
Expressão para o cálculo: Fórmula de Czuber
MoMo cdd
dLiMo .
21
1
modal. classe da amplitudec
posterior; a e moda a
contém que classe da frequência a entre Diferençad
anterior; a e moda a
contém que classe da frequência a entre Diferençad
modal; classe dainferior LimiteLi
Mo
2
1
Mo
Medidas de Tendência central
Prof: Amaral 57
Moda: é o valor que ocorre com maior frequência em uma série de valores.
3811d
2,911d 4,c 8,15Li
2
1
159,632
4*2158Mo
Medidas de Tendência central
Prof: Amaral 58
Média Geométrica: São empregadas em observações
positivas referentes a crescimentos exponenciais (como
taxas de avanço de doenças, número de habitantes de
regiões em colonização, crescimento de produtividade e
lucro em alguns negócios, etc...). A média geométrica é a
raiz n-ésima do produto das n observações.
Ex: O conjunto de dados {2,6,15,59} tem média
geométrica igual á:
15,1059.15.6.24 G
Medidas de Tendência central
Prof: Amaral 59
Média Harmônica: Para fenômenos que dependem
fortemente do menor dos dados, calculadas pelo inverso
da média dos inversos. Um exemplo é o cálculo do
tamanho efetivo de populações naturais submetidas a
processos de devastação ecológica (gargalos
populacionais).
Ex: O número de elefantes de uma região ao longo de quatro
gerações foi de {2000, 20, 250,1500}, a média harmônica desta
amostra é:51,72
1500
1
250
1
20
1
2000
1.
4
1
1
H
Medidas de Tendência central
Prof: Amaral 60
Encontre a média, moda e a mediana das classes abaixo:
Fonte: Pesquisa “y”
Exercício
11
Prof: Amaral 61
Exercício
Os dados abaixo representam o diâmetro das
tubulações para cabos. Com esses dados monte a
distribuição de frequência e calcule a média, moda e a
mediana.
10,938 10,948 11,872 11,912 11,936 11,998 12,264 12,320 12,432 12,452 12,900 12,934 12,980 13,184 13,250 13,28213,875 13,936 13,952 13,997 18,308 18,408
Prof: Amaral 62
Separatrizes
Tipos:
Mediana: divide a série em duas partes iguais;
Quartil: divide a série em quatro partes iguais;
Decil: divide a série em dez partes iguais;
Percentil ou Centil: divide a série em cem partes iguais.
Prof: Amaral 63
f
c*)F(PLiS AA
classe. de amplitude c
a;selecionad classe da Frequência
anterior; acumulada FrequênciaF
;separatriz da posição P
inferior; limiteLi
AA
f
Separatrizes
Prof: Amaral 64
Exemplos:
Calcule:
a) Os pesos de 30% menores;
b) Os pesos 25% maiores;
c) Os pesos que separam os 20%
pesos medianos.
Separatrizes
Prof: Amaral 65
a) Os 30% menores pesos estão no início, então
retiramos os dados: P=30% de 40 (total) = 12;
Li=154; FAA=4; c=4 e F=9.
157,569
4*4)(12154S
b) Os 25% maiores estão no final, então são 75% da
série: P=75% de 40=30, Li=162, FAA=24,c=4 e F=8.
1658
4*4)2(30162S
Separatrizes
Prof: Amaral 66
c) Nesse caso temos dois valores os 20% medianos;
esses 20% ficam no meio da série, então: 20% é
40% de 40=16;
d) Adicionando mais 20% temos 60%
Separatrizes
12
Prof: Amaral 67
Exercício:
Calcule:
a) O valor que separa 25% dos
salários menores;
b) O valor acima do qual estão 20%
dos salários maiores;
c) Os valores que separam 30% dos
salários medianos.
Separatrizes
Prof: Amaral 68
Medidas de Posição
1. Amplitude Amostral: é a mais simples e precária medida
de variabilidade. Representa a diferença entre o maior e o
menor valor coletado na amostra.
A=máximo-mínimo
Exemplo
Para a amostra dos salários semanais em dólares dos 100
trabalhadores a amplitude amostral é:
A = 61 - 39 = $ 22
Prof: Amaral 69
Medidas de posição
2. Desvio Médio: é construído tomando a média dos
desvios em relação à média geral dos dados.
Exemplo
1. Considere a amostra {2,3,5,7,8}: Encontre o seu desvio
médio:
A média é 5 e seus desvios são: {-3,-2,0,2,3}. Os módulos dos
desvios são {3,2,0,2,3} e seu desvio médio igual a 2.
Prof: Amaral 70
1-
.
1-
1
2
21
2
2
n
fxPm
sn
xx
s
n
i
i
n
i
i
3. Variância: mede a dispersão do conjunto dos dados de
uma amostra em relação à sua respectiva média.
AGRUPADOS dados para AGRUPADOS NÃO dados para
Medidas de posição
Variância populacional
Variância amostral
Prof: Amaral 71
4. Desvio-padrão: Um aspecto desconcertante da variância
é que devido ao seu método de cálculo o resultado é
expresso em unidades ao quadrado. Assim, o desvio-
padrão é a raiz quadrada da variância.
s 2s
Medidas de posição
Prof: Amaral 72
Coeficiente de variação
É a relação entre o desvio padrão e a média da distribuição. Utilizada
quando o objetivo é comparar a variabilidade de diferentes distribuições,
com diferentes valores para sua esperança.
μ
σCV%
ERRO PADRÃO DA MÉDIA
Essa medida é importante por indicar precisão que se atingiu no cálculo
da média com amostras de tamanhos diferentes.
n
ss
n
σσ xx
13
Prof: Amaral 73
Ou seja, embora as amostras A e C tenham a mesma variabilidade, o erro no
cálculo da média por amostras em C é o dobro do cometido em A.
3
2:C
3
1:B
3
1:A
YYYSSS
Como exemplo, sejam as seguintes amostras: A={1,2,3}, B={3,4,5} e
C{2,4,6}. O CV destas amostras são:
A=CV%=50% B=CV%=25% C=CV%=50%
Ou seja, embora A e B tenham a mesma variabilidade absoluta, em relação
às suas médias A é muito mais variável que B. Embora C tenha a maior
variabilidade absoluta dentre as três, em relação à suas médias, é tão
variável quanto A.
Já para o erro padrão da média, encontramos os seguintes resultados:
Exemplo
Prof: Amaral 74
Medidas de Assimetria
É o grau de desvio ou afastamento da simetria de uma distribuição.
Distribuição simétrica:
Quando a média = mediana = moda
Distribuição assimétrica à esquerda:
Quando a média < mediana < moda
Distribuição assimétrica à direita:
Quando a média > mediana > moda
Prof: Amaral 75
Coeficiente de Assimetria de Pearson:
É dado pela expressão:
padrão. desvio :
moda; :
amostral; média :
Pearson; de Assimetria de eCoeficient
:Onde
s
Mo
x
As
s
MoxAs
Medidas de Assimetria
Prof: Amaral 76
Medidas de curtose
É o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal.
Leptocúrtica:
Quando a distribuição apresenta uma curva de frequência mais fechada que a normal.
Platicúrtica:
Quando a distribuição apresenta uma curva de frequência mais aberta que a normal.
Mesocúrtica:
É a curva normal, adotada como base referencial.
Prof: Amaral 77
Coeficiente de curtose de Keley:
É dado pela expressão abaixo:
decil. Nono:
decil; Primeiro:
quartil; Terceiro:
quartil; Primeiro:
Keley; de eCoeficient :
:Onde
2
9
1
3
1
19
13
D
D
Q
Q
C
DD
QQC
chata. mais ca,platicúrti
afilada; mais ca,leptocúrti
a;mesocúrtic
2630
2630
2630
,C
,C
,C
:Se
Medidas de curtose