métodos estocásticos da engenharia ii - capítulo 2...
Post on 12-Oct-2020
3 Views
Preview:
TRANSCRIPT
Métodos Estocásticos da Engenharia IICapítulo 2 - Estatística e Descrição de Dados
Prof. Magno Silvério Campos
2019/2
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 1 / 70
Bibliografia
Bibliografia
Essas notas de aulas foram baseadas nas seguintes obras:1 BORNIA, A. C.; BARBETTA, P. A.; REIS, M. M. Estatística para Cursos de
Engenharia e Informática. 3. ed. São Paulo: Atlas, 2010.2 CANCHO, V.G. Notas de Aulas sobre Noções de Estatística e Probabilidade. São
Paulo: USP, 2010.3 FARIAS, A. A.; SOARES, J. F.; CÉSAR, C. C. Introdução à Estatística. 2.ed. Rio de
Janeiro: LTC, 2008.4 HINES, W.W.; et al. Probabilidade e Estatística na Engenharia. 4. ed. Rio de
Janeiro: LTC, 2006.5 MONTGOMERY, D.C.; RUNGER, G.C. Estatística Aplicada e Probabilidade para
Engenheiros. 6. ed. Rio de Janeiro: LTC, 2016.
Aconselha-se pesquisá-las para se obter um maior aprofundamento e ummelhor aproveitamento nos estudos.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 2 / 70
Introdução
Introdução
Etapas do Método de Análise Estatística
Fonte: adaptado de [Cancho(2010)]
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 3 / 70
Conteúdo Programático
Conteúdo Programático1 Seção 1 - Medidas de posição:
Média;Média aritméticaMédia ponderada;Média geométrica;Média harmônica;Média aparada;Média quadrática;
Mediana;Ponto médio;Moda;Separatrizes: percentil e quartil
2 Seção 2 - Medidas de dispersão:Amplitude;Intervalo interquartil;Desvio médio absoluto;Variância;Desvio padrão;Coeficiente de variabilidade;
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 4 / 70
Conteúdo Programático
Conteúdo Programático
1 Seção 3 - Boxplot, assimetria e curtose;2 Seção 4 - Gráficos de probabilidade;3 Seção 5 - Graus de liberdade.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 5 / 70
Seção 1 - Medidas de posição
Seção 1 - Medidas de posição
As medidas de posição ou tendência central são usadas para indicar umvalor que tende a resumir ou representar melhor um conjunto de dados.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 6 / 70
Seção 1 - Medidas de posição
Média aritmética
A média de um conjunto de observações é definida como a soma de todasas observações dividida pelo número de observações. Isto é,
Média populacional : µ =1
N
N∑i=1
Xi (1)
Média Amostral : X =1
n
n∑i=1
Xi (2)
ondeXi: valor da i-ésima observação da variável em estudo.N : tamanho da população.n: tamanho da amostra.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 7 / 70
Seção 1 - Medidas de posição
ObservaçãoEssa medida de posição apresenta a desvantagem de ser fortemente in-fluenciada por valores discrepantes, isto é, valores muito pequenos oumuito elevados. Portanto, nesse caso essa medida já não será um valorrepresentativo do conjunto de dados.
ExemploSejam as notas de quatro provas de um estudante: X1 = 8.3, X2 =9.4, X3 = 9.5, X4 = 8, 6. Determinar a nota média.
X =1
4
n∑i=1
Xi =8, 3 + 9, 4 + 9, 5 + 8.6
4= 8, 95
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 8 / 70
Seção 1 - Medidas de posição
Propriedades1 A soma dos desvios das observações em relação à média é igual a 0:
n∑i=1
(Xi − X) = 0
2 A soma de quadrados dos desvios das observações em relação àmédia é mínima, ou seja,
n∑i=1
(Xi − X)2é um valor mínimo.
Isto é,n∑i=1
(Xi − X)2 ≤n∑i=1
(Xi − k)2, k ∈ <.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 9 / 70
Seção 1 - Medidas de posição
1 Para k 6= 0 ∈ <.SeYi = Xi ± k, então Y = X ± kSeYi = kXi, então Y = kXSeYi = Xi
k , então Y = Xk
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 10 / 70
Seção 1 - Medidas de posição
Média ponderada
A média ponderada de um conjunto de observações X1, . . . , Xn, compesos ou ponderações W1, . . . ,Wn, é definida como:
Xp =
n∑i=1
WiXi
n∑i=1
Wi
=W1X1 + · · ·+WnXn
W1 + · · ·+Wn
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 11 / 70
Seção 1 - Medidas de posição
Exemplo - [Cancho(2010)]Suponha que os custos de produção e as quantidades produzidas por trêsfiliais A, B e C de uma empresa são:
Custo de produção (Xi) Quantidade produzida (Wi)Filial unidades monetárias (u.m) (número de unidades)A 1,20 500B 1,60 200C 1,05 900
Qual é o custo médio de produção por unidade produzida?
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 12 / 70
Seção 1 - Medidas de posição
Média geométrica
A média geométrica de um conjunto de n observações positivasX1, . . . , Xn é definida como:
XG = (X1 ×X2 × · · · ×Xn)1/n
Observe que:
log XG =1
n(logX1 + logX2 + logX3 + . . .+ logXn)
Isto é, o logaritmo da média geométrica é igual à média aritmética doslogaritmos das observações. Por isso, essa média é usada na elaboraçãode números índices e para o cálculo de taxas médias de variação.
A média geométrica de um conjunto de números é sempre menor ouigual à média aritmética dos membros desse conjunto (as duas médiassão iguais se e somente se todos os membros do conjunto são iguais).
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 13 / 70
Seção 1 - Medidas de posição
ExemploSuponha que uma fábrica teve um incremento em sua produção de: 15%no ano 2016, 10% em 2017 e 16% em 2018. Achar o crescimento médioanual.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 14 / 70
Seção 1 - Medidas de posição
Média harmônica
A média harmônica de n observaçõesX1, . . . , Xn (∈ <+) é definida como:
XH =n
1X1
+ · · ·+ 1Xn
.
Essa média tem a particularidade de que os valores discrepantes a afetamem menor intensidade do que em outras médias.
A média harmônica nunca é maior do que a média geométrica ou do quea média aritmética.
Utilizamos a Média Harmônica quando estamos tratando de observaçõesde grandezas inversamente proporcionais como por exemplo, velocidadee tempo.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 15 / 70
Seção 1 - Medidas de posição
ExemploSuponha que um automóvel percorre os primeiros 10 quilômetros a 30km/h e os outros 10 km a 60 km/h. À primeira vista, pareceria que avelocidade média de 30 e 60 km/h é de 45 km/h. Será?
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 16 / 70
Seção 1 - Medidas de posição
Média aparada
Considere que os dados sejam dispostos em ordem crescente de seus va-lores.
Em seguida, t% das observações são removidas de cada extremo e écalculada a média aritmética dos dados restantes. O valor resultante édenominado de média aparada (trimmed mean) dos dados.
Essa eliminação dos valores extremos, torna a média menos sensível aosmaiores e menores valores. Com isso, a média apararada representa umaposição intermediária entre a média aritmética e a mediana.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 17 / 70
Seção 1 - Medidas de posição
ExemploCalcule a média aparada 5% dos seguintes valores:
4 18 19 21 22 25 26 27 30 31 33 34 37 40 41 42 44 45 47 70
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 18 / 70
Seção 1 - Medidas de posição
Média quadrática
Sejam X1, X2, X3, . . . , Xn, os n valores de uma variável X.
A média quadrática de X é dada por:
XQ =
√∑ni=1X
2i
n
Essa média é muito útil quando se estuda afastamentos médios dos dadosem relação à media aritmética destes.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 19 / 70
Seção 1 - Medidas de posição
ExemploCalcule a média quadrática dos seguintes valores:
4 18 19 21 22 25 26 27
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 20 / 70
Seção 1 - Medidas de posição
Comparação entre as diversas médias
Se todos os X ′is forem iguais:
X = XG = XH = XQ
Se todos os X ′is forem distintos:
XH < XG < X < XQ
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 21 / 70
Seção 1 - Medidas de posição
Mediana
É uma medida de posição que divide o conjunto de observações, previa-mente ordenadas de acordo a sua magnitude (forma crescente), em doisgrupos de tal modo que 50% das observações são menores que a medianae os outros 50% são maiores.
Suponha que Y1, Y2, . . . , Yn seja um conjunto de n observações ordenadasem forma crescente, isto é, Y1 ≤ Y2 ≤ · · · ≤ Yn. A mediana é definidacomo
Md =
{Yn+1
2, se n é impar
Yn2
+Yn2 +1
2 , se n é par
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 22 / 70
Seção 1 - Medidas de posição
ExemploConsideram-se duas amostras constituídas pelos dados apresentados aseguir e já ordenados:a)Y1 = 2, 0,Y2 = 3, 2, Y3 = 4, 5, Y4 = 4, 6
b)Y1 = 2,Y2 = 3, Y3 = 5, Y4 = 6, Y5 = 10;
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 23 / 70
Seção 1 - Medidas de posição
Propriedades
1 A soma dos desvios absolutos das observações em relação àmediana é mínima, ou seja,
n∑i=1
|Xi −Md| é mínima
Isto é,n∑i=1
|Xi −Md| ≤n∑i=1
|Xi − h|, h ∈ <.
2 Para k 6= 0 ∈ <.SeYi = Xi ± k, então MdY = MdX ± kSeYi = kXi, então MdY = kMdXSeYi = Xi
k , então MdY = MdX
k
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 24 / 70
Seção 1 - Medidas de posição
Ponto médio
O ponto médio é o valor a meio caminho entre o maior valor e o menorvalor observados no conjunto de dados. É dado por:
PM =valor mínimo + valor máximo
2
Observação:Não confunda ponto médio com mediana!
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 25 / 70
Seção 1 - Medidas de posição
ExemploCalcule o ponto médio e a mediana dos seguintes valores:
4 18 19 21 22 25 26 27 30 31 33 34 37 40 41 42 44 45 47 70
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 26 / 70
Seção 1 - Medidas de posição
Moda
A moda de um conjunto de observações é definida como o valor, classeou categoria que ocorre com maior frequência. A moda populacional édenotada por Mo e a moda amostral é denotada por mo.
ExemploTêm-se as seguintes observações amostrais:a)5, 8, 7, 9, 5, 4, 6.b) 5, 8, 5, 9, 6, 5, 4, 9.
PropriedadeA moda pode não existir, ou pode existir mais de uma moda.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 27 / 70
Seção 1 - Medidas de posição
Separatrizes: percentil e quartil
As separatrizes são medidas de posição que separam ou que dividem oconjunto de dados em um certo número de partes iguais. Dois tipos deseparatrizes muito utilizadas são o percentil e o quartil.
PercentilO percentil Pp, é um valor que divide um conjunto de observações or-denadas de forma crescente em duas partes, o 100p% dessas observaçõescom valores inferiores a Pp, e o 100(1− p)% com valores superiores a Pp.Sendo 0 < p < 1.
QuartilA mediana, seja de uma população ou de uma amostra, divide o conjuntode dados em duas partes iguais. Também é possível dividí-lo em mais de2 partes.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 28 / 70
Seção 1 - Medidas de posição
Quando se divide um conjunto ordenado de dados em quatro partesiguais, os pontos da divisão são conhecidos como quartis; o primeiroquartil, Q1, é o valor que divide aproximadamente, a quarta parte (25%)das observações abaixo dele, e os 75% restantes, acima dele. O segundoquartil é exatamente a mediana (Md). O terceiro quartil, Q3, tem apro-ximadamente os três quartos (75%) das observações abaixo dele.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 29 / 70
Seção 1 - Medidas de posição
Primeiro Quartil, Q1
25% dos valores ordenados de forma crescente são menores ou iguais aQ1 e 75% são maiores ou iguais a Q1.
Posição de Q1 =n+ 1
4
Terceiro Quartil, Q3
75% dos valores ordenados de forma crescente são menores ou iguais aQ3 e 25% são maiores ou iguais a Q3.
Posição de Q3 =3(n+ 1)
4
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 30 / 70
Seção 1 - Medidas de posição
Utilize as seguintes regras para calcular os quartis:
Regra 1Se o resultado corresponder a um número inteiro, então o quartil é igualao valor na ordem de classificação.
Regra 2Se o resultado for uma metade fracionada (2,5; 4,5; etc.)), então o quartilé igual à média entre os valores correspondentes na ordem de classificação.
Regra 3Se o resultado não for um inteiro ou uma metade fracionada, faça umainterpolação para o resultado.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 31 / 70
Seção 1 - Medidas de posição
ExemploA seguir são apresentadas 19 observações do tempo de falha, em horasde um material, 204 228 252 300 324 444 624 720 816 912 1176 1296 13921488 1512 2520 2856 3192 3528
Q1 =
Q2(= Md) =
Q3 =
Exercíciosa) 204 228 252 300 324 444 624 720 816b) 204 228 252 300 324 444 624 720
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 32 / 70
Seção 2 - Medidas de dispersão
Seção 2 - Medidas de dispersão
As medidas de posição ou de tendência central não necessariamente pro-porcionam informação suficiente para descrever dados de maneira ade-quada. Por exemplo, considere os dados de resistência à tensão (em psi)de três amostras de alheação de alumínio-lítio.Amostra 1: 130 150 145 158 165 140Amostra 2: 148 148 148 148 148Amostra 3: 90 120 205 140 165 160
Fonte: [Cancho(2010)]
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 33 / 70
Seção 2 - Medidas de dispersão
As medidas de dispersão ou variabilidade são medidas estatísticas quepermitem conhecer o grau de homogeneidade ou heterogeneidade de umconjunto de dados.
Fonte: [Cancho(2010)]
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 34 / 70
Seção 2 - Medidas de dispersão
Amplitude
É a diferença entre a observação de maior e menor valor,
A = Xmax −Xmin.
Quanto maior for a amplitude, maior será a variabilidade nos dados.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 35 / 70
Seção 2 - Medidas de dispersão
ExemploCalcule a amplitude para os valores da amostra 1.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 36 / 70
Seção 2 - Medidas de dispersão
Intervalo Interquartil (d)
É a diferença entre o terceiro quartil e o primeiro quartil,
d = Q3 −Q1
O intervalo interquartil é menos sensível aos valores discrepantes ou ex-tremos dos dados do que a amplitude.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 37 / 70
Seção 2 - Medidas de dispersão
ExemploCalcule o interval interquartil para os valores da amostra 1.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 38 / 70
Seção 2 - Medidas de dispersão
Desvio Médio Absoluto
Seja considerar a posição dos dados em relação à média:
x
Uma maneira inicial de se calcular o "afastamento médio"desses valoresem relação à média se dá a partir do cálculo do desvio médio absolutodesses dados:
DMA =
∑ni=1 |xi − x|
n(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 39 / 70
Seção 2 - Medidas de dispersão
ExemploCalcule o desvio médio absoluto para os valores da amostra 1.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 40 / 70
Seção 2 - Medidas de dispersão
Variância
É uma medida de dispersão quadrática das observações. É dada pelasoma das diferenças quadráticas das observações em relação a sua média,dividida pelo número total de observações. A variância populacional édenotada pela letra grega σ2 e variância amostral por S2.
x
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 41 / 70
Seção 2 - Medidas de dispersão
1 Populacional:
σ2 =
N∑i=1
(Xi − µ)2
N=
N∑i=1
X2i
N− µ2.
2 Amostral:
S2 =
n∑i=1
(Xi − X)2
n− 1=
1
n− 1(
n∑i=1
x2i − nx2).
onde,Xi: valor da i-ésima observação da variável em estudo.X: média amostral.µ: média populacional.N : tamanho da população.n: tamanho da amostra.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 42 / 70
Seção 2 - Medidas de dispersão
Correção de BesselComo a variância amostral tende a ser maior que a variância popula-cional, Friedrich Wilhelm Bessel (1784-1846) introduziu no cálculo davariância amostral, o seguinte fator de correção na fórmula da variân-cia populacional:
n
n− 1
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 43 / 70
Seção 2 - Medidas de dispersão
Desvio padrão
É a raíz quadrada positiva da variância. O desvio padrão populacionale amostral são denotados por σ e S, respectivamente.
1 Populacional:
σ =√σ2 =
√√√√√ N∑i=1
(Xi − µ)2
N=
√√√√√ N∑i=1
X2i
N− µ2.
2 Amostral:
S =√S2 =
√√√√√ n∑i=1
(Xi − X)2
n− 1=
√√√√ 1
n− 1(
n∑i=1
x2i − nx2).
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 44 / 70
Seção 2 - Medidas de dispersão
ObservaçãoO desvio padrão tem a propriedade de medir a variabilidade nas mesmasunidades que a variável de interesse X.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 45 / 70
Seção 2 - Medidas de dispersão
ExemploNa tabela 1, são apresentadas as quantidades necessárias para cálculo davariância e do desvio padrão amostral, para os dados da amostra 1.
Tabela: Cálculo da variância e o desvio padrão amostral
i xi xi − x (xi − x)2
1 130 -18 3242 150 2 43 145 -3 94 158 10 1005 165 17 2896 140 -8 64
6∑i=1
xi =6∑i=1
(xi − x) =6∑i=1
(xi − x)2 =
x =
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 46 / 70
Seção 2 - Medidas de dispersão
Variância =
Desvio padrão =
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 47 / 70
Seção 2 - Medidas de dispersão
ObservaçãoA variância e o desvio padrão são utilizados para comparar a variabi-lidade de conjuntos de dados expressados nas mesmas unidades, commédias que sejam aproximadamente similares.
Exemplo 1Deseja-se comparar a renda mensal do ano 2009 de duas empresas.Empresa A: µA = 450.000 σ2
A = 2.500Empresa B: µB = 400.000 σ2
B = 5.000
Exemplo 2A variância e o desvio padrão amostral para os dados das três amostrasde alheação de alumínio-lítio do exemplo desta seção são apresentadosabaixo:
Amostra Média Variância Desvio padrão1 148 158 12,572 148 0 03 148 1502 38,8
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 48 / 70
Seção 2 - Medidas de dispersão
Teorema de ChebyshevSegundo o russo Pafnuti Chebyshev (1821-1894), a fração de qualquerconjunto de dados que se situa a K desvios-padrão da média é sempre,no mínimo, igual a
1− 1
K2,
onde K é qualquer número positivo maior do que 1.
ExemploPara K = 2 −→ pelo menos 75% dos valores se localizam a 2desvios-padrão da média;Para K = 3 −→ pelo menos 89% dos valores se localizam a 3desvios-padrão da média;Para K = 4 −→ pelo menos 93,75% dos valores se localizam a 4desvios-padrão da média;
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 49 / 70
Seção 2 - Medidas de dispersão
Coeficiente de variabilidade
É uma medida de variabilidade adimensional que expressa o número devezes que o desvio padrão contém a média.
Essa medida estatística é utilizada para comparar conjuntos de dadosque têm diferentes unidades ou quando as médias são muito diferentes.Denota-se o coeficiente de variabilidade populacional e amostral por CVe cv, respectivamente.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 50 / 70
Seção 2 - Medidas de dispersão
1 Populacional:CV =
σ
µ× 100
ondeµ: média populacional.σ: desvio padrão populacional.
2 Amostral:cv =
S
X× 100
ondeX: média amostral.S: desvio padrão amostral
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 51 / 70
Seção 2 - Medidas de dispersão
Em termos práticos:Se CV (ou cv) ≤ 15% −→ baixa dispersão dos valores em torno desua média e grande representatividade dessa média;Se 15% < CV (ou cv) ≤ 30% −→ média dispersão dos valores emtorno de sua média e média representatividade dessa média;Se CV (ou cv) > 30% −→ alta dispersão dos valores em torno desua média e baixa representatividade dessa média;
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 52 / 70
Seção 2 - Medidas de dispersão
Exemplo 1 - [Cancho(2010)]
Considere a altura (em metros) e a massa (em kg) de uma amostra dealunos.
Média Desvio PadrãoAltura 1,70 m 0,085mMassa 70 kg 7kg
Exemplo 2 - [Cancho(2010)]
Considere as massas (em kg) de uma amostra de meninos de 11 anos deidade e de uma amostra de homens de 25 anos de idade.
Média Desvio PadrãoHomens 66 ,0 4,5Meninos 36,0 4,5
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 53 / 70
Seção 3 - Boxplot, assimetria e curtose
Seção 3 - Boxplot, assimetria e curtose
BoxplotO boxplot é um gráfico que fornece uma visualização da distribuição dosdados, além de permitir detectar rapidamente uma possível assimetriadessa distribuição. Sua construção é baseada nas seguintes medidas: namediana, no primeiro e terceiro quartis, e nos valores extremos. A formadesse gráfico tem as seguintes características:
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 54 / 70
Seção 3 - Boxplot, assimetria e curtose
Fonte: [Cancho(2010)]
a) A caixa ("box") é delimitada pelo primeiro (Q1) e terceiro (Q3)quartis. A linha interior da caixa corresponde a mediana(me = Q2).
b) A partir dos limites da caixa, considera-se duas linhas auxiliaresque distam 1,5 o intervalo interquartil d = Q3 −Q1. Essas linhasnão aparecerão no gráfico final. Elas servem para caracterizar osvalores discrepantes que são os valores menores que Q1 − 1, 5d ouvalores maiores que Q3 + 1, 5d. Os valores discrepantes serãorepresentados no gráfico com asteriscos (∗).
c) Os limites do gráfico, representados por uma linha à direita e àesquerda ("bigodes") da caixa, correspondem ao maior e ao menorvalores não discrepantes do conjunto de dados.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 55 / 70
Seção 3 - Boxplot, assimetria e curtose
Exemplo - [Cancho(2010)]
Com a finalidade de aumentar a massa corporal (em kg), um regimealimentar foi aplicado a 12 pessoas. Os resultados (ordenados) foram:-0,5 2,5 3,0 3,6 4,7 5,3 5,9 6,0 6,2 6,3 7,9 11,2
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 56 / 70
Seção 3 - Boxplot, assimetria e curtose
Exemplo - [Cancho(2010)]
Com a finalidade de aumentar a massa corporal (em kg), um regimealimentar foi aplicado a 12 pessoas. Os resultados (ordenados) foram:-0,5 2,5 3,0 3,6 4,7 5,3 5,9 6,0 6,2 6,3 7,9 11,2
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 56 / 70
Seção 3 - Boxplot, assimetria e curtose
Exemplo - [Cancho(2010)]
Com a finalidade de aumentar a massa corporal (em kg), um regimealimentar foi aplicado a 12 pessoas. Os resultados (ordenados) foram:-0,5 2,5 3,0 3,6 4,7 5,3 5,9 6,0 6,2 6,3 7,9 11,2
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 56 / 70
Seção 3 - Boxplot, assimetria e curtose
Comentários sobre o Boxplot
Fonte: Minitab c©
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 57 / 70
Seção 3 - Boxplot, assimetria e curtose
Distribuições diferentes emtermos da posição central
Distribuições diferentesquanto à dispersão
Distribuições diferentesquanto à assimetria
Distribuições diferentesquanto à curtose
Fonte: Adaptado de [Bornia et al. (2010)]
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 58 / 70
Seção 3 - Boxplot, assimetria e curtose
Comparações
Fonte: Adaptado de [Bornia et al. (2010)]
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 59 / 70
Seção 3 - Boxplot, assimetria e curtose
As características de assimetria e de curtose são próprias da população,sendo definidas em termos de momentos, µk, assim:
Assimetriaβ3 =
µ3
σ3
Curtoseβ4 =
µ4
σ4− 3
onde:
µk =
N∑i=1
(xi − µ)k
N.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 60 / 70
Seção 3 - Boxplot, assimetria e curtose
AssimetriaA assimetria reflete o grau de simetria em torno da média.
Assimetria negativa resulta em uma cauda assimétrica na direçãodos menores valores da variável;Assimetria positiva resulta em uma cauda assimétrica que seestende em direção aos valores mais altos da variável;Assimetria nula resulta em simetria em torno da média, como é ocaso de variáveis normais.
Comparaçõesβ3 < 0x < md < mo
β3 = 0x = md = mo
β3 > 0mo > md > x
Fonte: Adaptado de [Bornia et al. (2010)](UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 61 / 70
Seção 3 - Boxplot, assimetria e curtose
CurtoseA curtose descreve a presença relativa de picos de uma distribuiçãoquando comparada com a distribuição normal.
Curtose negativa é associada a uma distribuição relativamenteachatada;Curtose positiva é associada a distribuições com picos;Curtose nula é associada à distribuição normal.
Comparações
→ β4 > 0
→ β4 = 0
→ β4 < 0
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 62 / 70
Seção 3 - Boxplot, assimetria e curtose
ObservaçãoSe os dados sob análise representam medições de uma variável feitas emunidades amostrais, as estimativas amostrais de β3 e β4 são:
Assimetria
β3 =n
(n− 1)(n− 2)×
n∑i=1
(xi − x)3
s3, n > 2
Curtose
β4 = [(n)(n+ 1)
(n− 1)(n− 2)(n− 3)×
n∑i=1
(xi − x)4
s4]− 3× (n− 1)2
(n− 2)(n− 3), n > 3
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 63 / 70
Seção 4 - Gráficos de probabilidade
Gráficos de probabilidade
Introdução
Fonte: Adaptado de [Montgomery e Runger(2016)].x
MotivaçãoComo sabemos se uma distribuição particular de probabilidades é um
modelo razoável para os dados?(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 64 / 70
Seção 4 - Gráficos de probabilidade
Um gráfico de probabilidade é um método para determinar se os dadosda amostra obedecem a uma distribuição hipotética, baseada no examevisual subjetivo dos dados.
Muitas das técnicas estatísticas são apropriadas somente quando a popu-lação é (pelo menos, aproximadamente) normal. Sendo assim, focaliza-remos nesse curso, principalmente, nos gráficos de probabilidade normal.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 65 / 70
Seção 4 - Gráficos de probabilidade
ProcedimentoPara construir um gráfico de probabilidade, as observações na amostrasão primeiro ordenadas, da menor para a maior. Ou seja, a amostrax1, x2, . . . , xn fica assim ordenada:
x(1) ≤ x(2) ≤ x(3) ≤ . . . ≤ x(n)
As observações ordenadas x(j) são então plotadas contra suas freqüênciascumulativas observadas (j − 0, 5)/n em um papel apropriado de proba-bilidade.
Se a distribuição hipotética descrever adequadamente os dados, os pontosplotados cairão, aproximadamente, ao longo de uma linha reta; se ospontos plotados desviarem significativamente de uma linha reta, entãoo modelo hipotético não será apropriado. Geralmente, determinar se osdados plotados seguem ou não uma linha reta é algo subjetivo.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 66 / 70
Seção 4 - Gráficos de probabilidade
Exemplo:Doze observações sobre o tempo de uma determinada operação fabril são:
180; 177; 185; 190; 186; 178; 195; 192; 179; 182; 191; 184
Investigue a hipótese desse tempo ser adequadamente modelado por umadistribuição normal.
Solução
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 67 / 70
Seção 4 - Gráficos de probabilidade
Os pares de valores x(j) e 100 · (j − 0, 5)/10 são plotados em eixos deprobabilidade normal, conforme na figura abaixo:
100·(j−0,5)n
xj
Uma linha reta, escolhida subjetivamente, foi desenhada através dos pon-tos plotados.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 68 / 70
Seção 5 - Graus de liberdade
Seção 5 - Graus de liberdade
O número de graus de liberdade associado a uma estatística é a quan-tidade de elementos da amostra (n), menos o número de parâmetros dapopulação estimados a partir dessa mesma amostra.
De uma maneira bem prolixa, podemos dizer que os graus de liberdaderepresentam a quantidade de informação que os dados fornecem e quepodemos “gastar” para estimar os valores de parâmetros populacionaisdesconhecidos, e calcular a variabilidade destas estimativas.
Em resumo, seu valor é determinado pelo número de observações naamostra e o número de parâmetros em seu modelo.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 69 / 70
Seção 5 - Graus de liberdade
O aumento do tamanho amostral fornece mais informações sobre a po-pulação e, desta forma, aumenta os graus de liberdade dos dados.
Por outro lado, quando adicionamos parâmetros ao modelo em ques-tão (aumentando os coeficientes em um MRLM, por exemplo) gasta-mos informações dos dados, e com isso, reduzimos os graus de liberdadedisponíveis para estimar a variabilidade das estimativas do parâmetrospopulacionais.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 70 / 70
Seção 5 - Graus de liberdade
Cancho, V., 2010. Notas de aulas sobre noções de estatística eprobabilidade - São Paulo: USP.
Montgomery, D., Runger, G., 2016. Estatística Aplicada eProbabilidade para Engenheiros. Rio de Janeiro: LTC.
(UFOP/EM/DEPRO) Métodos Estocásticos da Engenharia II 2019/2 70 / 70
top related