MEDIDAS DE VARIABILIDADE,
ASSIMETRIA E CURTOSE
Professor: WALDEMAR SANTA CRUZ OLIVEIRA JR
UNIVERSIDADE FEDERAL DE PERNABUCO - UFPE Disciplina: ESTATÍSTICA
APLICADA AO TURISMO E HOTELARIA ET-652
Curso: TURISMO
Medidas de Variabilidade: São medidas cujo o objetivo é medir o
grau de dispersão ou variação dos dados.
Medidas de Variabilidade
Absoluta
Relativa
Amplitude
Desvio Padrão
Desvio Médio
Variância
Coeficiente de Variação
Amplitude Am: É a diferença entre o maior e o menor valor dos dados.
Por ser limitada esta medida não é muito usada.
Muito afetada por valores extremos e pouco afetada pelos valoresInternos dos dados.
Exemplo: X={1,2,2,2,3,3,3,3,4,7}, logo Am =7-1=6
Exemplo: X={1,2,3,4,5,5,6,6,7,7}, logo Am =7-1=6
Observe que mesmo tendo a mesma amplitude os dados do primeiro exemplo deveria ter uma medida de variabilidade menor.
Desvio Médio:
n
xxd
n
ii
m
1
||
Dados não Agrupados
Exemplo: X={2,4,6,8} 5420
48642
x
4|58||56||54||52|
md
248
4|3||1||1||3|
md
n
fxxd
i
k
ii
m
1
||Dados Agrupados
Exemplo: X={1,2,2,2,3,3,3,3,4,7}
Onde k é o número de elementos distintos da série
xi fi
1 12 33 44 17 1
Total 10
n
fxxd
i
k
ii
m
1
||Dados Agrupados
Exemplo: X={1,2,2,2,3,3,3,3,4,7}
Onde k é o número de elementos distintos da série
xi fi xifi |xi- |fi |xi- |fi
1 1 1 |1-3|*1 22 3 6 |2-3|*3 33 4 12 |3-3|*4 04 1 4 |4-3|*1 17 1 7 |7-3|*1 4
Total 10 30 10
x x
11010
md
Amplitude Am: É a diferença entre o maior e o menor dos dados.
Por ser limitada esta medida não é muito usada.
Muito afetada por valores extremos e pouco afetada pelos valoresInternos dos dados.
Exemplo: X={1,2,2,2,3,3,3,3,4,7}, logo Am =7-1=6
Exemplo: X={1,2,3,4,5,5,6,6,7,7}, logo Am =7-1=6
Observe que mesmo tendo a mesma amplitude os dados do primeiro exemplo deveria ter uma medida de variabilidade menor.
1md
68,1md
Amplitude Am: É a diferença entre o maior e o menor dos dados.
Por ser limitada esta medida não é muito usada.
Muito afetada por valores extremos e pouco afetada pelos valoresInternos dos dados.
Exemplo: X={1,2,2,2,3,3,3,3,4,7}, logo Am =7-1=6
Exemplo: X={1,2,3,4,5,5,6,6,7,7}, logo Am =7-1=6
Observe que mesmo tendo a mesma amplitude os dados do primeiro exemplo deveria ter uma medida de variabilidade menor.
1md
68,1md
E de fato teve no caso do desvio médio
n
fxxd
i
k
ii
m
1
||Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi
0 |----- 2 5
2 |----- 4 15
4 |----- 6 40
6 |----- 8 15
8 |----10 5
Total 80
n
fxxd
i
k
ii
m
1
||Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi
0 |----- 2 5
2 |----- 4 15
4 |----- 6 40
6 |----- 8 15
8 |----10 5
Total 80
n
fxxd
i
k
ii
m
1
||Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi xi xifi
0 |----- 2 5 1 5
2 |----- 4 15 3 45
4 |----- 6 40 5 200
6 |----- 8 15 7 105
8 |----10 5 9 45
Total 80 400
580400
x
n
fxxd
i
k
ii
m
1
||Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi xi xifi |xi- |fi |xi- |fi
0 |----- 2 5 1 5 |1-5|*5 4*5=20
2 |----- 4 15 3 45 |3-5|*15 2*15=30
4 |----- 6 40 5 200 |5-5|*40 0
6 |----- 8 15 7 105 |7-5|*15 2*15=30
8 |----10 5 9 45 |9-5|*5 4*5=20
Total 80 400 100
xx
25,180100
md
580400
x
Variância:
Para dados não agrupados
n
xxn
ii
1
2
2)(
Vantagem da variância é que a função quadrática é muito melhor
de se trabalhar do que a modular
Exemplo: X={2,4,6,8} 5x
4)58()56()54()52( 2222
2
5420
491192
n
fxx i
k
ii
1
2
2)(
Dados Agrupados
Exemplo: X={1,2,2,2,3,3,3,3,4,7}
Onde k é o número de elementos distintos da série
xi fi
1 12 33 44 17 1
Total 10
n
fxx i
k
ii
1
2
2)(
Dados Agrupados
Exemplo: X={1,2,2,2,3,3,3,3,4,7}
Onde k é o número de elementos distintos da série
xi fi xifi (xi- )2fi (xi- )2fi
1 1 1 (1-3)2*1 42 3 6 (2-3)2*3 33 4 12 (3-3)2*4 04 1 4 (4-3)2*1 17 1 7 (7-3)2*1 16
Total 10 30 24
x x
4,210242
n
fxx i
k
ii
1
2
2)(
Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi
0 |----- 2 5
2 |----- 4 15
4 |----- 6 40
6 |----- 8 15
8 |----10 5
Total 80
n
fxx i
k
ii
1
2
2)(
Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi
0 |----- 2 5
2 |----- 4 15
4 |----- 6 40
6 |----- 8 15
8 |----10 5
Total 80
n
fxx i
k
ii
1
2
2)(
Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi xi xifi
0 |----- 2 5 1 5
2 |----- 4 15 3 45
4 |----- 6 40 5 200
6 |----- 8 15 7 105
8 |----10 5 9 45
Total 80 400
580400
x
n
fxx i
k
ii
1
2
2)(
Dados Agrupados em Classes
Onde k é o número de classes da série
Classes fi xi xifi (xi- )2fi (xi- )2fi
0 |----- 2 5 1 5 (1-5)2*5 16*5=80
2 |----- 4 15 3 45 (3-5)2*15 4*15=60
4 |----- 6 40 5 200 (5-5)2*40 0
6 |----- 8 15 7 105 (7-5)2*15 4*15=60
8 |----10 5 9 45 (9-5)2*5 16*5=80
Total 80 400 280
xx
5,3802802
580400
x
Desvio Padrão: é a raiz quadrada da variância
n
fxx i
k
ii
1
2)(
Obs: Não confundir Desvio Padrão com Desvio Médio
m
i
k
iii
k
ii
dn
fxx
n
fxx
11
2 ||)(
Obs: A variância é uma medida em unidade quadrada, enquanto
que os desvios Padrão e Médio estão em uma unidade linear
Se os dados são populacionais o denominador da fórmula da
variância e do desvio padrão é n
n
fxx i
k
ii
1
2)(
n
fxx i
k
ii
1
2
2)(
Se os dados não são populacionais o denominador da fórmula
da variância e do desvio padrão é n-1
1
)(1
2
2
n
fxx i
k
ii
1
)(1
2
n
fxx i
k
ii
Propriedades da Variância e do Desvio Padrão
P1: Se somarmos uma constante K aos dados tanto o desvio
padrão como a variância ficam inalterados
Exemplo: X={2,4,5,9}
5,6426
41619
4)59()55()54()52( 2222
2
X
5x
Somando-se 8 ao conjunto temos Y={10,12,13,17} 13x
5,641619
4)1317()1313()1312()1310(
2
22222
Y
Y
P2: Se multiplicarmos uma constante K aos dados o desvio
padrão fica multiplicado pela constante e a variância fica
multiplicada pelo quadrado da constante
Exemplo: X={2,4,5,9} 5,62 X
Multiplicando-se por 4 o conjunto temos Y={8,16,20,36} 20y
5,6*161044416
416412
4)2036()2020()2016()208(
2222
22222
Y
Y
222 *45,6*16 XY XY *4
Coeficiente de Variação: é a relação entre o desvio padrão e a
média %100x
CV
É uma medida de dispersão relativa e muito usada para comparar
conjuntos de dados com unidades de medidas diferentes
Exemplo: X={2,4,5,9}
55,25,6
5x
%99,50%100555,2
CV
Dizemos que uma distribuição tem:
Baixa Dispersão se CV 15%
Alta Dispersão se CV 30%
Média Dispersão se 15% CV 30%
Medidas de Assimetria: são medidas que determinam o grau de
assimetria da curva de frequência de uma distribuição de
frequência.
Curva Simétrica
Dados
f
Mo=Md=x
Curva AssimétricaÀ Direita
Dados Mo<Md<x
Curva AssimétricaÀ Esquerda
Dados Mo>Md>x
f
f
Coeficiente de Assimetria de Pearson:
MdxAs
3
Se -0,15<|As|<0,15 consideramos a curva pouco assimétrica ou
simétricaSe 0,15<As<1 temos uma assimetria moderada à direita
Se As>1 temos uma assimetria forte à direita
Se -1<As<-0,15 temos uma assimetria moderada à esquerda
Se -1<As temos uma assimetria forte à esquerda
Curtose: é o grau de achatamento de uma distribuição de frequência
comparada com a distribuição normal padrão
Curva Leptocúrtica
Curva Platicúrtica
Curva Mesocúrtica