medidas de dispersão
TRANSCRIPT
1
CMIP- Centro de Metrologia e Inovação em ProcessosUFSC- UNIVERSIDADE FEDERAL DE SANTA CATARINA
Profª Andréa
Medidas de Dispersão
2
Medidas de Dispersão
• As Medidas de Tendência Central:
– representam de certa forma uma determinada
distribuição de dados
– só elas não são suficientes para caracterizar a
distribuição.
• Para uma análise estatística mais exata é necessária
a verificação da flutuação dos valores em torno de
sua média aritmética
3
Medidas de Dispersão
• Suponha as notas de 2 grupos de estudantes,
cada qual com 4 alunos.
• GRUPO “A” : 4, 5, 5, 6
• GRUPO “B” : 0, 0, 10, 10
• Média do grupo “A”: 5
• Média do grupo “B”: 5
4
Medidas de Dispersão
• Os dois grupos apresentam a mesma média
• O comportamento dos 2 grupos são bem distintos.
GRUPO “A”: valores são mais homogêneos
GRUPO “B”: valores são dispersos em relação à
média
5
Medidas de Dispersão
• Dentre as medidas de dispersão pode-se citar algumas delas:
Amplitude Total
Variância
Desvio Padrão
6
Amplitude Total - At
• A amplitude total é a diferença entre o maior e o
menor valor da série ou da distribuição. Representa
a dispersão máxima.
• Ela raramente é usada como única medida de
variabilidade porque é calculada apenas com os
valores extremos
• Exemplo: Nota de 20 alunos:
Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9
At = 9 – 1 = 8
7
Distribuição de frequência sem intervalos de classes - At
• A definição é a mesma, porém, o maior e o menor valor da série são observados na coluna do valor da variável Xi .
At = 10 – 6At = 4
8
i Idades (anos) fi
1 18 24 5
2 24 30 10
3 30 36 4
4 36 42 12
5 42 48 7
6 48 54 2
40
Distribuição de frequência com intervalos de classes - At
At = 54 – 18At = 36
9
Variância
A medida de dispersão usual é a variância e principalmente sua
raiz quadrada que é denominada de desvio padrão.
( )
N
μx
)x(σ)x(Var
N
1i
2
i2
=
−
==N
x
μ
N
1i
i==
Onde é a média populacionale N é o tamanho da população
estudada.
A variância é expressa por:
e
10
Quando a média não é exata e precisa ser arredondada, cada
desvio fica afetado ligeiramente por esse arredondamento, que
não deixa de ser um erro, por isso é mais aconselhável que se
utilize a fórmula desenvolvida a seguir:
( )
−=
N
xx
N
1)x(σ
2
i2
i
2
Variância - População
OBS:
A unidade da variância é o quadrado da unidade dos dadoscausando dificuldades para avaliar a dispersão: se por exemplotemos a variável peso com média de 75 kg em um conjunto e aocalcular a variância obtemos 12 kg2 a avaliação da dispersão torna-se difícil.
11
As equações que definem a variância da amostra, denotada porS2 são, então:
( )
1)()( 1
2
2
−
−
===
n
xx
xsxVar
n
i
i
n=é o tamanho da amostra estudada.
amostralmédiax =
( )
−
−=
n
xx
1n
1)x(s
2
i2
i
2
Variância Amostra
12
( )
−
−=
n
xx
1n
1)x(s
2
i2
i
2
Variância Amostra
OBS:
A utilização de n - 1 no denominador é indispensável para que a variância da variável na amostra possa ser um bom estimador da variância da variável na população.
13
Variância –População e Amostra
Portanto:
( )
−=
N
xx
N
1)x(σ
2
i2
i
2
Amostra
( )
−
−=
n
xx
1n
1)x(s
2
i2
i
2
População
14
Desvio Padrão
O desvio padrão é a medida de dispersão maisusada, tendo em comum com o desvio médio o fatode ambos considerarem os desvios em relação àmédia.
2)( =x
2)( sxs =
Amostra
PopulaçãoDispersão
absoluta
15
Exemplo de Aplicação
Vamos calcular o desvio padrão das notas das trêsequipes. Para facilitar, vamos montar uma tabelacom os dados e os cálculos necessários.
Imagine três equipes de alunos cujas notas numa mesma prova de estatística foram:Considerando que seja a populaçãoEquipe A: 5; 5; 5; 5
Equipe B: 9; 9; 1; 1
Equipe C: 6; 6; 4; 4
16
Exemplo de Aplicação
Para o cálculo da variância populacional:
( )
−=
N
xx
N
1)x(σ
2
i2
i
2
a) Equipe A: 5; 5; 5; 5
( )
= −N
X
i
iX
N
2
22 1
−=
4
20100
4
1 22
17
Exemplo de Aplicação
a) Equipe A: 5; 5; 5; 5
−=
4
400100
4
12
1001004
12 −=
Como já esperávamos uma vez que todos os valores são iguais à média e não há variabilidade (dispersão).
2 =
pontospontos 00 2 ==
18
Exemplo de Aplicação
b) Equipe B: 9; 9; 1; 1
( )
= −N
X
i
iX
N
2
22 1
−=
4
20164
4
1 22
−=
4
400164
4
12
644
12 =
22 16 pontos=
19
Exemplo de Aplicação
b) Equipe B: 9; 9; 1; 1
22 16 pontos=
O desvio-padrão vale
2 =pontospontos 416 2 ==
20
Exemplo de Aplicação
c) Equipe C: 6; 6; 4; 4
Xi Xi2
6 36
6 36
4 16
4 16
20 104
( )
= −N
X
i
iX
N
2
22 1
−=
4
20104
4
1 22
−=
4
400104
4
12
1001044
12 −=
21
Exemplo de Aplicação
c) Equipe C: 6; 6; 4; 4
Xi Xi2
6 36
6 36
4 16
4 16
20 104
O desvio padrão vale
2 =
pontoponto 11 2 ==
22
Exemplo de Aplicação
Observação – Supondo que para a Equipe Bdo exemplo anterior conhecêssemos os dadosamostrais. Usaríamos, então, n -1 e os cálculosseriam:
Variância:
( )
−= −
n
X
i
iX
nS
2
22
1
1
−=
4
20164
3
1 22S
23
Exemplo de Aplicação
−=
4
400164
3
12S
1001643
12 −=S
643
12 =S
22 33,21 pontosS =
pontospontosS 62,433,21 2 == DESVIO PADRÃO
24
Como há repetição dos valores da variável, avariância passa a ser uma média aritméticaponderada dos desvios ao redor da médiaelevados ao quadrado e às equaçõesanteriormente vistas acrescentam-se asfrequências.
Distribuição de frequência sem intervalos de classes
25
Distribuição de frequência sem intervalos de classes
Para a população, partindo-se da definição tem-se que:
( )
= −N
fX
ii
iifX
N
2
22 1
26
Para a amostra, partindo-se da definiçãotem-se que
( )
−= −
n
fX
ii
iifX
nS
2
22
1
1
Lembre-se de que nas distribuições o número de observações Nno caso de populações ou n no caso de amostras é obtido
somando-se as frequências simples absolutas das classes .
Distribuição de frequência sem intervalos de classes
27
Exemplo de Aplicação
Nas aulas anteriores, elaboramos a distribuição defrequências do número de filhos dos funcionáriosde uma empresa X.
Agora, vamos calcular a variância e o desvio padrãolembrando que a população foi investigada.
Para facilitar os cálculos, repetiremos as trêsprimeiras colunas da tabela conforme visto em aula
28
Exemplo de Aplicação
29
Exemplo de Aplicação
30
Exemplo de Aplicação
31
( )
= −N
fX
ii
iifX
N
2
22 1
−=
40
63165
40
1 22
−=
40
3969165
40
12
225,9916540
12 −=
Cálculo da variância
Exemplo de Aplicação
32
Cálculo da variância
775,6540
12 =
22 644375,1 filhos=
2 =
DESVIO PADRÃO
filhosfilhos 282332,1644375,1 2 ==
Exemplo de Aplicação
33
Supondo que a pesquisa na empresa X tivesseabrangido apenas uma amostra de 40funcionários e não a população. Usaríamos, então,n -1 e os cálculos seriam:
Variância:( )
−= −
n
fX
ii
iifX
nS
2
22
1
1
−=
40
63165
39
1 22S
225,9916539
12 −=S
22 686538,1 filhosS =
Exemplo de Aplicação
34
DESVIO PADRÃO
2SS =
filhosfilhosS 298668,1686538,1 2 ==
Exemplo de Aplicação
35
Variância - Dados agrupados com intervalo de classes
Para dados agrupados consideraremos a frequência no cálculo
da Variância e quando os dados se apresentarem em intervalos
de classe, Xi será o ponto médio do intervalo de classe. Logo,a
fórmula será:
( )
( )
−=
=
−
−
fi
fX
ii
fi
fX
ii
ii
ii
fXfi
s
fXfi
2
2
22
22
1
1
1
36
iESTATURAS
(cm)fi xi fixi fixi2
1
2
3
4
5
6
150 ι— 154
154 ι— 158
158 ι— 162
162 ι— 166
166 ι— 170
170 ι— 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1.404
1.760
1.312
840
516
92.416
219.024
281.600
215.168
141.120
88.752
∑ = 40 ∑ = 6.440 ∑ = 1038.080
Ponto Médio = Xi
Exemplo de Aplicação
37
( )
567,531
31124040
1
1036840-1038.08040
1
40
6440-1.038.080
40
1
1
2
22
222
==
===
=
=
=
−
fi
fX
ii
iifXfi
Exemplo de Aplicação
38
Medidas de Dispersão Relativa
A dispersão relativa permite ainda compararduas ou mais distribuições, mesmo que essas serefiram a diferentes fenômenos e sejamexpressas em unidades de medidas distintas.
39
Coeficiente de Variação
É uma medida de dispersão relativaque indica a relação percentual entre odesvio padrão e a média dos dados.
100μ
σCV =
100x
sCV =
População
Amostra
Para:CV < 15% → baixa dispersão15% CV 30% → média dispersãoCV > 30% → alta dispersão
40
Em uma amostra de moradores de determinada região foramanalisadas a idade (em anos) e a altura (em metros) daspessoas. Deseja-se comparar a dispersão em termos relativosem torno da média dos dois conjuntos de dados, a fim deverificar qual deles é mais homogêneo. Na coleta dos dadosverificou-se que:
Idade das pessoas : média 41,6 e desvio padrão = 0,82
Altura das pessoas: média 1,67 e desvio padrão = 0,2
Qual conjunto de dados apresenta menor dispersão relativa em torno da média?
Coeficiente de Variação- Exemplo
41
Coeficiente de Variação- Exemplo
Interpretação dos dados: como o coeficiente de variação da
idade foi menor que o coeficiente de variação da altura,
pode-se afirmar que os dados relativos à idade são mais
homogêneos que os dados da altura.
42