dispersion04
TRANSCRIPT
MEDIDAS DE DISPERSIÓN O VARIABILIDAD
ESTADÍSTICAProf. Alejandra Camors
Algunas consideraciones
1. Variación, se refiere a la cantidad en que los datos u observaciones varían entre si, esta variación puede medirse.
2. Los datos que están relativamente cercanos entre si, tienen bajas medidas de variabilidad, mientras que los que están mas alejados entre si tienen medidas de variación mas grandes.
MEDIDAS DE DISPERSION
Definición 1
Una medida de dispersión de un conjunto de datos, mide cuan esparcidos se encuentran estos o que tan heterogéneos son.
Clasificación de las Medidas de Dispersión:
MEDIDAS DE DISPERSIÓN ABSOLUTA
No hacen referencia a ningún promedio: Recorridos.
Hacen referencia a algún promedio:Desviación Absoluta Media respecto a un promedio. Desviación Cuadrática Media respecto a un promedio:
Varianza, Desviación Típica.
MEDIDAS DE DISPERSION RELATIVA
No hacen referencia a ningún promedio: Coeficiente de Apertura, Recorrido relativo, Recorrido Semi-intercuartílico
Hacen referencia a algún promedio: Coeficiente de Variación,
1.- Introducción
Recorrido o rango: Re = x(k) - x(1)
(En el ejemplo anterior 60 – 10 = 50 y 33 – 28 = 5 respectivamente, la 1ª más dispersa)
Recorrido Intercuartílico: RI = C3 - C1
Longitud del intervalo que recoge el 50% de las observaciones centrales
Recorrido Décil: RD = D9 - D1
Recorrido Percentil: RP = P99 - P1
150 160 170 180 190
0.0
00
.01
0.0
20
.03
0.0
40
.05
150 160 170 180 190
25% 25% 25% 25%
Mín. P25 P50 P75 Máx.
Rango intercuartílico
Rango
2.2.1- Medidas de Dispersión Absolutas. Recorridos
RANGO
Ante la pregunta sobre número de hijos por familia, una muestra de 12 hogares, marcó las siguientes respuestas:2 1 2 4 1 32 3 2 0 5 1
Calcule el rango de la variable
SoluciónEl Rango es R = 5 – 0 = 5
R = X máx – X min
La varianza
N
xN
ixi
1
2
2
)(
2
2 1
( )
1
n
ii
x xs
n
Muestral
Poblacional
VARIANZA VARIANZA
La varianza es otra medida de dispersión que se basa en la diferencia entre el valor de cada dato (Xi) y la media ( ). La diferencia entre cada dato (Xi) y su media ( ) para una muestra se llama desviación con respecto a la media o promedio y se expresa con la siguiente fórmula:
Para calcular la varianza, las desviaciones respecto a la media se elevan al cuadrado y se dividen entre (N – 1).
x
(Xi – X)(Xi – X)
x
CONTINUACIÓN CONTINUACIÓN
Fórmula para calcular la varianza:
S =
Veamos como calculamos la varianza en el siguiente ejemplo:
Se tienen los siguientes datos; 15, 12, 18, 20 y 25.Primero, calculamos la media:
= = 18
2
1
)(
N
xxi2
N
xx
5
2520181512
CONTINUACIÓN CONTINUACIÓN
Segundo, buscamos la desviación estándar respecto a la media ( ), que es la diferencia entre cada valor de (Xi) y el promedio ( ) luego, calculamos la sumatoria ∑( )2 , como se presenta a continuación:
Xi X ( ) ∑( )2 12 18 -6 3615 18 -3 918 18 0 020 18 2 4 25 18 7 49
total 98
2x
xx i
xx i
xx i
xx i
CONTINUACIÓN CONTINUACIÓN
Ahora, sustituimos las variables de la fórmula por los valores obtenidos como se presenta a continuación:
S = = = = 24.5 2
1
)(
N
xxi2
15
98
4
98
Desviación estándar Desviación estándar
N
xN
ixi
1
2)(
2
1
( )
1
n
ii
x xs
n
Muestral
Poblacional
DESVIACIÓN ESTÁNDAR
DESVIACIÓN ESTÁNDAR
Es una medida de la variabilidad de un conjunto de datos. Se calcula sacando la raíz cuadrada de la varianza. Nos indica cuánto tienden a alejarse los datos del promedio. Si los datos son de una muestra, la desviación estándar se representa como:
S = 2s
CONTINUACIÓN CONTINUACIÓN
En el ejemplo anterior la desviación estándar es:
S =
S =
S = 4.95
2s
5.24
Coeficiente de variación
Compara la variabilidad de series de datos que tengan unidades diferentes.
No tiene unidades de medida.Se calcula para variables medidas en
escala de razón
100%S
CVx
Muestral
Poblacional
100%CV
Ejemplo 4
Calcule el coeficiente de variabilidad para los datos del ejemplo 1
Solución:
%7759,641001667,2
4035,1
xcv
Medidas de dispersión en tablas de frecuencias (caso discreto)
Medidas de dispersión en tablas de frecuencias (caso discreto)
11
)(1
2
12
1
2
2
nn
fx
xf
n
xxfs
k
i
k
iii
ii
k
iii
21
2
1
2
2)(
N
xf
N
xfk
iii
k
iii
Muestral
Poblacional
18
Ejemplo_1Calificaciones de 100 alumnos de una clase en MatemáticasVariable discreta. Tabla ampliada.
xi fi xi fi |xi-x| |xi-x|.fi fi xi 2
3 40 120 1,80 72 360
5 30 150 0,20 6 750
7 30 210 3,20 96 1470
100 480 174 2580
VARIANZA
∑ fi .xi 2
V = ------------- - x 2 = 25,80 – 4,82
∑ fiV = 2,76
DESVIACIÓN TÍPICAS = √V =√2,76 = 1,66
DESVIACIÓN MEDIA
Dm = ∑ |xi-x| / ∑ fi = 174/100 =1,74
COEFICIENTE DE VARIACIÓN
CV = s / x = 1,66 / 4,8 = 0,346
19
clases xi = m.c. fi xi fi |xi-x| |xi-x|.fi fi xi 2
[0,5 , 3,5] 2 40 80 2,70 108 160
(3,5 , 6,5] 5 30 150 0,30 9 750
(6,5 , 9,5] 8 30 240 3,30 99 1920
100 470 216 2830
Ejemplo_2Calificaciones de 100 alumnos de una clase en MatemáticasVariable continua. Tabla ampliada.
VARIANZA
∑ fi .xi 2
V = ------------- - x 2 = 28,30 – 4,72
∑ fi V = 6,21
DESVIACIÓN TÍPICAS = √V =√6,21 = 2,49
DESVIACIÓN MEDIADm = ∑ |xi-x| / ∑ fi = 216/100 == 2,16
COEFICIENTE DE VARIACIÓN
CV = s / x = 2,49 / 4,7 = 0,53
Calcular y comparar (hombres/mujeres):
Coeficiente de Apertura, Recorrido Relativo y Recorrido Semi-Intercuartílico
Coeficiente de Variación
¿Qué salario es más homogéneo, el de hombres o el de mujeres?
Solución
0,37373,655
5,244
215,0)51,502777(
49,274
88,0875.1
650.1
33,8225
875.1
V
R
R
pA
s
r
Hombres
0,43251,556
55,240V
0,293)13,38138,696(
25,315
88,0875.1
650.1
33,8225
875.1
s
r
R
R
pA
Mujeres
MÁS HOMOGÉNEO