medidas descriptivas · (asimetría negativa) media, mediana y moda. estadísticos de posición:...
TRANSCRIPT
Medidas descriptivas
• Los fenómenos biológicos no suelen ser
constantes, por lo que será necesario
que junto a una medida que indique el
valor alrededor del cual se agrupan los
datos, se asocie una medida que haga
referencia a la variabilidad que refleje
dicha fluctuación.
• La tendencia central de los datos.
• La dispersión o variación con respecto a
este centro.
• Los datos que ocupan ciertas posiciones.
• La simetría de los datos.
• La forma en la que los datos se agrupan.
Medidas representativas de un
conjunto de datos estadísticos
Estadísticos de tendencia
central
• la media
• la mediana
• la moda
En ciertas ocasiones estos tres
estadísticos suelen coincidir, aunque
generalmente no es así. Cada uno de
ellos presenta ventajas e inconvenientes.
La media
• Es la medida mas popular.
• Es decir, tenemos una muestra de n observaciones: x1, x2,…,xn. Su media muestral es:
• De forma compacta:n
)x...xx( n21 +++=x
=
=n
1i
ixn
1x
Suma de las observaciones
Número de observacionesMedia =
=+++++
=
= =
6
xxxxxx
6
xx 654321i
61i
• Ejemplo:
La media de la muestra de seis
observaciones:
7, 3, 9, -2, 4, 6
esta dada por:
7 3 9 4 64.5
2−
16 empleados
5.116
)3(2)2(7)1(4)0(3
16
x...xx
16
xx 1621i
161i =
+++=
++=
= =
Medidas de Posición Central: la media
Cuando muchas observaciones toman el mismo valor, estas se pueden
resumir en una tabla de frecuencias. Supongamos que el número de
Hijos en una muestra de 16 empleados fuera el siguiente:
NUMERO DE HIJOS 0 1 2 3
NUMERO DE EMPLEADOS 3 4 7 2
• Ejemplo:
Propiedades de la media
• La suma de los desvíos de los valores de la
variable, calculado con respecto de la media
aritmética es = 0
=−
=−
0)(
0)(
ii
i
nXx
Xx
• La media aritmética
del producto de una
constante por una
variable es = a la
constante por la
media aritmética de
la variable:
Xaxa .. =
• La media aritmética
de la suma de dos
variables es = a la
suma de sus
respectivas medias
aritméticas:YXyx +=+
Mediana
• Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
• Los datos deben ordenarse de menor a mayor
• No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).
La mediana
Nro. de observaciones es impar
26,26,28,29,30,32,60
Los salarios de siete empleados fueron
los siguientes (en 1000s) :
28, 60, 26, 32, 30, 26, 29.
¿Cuál es la mediana?
Supongamos que se agrega al grupo el
Salario de un empleado más ($31,000).
¿Cuál es la mediana?
Nro. de observaciones es par
26,26,28,29, 30,31, 32,60
Hay dos valores en el medio!
Primero, ordenar los salarios.
Luego, localizar el valor en el medio.
26,26,28,29, 30,31,32,6029.5,
• Ejemplo:
Primero, ordenar los salarios.
Luego, localizar el valor en el medio.
La moda es el valor que ocurre con
mayor frecuencia en un grupo de
observaciones.
La modaCuando la muestra
es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal
La Moda
En un conjunto de observaciones puede haber más de una
moda.
Ejemplo
El gerente de una tienda de ropa posee la siguiente
información sobre el talle de los pantalones que
se vendieron ayer:
31, 34, 36, 33, 28, 34, 30, 34, 32, 40.
La Moda es 34
En muchos casos, la moda nos da
información mas valiosa que la
mediana: 33.2.
La Moda
Ejemplo
• Vamos a utilizar la
distribución de
frecuencias con
datos de la estatura
(altura a la cruz) de
los terneros de un
lote a remate.
VariableFrecuencias absolutas
Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
• Media aritmética:
• Luego:
• Por lo tanto, la estatura media de este
grupo de es de 1,253 m.
( ) ( ) ( )30
330,1421,1120,1 +++=
x
253,1=x
• Mediana: La mediana
de esta muestra es 1,26
m, ya que por debajo
está el 50% de los
valores y por arriba el
otro 50%. Esto se puede
ver al analizar la
columna de frecuencias
relativas acumuladas.
Como el valor 1,26 se repite en 3 ocasiones, la media
se situaría exactamente entre el primer y el segundo
valor de este grupo, ya que entre estos dos valores se
encuentra la división entre el 50% inferior y el 50%
superior.
Variable
Frecuencias absolutas
Frecuencias relativas
(Valor) SimpleAcumula
daSimple
Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0%100,0
%
• Moda: Hay 3 valores
que se repiten en 4
ocasiones: el 1,21, el
1,22 y el 1,28, por lo
tanto esta seria
cuenta con 3 modas.
VariableFrecuencias absolutas
Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Media y Mediana
• La media es sensible a observaciones extremas y a outliers.
• La mediana solo es sensible a cambios en su entorno que la cruzan. Por ello, se dice que la mediana es un estimador robusto de la tendencia central.
• La media y la mediana de una distribución simétrica se encuentran muy cerca. Si la distribución es exactamente simétrica, la media y la mediana coinciden.
Distribuciones simétricas
y asimétricas
• Una distribución es simétrica si el lado derecho e izquierdo del histograma con respecto a la mediana son aproximadamente iguales.
• Un distribución es asimétrica hacia laderecha si el lado derecho del histograma seextiende sobre un mayor número de valores(intervalos) que el lado izquierdo.
• Una distribución es asimétrica hacia la izquierda si el lado izquierdo del histograma se extiende sobre un mayor número de valores (intervalos) que el lado derecho.
Asimetría hacia la derecha
Asimetría hacia la izquierda
Aspecto general de una
distribución
• La figura muestra la distribución de ventas de libros
por individuo en la feria del libro. Esta distribución es
asimétrica hacia la derecha. Es decir hay muchas
ventas de 3 o 4 libros y pocas ventas de 10 libros.
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12
• Si una distribución es simétrica, la media,
mediana y modo coinciden
• Si una distribución no es simétrica, las tres
medidas difieren.
Asimetría hacia la derecha
(asimetría positiva)
Media
MedianaModo
Media
Mediana
Modo
Asimetría hacia la izquierda
(asimetría negativa)
Media, Mediana y Moda
Estadísticos de posición:
Cuartiles (Ql)
• Son un caso
particular de los
percentiles. Hay 3, y
se definen como:753
502
251
PQ
M PQ
PQ
ed
=
==
=
Estadísticos de Posición:
Percentiles• Los percentiles son otro conjunto de medidas de tendencia no central
de una distribución.
• Dividen los datos ordenados en 100 partes iguales.
• El percentil 25 es el primer cuartil ...
• Ejemplo
– Supongamos que el 78% de los resultados del GMAT es menor o igual a 600 puntos. Entonces, 600 es el percentil 78 de la distribución.
600200 800
78% de todos los resultados 22%
• En el caso de una variable continua, el
intervalo donde se encuentra ,
se calcula buscando el que deja debajo
de si al k% de las observaciones.
Dentro de él, Pk se obtiene según la
relación:
( iik llP − −1
i
i
i
ik a . n
Nk
n
lP1
1
100−
−
−
+=
– Percentiles frecuentemente utilizados
• Primer decil = percentil 10
• Primer cuartil, Q1, = percentil 25
• Segundo cuartil,Q2, = percentil 50
• Tercer cuartil, Q3, = percentil 75
• Noveno decil = percentil 90
Ejemplo
Encontrar los cuartiles del siguiente conjunto de
datos:
7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 8
– Solución
• Primero, ordenar las observaciones
2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30
Como máximo, (.25)(15) = 3.75
observaciones deberían aparecer por
debajo del primer cuartil.
Como máximo, (.75)(15)=11.25
observaciones deberían aparecer por
encima del primer cuartil.
Primer cuartil
Si el numero de observaciones es par,
los resultados se encuentran entre dos observaciones.
En ese caso, hay que elegir el punto medio entre ambas observaciones.
15 observaciones
Deciles
• Se definen como los valores de la variable
que dividen a las observaciones en 10
grupos de igual tamaño.
• Más precisamente, definimos D1,D2, ..., D9
como:
,91,2,i PD ii == 10
Ejemplo
• Dada la siguiente
distribución en el
número de crías de
cien perras, calcular
sus cuartiles
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n = 100
Solución
• Primer cuartil:
• Segundo cuartil:
• Tercer cuartil:
2Q luego ;394/N Primera ;254
1i === nn
3;654/2;504
2=== 2i Q luego nN Primera
n
4;854/3;754
3=== 3i Q luego nN Primera
n
xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n = 100