Download - 4 medidas de posición
EstadísticosDefinición: Valores que resumen el
comportamiento (distribución) de una variable, o la relación (asociación) entre dos o mas variables.
Estadísticos que resumen el comportamiento de una variable: Medidas de Posición (Media, Mediana, Moda), Medidas de dispersión (Desvío Estandar, Varianza, Coef. de Variación, Rango intercoartilico).
Medidas de Posición – LA MODA
La moda, es aquel valor de la variable que más se repite.
Medidas de Posición – LA MODA
• La moda puede ser única, si la frecuencia mayor es única.
• Puede haber mas de una, en caso de que la frecuencia mayor se repita.
• Puede no existir, en caso de que no halla valores repetidos (esto último en datos acumulados no es verificable).
Medidas de Posición – LA MODA
Miremos los siguientes conjuntos a)2 5 7 9 9 9 11 11 Tiene moda 9b)3 8 10 12 15 16 19 No tiene modac) 2 4 4 4 4 5 5 7 7 7 7 9 Tiene 2 modas
Los conjuntos que tienen una moda se llaman unimodales y los conjuntos que tienen 2 modas se llaman bimodales.
LA MODA en datos acumulados
Distribución de Frecuencias
Categorías (en años) FA
1 18
2 32
3 12
4 10
5 9
81
POLIGONO DE FRECUENCIAS
•La Categoría que presenta la moda se llama Categoría Modal.
En un polígono de frecuencia la moda corresponde al punto más alto.
Variables Continuas – LA MODA
En variables continuas habitualmente hablamos de Intervalo Modal.
Intervalos Marcas de clase
Frecuencias Absolutas
(58-62] 60 5
(62-66] 64 18
(66-70] 68 42
(70-74] 72 27
(74-78] 76 8
100
iiiii
iii a
nnnn
nnlModa
11
11 46,684
27421842
184266
Moda
Medidas de Posición – LA MEDIA
La Media X� (promedio): El valor que hubiera tomado cada individuos si el total de los puntajes se hubiera distribuido equitativamente entre todos los individuos.
Consiste en sumar los valores de los individuos y dividirlos entre la cantidad de individuos.
x = x₁ + x₂+…………xn → DATOS SIN AGRUPAR N
Los valores observados en cada individuo son los valores que toman los individuos en la variable x₁ + x₂+…………+xn y el número de observaciones, ó número de individuos es N.
Propiedades de la Media (1)• La suma de las distancias a la media = 0
x de 5; 10, 15 = 5+10+15 = 10 3
5-10 = -510-10 = 015-10 = 5 -5 + 0 + 5 = 0
01
N
i
xxi
Propiedades de la Media (2)• La media de una suma de variables = la suma de las medias
de cada variable.
+ y + = 10+16+25=51x� z�x (5,10,15) / = 5; 10; 15 = 10xy (8,16,24)/ y = 8; 16; 24 = 16z (14,28,33)/ = 14; 28; 33 = 25z Media de (x+y+z) = (5+8+14)+(10+16+28)+(15+24+33) 3
Media de x+y+z = 27+54+72 = 153 = 51 3 3
Propiedades de la Media (3)
Si un conjunto de observaciones x₁, x₂………xn tienen desviaciones respecto de un número A dadas por:
Entonces tenemos que: la media del conjunto es igual a A + el promedio de la sumatoria de las distancias al punto.
AxdAxdAxd NN ,..., , 2211
N
dAx
N
ii
1
Propiedad 3
2 4 7 A= 9 11 Suma de distancias -32-9= -74-9=-5 -7-5-2+2 = -127-9=-2 -12/4=-311-9=2 = 9-3 = 6 x
2 4 =6 7 A=9 11x� Promedios 0 -3
Siendo:A = 9Promedio distancias a 9 = -3La media desconocida
= 9 – 3= 6x�
N
dAx
N
ii
1
Propiedad 3
• A cualquier punto de la variable, se le suma el promedio de las distancias a ese punto y nos da la Media de la variable.
N
dAx
N
ii
1
Demostración práctica (propiedad 3)•En valores absolutos, la distancia entre dos puntos de una variable = La distancia entre el promedio de las distancias a cada uno de los 2 puntos.
Propiedades de la Media (4)• Dado un conjunto de observaciones con media , si a cada uno
de esos valores se le realiza la misma operación matemática por el mismo valor constante:
(x₁◊k), (x₂◊k),…………………….(xn◊k) siendo ◊ una operación matemática básica (suma, resta,
multiplicación o división) la media del nuevo conjunto de valores es igual a: ◊kx
x de 5; 10, 15 = 10 / operación básica suma y k=7x de 12; 17, 22 = 17 ₁
= 10 + x k = 10 +7
Media para Datos Acumulados
Para el cálculo de la Media ( ) utilizamos en variables xcontinuas, la marca de clase y en las variables discretas, tomamos el valor de la variable por la marca de clase (MC). Con esta indicación, usamos la misma formula tanto para variables discretas como para variables continuas.
= x� (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 * nn-1)+(cn *nn)N
Siendo c las Marca de Clase y n las Frecuencias Absolutas
Media para Datos Acumulados
En variables continuas asumimos que los individuos se distribuyen equitativamente al interior de cada intervalo, en torno a la marca de clase. Asumimos que es un buen promedio al interior del intervalo, lo que es probable estadísticamente.
= x� (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 * nn-1)+(cn *nn)N
Siendo c las Marca de Clase y n las Frecuencias Absolutas
Media para Frecuencia Absoluta
Media para Frecuencia Absoluta: = x (1500*8)+(4500*11)+(7500*11)+………(25500*1)=hacer en clase
75
Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,26(6000 a 9000] 7500 11 0,15 30 0,41
(9000 a 12000] 10500 20 0,27 50 0,68(12000 a 15000] 13500 15 0,20 65 0,88(15000 a 18000] 16500 6 0,08 71 0,96(18000 a 21000] 19500 3 0,04 74 0,10(21000 a 24000] 22500 0 0,00 74 0,10(24000 a 27000] 25500 1 0,01 75 1
75 1,00
Media para Frecuencia Relativa
Media para Frecuencia Relativa:
= (0,11*1500)+(0,15*4500)+(0,15*7500)+………(0,01+25500)= Hacer en clasex
Las FR ya están divididas por el N, por lo tanto es sumatoria de la MC*FR en cada intervalo.
Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,26
(6000 a 9000] 7500 11 0,15 30 0,41
(9000 a 12000] 10500 20 0,27 50 0,68
(12000 a 15000] 13500 15 0,20 65 0,88
(15000 a 18000] 16500 6 0,08 71 0,96
(18000 a 21000] 19500 3 0,04 74 0,10
(21000 a 24000] 22500 0 0,00 74 0,10
(24000 a 27000] 25500 1 0,01 75 1
75 1,00
ResoluciónMedia para Frecuencia
Absoluta
Sueldos MC FA =∑(MC*FA)/Nx
(0 a 3000] 1500 8
(3000 a 6000] 4500 11
(6000 a 9000] 7500 11
(9000 a 12000] 10500 20
(12000 a 15000] 13500 15
(15000 a 18000] 16500 6
(18000 a 21000] 19500 3
(21000 a 24000] 22500 0
(24000 a 27000] 25500 175 9860
Media para Frecuencia Relativa
MC FR MC*FR =∑(MC*FA)x
1500 0,11 165
4500 0,15 675
5500 0,15 825
8500 0,27 2295
11500 0,2 2300
14500 0,08 1160
17500 0,04 700
20500 0 0
22500 0,01 225
1 8345 9860
Medidas de Posición – LA MEDIANAValor que toma la variable para aquel individuo que
ocupa el centro de la distribución, una vez que los datos están ordenados de menor a mayor. Valor del individuo que se encuentra en el centro de la distribución.
IMPORTANTE: encontrar la mediana implica primero encontrar la posición del individuo en el centro de la distribución y luego el valor que toma ese individuo en la variable.
Medidas de Posición – LA MEDIANA1 2 2 3 3 4 5 5 5 6 7 7 8 9 10 11 12 13
Mediana = 5,5
Formula para Impar: Par:
Recordemos que la cifra entre paréntesis es la posición del individuo.X por su parte es el valor que toma la variable para el individuo que esta en esa posición.
2
122
NN
x
xx
med
2
1N x xmed
Medidas de Posición – LA MEDIANA
Datos sin agrupar impar
3 4 5 6 7Med = X₃ = 5
Datos sin agrupar par
34 5 6 7 8Med = X₃+X₄ = 5,5
2IMPORTANTE: encontrar la mediana implica primero encontrar la posición del individuo en el centro de la distribución y luego el valor que toma ese individuo en la variable.
Mediana para Datos AcumuladosFrecuencia Absoluta
Med = N/2 – Ni-1 ai +li-1 ni
Limite inferior del Intervalo donde esta
la mediana
Amplitud del intervalo
FAA intervalo anterior a la mediana
FA Intervalo donde esta la
Mediana
Calculo de la Mediana (FA)Sueldos MC FA FR FAA FRA
(0 a 3000] 1500 8 0,11 8 0,11(3000 a 6000] 4500 11 0,15 19 0,25(6000 a 9000] 7500 11 0,15 30 0,40
(9000 a 12000] 10500 20 0,27 50 0,67(12000 a 15000] 13500 15 0,20 65 0,87(15000 a 18000] 16500 6 0,08 71 0,95(18000 a 21000] 19500 3 0,04 74 0,99(21000 a 24000] 22500 0 0,00 74 0,99(24000 a 27000] 25500 1 0,01 75 1
75 1,00
Med = N/2 – Ni-1 ai +li-1 ni
Med = 37,5 – 30 3000+9000= 10125 20
Calculo de la Mediana (FA)
Med = N/2 – Ni-1 ai +li-1 ni
Med = 37,5 – 30 3000+9000= 10125 20
Mediana para Datos AcumuladosFrecuencia Relativa: donde dice N (FA) pongo F (FR)
Med = 1/2-Fi-1 ai +li-1 fi
Limite inferior del Intervalo donde esta la mediana
Amplitud del intervalo
FAA intervalo anterior a la mediana
FA Intervalo donde esta la
Mediana
Calculo de la Mediana (FR)
Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,25(6000 a 9000] 7500 11 0,15 30 0,40
(9000 a 12000] 10500 20 0,27 50 0,67(12000 a 15000] 13500 15 0,20 65 0,87(15000 a 18000] 16500 6 0,08 71 0,95(18000 a 21000] 19500 3 0,04 74 0,99(21000 a 24000] 22500 0 0,00 74 0,99(24000 a 27000] 25500 1 0,01 75 1
75 1,00
Med = 0,50 – Fi-1 ai +li-1 fi
Med = 0,50 – 0,40 3000+9000= 10111 0,27
Robustez; Media, Mediana• Si tomamos un conjunto de datos cualquiera a los
cuales calculamos media, mediana y moda y agregamos un dato extremo. Al volver a calcular la media, la mediana y la moda, veremos que la media puede variar notablemente, mientras que la mediana y la moda permanecen similares. Esta no variación de la mediana y la moda reciben el nombre de robustez. Las medidas basadas en el orden –como la mediana- gozan de ésta, en tanto que las medidas basadas en la suma –como la media- se ven más afectadas por las observaciones extremas y son, por lo tanto, poco robustas.
Media, Mediana y Moda• Si todas las observaciones estuvieran concentradas en un solo valor de la
variable, media, mediana coincidirían en el mismo. Si las observaciones se fueran distribuyendo en forma simétrica, a la izquierda y a la derecha de ese valor central, media, mediana y modo seguirían coincidiendo. Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central más que las observaciones de la parte derecha, generando una distribución asimétrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correrá a la izquierda también y por el mismo motivo, la media será menor que la mediana. En una distribución asimétrica a la derecha, la media, es mayor que la mediana.
Concentración de los individuos• Según el tipo de Asimetría que tenga la
variable sabemos en donde se concentran los individuos que estamos investigando.
• Si la gráfica es simétrica los individuos se concentran en el centro de la variable.
• Si tiene asimetría negativa, los valores concentran a la izquierda de la gráfica.
• Si la asimetría es positiva, los valores concentraran a la derecha de la gráfica.
Gráficos para cuantitativas continuasAsimetría positiva a la derecha Asimetría negativa a la izquierda
Medidas de Posición – Cuartiles
De la misma forma que la Mediana divide la distribución en 2 partes al ubicar al individuo central. Los Cuartiles dividen la distribución en 4 partes.
Medidas de Posición – Cuartiles
• 1er cuartil: Valor del individuo que esta sobre el 25% de la distribución.
• 2º cuartil: coincide con la mediana.• 3er cuartil: Valor del individuo que esta sobre
el 75% de la distribución.• 4º Cuartil: Ultimo individuo de la distribución.
Medidas de Posición – Cuartiles1 2 2 3 3 4 5 5 5 7 6 7 8 9 10 11 12 13
Mediana = 6
Formula para 1er. Cuartil sin agruparImpar: Par: 2
144
1
NN xx
Q
4
11 NxQ
Recordemos que Q1 es la posición del individuo que ocupa el 25% de la variable. (ubicar primer cuartil en el ejemplo)
Medidas de Posición – CuartilesFormula para 3er. Cuartil sin agrupar
• Impar • Par
34
13 NxQ2
13
43
43
NN xx
Q
Si el número da con coma se ajusta hacia arriba. Ya que es el individuo sobre el cual quedan el 75% de las observaciones. Recordemos que con la formula (N….) ubicamos la posición del individuo en la distribución.
Cuartiles – Datos AgrupadosFrecuencia Absoluta
Primer Cuartil
Frecuencia Relativa
Tercer Cuartil
1
1
14
ii
i
i
lan
NN
Q
1
1
3
34
ii
i
i
lan
NN
Q
111
25,0
iii
laf
FQ i
131
75,0
iii
laf
FQ i
Medidas de Posición – Quintiles, Déciles, Percentiles.
• Quintiles: Divide la frecuencia en 5 partes iguales.
• Déciles: Divide la frecuencia en 10 partes.
• Percentiles: Divide la frecuencia en 100 partes iguales.
Formula GeneralFrecuencia Absoluta
I = p(N) – Ni-1 ai +li-1
ni
Frecuencia Relativa:
I = p(1)-Fi-1 ai +li-1 fi
Limite inferior del Intervalo donde esta
el individuo
Amplitud del intervalo
FAA intervalo anterior al individuo
FA Intervalo donde esta el
individuo
Proporción del Individuo buscado
En un N de 1240 buscar la ubicación de los siguientes individuos.
• Decil₃
• Cuartil₁
• Quintil₄
• Percentil34
En un N de 1240 Buscar
• Decil₃ …………………. 3/10(1240)=
• Cuartil₁…………………1/4(1240)=
• Quintil₄…………………4/5(1240)=
• Percentil34……………………...35/100 (1240)=
Estadísticos: Medidas de Posición
Estadístico Variable según su nivel de mediciónProporción nominales ordinales RazónPorcentaje nominales ordinales RazónRatio nominales ordinales RazónModa nominales ordinales Intervales RazónMediana nominales₁ ordinales Intervales RazónMedia₂ Intervales Razón
₁Mediana:-En las variables nominales suele ser poco útil ya que su valor cambia con el orden que se le de a las categorías.