4 medidas de posición
TRANSCRIPT
![Page 1: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/1.jpg)
EstadísticosDefinición: Valores que resumen el
comportamiento (distribución) de una variable, o la relación (asociación) entre dos o mas variables.
Estadísticos que resumen el comportamiento de una variable: Medidas de Posición (Media, Mediana, Moda), Medidas de dispersión (Desvío Estandar, Varianza, Coef. de Variación, Rango intercoartilico).
![Page 2: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/2.jpg)
Medidas de Posición – LA MODA
La moda, es aquel valor de la variable que más se repite.
![Page 3: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/3.jpg)
Medidas de Posición – LA MODA
• La moda puede ser única, si la frecuencia mayor es única.
• Puede haber mas de una, en caso de que la frecuencia mayor se repita.
• Puede no existir, en caso de que no halla valores repetidos (esto último en datos acumulados no es verificable).
![Page 4: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/4.jpg)
Medidas de Posición – LA MODA
Miremos los siguientes conjuntos a)2 5 7 9 9 9 11 11 Tiene moda 9b)3 8 10 12 15 16 19 No tiene modac) 2 4 4 4 4 5 5 7 7 7 7 9 Tiene 2 modas
Los conjuntos que tienen una moda se llaman unimodales y los conjuntos que tienen 2 modas se llaman bimodales.
![Page 5: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/5.jpg)
LA MODA en datos acumulados
Distribución de Frecuencias
Categorías (en años) FA
1 18
2 32
3 12
4 10
5 9
81
POLIGONO DE FRECUENCIAS
•La Categoría que presenta la moda se llama Categoría Modal.
En un polígono de frecuencia la moda corresponde al punto más alto.
![Page 6: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/6.jpg)
Variables Continuas – LA MODA
En variables continuas habitualmente hablamos de Intervalo Modal.
Intervalos Marcas de clase
Frecuencias Absolutas
(58-62] 60 5
(62-66] 64 18
(66-70] 68 42
(70-74] 72 27
(74-78] 76 8
100
iiiii
iii a
nnnn
nnlModa
11
11 46,684
27421842
184266
Moda
![Page 7: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/7.jpg)
Medidas de Posición – LA MEDIA
La Media X� (promedio): El valor que hubiera tomado cada individuos si el total de los puntajes se hubiera distribuido equitativamente entre todos los individuos.
Consiste en sumar los valores de los individuos y dividirlos entre la cantidad de individuos.
x = x₁ + x₂+…………xn → DATOS SIN AGRUPAR N
Los valores observados en cada individuo son los valores que toman los individuos en la variable x₁ + x₂+…………+xn y el número de observaciones, ó número de individuos es N.
![Page 8: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/8.jpg)
Propiedades de la Media (1)• La suma de las distancias a la media = 0
x de 5; 10, 15 = 5+10+15 = 10 3
5-10 = -510-10 = 015-10 = 5 -5 + 0 + 5 = 0
01
N
i
xxi
![Page 9: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/9.jpg)
Propiedades de la Media (2)• La media de una suma de variables = la suma de las medias
de cada variable.
+ y + = 10+16+25=51x� z�x (5,10,15) / = 5; 10; 15 = 10xy (8,16,24)/ y = 8; 16; 24 = 16z (14,28,33)/ = 14; 28; 33 = 25z Media de (x+y+z) = (5+8+14)+(10+16+28)+(15+24+33) 3
Media de x+y+z = 27+54+72 = 153 = 51 3 3
![Page 10: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/10.jpg)
Propiedades de la Media (3)
Si un conjunto de observaciones x₁, x₂………xn tienen desviaciones respecto de un número A dadas por:
Entonces tenemos que: la media del conjunto es igual a A + el promedio de la sumatoria de las distancias al punto.
AxdAxdAxd NN ,..., , 2211
N
dAx
N
ii
1
![Page 11: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/11.jpg)
Propiedad 3
2 4 7 A= 9 11 Suma de distancias -32-9= -74-9=-5 -7-5-2+2 = -127-9=-2 -12/4=-311-9=2 = 9-3 = 6 x
2 4 =6 7 A=9 11x� Promedios 0 -3
Siendo:A = 9Promedio distancias a 9 = -3La media desconocida
= 9 – 3= 6x�
N
dAx
N
ii
1
![Page 12: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/12.jpg)
Propiedad 3
• A cualquier punto de la variable, se le suma el promedio de las distancias a ese punto y nos da la Media de la variable.
N
dAx
N
ii
1
![Page 13: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/13.jpg)
Demostración práctica (propiedad 3)•En valores absolutos, la distancia entre dos puntos de una variable = La distancia entre el promedio de las distancias a cada uno de los 2 puntos.
![Page 14: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/14.jpg)
Propiedades de la Media (4)• Dado un conjunto de observaciones con media , si a cada uno
de esos valores se le realiza la misma operación matemática por el mismo valor constante:
(x₁◊k), (x₂◊k),…………………….(xn◊k) siendo ◊ una operación matemática básica (suma, resta,
multiplicación o división) la media del nuevo conjunto de valores es igual a: ◊kx
x de 5; 10, 15 = 10 / operación básica suma y k=7x de 12; 17, 22 = 17 ₁
= 10 + x k = 10 +7
![Page 15: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/15.jpg)
Media para Datos Acumulados
Para el cálculo de la Media ( ) utilizamos en variables xcontinuas, la marca de clase y en las variables discretas, tomamos el valor de la variable por la marca de clase (MC). Con esta indicación, usamos la misma formula tanto para variables discretas como para variables continuas.
= x� (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 * nn-1)+(cn *nn)N
Siendo c las Marca de Clase y n las Frecuencias Absolutas
![Page 16: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/16.jpg)
Media para Datos Acumulados
En variables continuas asumimos que los individuos se distribuyen equitativamente al interior de cada intervalo, en torno a la marca de clase. Asumimos que es un buen promedio al interior del intervalo, lo que es probable estadísticamente.
= x� (c1*n1)+(c2 * n2)+(c3 * n3)+ .....+(cn-1 * nn-1)+(cn *nn)N
Siendo c las Marca de Clase y n las Frecuencias Absolutas
![Page 17: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/17.jpg)
Media para Frecuencia Absoluta
Media para Frecuencia Absoluta: = x (1500*8)+(4500*11)+(7500*11)+………(25500*1)=hacer en clase
75
Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,26(6000 a 9000] 7500 11 0,15 30 0,41
(9000 a 12000] 10500 20 0,27 50 0,68(12000 a 15000] 13500 15 0,20 65 0,88(15000 a 18000] 16500 6 0,08 71 0,96(18000 a 21000] 19500 3 0,04 74 0,10(21000 a 24000] 22500 0 0,00 74 0,10(24000 a 27000] 25500 1 0,01 75 1
75 1,00
![Page 18: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/18.jpg)
Media para Frecuencia Relativa
Media para Frecuencia Relativa:
= (0,11*1500)+(0,15*4500)+(0,15*7500)+………(0,01+25500)= Hacer en clasex
Las FR ya están divididas por el N, por lo tanto es sumatoria de la MC*FR en cada intervalo.
Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,26
(6000 a 9000] 7500 11 0,15 30 0,41
(9000 a 12000] 10500 20 0,27 50 0,68
(12000 a 15000] 13500 15 0,20 65 0,88
(15000 a 18000] 16500 6 0,08 71 0,96
(18000 a 21000] 19500 3 0,04 74 0,10
(21000 a 24000] 22500 0 0,00 74 0,10
(24000 a 27000] 25500 1 0,01 75 1
75 1,00
![Page 19: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/19.jpg)
ResoluciónMedia para Frecuencia
Absoluta
Sueldos MC FA =∑(MC*FA)/Nx
(0 a 3000] 1500 8
(3000 a 6000] 4500 11
(6000 a 9000] 7500 11
(9000 a 12000] 10500 20
(12000 a 15000] 13500 15
(15000 a 18000] 16500 6
(18000 a 21000] 19500 3
(21000 a 24000] 22500 0
(24000 a 27000] 25500 175 9860
Media para Frecuencia Relativa
MC FR MC*FR =∑(MC*FA)x
1500 0,11 165
4500 0,15 675
5500 0,15 825
8500 0,27 2295
11500 0,2 2300
14500 0,08 1160
17500 0,04 700
20500 0 0
22500 0,01 225
1 8345 9860
![Page 20: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/20.jpg)
Medidas de Posición – LA MEDIANAValor que toma la variable para aquel individuo que
ocupa el centro de la distribución, una vez que los datos están ordenados de menor a mayor. Valor del individuo que se encuentra en el centro de la distribución.
IMPORTANTE: encontrar la mediana implica primero encontrar la posición del individuo en el centro de la distribución y luego el valor que toma ese individuo en la variable.
![Page 21: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/21.jpg)
Medidas de Posición – LA MEDIANA1 2 2 3 3 4 5 5 5 6 7 7 8 9 10 11 12 13
Mediana = 5,5
Formula para Impar: Par:
Recordemos que la cifra entre paréntesis es la posición del individuo.X por su parte es el valor que toma la variable para el individuo que esta en esa posición.
2
122
NN
x
xx
med
2
1N x xmed
![Page 22: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/22.jpg)
Medidas de Posición – LA MEDIANA
Datos sin agrupar impar
3 4 5 6 7Med = X₃ = 5
Datos sin agrupar par
34 5 6 7 8Med = X₃+X₄ = 5,5
2IMPORTANTE: encontrar la mediana implica primero encontrar la posición del individuo en el centro de la distribución y luego el valor que toma ese individuo en la variable.
![Page 23: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/23.jpg)
Mediana para Datos AcumuladosFrecuencia Absoluta
Med = N/2 – Ni-1 ai +li-1 ni
Limite inferior del Intervalo donde esta
la mediana
Amplitud del intervalo
FAA intervalo anterior a la mediana
FA Intervalo donde esta la
Mediana
![Page 24: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/24.jpg)
Calculo de la Mediana (FA)Sueldos MC FA FR FAA FRA
(0 a 3000] 1500 8 0,11 8 0,11(3000 a 6000] 4500 11 0,15 19 0,25(6000 a 9000] 7500 11 0,15 30 0,40
(9000 a 12000] 10500 20 0,27 50 0,67(12000 a 15000] 13500 15 0,20 65 0,87(15000 a 18000] 16500 6 0,08 71 0,95(18000 a 21000] 19500 3 0,04 74 0,99(21000 a 24000] 22500 0 0,00 74 0,99(24000 a 27000] 25500 1 0,01 75 1
75 1,00
Med = N/2 – Ni-1 ai +li-1 ni
Med = 37,5 – 30 3000+9000= 10125 20
![Page 25: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/25.jpg)
Calculo de la Mediana (FA)
Med = N/2 – Ni-1 ai +li-1 ni
Med = 37,5 – 30 3000+9000= 10125 20
![Page 26: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/26.jpg)
Mediana para Datos AcumuladosFrecuencia Relativa: donde dice N (FA) pongo F (FR)
Med = 1/2-Fi-1 ai +li-1 fi
Limite inferior del Intervalo donde esta la mediana
Amplitud del intervalo
FAA intervalo anterior a la mediana
FA Intervalo donde esta la
Mediana
![Page 27: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/27.jpg)
Calculo de la Mediana (FR)
Sueldos MC FA FR FAA FRA(0 a 3000] 1500 8 0,11 8 0,11
(3000 a 6000] 4500 11 0,15 19 0,25(6000 a 9000] 7500 11 0,15 30 0,40
(9000 a 12000] 10500 20 0,27 50 0,67(12000 a 15000] 13500 15 0,20 65 0,87(15000 a 18000] 16500 6 0,08 71 0,95(18000 a 21000] 19500 3 0,04 74 0,99(21000 a 24000] 22500 0 0,00 74 0,99(24000 a 27000] 25500 1 0,01 75 1
75 1,00
Med = 0,50 – Fi-1 ai +li-1 fi
Med = 0,50 – 0,40 3000+9000= 10111 0,27
![Page 28: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/28.jpg)
Robustez; Media, Mediana• Si tomamos un conjunto de datos cualquiera a los
cuales calculamos media, mediana y moda y agregamos un dato extremo. Al volver a calcular la media, la mediana y la moda, veremos que la media puede variar notablemente, mientras que la mediana y la moda permanecen similares. Esta no variación de la mediana y la moda reciben el nombre de robustez. Las medidas basadas en el orden –como la mediana- gozan de ésta, en tanto que las medidas basadas en la suma –como la media- se ven más afectadas por las observaciones extremas y son, por lo tanto, poco robustas.
![Page 29: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/29.jpg)
Media, Mediana y Moda• Si todas las observaciones estuvieran concentradas en un solo valor de la
variable, media, mediana coincidirían en el mismo. Si las observaciones se fueran distribuyendo en forma simétrica, a la izquierda y a la derecha de ese valor central, media, mediana y modo seguirían coincidiendo. Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central más que las observaciones de la parte derecha, generando una distribución asimétrica hacia la izquierda; en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones, su valor se correrá a la izquierda también y por el mismo motivo, la media será menor que la mediana. En una distribución asimétrica a la derecha, la media, es mayor que la mediana.
![Page 30: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/30.jpg)
Concentración de los individuos• Según el tipo de Asimetría que tenga la
variable sabemos en donde se concentran los individuos que estamos investigando.
• Si la gráfica es simétrica los individuos se concentran en el centro de la variable.
• Si tiene asimetría negativa, los valores concentran a la izquierda de la gráfica.
• Si la asimetría es positiva, los valores concentraran a la derecha de la gráfica.
![Page 31: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/31.jpg)
Gráficos para cuantitativas continuasAsimetría positiva a la derecha Asimetría negativa a la izquierda
![Page 32: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/32.jpg)
Medidas de Posición – Cuartiles
De la misma forma que la Mediana divide la distribución en 2 partes al ubicar al individuo central. Los Cuartiles dividen la distribución en 4 partes.
![Page 33: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/33.jpg)
Medidas de Posición – Cuartiles
• 1er cuartil: Valor del individuo que esta sobre el 25% de la distribución.
• 2º cuartil: coincide con la mediana.• 3er cuartil: Valor del individuo que esta sobre
el 75% de la distribución.• 4º Cuartil: Ultimo individuo de la distribución.
![Page 34: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/34.jpg)
Medidas de Posición – Cuartiles1 2 2 3 3 4 5 5 5 7 6 7 8 9 10 11 12 13
Mediana = 6
Formula para 1er. Cuartil sin agruparImpar: Par: 2
144
1
NN xx
Q
4
11 NxQ
Recordemos que Q1 es la posición del individuo que ocupa el 25% de la variable. (ubicar primer cuartil en el ejemplo)
![Page 35: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/35.jpg)
Medidas de Posición – CuartilesFormula para 3er. Cuartil sin agrupar
• Impar • Par
34
13 NxQ2
13
43
43
NN xx
Q
Si el número da con coma se ajusta hacia arriba. Ya que es el individuo sobre el cual quedan el 75% de las observaciones. Recordemos que con la formula (N….) ubicamos la posición del individuo en la distribución.
![Page 36: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/36.jpg)
Cuartiles – Datos AgrupadosFrecuencia Absoluta
Primer Cuartil
Frecuencia Relativa
Tercer Cuartil
1
1
14
ii
i
i
lan
NN
Q
1
1
3
34
ii
i
i
lan
NN
Q
111
25,0
iii
laf
FQ i
131
75,0
iii
laf
FQ i
![Page 37: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/37.jpg)
Medidas de Posición – Quintiles, Déciles, Percentiles.
• Quintiles: Divide la frecuencia en 5 partes iguales.
• Déciles: Divide la frecuencia en 10 partes.
• Percentiles: Divide la frecuencia en 100 partes iguales.
![Page 38: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/38.jpg)
Formula GeneralFrecuencia Absoluta
I = p(N) – Ni-1 ai +li-1
ni
Frecuencia Relativa:
I = p(1)-Fi-1 ai +li-1 fi
Limite inferior del Intervalo donde esta
el individuo
Amplitud del intervalo
FAA intervalo anterior al individuo
FA Intervalo donde esta el
individuo
Proporción del Individuo buscado
![Page 39: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/39.jpg)
En un N de 1240 buscar la ubicación de los siguientes individuos.
• Decil₃
• Cuartil₁
• Quintil₄
• Percentil34
![Page 40: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/40.jpg)
En un N de 1240 Buscar
• Decil₃ …………………. 3/10(1240)=
• Cuartil₁…………………1/4(1240)=
• Quintil₄…………………4/5(1240)=
• Percentil34……………………...35/100 (1240)=
![Page 41: 4 medidas de posición](https://reader036.vdocuments.pub/reader036/viewer/2022062303/5571f32349795947648d8f02/html5/thumbnails/41.jpg)
Estadísticos: Medidas de Posición
Estadístico Variable según su nivel de mediciónProporción nominales ordinales RazónPorcentaje nominales ordinales RazónRatio nominales ordinales RazónModa nominales ordinales Intervales RazónMediana nominales₁ ordinales Intervales RazónMedia₂ Intervales Razón
₁Mediana:-En las variables nominales suele ser poco útil ya que su valor cambia con el orden que se le de a las categorías.