medidas de tendencia central con casos
TRANSCRIPT
Medidas de Tendencia Central
Oswaldo Quiroz Marín Marín
1
La Estadística Sumaria
2
Después de construir tablas y gráficos, a partir de una colección de datos, se requieren medidas más exactas.
La estadística sumaria o de resumen, proporciona medidas para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:• De tendencia central.• De dispersión.• De la forma de la distribución.
(A) Las medidas de tendencia central
3
Se refieren al punto medio de una distribuciónSe conocen como medidas de posiciónEjemplo: A partir del gráfico siguiente, se observa que la
posición central de la curva B está a la derecha de la posición central de las curvas A y C. Obsérvese que la posición central de la curva A es la misma que la curva C.
(B) Las medidas de dispersión
4
Se refieren a la extensión o amplitud de los datos de una distribución
Representan el grado de variabilidad de los datos.Ejemplo: Observe que la curva A en el siguiente gráfico tiene una
mayor dispersión que la curva B, a pesar que la posición central es la misma.
(C) Las medidas de la forma de la curva
5
Las curvas que representan a un conjunto de datos, pueden ser analizadas de acuerdo a su:
a)Simetría b) Curtosis Las curvas simétricas, tienen una forma tal que con
una línea vertical que pase por el punto más alto de la curva, dividirá el área de esta en dos partes iguales.
6
Las curvas sesgadas son aquellas cuyos valores están concentrados en el extremo inferior o superior de la escala de medición del eje horizontal. La “cola” indica el tipo de sesgo.
7
Cuando medimos la curtosis nos referimos al grado de agudeza. Pueden ser: leptocúrtica (concentración al centro) mesocúrtica (distribuidos simétricamente) platicúrtica (aplanada).
3.3 Las medidas de tendencia central
Oswaldo Quiroz Marín 8
En general se denominan promedios. Los más importantes son la media, la mediana y la
moda.Aritmética
Media GeométricaMedidas de Mediana Armónicatendencia central Moda
También es útil conocer los percentiles (o fráctiles).
3.3.1 La Media
Oswaldo Quiroz Marín 9
(A) La media aritmética ( )a) Obtención: Se obtiene sumando los valores
registrados y dividiéndolos entre el número de datos.
Ejemplo: La siguiente tabla muestra el número de reclamos y
quejas presentadas por vecinos por la demora en la construcción de carreteras . Calcule e interprete la media.
Día/Semana Lun Mar Mier Jue Vier SabReclamos/día 8 10 5 12 10 15
x
Oswaldo Quiroz Marín 10
Media aritmética =
= 10 reclamosb) Interpretación: Si elige al azar un día de la semana,
se espera que los clientes de esta tienda realicen 10 reclamos por día.
c) Simbología: Tamaño Media aritmética
Muestra n (equis barra)Población N (mu)
10
60
6
1510125108
x
x
Oswaldo Quiroz Marín 11
d) Cálculos a partir de datos no agrupados, se utilizan las siguientes formulas.Para una muestra
donde: : media muestral
: suma de todos lo datos
: número de datos
(muestra)
n
n
iix
1
X
para una población
donde: : media poblacional : suma de todos los
datos N : número de datos
(población)
:i
Xx
n
iX
N
N
ii
1X
Oswaldo Quiroz Marín 12
e) Cálculo a partir de datos agrupados. Se utiliza la formula siguiente
donde: : media muestral : frecuencia absoluta
de la clase i : marca de la clase i
nf
nf
i
i
i
ii
x
1
1X
xif
iX
Oswaldo Quiroz Marín 13
Ejemplo: La distribución de frecuencias siguiente, representa los puntajes obtenidos en una evaluación del desempeño, aplicado al personal técnico de una empresa. El puntaje máximo en la prueba es 50. Calcule e interprete en media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Oswaldo Quiroz Marín 14
Primero se calcularán las marcas de clase ( ); es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase ( ) absoluta(fi)12 - 16 14 417 - 21 19 822 - 26 24 1527 - 31 29 2332 - 36 34 10
Total 60
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)
4+8+15+23+10
iX
ix
x
x x
clase
1575 60 26.25
Oswaldo Quiroz Marín 15
Interpretación : Si se elige al azar a un técnico, se espera que tenga un puntaje de 26,25 en su evaluación de desempeño.
f) La media aritmética ponderada ( )
donde:
= factor de ponderación
= datos
n
ii
n
iii
w
w
px
1
1
X
px
iw
iX
Oswaldo Quiroz Marín 16
Ejemplo: Una empresa comercializadora de teléfonos celulares dispone de 3 vendedores, cada uno de los cuales cobra diferente comisión por teléfono vendido, y realiza diferente número de ventas. Calcule e interprete el valor medio de la comisión
Nº de teléfonos ComisiónVendedor vendidos por venta $
Pedro 30 30Juan 25 40Pablo 20 50
iw iX
Oswaldo Quiroz Marín 17
Interpretación:Si se elige al azar un vendedor se espera que cobre una comisión de $38.67 por teléfono vendido.
67.38$75
2900
202530
)50(20)40(25)30(30
px
Oswaldo Quiroz Marín 18
g)Ventajas y desventajas de la media aritméticaVentajas: Concepto familiar para muchas personas Es única para cada conjunto de datos Es posible comparar medias de diferentes muestras
Desventajas Se ve afectada por los datos extremos Si la muestra es grande y los datos no están agrupados, su cálculo es tedioso Si los datos están agrupados en clases con extremos abiertos, no es posible calcular la media.
(B) La media geométrica ( )
Oswaldo Quiroz Marín 19
Se utiliza para calcular tasas medias de variación, como la tasa media de crecimiento poblacional, la tasa media de inflación mensual, la tasa media de mortalidad, entre otros.
a) Obtención Se obtiene extrayendo la raíz enésima del producto de los n valores de una serie.
gx
ng nx XXXX .........
321
Oswaldo Quiroz Marín 20
Ejemplo:La siguiente tabla muestra la tasa de aumento en las ventas durante los últimos meses. Calcule e interprete la tasa media mensual.
Meses Enero Febrero Marzo Abril MayoAumento de
Ventas2.6% 5.4% 3.8% 0.5% 1.4%
La tasa 2.6% también se puede expresar como 0.026 y, ya que como se refiere a un aumento a partir de 100%, el factor de variación será 1.026. Para los otros datos se opera igual.
Oswaldo Quiroz Marín 21
Por lo tanto, la media geométrica se calcula:
5 )014.1)(005.1( )038.1( )054.1( )026.1(
)( 0272540,1 medioocrecimientdeFactor
5 143903377.1
= (1,0272540 - 1) x 100 = 2.72%
100)1 ( Tasa mediade variación=
b) Cálculos
n xxxxx g ,......,, 321
gx
gx
gx
gx
Oswaldo Quiroz Marín 22
c) InterpretaciónSi se selecciona al azar un mes entre enero y mayo, se espera que las ventas se hayan incrementado 2.72% con respecto al mes anterior.
(C) La media armónica ( )
Oswaldo Quiroz Marín 23
Se utiliza para calcular el tiempo medio, velocidad y aceleración media, como el tiempo medio para realizar un proceso productivo.
a)Obtención: se obtiene calculando el inverso de la media aritmética de los inversos de una serie.
hx
n
n
i i
hx
1X1
1
Oswaldo Quiroz Marín 24
Ejemplo: Los siguientes datos registran el tiempo que utilizan cuatro clientes al realizar una compra de un artefacto doméstico. Calcule e interprete el tiempo medio.
Cliente A B C DTiempo
(minutos)45 38 52 40
Oswaldo Quiroz Marín 25
b) Interpretación:Si se selecciona al azar a uno de los cuatro clientes, se espera que realice la compra de un artefacto en 43 minutos aproximadamente.
889202223171023401976
4
401
521
381
451
4
hx
minutos 117953.438249889204
hx
segundos 7 minutos 43hx
3.3.2 La Mediana
Oswaldo Quiroz Marín 26
Es la medida que divide en dos subconjuntos iguales a datos, de tal manera que 50% de los datos es menor a la mediana y el otro 50% es mayor a la mediana.
a)Obtención: Se obtiene ordenando la serie de datos (en forma ascendente o descendente) y ubicando el dato central.
Oswaldo Quiroz Marín 27
Ejemplo:Los siguientes datos se refieren al número de clientes atendidos durante los últimos 11 días en una tienda de artefactos. Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Primero se ordenan lo datos:5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores
mediana
Oswaldo Quiroz Marín 28
b) Interpretación: Durante 5 días se atendieron a menos de 11 clientes, y durante 5 días se atendieron a más de 11 clientes.
c) Reglas1º Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
Oswaldo Quiroz Marín 29
Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34
3º Sea la serie par o impar, la mediana ocupa el lugar , de la serie previamente ordenada.
2
1n
5.202
2318
mediana
2º Si la serie es par, la mediana se obtiene de la semisuma de los dos valores centrales de la serie previamente ordenada.
donde:: mediana: limite real (o frontera) inferior de la clase medial (o mediana).: número total de datos.: suma de todas las frecuencias hasta, pero sin incluir, la clase mediana.: frecuencia de la clase medial: amplitud de clase
Oswaldo Quiroz Marín 30
d) Cálculo a partir de datos agrupados.
c
Mdf
Fn
Md i
1
21
L
Md
iLnF
Mdfc
Oswaldo Quiroz Marín 31
Ejemplo: La tabla siguiente muestra la experiencia profesional (años) del personal técnico que labora en una empresa. Calcule e interprete la mediana.
Experiencia Número deprofesional trabajadores
(años) técnicos 0 - 3 4 4 - 7 12
Clase Medial
8 - 11 24
12 - 15 16 16 - 19 10 20 - 23 3
69
Lugar de la mediana:
424
)17(2
169
8
dM
424
17358
Mediana = 11 años
o352
1692
1 n
Oswaldo Quiroz Marín 32
Interpretación:
La mitad de los profesionales técnicos que laboran en esta empresa tienen una experiencia laboral igual o menor a 11 años. La otra mitad de los profesionales tienen una experiencia laboral igual o menor a 10 años y 6 meses.
Oswaldo Quiroz Marín 33
e) Ventajas y desventajas de la mediana
Ventajas:Los valores extremos no afectan a la mediana como en el caso de
la media aritmética.Es fácil de calcular, interpretar y entender.Se puede determinar para datos cualitativos.
Desventajas:Como valor central, se debe ordenar primero la serie de datos.Para una serie amplia de datos no agrupados, el proceso de
ordenamiento de los datos demanda tiempo y usualmente provoca equivocaciones.
3.3.3 La Moda
Oswaldo Quiroz Marín 34
La moda es el valor que más se repite dentro de un conjunto de datos.a) Obtención: se obtiene organizando la serie de datos y seleccionando el o los datos que más se repiten.
4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38
Ejemplo:
Oswaldo Quiroz Marín 35
b) Cálculo a partir de datos agrupados
donde:: moda: limite real (o frontera) inferior de la clase modal (la de mayor frecuencia): frecuencia de la clase modal menos la frecuencia de la clase anterior: frecuencia de la clase modal menos la frecuencia de la clase siguiente: amplitud de clase
ci
21
1LoM
oM
iL
1
2
c
Oswaldo Quiroz Marín 36
La clase medial pueden coincidir pero conceptualmente son diferentes.Ejemplo: La tabla siguiente muestra los errores de facturación durante un mes, en una empresa comercializadora.
Calcule e interprete la moda.Errores defacturación Días
0 - 3 6
4 - 7 12Clase Modal
8 - 11 8
12 - 15 3
16 - 19 1
Total 30
Clase moda : (4 - 7)
Mo = 6.4
61
42 4
466
4 Mo
Interpretación: Durante un mes, el número más frecuente de errores de facturación en esta empresa comercializadora es 6.
Oswaldo Quiroz Marín 37
e) Ventajas y desventajas de la moda.Ventajas:
Se puede utilizar tanto para datos cualitativos como cuantitativos.No se ve afectada por los valores externosSe puede calcular, a pesar de que existan una o más clases abiertas.
Desventajas:No tiene un uso tan frecuente como la media.Muchas veces no existe moda (distribución amodal).En otros casos la distribución tiene varias modas, lo que dificulta su
interpretación.
3.3.4 Los Percentiles
Oswaldo Quiroz Marín 38
Son los valores que dividen en 100 partes iguales a un conjunto de datos
a) Cálculo: para datos agrupados.
c
f
n
iK
KP
1F100
K
LP
Oswaldo Quiroz Marín 39
donde:
: percentil
: el percentil
: número de datos
: frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil
K
: frecuencia absoluta de la clase donde se ubica
el
percentil K
: amplitud de clase
KP
c
K
n
F
K
fP
Oswaldo Quiroz Marín 40
Ejemplo:
La tabla muestra la experiencia (en años) de los trabajadores de una gran compañía textil.
Experiencia Trabajadores(años)
0 - 3 18 4 - 7 42
8 - 11 68 12 - 15 120 16 - 19 40 20 - 23 34 24 - 27 12
Total 334
Oswaldo Quiroz Marín 41
¿Sobre qué edad se ubica el 25% de los trabajadores de mayor experiencia?
Para saber en qué clase se halla este dato, se calculó la frecuencia acumulativa.
Menor
Experiencia
Mayor
Experiencia
75 % 25 %
P75
K = 75
)ordenados números los de( 5.250100
)334(75100K
P delLugar o75 n
Oswaldo Quiroz Marín 42
Experiencia Nº Trabajadores Frec. Acumulada(años) 0 - 3 18 18 4 - 7 42 60
8 - 11 68 128 12 - 15 120 248 16 - 19 40 28820 - 23 34 32224 - 27 12 334
334
Interpretación: Para que un trabajador esté comprendido en el 25% de mayor experiencia laboral debe tener al menos 16 años, 1 mesesy 24 días.
4
40
1248100
75(334)
1675
P
años 15.16
75P
iFif
En esta clasese ordenan del249º - 288º
F=248
3.4 Las medidas de dispersión
Oswaldo Quiroz Marín 43
Llamadas también medidas de variabilidadSon útiles porque:Permiten juzgar la confiabilidad de la medida de
tendencia central. Los datos demasiados dispersos tienen un
comportamiento especial.Es posible comparar dispersión de diversas
muestras.
3.4.1 El rango (R)
Oswaldo Quiroz Marín 44
Llamado también amplitud o alcance.
a) Obtención: se obtiene de la influencia entre el dato mayor y el dato menor más una unidad significativa, a fin de incluir ambos valores extremos.
Oswaldo Quiroz Marín 45
Ejemplo:
Los siguientes datos representan el peso de 10 niños al nacer, (en kgs). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,7804,170 3,920 3,280 4,050 3,120
Rango = (4,170 - 2,860) + 0.001Rango = 1,311 Kgs
Oswaldo Quiroz Marín 46
b) InterpretaciónLa diferencia entre el bebe de mayor peso y el bebe menor peso es 1,311 Kgs.
c) Cálculo a partir de datos agrupadosSe utiliza la siguiente formula:
donde:R = (Ls - Li ) + 1 : Limite superior de la
última clase : Limite inferior de la primera clase
sL
iL
Oswaldo Quiroz Marín 47
Ejemplo: La distribución de frecuencias siguiente representa el tiempo que demora un cliente en un banco. Calcule e interprete el rango
Rango = (36-12) + 1
R = 25 minutos
Tiempo Nº de Clientes(minutos) (por día)
12 - 16 4 17 - 21 8 22 - 26 15 27 - 31 23 32 - 36 10Total 60
Interpretación: la diferencia de tiempo entre el cliente que más demora y el que menos demoró es 25 minutos.
Oswaldo Quiroz Marín 48
f) Ventajas y desventajas del rango
Ventajasfácil de calcularfácil de entender e interpretar
Desventajassólo considera los valores extremosno toma en cuenta ni el número de datos ni el valor de
estosno es posible calcular en tablas con extremos abiertos.
3.4.2 El rango intercuartil
Oswaldo Quiroz Marín 49
Permite ubicar el 50% de los datos que se encuentran en el centro de la distribución, es decir, el 25% de los datos son menores al primer cuartil y también 25% de los datos son mayores al tercer cuartil.
Oswaldo Quiroz Marín 50
Ejemplo: La tabla muestra la experiencia (en años) de los trabajadores de una gran compañía textil.
Experiencia (años)
Trabajadores
0 - 3 18 4 - 7 42 8 - 11 68
12 - 15 120 16 - 19 4020 - 23 3424 - 27 12Total 334
A)¿En qué valores se encuentra el 50% intermedio de estos datos?
B)¿Cuál es el rango intercuartílico?
Oswaldo Quiroz Marín 51
Rango Intercuartílico
50 %25 %
Q3
clase 3ra laen ubica se 5.83100
)334(25PQLugar 251
o
25 %
Q1
4
68
160100
25(334)
5.7Q1
años 82.8Q
1
Oswaldo Quiroz Marín 52
clase 5ta laen ubica se 5.250100
)334(75PQLugar 753
o
4
40
1248100
75(334)
5.153
Q
A)Es 50% de los trabajadores con experiencia intermedia se encuentran entre 8.82 y 15.65
B) El rango intercuartílico es 6 años 10 meses aproximadamente
años 65.153
Q
3.4.3 La varianza
Oswaldo Quiroz Marín 53
Es una medida de desviación promedio con respecto a la media aritmética
a) Cálculos a partir de datos no agrupados.
para una muestra
para un población1
1
2
)X(2
n
n
ii
xS
N
N
ii
1
2
)X(2
Oswaldo Quiroz Marín 54
8 8 - 10 = 2 4
10 10 - 10 = 0 0
5 5 - 10 = 5 25
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25
Ejemplo:
La siguiente información se refiere al número de artículos vendidos durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Elaboramos un cuadro de la forma siguiente
x X xi 2X xi
60X 0X xi
10
6
60
x
x
58X 2xi
Oswaldo Quiroz Marín 55
58X 2xi
1
)(X2
2
n
iS
x
6.1116
582
S
3.4.4 La desviación estándar
Oswaldo Quiroz Marín 56
Es la raíz cuadrada de la varianza, sea poblacional o muestral.a) Cálculos a partir de datos no agrupados
para la muestra
para la población
1
)X(S 1
2
2
s
n
n
i
xi
N
N
ii
1
2
2)X(
Oswaldo Quiroz Marín 57
Ejemplo:
La siguiente información se refiere al número de artículos vendidos durante una semana. Calcule la desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11.6 Entonces
s2
S
articulos 3,4 S
6,11S
3.4.5 El coeficiente de variación
Oswaldo Quiroz Marín 58
Es una medida relativa de variabilidad de los datos, permite comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes (peso; kgs y libras).
a) Calcular a partir de datos no agrupados
para la muestra:
para la población: 100xs
CV
100
CV
Oswaldo Quiroz Marín 59
Ejemplo:
A continuación se presentan las ventas (en unidades monetarias) logradas durante una semana por dos tiendas de artículos electrodomésticas. La tienda I vende en soles y la tienda II en dólares ¿Cuál de ellos tiene un desempeño más estable, en cuanto a nivel de ventas?.
Tienda I (soles) Tienda II (dólares)40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
Calculamos la media y desviación estándar por cada una de las tiendas
Oswaldo Quiroz Marín 60
Tienda I
40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
x X xi 2X xi
14.567
393X1
ni
n
ix
393X 0X xi 86,632X 2xi
Oswaldo Quiroz Marín 61
86.632X Si 2xi
27.101786.632
1
)X(S 1
2
n
n
ixi
100S
x
CV
29.1810056.1410.27 CV
Oswaldo Quiroz Marín 62
Tienda II
70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
x X xi 2X xi
87.1058
8471X
n
i
n
ix
847X 04,0X xi 88,11372X 2xi
Oswaldo Quiroz Marín 63
88.11372X Si1
2
n
i i x
30.401888,11372
1
XS 1
2)(
n
n
ixi
100S
x
CV 06,30100105,8740,30 CV
La tienda II presenta una mayor variabilidad en el volúmen de ventas.