Download - Entrega cincocompendio
1. Establecer las diferentes fórmulas que llevan al cálculo
de las medidas de tendencia central
2. Buscar la aplicabilidad y sensibilidad de cada una de
las medidas de tendencia central.
3. Hacer cálculo de todas las medidas de tendencia
central con las diferentes tipos de datos.
4. Hacer uso de R, para el cálculo de las medidas de
tendencia central.
5. Hacer uso de R para el grafico de cuartiles mediante
las cajas de bigotes (Boxplot)
MEDIDAS DE TENDENCIA CENTRAL
Lo que hasta ahora se ha hecho se redujo a resúmenes de la
información en tablas de frecuencias y sus correspondientes clases de
frecuencias así como sus representaciones gráficas.
Con Las medidas de tendencia central, pondremos nuestra atención en
hacer resúmenes numéricos porque mediante unos resultados tienden a
localizarse en el centro de la información, el resultado o parámetro
describe al grupo en su totalidad.
Estos resúmenes numéricos representan simplificaciones de los datos
que por ser resúmenes dejaran por fuera la mayor parte de los detalles y
se quedan sólo con lo más general que tienen los datos.
EJEMPLO:
Si se desea conocer el rendimiento académico de un grupo de
estudiantes entonces se puede calcular el promedio. Con esta medida
representativa se puede afirmar en forma aproximada como es el
rendimiento académico de todo el grupo.
Algunas de las medidas de tendencia central son:
1. Media
Media aritmética
Media geométrica
2. Mediana
Cuartiles
Déciles
Percentiles
3. Moda
MEDIA ARITMÉTICA:
El principal resumen que se puede hacer de una colección de datos es el
promedio al que llamaremos media aritmética. Su cálculo se basa en
la magnitud de los datos
Aunque es una medida de cálculo sencillo la información brindada por el
número por si sola no es del todo confiable, dice poco de la distribución
de los datos. Por ejemplo si decimos que el rendimiento académico de
un grupo es de 2 y lo clasificamos como insuficiente, individualmente
existirán estudiantes que superaron el logro y la valoración de 2. Así
como existen estudiantes por debajo de esta valoración. La media
aritmética es un resumen muy bueno, pero no da los detalles. El cálculo
de la media aritmética depende de la forma como este dada la
distribución de los datos, por eso el cálculo se lo hace de dos formas
diferentes:
1. MEDIA PARA DATOS NO AGRUPADOS:
Se calcula sumando todos los datos y dividiendo por el número total de
ellos.
Sean X1, X2, X3,…Xn datos no agrupados de una distribución numérica.
Entonces la media se calcula mediante la expresión
X=∑i=1
n
X i
n
EJEMPLO:
El pagador del colegio desea calcular el promedio de 7 facturas pagadas
por adquisición de material de oficina en el mes de agosto y tienen
como montos:
12, 235, 318, 15, 616, 325, 212
Utilizando la formula X=
∑i=1
n
X i
n se obtiene
X=12+235+318+15+616+325+2127 = 247,57
El número 247.57, representa el precio promedio que se ha pagado en el
mes de agosto por material de oficina.
Si los datos enteros son pocos y se pueden ordenar en una tabla de
frecuencias absolutas entonces la media se puede calcular mediante la
expresión:
EJEMPLO:
Un Profesor de geografía tiene registrado en su informe de logros la
información de 20 estudiantes con los siguientes resultados.
X=∑i=1
n
X i∗f
n
E S A S D I A S E D
A I S E D A S A D I
Los datos de los logros obtenidos se pueden registrar en la siguiente
tabla.
Haciendo uso de la expresión X=
∑i=1
n
X i∗f
n , se obtiene el siguiente resultado.
X=1∗4+2∗3+3∗5+4∗5+5∗320
=6020 = 3
De este resultado podemos decir que el rendimiento académico del
grupo en el área de geografía es aceptable.
MEDIA PARA DATOS AGRUPADOS:
Hace referencia a la media calculada para los datos organizados en una
distribución de frecuencias, que por lo general corresponden a datos de
tipo continuo, y en una cantidad que exceden a 20 datos. Para el cálculo
de la media para datos agrupados definamos primero que es una marca
de clase
MARCAS DE CLASE:
Logros
No de estudiantes
fDIASE
12345
43553
Es el punto medio de cada intervalo de clase, la denotaremos como X i ..
Sea [a b] los datos en el intervalo de clase, entonces la marca de clase
se define como:
Con la marca de clase definimos la media para datos agrupados como
sigue:
EJEMPLO:
Determine la edad promedio, en el grado once de un colegio, si los
estudiantes presentan las siguientes edades:
18 18 17 15 16 20 23 21 25 17
16 21 22 19 21 24 19 22 21 16
15 19 21 22 15 24 18 16 19 20
Construimos primero las condiciones necesarias para armar los
intervalos de clase.
R = Xmax – Xmin = 25 – 15 = 10
Corre por ahí el chiste de que si en un salón
hay más o menos la misma cantidad de niños
que de niñas, ¿cuál es el género del alumno
promedio?
Xi =
a+b2
X =
∑i=1
n
Xi∗f
n
m = 1 + 3,3 log(30) = 1 + 3,3*(1,47) = 5,85 6 por Exceso, 5 por
defecto.
C =
106 2
Rango = C * m = 2*6 = 12
Diferencia: 12 – 10 = 2
Xmin - 1 = 14
Xmax + 1 = 26
Con los resultados de la tabla ya se puede hacer el cálculo de la media.
X =
584 ,130
=19
La edad promedio de los alumnos del grado once es de: 19 años.
SUBMUESTRAS:
Si se quiere dividir la muestra total de una población en varias
submuestras y se hace necesario el cálculo total de la media entonces
se recurre a la siguiente formula.
Edades f xi f* xi
14.5 _ 16
16,5 _ 18
18,5 _ 20
20,5 _ 22
22.5 _ 24
24.5 _ 26
7
5
6
8
3
1
15
17
19
21
23
25
105
85
114
168
69
25
30 566
Donde
EJEMPLO:
Una empresa de juegos mecánicos ha extendido una invitación a
diferentes colegios de la ciudad. Debido a situaciones técnicas y para
protección y satisfacción de los estudiantes en algunos juegos, La
empresa hace descuentos del 50% bajo los siguientes requerimientos
Se deben formar grupos de mujeres y hombres por separado.
1. Las estaturas de los hombres en promedio no deben superar los
170 cms
2. Las estaturas de las mujeres en promedio no deben superar los
165 cms.
3. El promedio total de las estaturas para todos los estudiantes
invitados debe ser de 168 cms
Un docente encargado en uno de los colegios invitados escogió al azar
50 estudiantes, 30 hombres, y 20 mujeres, los datos se especifican
abajo.
Mujeres Hombres
160 145 170 175 130 140 175 180 142 145
X=X1∗n1+X2∗n2+X3∗n3+.. .. . .+Xn∗nn
n
n = n1 + n2 + ...+
nn
145 169 171 143 144 178 145 155 168 166
149 157 173 143 138 165 156 158 170 173
139 150 157 135 148 152 172 165 134 154
143 128 137 171 124
145 153 180 172 153
Será que todo el grupo puede asistir a los juegos mecánicos con el
descuento del 50%?.
La edad total promedio las calculamos mediante la expresión
X=X1∗n1+X2∗n2+X3∗n3+.. .. . .+Xn∗nn
n
Entonces
X=152∗20+157∗3050 = 155
Los requerimientos dados por la empresa se cumplen por tanto todos los
niños escogidos por el profesor pueden asistir a disfrutar de los juegos
mecánicos con un descuento del 50%..
PROPIEDADES DE LA MEDIA ARITMÉTICA:
1. La media es única
2. El cálculo de la media es sencillo y de fácil comprensión
3. Cuando existen datos extremos suficientemente distantes de la
mayoría de los datos la media no es una medida muy confiable.
PROBLEMA PARA RESOLVER
1. La siguiente tabla muestra las diferentes actividades realizados por
diferentes personas en una institución educativa de la ciudad y su
correspondiente asignación salarial.
a. Encontrar el salario promedio
b. Si se conviene reconocerles $70 diarios de aumento, cual es el nuevo
salario promedio?
Trabajadores No Salarios
Rector
Secretarias
Coordinadores
Docentes
Celadores
Aseadoras
1
4
2
45
3
4
2’000.0
00
750.000
1’500.0
00
1’200.0
00
600.000
450.000
2. Cuatro grupos de estudiantes consistentes en 15, 20, 10 y 18,
individuos, dieron pesos medios de 162, 148, 153, y 140 lb,
respectivamente. Hallar el peso medio de todos los estudiantes.
3. Los siguientes datos representan las notas definitivas de 45
estudiantes en un curso de estadística aplicada.
4.5 2.3 1.0 5.0 3.2 2.8 3.5 4.2 5.0
3.2 1.8 2.9 3.1 4.2 3.3 1.8 2.9 4.4
3.3 1.7 1.0 3.8 4.2 3.1 1.7 1.5 2.6
3.3 3.8 4.1 4.4 4.5 4.0 3.5 3.3 2.1
2.7 3.3 2.2 4.6 4.1 4.4 3.3 4.8 4.4
a. Encuentre la nota promedio del grupo.
b. El resultado de la media puede asegurar con certeza el
rendimiento académico del grupo?
c. Si las dos primeras filas de los datos representan las notas de
estudiantes de sexo femenino, calcule las medias de los hombres
y de las mujeres.
d. Con la media de los hombres y de las mujeres calcule la media
total.
e. Compare el resultado anterior con el resultado encontrado en el
primer punto.
MEDIA GEOMETRICA:
Existen algunos datos que tienen comportamientos crecientes o
decrecientes en forma infinita y que por tanto el promedio dado por la
media aritmética tendría mucho margen de error. Para ello se recurre al
cálculo de la media geométrica.
EJEMPLOS:
1. Crecimiento de número de enfermos de SIDA.
2. Crecimiento poblacional
3. Crecimiento de la pobreza en el mundo
4. Crecimiento de plagas y bacterias en cultivos.
La media geométrica para datos no agrupados se define mediante la
expresión.
Mg =
n√X1∗X2∗X3∗.. . Xn
Apliquemos la expresión para la siguiente serie de números.
2, 4, 8, 16.
Mg = 4√2∗4∗8∗16 =
4√1024 = 5,66
Haciendo uso de los logaritmos y sus propiedades se llega a la siguiente
formula:
La media geométrica para datos
agrupados se calcula mediante la
expresión.
Haciendo uso de los logaritmos y sus propiedades la formula se puede
expresar mediante la expresión.
La demostración matemática de la anterior expresión es sencilla y se
deja al estudiante como ejercicio, ella le permitirá recordar las
propiedades y la definición de logaritmo.
Para aplicaciones prácticas de medias geométricas se suele recurrir a las
aplicaciones de las progresiones geométricas en las que se definen los
conceptos de interés simple y de interés compuesto.
Mg =
AntiLog(∑i=1
n
LogX i
n)
Mg =
n√X1f 1∗X
2f2¿ X
3f3¿ .. .∗X
nfn
Mg =
Anti log(∑i=1
n
fi*log Xi
n)
INTERES SIMPLE:
Se conoce como interés simple el interés que se cobra únicamente sobre
el capital dado en préstamos y no sobre los intereses producidos por el
mismo. Se calcula mediante la expresión
INTERÉS COMPUESTO:
Consiste en sumar periódicamente los intereses mas el capital. Se
calcula mediante la expresión.
EJEMPLOS:
1. Un profesor solicita un préstamo a un banco, de $ 10`000.000 al 12%
de interés anual. Para que sea descontado por nomina. ¿Cuánto pagara
el profesor al final de tres años?
CT = Monto total
Co = Monto inicial = $ 10’000.000
i = Tasa de interés anual = 12% = 0.12
n = Tiempo en años = 3
CT = 10’.000.000(1+ 0.12)3
CT = $14’ 049.280
Al final de los tres años el profesor pagara $ $14’ 049.280
CTotal = C0 (1 +
i)n
In = C0 ( 1+ i )n-1 *
i
2. Al comienzo de cada año escolar los padres de familia siempre en
forma inútil manifiestan el alza en útiles escolares. Doña Maria una
madre de familia manifiesta que hace 4 años la misma lista para su hijo
mayor era de $150.000, para este año la lista que le han dado para su
hijo menor tiene un valor de $300.000. Cual fue el promedio de
incremento anual?
Co = $150.000
CT = $300.000
n = 4 años
i = ?
De la expresión CTotal = C0 (1 + i)n despejemos i.
CTCo = ( 1+ i ) n ;
1 + i =
n√CTCn ; finalmente obtenemos una expresión para i
i =
n√CTCn - 1
Aplicando los datos en la expresión antes encontrada obtenemos el
resultado final
i =
n√CTCn - 1 =
4√300 .000150 .000
−1 = 1,189 - 1 = 0.189 = 18. 9%
18.9 % Corresponde al alza anual de los textos escolares en el mercado.
MEDIANA:
Determina la posición central que ocupa un dato en el orden de su
magnitud, dividiendo la información en dos partes iguales, dejando igual
número de datos por encima y por debajo de ella.
MEDIANA PARA DATOS NO AGRUPADOS:
Si los datos no están agrupados y la distribución de datos es impar,
entonces la mediana es el dato central.
Si el número de datos es impar, el dato central de la distribución
organizada en forma ascendente o descendente es la mediana.
X1, X2, X3, X4, ... , Xn n Impar
Me= Xi , donde Xi representa el dato central
Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.
X1, X2, X3, X4, ... , Xn n par
Me=
X i+X j2 , donde Xi, Xj representan Los datos centrales
EJEMPLO:
1. Las notas de un estudiante de una universidad en 5 exámenes
corresponden a:
5,0 1,5 3,8 4,1 2,2,
Calcule la mediana de las notas.
Organizamos las notas en orden ascendente o descendente
1,5 2,2 3,8 4,1 5,0
Me = 3,8
Significa que la mitad de las notas del estudiantes esta por debajo de
3,8 y la otra mitad están por encima de este valor.
2. Supongamos que el estudiante conoce ahora otra nota
correspondiente a otra asignatura. La distribución de datos es par:
5,0 1,5 3,8 4,1 2,2 3,2
Si organizamos nuevamente los datos
1,5 2,2 3,2 3,8 4,1 5,0
La mediana corresponde a:
Me =
3. 2+3 . 82 = 3.5
El 50% de las notas están por debajo de 3.5. 4. La siguiente tabla muestra el Consumo mensual de agua, en m3, de
una escuela pública, encuentre la mediana de la distribución.
Enero = 10, . . . . Mayo = 14, . . . . Septiembre =
18,
Febrero =12, Junio = 19, Octubre = 22,Marzo = 15, Julio = 17, Noviembre =15,Abril = 18, Agosto = 18, Diciembre = 13
X1= 10 X2=12 X3 =13 X4=14 X5= 15 X6=15
X7=17 X8 =18 X9 = 18 X10 = 18 X11 = 19 X12
= 22
Me =
X6+X7
2 =
15+172 =16,
La mitad del consumo del agua en la escuela está por debajo de 16 m3,
y por encima de 16 m3 de consumo al año
MEDIANA PARA DATOS AGRUPADOS:
La mediana para datos agrupados se encuentra mediante la fórmula:
Dónde:
Li = Limite real inferior a la clase mediana
n = Es el tamaño de la muestra o población
Fa = Frecuencia acumulada anterior a la clase mediana.
C = Ancho del intervalo
f= Frecuencia observada en la clase mediana
CLASE MEDIANA:
Se entiende por clase mediana al primer intervalo de clase que contiene
en las frecuencias acumuladas el valor de n /2, siempre que el número
de intervalos sea par, de lo contrario la clase mediana es el intervalo
central.
EJEMPLO:
Las notas de 40 estudiantes están resumidas en la siguiente tabla. Se
pide determinar el valor de la mediana.
Me= Li +
( n2−Fa
f )∗C
Li = Limite real inferior a la clase mediana = 2
n = Es el tamaño de la muestra o población = 40
Fa = Frecuencia acumulada anterior a la clase mediana. = 7
C = Ancho del intervalo = 1
f= 5
La clase mediana se ha señalado con rojo, resultado de dividir la
muestra de 40 estudiantes en 2 y de haber ubicado en las frecuencias
acumuladas el primer valor que contenga a esta división.
Utilizando la formula anterior y reemplazando, obtenemos.
Me= Li + ( n2−Fa
f )∗CLi = 2 + (
20−75 )*1 = 2 + (13/5) = 3,03 =3
El 50% de los estudiantes tienen notas inferior a 3 y el 50 % tiene notas
superiores a 3, podemos afirmar entonces que el rendimiento académico
del grupo es bueno?
LOS CUANTILES:
Son medidas derivadas de la mediana, e intentan medir en valores de
proporción más pequeña que la mediana misma a una muestra. Los
cuantiles se dividen en:
1. Cuartiles
Notas f F
0 _ 11 _ 22 _ 33 _ 44 _ 5
2551513
27122740
40
2. Deciles
3. Percentiles
4. Quintiles
CUARTILES:
Los cuartiles son valores posiciónales. Son medidas de tendencia
central que dividen la distribución de datos en cuatro partes iguales.
Muestra la importancia de la cuarta parte de la muestra analizada. Se
simboliza con Q.
El primer cuartil deja el 25% de la información por debajo de él, y el 75%
por encima, el segundo cuartil, al igual que la mediana, divide la
información en dos partes iguales, y por último el tercer cuartil deja el
75% por debajo de sí, y el 25% por encima.
Gráficamente:
Se necesita, entonces calcular tres cuartillas ya que la cuarta queda
automáticamente determinada.
Su cálculo se deduce de la fórmula que en forma general se expresa así:
QJK =
Li+( k∗n4−Fa
fo )∗c
0% 25% 50% 75%
De esta expresión podemos encontrar los cuartiles.
CUARTIL 1: Q1
Representa el 25% de la muestra tomada. Por encima de este valor esta
el 75% de los valores de una distribución.
Se obtiene de la expresión anterior cuando K= 1
CUARTIL 2: Q2
Se obtiene cuando K = 2; representa el 50% de la muestra tomada. Por
encima de este valor esta el 50% de los valores de una distribución.
Si observamos la deducción de la formula deducimos que el cuartil 2
representa la mediana.
CUARTIL 3: Q3
Se obtiene cuando K = 3; representa el 75% de la muestra tomada. Por
debajo de este valor esta el 25% de los valores de una distribución.
Q1 =
Li+( n4−Fa
fo )∗c
Q2 =
Li+( 2∗n4
−Fa
fo )∗c=Li+( n2−Fa
fo )∗c
Q3 =
Li+( 3∗n4
−Fa
fo )∗c
DECILES:
Se definen como la medida de tendencia central que divide la
distribución de datos en diez partes iguales. Muestra la importancia de
la décima parte de la muestra analizada. Se simboliza con D.
Su cálculo se deduce de la fórmula que en forma general se expresa así:
El cálculo de cualquiera de los nueve deciles se calculan haciendo uso
de la formula anterior.
EJEMPLO:
para un caso especial se requiere el cálculo de los deciles 7 y 3. Las
expresiones para los deciles mencionados serian:
PERCENTILES:
Se definen como la medida de tendencia central que divide la
distribución de datos en cien partes iguales. Muestra la importancia de
la centésima parte de la muestra analizada. Se simboliza con P.
CJK =
Li+( k∗n10−Fa
fo )∗c
D3 =
Li+( 3∗n10
−Fa
fo )∗cD7 =
Li+( 7∗n10
−Fa
fo )∗c
Su cálculo se deduce de la fórmula que en forma general se expresa así:
PJK =
Li+( k∗n100−Fa
fo )∗c
EJEMPLO:
Para un caso especial se requiere el cálculo de los percentiles 70 y 40.
Las expresiones para los deciles mencionados serian:
EJEMPLO DE APLICACIÓN:
La secretaria de educación está implementando un estudio sobre la
asignación salarial de los docentes del departamento con el objetivo de
promover un plan de vivienda. Para llegar a conclusiones precisas los
encargados del estudio han elaborado una encuesta que consta de 10
preguntas a una muestra de 200 profesores de todos los municipios. Dos
de las 10 preguntas estaban redactadas así:
1. Cuál es su grado de escalafón? _____
2. Su asignación salarial (En miles de pesos) de acuerdo a su grado de
escalafón se ubica en los siguientes rangos.
a. 500 _ 700 ______
P40 =
Li+( 40∗n100
−Fa
fo )∗c=
Li+( 2∗n5
−Fa
fo )∗c
P70=
Li+( 70∗n100
−Fa
fo )∗c=Li+( 7∗n10
−Fa
fo )∗c
b. 700 _ 900 ______
c. 900 _ 1100 ______
d. 1100 _ 1300 ______
e. 1300 _ 1500 ______
f. 1500 _ 1800
Los resultados de las encuestas para la primera pregunta se resumen en
la siguiente tabla.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 91 2 3 4 5 6 7 8 9 10 11 12 13 14 31 2 3 4 5 6 7 8 9 10 11 12 13 14 21 2 3 4 5 6 7 8 9 10 11 12 13 1 21 2 3 4 5 6 7 8 9 10 11 12 2 1 21 2 3 4 5 6 7 8 9 10 1 12 2 1 21 2 3 4 5 6 7 8 9 9 1 12 2 1 21 2 3 4 3 6 7 9 9 9 1 12 3 1 21 2 3 2 3 6 2 9 9 3 12 12 3 1 9
Haciendo uso de R, Calcular las medidas cuantiles para datos no
agrupados, realizar gráficos Boxplot.
Solución:
Los datos se organizaron en un archivo txt, denominado “Escalafon.txt”
y se grabó en la carpeta de trabajo. En el entorno de R se ha
direccionado, direccionando hacia la carpeta en donde se encuentra el
archivo. Las siguientes líneas hacen llamado de los datos.
datos=read.table("Escalafon.txt")
attach(datos)
datos
Veamos un resumen de las medidas cuantiles
summary(datos)
Min. : 1.00 1st Qu.: 3.00 Median : 6.00 Mean : 6.34 3rd Qu.: 9.00 Max. :14.00
De inmediato se obtienen los cuartiles de la distribución, además del
valor mínimo, máximo y el promedio. Para este caso el promedio se
requiere redondearlo ya que se está considerando los grados de
escalafón como datos enteros, por tanto:
X=6
Las medidas cuartiles se pueden representar mediante la caja de
bigotes o los Boxplot
La grafica se obtiene mediante los comandos
boxplot(datos, main="Grados de Escalafon", xlab="Escalafon", ylab="Numero de
docentes")
Una representación con mejor presentación se obtiene mediante la
codificación
boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Grados de escalafon",
xlab="Docentes")
Para reconocer las demás medidas cuantiles en R, se requiere tener los
datos como un vector, veamos un ejemplo para un número determinado
de datos extraído de la información obtenida en el grupo de los 200
docentes entrevistados
datos1=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,
2,3,4,5,6,7,8,9,10,11,12,13,14,3,9)
quantile(datos1, prob = seq(0, 1, length = 11), type = 5)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1.0 2.0 3.0 4.0 6.0 7.5 9.0 10.0 11.0 13.0 14.0
quantile(datos1)
0% 25% 50% 75% 100% 1.00 3.75 7.50 10.25 14.00
quantile(datos1, prob = c(0.15, 0.25, 0.35))
15% 25% 35% 2.05 3.75 5.00
Los resultados de la encuesta para la segunda pregunta se muestran en
la siguiente tabla.
Los encuestadores conocedores de las medidas cuantíles calcularon Q1,
Q3, D3, D8, P10, P60, P70 y tomaron sus respectivas conclusiones.
Antes de proceder al cálculo de los cuantíles elaboraron una tabla de
frecuencias.
a. Para calcular el cuartil uno partimos de la expresión Q1 =
Salarios No de
docentes
500 _ 700 30
700 _ 900 75
900 _ 1100 35
1100 _ 1300 20
1300 _ 1500 25
1300 _ 1800 15
TOTAL 200
Salarios f F
500 _ 700 30 30
700 _ 900 75 105
900 _ 1100 35 140
1100 _ 1300 20 160
1300 _ 1500 25 185
1300 _ 1800 15 200
TOTAL 200
Li+( n4−Fa
fo )∗C. De la expresión
n4 =
2004 = 50, sabemos que las
operaciones se harán en el segundo intervalo ya que en las frecuencias
acumuladas el valor de 50 queda perfectamente contenido en 105.
Por tanto:
Li = 700
n4 = 50 Q1 =
Li+( n4−Fa
fo )∗C. = 700 +
(50−3075 )
*200 = 753.333
Fa = 30 Lo que indica que el 25 % de los docentes entrevistados
ganan
fo = 75 salarios medios correspondientes a $753.333.
C = 200
b. Para calcular el cuartil tres partimos de la expresión Q3 =
Li+( 3n4
−Fa
fo )∗C. De la expresión
3n4 =
6004 = 150, sabemos que las
operaciones se harán en el quinto intervalo ya que en las frecuencias
acumuladas el valor de 150 queda perfectamente contenido en 185.
Por tanto:
Li = 1300
3n4 = 150 Q3 =
Li+( 3n4
−Fa
fo )∗C. = 1300 +
(150−16025 )
*200 =
1’220.000
Fa = 160 Lo que indica que el 75 % de los docentes entrevistados
ganan
fo = 25 salarios medios correspondientes a $1’220.000.
C = 200
d. Para calcular el decil tres partimos de la expresión D3 =
Li+( 3n10
−Fa
fo )∗C. De la expresión
3n10 =
60010 = 60, sabemos que las
operaciones se harán en el segundo intervalo ya que en las frecuencias
acumuladas el valor de 60 queda perfectamente contenido en 105.
Li = 700
3n10 = 60 D3 =
Li+( 3n10
−Fa
fo )∗C. = 700 +
(60−3075 )
*200 = $
780.000
Fa = 30 Lo que indica que el 30 % de los docentes entrevistados
ganan
fo = 75 salarios medios correspondientes a $780.000.
C = 200
f. El decil 8 se deja como ejercicio de aplicación.
g. Para calcular el percentil 10 tres partimos de la expresión
P10 =
Li+( n10−Fa
fo )∗C. De la expresión
n10 =
20010 = 20, sabemos que
las operaciones se harán en el primer intervalo ya que en las frecuencias
acumuladas el valor de 20 queda perfectamente contenido en 30.
Li = 500
n10 = 20 P10 =
Li+( n10−Fa
fo )∗C. = 500 +
(2030 )
*200 = $ 633.333
Fa = 0 Lo que indica que el 10 % de los docentes
entrevistados ganan
fo = 30 salarios medios correspondientes a $633.333
C = 200
Los P60 y P70, se dejan como ejercicio de aplicación.
Gráficos Boxplot
PROPIEDADES DE LA MEDIANA
Entre las propiedades de la mediana, vamos a destacar las siguientes:
1. Es una medida descriptiva que tiene la ventaja de no estar afectada
por las observaciones extremas, ya que no depende de los valores que
toma la variable, sino del orden de las mismas.
2. Es de cálculo rápido y de interpretación sencilla.
3. A diferencia de la media, la mediana de una variable discreta es
siempre un valor de la variable que estudiamos.
3. Si una población está formada por 2 subpoblaciones de medianas
Med1 y Med2, sólo se puede afirmar que la mediana, Med, de la
población está comprendida entre Med1 y Med2
4. El mayor defecto de la mediana es que tiene unas propiedades
matemáticas complicadas, lo que hace que sea muy difícil de utilizar en
inferencia estadística.
5. Es función de los intervalos escogidos.
6. Puede ser calculada aunque el intervalo inferior o el superior no tenga
límites.
EJERCICIO DE APLICACIÓN
1. Al consejo directivo de un colegio le han llegado las quejas de que los
precios de las comidas y artículos que se venden en la cafetería están
elevados. Para averiguar si el rumor es cierto se tomaron como muestra
algunos artículos encontrándose los siguientes precios.
70 86 75 72 66 90 85 70
72 81 70 75 84 62 66 74
82 75 68 83 81 65 75 70
73 65 82 80 66 73 95
85 84 75 68 80 75 68 72
78 73 72 68 84 75 72 80
Para ayudar al consejo directivo y determinar si el rumor es cierto o
falso realice las siguientes actividades.
a. Agrupar en intervalos de clase apropiados
b. Determinar el precio promedio de los artículos
c. Determinar la mediana de los artículos
d. Calcule, Q1, Q3, D3, D5, D7, P80, V2, V3, P70.
e. Realice un gráfico de bigotes y su respectivo análisis con las medidas
visualizadas
f. Realice un gráfico de barras
g. Realice un gráfico de ojivas de la distribución.
h. Respecto a las gráficas y las medidas de tendencia central, elabore
una conclusión.
2. En un colegio con modalidad en agropecuaria, el peso en kilogramos
presentado por el departamento de porcicultura en la experimental ABC
viene dado por la tabla.
Pesos Frecuencias
118 _ 126127 _ 135136 _ 144145 _ 153154 _ 162163 _ 171172 _ 180
368
10742
Calcule el valor de la media y la mediana, y realice interpretaciones de
las dos medidas obtenidas.
MODA
Cuando hablamos de histogramas, dijimos que los picos en los
histogramas se llaman modas. Usaremos como moda la marca de la
clase que tenga un pico en el histograma.
La moda es el valor que ocurre con mayor frecuencia en una
distribución de datos
En un conjunto de datos agrupados o no agrupados pueden existir varias
modas o ninguna. Si existen dos frecuencias con los mayores valores
entonces tendrá dos modas, si todas las frecuencias son iguales,
entonces el conjunto de valores propuestos no tendrá moda.
MODA PARA DATOS NO AGRUPADOS
Simplemente será contar el número de datos y observar su frecuencia.
Por
EJEMPLO.
En un almacén de suministros para partes de computadores se ofrecen
diferentes marcas de impresoras con diferentes valores. (En miles de
pesos) Las ventas en el mes de julio reportaron los siguientes datos.
$250 $300 $320 $250 $400 $250
$300 $310$400 $250
Si ordenamos los valores tenemos la siguiente tabla.
Mo = Moda =3 es la de mayor frecuencia, lo que indica que las
impresoras mas vendidas en julio fueron las impresoras cuyo valor
corresponde a $250000.
Precio
s
f
250
300
310
320
400
3
2
1
1
2
EJEMPLO 2
Los puntajes de una cierta prueba son los siguientes
15, 17, 19,19, 19, 20, 22, 22, 22, 25, 28, 28, 28, 30.
Calcular para estos datos la moda:
Puntaje
s
f
1517192022252830
11313131
Aquí existen varias modas:
Mo1= 19
Mo2 =22
Mo3 = 28
EJEMPLO 3
En una encuesta realizada en un colegio se pregunta por la asignatura
de mayor aceptación y gusto. Las respuestas brindadas por los
estudiantes arrojaron los siguientes resultados.
ASIGNATURA ESTUDIANTE
S
MATEMÁTIC 5
AS
ESPAÑOL 5
ESTETICA 5
SOCIALES 5
INLGES 5
BIOLOGIA 5
TOTAL 30
Cuál es la asignatura que se pone de moda de acuerdo a los gustos de
los estudiantes?
Respuesta
Observando en la tabla los registros de los 30 alumnos se puede
determinar que todas las asignaturas tienen la misma aceptación.
Para este caso decimos que la moda no existe, es una distribución
amodal
MODA PARA DATOS AGRUPADOS
Para datos agrupados la moda se calcula utilizando la siguiente formula
Δ1 = fo - fa
Δ2 = fo - fs
Donde:
fo = Frecuencia absoluta observada
Mo = Li + ( Δ1
Δ1+Δ2)
*C
fs = Frecuencia absoluta siguiente a la observada
fa = Frecuencia absoluta anterior a la observada.
EJEMPLO:
Determine la nota de mayor relevancia en una evaluación de Calculo
Integral realizada a 50 estudiantes de Ingeniería de una universidad de
la capital.
Notas f
0 _ 1
1 _ 2
2 _ 3
3_ 4
4 _ 5
1
5
12
22
10
Utilizando la formula
Antes de utilizar la formula entendamos que la clase modal es el
intervalo de clase que presenta la mayor frecuencia absoluta.
Para nuestro ejemplo la clase modal esta determinado por el intervalo [3
_ 4]
Teniendo en cuenta la clase modal podemos hacer los siguientes
cálculos.
Δ1 = fo – fa = 22 – 12 = 10
Mo = Li + ( Δ1
Δ1+Δ2)
*C
fo
fa
fs
Δ2 = fo – fs = 22 – 10 =1 2
De aquí:
Mo = 3 + (1010+12 )∗1
= 3.45 = 3.5
La nota de mayor relevancia en el grupo analizado fue de 3.5
PROPIEDADES DE LA MODA
De la moda destacamos las siguientes propiedades:
1. Es muy fácil de calcular.
2. Puede no ser única.
3. Es función de los intervalos elegidos a través de su amplitud, número
y límites de los mismos.
4. Aunque el primero o el último de los intervalos no posean extremos
inferior o superior respectivamente, la moda puede ser calculada.
5. Esta dada solo en términos de las frecuencias absolutas
EJERCICIOS PARA PRACTICAR
1. Un estudio en las diferentes escuelas y colegio de un país, consistió
en anotar el número de palabras leídas en 15 segundos por un grupo de
120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta
los resultados de la tabla
No de palabras
leídas
Disléxicos Normales
26 24 9
27 16 21
28 12 29
29 10 28
30 2 32
Calcule:
1. Las medias aritméticas de ambos grupos.
2. Las medianas de ambos grupos.
3. El porcentaje de sujetos disléxicos que superaron la mediana de
los normales
4. Q1, Q3, D5, D7, P70, P35
5. Las modas de ambos grupos.
6. Que implica que la moda del segundo grupo sea mayor que la
del primer grupo.
Realizar los anteriores cálculos en R-Estadístico, dibujar las respectivas
cajas de bigotes.
2. Con el fin de observar la relación entre la inteligencia y el nivel
socioeconómico (medido por el salario mensual familiar) se tomaron dos
grupos, uno formado con sujetos de cociente intelectual inferior a 95 y
otro formado por los demás; De cada sujeto se anotó el salario mensual
familiar. Teniendo en cuenta los resultados que se indican en la tabla:
Nivel
socioeconómico
Sujetos con CI <
95
Sujetos con
Intervalos Frecuencia Frecuencia
6 – 10 75 19
10 – 16 35 26
16 – 22 20 25
22 – 28 30 30
28 – 34 25 54
34 – 40 15 46
a. Dibuje un gráfico que permita comparar ambos grupos.
b. Calcule las medidas de tendencia central para aquellos sujetos con CI
< 95
c. Calcule las medidas de tendencia central para aquellos sujetos con CI
> 95
d. interprete los diferentes resultados obtenidos teniendo en cuenta los
gráficos obtenidos.
Realices las anteriores operaciones en R-estadistico
3. Considere las siguientes medidas: media, mediana, moda, (max +
min)/2, primer cuartil, tercer cuartil. Dos de las propiedades de abajo
pertenecen a las medidas anteriores.
1. Su valor siempre tiene que ser igual a uno de los datos observados.
2. Divide al conjunto de datos en dos conjuntos de igual tamaño.
3. Es el centro de los datos en un intervalo de clase.
4. Siempre existe.
4. Se ha definido una nueva medida Cuantil, los Quintiles, en cuantas
partes divide a una distribución los quintiles, y cuál es el quintil cuyo
valor corresponde a la mediana?
1. 5 partes
2. El 3 quintil
3. 50 partes
4. El segundo Quintil
5. Si se dan los siguientes Cuantíles: Q1; Q2 ; Q3; D2; D5; D8; P25; P50;
P90; en cual de los siguientes alternativas los Cuantíles mostrados son
equivalentes
A. Q3; D8; P50
B. Q2; D5; P50
C. Q3; D8; P90
D. Q2; D5; P25
E. Q1; D2; P50
6. Se sabe que ninguna de las sucursales de una empresa comercial
tiene más de 9 empleados o menos de 7. La mayoría tiene 8 empleados,
pero el 25% tiene 9 empleados y una de cada 10 sucursales tiene 7
empleados. ¿Cuál es el promedio de empleados por sucursal?.
A. 10.15
B. 8.15
C. 9.15
D. 15.15
E. 11.15
7. Un estudiante descubre que su calificación en un reciente examen de
estadística, corresponde al percentil 70. Si 80 estudiantes presentan el
examen, aproximadamente, significa que el número de estudiantes que
sacaron calificación superior a él fueron:
A. 56
B. 24
C. 30
D. 20
E. 10
8. Los salarios pagados a los empleados de una compañía se muestran
en la siguiente tabla.
El valor de la media y el Q2
1. 250.000
2. 360.000
3. 229052
4 370.000
Cargos Numer
o
Salario
Directores 2 930.00
0
Supervisor
es
4 510.00
0
Economist
as
6 370.00
0
Contadore
s
4 350.00
0
Auxiliares 26 246.00
0
Obreros 110 190.00
0
9. En una muestra de las compras de 15 estudiantes en la tienda de una
escuela primaria, se observan las siguientes cantidades de ventas,
dispuestas en orden de magnitud ascendente: $100, $100, $250, $250,
$250, $350, $400, $530, $900, $1250, $1350, $2450, $2710, $3090,
$4100.
El valor de la media, mediana y moda de estas cantidades de ventas son
respectivamente:
A. $1200, $530, $205
B. $1210, $205, $530
C. $1210, $3090, $900
D. $250, $530, $900
E. $1210, $530, $250