• Ordenar y agrupar datos en una tabla.
• Construir histogramas y polígonos de frecuencias, basados en los datos recopilados.
• Calcular e interpretar las medidas de tendencia central.
• Aplicar la Estadística Descriptiva en la resolución de problemas de la vida real.
• Analizar gráficos y tablas de datos.
Contenidos
1.1 Estadística
1.2 Población
1. Definición:
1.3 Muestra
1.4 Variable estadística, cualitativa y cuantitativa
2. Distribución de frecuencias
2.1 Distribución de frecuencias en datos NO agrupados
2.2 Distribución de frecuencias en datos agrupados
3. Gráficos estadísticos
4. Medidas de tendencia central
4.1 Moda
3.1 Gráfico de barras
3.2 Histogramas
3.3 Polígonos de frecuencia
3.4 Gráficos circulares
4.2 Mediana
4.3 Media aritmética o promedio
5. Medidas de dispersión
5.1 Desviación típica o estándar
1. Definición:
Es una herramienta matemática que permite recopilar,
organizar, presentar y analizar datos obtenidos de un
estudio estadístico.
1.1 Estadística
1.2 PoblaciónColección o conjunto de personas, objetos o eventos que
poseen características comunes, cuyas propiedades serán
analizadas.
1.3 MuestraSubconjunto de la población que comparte una determinada
característica.
1.4 Variable estadísticaInformación a recopilar, en ella se describen las
características de la muestra. Existen dos tipos: Cualitativas
y Cuantitativas
• Cualitativas:
Las variables cualitativas tienen características no numéricas.
Por ejemplo: color de pelo, sexo, estado civil, etc.
• Cuantitativas:
Las variables cuantitativas tienen características numéricas.
Por ejemplo: edad, estatura, número de hijos, etc.
Cuantitativa discreta: Son aquellas a las que se les puede
asociar un número entero y es imposible fraccionar.
Por ejemplo: número de hijos, número de automóviles.
Cuantitativa continua: Son aquellas a las que se les puede
asociar cualquier número real. Por ejemplo: peso, estatura,
tiempo.
2. Distribución de frecuenciasOrdenamiento de datos cuando en un estudio estadístico se
recopila una gran cantidad de ellos .
Existen dos tipos de distribución de frecuencias, con datos no
agrupados y con datos agrupados.
2.1 Distribución en datos NO agrupados
Se utiliza preferentemente cuando las opciones de la variable
son pocas .
Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente información:
1 – 6 – 4 – 3 – 1 – 2 – 6 – 5 – 1 – 3
Frecuencia: Corresponde a la cantidad de veces
que se encuentra un dato en una muestra.
Rango: 6 – 1 =5
Rango: Es la diferencia entre el dato mayor y el menor.
1 – 6 – 4 – 3 – 1 – 2 – 6 – 5 – 1 – 3
Al construir la tabla de frecuencias, se obtiene:
Número Frecuencia
1 3
2 1
3 2
4 1
5 1
6 2
Al sumar la columna frecuencia, se
obtiene el total de datos (n).
Total datos: 10.
2.2 Distribución en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de posibilidades, si
es cuantitativa continua, debemos agrupar los datos en intervalos
semiabiertos, excepto el último, que es cerrado.
Al agrupar los datos en intervalos, se debe calcular la “marca de
clase”.
Peso (Kg.) Frecuencia Marca de clase
[55,59[ 2 57
[59,63[ 5 61
[63,67[ 3 65
[67,71[ 7 69
[71,75] 4 73
Ejemplo:
Corresponde al promedio entre los extremos del intervalo.
R N IA=
A: Amplitud=Longitud del IntervaloR: RangoN I: Número de Intervalos
MODA: Es el dato que mas se repite, es decir, es aquel que posee la mayor frecuencia absoluta, Si ningún dato se repite la tabla no tiene moda o si mas de dos datos poseen la mayor frecuencia absoluta esos datos serian la moda
La moda se aplica para obtener información sobre el punto donde hay mayor concentración de datos
MEDIANA: En un conjunto de datos numéricos ordenados en forma creciente o decreciente, es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
Si la muestra esta compuesta por un numero impar de datos la mediana es el dato central
Si la muestra esta compuesta por un numero par de datos la mediana es el promedio de los dos datos centrales
PROMEDIO O MEDIA ARITMETICA:El promedio de n datos es el cuocienteentre la suma de los n datos, divididos
por nEjemplo: 5, 8, 12, 4, 6, 85+8+12+4+6+7= 42/6= 7Luego el promedio es 7
Observación: En datos cualitativos no tiene sentido
Ejercicio: 24, 25, 25, 27, 28, 29, 30, 32, 35, 37
MARCA DE CLASE: Corresponde al promedio de los extremos de los intervalos
ClasesClases FrecuenciasFrecuencias FrecuenciasFrecuenciasAcumuladasAcumuladas
Marca de Marca de ClaseClase
118 – 126118 – 126 33 33 122122
127 – 135127 – 135 55 88 131131
136 – 144136 – 144 99 1717 140140
145 – 153145 – 153 1212 2929 149149
154 – 162154 – 162 55 3434 158158
163 – 171163 – 171 44 3838 167167
172 - 180172 - 180 22 4040 176176
PROMEDIO: Se calcula sumando todos los productos de marca de clase con la frecuencia absoluta respectiva y su resultado dividirlo por el número total de datos, es decir:
Frecuencia absoluta (fi)
Marca de Clase (xi)
[60 - 63[ 5 61,5
[63 - 66[ 18 64,5
[66 - 69[ 42 67,5
[69 - 72[ 27 70,5
[72 - 75] 8 73,5
Ejemplo 1
Promedio: 67,95
ClasesClases FrecuenciasFrecuencias FrecuenciasFrecuenciasAcumuladasAcumuladas
Marca de Marca de ClaseClase
118 – 126118 – 126 33 33 122122
127 – 135127 – 135 55 88 131131
136 – 144136 – 144 99 1717 140140
145 – 153145 – 153 1212 2929 149149
154 – 162154 – 162 55 3434 158158
163 – 171163 – 171 44 3838 167167
172 - 180172 - 180 22 4040 176176
Ejemplo 2
Promedio: 146,9 147
En el caso de variables continuas, las clases vienen dadas por intervalos, y aquí la fórmula de la mediana se complica un poco más debido a que supone una interpolación de datos.
Fórmula para interpolar:
ii
iant
i Af
FN
LMe *2
donde:
Li = límite inferior del intervalo mediano
N= total de observaciones de la población
Fiant= frecuencias acumuladas en la clase anterior del
intervalo mediano
fi= frecuencia absoluta simple del intervalo mediano
Ai = amplitud del intervalo mediano
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimétricas.
Es de cálculo rápido y de interpretación sencilla. A diferencia de la media, la mediana de una variable
discreta es siempre un valor de la variable que estudiamos (ej. La mediana de una variable número de hijos toma siempre valores enteros).
Es función de los intervalos escogidos. Puede ser calculada aunque el intervalo inferior o el
superior no tenga límites. En variables ordinales puede ser calculada pero sólo
indica una clase dentro de la distribución. Por ejemplo, si se analiza el nivel educativo podría suceder que al menos el 50% tienen estudios de cuando más (por ejemplo) secundaria, porque se alcanza este porcentaje en esta categoría de la variable.
ClasesClases FrecuenciasFrecuencias FrecuenciasFrecuenciasAcumuladasAcumuladas
Marca de Marca de ClaseClase
118 – 126118 – 126 33 33 122122
127 – 135127 – 135 55 88 131131
136 – 144136 – 144 99 1717 140140
145 – 153145 – 153 1212 2929 149149
154 – 162154 – 162 55 3434 158158
163 – 171163 – 171 44 3838 167167
172 - 180172 - 180 22 4040 176176
Veamos un ejemplo:
Es muy fácil de calcular ( o identificar) Puede no ser única (distribución unimodal,
bimodal, etc). Es función de los intervalos elegidos a
través de su amplitud, número y límites de los mismos.
Aunque el primero o el último de los intervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.
Observación: El intervalo donde la frecuencia absoluta es la mas grande se llama intervalo modal.
Para obtener la moda para datos agrupados, podemos seguir los siguientes pasos:
1º Identificar el intervalo modal, en este caso es 32 - 37, con una frecuencia de 45 personas.
2º Identificar las frecuencias absolutas del intervalo anterior y posterior al intervalo modal. En este caso, el intervalo anterior corresponde a 26 - 31, con una frecuencia de 30 personas; y el intervalo posterior a 38 - 43, con una frecuencia de 40 personas.
3º Obtener la diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo anterior (d1). Entonces, tenemos que, 45 – 30 = 15.
4º Obtener la diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo posterior (d2). Entonces, tenemos que, 45 – 40 = 5.
5º Obtener la amplitud de los intervalos
6º Obtener el número que representa el extremo inferior del intervalo modal (Li ).
Luego, el cálculo de la moda se puede obtener por medio de la expresión:
add
diLM
21
1
Ejemplo: En una empresa, las edades del personal se resumen en la siguiente tabla.
Veamos un ejemplo
Moda: 36
Frecuencia Absoluta (fi) Marca de Clase (xi)
[60 - 63[ 5 61,5
[63 - 66[ 18 64,5
[66 - 69[ 42 67,5
[69 - 72[ 27 70,5
[72 - 75] 8 73,5
Ejemplo 2:
Moda: 67.8
Las estaturas de los y las estudiantes de un 8º Básico se resumen en la siguiente tabla. Complétala.
Calcula e interpreta la media aritmética y la moda.
EjemploLas inversiones anuales, en miles de dólares, de una muestra de 40 empresas fueron:
31 17 27 20 10 34 25 28 4 24 15 39 18 30 26 12 46 41 18 23 36 19 29 37 27 27 24 33 26 31 25 28 33 28 23 31 29 22 35 21Determine las medidas de tendencia central: media, mediana y moda. Interprete los resultados.
Solución:
1. n = 40,Xmax = 46, Xmin = 4, entonces:
Rango = R = 46 – 4 = 42.
2. √ 40 = 7
3. Amplitud = 42 / 7 = 6.
Título: “Inversión anual de empresas”Unidades: miles de dólares.
Frecuencias FrecuenciasIntervalo mi Conteo absolutas acumuladas
fi hi Fi Hi
4, 10 7 / 1 0,025 1 0,025 10, 16 13 /// 3 0,075 4 0,100
16, 22 19 //// / 6 0,150 10 0,250 22, 28 25 //// //// // 12 0,300 22 0,550
28, 34 31 //// //// / 11 0,275 33 0,825 34, 40 37 //// 5 0,125 38 0,950 40, 46 43 // 2 0,050 40 1,000 Total 40 1,000
Ejemplo: Título: “Inversión anual de empresas”Unidades: miles de dólares.
Frecuencias FrecuenciasIntervalo mi absolutas acumuladas
fi fri Fi Fri
4, 10 7 1 0,025 1 0,025 10, 16 13 3 0,075 4 0,100 16, 22 19 6 0,150 10 0,250 22, 28 25 12 0,300 22 0,550 28, 34 31 11 0,275 33 0,825 34, 40 37 5 0,125 38 0,950 40, 46 43 2 0,050 40 1,000
40 1,000
40
2*435*3711*3112*256*193*131*7x
Ejemplo: Título: “Inversión anual de empresas”Unidades: miles de dólares.
Frecuencias FrecuenciasIntervalo mi absolutas acumuladas
fi hi Fi Hi
4, 10 7 1 0,025 1 0,025 10, 16 13 3 0,075 4 0,100 16, 22 19 6 0,150 10 0,250 22, 28 25 12 0,300 22 0,550 28, 34 31 11 0,275 33 0,825 34, 40 37 5 0,125 38 0,950 40, 46 43 2 0,050 40 1,000
40 1,000
1°Hallamos n:2=20 y buscamos en Fi que clase lo contiene.
Li = 22
fmediana=12
F i-1 =10
27612
102022
Me
Ejemplo: Título: “Inversión anual de empresas”Unidades: miles de dólares.
Frecuencias FrecuenciasIntervalo mi absolutas acumuladas
fi hi Fi Hi
4, 10 7 1 0,025 1 0,025 10, 16 13 3 0,075 4 0,100 16, 22 19 6 0,150 10 0,250 22, 28 25 12 0,300 22 0,550 28, 34 31 11 0,275 33 0,825 34, 40 37 5 0,125 38 0,950 40, 46 43 2 0,050 40 1,000
40 1,000
1°Hallamos la clase modal
Li = 22
d1=12-6=6
d2=12-11=1
14,27616
622
Mo
Ejercicio Propuesto:
A continuación, se muestra el promedio obtenido en Matemática por los alumnos y las alumnas de un curso:
4,4 - 5,5 - 5,0 - 4,9 5,9 - 6,0 - 4,2 - 6,8 - 7,0 - 6,1 - 7,0 - 3,7 - 4,5 4,8 - 6,3 - 4,1 - 3,4 - 5,3 - 5,0 - 6,0 - 2,6 - 3,8 4,0 - 2,0 - 5,6 - 6,7 - 6,0 - 4,9 - 3,3 - 7,0 - 6,3 5,0
a) Construye una tabla de frecuencias cuyos datos estén agrupados en cinco intervalos.
b) Determina la media aritmética y moda.
Ejercicio Propuesto:
Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día.
0, 1, 2, 4, 3, 5, 10, 6, 13, 9, 8, 10, 11, 12, 13, 14, 6, 14, 8, 15, 16, 17, 18, 19, 5, 12, 7, 11, 3, 20
a) Construye una tabla de frecuencias cuyos datos estén agrupados en cinco intervalos.
b) Determina la media aritmética y moda.
Ejercicio Propuesto: