sesiÓn 3 estadística descriptiva - moodle2.unid.edu.mx · con los datos de la tabla anterior se...
TRANSCRIPT
Estadística descriptiva SESIÓN 3
Estadística descriptiva
Contextualización de la sesión 3
Parte fundamental de la Estadística es la organización de los datos, una forma de realizar esta organización es en tablas, estas también sirven para facilitar la creación de representaciones graficas de la información obtenida o procesada.
Al terminar esta sesión deberás de conocer los primeros pasos para la conformación de una tabla de datos agrupados.
Al analizar una muestra, es necesario someterla a un
conjunto de pasos sistematizados para su organización
en una tabla de datos agrupados, también conocida
como tabla de distribución de frecuencias.
Introducción de la sesión 3
Esta tabla es de gran utilidad en el
cálculo de los estadígrafos que
describen una muestra, así como en la
construcción de sus correspondientes
representaciones gráficas.
En esta sesión, estudiarás los pasos
para la conformación de una tabla de
datos agrupados.
Introducción de la sesión 3
Explicación: Distribución de
frecuencias
La población o universo es el conjunto de elementos de los
cuales se desea conocer, por medio de un tratamiento
cuantitativo, sus principales características. En este contexto,
una muestra es un subconjunto de la población; es decir, una
porción de elementos con características generales
semejantes a la población objetivo.
Explicación: Distribución de
frecuencias
Para que una muestra sea representativa de una
población, debe cumplir las siguientes condiciones:
Debe obtenerse mediante un procedimiento aleatorio,
es decir, la selección de sus elementos será al azar.
Debe ser lo suficientemente grande.
Las condiciones anteriores corresponden a la rama de la
estadística inferencial denominada “muestreo”.
Explicación: Distribución de
frecuencias
Al analizar una muestra, el primer paso es organizar los
datos en una tabla conocida como tabla de datos
agrupados. Esta tabla permitirá el cálculo de ciertas
medidas orientadas a la descripción de la muestra. Las
principales medidas para la descripción de una muestra
son, estas medidas son denominadas estadígrafos o
estadísticos:
• Medidas de tendencia central. • Medidas de dispersión o
variabilidad.
Explicación: Distribución de
frecuencias
Si la muestra se ha obtenido mediante un procedimiento
correcto (muestra aleatoria y de tamaño lo suficientemente
grande), los estadígrafos serán razonablemente cercanos a
los verdaderos valores numéricos que caracterizan a una
población, a los cuales se les denomina parámetros.
Explicación: Distribución de
frecuencias
Una vez que se ha obtenido una muestra aleatoria para estudiarla y generalizar sus propiedades al total de la población, se procede a organizar sus datos mediante los siguientes pasos:
1. Ordenar los datos de la muestra en forma creciente.
2. Determinar el rango de los datos, es decir, calcular la resta o diferencia entre el mayor y el menor de los datos de la muestra. El rango se denota con la literal r y su cálculo se representa con la siguiente expresión:
Donde corresponde al mayor de los datos de la muestra
y al menor. Asimismo, n denota el número total de
elementos de la muestra.
Explicación: Distribución de
frecuencias
Explicación: Distribución de
frecuencias
3. Determinar el número k de clases en las que se organizarán los datos; esto es, establecer el número k de subconjuntos en los que se distribuirán los elementos de la muestra.
4. Definir la longitud de las clases de tal manera que todos los datos de la muestra se distribuyan en ellas, vigilando que cada uno de los datos se ubique en una sola clase. Esto es, establecer los límites de cada clase de forma que ningún elemento de la muestra pertenezca a más de una clase o quede fuera de éstas. La longitud de cada clase se denota con la literal c, y se calcula mediante la siguiente expresión:
Explicación: Distribución de
frecuencias
Donde r corresponde al rango de la muestra
y k es igual al número de clases deseadas.
En terminología formal, a las clases se les
denomina intervalos de clase.
5. Una vez definidas las clases, se
contabiliza cuántos elementos de la
muestra caen dentro de cada intervalo
de clase, es decir, se determinan las
frecuencias de clase, las cuales se
denotan con la literal f. Con estos datos
se construye una tabla que se conoce
como tabla de datos agrupados.
Explicación: Distribución de
frecuencias
6. Con los datos de la tabla anterior se construyen las
representaciones gráficas correspondientes al histograma,
polígono de frecuencias, ojiva y ojiva porcentual.
7. Finalmente, para efectos del análisis de los datos de la
muestra, se calculan los estadígrafos: medidas de
tendencia central y de variación.
Explicación: Distribución de
frecuencias
Los pasos descritos permiten la construcción de una tabla de
distribución de frecuencias, esta asume una estructura
matricial que permite la presentación de n datos de la
muestra organizados en grupos o clases.
Explicación: Distribución de
frecuencias
Caso práctico:
Se desea introducir en el mercado una bebida para su venta en cines. Antes de diseñar la campaña y la estrategia de mercadotecnia, es necesario determinar las características de los consumidores potenciales para definir un grupo focal en función de su edad al cual dirigir la campaña con mayor énfasis. Para iniciar el estudio estadístico, se selecciona una muestra de cien personas y se les pregunta su edad.
Explicación: Distribución de
frecuencias
La siguiente tabla muestra las edades ordenadas en
forma creciente:
Explicación: Distribución de
frecuencias
Supongamos que decidimos distribuir las edades en
cinco clases. Antes de hacerlo, debemos determinar la
longitud de cada clase y establecer sus respectivos
límites. De las características de nuestro caso práctico,
tenemos los siguientes datos:
Explicación: Distribución de
frecuencias
Entonces, primero calculamos el rango:
Una vez calculado el rango, procedemos al cálculo de la
longitud de cada clase:
Conclusión
La correcta organización de los datos se logra a través de
diversas herramientas, tales como las tablas de datos
agrupados, que además nos permite calcular medidas para
describir una muestra; esta muestra debe cumplir con
algunas condiciones para representar una población.
Cuando se tiene esta muestra representativa, se ordenan
todos datos y se comienzan los calculas necesarios para
generar la información correspondiente con el uso de la tabla
de datos.
Conclusión
En la siguiente sesión los temas correspondientes a intervalos
de clase, sus límites, su frecuencia y las respectivas marcas de
clase, de esta manera aumentaran tus conocimientos en los
temas relacionados con la Estadística descriptiva.
Conclusión