Download - Ejercicios de estadística
UNIVERSIDAD FILADELFIA DE MÉXICOMAESTRIA EN TECNOLOGIA EDUCATIVA
TECNICAS ESTADISTICAS EN LA EDUCACIONTAREA 1
Nombre: _ Lorena Sangabriel Rivera ______________________ Cal:_______
1. Supóngase que usted está interesado en la proporción de estudiantes que utilizan el
Wikipedia como herramientas en la solución de tareas, se tiene una población total de 220,000
alumnos de educación media superior en el Estado de Veracruz de los cuales solamente se les
pregunto 7,346 alumnos.
a) Describir cuidadosamente la población bajo estudio.
220,000 alumnos de educación media superior en el Estado de Veracruz
b) Describir la muestra.
7,346 alumnos de educación media superior en el Estado de Veracruz
c) Describir el estadístico bajo estudio.
La proporción de estudiantes que utilizan el Wikipedia como herramienta en la solución de
tareas a partir de los 7,346 alumnos de educación media superior en el Estado de Veracruz.
2. Se tiene 22,345 escuelas de educación básica en el Estado de Veracruz, del cual se hace un
estudio muestral con 2,765 escuelas de este nivel, para estimar calificación promedio en
matemáticas, el cual fue de 7.5.
a) ¿Describa cuidadosamente la población?
22,345 escuelas de educación básica en el Estado de Veracruz
b) ¿Describa cuidadosamente la muestra?
2,765 escuelas de educación básica en el Estado de Veracruz
c) ¿Describa el estadístico de interés?
Proporción de escuelas para estimar el Promedio de calificación en la asignatura de matemáticas
a partir de 2,765 escuelas del Estado de Veracruz.
d) ¿Describa el parámetro de interés?
Para sacar el parámetro tendríamos que realizar un estudio estadístico de las 22,345 escuelas
de educación básica en el Estado de Veracruz, el parámetro de interés sería el promedio de
calificación en la población total.
e) ¿Cuál es el valor del Parámetro?
El promedio de calificación en la materia de matemáticas a partir de las 22,345 escuelas de educación básica en el Estado de Veracruz.
f) ¿Cuál es el valor del estadístico?
El promedio el cual fue de 7.5
3. Supóngase que la clase de un estudiante de primer año de su universidad consta de 5000
estudiantes, todos los cuales han tomado una prueba estándar de aptitudes que se aplicó a
todos los estudiantes que entran a primer año de universidad en el país. Explíquense las
circunstancia bajo las cuales las calificaciones recibidas por la clase de estudiante de primer año
de su universidad puede considerarse como
a) Una muestra
Se considera una muestra de 5000 estudiantes a los cuales se les aplicó la prueba estándar de
aptitudes ya que la población total son todos los resultados de los estudiantes de universidad de
todo el país
b) Una población.
Es una población si solo se considera la calificación de los 5000 estudiantes que realizaron la
prueba de aptitudes.
4. Supóngase que usted está interesado en la edad promedio de los estudiantes de la Maestría
en Tecnología Educativa de la Universidad Filadelfia de México. Considere al grupo 105 de la
Maestría como muestra.
a) Describa cuidadosamente la población bajo estudio
Los estudiantes de la Maestría en Tecnología Educativa de la Universidad Filadelfia de México.
b) Descríbase el estadístico y el parámetro de la población involucrada.
Promedio de edad de los estudiantes de la Maestría en Tecnología Educativa de la Universidad
Filadelfia de México, a partir del grupo 105.
El parámetro de la población sería la edad promedio de los estudiantes de la Maestría en
Tecnología Educativa de la Universidad Filadelfia de México.
5. Para cada una de las siguientes declaraciones, defínase la población que se está muestreando
y descríbase el parámetro y el estadístico.
a) Se entrevista a mil estudiantes universitarios acerca de sus opiniones (respuestas de tipo sí
o no) acerca de la legalización del uso de la mariguana.
Población: estudiantes universitarios.
Parámetro: mil estudiantes universitarios que fueron entrevistados acerca de la legalización del
uso de la mariguana.
Estadístico: porcentaje de estudiantes universitarios que contestaron si o no acerca de la
legalización del uso de la marihuana a partir de los 1000 entrevistados.
b) Se entrevista a 500 profesores no sindicalizados para determinar sus actitudes (respuesta
tipo sí o no)
Población: profesores no sindicalizados
Parámetro: 500 profesores no sindicalizados
Estadístico: porcentaje de profesores no sindicalizados que contestaron si o no a la entrevista para determinar sus actitudes a partir de los 500 profesores no sindicalizados entrevistados.
6. Se hizo una encuesta telefónica a 100,000 familias del Estado de Veracruz (de
1,000,000 familias) con el fin de detectar ciudadanos interesados en pagar mayores
impuestos para mejorar la calidad de la educación pública. La encuesta reveló que
solo el 23% si pagaría mayores impuestos para lograr tal fin. ¿23% es un estadístico o
un parámetro?
Es un estadístico porque el 23% de las familias del Estado de Veracruz que están de
acuerdo en pagar mayores impuestos se desprende a partir de una muestra de 100,000
familias de un total poblacional de 1,000,000.
7. La oficina de inscripciones desea calcular el costo de los libros de texto para los
100,000 estudiantes de una universidad. Sea la variable el costo total de todos los
libros de texto adquiridos por un estudiante este semestre. El plan es identificar
aleatoriamente a 1000 estudiantes y obtener sus costos totales por concepto de libros
de texto. El costo promedio de los 1000 estudiantes será utilizado para estimar el costo
promedio para todos los estudiantes.
a) Describa población.
100,000 estudiantes de una universidad.
b) Describa la variable implicada.
El costo total de todos los libros de texto adquiridos por un estudiante este semestre.
c) Describa el parámetro que desea estimar la oficina de inscripciones.
El costo promedio de los libros de texto para los 100,000 estudiantes de una
universidad.
d) Describa la muestra.
1000 estudiantes de una universidad
8. Una estudiante de posgrado de la Universidad de Newport realiza un proyecto de
investigación sobre la comunicación. Ella envía por correo una encuesta a los 500
adultos que conoce, y les pide que respondan y regresen por correo la siguiente
pregunta: “¿Prefiere utilizar el correo electrónico o el correo ordinario (el servicio
postal)?” Ella recibe 65 respuestas, y 42 de ellas indican una preferencia por el correo
ordinario.
a) Identifique la muestra
65 respuestas que recibió una estudiante de posgrado de la universidad de Newport
acerca de la encuesta que realizó a los adultos que conoce sobre su preferencia por el
correo electrónico o el servicio postal.
b) Identifique la población.
500 adultos que una estudiante de la universidad de Newport conoce
c) Además, determine si la muestra parece ser representativa de la población.
La muestra es representativa pero no óptima
9. Clasifique cada una de las siguientes variables como A) discreta, B) continuas o C)
como no variable.
a) Método de pago por las compras (efectivo, con tarjeta de crédito, con cheque).
A
b) Satisfacción de los padres en el estudio de sus hijos (muy satisfecho, satisfecho, insatisfecho).
A
c) Cantidad de impuesto recolectado para la educación. B
d) Número de artículos escolares comprados. A
e) Número de la lista de cierto estudiante. C
10. El tiempo promedio necesario para contestar un examen para todos los alumnos
de sexto grado de primaria, se tomo solamente a 75 alumnos elegidos aleatoriamente.
Haga corresponder las expresiones de la columna dos con los términos estadísticos de
la columna uno.
1 2f dato (uno) (a) los 75 alumnos.g datos (conjuntos) (b) el tiempo promedio para todos los alumnos.
h Experimento(c) dos minutos, el tiempo para realizar el examen un
alumno.b Parámetro (d) el tiempo promedio para los 75 alumnos.e Población (e) todos los alumnos de sexto grado de primaria.a Muestra (f) el tiempo para realizar el examen de un alumno.d Estadístico (g) los 75 tiempos.
C Variable(h) el proceso utilizado para seleccionar a los 75 alumnos
y medir sus tiempos.
11. Unas de las variables que se incluyen con mayor frecuencia en las encuestas es el
ingreso. A veces la pregunta enuncia “¿cuál es su ingreso (en pesos)?” En otras
encuestas, se pide lo siguiente “marque con una X el rectángulo que corresponde a su
nivel de ingreso”
Menos de $2000 Entre $2000 y $3999 $4000 o más
a) Explique por qué en el caso de la primera pregunta el ingreso puede considerarse
discreto o continuos.
En el primer caso es continua porque el ingreso de una persona puede incluir
números decimales
b) ¿Qué tipo de pregunta usaría si realizara una encuesta? ¿Por qué?
Una pregunta que utilizara variables discretas para que las respuestas no fueran ambiguas (como la segunda)
c) ¿Qué pregunta tiene más probabilidades de ofrecer un alto índice de respuesta? ¿Por
qué?
La segunda porque es más probable que los encuestados respondan (por su
tipo de variable) y favorece el análisis de los datos obtenidos.
12. Suponga que se tiene la siguiente información de Roberto Cardozo en su solicitud
de un préstamo hipotecario de la casa en cierto Banco.
a) Lugar de residencia: Xalapa, Veracruz.
b) Tipo de residencia: casa unifamiliar.
c) Fecha de nacimiento: 14 marzo de 1962.
d) Pagos mensuales: $14,275.
e) Ocupación: Académico.
f) Empleador: Universidad Veracruzana.
g) Número de años en el trabajo: 14.
h) Números de trabajos en los últimos diez años: 1.
i) Ingreso salarial familiar anual: $200,000
j) Otros ingresos: $28,700.
k) Estado civil: casado.
l) Número de hijos: 2.
m) Hipotecario solicitado: $1,200,000.
n) Término del hipotecario: 30 años.
o) Otros préstamos: carro.
p) Cantidad de otros préstamos: $15,000
Clasifique cada una de las respuestas por tipo de datos, variable y escala de medición.
DATOS TIPO DE DATOS VARIABLE ESCALA DE MEDICIÓN
Lugar de residencia:
Xalapa, Veracruz
Cualitativo Variable Discreta Escala Nominal
Tipo de residencia: casa
unifamiliar.
Cualitativo Variable Discreta Escala Ordinal
Fecha de Nacimiento:
14 de Marzo 1962
Cuantitativo Variable continua Escala de intervalo
Pagos mensuales:
$14,275.
Cuantitativo Variable continua Escala de razón
Ocupación: Académico. Cualitativo Variable Discreta Escala ordinal
Empleador: Universidad
Veracruzana
Cualitativo Variable Discreta Escala nominal
Número de años en el
trabajo: 14.
Cuantitativo Variable Discreta Escala de Razón
Números de trabajos en
los últimos diez años: 1
Cuantitativo Variable Discreta Escala de Razón
Ingreso salarial familiar
anual: $200,000
Cuantitativo Variable Discreta Escala de Razón
Otros ingresos: $28,700. Cuantitativo Variable Discreta Escala de Razón
Estado civil: casado Cualitativo Variable Discreta Escala Nominal
Número de hijos: 2 Cuantitativo Variable Discreta Escala de razón
Hipotecario solicitado:
$1,200,000.
Cuantitativo Variable Discreta Escala de razón
Término del
hipotecario: 30 años
Cuantitativo Variable Discreta Escala de Intervalo
Otros préstamos: carro Cualitativo Variable Discreta Escala Nominal
Cantidad de otros
préstamos: $15,000
Cuantitativo Variable Discreta Escala de Razón
13. Los estudiantes de una universidad se clasifica como primer año, de segundo, de
penúltimo año y de último año. ¿Qué tipo de escala de medición es?
Escala de medición ordinal
14. En cada uno de los incisos siguientes, determine cuál de los cuatro niveles de
medición (nominal, ordinal, de intervalo, de razón) más apropiado.
a) Distancia que los alumnos recorren para llegar a clases. DR
b) Calificaciones de los alumnos en el primer examen de estadística. DI
c) Una clasificación de los alumnos por estado de origen N
d) Una clasificación de los estudiantes según el semestre que cursan. O
e) Número de horas que los alumnos dedican a estudiar por semana. DR
15. Un grupo de estudiantes elabora una escala para calificar la calidad de los
alimentos en la cafetería, donde 0 representa “neutral: ni buena ni mala”. A las
comidas malas se asignan números negativos y a las comidas buenas números
positivos, y la magnitud del número corresponde al grado de lo bueno o lo malo. Las
primeras tres comidas se califican con 2, 4 y -5. ¿Cuál es el nivel de medición de este
tipo de calificaciones? Explique su respuesta.
En una escala de intervalo porque se establecen distancias entre dos observaciones y el
0 es arbitrario es decir “ni buena ni mala”, hay una escala que va de números
positivos a escalas con números negativos.
16. Indicar si los enunciados siguientes representan una constante o una variable.
a) El número día del mes de agosto.
Constante
b) El número de acciones negociadas en la bolsa de valores en México el 5 de enero de
1980.
Variable
c) La edad de los estudiantes del primer año de la Universidad Veracruzana.
Variable
d) El tiempo requerido para completar un ejercicio
Variable
17. En una prueba de aptitudes, tres trabadores recibieron calificaciones de 90, 85, y
80. Tres trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes
declaraciones realizadas con base en estas calificaciones identifíquese aquellas que se
derivan de estadística descriptiva y aquellos que se derivan de estadística inferencial.
a) La calificación promedio de los tres trabajadores es 85 y la calificación promedio de
las tres trabajadoras es 89. inferencial
b) La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los
trabadores. descriptiva
c) En la siguiente prueba de aptitudes, probablemente los trabajadores reciben
calificaciones más bajas que las trabajadoras. descriptiva
18. En cuatro pruebas de estadísticas, María recibió calificaciones de 95, 100, 85 y 60,
mientras que Juan recibió calificaciones de 65, 85, 70 y 80. A partir de estos datos se
llaga a las siguientes conclusiones, ¿cuáles de éstas incluyen estadística descriptiva y
cuales es estadística inferencial?
a) El promedio de las calificaciones de María es 85 y el promedio de las calificaciones
de Juan es 75. inferencial
b) María es mejor estudiantes que Juan. Inferencial
c) Probablemente en la siguiente prueba, María obtenga calificaciones más elevadas
que Juan. descriptiva
d) La diferencia entre los dos promedio es de 10 puntos. Inferencial
19. La tabla siguiente contiene alumnos del sistema educativo nacional del ciclo
escolar 2007 a 2008.
Clase Tipo Educativo Cifra registrada
1 Nivel Básico 51,032,300
2 Media Superior 3,830,042
3 Superior 2,623,367
a) Clasifique los datos de cada una de las tres columnas como cuantitativos o
cualitativos.
Columna 1: cuantitativo
Columna 2: cualitativo
Columna 3: cuantitativo
b) Identifique los datos de la tercera columna como discreta o continuos.
Discreta
c) Determine los datos de cada una de las tres columnas como nominales, ordinales, de
intervalo o de razón.
Columna 1: ordinal
Columna 2: ordinal
Columna 3: de Razón
20. Un profesor construye una prueba de ortografía seleccionando una muestra de 200
palabras del diccionario.
a) Si el profesor califica su prueba de una de las siguientes maneras ¿cuál es la escala de
medida que emplea?
0 el alumno escribió al menos un plural con algún error.
1 el alumno escribió todas los plurales correctamente.
Escala de medición de Razón
c) si el profesor cuenta el número de palabras correctamente escritas y denomina tal
hecho como “habilidad general para escribir con ortografía” ¿Cuál es la escala de
medida a que está recurriendo?
Escala de medición de intervalo.
21. En el siguiente ejercicio mencione cual es estadística descriptiva y cual es
inferencial. En cierta Universidad, el decano de un colegio, al hacer los preparativos
para una presentación de consejero, necesita conocer el promedio del número de
estudiantes por clase. El decano descubre que:
a) En una muestra de 10 grupos, el número promedio de estudiantes por grupo es de
80.
inferencial
b) En un estudio acerca de toda la universidad el promedio por grupo resulta 84.
descriptiva
22. En un estudio sobre los estudiantes del último año en una prestigiada universidad,
se mide el área de especialización de los alumnos (Psicología. Química, Inglés,
etcétera) y su año de escolaridad (primero, segundo, tercero, último año). En dicho
estudio ¿cuál de las mediciones representa una variable y cual una constante?
Especialización: constante
Escolaridad: variable
23. ¿Qué significa Teorema Central de Limite?
estudia el comportamiento de la suma de variables aleatorias, Este teorema, del cual existen diferentes versiones que se han ido desarrollando a lo largo de la historia, tiene una gran aplicación en estadística inferencial, pues muchos parámetros de diferentes distribuciones de probabilidad, como la media, pueden expresarse en función de una suma de variables.
El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que
éste sea), la suma de ellas se distribuye según una distribución normal.
24. ¿Qué es el coeficiente de variación?
Es la relación entre el tamaño de la media y la variabilidad de la variable, a mayor
valor del coeficiente mayor heterogeneidad de los valores de la variable.
25. ¿Cuándo se utiliza la media Armónica?
Cuando la media, la mediana y la moda no son tan buenos y se debe usar la media
armónica, se usa cuando existe variabilidad en los datos.
26. ¿Cuándo se utiliza la media Geométrica?
Es una medida de tendencia central que puede utilizarse para mostrar los cambios
porcentuales en una serie de números positivos y cuando se utilizan indices. Como tal,
tiene una amplia aplicación en los negocios y en la economía, debido a que con
frecuencia se está interesado en establecer el cambio porcentual en las ventas en el
producto interno bruto o en cualquier serie económica. Se define como la raíz índice n
del producto de n términos.
27. En qué consisten los deciles, cuartiles y percentiles y cuál es su importancia en el
análisis de los datos.
Las medidas de posición se utilizan para describir la posición que un dato específico
posee en relación con el resto de los datos cuando están en orden por categorías.
Cuartiles, deciles y percentiles son las medidas de posición más populares, así tenemos
que los cuartiles son valores de la variable que dividen los datos ordenados en cuartos,
los deciles Son valores de la variable que dividen los datos ordenados en diez partes
iguales (9 divisiones) y los percentiles Son los valores de la variable que dividen un
conjunto de datos clasificados en 100 subconjuntos iguales.
28. Explique cómo se construye un diagrama de cajas y alambres
Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles
restantes, ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2
y Q3 y el Rango, hay que calcular los límites superior e inferior, se buscan los últimos
valores que NO son atípicos, que serán los extremos de los alambres.
29. Que visualiza con el diagrama de cajas y alambres.
Es un gráfico que suministra información sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría
de la distribución
30. ¿Qué significa cuando la media, la mediana y la moda tienen el mismo valor?
Que son simétricas
31. ¿Qué significa el termino de sesgo en estadística?
diferencia entre su esperanza matemática y el valor numérico del parámetro que
estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.
32. ¿Qué clase de grafico son apropiados para
a) Datos nominales? Pastel y barras
b) Ordinales? Pastel, barras
c) Datos de intervalo y de razón ojiva, histograma, polígono,
33. Diga que clases de graficas son apropiados para
a) Datos cualitativos. De pastel y Barras
b) Datos cuantitativos. Histograma, cajas y alambres ojiva
34. Qué medida de tendencia central es más adecuada cuando los datos es simétrico y
además tiene kurtosis mesocúrtica.
La media
35. busque los conceptos de la siguiente prueba de correlación, así como, qué tipo de
variable se utiliza cada una de las pruebas.
Correlación de Pearson: un índice que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean cuantitativas.
Chi-cuadrada: es una medida de la "intensidad" de la relación entre las características
observadas
coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la
asociación o interdependencia) entre dos variables aleatorias continuas.
Correlación Kendall: coeficiente de correlación de rangos de Kendall, comúnmente
conocida como coeficiente tau de Kendall, es una estadística que se usa para medir la
asociación entre dos cantidades medidas. Una prueba de tau es una prueba de hipótesis no
paramétrica para la dependencia estadística basada en el coeficiente de tau.
En concreto, se trata de una medida de correlación de rangos, es decir, la similitud de los
ordenamientos de los datos cuando clasificados en orden de cada una de las cantidades.
36. ¿Por qué es importante conocer que los datos se distribuyen como una normal?
37. ¿Qué método se utiliza para verificar si existe normalidad?
Test de Shapiro–Wilk se usa para contrastar la normalidad de un conjunto de datos. Se
plantea como hipótesis nula que una muestra x1, ..., xn proviene de una población
normalmente distribuida.
la prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que
se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí.
Living for
38. ¿Qué son los métodos no paramétricos?
Los procedimientos inferenciales que no se encuentran sujetos a la forma de la
distribución de la población y no requieren que las observaciones estén dadas en
escala de intervalo
39. ¿Qué significa Estadística Exploratoria?
el análisis exploratorio de datos puede ser una herramienta de utilidad en la
generación de hipótesis, conjeturas y preguntas de investigación acerca de los
fenómenos de donde los datos fueron obtenidos.
40. ¿En qué consiste un análisis bivariado?
Implica el análisis comparativos de dos variables una de las cuales modifica a la otra.
41. Problema: A continuación complete el espacio en blanco con la respuesta correcta.
De razón En esta escala existe un cero absoluto (real), aquí el cero indica ausencia de medición.
estadística Conjunto de técnicas que se encarga de recolectar, organizar, presentar e interpretar la información.
ordinal En esta escala los datos pueden ordenarse de un modo lógico en forma ascendente o descendente
Datos cualitativos Es aquella variable que se representa por categorías o atributos.histograma Es un tipo de gráfica de barras apiladas para una distribución de
frecuencia de una variable cuantitativa.Relativa acumulada
Es una gráfica lineal construida a partir de una tabla de frecuencia acumulada o de una tabla de frecuencia relativa acumulada.
parámetros Se le llama a los valores del promedio poblacional, desviación estándar poblacional, etc.
Histograma Es un gráfico que se utiliza cuando se tiene una variable de tiempo.
Escala de medición de intervalo
En esta escala existe un cero arbitrario, que no indica ausencia de medición y se puede establecer distancias entre dos observaciones.
Estadísticos muestrales
Son valores a partir de una muestra como son (la media muestral, varianza muestral, proporción muestral, etc).
Variables discretas Es aquella variable en donde las mediciones se realizan de manera numérica.
Grafica de barras Es una gráfica de barras separadas y se utiliza para datos cualitativos.
Desviación estándar
Es la distancia promedio que hay entre el promedio y los datos.
muestra Es un subconjunto de la población.Escala nominal Es la escala en donde las categorías no llevan un cierto orden.constante Es una característica que no se puede alterar.Gráfico de pastel Es un gráfico se usan generalmente para datos categóricos y se
representa con porcentajeTabla de contingencia
Es una tabla de doble entrada que representan dos variables cualitativas.
inferencia Es aquella que a partir de una muestra representativa se puede generalizar a la población.
mediana Se le llama cuando le media aritmética o promedio y la mediana coincide.
Ojiva Es aquel grafico además del histograma que nos permite visualizar si los datos tienen un comportamiento normal.