estadistica y pronostico para la toma de decisiones ma13202
TRANSCRIPT
Maestros Online www.maestronline.com
Solicita una cotización a través de nuestros
correos
La
Maestros Online
Estadística y pronóstico para la
toma de decisiones Grupo de
problemas
Servicio de asesorías y solución de ejercicios
Envía tus actividades a [email protected]
Maestros Online www.maestronline.com
estatura de una persona está relacionada con su peso, por lo que puede sugerirse, en
términos generales, que a mayor estatura de una persona, esta tendrá más peso. Para tener
una idea de cómo es esta relación, realiza lo siguiente:
Parte 1
1. De manera individual, pregunta a 10 personas diferentes la siguiente información:
a. Su género
b. Su estatura en centímetros
c. Su peso en kilogramos
2. Con base en la información recolectada, determina:
a. ¿Quiénes presentan mayor estatura, hombres o mujeres?
b. ¿Quiénes presentan mayor peso, hombres o mujeres?
c. ¿Cuál es la mayor estatura? ¿La menor?
d. ¿Cuál es el promedio de las estaturas? ¿Cuál es el promedio del peso?
Parte 2
En equipo de dos personas:
3. Hagan comentarios en el foro de grupo sobre la forma en que recolectaron los datos, y
cómo los van a organizar.
4. Utilicen Excel para elaborar una base de datos, donde se incluya la información de todos
los miembros del equipo.
5. Con una calculadora de bolsillo, determinen los siguiente:
a. El promedio general tanto de estatura como de peso
b. Para ambas variables determinar la mediana
c. La varianza y la desviación estándar
6. Verifiquen lo anterior, utilizando herramientas de análisis de Excel.
Parte 3
7. Al finalizar, reflexionen sobre las siguientes preguntas, y preparen un documento que
integre las respuestas de todo el equipo a manera de conclusiones:
a. ¿Cuál es el promedio general, tanto para peso como para estatura?
b. ¿Cuál es el promedio por género?
c. ¿Cuál es la desviación estándar para todo el conjunto de datos?
d. ¿Cuál es la desviación estándar por género?
e. ¿Cuál de los dos géneros es el de mayor estatura? ¿Cuál de los dos géneros es el de
mayor peso?
f. ¿Qué genero presenta mayor variabilidad en ambas características (estatura y peso)?
g. ¿En qué otras áreas podrían aplicar estos conceptos?
Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y
fundamentada.
Maestros Online www.maestronline.com
1. Escribe con tus propias palabras por qué se les llama medidas de tendencia central o
medidas de dispersión o variabilidad.
2. Lee y resuelve el siguiente ejercicio:
Se registraron las edades de una muestra de 25 empleados.
Los resultados se encuentran enseguida:
3. Determina lo siguiente:
a. Media
b. Mediana
c. Varianza y desviación estándar
4. Construye una tabla de frecuencias y un histograma.
5. Describe brevemente cuál es el papel de la probabilidad en la estadística.
6. Durante una reciente promoción, un banco ofrece hipotecas de 1, 2 y 3 con un interés
reducido. Los clientes también pueden elegir entre las hipotecas abiertas y cerradas.
Supón que 300 solicitudes de hipotecas y que el número de hipotecas de cada tipo
son como se presentan en la siguiente tabla. El gerente selecciona una solicitud de
hipoteca al azar, y los eventos relevantes se definen como sigue.
L: la solicitud es por una hipoteca de 1 año
M: la solicitud es por una hipoteca de 2 años
S: la solicitud es por una hipoteca de 3 años
C: la solicitud es de una hipoteca cerrada
7. Encuentra: P (L), P (M), P(S), P(C) y P ( ).
Maestros Online www.maestronline.com
8. Si se selecciona una hipoteca de 3 años, ¿cuál es la probabilidad de que sea una
solicitud por hipoteca cerrada?
9. Si la solicitud es de una hipoteca cerrada, ¿cuál es la probabilidad de que sea una
hipoteca de 3 años?
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Parte 1
1. Escribe el proceso de la prueba de hipótesis.
2. Reúnanse en equipos de trabajo, y expongan lo que se pide en el foro de discusión.
3. Comenten sobre el proceso de las pruebas de hipótesis.
4. Busquen información sobre el consumo diario en promedio que tienen los mexicanos de
cigarrillos, y relacionen esta información con los decesos por cáncer de pulmón en México
5. Realicen sus conclusiones de la información analizada
Parte 2
6. Respondan al siguiente ejercicio, a través de foro que se destinó para esta actividad.
Análisis de un problema del contenido de nicotina en cigarrillos
La empresa de cierta marca de cigarrillos asegura que el contenido promedio de nicotina
en su producto es de 0.65 miligramos por cigarrillo. La Procuraduría Federal del
Consumidor asevera que µ ≠ 0.65. Para corroborar esto, toma una muestra de 10
cigarrillos y se registra el contenido de nicotina. Los resultados, en miligramos por
cigarrillo, se presentan enseguida:
Fuente: Miller, W. y Freund, J. E. (1986). Probabilidad y estadística para ingenieros (3ª ed.). Prentice-Hall
Hispanoamericana, S. A.
7. Realicen lo siguiente:
a. La media y desviación estándar
b. En el siguiente inciso se va a utilizar la prueba de t. Respondan: ¿por qué va a
utilizarse esta prueba y no la prueba de z?
c. Prueben la hipótesis de que H0: µ = 0.65 contra Ha: µ ≠ 0.65 contra Utilicen α = 0.05.
d. Concluyan en el contexto del problema, es decir, contesten la pregunta: ¿hay
suficiente evidencia para asegurar que el contenido medio de nicotina es diferente de
0.65 miligramos?
e. Construyan un intervalo de confianza al 95%, para la media de la población .
Parte 3
Maestros Online www.maestronline.com
8. Respondan:
a. ¿Para qué sirven las pruebas de hipótesis?
b. ¿Qué es la estadística de prueba?
c. ¿Qué significa región de rechazo?
d. ¿Cuál es la relación del intervalo de confianza con las pruebas de hipótesis?
e. ¿Cómo podrían relacionar este análisis con la información que analizaron en la
primera parte de esta actividad?
1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que no
sea función de probabilidad, explicar por qué no lo es.
a.
b.
c.
d.
2. El gerente de una planta utiliza datos históricos para construir una función de distribución
de probabilidad de X, el número de empleados ausentes en un día dado; los datos se
presentan a continuación:
Determina lo siguiente:
1. P(X=1)
2. P(X>5)
3. P(X≥5)
4. P(X=6)
3. Supón que X representa el número de personas en una vivienda. La distribución de
probabilidad es como sigue:
a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga menos de 3
personas?
b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5
personas?
Maestros Online www.maestronline.com
c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre 2 y 4
(inclusive) personas? Determínese P(2≤X≤4).
1. Escribe con tus propias palabras el proceso de prueba de hipótesis y los intervalos de
confianza.
2. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los datos
son los siguientes:
3 6 3 5 6 2 6 5 5 4
3. En parejas, establezcan lo siguiente:
a. Un intervalo de confianza al 90%
b. Un intervalo de confianza al 95%
c. Un intervalo de confianza al 99%
4. En un experimento para determinar los grados centígrados necesarios para llevar al punto
de ebullición un litro de agua, se obtuvieron los siguientes resultados:
100.0 100.2 99.7 99.5 99.5 100.3
99.0 99.4 99.9 100.2 100.1 99.8
5.
a. Prueben la hipótesis de que la media es igual a 100 (H0: µ =100) contra la alternativa
de que la media poblacional es diferente a 100 (Ha: µ ≠ 100). El nivel de significancia
es del 1% (α = 0.01).
Realicen todas las etapas de una prueba de hipótesis.
b. Establezcan interprete el intervalo de confianza al 99% para la media de ebullición, µ.
6. Por un periodo de varios años, un dentífrico ha recibido una puntuación media de 5.9, en
una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el producto.
Debido a un cambio no anunciado en el producto, existe la preocupación de que quizás
haya cambiado la satisfacción del cliente. Supóngase que las puntuaciones para una
muestra de 25 clientes tienen una media de 5.60 y una desviación estándar de 0.87.
¿Indican estos datos que la satisfacción del cliente es diferente de 5.9?
a. Prueben la hipótesis con α = 0.05.
b. Obtengan un intervalo de confianza al 95% para la media µ.
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
1. Describe con tus propias palabras qué significa una serie de tiempo.
2. Enlista y define los componentes de una serie de tiempo.
3. Responde:
Maestros Online www.maestronline.com
a. ¿Cuál de los cuatro componentes de una serie de tiempo se utilizaría para describir el
efecto de las ventas navideñas de una tienda departamental de menudeo?
b. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un
componente estacional que uno que posee un componente cíclico?
4. Los datos que se presentan a continuación corresponden al número de autos de
pasajeros (en miles) en Francia, durante los años 1970 a 2006.
a. Grafica el número de autos contra los años (utilícese Excel o cualquier paquete
estadístico como Minitab).
b. Responde: ¿Qué componentes de la series de tiempo parecen estar presentes en
esta serie?
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
nstrucción para el alumno:
¿Cuánto tiempo dedica una persona en promedio a Internet?
Para tener una idea de esto, realiza lo siguiente:
1. Pregunta, de manera individual, a 10 personas del género masculino y a 10 personas del
género femenino la siguiente información:
a. Su edad
b. Tiempo que dedica diariamente a Internet
2. Con una calculadora de bolsillo y con base en esta información, determina:
a. En promedio, ¿quién dedica más tiempo a Internet: hombres o mujeres?
b. ¿Cuál es el promedio de edad de las mujeres? ¿Cuál es el promedio de edad de los
hombres?
c. Para los géneros por separado, determina la mediana de la edad y del tiempo
dedicado a Internet.
d. Para el total de datos, determina la varianza y la desviación estándar del tiempo que
dedican a Internet y de la edad.
Maestros Online www.maestronline.com
3. Utiliza Excel para elaborar una base de datos, en la que incluyas toda la información. Con
una calculadora de bolsillo contesta lo siguiente:
a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad?
b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado a
Internet como de la edad?
c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo
dedicado a Internet y para la edad?
4. Verifica lo anterior, utilizando herramientas de análisis de Excel.
5. Para finalizar, reflexiona sobre las siguientes preguntas, y prepara un documento con
respuestas a manera de conclusiones:
Para el total del conjunto de datos:
a. ¿Cuál es el promedio general, tanto del el tiempo dedicado a Internet como de la edad?
b. ¿Cuál es la desviación estándar para todo el conjunto de datos?
c. Supón que se tiene información de que el promedio que dedica una persona (sin importar
su género) es de 7 horas diarias. Con los datos anteriores, prueba las siguientes
hipótesis:
H0 : µ = 7 contra la alternativa de que Ha : µ ≠ 7 con un nivel de significancia de 0.05.
Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del
problema ¿Es el tiempo promedio dedicado a Internet diferente de 7?
d. Establece e interpreta el intervalo de confianza al 95%.
e. Realiza un resumen de los hallazgos.
Para los datos del género masculino:
a. ¿Cuál es el promedio del tiempo dedicado a Internet y de la edad?
b. ¿Cuál es la desviación estándar para estos datos del género masculino?
c. Supón que se tiene información de que el promedio que dedican los hombres a Internet es
de 5 horas diarias. Con los datos para este género, prueba las siguientes hipótesis:
H0 : µ = 5 contra la alternativa de que Ha : µ ≠ 5 con un nivel de significancia de 0.05.
Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del
problema ¿Es el tiempo promedio dedicado a Internet diferente de 5 horas diarias?
d. Establece e interpreta el intervalo de confianza al 95%.
e. Realiza un resumen de los hallazgos.
Para los datos del género femenino:
a. ¿Cuál es el promedio del tiempo dedicado a Internet y de la edad?
b. ¿Cuál es la desviación estándar para estos datos del género femenino?
c. Supón que se tiene información de que el promedio que dedican los mujeres a Internet es
de 8 horas diarias. Con los datos para este género, prueba las siguientes hipótesis:
Maestros Online www.maestronline.com
H0 : µ = 8 contra la alternativa de que Ha : µ ≠8 con un nivel de significancia de 0.05.
Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del
problema ¿Es el tiempo promedio dedicado a Internet diferente de 8 horas diarias?
d. Establece e interpreta el intervalo de confianza al 95%.
e. Realiza un resumen de los hallazgos.
f. Reúnanse en grupos de dos personas a través de un chat (MSN, Skype, foro de
equipo, etc.) y definan lo que significa los términos de
a. Serie de tiempo
b. Componentes de una serie de tiempo
c. Correlación
d. Autocorrelación
e. Promedio móvil
f. Suavizamiento exponencial
En equipos lleguen a una definición común e indiquen en qué situaciones de la vida diaria
se pueden aplicar estos conceptos den un ejemplo de cada término
2. Busquen información de 20 casas en venta en donde las variables son: Y (metros de
construcción) y X (metros de terreno); y realicen lo que se indica
a. Realicen y describan el diagrama de dispersión.
b. Calculen e interpreten el coeficiente de correlación muestral r.
c. Respondan a la siguiente cuestión en un terreno urbano ¿a mayor cantidad en metros
de construcción es mayor el precio de la vivienda?
3. Busquen información de los CETES a 28 DÍAS – SEMANAL, periodicidad diaria, datos del
Banco de México, consideren las últimas 20 cotizaciones de los CETES y realicen lo que
se indica:
a. Determinen el coeficiente de autocorrelación r1
b. Determinen la prueba de hipótesis de que:
i. Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)
ii. Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero).
iii. Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k.
c. Respondan: ¿Qué significa el término autocorrelación? ¿Existe autocorrelación entre
los rendimientos de los CETES a 28 días?
4. Las llamadas de emergencia a un teléfono durante las últimas 24 semanas son:
Semana Llamadas Semana Llamadas Semana llamadas
1 50 9 35 17 55
2 35 10 20 18 40
3 24 11 15 19 35
4 40 12 40 20 60
5 44 13 55 21 75
Maestros Online www.maestronline.com
6 34 14 35 22 50
7 20 15 25 23 40
8 30 16 55 24 65
a. Realicen y describan un diagrama de dispersión.
b. Determinen un promedio móvil con k=3 periodos y pronostiquen el valor para la
semana 25.
c. Consideren un pronóstico inicial de 50 llamadas durante la primera semana y
utilizando un suavizamiento exponencial con α = 0.10, desarrollen los pronósticos para
el periodo comprendido entre las semanas 1 a 24. ¿Cuál es el pronóstico para la
semana 25?
d. Pronostiquen nuevamente cada periodo utilizando α = 0.6.Obtengan el valor para la
semana 25.
e. Las llamadas reales durante la semana 25 fueron 85. ¿Cuál de los tres métodos
anteriores se acerca más?
5. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada una
de las siguientes cuestiones
a. ¿Qué significa el coeficiente de correlación?
b. ¿Cómo se interpreta el coeficiente de correlación?
c. ¿Para qué sirve el coeficiente de autocorrelación?
d. ¿Cuándo utilizarías el método de promedios móviles?
e. ¿Cómo elegirías la constante suavizamiento en el método de suavización
exponencial?
Ejercicio 1
1. Una empresa refresquera está estudiando el efecto de su última campaña publicitaria. Se
eligieron personas al azar y se les llamó para preguntarles cuantas latas de su refresco
habían comprado la semana anterior y cuántos anuncios de su refresco habían leído o
visto durante el periodo. Los datos se presentan a continuación:
X (número de anuncios) 3 7 4 2 0 4 1 2
Y (latas compradas) 11 18 9 4 7 6 3 8
Determina el coeficiente de correlación.
Ejercicio 2
2. Enseguida se presentan los precios diarios al cierre (en dólares por acción).
Periodo
t
Precio
Yt
Maestros Online www.maestronline.com
1 82.87
2 83.00
3 83.61
4 83.15
5 82.84
6 83.99
7 84.55
8 84.36
9 85.53
10 86.54
11 86.89
12 87.77
13 87.29
14 87.99
15 88.80
16 88.80
17 89.11
18 89.10
19 88.90
20 89.21
Prueba si existe autocorrelación en estos datos. Utiliza: α = 0.05
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
esponde la siguiente pregunta:
¿Bajo qué condiciones es un promedio móvil simple apropiado para pronosticar?
Ejercicio 1
1. Los datos de la demanda anual de bolsas de fertilizante de una empresa agrícola se
muestran en la siguiente tabla.
Año
t
Demanda de
Fertilizante
(miles de bolsas) Yt
Pronóstico
Ŷt
1 4 -
2 6 -
3 4 -
4 5 4.7
5 10
6 8
7 7
8 9
9 12
10 14
Maestros Online www.maestronline.com
11 15
a. Grafica la serie de tiempo.
b. Encuentra el valor de pronóstico para la demanda de fertilizante para cada año,
comenzando por el año 4 por medio de un promedio móvil de k=3 años.
2. Aplica el suavizamiento exponencial con una constante de suavizamiento de α = 0.1 y un
valor inicial de 38 para pronosticar el valor del año 11 para el siguiente conjunto de datos.
Periodo
t
Yt Ŷt
1 38 38
2 43
3 42
4 45
5 46
6 48
7 50
8 49
9 46
10 45
Ejercicio 2
3. Las ventas de equipos de cocina han aumentado durante los últimos cinco años.
Año Ventas Yt Ŷt
1 400 360
2 455
3 468
4 513
5 534
6
El gerente había pronosticado, antes de iniciar el negocio, que las ventas del primer año
serían de 360 equipos de cocina. Por medio de un suavizamiento exponencial conα = 0.40 ,
desarrolla los pronósticos para el periodo comprendido entre los años 2 y 6.
Ejercicio 3
4. Las ventas trimestrales de una cadena de tiendas departamentales se registraron para los
años 1986-1989:
Maestros Online www.maestronline.com
Año Trimestre Ventas
(millones)
Yt
Pronóstico
Ŷt
1986 1 18 18
2 33
3 25
4 41
1987 1 22
2 20
3 36
4 33
1988 1 27
2 38
3 44
4 52
1989 1 31
2 26
3 29
4 45
1990 1
Utiliza el suavizamiento exponencial con una constante de suavizamiento de 0.4 y un valor
inicial de 18 para pronosticar las ventas para el primer trimestre de 1990.
1. Reúnanse en grupos de dos personas a través de un chat (MSN, Skype, foro de equipo,
etc.) y definan los términos de:
a. Criterios de estimación de la precisión de un pronóstico (desviación absoluta media,
error cuadrático medio, error porcentual absoluto medio y error porcentual medio).
b. Análisis de la regresión simple.
c. Estimadores de mínimos cuadrados.
d. Intervalo de confianza.
e. Coeficiente de regresión.
f. Coeficiente de correlación.
g. Coeficiente de determinación.
En equipos lleguen a una definición común e indiquen en qué situaciones de la vida diaria se
pueden aplicar estos conceptos den un ejemplo de cada término.
2. Busquen información de 20 casas en venta en donde las variables son: Y (metros de
construcción) y X (metros de terreno); y realicen lo que se indica
a. Realicen el diagrama de dispersión y describe el comportamiento de ambas variables.
¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor cantidad
de metros de construcción es mayor el precio?
b. Calculen la recta de regresión de mínimos cuadrados.
Maestros Online www.maestronline.com
c. ¿Existe evidencia que indique que a mayor cantidad de metros de construcción es
mayor el precio de venta? Prueben la significancia de la recta de regresión con un
nivel de significancia α = 0.01.¿Es significativa esta regresión? Realicen todas las
etapas de una prueba de hipótesis. Concluye en el contexto del problema.
d. Pronostiquen el precio de la vivienda si la cantidad de metros de construcción es de
90, 105 y 120 metros de construcción.
e. Calculen el coeficiente de correlación.
f. Determinen e interpreten el coeficiente de determinación en el contexto del problema.
g. Realicen un breve resumen de los hallazgos.
h. En un terreno urbano ¿a mayor cantidad en metros de construcción es mayor el precio
de la vivienda?
3. Los datos de la siguiente tabla representan los pronósticos Ŷt para las series de tiempo en
los periodos t = 1, 2, 3, 4, y 5 junto con los valores observados Yt.
t Yt Ŷt
1 32.8 33.1
2 35.6 32.4
3 33.6 30.6
4 29.3 29.9
5 31.5 33.7
a. Grafiquen los datos en una misma gráfica.
b. Calculen la DAM, el ECM, el EPAM y el EPM.
4. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de
tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales
observados (Yt).
Valores de pronóstico
Ŷt
Mes Valor observado
Yt
Modelo 1 Modelo 2
1 70 71 69
2 89 85 87
3 94 90 92
4 80 84 98
5 68 70 74
6 72 68 70
7 60 61 59
Maestros Online www.maestronline.com
8 75 71 75
9 86 84 88
10 90 88 88
5. Calculen el ECM y la DAM para cada pronóstico. ¿Parece alguno de los dos métodos
superior? Explíquese.
6. En una compañía fabricante de helados se sospecha que el almacenar el
helado temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida de
peso del producto. En la planta de almacenamiento de la compañía se obtuvieron los
siguientes datos:
Pérdida de peso (gr) Y 28 37 36 30 28 36 35
Tiempo (semanas) X 26 32 35 27 25 31 30
a. Ajusten e interprétese un modelo de regresión lineal simple a los datos.
b. Prueben la significancia de la pendiente β1.
c. Calculen e interprétese R2.
d. Elaboren un intervalo de confianza del 90% para β1.
e. Pronostiquen la pérdida cuando el tiempo es de 33 semanas.
b. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada
una de las siguientes cuestiones
a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu
especialidad?
b. ¿Qué relación tiene con la correlación?
c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?
d. ¿Qué es el coeficiente de determinación?
e. ¿Por qué crees que se llama regresión lineal?
f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en
la regresión?
Resuelve los siguientes ejercicios:
1. Para los siguientes valores de Yt y Ŷt de la siguiente tabla calcula la DAM, el ECM, el
EPAM y EPM.
Valor
observado
Yt
Pronóstico
Ŷt
166 173
179 186
Maestros Online www.maestronline.com
195 192
214 211
220 223
2. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de
tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales
observados (Yt).
Valores de pronóstico
Ŷt
Valor observado Yt Modelo 1
Modelo 2
6.0 7.5 6.3
6.6 6.3 6.7
7.3 5.4 7.1
9.4 8.2 7.5
Calcula el DAM y el ECM para determinar cuál es más preciso.
3. Determina DAM y ECM para los siguientes pronósticos.
Valor
observado
Yt
Pronóstico Ŷt
57 63
60 72
70 86
75 71
70 60
4. Se utilizaron tres técnicas de pronóstico para predecir los valores de una serie de tiempo.
Estos valores se dan en la siguiente tabla. Calcula el DAM y el ECM para cada técnica
para determinar cuál es el más preciso.
Valores de pronóstico Ŷt
Valor observado Yt Técnica
1
Técnica 2 Técnica 3
19 21 22 17
24 27 24 20
28 29 26 25
32 31 28 31
38 35 30 39
Maestros Online www.maestronline.com
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
1. Realizar un resumen del método de mínimos cuadrados.
2. Resuelve el siguiente ejercicio:
Una empresa de bienes raíces ha recopilado datos para ayudar a determinar cómo el
número de ventas de viviendas en la región está relacionado con los niveles de tasas de
interés de la hipoteca. El número de viviendas vendidas en la región y tasas de interés de
la hipoteca para 12 meses seleccionados al azar se muestran en la siguiente tabla.
Interés
(%)
Número de
viviendas vendidas
Interés
(%)
Número de
viviendas vendidas
8.0 188 10.5 140
9.5 145 7.0 203
7.5 181 7.5 188
11.0 137 11.0 144
8.5 157 9.0 150
10.0 148 8.0 166
a. Realiza un diagrama de dispersión para estos datos con el número de casas vendidas
en el eje vertical.
b. Describe la relación entre el interés de la hipoteca y el número de viviendas vendidas.
c. Determina la recta de regresión que describa como las tasas de interés (X) afectan el
número de viviendas vendidas (Y). ¿Qué indica el coeficiente de regresión acerca de
esta relación?
d. Pronostica el número de viviendas vendidas si la tasa de interés es del 10%.
e. Determina el coeficiente de correlación.
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Ejercicio 1
1. Las ventas de línea blanca varían según el estado del mercado de casas nuevas: cuando
las ventas de casas nuevas son buenas, también se reflejan éstas en las cifras de
lavaplatos, lavadoras de ropa, secadoras y refrigeradores. Una asociación de comercio
compiló los siguientes datos históricos (en miles de unidades) de las ventas de línea
blanca y construcción de casas.
Construcción de
casas (miles)
Ventas de
línea blanca (miles)
Maestros Online www.maestronline.com
X Y
2.0 5.0
2.5 5.5
3.2 6.0
3.6 7.0
3.3 7.2
4.0 7.7
4.2 8.4
4.6 9.0
4.8 9.7
5.0 10.0
a. Realiza un diagrama de dispersión para estos datos.
b. Desarrolla una ecuación para la relación entre las ventas de línea blanca (en miles) y
la construcción de casas (miles).
c. Interpreta la pendiente de la recta de regresión.
d. Calcula e interpreta el coeficiente de determinación de la muestra, r2 , para estos
datos.
e. Determina e interpreta el error estándar de estimación.
f. La construcción de casas durante el año próximo puede ser mayor que el intervalo
registrado; se han pronosticado estimaciones hasta de 8000 (en miles) unidades.
Calcula un intervalo de predicción de 90% de confianza para las ventas de línea
blanca, con base en los datos anteriores y el nuevo pronóstico de construcción de
casas.
Ejercicio 2
2. En un problema de regresión con tamaño de muestra 17, se encontró que la pendiente era
de 3.73 y el error estándar de 28.654. La cantidad:
a. Encuentra el error estándar del coeficiente de la pendiente de regresión.
b. Construye un intervalo de confianza del 95% para la pendiente de la población.
c. Interpreta el intervalo de confianza de la parte b).
Ejercicio 3
1. Una compañía de productos químicos desea estudiar los efectos que el tiempo de
extracción tiene en la eficiencia de una operación de extracción, obteniéndose los datos
que aparecen en la siguiente tabla:
Eficiencia de extracción Tiempo de extracción
Maestros Online www.maestronline.com
(minutos)
X
(%)
Y
27 57
45 64
41 80
19 46
35 62
39 72
19 52
49 77
15 57
31 68
1. Realiza un diagrama de dispersión para verificar que una línea recta se ajustará bien a los
datos.
2. Obtén una línea de regresión estimada.
3. Utiliza la ecuación estimada de regresión para predecir la eficiencia de extracción cuando
el tiempo de extracción es de 35 minutos.
4. Prueba la hipótesis de que:
H0 : β1 = 0 en oposición a Ha: β1 ≠ 0. Utiliza α = 0.01.
5. Obten un intervalo de confianza al 99% para β1.
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Analiza y resuelve los siguientes ejercicios sin olvidar incluir los procedimientos utilizados que
te llevaron a la respuesta.
Concluye con una reflexión sobre la utilización de la regresión, correlación y autocorrelación
en la vida cotidiana ¿Qué tipo de problemas pudieras resolver con los conocimientos
adquiridos en este módulo?
1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar al campus
y la distancia desde la casa en donde tú vives? Entrevista a 20 compañeros de tu
Campus y pregúntales el tiempo que tardan en llegar al Campus y la distancia a su casa.
Después denomina a la variable tiempo en minutos como (Y) y a la distancia en km como
(X).
Contesta lo siguiente:
a. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables.
¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor
distancia es mayor el tiempo?
Maestros Online www.maestronline.com
b. Calcula la recta de regresión de mínimos cuadrados.
c. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en llegar?
Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01.
¿Es significativa esta regresión? Realiza todas las etapas de una prueba de
hipótesis. Concluye en el contexto del problema.
d. Pronostica el tiempo en llegar al campus si la distancia es de 3, 4 y 6 kilómetros de
distancia.
e. Calcula el coeficiente de correlación.
f. Determina e interpreta el coeficiente de determinación en el contexto del problema.
g. Realiza un breve resumen de los hallazgos.
2. ¿Existe relación entre el peso de una persona y la medida de su cintura en centímetros?
Selecciona 10 personas del género masculino y 10 personas del género femenino y
pídeles que te den su peso en kilogramos y la medida de su cintura en centímetros.
Posteriormente denomina a la variable peso como (Y) y a la medida de la cintura como (X)
y contesta lo siguiente:
a. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables.
¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor medida
de la cintura es mayor el peso?
b. Calcula la recta de regresión de mínimos cuadrados.
c. ¿Existe evidencia que indique que a mayor medida de la cintura es mayor el peso?
Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01.
¿Es significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis.
Concluye en el contexto del problema.
d. Pronostica el peso si las medidas de cintura son de 66, 80 y 86 centímetros.
e. Calcula el coeficiente de correlación.
f. Determina e interpreta el coeficiente de determinación en el contexto del problema.
g. Realiza un breve resumen de los hallazgos.
3. Busca información de 20 casas en venta en donde las variables son: Y (metros de
construcción) y X (metros de terreno); y realiza lo que se te indica.
Contesta lo siguiente:
a. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables.
b. ¿Qué clase de relación crees que existe entre estas dos variables?
c. Calcula la recta de regresión de mínimos cuadrados.
d. Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01.
e. ¿Es significativa esta regresión? Explica. Concluye en el contexto del problema.
Realiza todas las etapas de una prueba de hipótesis.
f. Pronostica los metros de construcción cuando los metros de terreno son de 90, 100 y
150 metros.
g. Calcula el coeficiente de correlación.
Maestros Online www.maestronline.com
h. Determina e interpreta el coeficiente de determinación en el contexto del problema.
i. Realiza un breve resumen de los hallazgos.
4. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco
de México y realiza lo que se indica,
a. Considera las últimas 12 cotizaciones de la TIIE
b. Determina el coeficiente de autocorrelación
c. Determina la prueba la hipótesis de que:
Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)
Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero).
Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k.
5. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco
de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se indica,
a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en 4to
periodo, por medio de un promedio móvil de k= 3 meses.
b. Determina el valor de pronóstico para el rendimiento del bono para cada mes,
comenzando en el periodo 6, mediante un promedio móvil de k=5 meses.
c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α = 0.2 y un
valor inicial igual a la primera lectura del TIIE 28 DÍAS.
d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media (DAM),
Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio (EPAM) y Error
Porcentual Medio (EPM).
e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica.
Parte 1
1. Entrevista a 25 personas y obtén los siguientes datos:
1. Y: Peso en kg
2. X1: Estatura en cm
3. X2: Cintura en cm
4. X3: Medida de los bíceps en cm
2. Utiliza Excel o cualquier otro paquete estadístico como Minitab y establece la ecuación de
regresión múltiple ajustada.
Parte 2a
3. Reúnanse en equipos (Skype, Google Docs, chat, foto, etc.).
4. Interpreten los coeficientes de la ecuación de regresión lineal múltiple.
5. Calculen el error estándar de estimación.
6. Establezcan los intervalos de confianza para los parámetros poblacionales β1, β2 y β3.
Utilicen α = 0.05.
Maestros Online www.maestronline.com
Parte 2b
Cantidad de
alimento, g
X
Colesterol,
mg
Y
Cantidad de
alimento, g
X
Colesterol,
mg
Y
10 313 33 677
15 370 35 151
18 424 36 280
19 356 37 245
20 310 39 396
21 349 42 278
21 365 45 297
24 245 54 224
25 373 56 346
27 395 56 141
28 156 59 139
30 243 59 424
30 150 60 316
31 463 64 379
a. Estimen la ecuación de regresión.
b. Calculen las predicciones para los siguientes valores de X0: 11, 12, 15, 25, 30,
35.5, 39, 45, 60, 70, 80, 90.
c. Obtengan los intervalos de confianza al 99 para cada valor de Y para los
diferentes valores de X0.
d. Compartan sus resultados en el foro.
Parte 3
7. Para la ecuación de regresión múltiple (de la parte 2a) pronostiquen el peso con los
siguientes datos:
Estatura, cm Cintura, cm Bíceps, cm
165 79 17
160 80 19
180 75 18
175 85 21
159 90 22
8. Calculen e interpreten R2 en el contexto del problema.
9. Calculen R2ajustada.
Maestros Online www.maestronline.com
10. Manifiesten, a través del foro, sus conclusiones para este análisis sobre el ajuste de la
ecuación y también sobre las contribuciones de las variables independientes.
Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y
fundamentada.
Entregable(s): Resultado de ejercicio y problema.
1. En un experimento con conejos se tomaron en cuenta las siguientes variables:
Y: Proporción del peso final al peso inicial.
X: Gramos diarios de alimento por kg de peso inicial.
Proporción de Peso
final al
peso inicial
Y
Gramos diarios
de alimento por kg de
peso inicial
X
Proporción de peso
final al
peso inicial
Y
Gramos diarios de alimento
por kg de peso
inicial
X
0.91 10 1.16 33
0.88 15 0.96 35
0.90 18 1.08 36
0.79 19 1.13 37
0.94 20 1.00 39
0.88 21 1.10 42
0.95 21 1.11 45
0.97 24 1.18 54
0.88 25 1.26 56
1.01 27 1.29 56
0.95 28 1.36 59
0.95 30 1.40 59
1.05 30 1.32 60
1.05 31 1.47 64
a. Realiza un diagrama de dispersión de los datos para Y contra X.
b. Calcula las rectas de mínimos cuadrados para Y contra X.
c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas de la prueba
de hipótesis (α = 0.01).
d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25, 30, 35.5, 39,
45, 60, 70, 80, 90.
e. Calcula el intervalo de confianza de los valores particulares de Y para los valores
dados de X0 del inciso anterior.
Ejercicio 1
Maestros Online www.maestronline.com
1. Una empresa ha estado buscando los factores que influyen en la cantidad de acero (en
millones de toneladas) que puede vender cada año. La administración sospecha que los
siguientes son los factores principales: la tasa anual de inflación del país, el precio
promedio por tonelada de acero importado que acota los precios (en dólares) y el número
de automóviles (en millones) que los fabricantes de autos planean producir ese año. Se
recolectaron los datos de los últimos siete años:
Millones
de tons.
vendidas
Y
Tasa de inflación
X1
Cota de
importaciones
X2
Número de
automóviles
(millones)
X3
4.2 3.1 3.10 6.2
3.1 3.9 5.00 5.1
4.0 7.5 2.20 5.7
4.7 10.7 4.50 7.1
4.3 15.5 4.35 6.5
3.7 13.0 2.60 6.1
3.5 11.0 3.05 5.9
a. Estima la ecuación de regresión múltiple.
b. Interpreta los coeficientes de regresión estimados.
Ejercicio 2
2. Se llevó a cabo un conjunto de ensayos experimentales para determinar una forma de
predecir el tiempo de cocimiento en minutos (Y) a varios niveles de amplitud del horno,
pies (X1) y temperatura de cocción, grados Celsius (X2). Los datos obtenidos fueron
registrados como se muestra a continuación:
Tiempo de
Cocimiento
Y
Niveles de amplitud
del horno, pies
X1
Temperatura
en grados C
X2
6.40 1.32 1.15
15.05 2.69 3.40
18.75 3.56 4.10
30.25 4.41 8.75
44.85 5.35 14.82
48.94 6.20 15.15
51.55 7.12 15.32
61.50 8.87 18.18
100.44 9.80 35.19
111.42 10.65 40.40
Maestros Online www.maestronline.com
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Pronostica el tiempo de cocimiento cuando el nivel de amplitud del horno es de 5 pies
y la temperatura de cocción es de 20 grados Celsius.
Ejercicio 3
3. El supervisor de una empresa está examinando la relación existente entre la calificación
que obtiene un empleado en una prueba de aptitud, su experiencia previa y el éxito en el
trabajo. Se estudia y se pondera la experiencia de un empleado en trabajos anteriores y
se obtiene una calificación entre 2 y 12. La medida del éxito en el empleo se basa en un
sistema de puntuación que incluye producción total y eficiencia, con valor máximo posible
de 50. El supervisor tomó una muestra de seis empleados con menos de un año de
antigüedad y obtuvo lo siguiente:
Y
Evaluación del
desempeño
X1
Resultado de la
prueba de aptitud
X2
Experiencia en
trabajos anteriores
(años)
28 74 5
33 87 11
21 69 4
40 93 9
38 71 7
46 97 10
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una experiencia en
trabajos anteriores de 7 años ¿qué evaluación de desempeño puede esperar?
Ejercicio 4
4. Se tomó una muestra de 20 automóviles con relación al número de kilómetros por litro (Y),
caballos de fuerza X1 y peso total en kg X2.
Kilómetros por litro,
Y
Caballos de
fuerza, X1 Peso en kg X2
19 67 1844
19 50 1998
17 62 1752
16 69 1980
16 66 1797
15 63 2199
15 90 2404
Maestros Online www.maestronline.com
14 99 2611
13 63 3236
12 91 2606
11 94 2580
11 88 2507
11 124 2922
10 97 2434
9 114 3248
9 102 2812
8 114 3382
8 142 3197
7 153 4380
7 139 4036
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Si un vehículo tiene 92 caballos de fuerza y un peso de 1750 kg ¿cuál será el número
de kilómetros por litro que se esperaría?
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Parte 1
1. Reúnanse en equipos (usen Skype, Google Docs, chats, foro, etc.) y revisen la siguiente
información nutricional, de las ensaladas.Enseguida se presentan las siguientes variables
que se registraron en diferentes tipos de ensaladas. Las variables son
a. Y: Calorías
b. X1: Grasa (g)
c. X2:Carbohidratos (g)
d. X3: Proteínas (g)
Ensalada
(porciones
de 100 g)
Grasa (g) Carbohidratos (g) Proteínas (g) Calorías
Y
César 14.7 6.52 5.03 170
Atún 11.02 6.96 14.27 184
Atún con Queso 14.72 6.87 14.44 217
Atún con huevo 12.93 6.96 13.71 196
Macarrones o pasta 10.63 22.98 3.76 202
Macarrones u otra pasta con pollo 13.34 15.00 10.11 221
Macarrones u otra pasta con atún 9.14 19.49 7.07 18.9
Ensalada de huevo 30.26 1.93 9.20 318
Ensalada de papas 8.20 11.17 2.68 143
Ensalada de papas con huevo 7.05 15.96 2.77 136
Maestros Online www.maestronline.com
Ensalada de papas estilo alemán 1.24 16.66 2.52 88
Información obtenida de:
http://www.fatsecret.cl Solo para fines educativos
2. Estos datos se deben ingresar a Excel o Minitab.
3. Estimen e interpreten en el contexto del problema los coeficientes de la ecuación de
regresión múltiple.
4. Prueben la significancia del modelo de regresión múltiple; realicen todas las etapas de una
prueba de hipótesis.
Parte 2
5. Prueben la significancia de los coeficientes de regresión individuales. Realicen todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
6. Calculen e interpreten R2 en el contexto del problema.
7. Calculen el error estándar de estimación.
Parte 3
8. Estimen la cantidad promedio de calorías cuando el contenido de grasa es de 50 g, la
cantidad de carbohidratos es de 10 g y la cantidad de proteínas es de 8 g.
9. Calculen R2ajustada.
10. Construyan un intervalo de confianza para las pendientes de la población (β1, β2 y β3).
11. Compartan sus resultados en el foro.
Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y
fundamentada.
Ejercicio 1
1. La energía eléctrica consumida (Y) cada mes por una planta química se considera
relacionada con la temperatura ambiente promedio, grados Fahrenheit (X1), número de
días al mes (X2), la pureza promedio del producto, en porciento (X3) y las toneladas
obtenidas del producto (X4). Haz clic aquí para revisarlos.
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las
etapas de una prueba de hipótesis.
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
Maestros Online www.maestronline.com
g. Pronostica la energía eléctrica consumida (Y) cuando la temperatura ambiente
promedio (X1) es de 30, el número de días al mes (X2) es de 25 grados Fahrenheit, la
pureza promedio del producto, en porciento (X3), es de 92 y las toneladas obtenidas
del producto (X4) es de 95.
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población β1, β2, β3 y β4.
Ejercicio 2
1. Un negocio de ventas por catálogo de computadoras
personales, software y hardware mantiene un almacén centralizado para la distribución de
los productos ordenados. La administración examina el proceso de distribución y está
interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una
pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos
de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y el
número de órdenes recibidas (X2). Haz clic aquí para ver los resultados.
Con base en los resultados obtenidos:
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.
b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las
etapas de una prueba de hipótesis.
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las
ventas son de 400,000 dólares y el número de órdenes es de 4500.
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población ( β1 y β2).
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
En equipos de dos, realicen los siguientes ejercicios:
Ejercicio 1
1. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas
como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia
ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se
recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad.
Tiempo Ventas
Maestros Online www.maestronline.com
Semanas
(X)
(miles de dólares)
(Y)
1 4618
2 3741
3 5836
4 4367
5 5118
6 8887
7 19746
8 34215
9 50306
10 65717
11 86434
12 105464
a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.
b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
c. ¿Estás satisfecho con el modelo como pronosticador de ventas (Y)? Explica. Realiza
todas las etapas de una prueba de hipótesis con α = 0.05.
d. Transforma la variable independiente (X2) y ahora corre de nuevo el modelo con X y
X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los
datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05.
e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
Compáralo con el obtenido en el inciso b ¿Cuál modelo prefieres? ¿Por qué?
Ejercicio 2
2. Un editor de libros de texto universitarios realizó un estudio para relacionar la ganancia
por libro (Y) con el costo de venta (X) para un periodo de seis años. Se obtuvieron los
siguientes datos (en miles de dólares, ajustados por la inflación):
Utilidad por libro dólares,
(Y)
16.5 22.4 24.9 28.8 31.5 35.8
Costo de venta por libro en dólares, (X) 5.0 5.6 6.1 6.8 7.4 8.6
a. Ajusta un modelo cuadrático.
b. ¿Proporcionan los datos suficiente evidencia para indicar una curvatura entre (Y) y
(X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.
c. Encuentra el coeficiente de determinación en la salida de Excel e interpreta su valor
en el contexto del problema.
d. Utiliza la ecuación de predicción para estimar la utilidad media del libro cuando el
costo de venta por libro es de 6500 (expresa dicho costo en miles de dólares antes de
sustituirlo en la ecuación).
Maestros Online www.maestronline.com
Ejercicio 3
3. Un agrónomo está interesado en la producción de algodón recopilada en los siguientes
datos referentes al número de bellotas por planta durante la estación de crecimiento. Aquí
Y es la media del número de bellotas por planta y X es el tiempo medido en semanas.
Y, bellotas 110 470 1040 1100 1000 820
X, semanas 1 4 7 9 12 15
a. Utiliza Excel o cualquier otro paquete estadístico como Minitab para obtener un
diagrama de dispersión.
b. Ajusta un modelo cuadrático, es decir X y X2. ¿Proporcionan los datos suficiente
evidencia para indicar una curvatura entre el número de bellotas (Y) y el tiempo en
semanas (X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.
c. Encuentra el coeficiente de determinación en la salida del software que elegiste e
interpreta su valor en el contexto del problema.
d. Utiliza la ecuación de predicción para estimar el número de bellotas cuando el número
de semanas es de 8, 10 y 14.
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Ejercicio 1
1. Si el coeficiente de determinación entre dos variables independientes es 0.20, ¿cuál es el
valor del Factor de Inflación de Varianza VIF?
2. Si el coeficiente de determinación entre dos variables independientes es 0.50, ¿cuál es el
valor del Factor de Inflación de Varianza VIF?
3. Un negocio de ventas por catálogo de computadoras
personales, software y hardware mantiene un almacén centralizado para la distribución de
los productos ordenados. La administración examina el proceso de distribución y está
interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una
pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos
de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y el
número de órdenes recibidas (X2). Haz clic aquí para ver los resultados.
a. Realiza una regresión múltiple y determina el VIF para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Ejercicio 2
Maestros Online www.maestronline.com
4. Una organización de consumidores desea desarrollar un modelo para predecir el
rendimiento de gasolina de automóvil, medido en cantidad de millas recorridas [millas por
galón (mpg)] de acuerdo a los caballos de fuerza del motor y el peso del auto Kg. Se
seleccionó una muestra de 50 modelos. Haz clic aquí para ver los resultados.
a. Realiza un modelo de regresión lineal múltiple.
b. Determina el Factor de Inflación de Varianza VIF para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Ejercicio 3
5. El director de operaciones de transmisión de una estación de televisión desea estudiar el
aspecto de las “horas de espera” en la que los artistas gráficos sindicalizados se les paga
por no realizar actividades. Las variables a considerar son:
a. Horas de espera (Y): número total de horas por semana.
b. Personal presente total (X1): total semanal de días-persona los 7 días a la semana.
c. Horas remotas (X2): número total de horas trabajadas por empleados fuera de la
planta central.
d. Haz clic aquí para ver los resultados de un periodo de 26 semanas.
e. Ajusta un modelo de regresión lineal múltiple.
f. Determina el Factor de Inflación de Varianza VIF para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
1. Revisa la siguiente información tomada de la sección de avisos de ocasión.
2. Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo siguiente:
a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de
regresión lineal múltiple.
b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las
etapas de una prueba de hipótesis.
c. Pronostica el precio para los siguientes datos.
Metros de
terreno
(X1)
Metros de
construcción
(X2)
Número de
recámaras
(X3)
180 390 4
200 250 3
230 200 4
250 180 2
100 120 3
Maestros Online www.maestronline.com
3. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las
etapas de una prueba de hipótesis para cada uno de los coeficientes.
4. Calcula el error estándar de estimación.
5. Construye un intervalo de confianza para las pendientes de la población ( β1, β2 y β3).
6. Calcula e interpreta R2 en el contexto del problema.
7. Calcula R2ajustada.
8. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el
modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?
9. Finalmente prepara un documento presentando un resumen de tus hallazgos.