modelos de pronosticos primer semestre 2010 modelo de regresión con dos variables
Post on 25-Jan-2016
217 Views
Preview:
TRANSCRIPT
MODELOS DE PRONOSTICOS
Primer semestre 2010
Modelo de Regresión con dos variables
En la práctica es frecuente encontrar una relación entre 2 variables.
Por ejemplo, el consumo (o gasto) de una familia y su ingreso.
O el salario de una persona y los años de instrucción.
Se dice que una variable depende de la otra.
Introducción
Introducción
Por ejemplo, el consumo (o gasto) de una familia va a depender de su ingreso.
El salario de una persona depende de los años de instrucción.
Debido a esto a una se le llama variable dependiente y a la otra variable independiente.
Análisis de regresión
La variable dependiente es la variable que se desea explicar o predecir y se le designa por Y.
La variable independiente es la variable explicativa y se designa por X.
El análisis de regresión se relaciona con la estimación y/o predicción de la media (poblacional) o valor promedio de la variable dependiente, con base en los valores conocidos o fijos de la variable explicativa.
Análisis de regresión
Ejemplo: Los datos siguientes se refieren a una población total de 60 familias de una comunidad hipotética, así como a su ingreso semanal (X) y a su gasto de consumo semanal (Y) en dólares.
Las 60 familias se dividen en 10 grupos de ingresos (de $80 a $260).
Luego, se tienen 10 valores fijos de X y los correspondientes valores Y para cada uno de los valores X, así que hay 10 subpoblaciones Y.
Análisis de regresión
Análisis de regresión Se observa una variación considerable en el
gasto de consumo semanal para cada uno de los grupos de ingreso.
Sin embargo, a pesar de la variabilidad del gasto de consumo semanal para cada ingreso considerado en promedio el consumo semanal se incrementa en la misma medida que el ingreso.
Como se ve en la figura siguiente.
Análisis de regresión
Análisis de regresión A estos valores medios los conocemos como
valores esperados condicionales, ya que dependen de los valores dados a la variable (condicional) X.
Se denotarán E(Y/X) lo cual se lee como el valor esperado de Y dado el valor de X.
Se deben distinguir dichos valores condicionales esperados del valor esperado incondicional del gasto de consumo semanal E(Y) que se obtiene sumando los gastos de consumo semanales de las 60 familias dividido por 60.
Análisis de regresión Al unir los valores de las medias condicionales se
obtiene lo que se conoce como la recta de regresión poblacional o de una manera más general la curva de regresión poblacional.
Con palabras más sencillas es la regresión de Y sobre X.
La figura siguiente muestra que para cada X (el nivel de ingresos) existe una población de valores Y (gastos de consumo semanal) que se dispersan alrededor de la media (condicional) de dichos valores Y.
Análisis de regresión
Análisis de regresión
Por simplicidad, se supone que tales valores Y están distribuidos simétricamente alrededor de sus respectivos valores medios (condicionales).
Es claro que la media condicional E(Y/Xi) es función de Xi
Como una primera aproximación supondremos que es lineal (función de regresión poblacional lineal)
ii XXYE 21)/(
)()/( ii XfXYE
f
Análisis de regresión
Donde y son parámetros no conocidos pero fijos que se denominan coeficientes de regresión.
Es claro que a medida que el ingreso familiar aumenta en promedio el consumo familiar también aumenta.
Pero para una familia individual esto no es necesariamente cierto.
21
iii uXY 21 iii uXYEY )/(
Análisis de regresión
Donde es el término de error estocástico o perturbación estocástica.
Representa todas las variables ignoradas que puedan afectar a Y pero que no están incluidas en el modelo de regresión.
Por motivos de vaguedad de teoría, no disponibilidad de información de las variables, por consideraciones de costo, por aleatoriedad intrínseca del comportamiento humano, por ppio. de parsimonia (modelo más sencillo posible), etc.
Se espera que el efecto combinado pueda ser tratado como una variable aleatoria.
iu
Análisis de regresión
Luego, el gasto de una familia individual tiene 2 componentes:
1. Un componente determinístico o sistemático
2. Un componente aleatorio o no sistemático
)/( iXYE
iu
Análisis de regresión
Así, el supuesto de que la recta de regresión pasa a través de las medias condicionales de Y implica que las medias condicionales de son cero.
Luego, si
iu
iii uXYEY )/(
)/()/()/( iiiii XuEXYEEXYE
0)/()/()/()/( iiiiiii XuEXuEXYEXYE
ii XXYE 21)/( iii uXY 21
0)/( ii XuE
Análisis de regresión En la práctica se tiene una muestra de valores de Y
que corresponden a algunos valores fijos de X.
El problema es estimar la función de regresión poblacional con base en información muestral.
Supóngase que se tiene una muestra de valores de Y seleccionados aleatoriamente para valores dados de X.
Ahora se tiene un solo valor de Y correspondiente a los valores de X.
Cada Y es seleccionada aleatoriamente de Y “similares” correspondiente a las mismas X.
Análisis de regresión ¿Se puede estimar la forma
de la FRP a partir de la información muestral?
La precisión varía respecto a las fluctuaciones muestrales.
Y X
70 80
65 100
90 120
95 140
110 160
115 180
120 200
140 220
155 240
150 260
Esto se aprecia considerando otra muestra de la población estudiada
Y X
55 80
88 100
90 120
80 140
118 160
120 180
145 200
135 220
145 240
175 260
Análisis de regresión
Revisando las rectas de regresión para cada muestra, cabe la pregunta cual es la verdadera, y evidente habrá N rectas de regresión para N muestras distintas.
Análisis de regresión Al igual que la FRP se establece la FRM
Para la FRM se define entonces
Al igual que la FRP, la FRM tiene su forma estocástica:
22
11
21
:ˆ
:ˆ
/:ˆ
ˆˆˆ
deestimador
deestimador
XYEdeestimadorY
XY
ii
ii
iii uXY ˆˆˆ21
Análisis de regresión
es el término residual (muestral).
Es una estimación de
El objetivo principal en el análisis de regresión es estimar la FRP
con base en la FRM
Luego la FRM es una aproximación de FRP
iu
iu
iii uXY ˆˆˆ21
iii uXY ·21
iii uYY ˆˆ
Análisis de regresión
iii uYY ˆˆ
top related