apuntes de econometría i (primera parte) jorge salgado
DESCRIPTION
Apuntes de Econometría IJorge SalgadoPUCETRANSCRIPT
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
PRINCIPIOS ECONOMÉTRICOS:
1.- Análisis de regresión con dos variables:
Supongamos una comunidad hipotética con una población total de 60 familias con sus ingresos (X)
y sus gastos en consumo (Y) semanales.
Cabe advertir que se analizará la propensión marginal de consumo (PMC), desarrollado por el
economista John Maynard Keynes1 en el año de 1935.
Condiciones: Se va a construir un marco hipotético con 10 valores fijos de X y 10
“subpoblaciones” de Y.
Ingreso Familiar (X)
80 100 120 140 160 180 200 220 240 260
Consumo Familiar (Y)
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 112 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 189 185
115 110 162 191
TOTAL 325 462 445 707 678 750 685 1043 966 1211
MEDIA CONDICIONAL 65 77 89 101 113 125 137 144 161 173
1 John Maynard Keynes (1883-1946), economista británico. Dio lugar a una nueva escuela de pensamiento económico
denominada keynesianismo o “nueva ciencia económica”, estas influyeron de forma determinante en el diseño de las políticas económicas de muchos países desde la finalización de la II Guerra Mundial dando lugar a los sistemas de desarrollo.
X
Re
gr
esi
ón
Po
bl
aci
on
al
Curva de Regresión Poblacional
Y
Ingreso Semanal
Co
nsu
mo
Sem
anal
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
1.1.-El valor esperado condicional e incondicional:
Para comprender las diferencias entre las categorías, vamos a relazar una contrastación utilizando
la tabla anterior.
Valor esperado Incondicional
E (Y) = 7272
60= 121,20
Valor esperado condicional
E (Y/X = 140) = 707
7= 101
Por lo tanto, el valor esperado incondicional y condicional son respuestas a diferentes preguntas.
En el caso de la media incondicional (en donde no existen condiciones) se formula la
pregunta:
¿Cuál es el valor esperado del consumo de una familia? En donde, se hace alusión
cualquier familia.
Por otro lado la media condicional formula la pregunta:
¿Cuál es el valor esperado de consumo de una familia cuyo ingreso semanal es de
$ 140?
-En el gráfico anterior la recta representa los valores promedio de las observaciones.
-Los promedios también son conocidos como los valores esperados condicionales.
-La expectativa (esperanza de Y condicionada a X) se simboliza como: E (X/Y)
- E (X\Y), en nuestro ejemplo se trata del promedio del consumo con respecto al
ingreso.
-Se concluye de forma sencilla que a medida que el ingreso semanal aumenta el
consumo aumenta.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
2.-Función de Regresión Poblacional:
De lo presentado anteriormente se deduce que cada media condicional E (Y/Xi) es función de Xi.
E (Y/Xi) = f (Xi)
Esta ecuación señala que los valores esperados de la distribución de Y, están relacionados
funcionalmente con X.
Ahora vamos a suponer el gasto está linealmente relacionado con el ingreso.
E (Y/Xi) = β1 + β2Xi
En donde β1 y β2 son parámetros no conocidos, denominados coeficientes de regresión,
cuya estimación es el interés del análisis de regresión. La ecuación anterior es la función de
regresión lineal poblacional.
Finalmente es necesario resaltar que el criterio clave que subyace en el análisis de regresión es el
de función de regresión poblacional (FRP). Así, el objetivo del análisis de regresión es averiguar la
forma en que el valor promedio de la variable dependiente (regresada) varía de acuerdo con el
valor dado de la variable explicativa (regresora).
2.1-Significado del término lineal:
La interpretación matemática del término lineal, puede ser desarrollada por medio de dos vías.
a) Linealidad en las variables: Se dice que una función E (Y/Xi) = f (x) es lineal en las
variables si estas aparecen elevadas a una potencia uno y no están multiplicadas
ni dividas por ninguna variable. En el contexto de las matemáticas puras se dice
que la incógnita es el elemento de la ecuación elevada a una potencia.
b) Linealidad en los parámetros: Se dice que una función E (Y/Xi) = f (x) es lineal en
los parámetros se estos aparecen elevados a una potencia y no están
multiplicados ni divididos por ningún otro parámetro.
Ejemplos:
𝐸(𝑌/𝑋𝑖) = 𝛽1 + 𝛽2𝑋𝑖
𝐸(𝑌/𝑋𝑖) = 𝛽1 + 𝛽2𝑋𝑖2
𝐸(𝑌/𝑋𝑖) = 𝛽1 + 𝛽21/2
𝑋𝑖
- Lineal en las variables. - Lineal en los parámetros.
- No lineal en las variables. - Lineal en los parámetros.
- Lineal en las variables. - No lineal en los parámetros.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 4
𝐸(𝑌/𝑋𝑖) = 𝛽1 + 𝛽2𝑋𝑖−1
𝐸(𝑌/𝑋𝑖) = 𝛽1−1 + 𝛽2𝑋𝑖
𝐸(𝑌/𝑋𝑖) = 𝛽1
𝛽2+ 𝛽2
𝑋𝑖
𝑍𝑖
- Para nuestro propósito, la segunda interpretación (linealidad en los parámetros) es la que será
utilizada en el desarrollo de la materia.
- En una regresión lineal debemos fijarnos en los parámetros.
3.-Especificación Estocástica de la FRP:
Se ha demostrado que a medida que el ingreso familiar aumenta, el gasto de consumo familiar en
promedio también aumenta. Sin embargo, el gasto en consumo de una familia individual no
necesariamente aumenta a medida que el nivel de ingreso es mayor.
Perturbación estocástica, variables que afectan al consumo pero no es el ingreso.
- No lineal en las variables. - Lineal en los parámetros.
- Lineal en las variables. - No lineal en los parámetros.
- No lineal en las variables. - No lineal en los parámetros.
X1 X2 X3 X4 X5 X6 X7
X1 X2 X3 X4 X5 X6 X7
Analizamos un cambio latitudinal
Son considerados otros patrones
de consumo a la religión, la
situación geográfica entre otros.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 5
-Es importante recordar que la sumatoria de las desviaciones con respecto a la media es igual a
cero. En el siguiente ejemplo se examina la premisa anterior:
Y1 75
U1 Y2 70
+
U2
Y3 65 - E(Y/Xi)
U3
Y4 60
-
U4
Y5 55
U5
Así 𝑢𝑖 = 𝑌𝑖 − 𝐸 𝑌/𝑋𝑖 , donde 𝑢𝑖 es una variable aleatoria que se denomina perturbación
estocástica que en términos estadísticos son desviaciones con respecto a la media; que sustituye o
representa a las variables omitidas o ignoradas que pueden afectar a Y por que no están incluidas
en el modelo de regresión.
𝑌𝑖 = 𝐸 𝑌/𝑋𝑖 + 𝑢𝑖
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
Con el modelo anterior se puede determinar a las sesenta familias del ejercicio empírico
presentado inicialmente.
La ecuación plantea que el gasto de consumo de una familia está relacionado linealmente con sus
ingresos más el término de perturbación estocástica que puede ser positivo (+) o negativo (-).
X1 X2 X3 X4 X5 X6 X7
En el siguiente
gráfico se muestra
a 𝜷𝟏 .
𝜷𝟏
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 6
4.-Propiedades del Operador Expectativa:
1.-La expectativa de una constante es la constante.
El promedio de una constante es la constante.
𝐸 𝒷 = 𝒷
2.-Cuando tenemos la expectativa 𝐸 𝑌/𝑋𝑖 queremos decir:
𝐸 𝑌𝑖/𝑋𝑖
∴
𝐸 𝒷𝑌 =𝒷 ∗ 𝐸 𝑌 = 𝒷 ∗ 𝐸 𝑌
𝑋𝑖
= 𝒷 ∗ 𝐸 𝑌𝑖/𝑋𝑖
𝐸 𝒷𝑌 + 𝑎 = 𝐸 𝑎 + 𝐸 𝒷𝑌
= 𝑎 + 𝒷 ∗ 𝐸 𝑌
= 𝑎 + 𝒷 ∗ 𝐸 𝑌
𝑋𝑖
= 𝑎 + 𝒷 ∗ 𝐸 𝑌𝑖/𝑋𝑖
Si tenemos el valor esperado de la ecuación anterior:
𝑌𝑖 = 𝐸 𝑌/𝑋𝑖 + 𝑢𝑖
𝐸(𝑌𝑖) = 𝐸 𝐸 𝑌/𝑋𝑖 + 𝑢𝑖
𝐸(𝑌𝑖) = 𝐸 𝐸 𝑌/𝑋𝑖 + 𝐸 𝑢𝑖
𝐸(𝑌𝑖) = 𝐸 𝐸 𝑌/𝑋𝑖 + 𝐸 𝑢𝑖
𝑋𝑖
𝐸 𝑢𝑖
𝑋𝑖
= 0
Recordando que las expectativa de una constante es una constante.
Por un lado, el promedio de las perturbaciones estocásticas es igual a cero porque son
desviaciones con respecto a la media; pero por otro lado lo anterior implica que la recta de
regresión pasa a través de las medias condicionales de Y.
5.-Función de Regresión Muestral:
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 7
Cambiando de perspectiva de valores poblacionales vayamos a considerar valores muestrales que
es el problema de análisis de la regresión lineal.
En el ejemplo el número de muestras que disponemos es:
La combinación de las 60 familias, de donde podemos escoger uno de cada grupo.
𝐶60,10 =60!
10! 50! = 7,539402757 * 10 10 muestras.
De las cuales seleccionamos dos:
Muestra 1 Muestra 2
Y X Y X
70 80 55 80
65 100 88 100
90 120 90 120
95 140 80 140
110 160 118 160
115 180 120 180
120 200 145 200
140 220 135 220
155 240 145 240
150 260 175 260
Primera Muestra
Segunda Muestra
Regresión basada en la
segunda muestra
Regresión basada en la
primera muestra
FRM1
FRM2
En general las rectas de regresión
muestral, son aproximaciones a la
recta poblacional
Gas
to e
n C
on
sum
o S
eman
al $
Ingreso Semanal $
Regresión basada en la
primera muestra
En general las rectas de regresión
muestral, son aproximaciones a la
recta poblacional
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 8
De manera similar a la función de regresión poblacional (FRP), es posible definir a la función de
regresión muestral(FRM), para representar la recta de regresión muestral.
𝑌𝑖 = 𝛽 1 + 𝛽 2𝑋𝑖 + 𝑢 𝑖
Donde 𝑌𝑖 = 𝛽 1 + 𝛽 2𝑋𝑖 , y representa a un punto de la recta de regresión muestral.
Así un estimador es la aproximación al parámetro poblacional a partir de la información de la
muestra que se tiene a la mano,
𝑌𝑖 = 𝑌𝑖 + 𝑢 𝑖
𝑢 𝑖 = 𝑌𝑖 − 𝑌𝑖
Ecuación que en términos de la FRP son:
𝑌𝑖 = 𝐸(𝑌/𝑋𝑖) + 𝑢𝑖 𝑢𝑖 = 𝑌𝑖 − 𝐸(𝑌𝑖/𝑋𝑖)
𝑌𝑖 = Estimador del promedio 𝐸 𝑌/𝑋𝑖
𝛽 1= Estimador de la intersección 𝛽1
𝛽 2= Estimador de la pendiente 𝛽2
𝑢 𝑖= Estimador de 𝑢𝑖(residuos)
FRM
FRP
Gas
to e
n C
on
sum
o S
eman
al $
Ingreso Semanal $
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 9
MODELO DE REGRESIÓN CON DOS VARAIBLES: PROBLEMA DE ESTIMACIÓN
La primera tarea consiste en estimar la función de regresión poblacional (FRP) con fundamento en
la función de regresión muestral(FRM) de la manera más precisa posible. Hay dos métodos de
estimación:
1) Los mínimos cuadrados ordinarios (MCO).
2) La máxima verosimilitud (MV).
Se estudiará el primer método.
Mínimos Cuadrados Ordinarios:
Se le atribuye a Carl Friedrich Gauss2, cuyo principio es el de minimizar la sumatoria de los residuos
al cuadrado.
𝑢 𝑖2 = 𝑌𝑖 − 𝑌 𝑖
2= 𝑌𝑖 − 𝛽 1 − 𝛽 2𝑋𝑖
2
Considerando como incógnitas a 𝛽 1 ,𝛽 2
𝜕 𝑢 𝑖2
𝜕𝛽 1= 2 (𝑌𝑖 − 𝛽 1 − 𝛽 2𝑋𝑖) −1 = 0
(𝑌𝑖 − 𝛽 1 − 𝛽 2𝑋𝑖) = 0
𝑌𝑖 − 𝑛𝛽 1 − 𝛽 2 𝑋𝑖 = 0
𝑌𝑖 = 𝑛𝛽 1 + 𝛽 2 𝑋𝑖 = 𝑃𝑅𝐼𝑀𝐸𝑅𝐴 𝐸𝐶𝑈𝐴𝐶𝐼Ó𝑁 𝑁𝑂𝑅𝑀𝐴𝐿
𝜕 𝑢 𝑖2
𝜕𝛽 2= 2 (𝑌𝑖 − 𝛽 1 − 𝛽 2𝑋𝑖) −𝑋𝑖 = 0
2 Carl Friedrich Gauss (1777-1855), matemático alemán conocido por sus muy diversas contribuciones a la
astronomía, las matemáticas y la física, especialmente por sus estudios del electromagnetismo. En el caso econométrico cobre relevancia por su aporte de la Curva Normal.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
0
(𝑌𝑖 − 𝛽 1 − 𝛽 2𝑋𝑖)(𝑋𝑖) = 0
𝑋𝑖𝑌𝑖 − 𝛽 1 𝑋𝑖 − 𝛽 2 𝑋𝑖2 = 0
𝑋𝑖𝑌𝑖 = 𝛽 1 𝑋𝑖 + 𝛽 2 𝑋𝑖2 = 𝑆𝐸𝐺𝑈𝑁𝐷𝐴 𝐸𝐶𝑈𝐴𝐶𝐼Ó𝑁 𝑁𝑂𝑅𝑀𝐴𝐿
Ahora multiplicando a la segunda ecuación normal por n y restando la primera ecuación
multiplicada por 𝑋𝑖 , resolvemos el sistema de ecuaciones. Adicionalmente, tenemos que tener
en consideración que 𝑋𝑖2 ≠ 𝑋𝑖
2.
𝑛 𝑋𝑖𝑌𝑖 = 𝑛𝛽 1 𝑋𝑖 + 𝑛𝛽 2 𝑋𝑖2
𝑋𝑖 𝑌𝑖 = 𝑛𝛽 1 𝑋𝑖 + 𝛽 2 𝑋𝑖 2
La resta nos da el siguiente resultado:
𝑛 𝑋𝑖𝑌𝑖 − 𝑋𝑖 𝑌𝑖 = 𝑛𝛽 2 𝑋𝑖2 −𝛽 2 𝑋𝑖
2
𝛽 2 𝑛 𝑋𝑖2 − 𝑋𝑖
2
= 𝑛 𝑋𝑖𝑌𝑖 − 𝑋𝑖 𝑌𝑖
𝛽 2 =𝑛 𝑋𝑖𝑌𝑖 − 𝑋𝑖 𝑌𝑖
𝑛 𝑋𝑖2 − 𝑋𝑖
2
Remplazando, obtenemos 𝛽 1:
𝛽 1 = 𝑋𝑖
2 𝑌𝑖 − 𝑋𝑖 𝑋𝑖𝑌𝑖
𝑛 𝑋𝑖2 − 𝑋𝑖
2
Se deben hacer los cálculos de los estimadores con el ejercicio de las muestras.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
1
Propiedades de las desviaciones con respecto a la media:
Notación:
𝑥𝑖 = 𝑋𝑖 − 𝑋 𝑦𝑖 = 𝑌𝑖 − 𝑌
1.- La sumatoria de las desviaciones con respecto a la media es igual a cero:
𝑥𝑖 = (𝑋𝑖 − 𝑋 ) = 𝑋𝑖 − 𝑛𝑋 = 𝑛𝑋 − 𝑛𝑋 = 0
𝑋 =1
𝑛 𝑋𝑖
𝑛𝑋 = 𝑋𝑖
2.-La varianza:
𝑥𝑖2 = 𝑋𝑖 − 𝑋 2 = 𝑋𝑖
2 − 2𝑋 𝑋𝑖 + 𝑋 2
= 𝑋𝑖2 − 2𝑋 𝑋𝑖 + 𝑛𝑋 2 2𝑋 𝑋𝑖 = 0
= 𝑋𝑖2 − 𝑛𝑋 2
3.-La covarianza:
𝑥𝑖 𝑦𝑖 = 𝑥𝑖 𝑌𝑖 − 𝑌
= 𝑥𝑖𝑌𝑖 − 𝑥𝑖𝑌
= 𝑥𝑖𝑌𝑖 − 𝑌 𝑥𝑖 𝑌 𝑥𝑖=0
𝑥𝑖 𝑦𝑖 = 𝑥𝑖𝑌𝑖
Si en 𝛽 2 se sustituyen los valores observados (mayúsculas) por las desviaciones con respecto a la
media (minúsculas), encontramos:
𝛽 2 =𝑛 𝑥𝑖𝑦𝑖 − 𝑥𝑖 𝑦𝑖
𝑛 𝑥𝑖2 − 𝑥𝑖
2
𝛽 2 =𝑛 𝑥𝑖𝑦𝑖 − 𝑥𝑖 𝑦𝑖
𝑛 𝑥𝑖2 − 𝑥𝑖
2
𝛽 2 =𝑛 𝑥𝑖𝑦𝑖
𝑛 𝑥𝑖2 =
𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
2
𝛽 2 = 𝑥𝑖𝑦𝑖 𝑥𝑖
2 = 𝑥𝑖𝑌𝑖
𝑋𝑖2 − 𝑛𝑋 𝑖
2 = 𝑋𝑖𝑦𝑖
𝑋𝑖2 − 𝑛𝑋 𝑖
2
Si en la primera ecuación normal dividimos para n, encontramos:
𝑌𝑖 = 𝑛𝛽 1 + 𝛽 2 𝑋𝑖 = 𝑃𝑅𝐼𝑀𝐸𝑅𝐴 𝐸𝐶𝑈𝐴𝐶𝐼Ó𝑁 𝑁𝑂𝑅𝑀𝐴𝐿
𝑌𝑖𝑛
= 𝛽 1 +𝛽 2 𝑋𝑖
𝑛
𝑌 = 𝛽 1 + 𝛽 2𝑋
𝛽 1 = 𝑌 − 𝛽 2𝑋
Propiedades de numéricas de los operadores de los Mínimos Cuadrados Ordinarios:
Son aquellas que se mantienen sin considerar la forma o la manera en que se generan los datos.
1.-Están expresados en términos de las cantidades observadas, por consiguiente pueden
ser fácilmente calculados.
2.-Son estimadores puntuales, es decir proporcionan un solo valor poblacional pertinente.
3.-Una vez obtenidos los estimadores la recta de regresión muestral puede graficarse
fácilmente.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
3
Propiedades de la recta de regresión muestral:
Nota:
Estos resultados son correctos cuando el modelo de regresión incluye la intersección 𝛽 1 , en el
caso de que sean excluidos estos resultados no se dan necesariamente. Sin embargo, hay c casos
en donde encontramos:
i) Pasa a través de las medias muetrales de Y y X.
𝑌 = 𝛽 1 + 𝛽 2𝑋
ii) La media de 𝑌 (𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎) es igual a la media de Y (observada).
𝑌 𝑖 = 𝛽 1 + 𝛽 2𝑋𝑖 𝛽 1 = 𝑌 − 𝛽 2𝑋
𝑌 𝑖 = 𝑌 − 𝛽 2𝑋 + 𝛽 2𝑋𝑖 = 𝑌 + 𝛽 2 𝑋𝑖 − 𝑋 = 𝑌 + 𝛽 2𝑋𝑖
𝑌 𝑖 = 𝑛𝑌 + 𝛽 2 𝑋𝑖 𝑋𝑖 = 0
𝑌 𝑖 = 𝑛𝑌
𝑌 𝑖𝑛
= 𝑌
𝑌 = 𝑌
Y
X
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
4
iii) La media de los residuos 𝑢 𝑖 es cero:
𝑢 𝑖2 = 𝑌𝑖 − 𝑌 𝑖
2= 𝑌𝑖 − 𝛽 1 + 𝛽 2𝑋𝑖
2
𝜕 𝑢 𝑖2
𝜕𝛽 1= 2 𝑌𝑖 − 𝛽 1 + 𝛽 2𝑋𝑖 −1 = 0
𝑌𝑖 − 𝛽 1 + 𝛽 2𝑋𝑖 = 𝑌𝑖 − 𝑌 𝑖 = 0
𝑢 𝑖 = 0
Nota:
“Cuando se realza una regresión con respecto a la media se parte del origen”.
iv) Los residuos 𝑢 𝑖 no están correlacionados con 𝑦 𝑖 𝑌𝑖 .
Con la ecuación obtenida anteriormente multiplicamos por 𝑢 𝑖 y aplicamos la sumatoria:
𝑦 𝑖𝑢 𝑖 = 𝛽 2𝑥𝑖𝑢 𝑖
𝑦 𝑖𝑢 𝑖 = 𝛽 2 𝑥𝑖𝑢 𝑖
𝑦 𝑖𝑢 𝑖 = 𝛽 2 𝑥𝑖 𝑦𝑖 − 𝛽 2𝑥𝑖
𝛽 2 = 𝑥𝑖𝑦𝑖
𝑥𝑖2 𝑥𝑖𝑦𝑖 = 𝛽 2 𝑥𝑖
2
𝑌𝑖 = 𝛽 1 + 𝛽 2𝑋𝑖 + 𝑢 𝑖
𝑌𝑖 − 𝑌 = 𝛽 2𝑋𝑖 − 𝛽 2𝑋 + 𝑢 𝑖
𝑦𝑖 = 𝛽 2 𝑋𝑖 − 𝑋 + 𝑢 𝑖
− 𝑌 = 𝛽 1 + 𝛽 2𝑋 . 𝑦𝑖 = 𝛽 2𝑥𝑖 + 𝑢 𝑖
𝑦 𝑖 = 𝛽 2𝑥𝑖
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
5
𝑦 𝑖𝑢 𝑖 = 0 = 𝑌𝑖𝑢 𝑖
𝑌 𝑖 𝑦 𝑢 𝑖 están correlacionados. Son dependientes.
𝐶𝑜𝑣 = 𝑌 𝑖 ,𝑢 𝑖 = 0
𝑌 𝑖 𝑦 𝑢 𝑖 no están correlacionados. Son independientes.
v) Los residuos 𝑢 𝑖 no están correlacionados con 𝑋𝑖 .
𝑢 𝑖2 = 𝑌𝑖 − 𝑌 𝑖
2= 𝑌𝑖 − 𝛽 1 + 𝛽 2𝑋𝑖
2
𝜕 𝑢 𝑖2
𝜕𝛽 2= 2 𝑌𝑖 − 𝛽 1 + 𝛽 2𝑋𝑖 −𝑋𝑖 = 0
𝑌 𝑖 𝑢 𝑖
𝐶𝑜𝑣 = 𝑌 𝑖 ,𝑢 𝑖 ≠0
𝑌 𝑖 𝑢 𝑖
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
6
𝑌𝑖 − 𝛽 1 + 𝛽 2𝑋𝑖 𝑋𝑖 = 0
𝑢 𝑖 𝑋𝑖 = 0
𝑌𝑖 − 𝑌 𝑖 𝑋𝑖 = 0
𝑢 𝑖 𝑦 𝑋𝑖 están correlacionados. Son dependientes.
𝐶𝑜𝑣 = 𝑌 𝑖 ,𝑢 𝑖 = 0
𝑢 𝑖 𝑦 𝑋𝑖 no están correlacionados. Son independientes.
Supuestos detrás de los Mínimos Cuadrados Ordinarios (MCO):
Son supuestos sobre la forma como se generan los datos, los cuales fijan las propiedades
estadísticas de los estimadores de los Mínimos Cuadrados Ordinarios (MCO).
Si el objetivo de la econometría sería estimar 𝛽1 y 𝛽2, solamente el método de los MCO sería
suficiente. Pero es necesario saber que cerca está 𝛽 1 de 𝛽1, 𝛽 2 de 𝛽2 y además se 𝑌 𝑖está cerca de
𝐶𝑜𝑣 = 𝑢 𝑖 ,𝑋𝑖 ≠0
𝑢 𝑖
𝑋𝑖
𝑢 𝑖 𝑋𝑖
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
7
𝐸(𝑌/𝑋𝑖), para poder hacer inferencia. Por tanto, el modelo clásico de regresión lineal plantea diez
supuesto.
Supuesto 1: El modelo de regresión es lineal en los parámetros.
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
Supuesto 2: Los valores de X son fijos en muestreo repetido, es decir se suponen no estocásticos.
Valores fijos en muestro repetido hace referencia a que mediante un valor de X se pueden escoger
varios valores diferentes de Y en diferente s muestras.
Supuesto 3: El valor medio de las perturbaciones 𝑢𝑖es igual a cero.
Por un lado los valores negativos y positivos de ui se cancelan de tal manera que el efecto sobre el
promedio es cero; por otro lado las ui son desviaciones con respecto a la media cuya sumatoria es
igual a cero.
Yi = β1+ β2 + ui
Yi = E(Y/Xi) + ui
E Yi = E E(Y/Xi) + ui
E Yi = E E(Y/Xi) + E ui/Xi
E Y/Xi = E(Y/Xi) + E ui/Xi
E ui/Xi = 0
D.P.
f(u)
FRP Xi
-ui
+ui
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
8
Supuesto 4: Homocedasticidad3 o igual varianza en las distribuciones de ui.
La homocedasticidad es una característica de las series de tiempo, en donde existen distribuiones varianzas y medias
iguales.
Así como la homocedasticidad es la característica de las series de tiempo, la heterocedasticidad es la característica de la
información de corte transversal.
3 En griego Homo = igual y Cedasticidad = Dispersión
FRP:
D.P.
f(u)
𝜎2 𝜎2
𝜎2
FRP:
f(u)
D.P.
𝜎12
𝜎22
𝜎32
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 1
9
Nota: La varianza de una variable X:
Supuesto 5: No existe autocorrelación entre las distribuciones de ui.
El problema de la autocorrelación está presente en series de tiempo, que en términos generales se
manifiesta de dos maneras:
𝑌𝑡 = 𝛽1 + 𝛽2Xt + ut 𝑢𝑡 = 𝜌𝑢𝑡−1
𝐶𝑜𝑣 𝑢𝑡−1 ,𝑢𝑡 ≠ 0
𝑉𝑎𝑟 𝑋 =1
𝑛 𝑥𝑖
2 =1
𝑛 𝑋𝑖 − 𝑋 2
𝑉𝑎𝑟 𝑋 = 𝐸 𝑋𝑖 − 𝐸 𝑋𝑖 2
𝐸 𝑢𝑖 𝑋𝑖 = 0
𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝐸 𝑢𝑖 2 = 𝜎2
𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑋𝑖 2
FRP:
f (u)
D.P.
𝑢𝑡−1 𝑢𝑡
𝑋𝑡
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
0
𝑌𝑡 = 𝛽1 + 𝛽2Xt + ut 𝑢𝑡 = 𝜌𝑂 + 𝜌1𝑢𝑡−1
𝐶𝑜𝑣 𝑢𝑡−1 ,𝑢𝑡 ≠ 0
Nota:
Cov ui , uj\XiXj
=1
n𝐸 𝑢𝑖 − 𝐸 𝑢𝑖/𝑋𝑖 𝐸 𝑢𝑗 − 𝐸 𝑢𝑗/𝑋𝑗
Cov X, Y = 1
n 𝑥𝑖𝑦𝑖
=1
n 𝑋𝑖 − 𝑋 𝑌𝑖 − 𝑌
=1
n𝐸 𝑥𝑖 − 𝐸 𝑥𝑖 𝐸 𝑦𝑖 − 𝐸 𝑦𝑖
f (u)
D.P.
FRP: 𝑋𝑡−1
𝑋𝑡
𝜌𝑂 𝜌1
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
1
Supuesto 6: La varianza entre la distribución ui y Xi es cero. Las dos distribuciones no están
correlacionadas. Si la función de regresión poblacional es 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖 y si existiera
correlación entre las perturbaciones de ui, y la variable Xi, la Cov(ui, Xi) ≠ 0, entonces Xi = f (ui). La
influencia de cada una de las dos sobre Yi, no serían independientes y lo que se requiere es que
sean separadas e individuales.
𝐶𝑜𝑣 𝑢𝑖 ,𝑋𝑖 = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑋𝑖 𝑋𝑖 − 𝐸 𝑋𝑖 𝐸 𝑢𝑖 𝑋𝑖 = 0
𝐶𝑜𝑣 𝑢𝑖 ,𝑋𝑖 = 𝐸 𝑢𝑖 𝑋𝑖 − 𝐸 𝑋𝑖
𝐶𝑜𝑣 𝑢𝑖 ,𝑋𝑖 = 𝐸 𝑢𝑖𝑋𝑖 − 𝑢𝑖𝐸 𝑋𝑖
𝐶𝑜𝑣 𝑢𝑖 ,𝑋𝑖 = 𝐸 𝑢𝑖𝑋𝑖 − 𝐸 𝑢𝑖𝐸 𝑋𝑖 La expectativa de ui está condicionada.
𝐶𝑜𝑣 𝑢𝑖 ,𝑋𝑖 = 𝐸 𝑢𝑖𝑋𝑖 − 𝐸 𝑢𝑖 𝑋𝑖 𝐸 𝑋𝑖
𝐶𝑜𝑣 𝑢𝑖 ,𝑋𝑖 = 𝐸 𝑢𝑖𝑋𝑖 = 0 → 𝐸 𝑢𝑖𝑋𝑖 =1
𝑛 𝑢𝑖 𝑋𝑖
Supuesto 7: El número de observaciones n debe ser mayor que el número de variables
explicativas. Este supuesto quiere asegurar los suficientes grados de libertad.
“En la práctica si solo poseemos diez observaciones no debemos hacer una regresión, los grados de
libertad son reducidos, por lo que la hipótesis no pasa y la inferencia poblacional estaría errada.”
n - k = Grados de libertad
En donde, n es el número de observaciones y k es el número de regresores. Así, lo óptimo es:
𝒏 ≥ 𝟑𝟔
El número de observaciones n debe ser mayor que el número de variables explicativas. Este
supuesto quiere asegurar los suficientes grados de libertad.
Supuesto 8: Variabilidad de los valores de X (Los valores de las variables explicativas tiene que
tener diferentes valores).
No todos los valores de X en una muestra dada deben ser iguales. Si todos los valores de X son
idénticos, 𝑋𝑖 = 𝑋 y la varianza sería cero. La varianza de X debe ser un número positivo finito. Por
lo tanto, cuando la varianza es igual a cero no existe distribución.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
2
Supuesto 9: El modelo de regresión está correctamente especificado.
Una investigación econométrica empieza con la especificación de un modelo de base para explicar
el fenómeno de interés. En este proceso surgen dos preguntas esenciales:
Respecto al primer cuestionamiento se debe seguir alguna teoría que explique el fenómeno
económico y aún así, en la práctica el”econometrista” tiene que usar su juicio para escoger
cuantas y cuales variables.
Con relación al segundo cuestionamiento analizamos a la Curva de Phillips.
A) ¿Cuáles son las variables que deben ser incluidas? Las técnicas estadísticas
probabilísticas, la teoría económica usada, solventan a este cuestionamiento.
B) ¿Cuál es la forma funcional del modelo? A nivel nacional aplicar un modelo puede
tener múltiples dificultades, se suelen usar variables proxy.
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖−1 + 𝑢𝑖 (Hipérbole)
% S
alar
ios
% Desempleo
Haríamos mal en proponer un modelo lineal,
porque solo hay dos puntos en contacto con la
realidad. La hipérbole por el contrario se funde con
la realidad.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
3
β 2 = 𝑥𝑖𝑦𝑖 𝑥𝑖
2 = 𝑥𝑖𝑌𝑖 𝑥𝑖
2 = 𝑘𝑖𝑌𝑖
𝑘𝑖 =𝑥𝑖 𝑥𝑖
2
β 2 = 𝑥1
𝑥𝑖2 𝑌1 +
𝑥2
𝑥22 𝑌2 + ⋯+
𝑥𝑛 𝑥𝑖
2 𝑌𝑛
Si proponemos a 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖, una línea recta, apenas coincidirá en dos puntos con las
observaciones y será una mala propuesta.
Si proponemos a 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖−1 + 𝑢𝑖 , entonces es una hipérbole, coincidirá con las
observaciones y será una buena propuesta.
Supuesto 10: No existe multicolinealidad perfecta. Este supuesto está destinado a la regresión
múltiple y se discutirá más adelante.
Nota: Propiedades de ki:
β 2 es un estimador lineal Yi, es decir un
promedio ponderado de Yi en donde ki
son las ponderaciones.
1.- 𝑘𝑖 = 0
𝑘𝑖 = 𝑥𝑖 𝑥𝑖
2 = 𝑥𝑖 𝑥𝑖
2 = 0
2.- 𝑘𝑖2 =
𝑥𝑖
𝑥𝑖2
2
= 𝑥𝑖
2
𝑥𝑖2
2
𝑥𝑖 𝑥𝑖
2
2
= 𝑥𝑖
2
𝑥𝑖2
2 = 𝑥𝑖
2
𝑥𝑖2
2 =1
𝑥𝑖2
3.- 𝑘𝑖 𝑥𝑖 = 𝑘𝑖 𝑋𝑖 = 1
𝑘𝑖 𝑥𝑖 = 𝑥𝑖 𝑥𝑖
2 𝑥𝑖 = 𝑥𝑖
2
𝑥𝑖2 = 1
𝑘𝑖 𝑋𝑖 = 𝑥𝑖 𝑥𝑖
2 𝑋𝑖 = 𝑥𝑖 𝑋𝑖 𝑥𝑖
2 = 𝑋𝑖 − 𝑋 𝑋𝑖 𝑋𝑖 − 𝑋 2
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
4
En donde 𝜎2 es la varianza homocedástica de las
distribuciones de las perturbaciones ui y que se estima
de la siguiente manera:
Donde n es el número de observaciones y k es el
número de regresores.
𝜎 2 = 𝑢 𝑖
2
𝑛 − 𝑘
𝑋𝑖2 − 𝑋 𝑋𝑖
𝑋𝑖2 − 2𝑋 𝑋𝑖 + 𝑋 2
= 𝑋𝑖
2 − 𝑋 𝑋𝑖 𝑋𝑖
2 − 2𝑋 𝑋𝑖 + 𝑛𝑋 2=
𝑋𝑖2 − 𝑛𝑋 2
𝑋𝑖2 − 2𝑋 𝑋𝑖 + 𝑛𝑋 2
= 𝑋𝑖
2 − 𝑛𝑋 2
𝑋𝑖2 − 𝑛𝑋 2
= 1
Nota: Propiedades del operador varianza:
1.-Var(a) = 0 No existe
2.-Var (aXi)=a2Var(X)
3.-Var 𝑎 ± 𝑏𝑋𝑖 = 𝑏2𝑉𝑎𝑟(𝑋)
4.- Var 𝑎 ± 𝑋𝑖 = 𝑉𝑎𝑟(𝑋)
Cuando las variables son independientes (no correlacionadas)
5.- Var 𝑋𝑖 ± 𝑌𝑖 ± 𝑍𝑖 = 𝑉𝑎𝑟 𝑋 + 𝑉𝑎𝑟 𝑌 + 𝑉𝑎𝑟 𝑍
6.- Var 𝑎𝑋𝑖 ± 𝑏𝑌𝑖 ± 𝑐𝑍𝑖 = 𝑎2𝑉𝑎𝑟 𝑋 + 𝑏2𝑉𝑎𝑟 𝑌 + 𝑐2𝑉𝑎𝑟 𝑍
Cuando las variables son dependientes (correlacionadas)
7.- Var 𝑋𝑖 ± 𝑌𝑖 ± 𝑍𝑖 = 𝑉𝑎𝑟 𝑋 + 𝑉𝑎𝑟 𝑌 + 𝑉𝑎𝑟 𝑍 ± 2𝐶𝑜𝑣 𝑋,𝑌 ± 2𝐶𝑜𝑣 𝑋,𝑍 ± 2𝐶𝑜𝑣 𝑌,𝑍
8.- Var 𝑎𝑋𝑖 ± 𝑏𝑌𝑖 ± 𝑐𝑍𝑖 = 𝑎2 𝑉𝑎𝑟 𝑋 + 𝑏2 𝑉𝑎𝑟 𝑌 + 𝑐2𝑉𝑎𝑟 𝑍 ± 2𝑎𝑏𝐶𝑜𝑣 𝑋,𝑌 ± 2𝑎𝑐𝐶𝑜𝑣 𝑋,𝑍 ± 2𝑏𝑐𝐶𝑜𝑣 𝑌,𝑍
Varianza y errores estándar estimadores de MCO
Si en nuestro ejemplo hipotético hay 7,54*1010 muestras quiere decir que se puede obtener
7,54*1010 regresiones o líneas rectas 𝛽 1´𝑠 (para hacer cumplir los MCO) y 𝛽 2´𝑠, valores con los
cuales se pueden obtener dos distribuciones normales.
𝑉𝑎𝑟 𝛽 2 =𝜎2
𝑥𝑖2
𝑒𝑒 𝛽 2 = 𝑉𝑎𝑟 𝛽 2 1/2
𝑉𝑎𝑟 𝛽 1 = 𝜎2 𝑋𝑖
2
𝑛 𝑥𝑖2
𝑒𝑒 𝛽 1 = 𝑉𝑎𝑟 𝛽 1 1/2
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
5
Recordando de esta manera que (n-k) son los grados de libertad, n es el número total de
observaciones y k es el número de restricciones lineales (número de 𝛽 1´𝑠 ) para una muestra(n-2).
Así, los 𝑢 𝑖2 son denominados suma de residuos cuadrados (SRC). Además, la raíz cuadrada de 𝜎 2
es el error estándar de la regresión.
Por otro lado, en una muestra dada 𝛽 1 y 𝛽 2 pueden estar correlacionados entre si:
𝐶𝑜𝑣 𝛽 1 ,𝛽 2 = −𝑋 𝑉𝑎𝑟 𝛽 2
Varianza de 𝜷 𝟐:
𝛽 2 = 𝑘𝑖𝑌𝑖
𝑉𝑎𝑟 𝛽 2 = 𝑉𝑎𝑟 𝑘𝑖𝑌𝑖 = 𝑘𝑖2 𝑉𝑎𝑟 𝑌𝑖
𝑉𝑎𝑟 𝑌𝑖 = 𝑉𝑎𝑟 𝑢𝑖 = 𝜎2 𝑘𝑖2 =
1
𝑥𝑖2
Reemplazando:
𝑉𝑎𝑟 𝛽 2 =𝜎2
𝑥𝑖2
Nota:
Considerando a 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝛽 2 = 𝑘𝑖 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝛽 2 = 𝛽1 𝑘𝑖 + 𝛽2 𝑘𝑖 𝑋𝑖 + 𝑘𝑖 𝑢𝑖 𝑘𝑖 = 0 y 𝑘𝑖 𝑋𝑖=1
𝛽 2 = 𝛽2 + 𝑘𝑖 𝑢𝑖
𝛽 2 − 𝛽2 = 𝑘𝑖 𝑢𝑖
𝐸 𝛽 2 = 𝐸 𝛽2 + 𝑘𝑖 𝑢𝑖 = 𝛽2 + 𝑘𝑖 𝐸 𝑢𝑖 𝐸 𝑢𝑖 =0
𝐸 𝛽 2 = 𝛽2
Se cumple de esta forma la premisa de que el promedio de las muestras es igual al valor
poblacional.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
6
Estimados de 𝝈 𝟐:
𝑌𝑖 − 𝑌 = 𝛽2𝑋𝑖 − 𝛽2𝑋 + 𝑢𝑖 − 𝑢
𝑌𝑖 − 𝑌 = 𝛽2 𝑋𝑖 − 𝑋 + 𝑢𝑖 − 𝑢
𝑦𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖 − 𝑢 Recordando que 𝑦𝑖 = 𝛽 2𝑥𝑖 + 𝑢 𝑖
𝛽 2𝑥𝑖 + 𝑢 𝑖 = 𝛽2𝑥𝑖 + 𝑢𝑖 − 𝑢
𝑢 𝑖 = 𝑢𝑖 − 𝑢 + 𝛽2𝑥𝑖 − 𝛽 2𝑥𝑖
𝑢 𝑖 = 𝑢𝑖 − 𝑢 + (𝛽2 − 𝛽 2)𝑥𝑖
𝑢 𝑖2 = 𝑢𝑖 − 𝑢 − (𝛽 2 − 𝛽2)𝑥𝑖
2
𝑢 𝑖2 = 𝑢𝑖 − 𝑢 2 − 2 𝑢𝑖 − 𝑢 𝛽 2 − 𝛽2 𝑥𝑖 + (𝛽 2 − 𝛽2)2𝑥𝑖
2
** 𝑢 𝑖2 = 𝑢𝑖 − 𝑢 2 − 𝛽 2 − 𝛽2 2 𝑢𝑖 − 𝑢 𝑥𝑖 + (𝛽 2 − 𝛽2)2 𝑥𝑖
2
Con los dos primeros términos:
* 𝒖𝒊 − 𝒖 𝟐 = 𝒖𝒊𝟐 − 𝟐𝒖 𝒖𝒊 + 𝒖 𝟐
𝑢𝑖 − 𝑢 2 = 𝑢𝑖2 − 2𝑢 𝑢𝑖 + 𝑛𝑢 2
Teniendo en cuenta:
𝑢 =1
𝑛 𝑢𝑖
𝑢 𝑛 = 𝑢𝑖
𝑢𝑖 − 𝑢 2 = 𝑢𝑖2 − 2𝑛𝑢 2 + 𝑛𝑢 2
𝑢𝑖 − 𝑢 2 = 𝑢𝑖2 − 𝑛𝑢 2
𝑢𝑖 − 𝑢 2 = 𝑢𝑖2 − 𝑛
𝑢𝑖𝑛
2
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
__ 𝑌 = 𝛽1 + 𝛽2𝑋 + 𝑢
Suma de cero
Desviaciones con respecto a la media de las perturbaciones estocásticas.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
7
𝑢𝑖 − 𝑢 2 = 𝑢𝑖2 −
𝑢𝑖2
𝑛
𝑢𝑖 − 𝑢 2 = 𝑛𝜎2 − 𝜎2 = (𝑛 − 1) 𝜎2
𝝈𝟐 =𝟏
𝒏 𝒖𝒊
𝟐
* −𝟐 𝜷 𝟐 − 𝜷𝟐 𝒙𝒊 𝒖𝒊 − 𝒖
= −2 kiui xi ui − u xi xi = 0
= −2 kixiui2
Remplazando en **
𝑢 𝑖2 = (𝑛 − 1) 𝜎2 − 2 kixiui
2 + (𝛽 2 − 𝛽2)2 𝑥𝑖2
𝐸 𝑢 𝑖2 = 𝐸 (𝑛 − 1) 𝜎2 − 2 kixiui
2 + (𝛽 2 − 𝛽2)2 𝑥𝑖2
𝐸 𝑢 𝑖2 = (𝑛 − 1) 𝜎2 − 2 kixiE(ui
2) + 𝐸(𝛽 2 − 𝛽2)2 𝑥𝑖2
𝐸 𝑢 𝑖2 = 𝑛𝜎2 − 𝜎2 − 2𝜎2 + 𝜎2
𝐸 𝑢 𝑖2 = 𝑛 − 2 𝜎2
Considerando:
𝐸 𝜎 2 = 𝜎2
𝐸 𝑢 𝑖2 = 𝑛 − 2 E σ 2
σ 2 = 𝑢 𝑖
2
n − 2
Covarianza entre 𝜷 𝟏 y 𝜷 𝟐:
𝐶𝑜𝑣 𝛽 1 ,𝛽 2 = 𝐸 𝛽 1 − 𝐸 𝛽 1 𝛽 2 − 𝐸 𝛽 2
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
8
𝐶𝑜𝑣 𝛽 1 ,𝛽 2 = 𝐸 𝛽 1 − 𝐸 𝛽 1 𝛽 2 − 𝛽2
𝑌 = 𝛽 1 + 𝛽 2𝑋 → 𝛽 1 = 𝑌 −𝛽 2𝑋
𝐸 𝛽 1 = 𝐸 𝑌 −𝛽 2𝑋 = 𝑌 − 𝑋 𝐸 𝛽 2
𝐸 𝛽 1 = 𝑌 − 𝛽2𝑋
𝐶𝑜𝑣 𝛽 1 ,𝛽 2 = 𝐸 𝑌 − 𝛽 2𝑋 − 𝑌 + 𝛽2𝑋 𝛽 2 − 𝛽2
= 𝐸 −𝑋 𝛽 2 − 𝛽2 2 = −𝑋 𝐸 𝛽 2 − 𝛽2
2= −𝑋 𝑉𝑎𝑟(𝛽 2)
𝐶𝑜𝑣 𝛽 1 ,𝛽 2 = −𝑋 𝑉𝑎𝑟(𝛽 2)
Propiedades Estadísticas de los MCO: Son aquellas que adquieren los MCO a raíz de los supuestos
del modelo clásico de regresión lineal.
1.- Son lineales con la variable dependiente:
𝛽 2 = 𝑘𝑖𝑌𝑖 𝑘𝑖 =𝑥𝑖
𝑥𝑖2
𝛽 2 =𝑥1
𝑥𝑖2 𝑌1 +
𝑥2
𝑥𝑖2 𝑌2 + ⋯+
𝑥𝑛 𝑥𝑖
2 𝑌𝑛
𝛽 2 es lineal con la variable Y, y además es un promedio ponderado de Y, donde ki son las
ponderaciones.
2.- Son insesgados:
𝛽 2 = 𝑘𝑖𝑌𝑖 = 𝑘𝑖 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝛽 2 = 𝛽1 𝑘𝑖 + 𝛽2 𝑘𝑖 𝑋𝑖 + 𝑘𝑖 𝑢𝑖
𝛽 2 = 𝛽1 𝑘𝑖 + 𝛽2 𝑘𝑖 𝑋𝑖 + 𝑘𝑖 𝑢𝑖 𝑘𝑖 = 0 𝑘𝑖 𝑋𝑖 = 1
𝛽 2 = 𝛽2 + 𝑘𝑖 𝑢𝑖
𝐸 𝛽 2 = 𝐸 𝛽2 + 𝑘𝑖 𝑢𝑖 = 𝐸 𝛽2 + 𝐸 𝑘𝑖 𝑢𝑖 = 𝛽2 + 𝑘𝑖 𝐸 𝑢𝑖 𝐸 𝑢𝑖 = 0
𝑬 𝜷 𝟐 = 𝜷𝟐
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 2
9
3.- Son eficientes, es decir tienen varianza mínima. Es el teorema de Gauss Markov:
𝛽 2 = 𝑘𝑖𝑌𝑖 ,donde 𝑘𝑖 =𝑥𝑖
𝑥𝑖2
Definamos un estimador lineal alterno de 𝛽2 y veamos si es insesgado.
𝛽 2∗ = 𝑤𝑖𝑌𝑖
Donde 𝑤𝑖 son también ponderaciones.
𝐸 𝛽2∗ = 𝐸 𝑤𝑖𝑌𝑖 = 𝑤𝑖𝐸 𝑌𝑖
𝐸 𝛽2∗ = 𝑤𝑖𝐸 𝛽1 + 𝛽2𝑋𝑖
𝐸 𝛽2∗ = 𝑤𝑖𝐸 𝛽1 + 𝛽2𝑋𝑖
𝐸 𝛽2∗ = 𝛽1 𝑤𝑖 +𝛽2 𝑤𝑖𝑋𝑖
Para que 𝛽2∗ sea insesgado:
𝑤𝑖 = 0 𝑦 𝑤𝑖𝑋𝑖 = 1
𝑬 𝜷𝟐∗ = 𝜷𝟐
En el caso de la varianza:
𝑉𝑎𝑟 𝑌𝑖 = 𝑉𝑎𝑟 𝑢𝑖 = 𝜎2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖
2
Suponiendo que 𝑤𝑖no son necesariamente iguales a 𝑘𝑖 .
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖 + 𝑘𝑖
2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖 + 𝑘𝑖
2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖
2 + 2 𝑤𝑖 − 𝑘𝑖 𝑘𝑖 + 𝑘𝑖2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖
2 + 2 𝑤𝑖𝑘𝑖 − 𝑘𝑖2 + 𝑘𝑖
2
Tomando al término intermedio:
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
0
2 𝑤𝑖𝑘𝑖 − 𝑘𝑖2
= 2 𝑤𝑖𝑘𝑖 − 𝑘𝑖2
= 2 𝑤𝑖
𝑥𝑖 𝑥𝑖
2 −1
𝑥𝑖2
= 2 1
𝑥𝑖2 −
1
𝑥𝑖2 = 0 ∴
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖
2 + 𝑘𝑖2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖
2 +𝜎2 𝑘𝑖2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖
2 +𝜎2
𝑥𝑖2
𝑉𝑎𝑟 𝛽2∗ = 𝜎2 𝑤𝑖 − 𝑘𝑖
2 +𝑉𝑎𝑟 𝛽 2
𝑽𝒂𝒓 𝜷𝟐∗ > 𝑉𝑎𝑟 𝜷 𝟐
De esta manera la única manera en que las dos varianzas sean iguales es que 𝑤𝑖 = 𝑘𝑖
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
1
El Coeficiente de Determinación:
Mide la bondad del ajuste, es decir, que tan bien se ajusta “la recta e regresión a los datos, o
también mide el porcentaje de la variación total en Y explicado por el modelo de regresión.
𝑟2 = 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑆𝑖𝑚𝑝𝑙𝑒
𝑅2 = 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑀𝑢𝑙𝑡𝑖𝑝𝑙𝑒
Por un lado;
𝑌𝑖 = 𝑌 𝑖 + 𝑢 𝑖
𝑌𝑖2 = 𝑌 𝑖 + 𝑢 𝑖
2
𝑌𝑖2 = 𝑌 𝑖
2 + 2𝑌 𝑖𝑢 𝑖 + 𝑢 𝑖2
𝑌𝑖2 = 𝑌 𝑖
2 + 2𝑌 𝑖𝑢 𝑖 + 𝑢 𝑖2
Por otro lado;
𝑌𝑖 = 𝑌 𝑖 + 𝑢 𝑖
𝑌𝑖 − 𝑌 = 𝑌 𝑖 − 𝑌 + 𝑢 𝑖
𝑦𝑖 = 𝑦 𝑖 + 𝑢 𝑖
Recordando
𝑦 𝑖 = 𝛽 2𝑥𝑖
𝑦 𝑖 = 𝛽 22𝑥𝑖
2
𝑌𝑖2 = 𝑌 𝑖
2 + 𝑢 𝑖2
𝑆𝑇𝐶∗ = 𝑆𝐸𝐶∗ + 𝑆𝑅𝐶
𝑦𝑖2 = 𝑦 𝑖 + 𝑢 𝑖
2 = 𝑦 𝑖2 + 2𝑦 𝑖𝑢 𝑖 + 𝑢 𝑖
2
𝑆𝑇𝐶 = 𝑆𝐸𝐶 + 𝑆𝑅𝐶
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
2
𝑦 𝑖 = 𝛽 22 𝑥𝑖
2
𝑦𝑖2 = 𝛽 2
2 𝑥𝑖2 + 𝑢 𝑖
2
r2 =SEC
STC= y i
2
yi2 =
Y i − Y 2
Yi − Y 2
𝑆𝑖 𝑆𝑅𝐶 = 0 → 𝑆𝑇𝐶 = 𝑆𝐸𝐶 𝑟2 = 1 ↔ 𝐴𝑗𝑢𝑠𝑡𝑒 𝑃𝑒𝑟𝑓𝑒𝑐𝑡𝑜
𝑆𝑖 𝑆𝑅𝐶 ≠ 0 → 𝑆𝐸𝐶 < 𝑆𝑇𝐶 𝑟2 < 1 ↔ 𝐴𝑗𝑢𝑠𝑡𝑒 𝑃𝑒𝑟𝑓𝑒𝑐𝑡𝑜
0 ≤ 𝑟2 ≥ 1
Cabe advertir que el grado de ajuste debe ser multiplicado por cien.
Recordando:
y i2 = β 2
2 xi2 y 𝛽 2 =
𝑥𝑖𝑦𝑖
𝑥𝑖2
𝑌𝑖 − 𝑌 = 𝑢 𝑖
FRM
𝑋
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
3
En donde 𝑘𝑖 ,𝛽1 ,𝛽2 𝑦 𝑋𝑖 son fijas, entonces 𝛽 2, es una
función lineal de ui, que es una variable aleatoria por
hipótesis. Por tanto, se asume que ui sigue un
distribución normal.
𝑟2 = 𝛽 22
𝑥𝑖2
𝑦𝑖2 =
𝑥𝑖𝑦𝑖 2
𝑥𝑖2 𝑦𝑖
2
𝑟2 = 𝛽 22
𝑥𝑖2
𝑦𝑖2 =
𝑥𝑖𝑦𝑖 2
𝑥𝑖2 𝑦𝑖
2
𝑟2 = 𝛽 22
𝑥𝑖2 𝑛
𝑦𝑖2 𝑛
= 𝛽 22𝑉𝑎𝑟 𝑥𝑖
𝑉𝑎𝑟 𝑦𝑖 = 𝛽 2
2 𝑆𝑥2
𝑆𝑦2
De la definición:
r2 =SEC
STC=
STC− SRC
STC= 1 −
𝑆𝑅𝐶
𝑆𝑇𝐶= 1 −
𝑢 𝑖 𝑦𝑖
2
Así mismo, la raíz cuadrada del coeficiente de determinación (r2) se denomina Coeficiente de
Correlación (r), que mide el grado de asociación entre dos variables.
r = xiyi
xi2 yi
2 =Cov X, Y
Var X Var Y 2
El Coeficiente de Correlación (r) puede ser positivo o negativo dependiendo del signo del
numerador que no es más, que la covarianza entre las dos variables, resulta de este modo entre:
−1 ≤ 𝑟 ≤ 0
MODELO CLÁSICO DE REGRESIÓN LINEAL NORMAL
La teoría clásica de la inferencia estadística consta de dos partes, la estimación y la prueba de
hipótesis. La primera se analizó en la sección anterior y la segunda se desarrolla a continuación.
Distribución de probabilidades de las perturbaciones ui:
Recordando que:
𝛽 2 = 𝑘𝑖𝑌𝑖
𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
𝛽 2 = 𝑘𝑖 𝛽1 + 𝛽2𝑋𝑖 + 𝑢𝑖
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
4
Supuesto de Normalidad:
La regresión lineal clásica supone que cada distribución de las perturbaciones ui, están
normalmente distribuidas con:
Media: 𝐸 𝑢𝑖 = 0
Varianza: E [ui – E (ui) ]2 = 𝐸 𝑢𝑖
2 = 𝜎2
Cov (ui, uj): E { [ (ui – E (ui)] [uj – E (uj ) ] } = E (ui, uj ) = 0
Propiedades de los estimadores de los Mínimos Cuadrados Ordinarios (MCO) bajo el supuesto
de normalidad:
1.-Son lineales con la variable Y. 2.-Son insesgados. 3.-Son eficientes es decir tienen varianza mínima. 4.- Son consistentes a medida que el tamaño de la muestra aumenta, los estimadores convergen hacia sus verdaderos valores poblacionales.
5.- 𝛽 1 al ser función lineal de ui está normalmente distribuida con:
Media: 𝐸 𝛽 1 = 𝛽1
𝑉𝑎𝑟 𝛽 1 : 𝜎𝛽 1
2 = 𝜎2 𝑋𝑖
2
𝑛 𝑥𝑖2
𝛽 1~𝑁 𝛽1,𝜎𝛽 1
2
Valores que luego del proceso de estandarización dan lugar a la obtención de la distribución normal estándar.
𝑍1 =𝛽 1−𝛽1
𝜎𝛽 1
2
𝑍1~𝑁(0,1)
Nota: 𝑍𝑖 =𝑋𝑖−𝑋
𝑆𝑋
6.- 𝛽 2~𝑁 𝛽2 ,𝜎𝛽 2
2
𝛽 2 al ser una función lineal de ui, está normalmente distribuido con:
Media: 𝐸 𝛽 2 = 𝛽2
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
5
𝑉𝑎𝑟 𝛽 2 : 𝜎𝛽 2
2 =𝜎2
𝑥𝑖2
𝛽 2~𝑁 𝛽2,𝜎𝛽 2
2
Estandarización:
𝑍2 =𝛽 2−𝛽2
𝜎𝛽 2
2
𝑍2~𝑁(0,1)
7.- 𝑛 − 2 𝜎 2
𝜎2 sigue una distribución 𝜒2, n-2 grados de libertad.
8.-𝛽 1 y 𝛽 2 se distribuyen de manera independiente a 𝜎 2.
Distribuciones relacionadas con la normal:
Teorema 1: Si Z1, Z2,…, Zn son variables aleatorias que están distribuidas normalmente y de manera independiente, tales que 𝑍𝑖~𝑁(𝑢𝑖 ,𝜎𝑖
2) entonces la suma 𝑍 = 𝑘𝑖𝑍𝑖 , donde 𝑘𝑖 son constantes no todas
nulas, está también normalmente distribuida y tiene una media 𝑘𝑖𝑢𝑖 y una varianza 𝑘𝑖2𝜎𝑖
2.
𝑍~𝑁 𝑘𝑖𝑢𝑖 , 𝑘𝑖2𝜎𝑖
2
Ejemplo: Con la variable peso, los seiscientos alumnos de Economía, los novecientos de Derecho y los quinientos de Ciencias Humanas, se distribuyen:
𝑍𝐸~𝑁 130,10 𝑍𝐷~𝑁 138,14 𝑍𝐶𝐻~𝑁 126,12
𝑍 = 600 + 900 + 500 = 2000
−1 0 +1
𝑓 𝛽 1
𝑓 𝑍1
𝛽 1
𝑓 𝛽 2
𝑓 𝑍2
𝑍1
𝛽 2
𝑍2
−1 0 +1
𝐸 𝛽 1 = 𝛽1 𝐸 𝛽 2 = 𝛽2
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
6
𝑘𝐸 = 0.3 𝑘𝐷 = 0.45 𝑘𝐶𝐻 = 0.25
𝑢 = 0.3 ∗ 130 + 0.45 ∗ 138 + 0.25 ∗ 126 = 132.6
𝜎2 = 0.2 210 + 0.45 214 + 0.25 212 = 3.9
𝑍~𝑁 132.6, 3.9
Teorema 2: Si Z1, Z2,…, Zn están normalmente distribuidas, pero no son independientes la suma
𝑍 = 𝑘𝑖𝑍𝑖 , donde 𝑘𝑖 son constantes y no todas igual cero, también está normalmente distribuida con una
media 𝑘𝑖𝑢𝑖 y una varianza 𝑘𝑖2𝜎𝑖
2 + 𝑘𝑖𝑘𝑗 𝐶𝑜𝑣 𝑍𝑖 ,𝑍𝑗 .
𝑍~𝑁 𝑘𝑖𝑢𝑖 , 𝑘𝑖2𝜎𝑖
2 + 𝑘𝑖𝑘𝑗 𝐶𝑜𝑣 𝑍𝑖 ,𝑍𝑗
Ejemplo: Con la variable peso, los seiscientos alumnos de Economía y los novecientos de Derecho:
𝑍𝐸~𝑁 130,10 𝑍𝐷~𝑁 138,14 𝐶𝑜𝑣 𝑍𝑖 ,𝑍𝑗 = 0.8
𝑍 = 600 + 900 = 1500
𝑘𝐸 = 0.4 𝑘𝐷 = 0.6
𝑢 = 0.4 ∗ 130 + 0.6 ∗ 138 = 134.8
𝜎2 = 0.4 210 + 0.6 214 + 2 0.4 0.6 0.8
𝜎2 = 7.02
𝑍~𝑁 134.8, 7.02 Teorema 3: Si Z1, Z2,…, Zn son variables aleatorias que están distribuidas de manera normal e independiente de tal manera que cada 𝑍𝑖~𝑁 0, 1 , es decir son variables estandarizadas,
entonces 𝑍𝑖2 = 𝑍1
2 + 𝑍22 + ⋯+ 𝑍𝑛
2 sigue una distribución 𝜒2 con n grados de libertad.
Teorema 4: Si Z1, Z2,…, Zn son variables distribuidas independientemente y cada una sigue una distribución 𝜒2 con ki grados de libertas (g de l) entonces la suma 𝑍 = 𝑍1 + 𝑍2 + ⋯+ 𝑍𝑛 también sigue una distribución 𝜒2 con𝑘 = 𝑘𝑖 grados de libertad.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Jorge Salgado
Págin
a 3
7
Teorema 5: Si Z1 es una variable normal estandarizada 𝑍1~𝑁 0, 1 y otra variable Z2 sigue la distribución 𝜒2 con k grados de libertad y es independiente de Z1 entonces se define la distribución t de Student.
𝑡 =𝑍1
𝑍2 𝑘 1/2
𝑡 =Variable normal estandarizada
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝜒2 1/2
Teorema 6: Si Z1 y Z2 son variables 𝜒2 independientemente distribuidas con 𝑘1 𝑦 𝑘2 grados de libertad respectivamente.
𝐹 = 𝑍1 𝑘1 1/2
𝑍2 𝑘2 1/2
Donde encontramos a la distribución F con 𝑘1 grados de libertad del numerador y 𝑘2 grados de libertad del denominador, 𝐹𝑘1 ,𝑘2
.
Teorema 7: El cuadrado de la variable t de Student, con k grados de libertad tiene una distribución F con 𝑘1 = 1 grados de libertad del numerador y 𝑘2 = 𝑘 grados de libertad en el denominador.
𝐹1,𝑘 = 𝑡2𝑘
Relación que se aplica solamente a una regresión simple, donde se cuenta con una variable explicativa y k observaciones.