apuntes econometria i
TRANSCRIPT
-
UNIVERSIDAD COMPLUTENSEMADRID
Facultad de CienciasEconmicas y Empresariales
ECONOMETRA I
http://www.ucm.es/info/ecocuan/ectr1
GUIN - APUNTES ADICIONALES
Jos Alberto Mauricio
Departamento de Economa Cuantitativa http://www.ucm.es/info/ecocuan
-
GUIN PGINA II
COPYRIGHT 2000-2010 Jos Alberto Mauricio http://www.ucm.es/info/ecocuan/jam Este documento puede utilizarse exclusivamente como instrumento para la docencia ocial de la asignatura ECONOMETRA I
que se imparte en la Facultad de Ciencias Econmicas de la Universidad Complutense de Madrid. No se permite almacenar, reproducir o distribuir por medio alguno, ni tampoco utilizar este documento en cualquier sentido, fuera de los trminos mencionados anteriormente. La obtencin de este documento (Ectr1-JAM-Guion.pdf) en la direccin de Internet
http://www.ucm.es/info/ecocuan/jam/ectr1
implica la aceptacin de que su uso estar limitado a los trminos anteriores. ltima revisin: 21 de septiembre de 2010.
-
CONTENIDO Y BIBLIOGRAFA
GUIN PGINA III
CONTENIDO
PRLOGO 1
Regresin Lineal: De Simple a Mltiple......................................................... 2 Notacin............................................................................................................ 6
T1 ESPECIFICACIN Y ESTIMACIN DEL MODELO LINEAL GENERAL 9
1.1 Hiptesis Clsicas ......................................................................................... 11 1.2 Mnimos Cuadrados Ordinarios ................................................................... 23 1.3 Propiedades estadsticas.............................................................................. 28 1.4 Propiedades algebraicas............................................................................... 30 1.5 Error Estndar de la Regresin .................................................................... 31 1.6 Datos en desviaciones con respecto a la media ........................................ 32 1.7 Regresin particionada y correlacin parcial ............................................. 32
-
CONTENIDO Y BIBLIOGRAFA
GUIN PGINA IV
1.8 Normalidad ..................................................................................................... 33 1.9 Mxima Verosimilitud .................................................................................... 36
T2 CONTRASTES DE HIPTESIS Y PREVISIN 38
2.1 Contrastes de varias hiptesis..................................................................... 39 2.2 Contrastes de una nica hiptesis .............................................................. 41 2.3 Intervalos de confianza ................................................................................. 49 2.4 Restricciones lineales ................................................................................... 51 2.5 Algunos contrastes como elementos de diagnosis................................... 52 2.6 Previsin......................................................................................................... 53
T3 EXTENSIONES 55
3.1 Transformaciones lineales............................................................................ 55 3.2 Multicolinealidad............................................................................................ 56 3.3 Errores de especificacin ............................................................................. 59 3.4 Variables explicativas binarias..................................................................... 62
-
CONTENIDO Y BIBLIOGRAFA
GUIN PGINA V
APUNTES ADICIONALES PARA EL TEMA 1 71
A.1 MCO en modelos sencillos ........................................................................... 71 A.2 Coeficientes de determinacin..................................................................... 73 Matrices inversas particionadas....................................................................... 75 A.3 Datos en desviaciones con respecto a la media ........................................ 76 A.4 Regresin particionada y correlacin parcial ............................................. 81
-
CONTENIDO Y BIBLIOGRAFA
GUIN PGINA VI
BIBLIOGRAFA
TEMA 1
J.M. WOOLDRIDGE (2006): CAPTULOS 2 Y 3. SECCIONES 6.2 Y 6.3. APNDICES E1 Y E2. M. VERBEEK (2004): SECCIONES 2.1, 2.2, 2.3, 2.4 Y 3.1.
F. HAYASHI (2000): SECCIONES 1.1, 1.2, 1.3 Y 1.5.
TEMA 2
J.M. WOOLDRIDGE (2006): CAPTULO 4. SECCIN 6.4. APNDICE E3. M. VERBEEK (2004): SECCIONES 2.5, 2.9 Y 3.3.
F. HAYASHI (2000): SECCIN 1.4.
TEMA 3
VER INDICACIONES AL FINAL DE CADA APARTADO DEL GUIN.
-
ECONOMETRA I PRLOGO
GUIN PGINA 1
PRLOGO
The key question in most empirical studies is: Have enough other factors been held fixed to make
a case for causality? Rarely is an econometric study evaluated without raising this issue. In most
serious applications, the number of factors that can affect the variable of interest such as []
wages is immense, and the isolation of any particular variable may seem like a hopeless effort.
However, we will eventually see that, when carefully applied, econometric methods can simulate
a ceteris paribus experiment. [] As we will see throughout this text, accounting for other
observed factors, such as experience, when estimating the ceteris paribus effect of another
variable, such as education, is relatively straightforward. We will also find that accounting for
inherently unobservable factors, such as ability, is much more problematic. It is fair to say that
many of the advances in econometric methods have tried to deal with unobserved factors in
econometric models.
J.M. WOOLDRIDGE
Introductory Econometrics A Modern Approach 2006
-
ECONOMETRA I PRLOGO
GUIN PGINA 2
REGRESIN LINEAL: DE SIMPLE A MLTIPLE
Como se vio en la Denicin 2.2 de la Introduccin a la asignatura, una dicultad asociada con la evaluacin del efecto causal de una variable X sobre otra variable Y utilizando solamente datos sobre X e Y, tiene que ver con que Y puede depender de otros factores
observables relacionados con X que no se consideran explcitamente en el anlisis. Si estos factores pudieran incluirse de forma explcita en la investigacin de una posible relacin
causal entre X e Y (en un "modelo"), entonces al menos dicha dicultad no estara presente. Para verlo, considrese (en la lnea de la Denicin 2.2 de la Introduccin) la respuesta total de Y ante una variacin de cuanta X en X, X X W X V XY F X F W F V + + , junto con la respuesta total de Y ante una variacin de cuanta W en W, W W X W V WY F W F X F V + + . En la Denicin 2.2 se vieron las implicaciones de considerar individualmente tan slo la primera de estas expresiones. Sin embargo, ambas pueden escribirse conjuntamente como
-
ECONOMETRA I PRLOGO
GUIN PGINA 3
[ ] [ ] [ ] [ ]
X X X XV
WW W W
Y X W F VF
FY X W V
+ XWXW XWFY XW V
, [A]
o bien, de manera ms compacta y explcita, como
[ ] [ ] [ ] [ ]
[ ] [ ] [ ] [ ]Efectos Totales
1
Efectos Directos Efectos Indirectos
.
V
V
F
F
+ = = +
XW XW XW
XW XW
Y XW F V
XW F XW V
[B]
Esta expresin (que puede considerarse una extensin de la ecuacin [4] en la Denicin 2.2 de la Introduccin) pone de maniesto que [ ] [ ] [ ]1 XW XWXW Y F siempre que O bien 0VF = , de manera que V no inuya directamente sobre Y, O bien [ ] =XWV 0 , de manera que V no vare sistemticamente ni con X ni con W.
-
ECONOMETRA I PRLOGO
GUIN PGINA 4
Por lo tanto, si las inuencias no observables recogidas en V son independientes tanto de X como de W, entonces el efecto causal de X sobre Y (al igual que el de W sobre Y, que tambin podra tener cierto inters) se puede evaluar de manera able a partir de [A]-[B] utilizando datos sobre Y, X y W, a pesar de que X y W estn relacionadas entre s.
Por el contrario, como se vio en la Denicin 2.2 de la Introduccin, el efecto causal de X sobre Y no podra evaluarse ablemente a partir tan slo de la primera ecuacin en [A] (incluso suponiendo que 0XV = ), a menos que o bien 0WF = , o bien 0XW = . La ventaja de incluir a W en un anlisis de causalidad de X sobre Y, reside justamente en que la inclusin de W elimina la necesidad de asumir ciertas hiptesis (como 0WF = , o
0XW = ) que pueden resultar difciles o imposibles de justicar en la prctica. Esta conclusin sugiere que en un anlisis de causalidad sobre Y es recomendable considerar explcitamente tantas inuencias observables como sea posible y razonable, a pesar de que en ltima instancia quizs interese evaluar el efecto directo o causal de tan
slo una de dichas inuencias.
-
ECONOMETRA I PRLOGO
GUIN PGINA 5
En este sentido, el modelo RLS del Ejemplo 2.8 de la Introduccin puede ampliarse para
recoger explcitamente otras inuencias directas sobre Y adicionales a la inuencia lineal de X. Esta ampliacin da lugar a un modelo de regresin lineal mltiple (RLM), en el que todas las inuencias que recibe Y se resumen mediante una expresin matemtica del tipo 1 2 2 3 3 ... K KY X X X U = + + + + , [C] donde 2X , 3X , ..., KX son 1K variables explicativas observables, posiblemente relacionadas entre s. Por su parte, U representa todas las inuencias (observables y no observables) sobre Y que no estn recogidas en 1 2 2 3 3 ... K KX X X + + + + . Observacin tcnica (prescindible): A partir de [C], las respuestas totales de Y ante variaciones de cuanta jX en
jX ( 2, 3, ..., )j K= pueden escribirse conjuntamente (en la lnea de la ecuacin [A]) como
[ ] [ ]
2 2
3 3
2
2 3.2 .2 2
2.3 3 .3 3
2. 3.K K
KX X
X XK
X XK K K K
X X XY U
Y UX X X
Y UX X X
= + XY XX
""
# ## # % # #"
[ ]
XU
, [D]
-
ECONOMETRA I PRLOGO
GUIN PGINA 6
o bien, de manera ms compacta y explcita (en la lnea de la ecuacin [B]), como
[ ] [ ] [ ]
[ ] [ ] [ ]
2
Efectos Totales
12
Efectos Directos Efectos Indirectos
.
= + = = +
X X
X
Y XX U
XX XX U
[E]
Esta expresin (que puede considerarse una extensin de [6] en el Ejemplo 2.8 de la Introduccin) indica que [ ] [ ]1 2 =XXX Y siempre que [ ] =XU 0 , es decir, siempre que U en [C] no vare sistemticamente con ninguna variable explicativa. Por lo tanto, si las inuencias recogidas en U son independientes de todas las variables explicativas, entonces tanto 2 como 3 , ..., K pueden evaluarse de manera able a partir de [E] utilizando datos sobre Y, 2X , 3X , ..., KX . Por el contrario, como se vio en el Ejemplo 2.8, 2 no podra evaluarse ablemente a partir tan slo de la primera ecuacin en [D] (incluso suponiendo que
2 0XU = ), a menos que .2 0j jX = para todo 3, ...,j K= . La ventaja de incluir a 3X , ..., KX junto con 2X en [C] en relacin con un anlisis de causalidad de 2X
sobre Y, reside justamente en que la inclusin de 3X , ..., KX elimina la necesidad de asumir ciertas hiptesis (como que bien 0j = , o bien .2 0jX = , para todo 3, ...,j K= ) que pueden resultar difciles de justicar en la prctica.
NOTACIN
Las variables aleatorias (v.a.s) se representan con letras maysculas 1 12( , , ...)Y X ; sus
valores observados se representan con las letras minsculas correspondientes 1 12( , , ...)y x .
-
ECONOMETRA I PRLOGO
GUIN PGINA 7
En general, las matrices se representan con letras maysculas en negrilla ( , , , ...)X A incluso si sus componentes no son v.a.s. Los vectores se representan con letras minsculas
en negrilla 2( , , , ...)y x . Un vector se representa con una letra mayscula slo cuando sus componentes son v.a.s ( , , , ...,Y Y U cuyos valores observados se representan como
, , , ...y y u ). Todos los vectores se consideran vectores columna. Se utiliza el smbolo (como en , , , ... A c ), en lugar de un superndice T, como smbolo de trasposicin. Las cantidades escalares (matrices de dimensin 1 1 ) se representan en cursiva ( 23 , , , , ...t F ). Los momentos muestrales (estadsticos) se representan como X (media), 2SX (varianza),
SXY (covarianza) y RXY (coeciente de correlacin lineal simple); sus valores observados (calculados) se representan con los mismos smbolos en minscula.
Las v.a.s (como estimadores y estadsticos de contraste) que dependen a su vez de una
coleccin W de v.a.s, se representan con un subndice W ( 2 , , , ...FW WW ); sus valores calculados a partir de una observacin (datos) w sobre W dada se representan sin dicho subndice ( 2 , , , ...F ). El smbolo E[ ] representa la esperanza de una v.a. (escalar, vectorial o matricial). El
-
ECONOMETRA I PRLOGO
GUIN PGINA 8
smbolo Var[ ] representa la varianza de una v.a. cuando dicha v.a. es escalar, en cuyo caso a veces se emplea el smbolo [ ] , o bien una matriz de varianzas-covarianzas cuando dicha v.a. es vectorial, en cuyo caso a veces se emplea el smbolo [ ] (en negrilla). El smbolo Cov[ , ] (Cv[ , ] ) representa la covarianza (estimada) entre dos v.a.s de cualquier tipo. Los smbolos [ ] W y [ ]W representan estimadores (que dependen de W) de la varianza correspondiente, cuyos valores observados (estimaciones) se representan como [ ] y [ ] (sin el subndice W), o simplemente como Vr[ ] . El smbolo (ms grande que el smbolo anterior) se emplea con mucha frecuencia para representar un sumatorio como 1Ni= .
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 9
TEMA 1 ESPECIFICACIN Y ESTIMACIN DEL MODELO LINEAL GENERAL
Se pretende cuanticar una supuesta relacin estocstica unidireccional entre cierta variable Y (variable dependiente) y 1K variables 1 2, , ..., KX X X (variables explicativas), sobre las que se dispone de una coleccin de datos o muestra
1 11 12 1
2 21 22 21 2
1 2
[ , , , ..., ]
K
KK
N N N NK
y x x x
y x x x
y x x x
w y x x x
""
# # # #"
.
Observacin preliminar I: Con el n de simplicar el lgebra matricial que se utiliza en la denicin y el anlisis del modelo lineal general (MLG), para especicar un modelo con trmino constante (como un modelo RLS, o un modelo RLM como [C]) la matriz w anterior se dene de manera que 1 1ix ( 1, 2, ...,i N= ) ( 1 [1, 1, ..., 1] x ). En este caso solamente hay 1K variables explicativas "reales" ( 2X , ..., KX , como en el modelo RLM [C]), ya que 1X es de hecho una constante "articial".
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 10
Las N las de datos 1 2[ ... ]i i i iKy x x x ( 1, 2, ..., )i N= en w pueden referirse a N entidades observables en un momento dado (datos de seccin cruzada; ver Ejemplo 2.5 en la Introduccin a la asignatura), o bien a N momentos consecutivos de la historia de una
nica entidad observable (datos de series temporales; ver Ejemplo 2.7 en la Introduccin).
La estimacin numrica de los parmetros 1 2, , ..., K en un modelo como [C] es un problema de fcil solucin prctica (Seccin 1.2).
No obstante, la cuestin central acerca de los parmetros 1 2, , ..., K no reside tanto en cmo calcular numricamente estimaciones de todos ellos, sino sobre todo en cul es el
grado de abilidad o precisin de dichas estimaciones. Una posibilidad para calibrar ese grado de precisin (especialmente en entornos no experimentales), consiste en plantear ciertas hiptesis acerca de los elementos del modelo en el que guran 1 2, , ..., K , y derivar las conclusiones a las que conducen dichas hiptesis. La validez de esas conclusiones depender de si las hiptesis utilizadas son razonables, especialmente en comparacin con las caractersticas muestrales de los datos empleados.
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 11
1.1 HIPTESIS CLSICAS
H1 Linealidad con respecto a los parmetros
Los datos disponibles son una realizacin particular de una coleccin de variables aleatorias
1 11 12 1
2 21 22 21 2
1 2
[ , , , ..., ]
K
KK
N N N NK
Y X X X
Y X X X
Y X X X
W Y X X X
""
# # # #"
tal que
1 1 2 2 1... ( 1, 2, ..., )K
i i i K iK i j ij ijY X X X U X U i N == + + + + = + = , [1] donde 1 2, , ..., K son K parmetros cuyos valores (desconocidos) son los mismos en todos los puntos muestrales, y iU (1 )i N es una perturbacin aleatoria no observable asociada con el -simoi punto muestral.
Observacin preliminar II: Para modelos con trmino constante, 1 1iX ( 1, 2, ...,i N= ) ( 1 [1, 1, ..., 1] X ).
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 12
La ecuacin [1] puede escribirse como
= +Y X U , [2] donde
""
# # ## # # #"
111 12 11 1 1
2 2 221 22 2 2
1 11
1 2
, , ,
K
K
N N K NK
N K NN N NK N
X X XY U
Y UX X X
Y UX X X
=
X
XY X U
X
,
o bien como
( 1, 2, ..., )i i iY U i N= + =X , [3] donde 1 2[ , , ..., ]i i i iKX X X X es la -simai la de la matriz X. Observacin 1: Una X con un subndice puede representar, segn el contexto, una columna o una la de la matriz X. Por ejemplo, 1 2[ , , ..., ] (1 )j j j NjX X X j K X es la -simaj columna ( 1)N de X; los subndices j y k se emplean para representar columnas (variables) de X. Por otro lado, 1 2[ , , ..., ] (1 )i i i iKX X X i N X es un vector columna ( 1)K cuyo traspuesto es la -simai la (1 )K de X (ver la ecuacin [3] anterior); los subndices i y t se emplean para representar las (entidades observables o momentos) de X.
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 13
Observacin 2: El MLG tiene trmino constante cuando 1 1 para todo 1, 2, ...,iX i N = . En este caso, [1] queda 1 2 2 1 2... ( 1, 2, ..., ),
Ki i K iK i j ij ijY X X U X U i N == + + + + = + + = [1]
donde 1 es el trmino constante y 2, ..., K son las pendientes del modelo. Las ecuaciones [2] - [3] siguen siendo vlidas en este caso, redeniendo la matriz X para que su primera columna sea ahora 1 [1, 1, ..., 1]X (de manera que la -simai la de X sea ahora 2[1, , ..., ]i i iKX X X ):
12 1
22 2
2
1
1
1
K
K
N NK
X X
X X
X X
X
""
# # #"
.
Observacin 3 - Muy importante: El MLG es lineal porque los parmetros que guran en su lado derecho lo hacen de forma lineal (a lo sumo, estn multiplicados por un trmino que no depende de ningn parmetro del modelo), como en [1] y [1]. No obstante, en el MLG pueden aparecer cualesquiera transformaciones lineales y no lineales de las variables originales de inters, como en los ejemplos siguientes (donde Q y P representan variables originales):
Modelo lineal 1 2i i iQ P U = + + . [M1] Modelo log-log o logartmico 1 2ln lni i iQ P U = + + . [M2] Modelo log-lineal o semilogartmico 1 2ln i i iQ P U = + + . [M3] Modelo lineal-log 1 2 lni i iQ P U = + + . [M4]
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 14
Modelo recproco 11 2i
i iPQ U = + + . [M5] Modelo cuadrtico 21 2 3i i iiQ P P U = + + + . [M6] Modelo con interaccin 1 2 1 3 2 4 1 2( )i i i i i iQ P P P P U = + + + + . [M7]
[M1]-[M7] son casos particulares del MLG con trmino constante [1] (como puede comprobarse deniendo adecuadamente iY , ijX y K en cada caso). [M1] implica que una variacin absoluta unitaria en iP tiene el mismo efecto sobre iQ con independencia de los valores de partida de iQ y de iP . Esto no es as en [M2]-[M7]; ver Tabla 1 y Figura 1 (ver tambin el Apndice A en Ectr1-JAM-Intro.pdf). Los modelos [M1]-[M7] pueden combinarse entre s para formular modelos RLM que resultan muy exibles en la prctica; ver Ejercicio n 1.
TABLA 1 Efectos "Ceteris Paribus" y Elasticidades en Diferentes Modelos de Regresin Lineal
Modelo Efecto "Ceteris Paribus" Elasticidad
[M1] 2 2i
i
Qi iP
Q P = = 2 iiPQ
[M2] 2 2% %i i
ii
Q Qi iPP
Q P = 2
[M3] 2 2% (100 )i
i
Qi i iP
Q Q P = 2 iP
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 15
[M4] ( )212 100 %i iiQ i iPP Q P = 12 iQ [M5] ( )2212 100 %i ii iQ i iPP P Q P = 12 i iQ P [M6] 2 32
i
i
QiP
P = +
2 3( 2 )i
i
Pi QP +
[M7] 1
2 4 2i
i
QiP
P = +
12 4 2( )
i
i
Pi QP +
Observacin 4: Modelos como 21 1 21i i i iQ P P U = + + y 1 20 1 2i ii iQ P P U = + son no lineales con respecto a sus parmetros (ninguno de ellos es un caso particular del MLG). Un modelo como 1 20 1 2 i
Ui i iQ P P e
= es equivalente (tomando el logaritmo neperiano en ambos lados) a 0 1 1 2 2ln ln lni i i iQ P P U = + + + , con 0 0ln , que s es lineal con respecto a los parmetros 0 , 1 y 2 . En general, un modelo de regresin es no lineal cuando ni es lineal en su formulacin original, ni se puede convertir en un modelo lineal mediante alguna transformacin.
Observacin 5 - Muy importante: En ltima instancia, la nalidad de escoger una forma funcional concreta o de transformar las variables de inters en un modelo de regresin, es obtener un modelo cuyas perturbaciones tengan unas propiedades estadsticas (ver H3, H4 y H5) que garanticen la validez de los mtodos de inferencia (estimacin, contrastes de hiptesis y previsin) que vayan a ser utilizados. Tambin deben tenerse en cuenta las implicaciones de cada forma funcional sobre el signicado de los efectos ceteris paribus de cada variable explicativa de inters.
-
ECONOMETRA I TEMA 1 - ESPECIFICACIN Y ESTIMACIN DEL MLG
GUIN PGINA 16
2 0 >
1 2[M1]: i iQ P = +
2 0
( )1 2 1 2[M2]: ln ln exp lni i i iQ P Q P = + = +
21 0