aplicaciones de mco.pdf
TRANSCRIPT
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 1/15
Aplicaciones deMínimos CuadradosOrdinarios en
Argentina
Santiago Hermo
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 2/15
1
ÍndicePunto 1. Estimación del modelo de retorno a la educación para Argentina ........................... 2
1.1)
Interpretación de los parámetros ...................................................................................... 2
1.2) Test t de significatividad individual .................................................................................... 3
1.3) y .............................................................................................................................. 3
1.4) Test F de significatividad global......................................................................................... 4
1.5) Test de White de heterocedasticidad (sin términos cruzados) ......................................... 5
1.6) Test Jarque-Bera de normalidad de los residuos ............................................................. 6
1.7) Conclusión y confiabilidad de la regresión ....................................................................... 7
Punto 2. Estimación de la curva de Philips para Argentina entre 1993-2012 .......................... 8
2.1)Interpretación de los parámetros ...................................................................................... 8
2.2)Test t de significatividad individual .................................................................................... 92.3) y .............................................................................................................................. 9
2.4)Test F de significatividad global ....................................................................................... 10
2.5) Test de White de heterocedasticidad (sin términos cruzados) ....................................... 10
2.6) Test Jarque-Bera de normalidad de los residuos ........................................................... 11
2.7) Test de Durbin-Watson de autocorrelación ................................................................... 11
2.8) Conclusión y confiabilidad de la regresión ..................................................................... 13
Bibliografía Consultada ..................................................................................................... 14
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 3/15
2
1) Estimación para Argentina del modelo de retorno a la educación
Se trata de un modelo para cuantificar el retorno de la educación tal como lo especificó Mincer
(1974).1
ln + ∗ + ∗ + ∗ () + Donde representa el ingreso, los coeficientes poblacionales y el término aleatorio.
Con los datos de corte transversal provistos se calculó la regresión mediante Mínimos Cuadrados
Ordinarios (en adelante, MCO), obteniendo los siguientes estimadores:
6,76859 0,08688 0,04067 0,00058
Será útil a lo largo del análisis recordar que el tamaño de muestra resulta ser 8 8 con 4
variables explicativas (considerando el intercepto).
1.1) Interpretación de los parámetros
El representa al intercepto estimado, el valor que tomaría ln si todas las variables explicativas
fueran cero. Sin embargo, no lo consideramos de este modo ya que estamos manejando datos
muestrales alejados del cero y no conocemos el comportamiento del modelo fuera del rango de
datos considerado. Entonces, nos quedamos con el intercepto como un simple indicador de la
“altura de la recta” sin considerarlo con poder explicativo.
Los coeficientes ( 2,3,4) representan cuanto cambia la variable explicada (en este caso,
nuestra variable explicada es ∗ l n ) ante un cambio unitario en la respectiva variable
explicativa. Gujarati los definiría como la semielasticidad , ya que “el coeficiente de la pendiente mide
el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor de la
regresora” . 2 En el caso de los modelos log-lin:
l n
: Al variar en un año la educación el cambio porcentual o tasa de crecimiento de Y es de 0,08688
ó 8,688 %.
: Al variar en un año la experiencia el cambio porcentual o tasa de crecimiento de Y es de
0,04067
ó 4,067 %.
: Refleja que el aumento de la experiencia cada vez aporta menos al ingreso. Al variar en un año
la experiencia el cambio porcentual negativo o tasa de decrecimiento de Y es de 0,00058 ó 0,058 %.
1 Juan José Merlo (2009): Tesis de Magíster.2 Gujarati (2009): “Econometría” 5ta ed. Página 163.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 4/15
3
Es decir, un año de experiencia aumenta el ingreso en 4,067 % pero este incremento se desacelera
0,058 % por cada nuevo año de experiencia.
1.2) Test t de significatividad individual
Recordemos cómo se conforma el test. Su hipótesis nula y alternativa, respectivamente, son:
: 0 : ≠ 0
El valor crítico, en este caso, considerando un nivel de significancia 5 % y con 8 4
grados de libertad es: ±1,9886 (recordar que se trata de una prueba a dos colas).
El estadístico de prueba resulta ser:
∿ −
Recordar que hipotetizamos
0. Aquí
representa el error estándar del coeficiente.
Si || > || rechazaremos la hipótesis nula y podremos afirmar que el coeficiente estudiado resulta
significativo al 5%.
Las varianzas de los estimadores de MCO se extrajeron de la diagonal de la matriz de varianzas y
covarianzas . Calculando la raíz cuadrada de estos valores se obtuvieron los errores estándares.
Los resultados se presentan en el siguiente cuadro:
:error estándar 0,33505 0,02153 0,01527 0,00029
|| : valor absoluto t 20,20157 4,03453 2,66245 1,99464P-Value 0 0,00012 0,00929 0,04932
¿Se rechaza ? SI SI SI SI
Se puede observar que, considerados individualmente, los parámetros a resultan
estadísticamente significativos a un nivel de significación del 5 %. Es importante tener en cuenta
que, de haber considerado un del 1 % , hubiéramos rechazado la hipótesis nula en el caso de .
Su significancia individual no resulta ampliamente aceptada, pero indudablemente aporta a la
estimación. Además, puede resultar muy importante cuando consideramos la significancia conjunta.
Pero antes de probar la significatividad global necesitaremos introducir el análisis del coeficiente dedeterminación.
1.3) y
El coeficiente de determinación nos muestra la “bondad del ajuste”, se calcula utilizando
variaciones.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 5/15
4
Variación Total o Suma de Cuadrados Total (SCT): ∑ ( )=
Variación Explicada o Suma de Cuadrados Explicada (SCE): ∑ ( )=
Variación No Explicada o Suma de Cuadrados Residual (SCR): ∑ ( )=
ó ó 1
Con los datos provistos la regresión arrojó un valor 0,22517. Este valor resulta ser algo bajo.
Sin embargo, existen varios problemas con el , y este sólo se usa de manera informal.3 Se
acostumbra a utilizar el coeficiente de determinación ajustado, . Éste toma en cuenta el peso de
la cantidad de variables explicativas y el tamaño de la muestra.
De todos modos podemos anticipar que el será como máximo igual al y probablemente menor
(esto se puede analizar comparando las fórmulas de ambos coeficientes). Así que el coeficiente de
determinación (ajustado o no) continuará generando incentivos a considerar al modelo pocoexplicativo.
toma varianzas en lugar de variaciones.
1 () () 1 ∑ ( )⏞
= ( )∑ ( )= ( 1)⁄ 1
∗ ( 1 )( )
El análisis en estudio nos dio un
0,1974 .
Pareciera ser que el modelo no resulta “explicativo”. Sin embargo preferimos considerar que, como
afirmó Goldberger, “una elevada no es evidencia en favor del modelo y una baja no es
evidencia en su contra”.4
1.4) Test F de significatividad global
En el caso en estudio, la hipótesis nula y alternativa del test F, respectivamente, son:
: 0 : Algún ≠ 0
El valor crítico de la distribución F, considerando un nivel de significancia 0, 05 y con 1 3 grados de libertad en el numerador y 8 4 grados de libertad en el denominador es: 2,7132 (en este caso tenemos una prueba de cola derecha). El estadístico de prueba se calcula como
sigue:
3 Pindyck y Rubinfeld (2000): “Econometría: Modelos y Pronósticos” Página 91.4 Gujarati: Op. cit. Página 206.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 6/15
5
( 1)⁄ ( )⁄ 2 ( 1)
( 1 2) ( ) ∿ (−;−)
El último término se consigue reemplazando , dividiendo numerador y
denominador por SCT. Y luego reemplazando de la fórmula de
.
Si > rechazaremos la hipótesis nula y podremos afirmar que la regresión resulta significativa
globalmente con una confianza de 1 9 5 % .
Volviendo a la ecuación de Mincer, el estadístico de prueba resultó ser 8,137 con un 8,077∗10−. Con sólo observar el P-Value (comparando con se llega a la misma
conclusión) estamos seguros de rechazar la y confirmar que la regresión resulta ampliamente
significativa no sólo con 5 %, sino también a un 1 %.
1.5) Test de White de heterocedasticidad (sin términos cruzados)
Esta prueba, propuesta por Hal White, ejecuta la siguiente regresión auxiliar:
+ ∗ + ∗ + ∗ () + ∗ () + ∗ () + El objetivo es ver si las variables independientes “explican” la variabilidad del error. Se incluyen los
términos cuadráticos para cubrir la posibilidad de que las discrepancias al cuadrado sigan una forma
funcional cuadrática.
Aquí no repetiremos la variable (), ya que si lo hiciéramos existiría una colinealidad perfecta
en la matriz de datos. En cuyo caso ésta no tendrá rango completo, de modo que será singular y no
inversible. En consecuencia, no sería posible calcular los coeficientes . De modo que esta variable
es descartada inmediatamente.
La hipótesis nula es la homocedasticidad, mientras que la alternativa será la heterocedasticidad.
Cuando hay homocedasticidad, el estadístico de prueba resulta ser:
∗ 2 ∿
Se puede demostrar que este asintóticamente sigue la distribución ji cuadrada con grados de
libertad igual al número de regresoras (sin el término constante) en la regresión auxiliar.
Por lo tanto, el valor crítico del test de White con 5 % extraído de una distribución ji cuadrada
con 5 grados de libertad será 11,07.
El coeficiente de determinación de la regresión auxiliar dio 0,041067. Recordando que
N=88, el valor empírico del test de White será 88∗0,0410673,6139.
Dado que < no podemos rechazar la hipótesis nula. Por lo que la evidencia indica que
suponer homocedasticidad es válido.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 7/15
6
1.6) Test Jarque-Bera de normalidad de los residuos
En este caso queremos probar si los residuos tienen normalidad. Este es un supuesto que se hace
más allá de los supuestos de Gauss-Markov y que es importante para la prueba estadística del
modelo.
Vamos a chequear la normalidad mediante la estadística Jarque-Bera:
6 ∗ + ( 3)
4 ∿
Donde [∑ ( )= ⁄ ] ⁄ es el coeficiente de asimetría o sesgo – igual a cero en la
distribución normal-, y [∑ ( )= ⁄ ] ⁄ representa la kurtosis –igual a tres en el caso
de normalidad-.
El estadístico de JB tiene una distribución chi-cuadrada con 2 grados de libertad. Por lo que,
considerando 5 % , el valor crítico resulta 5,99. Calculando el estadístico con el vector dediscrepancias del modelo obtenemos 0,23.
En vistas de que < no podemos rechazar la hipótesis nula de normalidad, por lo que este
supuesto parece muy razonable.
Observemos el siguiente gráfico de probabilidad normal obtenido con la función qqnorm() de R.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 8/15
7
Recordemos que, en este gráfico, una distribución completamente normal se reproduce en una
recta, como se puede estudiar en cualquier libro de estadística. Se observa claramente que la
normalidad no es violada en absoluto. El gráfico se aproxima bastante a una función lineal.
1.7) Conclusión y confiabilidad de la regresión
Una vez analizadas todas las herramientas a nuestra disposición podemos indicar que la regresión
resulta bastante confiable. Mediante el test t vimos que todos los parámetros estimados resultaron
individualmente significativos al 5%, como así también, utilizando el test F , confirmamos la
significatividad conjunta.
También pudimos verificar, valiéndonos del test de White, que no hay evidencias que indiquen la
existencia de heterocedasticidad. Lo que indica que la obtención de los estimadores MCO fue
correcta y estos efectivamente son los Mejores Estimadores Lineales Insesgados.
Mediante el test de Jarque-Bera vimos que la suposición de normalidad de los residuos resulta
válida. Lo que le da más confiabilidad a las pruebas t y F .
El único indicio que descalifica a la regresión es el coeficiente de determinación. Sin embargo, al
estimarlo dimos los motivos por los que no consideramos que esta sea un estadístico trascendental
como para tener en cuenta, de esta manera le restamos importancia.
Podemos concluir con certeza que la regresión resulta bastante confiable y que la cuantificación del
retorno a la educación que teorizó Mincer se presenta, aproximadamente, en la realidad argentina.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 9/15
8
2) Estimación de la curva de Philips para Argentina entre 1993-2012
El modelo de la curva de Phillips, según Blanchard y Pérez Enri, busca establecer una relación entre
la tasa de inflación y la tasa de desempleo. En la siguiente ecuación, extraída de su texto, se puede
deducir que: cuando aumenta la inflación esperada, aumenta la inflación; dada la inflación
esperada, cuanto mayor es el margen de precios que eligen las empresas , o cuanto más alto sonlos factores que afectan a la determinación de los salarios , mayor es la inflación; y dada la inflación
esperada, cuanto mayor es el desempleo, más baja es la inflación.5
( + + ) ∗
Donde es la tasa de inflación, es la tasa de inflación esperada, es el margen de precios queeligen las empresas y resume aquellos factores institucionales asociados a la determinación de lossalarios.Esta ecuación se puede rescribir de la siguiente forma:
ó
+ ∗ + ∗2002 +
Donde ó es la tasa de inflación del índice de precios al consumidor en el momento ,
es la tasa de desempleo en el momento , 2002 es una variable dummy que toma
valor 1 únicamente para el año 2002 y b0 agrupa a las variables + + de la precedente
ecuación presentada, extraída del texto de Blanchard y Pérez Enri.
Con los datos provistos se calculó la regresión a partir del método de MCO, obteniendo como
resultado los siguientes estimadores:
36,18776 1,99917 34,5626
Será útil recordar que la cantidad de observaciones provistas es de N=20 y con k=3 variables
explicativas (incluyendo el intercepto).
2.1) Interpretación de los parámetros
El representa al valor estimado de la agrupación de las siguientes variables: tasa de inflación
esperada, margen de precios que eligen las empresas y factores institucionales asociados a la
determinación de los salarios. En términos teóricos se trata del intercepto, el valor que tomaría la
ó cuando el desempleo es cero para cualquier año distinto del 2002 (veremos porqué
sucede esto más adelante en este mismo apartado).
El refleja cuanto cambia la variable explicada (en este caso la inflación) ante un cambio unitario
en la variable explicativa . Observamos que ante un aumento de la tasa de desempleo
de 1% , la inflación desciende en un 1,99917 %.
5 Blanchard y Pérez Enri (2000), “Macroeconomía. Teoría y Política Económica con Aplicaciones a América
Latina” Capítulo 17. Página 163.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 10/15
9
Tener en cuenta que, dado que las unidades de medida son porcentajes, los estimadores se
interpretan porcentualmente. Esto NO indica en absoluto que se trate de elasticidades.
Y, por último, el estimador representa el aumento del intercepto en el año 2002 (ya que es el
único año que toma valor 1 de toda la serie de datos). Trata de expresar que en el año 2002 la
regresión se encuentra desfasada de la original. Se puede demostrar que, al tomar la esperanza delmodelo, aumenta el intercepto cuando la dummy toma el valor 1.6 En el caso en estudio, nos
indica que en el año 2002 la inflación se ve aumentada en 34,5626, ya que dado el alto desempleo
la inflación tendría que ser muy baja, lo cual no sucedió; la inflación se disparó debido a la
devaluación, pero el desempleo continuó siendo alto. Aquí es donde la dummy aporta poder
explicativo.
2.2) Test t de significatividad individual
Su hipótesis nula y alternativa, respectivamente, son:
: 0 : ≠ 0
El valor crítico, en este caso, considerando un nivel de significancia 0, 05 y con 1 7
grados de libertad es: ±2.101 (se trata de un test a dos colas).
Dado que ya se recordó la teoría en el apartado 1.2) pasaremos a los resultados rápidamente:
:error estándar 3,76212 0,27574 5,84987
|| : valor absoluto t 9,61897 7,25006 5,90827
P-Value 2,7278*10-8 1,3572*10-6 1,719*10-5
¿Se rechaza ? SI SI SI
En este caso los tres coeficientes resultan ampliamente significativos. Tenemos la primera evidencia
en favor de la regresión realizada.
2.3) y
En el apartado 1.3) explicamos porqué estos estadísticos se usan de manera informal y no son
considerados trascendentes como estadístico. Sin embargo, un más alto generalmente espreferido. Este es el caso.
Los coeficientes para la regresión en estudio son:
6 Pindyck y Rubinfeld (2000): Op. cit. Página 127 a 129
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 11/15
10
0,7833 0,7578
Como era de esperarse, el coeficiente de determinación ajustado es menor que el
coeficiente de determinación sin ajuste.
2.4) Test F de significatividad globalEn el caso en estudio, la hipótesis nula y alternativa del test F, respectivamente, son:
: 0 : Algún ≠ 0
El valor crítico de la distribución F, considerando un nivel de significancia 5 % y con 1 2
grados de libertad en el numerador y 1 7 grados de libertad en el denominador es: 3,59153 (en este caso tenemos una prueba de cola derecha). El estadístico de prueba se calculó de
la misma manera que en el apartado 1.4) y arrojó un valor de 30,72762
Dado que
30,73 >
3,59 rechazaremos la hipótesis nula y podremos afirmar que la
regresión resulta significativa globalmente con una confianza de 1 9 5 % . Reportamos el 2,262191∗10− que arrojó el estadístico calculado, también muestra el amplio rechazo
de la hipótesis nula y, en consecuencia, la aceptación de la significatividad global de la regresión.
2.5) Test de White de heterocedasticidad
Se ejecuta la siguiente regresión auxiliar:
+ ∗ + ∗2002 + ∗ +
Como se dijo anteriormente, el objetivo es ver si las variables independientes “explican” la
variabilidad del error. Análogamente a lo realizado para el punto 1, aquí no incluimos la posible
variable (2002), ya que es idénticamente igual a 2002. Si lo hiciéramos nos encontraríamos
con el problema de la multicolinealidad , que queremos evitar.
Como se explicó en 1.5), el estadístico de prueba resulta ser:
∗ 2 ∿
Análogamente, el valor crítico del test de White con 5 % extraído de una distribución ji
cuadrada con, ahora, 3 grados de libertad será 7,815.
El coeficiente de determinación de la regresión auxiliar dio 0,093965. Recordando que
el número de observaciones es N=20, el valor empírico del test de White será 20∗0, 0941,879 .
Dado que < no podemos rechazar la hipótesis nula. Por lo que la evidencia indica que
suponer homocedasticidad es válido.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 12/15
11
2.6) Test Jarque-Bera de normalidad de los residuos
La teoría subyacente al test ya se formalizó en el apartado 1.6). Recordaremos simplemente que el
estadístico de JB tiene una distribución ji cuadrada con 2 grados de libertad. Por lo que,
considerando 5 % , el valor crítico resulta 5,99. Ahora, calculando el estadístico con el
vector de discrepancias del modelo de curva de Phillips obtenemos 1,75.
En vistas de que < no podemos rechazar la hipótesis nula de normalidad, por lo que el
supuesto de normalidad parece muy razonable.
Al igual que hicimos en 2.6), observemos el gráfico de probabilidad normal de los residuos:
Los residuos parecen presentar una asimetría a la derecha, lo cual es consistente con el
coeficiente de asimetría calculado
0,52. Sin embargo, esta no resulta lo suficientemente
marcada como para provocar el rechazo la hipótesis nula de normalidad.
2.7) Test de Durbin-Watson de autocorrelación
Con este test lo que se desea detectar es la posible existencia de autocorrelación serial entre los
residuos. Postularemos que:
∗ − +
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 13/15
12
Para comprobar si esta relación se cumple en la regresión en exposición utilizaremos el test de
Durbin-Watson, cuyo estadístico es:
∑ ( −)=∑ = 2 ∗ (1 )
Como se estudió en clase, este estadístico no sigue una distribución conocida, sin embargo Durbin-
Watson han estimado valores críticos en una tabla, la cual que se reproducen en Gujarati.7 Allí
fuimos con el objetivo de extraer los valores críticos Durbin-Watson con N=19 observaciones
(perdimos una al contrastar los residuos consigo mismos rezagados) y k=2 regresoras
(excluyendo el término constante):
1,074 1,536 42,464 42,926
El estadístico arrojó un 2,14637.
Nuevamente con la ayuda de Gujarati, recordemos la regla de decisión de este test:8
Dado que 1 , 5 3 6 < 2 , 1 4 6 < 4 2 , 4 6 4 , no rechazamos . Concluimos que
no existe autocorrelación. Para ver esto más claramente podemos despejar de la ecuación:
2,146372∗ (1 ) → 0,073
Este valor es muy cercano a cero y, confirma lo que ya nos había indicado el test, la ausencia de
autocorrelación significativa.
7 Gujarati: Op. cit. Página 888.8 Tabla extraída de Gujarati: Op. cit. Página 435.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 14/15
13
2.8) Conclusión y confiabilidad de la regresión
Nuevamente observamos que tanto las pruebas t y la prueba F resultaron apoyar ampliamente la
significatividad de la regresión.
Mediante el test de White mostramos que no hay evidencias que indiquen la existencia de
heterocedasticidad. Lo que indica, nuevamente, que la obtención de los estimadores MCO fue
correcta y estos efectivamente son los Mejores Estimadores Lineales Insesgados.
El test de Jarque-Bera, vimos, indicó que la suposición de normalidad de los residuos resulta
también válida. Lo que le da más confiabilidad aún a las pruebas t y F .
Al contrario de lo que sucedió en el punto 1, el coeficiente de determinación resultó más alto. Lo
que, siempre teniendo en cuenta que no lo tomamos formalmente como un indicador confiable,
también apoya la regresión.
Con el test de Durbin y Watson pudimos confirmar que los residuos no presentan correlación y que
los estimadores efectivamente poseen las propiedades deseables de ser MELI.
Finalmente, podemos confirmar que la regresión MCO de la Curva de Phillips para la Argentina en
el período considerado resulta ampliamente confiable y responde a lo que indica la teoría,
evidenciando un claro trade-off entre desempleo e inflación.
7/24/2019 Aplicaciones de MCO.pdf
http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 15/15
14
Bibliografía Consultada
Juan José Merlo (2009): Tesis de Magíster. “Retornos a la educación durante una depresión
económica. Evidencia Empírica para la Argentina”.
Damodar N. Gujarati (2009): “Econometría” 5ta edición. Editorial: McGraw-Hill.
Robert S. Pindyck y Daniel L. Rubinfeld (2000): “Econometría: Modelos y Pronósticos” 4ta
edición. Editorial: McGraw-Hill.
Blanchard y Pérez Enri (2000): “Macroeconomía. Teoría y Polí tica Económica con
Aplicaciones a América Latina”.
Notas de Clase.