aplicaciones de mco.pdf

7/24/2019 Aplicaciones de MCO.pdf

http://slidepdf.com/reader/full/aplicaciones-de-mcopdf 1/15

Aplicaciones deMínimos CuadradosOrdinarios en

Argentina

Santiago Hermo



1

ÍndicePunto 1. Estimación del modelo de retorno a la educación para Argentina ........................... 2

1.1)

Interpretación de los parámetros ...................................................................................... 2

1.2) Test t de significatividad individual .................................................................................... 3

1.3) y .............................................................................................................................. 3

1.4) Test F de significatividad global......................................................................................... 4

1.5) Test de White de heterocedasticidad (sin términos cruzados) ......................................... 5

1.6) Test Jarque-Bera de normalidad de los residuos ............................................................. 6

1.7) Conclusión y confiabilidad de la regresión ....................................................................... 7

Punto 2. Estimación de la curva de Philips para Argentina entre 1993-2012 .......................... 8

2.1)Interpretación de los parámetros ...................................................................................... 8

2.2)Test t de significatividad individual .................................................................................... 92.3) y .............................................................................................................................. 9

2.4)Test F de significatividad global ....................................................................................... 10

2.5) Test de White de heterocedasticidad (sin términos cruzados) ....................................... 10

2.6) Test Jarque-Bera de normalidad de los residuos ........................................................... 11

2.7) Test de Durbin-Watson de autocorrelación ................................................................... 11

2.8) Conclusión y confiabilidad de la regresión ..................................................................... 13

Bibliografía Consultada ..................................................................................................... 14



2

1) Estimación para Argentina del modelo de retorno a la educación

Se trata de un modelo para cuantificar el retorno de la educación tal como lo especificó Mincer

(1974).1

ln + ∗ + ∗ + ∗ () + Donde representa el ingreso, los coeficientes poblacionales y el término aleatorio.

Con los datos de corte transversal provistos se calculó la regresión mediante Mínimos Cuadrados

Ordinarios (en adelante, MCO), obteniendo los siguientes estimadores:

6,76859 0,08688 0,04067 0,00058

Será útil a lo largo del análisis recordar que el tamaño de muestra resulta ser 8 8 con 4

variables explicativas (considerando el intercepto).

1.1) Interpretación de los parámetros

El representa al intercepto estimado, el valor que tomaría ln si todas las variables explicativas

fueran cero. Sin embargo, no lo consideramos de este modo ya que estamos manejando datos

muestrales alejados del cero y no conocemos el comportamiento del modelo fuera del rango de

datos considerado. Entonces, nos quedamos con el intercepto como un simple indicador de la

“altura de la recta” sin considerarlo con poder explicativo.

Los coeficientes ( 2,3,4) representan cuanto cambia la variable explicada (en este caso,

nuestra variable explicada es ∗ l n ) ante un cambio unitario en la respectiva variable

explicativa. Gujarati los definiría como la semielasticidad , ya que “el coeficiente de la pendiente mide

el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor de la

regresora” . 2 En el caso de los modelos log-lin:

l n

: Al variar en un año la educación el cambio porcentual o tasa de crecimiento de Y es de 0,08688

ó 8,688 %.

: Al variar en un año la experiencia el cambio porcentual o tasa de crecimiento de Y es de

0,04067

ó 4,067 %.

: Refleja que el aumento de la experiencia cada vez aporta menos al ingreso. Al variar en un año

la experiencia el cambio porcentual negativo o tasa de decrecimiento de Y es de 0,00058 ó 0,058 %.

1 Juan José Merlo (2009): Tesis de Magíster.2 Gujarati (2009): “Econometría” 5ta ed. Página 163.



3

Es decir, un año de experiencia aumenta el ingreso en 4,067 % pero este incremento se desacelera

0,058 % por cada nuevo año de experiencia.

1.2) Test t de significatividad individual

Recordemos cómo se conforma el test. Su hipótesis nula y alternativa, respectivamente, son:

: 0 : ≠ 0

El valor crítico, en este caso, considerando un nivel de significancia 5 % y con 8 4

grados de libertad es: ±1,9886 (recordar que se trata de una prueba a dos colas).

El estadístico de prueba resulta ser:

∿ −

Recordar que hipotetizamos

0. Aquí

representa el error estándar del coeficiente.

Si || > || rechazaremos la hipótesis nula y podremos afirmar que el coeficiente estudiado resulta

significativo al 5%.

Las varianzas de los estimadores de MCO se extrajeron de la diagonal de la matriz de varianzas y

covarianzas . Calculando la raíz cuadrada de estos valores se obtuvieron los errores estándares.

Los resultados se presentan en el siguiente cuadro:

:error estándar 0,33505 0,02153 0,01527 0,00029

|| : valor absoluto t 20,20157 4,03453 2,66245 1,99464P-Value 0 0,00012 0,00929 0,04932

¿Se rechaza ? SI SI SI SI

Se puede observar que, considerados individualmente, los parámetros a resultan

estadísticamente significativos a un nivel de significación del 5 %. Es importante tener en cuenta

que, de haber considerado un del 1 % , hubiéramos rechazado la hipótesis nula en el caso de .

Su significancia individual no resulta ampliamente aceptada, pero indudablemente aporta a la

estimación. Además, puede resultar muy importante cuando consideramos la significancia conjunta.

Pero antes de probar la significatividad global necesitaremos introducir el análisis del coeficiente dedeterminación.

1.3) y

El coeficiente de determinación nos muestra la “bondad del ajuste”, se calcula utilizando

variaciones.



4

Variación Total o Suma de Cuadrados Total (SCT): ∑ ( )=

Variación Explicada o Suma de Cuadrados Explicada (SCE): ∑ ( )=

Variación No Explicada o Suma de Cuadrados Residual (SCR): ∑ ( )=

ó ó 1

Con los datos provistos la regresión arrojó un valor 0,22517. Este valor resulta ser algo bajo.

Sin embargo, existen varios problemas con el , y este sólo se usa de manera informal.3 Se

acostumbra a utilizar el coeficiente de determinación ajustado, . Éste toma en cuenta el peso de

la cantidad de variables explicativas y el tamaño de la muestra.

De todos modos podemos anticipar que el será como máximo igual al y probablemente menor

(esto se puede analizar comparando las fórmulas de ambos coeficientes). Así que el coeficiente de

determinación (ajustado o no) continuará generando incentivos a considerar al modelo pocoexplicativo.

toma varianzas en lugar de variaciones.

1 () () 1 ∑ ( )⏞

= ( )∑ ( )= ( 1)⁄ 1

∗ ( 1 )( )

El análisis en estudio nos dio un

0,1974 .

Pareciera ser que el modelo no resulta “explicativo”. Sin embargo preferimos considerar que, como

afirmó Goldberger, “una elevada no es evidencia en favor del modelo y una baja no es

evidencia en su contra”.4

1.4) Test F de significatividad global

En el caso en estudio, la hipótesis nula y alternativa del test F, respectivamente, son:

: 0 : Algún ≠ 0

El valor crítico de la distribución F, considerando un nivel de significancia 0, 05 y con 1 3 grados de libertad en el numerador y 8 4 grados de libertad en el denominador es: 2,7132 (en este caso tenemos una prueba de cola derecha). El estadístico de prueba se calcula como

sigue:

3 Pindyck y Rubinfeld (2000): “Econometría: Modelos y Pronósticos” Página 91.4 Gujarati: Op. cit. Página 206.



5

( 1)⁄ ( )⁄ 2 ( 1)

( 1 2) ( ) ∿ (−;−)

El último término se consigue reemplazando , dividiendo numerador y

denominador por SCT. Y luego reemplazando de la fórmula de

.

Si > rechazaremos la hipótesis nula y podremos afirmar que la regresión resulta significativa

globalmente con una confianza de 1 9 5 % .

Volviendo a la ecuación de Mincer, el estadístico de prueba resultó ser 8,137 con un 8,077∗10−. Con sólo observar el P-Value (comparando con se llega a la misma

conclusión) estamos seguros de rechazar la y confirmar que la regresión resulta ampliamente

significativa no sólo con 5 %, sino también a un 1 %.

1.5) Test de White de heterocedasticidad (sin términos cruzados)

Esta prueba, propuesta por Hal White, ejecuta la siguiente regresión auxiliar:

+ ∗ + ∗ + ∗ () + ∗ () + ∗ () + El objetivo es ver si las variables independientes “explican” la variabilidad del error. Se incluyen los

términos cuadráticos para cubrir la posibilidad de que las discrepancias al cuadrado sigan una forma

funcional cuadrática.

Aquí no repetiremos la variable (), ya que si lo hiciéramos existiría una colinealidad perfecta

en la matriz de datos. En cuyo caso ésta no tendrá rango completo, de modo que será singular y no

inversible. En consecuencia, no sería posible calcular los coeficientes . De modo que esta variable

es descartada inmediatamente.

La hipótesis nula es la homocedasticidad, mientras que la alternativa será la heterocedasticidad.

Cuando hay homocedasticidad, el estadístico de prueba resulta ser:

∗ 2 ∿

Se puede demostrar que este asintóticamente sigue la distribución ji cuadrada con grados de

libertad igual al número de regresoras (sin el término constante) en la regresión auxiliar.

Por lo tanto, el valor crítico del test de White con 5 % extraído de una distribución ji cuadrada

con 5 grados de libertad será 11,07.

El coeficiente de determinación de la regresión auxiliar dio 0,041067. Recordando que

N=88, el valor empírico del test de White será 88∗0,0410673,6139.

Dado que < no podemos rechazar la hipótesis nula. Por lo que la evidencia indica que

suponer homocedasticidad es válido.



6

1.6) Test Jarque-Bera de normalidad de los residuos

En este caso queremos probar si los residuos tienen normalidad. Este es un supuesto que se hace

más allá de los supuestos de Gauss-Markov y que es importante para la prueba estadística del

modelo.

Vamos a chequear la normalidad mediante la estadística Jarque-Bera:

6 ∗ + ( 3)

4 ∿

Donde [∑ ( )= ⁄ ] ⁄ es el coeficiente de asimetría o sesgo – igual a cero en la

distribución normal-, y [∑ ( )= ⁄ ] ⁄ representa la kurtosis –igual a tres en el caso

de normalidad-.

El estadístico de JB tiene una distribución chi-cuadrada con 2 grados de libertad. Por lo que,

considerando 5 % , el valor crítico resulta 5,99. Calculando el estadístico con el vector dediscrepancias del modelo obtenemos 0,23.

En vistas de que < no podemos rechazar la hipótesis nula de normalidad, por lo que este

supuesto parece muy razonable.

Observemos el siguiente gráfico de probabilidad normal obtenido con la función qqnorm() de R.



7

Recordemos que, en este gráfico, una distribución completamente normal se reproduce en una

recta, como se puede estudiar en cualquier libro de estadística. Se observa claramente que la

normalidad no es violada en absoluto. El gráfico se aproxima bastante a una función lineal.

1.7) Conclusión y confiabilidad de la regresión

Una vez analizadas todas las herramientas a nuestra disposición podemos indicar que la regresión

resulta bastante confiable. Mediante el test t vimos que todos los parámetros estimados resultaron

individualmente significativos al 5%, como así también, utilizando el test F , confirmamos la

significatividad conjunta.

También pudimos verificar, valiéndonos del test de White, que no hay evidencias que indiquen la

existencia de heterocedasticidad. Lo que indica que la obtención de los estimadores MCO fue

correcta y estos efectivamente son los Mejores Estimadores Lineales Insesgados.

Mediante el test de Jarque-Bera vimos que la suposición de normalidad de los residuos resulta

válida. Lo que le da más confiabilidad a las pruebas t y F .

El único indicio que descalifica a la regresión es el coeficiente de determinación. Sin embargo, al

estimarlo dimos los motivos por los que no consideramos que esta sea un estadístico trascendental

como para tener en cuenta, de esta manera le restamos importancia.

Podemos concluir con certeza que la regresión resulta bastante confiable y que la cuantificación del

retorno a la educación que teorizó Mincer se presenta, aproximadamente, en la realidad argentina.



8

2) Estimación de la curva de Philips para Argentina entre 1993-2012

El modelo de la curva de Phillips, según Blanchard y Pérez Enri, busca establecer una relación entre

la tasa de inflación y la tasa de desempleo. En la siguiente ecuación, extraída de su texto, se puede

deducir que: cuando aumenta la inflación esperada, aumenta la inflación; dada la inflación

esperada, cuanto mayor es el margen de precios que eligen las empresas , o cuanto más alto sonlos factores que afectan a la determinación de los salarios , mayor es la inflación; y dada la inflación

esperada, cuanto mayor es el desempleo, más baja es la inflación.5

( + + ) ∗

Donde es la tasa de inflación, es la tasa de inflación esperada, es el margen de precios queeligen las empresas y resume aquellos factores institucionales asociados a la determinación de lossalarios.Esta ecuación se puede rescribir de la siguiente forma:

ó

+ ∗ + ∗2002 +

Donde ó es la tasa de inflación del índice de precios al consumidor en el momento ,

es la tasa de desempleo en el momento , 2002 es una variable dummy que toma

valor 1 únicamente para el año 2002 y b0 agrupa a las variables + + de la precedente

ecuación presentada, extraída del texto de Blanchard y Pérez Enri.

Con los datos provistos se calculó la regresión a partir del método de MCO, obteniendo como

resultado los siguientes estimadores:

36,18776 1,99917 34,5626

Será útil recordar que la cantidad de observaciones provistas es de N=20 y con k=3 variables

explicativas (incluyendo el intercepto).

2.1) Interpretación de los parámetros

El representa al valor estimado de la agrupación de las siguientes variables: tasa de inflación

esperada, margen de precios que eligen las empresas y factores institucionales asociados a la

determinación de los salarios. En términos teóricos se trata del intercepto, el valor que tomaría la

ó cuando el desempleo es cero para cualquier año distinto del 2002 (veremos porqué

sucede esto más adelante en este mismo apartado).

El refleja cuanto cambia la variable explicada (en este caso la inflación) ante un cambio unitario

en la variable explicativa . Observamos que ante un aumento de la tasa de desempleo

de 1% , la inflación desciende en un 1,99917 %.

5 Blanchard y Pérez Enri (2000), “Macroeconomía. Teoría y Política Económica con Aplicaciones a América

Latina” Capítulo 17. Página 163.



9

Tener en cuenta que, dado que las unidades de medida son porcentajes, los estimadores se

interpretan porcentualmente. Esto NO indica en absoluto que se trate de elasticidades.

Y, por último, el estimador representa el aumento del intercepto en el año 2002 (ya que es el

único año que toma valor 1 de toda la serie de datos). Trata de expresar que en el año 2002 la

regresión se encuentra desfasada de la original. Se puede demostrar que, al tomar la esperanza delmodelo, aumenta el intercepto cuando la dummy toma el valor 1.6 En el caso en estudio, nos

indica que en el año 2002 la inflación se ve aumentada en 34,5626, ya que dado el alto desempleo

la inflación tendría que ser muy baja, lo cual no sucedió; la inflación se disparó debido a la

devaluación, pero el desempleo continuó siendo alto. Aquí es donde la dummy aporta poder

explicativo.

2.2) Test t de significatividad individual

Su hipótesis nula y alternativa, respectivamente, son:

: 0 : ≠ 0

El valor crítico, en este caso, considerando un nivel de significancia 0, 05 y con 1 7

grados de libertad es: ±2.101 (se trata de un test a dos colas).

Dado que ya se recordó la teoría en el apartado 1.2) pasaremos a los resultados rápidamente:

:error estándar 3,76212 0,27574 5,84987

|| : valor absoluto t 9,61897 7,25006 5,90827

P-Value 2,7278*10-8 1,3572*10-6 1,719*10-5

¿Se rechaza ? SI SI SI

En este caso los tres coeficientes resultan ampliamente significativos. Tenemos la primera evidencia

en favor de la regresión realizada.

2.3) y

En el apartado 1.3) explicamos porqué estos estadísticos se usan de manera informal y no son

considerados trascendentes como estadístico. Sin embargo, un más alto generalmente espreferido. Este es el caso.

Los coeficientes para la regresión en estudio son:

6 Pindyck y Rubinfeld (2000): Op. cit. Página 127 a 129



10

0,7833 0,7578

Como era de esperarse, el coeficiente de determinación ajustado es menor que el

coeficiente de determinación sin ajuste.

2.4) Test F de significatividad globalEn el caso en estudio, la hipótesis nula y alternativa del test F, respectivamente, son:

: 0 : Algún ≠ 0

El valor crítico de la distribución F, considerando un nivel de significancia 5 % y con 1 2

grados de libertad en el numerador y 1 7 grados de libertad en el denominador es: 3,59153 (en este caso tenemos una prueba de cola derecha). El estadístico de prueba se calculó de

la misma manera que en el apartado 1.4) y arrojó un valor de 30,72762

Dado que

30,73 >

3,59 rechazaremos la hipótesis nula y podremos afirmar que la

regresión resulta significativa globalmente con una confianza de 1 9 5 % . Reportamos el 2,262191∗10− que arrojó el estadístico calculado, también muestra el amplio rechazo

de la hipótesis nula y, en consecuencia, la aceptación de la significatividad global de la regresión.

2.5) Test de White de heterocedasticidad

Se ejecuta la siguiente regresión auxiliar:

+ ∗ + ∗2002 + ∗ +

Como se dijo anteriormente, el objetivo es ver si las variables independientes “explican” la

variabilidad del error. Análogamente a lo realizado para el punto 1, aquí no incluimos la posible

variable (2002), ya que es idénticamente igual a 2002. Si lo hiciéramos nos encontraríamos

con el problema de la multicolinealidad , que queremos evitar.

Como se explicó en 1.5), el estadístico de prueba resulta ser:

∗ 2 ∿

Análogamente, el valor crítico del test de White con 5 % extraído de una distribución ji

cuadrada con, ahora, 3 grados de libertad será 7,815.

El coeficiente de determinación de la regresión auxiliar dio 0,093965. Recordando que

el número de observaciones es N=20, el valor empírico del test de White será 20∗0, 0941,879 .

Dado que < no podemos rechazar la hipótesis nula. Por lo que la evidencia indica que

suponer homocedasticidad es válido.



11

2.6) Test Jarque-Bera de normalidad de los residuos

La teoría subyacente al test ya se formalizó en el apartado 1.6). Recordaremos simplemente que el

estadístico de JB tiene una distribución ji cuadrada con 2 grados de libertad. Por lo que,

considerando 5 % , el valor crítico resulta 5,99. Ahora, calculando el estadístico con el

vector de discrepancias del modelo de curva de Phillips obtenemos 1,75.

En vistas de que < no podemos rechazar la hipótesis nula de normalidad, por lo que el

supuesto de normalidad parece muy razonable.

Al igual que hicimos en 2.6), observemos el gráfico de probabilidad normal de los residuos:

Los residuos parecen presentar una asimetría a la derecha, lo cual es consistente con el

coeficiente de asimetría calculado

0,52. Sin embargo, esta no resulta lo suficientemente

marcada como para provocar el rechazo la hipótesis nula de normalidad.

2.7) Test de Durbin-Watson de autocorrelación

Con este test lo que se desea detectar es la posible existencia de autocorrelación serial entre los

residuos. Postularemos que:

∗ − +



12

Para comprobar si esta relación se cumple en la regresión en exposición utilizaremos el test de

Durbin-Watson, cuyo estadístico es:

∑ ( −)=∑ = 2 ∗ (1 )

Como se estudió en clase, este estadístico no sigue una distribución conocida, sin embargo Durbin-

Watson han estimado valores críticos en una tabla, la cual que se reproducen en Gujarati.7 Allí

fuimos con el objetivo de extraer los valores críticos Durbin-Watson con N=19 observaciones

(perdimos una al contrastar los residuos consigo mismos rezagados) y k=2 regresoras

(excluyendo el término constante):

1,074 1,536 42,464 42,926

El estadístico arrojó un 2,14637.

Nuevamente con la ayuda de Gujarati, recordemos la regla de decisión de este test:8

Dado que 1 , 5 3 6 < 2 , 1 4 6 < 4 2 , 4 6 4 , no rechazamos . Concluimos que

no existe autocorrelación. Para ver esto más claramente podemos despejar de la ecuación:

2,146372∗ (1 ) → 0,073

Este valor es muy cercano a cero y, confirma lo que ya nos había indicado el test, la ausencia de

autocorrelación significativa.

7 Gujarati: Op. cit. Página 888.8 Tabla extraída de Gujarati: Op. cit. Página 435.



13

2.8) Conclusión y confiabilidad de la regresión

Nuevamente observamos que tanto las pruebas t y la prueba F resultaron apoyar ampliamente la

significatividad de la regresión.

Mediante el test de White mostramos que no hay evidencias que indiquen la existencia de

heterocedasticidad. Lo que indica, nuevamente, que la obtención de los estimadores MCO fue

correcta y estos efectivamente son los Mejores Estimadores Lineales Insesgados.

El test de Jarque-Bera, vimos, indicó que la suposición de normalidad de los residuos resulta

también válida. Lo que le da más confiabilidad aún a las pruebas t y F .

Al contrario de lo que sucedió en el punto 1, el coeficiente de determinación resultó más alto. Lo

que, siempre teniendo en cuenta que no lo tomamos formalmente como un indicador confiable,

también apoya la regresión.

Con el test de Durbin y Watson pudimos confirmar que los residuos no presentan correlación y que

los estimadores efectivamente poseen las propiedades deseables de ser MELI.

Finalmente, podemos confirmar que la regresión MCO de la Curva de Phillips para la Argentina en

el período considerado resulta ampliamente confiable y responde a lo que indica la teoría,

evidenciando un claro trade-off entre desempleo e inflación.



14

Bibliografía Consultada

Juan José Merlo (2009): Tesis de Magíster. “Retornos a la educación durante una depresión

económica. Evidencia Empírica para la Argentina”.

Damodar N. Gujarati (2009): “Econometría” 5ta edición. Editorial: McGraw-Hill.

Robert S. Pindyck y Daniel L. Rubinfeld (2000): “Econometría: Modelos y Pronósticos” 4ta

edición. Editorial: McGraw-Hill.

Blanchard y Pérez Enri (2000): “Macroeconomía. Teoría y Polí tica Económica con

Aplicaciones a América Latina”.

Notas de Clase.

aplicaciones de mco.pdf

Documents