Download - Serie Apuntes de Clase F&E N° 02 Octubre de 2020

Serie Apuntes de Finance and Econometrics Group N°02. Octubre del 2020.

ECONOMETRIA DE DATOS DE

PANEL CON APLICACIONES

EN R STUDIO

Rafael Bustamante [email protected]

La Serie Apuntes de Finance and Econometrics Group S.A.C. tiene por objetivo difundir los materiales de enseñanza generados por los docentes que tienen a su cargo el desarrollo de las asignaturas de la empresa. Estos documentos buscan proporcionar a los estudiantes una explicación de algunos temas específicos que son abordados en su formación profesional.

Serie Apuntes de Clase F&E N° 02

Octubre de 2020


ECONOMETRÍA DE DATOS DE

PANEL: APLICACIONES EN EN R

STUDIO

Rafael Bustamante Romaní

RESUMEN

El aumento de bases de datos, junto con el progreso en las técnicas econométricas, ha facilitado el

perfeccionamiento de estudios cada vez más sofisticados de los fenómenos económicos, permitiendo asesorar

más acertadamente a los responsables de la elaboración de las políticas públicas y a los hombres de negocios.

Sin embargo, estas herramientas se han tornado cada vez más complejas, demandando un alto grado de

conocimiento teórico y práctico para poder implementarlas. La metodología de Datos de Panel es una de las

más usadas en los últimos tiempos en el ámbito de la economía, las finanzas y los negocios. Su riqueza radica

en que permite trabajar simultáneamente varios periodos de tiempo y los efectos individuales, y a su vez, tratar

el problema de la endogeneidad. A pesar de las ventajas de esta técnica, existen diversos obstáculos para su

implementación, tanto metodológicos como operativos. Esta guía intenta ayudar a los alumnos, investigadores

y profesionales que buscan llevar a cabo estudios utilizando Datos de Panel, ofreciendo una pauta para manejar

y analizar datos, en forma conjunta con revisar sus fundamentos.

Palabras Claves: Econometría de datos de Panel, especificaciones, Efectos Fijos, Efectos aleatorio

Clasificación JEL: C2, C25

Estudios de Doctorado en Economía, Universidad Autónoma de México. Maestría en Economía con mención en

Finanzas, MBA CENTRUM Pontificia Universidad Católica del Perú. B. Sc. Economía, Universidad Nacional Mayor de San

Marcos. Profesor del Departamento de Economía de UNMSM. Investigador asociado al Instituto de Investigaciones

FCE – UNMSM. Investiga. Contacto: [email protected]

mailto:[email protected]

Contenido

1. Introducción ...................................................................................................................... 1

2. Metodología ...................................................................................................................... 8

2.1 Desventajas del uso de los datos de panel ......................................................................13

2.2 Efectos Fijos versus efectos Aleatorios ...........................................................................24

2.3 Nuestro marco de análisis y los estimadores alternativos ..................................................26

2.4 Estimador Within ........................................................................................................27

2.5 Estimador Between .....................................................................................................29

2.6 Estimador de mínimos cuadrados generalizados ..............................................................31

2.7 Mínimos cuadrados generalizados factibles ....................................................................34

2.8 Estimador a usar .........................................................................................................36

2.9 Efectos no observados .................................................................................................36

2.10 Existe correlación entre los efectos no observados y los Regresores ...................................38

3. Aplicaciones......................................................................................................................40

3.1. Explorando el Panel Data ..........................................................................................42

3.2. Uso de ExPanD para la exploración de datos de panel ...................................................45

3.3. Inicio de ExPanD para cargar un archivo local que contiene datos del panel .....................46

3.4. Modelo de Efectos Fijos: Modelo de covarianza, estimador Within, modelo de variable

Dummy individual, modelo de variable Dummy de mínimos cuadrados .....................................50

4. Bibliografía .......................................................................................................................76


1. Introducción

Si se dispone de información de corte transversal para un conjunto de N individuos las

ganancias de que se tienen de tener información sobre cada uno de los individuos para

distintos períodos de tiempo se pueden expresar en:

➢ Primero es que logramos expandir el tamaño de nuestra base de datos, y, con esto,

dispondremos de más grados de libertad.

➢ Segundo es el hecho de contar con información referida a varios individuos

contribuye a reducir la colinealidad que es usual encontrar en un modelo de series

de tiempo. Todo esto contribuye a incrementar la precisión de nuestros estimados;

es decir, a reducir su varianza (Beltran & Castro, 2010).

➢ Un conjunto de datos panel (o longitudinales) consta de una serie temporal para

cada miembro del corte transversal en el conjunto de datos. Como ejemplo,

suponga que se tienen las variables de salario, educación , nivel de crédito, acceso a

educación y experiencia de un grupo de individuos a los que se les hace

seguimiento por varios años. De igual forma es posible recopilar información en

unidades geográficas. Por ejemplos, datos de los gobiernos regionales de un país

sobre impuestos, salarios, nivel de ejecución del gasto público, niveles de

educación, entre otros.

La característica principal de los datos panel, que los diferencian de las combinaciones de

cortes transversales, es el hecho de que se da un seguimiento a las mismas unidades


transversales ya sean individuos, países, regiones, entre otros, durante cierto período de

tiempo (Software Shop, 2013).

Como los datos de panel exigen la repetición de las mismas unidades con el tiempo, los

conjuntos de estos datos, en particular de los individuos, hogares y empresas, son más

difíciles de conseguir que en las combinaciones de corte transversales. La ventaja es que

al tener las mismas unidades es posible controlar ciertas características inobservadas de

individuos, empresas, países, bancos, etc.

Es decir, es posible capturar inferencias causales que no es posible capturar con los cortes

transversales. La segunda ventaja de los datos panel es que permite estudiar la

importancia de los rezagos en el comportamiento o el resultado de tomar una decisión.

Esta información puede ser significativa, puesto que es de esperar que muchas políticas

económicas tengan efecto sólo al paso del tiempo.

La idea del panel es poder capturar esos factores inobservables, por ejemplo, lo que

influye en el salario de un individuo en 1990 también influirá en el mismo individuo en

1991, ese factor inobservable puede ser la capacidad o habilidades.

Ahora bien, si además explotamos el hecho de que estamos observando cómo cambia el

comportamiento de cada individuo a lo largo del tiempo, estaremos en capacidad de

construir y validar hipótesis más complejas. Al respecto, recordemos que en el análisis de

regresión nuestros esfuerzos por aislar el efecto de determinada variable sobre otra

dependen de cómo estas varían a lo largo de la muestra consideradas. Si disponemos de

una muestra de corte transversal y queremos medir el impacto de determinada

característica, lo que haremos es comparar la respuesta de un individuo que tiene la

característica con la respuesta de otro que no la tiene. Si la muestra es de series de tiempo,


lo que haremos es comparar la respuesta de un mismo individuo antes y después de

exhibir la característica (Beltran & Castro,2010).

Puesta de esta manera, nuestra técnica puede ser duramente criticada: muchos otros

elementos que influyen sobre la respuesta pueden ser distintos entre un agente y otro, o

haber cambiado a lo largo del tiempo y nosotros, erróneamente, se los estamos

atribuyendo a la variable de interés. La ausencia de experimentación controlada está

conspirando contra la posibilidad de aislar los efectos de una variable de interés. Frente

a esto, y utilizando regresiones particionadas, podríamos responder que para eso están

los controles y que por eso hay un conjunto amplio de determinantes incluidos en nuestra

regresión.

Sabemos, no obstante, que difícilmente podremos informar de todos los determinantes y

que, sobre todo cuando hablamos del comportamiento de agentes individuales, el riesgo

de que el fenómeno en estudio dependa de variables no observables es alto. Si

disponemos de una base de datos de panel, en lugar de indagar si determinado agente

está mejor que su vecino o mejor que en el pasado, lo que podemos hacer es preguntar

qué tan distinta es la mejora experimentada por el agente respecto a la mejora

experimentada por su vecino. Es decir, en lugar de evaluar: ( )i jy y− (corte transversal)

o ( )t sy y− (Serie de tiempo), los datos de panel nos posibilita comparar

( ) ( )it is jt jsy y y y− − − o, más específicamente,_ _

it i jt jy y y y

− − −

. En la expresión

anterior _

iy y _

jy se refieren a los promedios de la variable dependiente tomados sobre

las T observaciones en el tiempo para el i-ésimo y j-ésimo agente, respectivamente. Esta

suerte de "diferencia en diferencia" solo es posible si tenemos datos que varían tanto a

través del espacio como a lo largo del tiempo y nos permitiría, en principio, limpiar


aquellos efectos que influyen sobre el fenómeno bajo análisis y no tienen que ver con la

característica que se busca evaluar (Beltran & Castro, 2010).

Con respecto a esto y a la presencia de variables no observables, sabemos que la omisión

de una variable relevante conlleva la lidiar con la presencia de estimadores sesgados. Para

muestras grandes esto no debería ser un problema, excepto cuando esta omisión ocasiona

también un problema de no consistencia en nuestro estimador. Antes de preocuparnos

por la estructura de varianzas-covarianzas del error, debemos analizar la posible

presencia un regresor estocástico. Y por "regresor estocástico" no solamente hacemos

referencia a aquellos que se determinan de manera simultánea con la variable

dependiente como es el caso de un sistema de ecuaciones simultáneas, sino que hacemos

referencia a aquellos regresores que se encuentran correlacionados contemporáneamente

con el término de error a través de la relación que tienen con las variables no observables

omitidas en el modelo.

La omisión de una variable puede conducir a la obtención de estimadores no consistentes

y esto se debe, precisamente, a que esta variable no observable omitida, está usualmente

correlacionada de manera contemporánea con los regresores incluidos en el modelo. Esto

trae como consecuencia la correlación contemporánea entre el regresor y el término de

error, lo que ocasiona que el estimador de mínimos cuadrados no converja en

probabilidad al verdadero parámetro (Beltran & Castro, 2010).

Ante la sospecha de que estamos frente a una situación como esta, el camino "clásico"

pasa por la búsqueda de variables instrumentales y la construcción del estimador

respectivo, con el consabido costo en términos de pérdida de información y precisión.

Una base de datos con estructura de panel, sin embargo, nos ofrece un camino alternativo

que implica, precisamente, trabajar con los desvíos presentados líneas arriba. Si bien esto

será discutido formalmente en las secciones siguientes, no es difícil darse cuenta de que


al trabajar con un desvío como _

.i jy y

−

se le está removiendo a cada observación del

i-ésimo agente cualquier efecto no observable que se mantenga constante en el tiempo; es

decir, cualquier característica especial que este agente tiene y que no es posible capturar

a partir del conjunto de regresores propuesto.

Al tener observaciones que varían tanto a lo largo del tiempo como a través del espacio,

es posible evaluar diferencias entre las diferencias de comportamiento, lo que permite

"limpiar" las observaciones de efectos difíciles de capturar que, de otro modo, hubiesen

resultado en estimados inexactos incluso en muestras grandes (Beltran & Castro, 2010).

En el análisis de la información (económica, social, empresarial, comercial, etc.) pueden

existir diferentes dimensiones sobre las cuales interesa obtener conclusiones derivadas

de la estimación de modelos que traten de extraer relaciones de causalidad o de

comportamiento entre diferentes tipos de variables, a partir de los datos disponibles. Una

de estas dimensiones la constituye el análisis de series de tiempo, la cual incorpora

información de variables y/o unidades individuales de estudio durante un período

determinado de tiempo (dimensión temporal). En este caso, cada período de tiempo

constituye el elemento poblacional y/o muestral. Ejemplo de este tipo de datos lo

constituyen las series del PIB y de tasas de interés de un país o el número de llamadas

telefónicas de una familia a lo largo de un período determinado de tiempo.


Finalmente podemos resumir que un modelo de datos de panel es, según la definición

más extendida, un modelo que utiliza muestras recogidas a individuos a lo largo de

instantes de tiempo. Los modelos de datos de panel incluyen así información de una

muestra de agentes económicos (individuos, empresas, bancos, ciudades, países, etc.)

durante un período determinado de tiempo, combinando, por tanto, la dimensión

temporal y estructural de los datos (Rodríguez, 2016).

Los modelos de datos de panel se aplican a conjuntos o bases de datos de series de tiempo

agregadas para los mismos individuos; estos conjuntos de datos suelen tener un número

relativamente grande de individuos y pocas observaciones en el tiempo, o por el contrario

podemos tener datos para un número grande de periodos, pero para un número pequeño

de individuos. Un ejemplo de este tipo de bases de datos es el panel de hogares de la

Unión Europea (70.000 hogares en la UE), las encuestas de opiniones empresariales del

Ministerio de Industria (3.000 empresas), los índices Nielsen (5.000 hogares en España)

para medir la audiencia televisiva, etc. Estos conjuntos de datos que son conocidos como

datos de panel o datos longitudinales hay que diferenciarlos de las encuestas

transversales que son repetidas en el tiempo, pero no a los mismos individuos (por

ejemplo, la Encuesta de Población Activa)1.

1 En los paneles de datos a veces también hay que sustituir individuos por falta de respuesta, pero no es el caso de las encuestas transversales en donde la muestra se renueva de forma sistemática, de manera que, a un periodo de tiempo determinado, por ejemplo, un año, los hogares de la muestra sean diferentes a los del año anterior. La falta de respuesta en los datos de panel como en otro tipo de encuesta a al momento de los análisis estadísticos deben de purificarse, bien eliminando todos los datos del individuo con falta de respuesta o eliminando únicamente los individuos con falta de respuesta en cada variable analizada.


El principal objetivo que busca al agrupar y estudiar los datos en panel es capturar la

heterogeneidad no observable entre los agentes económicos como entre periodos

temporales.

Dado que esta heterogeneidad no se puede detectar exclusivamente con estudios de

series temporales, ni tampoco con estudios de corte transversal, hay que realizar un

análisis más dinámico incorporando a los estudios de corte transversal la dimensión

temporal de los datos.

Esta modalidad de analizar la información es muy usual en estudios de naturaleza

empresarial, ya que los efectos individuales específicos de cada empresa y los efectos

temporales del medio son determinantes cuando se trabaja con este tipo de información.

Los efectos individuales específicos se definen como aquellos que afectan de manera

desigual a cada uno de los agentes de estudio contenidos en la muestra (individuos,

empresas, bancos (Rodríguez, 2016)).

Estos efectos son invariables en el tiempo y se supone que afectan de manera directa a las

decisiones que toman dichas unidades. Usualmente, se identifica este tipo de efectos con

cuestiones de capacidad empresarial, eficiencia operativa , el “saber-hacer” (Know-

how), acceso a la tecnología, etc.

Por su parte, los efectos temporales son aquellos que afectan por igual a todas las

unidades individuales del estudio y que, además, varían en el tiempo. Este tipo de efectos

suele asociarse, por ejemplo, a shocks macroeconómicos que afectan por igual a todas las

empresas o unidades de estudio (una subida de los tipos de interés, un incremento de los

precios de la energía, un aumento de la inflación, etc.), o a cambios en la regulación de

mercados (ampliación de la Unión Europea, reducción de tarifas arancelarias, aumento

de la imposición indirecta, etc.) (Rodríguez, 2016).


2. Metodología

El objetivo de esta sección es familiarizar al lector con la estructura de la base de datos,

así como con el álgebra matricial asociada a la construcción de los distintos estimadores.

Aquí se muestra un aspecto de la generalización del álgebra de mínimos cuadrados

ordinarios aplicada a un contexto en el que se dispone de información que varía tanto a

través del espacio como a lo largo del tiempo (Beltran & Castro, 2010).

Al respecto se sugiere, la generalización que aquí discutimos se refiere al rol del

intercepto. Si disponemos de información que varía solo en una dimensión (y en ausencia

de un problema de quiebre estructural), solo tiene sentido "desviar" o "controlar" con

respecto a un promedio: aquel tomado usando toda la información disponible, ya sea a

lo largo del tiempo o a través del espacio. Conviene recordar que estos desvíos respecto

a la media son provistos, precisamente, por el intercepto2. Así, es fácil darnos cuenta de

qué está detrás de la recomendación general de incluir siempre un intercepto en el

modelo: recomendar la inclusión de un intercepto equivale a remover la influencia de la

media muestral. Sobre el fenómeno bajo análisis. Dicho de otra forma, en un modelo con

intercepto la pendiente (o "beta") asociada al i-ésimo regresor nos indicará cuánto cambia

la variable dependiente respecto a su valor medio por cada unidad que el regresar se

desvíe con respecto a su valor medio. En el contexto de un panel de datos, la información

presenta variabilidad en ambas dimensiones. Por lo mismo, será necesario decidir con

respecto a qué media controlar: (i) la media de todas las observaciones; (ii) la media

tomada a lo largo del tiempo, de cada uno de los N agentes; (iii) la media tomada a través

del espacio de cada uno de T momentos del tiempo. En lo que sigue, se discute esto

2 ¡El lector recordará la clásica demostración donde se verifica que las pendientes en un modelo con

intercepto son idénticas a las que se obtendrían si antes desviamos (o restamos) cada dato de su media o

promedio muestra! De hecho, este es un caso particular del resultado de una regresión particionada.


formalmente sin perder de vista una interpretación intuitiva basada en el rol que tiene el

intercepto. Antes de proceder a la formalización del modelo, veamos algunas definiciones

de los datos de panel:

➢ Panel Data es mezclar información de corte transversal e información temporal.

Como en el corte transversal, se recoge información de individuos y se observa

cada individuo, como en el análisis de series de tiempo, a través del tiempo. Esto

permite estudiar los efectos dinámicos y de comportamiento individual de los

problemas.

➢ Son observaciones repetidas sobre el mismo conjunto de unidades de sección

cruzada o dicho de otra forma se tiene el mismo número de observaciones en cada

unidad de sección cruzada es decir es una mezcla de ambas en la cual se recoge

información entre individuos y se observa cada individuo como el análisis de

series de tiempo, a través del tiempo.

➢ En los paneles microeconómicos, el investigador está interesado en analizar como

varía el comportamiento de los agentes económicos individuales frente a

cuestiones como sus hábitos de consumo, su situación laboral, su nivel de estudios,

etc. Estas son decisiones que dependerán de una lista de características

socioeconómicas que el analista debe especificar como variables explicativas del

modelo. Sin embargo, no todos los agentes toman sus decisiones de igual modo:

diferentes agentes, incluso si comparten las mismas características observables,

toman decisiones distintas. Ello obliga a contemplar la existencia de efectos no

observables, específicos de cada agente encuestado, generalmente constantes en el

tiempo, que inciden sobre el modo en que esta toma sus decisiones. Si estos efectos

latentes existen y no se recogen explícitamente en el modelo, se producirá un


problema de variables omitidas: los coeficientes estimados de las variables

explicativas incluidas estarán sesgados, por recoger parcialmente los efectos

individuales no observables (Greene, William, 1999).

Para entender mejor esta metodología veamos algunos aspectos matriciales.

1

2

1

1, 2,3,...

...,

.

i

i

i

iT TX

Y

Y

Para todo t

Y

TY

=

=

(1)

1 2 1

1 1 1 1

1 2 1

2 2 2 2

1 2 1

1 1 1 1

1 2 1

. . .

. . .

. . . . . . .

. . . . . . .

. . . . . . .

. . .

. . .

K k

i i i i

K K

i i i i

i

K K

iT iT iT iT

K K

iT iT iT iT TxK

X X X X

X X X X

X

X X X X

X X X X

−

−

−

− − − −

−

=

(2)

Además, los errores del modelo y la variable explicativa se expresan:

1 1

2 2

1 1

1 1

. .

: . .

. .

i

i

i

iT N

iT NTX NTX

Ademas

− −

= =

1

2

1

1

.

.

.

N

N NTX

Y

Y

Y

Y

Y

−

=

(3)


1

2

1

1, 2, 3, 1, 2, 3, .....,

.

.

.

N

N NTXK

t T i

X

N

X

X

X

X

−

=

= =

(4)

El modelo totalmente apilado es:

Y = X + (5)

jitX : Es el valor Jth de una variable explicativa i. Para todo t = 0 1, 2, 3, T.

Si existen K variables explicativas el vector de variables explicativas se puede denotar

como:

1

2

1

.

.

.

K

K

−

=

(6)

En base a lo anotado podemos afirmar que metodología de datos de panel lo que hace es

utilizar procedimientos adecuados para el manejo de las observaciones con una

dimensión de sección cruzada grande, con el objeto de estimar modelos econométricos

que incluyan entre las variables explicativas los efectos individuales no observables.

El disponer de un número reducido, T, de observaciones de cada uno de los N individuos

de la muestra, podría pensarse en estimar un modelo econométrico con cada una de las


T secciones cruzadas para luego comparar la evolución de los coeficientes del modelo a

lo largo del tiempo.

Las ventajas de modelos econométricos con información en panel, son las siguientes

(Greene, William, 1999):

• Se dispone de un gran número de datos (a través de individuos y a través del tiempo).

Por esta razón aumentan los grados de libertad y, al utilizar las diferencias

individuales en los valores de las variables explicativas, se reduce la colinealidad entre

las variables explicativas, mejorando de esta forma la eficiencia de los estimadores.

• Evita los sesgos de agregación con datos macroeconómicos.

• En general, es posible obtener estimaciones consistentes para N→ y T fijo. No

obstante, dada la creciente existencia de bases de datos longitudinales con períodos

muéstrales prolongados, existen trabajos recientes en que se consideran propiedades

asintóticas para N→ y T→ .

• La disponibilidad de datos longitudinales permite a los investigadores analizar una

variedad de importantes interrogantes económicas, que no se pueden analizar

utilizando solo información de corte transversal o sólo información de series de

tiempo.

• Permite construir y testear modelos de comportamiento más sofisticados que los

modelos econométricos estándar de series de tiempo o de corte transversal.

• Proporciona un método para resolver o reducir la magnitud de un problema

econométrico clave que siempre surge en los trabajos empíricos: siempre se señala

que la verdadera razón de porque se encuentra (o no se encuentran) ciertos efectos es


producto de la omisión de variables- debido a problemas de medición o porque ciertas

variables no son observadas – que están correlacionadas con las variables explicativas.

• Permite estudiar de una mejor manera la dinámica de los procesos de ajuste. Esto es

fundamentalmente cierto en estudios sobre el grado de duración y permanencia de

ciertos niveles de condición económica (desempleo, pobreza, riqueza).

• Permite elaborar y probar modelos relativamente complejos de comportamiento en

comparación con los análisis de series de tiempo y de corte transversal. Un ejemplo

claro de este tipo de modelos, son los que se refieren a los que tratan de medir niveles

de eficiencia técnica por parte de unidades económicas individuales (empresas,

bancos, etc.) (Beltrán, 2003).

• Permite al investigador mucha más flexibilidad para modelizar las diferencias de

comportamientos entre los individuos. Tal y como se mencionó anteriormente, la

técnica permite capturar la heterogeneidad no observable ya sea entre unidades

individuales de estudio como en el tiempo. Con base en lo anterior, la técnica permite

aplicar una serie de pruebas de hipótesis para confirmar o rechazar dicha

heterogeneidad y cómo capturarla.

2.1 Desventajas del uso de los datos de panel

• Sesgo de heterogeneidad:

Muchos paneles de datos provienen de procesos muy complicados que exigen el

comportamiento diario. Cuando se analiza series de corte transversal el supuesto típico

es que una variable económica ty es generada por una distribución de probabilidad


paramétrica del tipo ( )f y/θ , donde θ es un vector real de dimensión k “idéntico para

todos los individuos en todo instante de tiempo”. Este supuesto puede no ser realista en

el caso de datos de panel; es más ignorar la heterogeneidad en los intercepto y/o en las

pendientes es una que puede ser errada.

• Sesgo de selección:

Otra fuente de sesgo que se encuentra con frecuencia en datos de corte transversal y de

paneles de datos es que la muestra puede no haber sido extraída de manera aleatoria de

una población lo cual es poco frecuente en series de tiempo. Como consecuencia de ello

se puede tener (de Arce & Mahía, 2007):

• Amplificación del efecto de errores de medida asociados a datos de encuestas.

• Falta de representatividad de la muestra debido a:

✓ Desgaste muestral

✓ No aleatoriedad de las observaciones

Ejemplos de este tipo de limitaciones se encuentran en: La cobertura de la población de

interés, porcentajes de respuesta, preguntas confusas, distorsión deliberada de las

respuestas, etc.

'

1,2,... ; 1,2,...

it it it itY X U

i N t T

+

= = (7)

Donde i,tβ mide el efecto marginal de itx (es decir, el efecto marginal de las variables

x en el momento t para la i-ésima unidad). Este modelo es general y es necesario imponer

cierta estructura en los coeficientes; es decir, es necesario suponer que los agentes en

cuestión responden a un patrón de comportamiento generalizable a lo largo del tiempo


y/o a través del espacio. El supuesto estándar es que ,i t es constante para todo i y t,

deja abierta la posibilidad de que haya un intercepto distinto para cada agente ( )i . Esto

implica dejar abierta la posibilidad de que cada agente tenga un "comportamiento

promedio" distinto respecto del cual conviene controlar. Con consecuencia a lo anterior

si re especifiquemos nuestro modelo de la siguiente manera (Barco & Castro, 2010):

'11 1

12

1

21

( 1) ( ) ( )

2

1 0 0

1 0 0

. . . .

. . . .

. . . .

0 1 0

0 1 0

. ;D ;. . .

. . . .

. . . .

0 1 . . . 0

. . . .

. . . .

. . . .

0 0 1

T

NTx NTxN NTxK

T

NT

y x

y

y

y

y X

y

y

= = =

111

'1212

'11

'2121

( 1)

'22

'

..

..

..

;u . ;.

..

..

..

..

..

TT

NTx

TT

NTNT

u

ux

ux

ux

ux

ux

=

(8)

De la expresión anterior, es la matriz D (o matriz de dummies) la que nos permitirá

acomodar la presencia de hasta N interceptas distintos. Observar que esta matriz puede

expresarse como: N rD I i=

; donde NI es una matriz identidad de N x N, mientras que


ir se refiere a un vector unitario de Tx1. Con esto, podemos expresar el modelo en

términos matriciales de fa siguiente forma compacta:

y D X u = + + (9)

Donde y son los vectores que contienen los N interceptos y k pendientes,

respectivamente.

Para hallar las expresiones asociadas al estimador mínimo cuadrático de estos

intercepto y pendientes, basta con recordar lo que sabemos sobre el rol del intercepto y

el modelo en desviaciones: desviemos cada observación respecto de la media de cada

agente tomada sobre el tiempo, construyamos el estimador mínimo cuadrático de las

pendientes y utilicemos este último para hallar los N interceptos. Para el i-ésimo agente,

la media tomada sobre el tiempo T de la variable dependiente viene dada por

( )1

1/T

it

t

T y=

. Lo mismo aplica para el término de error y las variables explicativas.

Denotemos estas medias como, _ _ _

..., , iii

y u X respectivamente. Así, el modelo en

desviaciones y los respectivos estimadores pueden expresarse de la siguiente manera

(Barco & Castro, 2010):


'

'_ _ _

. ..

_ _ _'

. .

1_ _

'. .

'_ _

, ..

( )

( )( )

it i it it

i iii

i iit it iti

i iWithin it it

it

i Within i Withini

y x u

y x u

y y x x u u

x x x x

y x

−

= + +

= + +

− = − + −

= − −

= −

(10)

Nótese que hemos llamado Within a este estimador mínimo cuadrático de un modelo

desviado respecto a la media de cada agente. El término Within (o "intra", en castellano)

responde, precisamente, a que estamos explotando la variabilidad intraagente. Estamos

interesados en estimar cuánto cambia el comportamiento del agente respecto de su

comportamiento promedio, cuando alguno de los factores que lo explican ( )x , se desvía

en una unidad, respecto de lo que en promedio le ocurre al agente en cuestión. Al hacerlo,

estamos reconociendo que cada agente puede registrar un comportamiento promedio

distinto al del resto (Beltran &Castro,2010).

Pensemos ahora en términos de todas las observaciones y en la transformación matricial

requerida para desviar cada dato correspondiente al i-ésimo agente de su respectiva

media. Para esto, empecemos por darnos cuenta de que es necesario calcular N

promedios, y que un arreglo matricial como el siguiente es capaz de devolvernos los N

promedios que necesitamos.


1.

1.

12.

2.

N.

1 . . . 1

. .

. .

.. .

.1 1 0

..

tal que y .

.

0 1 . . . 1.

. ..

. ..

. .

1 . . . 1

NTxNT NTx

y

y

P P y

y

y

−

−

−

−

−

= =

(11)

La matriz P puede ser expresada de manera más compacta, y basta con restarla de la

matriz identidad para encontrar la matriz de transformación que desvía cada dato de su

respectivamente. Denotemos esta matriz como Q.

'1N T T

NT

P I i iT

Q I P

=

= − (12)

Este par de matrices juega un papel muy importante en el momento de construir los

estimadores alternativos que preliminarmente podemos identificarlos como proyectores

o, "hacedor de estimados" (o "hacedor de medias") y "hacedor de los residuos" (o "hacedor

de desviaciones"), respectivamente. Como ocurre con todo el proyector mínimo

cuadráticos, el lector puede verificar rápidamente que estas dos matrices son simétricas

e idempotentes.

Con esto, es posible expresar (12.) de manera más compacta como:


' 1 '

1

=

= (I i )

Qy = Q(I i ) Q Q

= Q Q

=(XQ QX) XQ Qy

=(XQX) XQy

N T

N T

Within

y D X u

X u

X u

X u

−

−

+ +

+ +

+ +

+ (13)

Ahora bien, si recordamos el resultado asociado al modelo en desviaciones, notaremos

que el resultado anterior debería ser equivalente al que obtendríamos si incluimos un

intercepto distinto para cada agente. Formalmente3:

' 1 '

' '

=

=(X M X) X M y

M ( )

Within D D

D NT

y D X u

I D D D D

−

+ +

= −

(14)

Las expresiones dadas en (12.) y (13.) no implican que se tenga dos maneras distintas de

expresar

Within

sino, más bien, implican que 4 MD Q= . Equivale a nuestra generalización

del resultado del modelo en desviaciones: estimar una regresión por mínimos cuadrados

ordinarios con un intercepto distinto para cada agente (resultado dado en [9.]). Equivale

a estimar una regresión con observaciones desviadas respecto del valor medio

correspondiente al agente en cuestión (resultado dado en la ecuación 14).

3 Esta expresión muestra de manera explícita cómo este acápite es una aplicación del resultado de regresión

particionada. Si partimos de un modelo general y X u= + y particionamos la matriz X en dos subconjuntos de

regresores de la forma, es posible demostrar que las pendientes estimadas del segundo grupo de regresores vienen

dadas por: ' 1 '

2 1 2 2 1(X M X ) X M y

−= , donde ' 1 '

1 1 1 1 1( )M I X X X X−= −

4 Esta igualdad se puede verificar fácilmente trabajando con las propiedades del producto Kronecker)


Hasta ahora, nuestra discusión se ha centrado en la segunda de las tres opciones

presentadas al inicio del párrafo cuando nos referíamos a que en un panel de datos

hay tres medias distintas que pueden servir como controles. ¿Es posible realizar un

análisis similar trabajando con la media (tomada a través del espacio) de cada uno de los

T momentos del tiempo? ¿Respecto de qué estaremos controlando en este caso?

Empezamos a responder estas preguntas planteando la posibilidad de que exista un

intercepto distinto para cada momento del tiempo. Definamos, para esto, como a

la media tomada sobre el espacio de la variable dependiente del t-ésimo momento

.

1

(1/ )N

itt

i

y N y−

=

= .

'

'_ _ _

.t .t.t

_ _ _'

.t .t.t

1_ _

'.t .t

' _ _

.tt, .t

( )

( )( )

it t it it

t

it it it

Within it it

it

Within Within

y x u

y x u

y y x x u u

x x x x

y x

−

= + +

= + +

− = − + −

= − −

= −

(15)

Nótese que también hemos llamado Within a este estimador. De hecho, le corresponde el

término "intra", solo que esta vez lo que buscamos es explotar la variabilidad

intratemporal.

-

.ty


Nuestro interés recae en conocer cuánto cambia el comportamiento del agente respecto

del comportamiento promedio del grupo, cuando alguno de los factores que lo explican

( )itx experimenta un desvío, en una unidad, respecto del valor promedio del grupo. Al

hacerlo, estamos reconociendo que en cada momento del tiempo el grupo puede registrar

un promedio distinto.

En suma, los múltiples interceptos por agente nos permiten capturar qué tan distinta es

la respuesta de un agente respecto de su respuesta promedio, y comparar esto entre

agentes para un mismo momento del tiempo. Los múltiples interceptas de tiempo, por

su parte, nos permiten capturar qué tan distinta es la respuesta de un agente respecto de

la respuesta promedio del grupo, y comparar esto entre momentos del tiempo para un

mismo agente. En ambos casos se trata de una comparación de diferencias; de ahí la

"doble diferencia" a la que se hace referencia en el acápite introductorio.

La generalización de (14.) requiere introducir matrices de intercepto y desvíos distintos,

a las que llamaremos

y D Q , respectivamente. Formalmente (Barco & Castro, 2010):


'

' ' 1

1

1

=

y =

=

=(X X) X y

=(X X) X y

N T

NT N N T

Within

D i I

Q I i i IN

y D X u

Q Q D Q X Qu

Q X Qu

Q Q Q Q

Q Q

−

−

=

= −

+ +

+ +

+ (16)

Ahora solo nos queda una de las opciones pendiente: la media de todas las observaciones.

Como se verá a continuación, es necesario introducir esta media "total" si es que se desea

trabajar con interceptas distintos para agente y tiempo, simultáneamente. Partamos de

una especificación general:

'

it i t it ity x u = + + + (17)

Y démonos cuenta de que al remover (o desviar respecto de) las medias por agente y

tiempo, todavía están presentes los valores promedio de estos interceptas. Formalmente:


' _ _

. ..

' _ _ _

.t .t.t

' _ _ _ _ _ _ _ _

. . . .t. .t

(1/ )

(1/ N)

( )

i ii ti

i t

i t iit it iti

Ty x u

y x u

y y y x x x u u u

= + + +

= + + +

− − = − − + − − + − −

(18)

Donde: = = __ __1 1

,t i

it itNT NT;. Esto último implica que es posible eliminar estos

términos constantes (para proceder con la estimación de las pendientes) si sumamos el

promedio total a la ecuación dada en (17.). Este promedio total viene dado por:

_ _

y x u = = =

= + + + (19)

' _ _ _ _ _ _ _ _

. . . .t. .t( ) i t iit it iti

y y y y x x x x u u u u = = =

− − + = − − + − − + + − − +

(20)

Al regresionar _ _

. .tit iy y y y=

− − +

sobre

_ _

. .i titx x x x=

− − +

obtenemos Whitin y, con

esto, es posible hallar los estimadores de los efectos individuales y temporales:


_ _

, ..

_ _

.tt, .t

i Within iWithini

Within Within

y y x x

y y x x

= =

= =

= − − −

= − − −

(21)

Por último, el lector puede verificar que la transformación asociada pasa por pre

multiplicar el modelo por la matriz Q, la cual viene dada por:

' '1 1 1NT N T T N N TQ I I i i i i I J

T N NT

= − − + (22)

Donde J es una matriz unitaria de (NT x NT).

2.2 Efectos Fijos versus efectos Aleatorios

A partir de lo expuesto el problema radica en la estimación de N o T (o si se desea de NT)

interceptos distintos. Esto involucra suponer que iα ; ( )t

o γ son un conjunto

considerable de parámetros desconocidos. Pero que implica la estimación de un conjunto

demasiado grande de parámetros. Concentrémonos en i; y pensemos en un panel de

datos con un número bastante grande de observaciones de corte transversal (N), como en

el caso de un panel construido con encuestas de hogares realizada por los institutos de

estadísticas de los países. Dada la marcada heterogeneidad a través del espacio, de hecho,

tiene más sentido suponer que los distintos valores de i; son (al igual que la información

contenida en x) la realización de un proceso estocástico subyacente.

La distinción anterior es la que ha originado que, en algunos casos, se bosqueje una

aparente dicotomía entre un "modelo de efectos fijos" y un "modelo de efectos aleatorios''.


En el primero, se sugiere que los i ; son parámetros, mientras que en el segundo se trata

a i ; como una variable aleatoria. Sin embargo, esto puede conducir a una interpretación

errónea del rol del i , así como de los resultados de algunas de las pruebas que

advertiremos más adelante. Por lo mismo, aquí no haremos esta distinción y

supondremos que i ; recoge efectos no observables, atribuibles al i-ésimo agente y que

no varían en el tiempo. Esto no implica que más adelante no experimentemos saber más

sobre la naturaleza de i , o que no hagamos referencia a los estimadores de efectos fijos

y aleatorios.

Nuestro interés sobre la naturaleza de i , no obstante, se centrará en determinar si está

o no correlacionado con las variables explicativas del modelo. Nuestra distinción entre

"efectos fijos y "efectos aleatorios", por su parte, se referirá a la técnica de estimación por

emplear y no a la naturaleza de i .

No es difícil suponer que, en el momento de modelar las decisiones individuales de un

grupo amplio de agentes, las respuestas dependan de un conjunto también amplio de

factores, muchos de ellos no observables5.

En un modelo de corte transversal no queda más que dejar que esta heterogeneidad no

observable sea capturada por el error, y confiar en que no esté correlacionada

contemporáneamente con alguno de los regresores incluidos6. El panel, sin embargo,

ofrece una alternativa distinta, ya que hace posible controlar por esta fuente de

heterogeneidad no observable.

5 Factores como la "habilidad" o la "motivación" son sin duda determinantes de variables como la decisión de

matricularse en la educación superior o del salario por hora, pero difícilmente observables. 6 Tal como se discutió en el acápite introductorio, esta correlación contemporánea llevaría a que el estimador mínimo

cuadrático deje de exhibir la propiedad de consistencia. Una alternativa para esto es el uso del estimador de variables

instrumentales, con la subsecuente pérdida de información que su uso implica.


En lo que sigue, formalizaremos nuestros supuestos sobre la naturaleza de la data

partiendo de que i ; recoge esta heterogeneidad que no es observable pero que, sin duda,

afecta las decisiones de los agentes bajo análisis (Barco & Castro, 2010)

2.3 Nuestro marco de análisis y los estimadores alternativos

En las páginas que siguen empezaremos planteando un conjunto de supuestos sobre el

proceso generador de datos, para luego analizar las propiedades de distintos estimadores

con el objetivo de determinar cuál de ellos es el más apropiado. Como siempre, las

propiedades que privilegiaremos serán el insesgamiento y eficiencia, para muestras

pequeñas; y la consistencia para muestras grandes.

De acuerdo con nuestra discusión anterior, supongamos que la información contenida en

nuestro panel de datos puede representarse de la siguiente manera (Barco & Castro,

2010):

'

2

2

. . (0, )

. . (0, )

it it it

it i it

i

it u

y x v

v u

i i d

u i i d

= + +

= +

(23)

Es decir, supongamos que el error asociado a la observación del i-ésimo agente en el t-

ésimo momento del tiempo está compuesto de dos partes: un término que no varía a lo

largo del tiempo y recoge la heterogeneidad no observable atribuible al i-ésimo agente

( )i , que se distribuye de manera idéntica e independiente con media igual a cero y


varianza igual a 2

, y un término que registra realizaciones distintas tanto a lo largo del

tiempo como a través del espacio ( )itu que distribuye de manera idéntica e independiente

con media igual a cero y varianza igual a 2

u .

La forma compuesta que hemos supuesto para el error implica que, si bien este es

homocedástico en los residuos, exhiben correlación serial cuando se trata de un propio

agente. Formalmente: lo expresamos en la ecuación 24.

2 2

2

( )

Cov( , ) t s

it u

it is

Var v

v v

= +

= (24)

También podemos expresar el modelo y su estructura de varianzas y covarianzas del

error en términos matriciales. Formalmente: lo expresamos en la ecuación 25.

' '

' 2 2 ' 2 2

; W= ,

( )

NT

u NT N T T u NT

y W v i X

W vv I I i i I TP

= + =

= = = + = + (25)

2.4 Estimador Within

Este estimador que ya fue presentado anteriormente y, como sabemos, implica

transformar el modelo premultiplicándolo por un proyector. A diferencia de lo indicado

en la ecuación 14, aquí estamos asumiendo que solo existe un intercepto común ( ) por

estimar y que el término a; corresponde al error. Nótese que, en términos prácticos, no

existe ninguna diferencia en la expresión asociada a la estimación de las pendientes.


Como ya es usual, expresamos el estimador tanto en términos matriciales (Barco &

Castro, 2010):

−= ' 1 '( )Whitin WQW WQy (26)

Lo que equivale a regresionar:

'

'_ '

.

1_ _ _ _

' '. . . .

' =

t,

( )( ) ( )(y )

− −

−

=

= + + +

− = − + + −

= − − − −

= −

it it i it

iit it i it ii

i i iWithin it it it it i

it it

Within Within

y x u

y y x x u u

x x x x x x y

y x

(27)

En este punto cabe destacar la forma que adopta el error del modelo transformado. Al

remover de cada observación la media correspondiente al agente en cuestión (haciendo

uso del proyector Q ), el nuevo término de error, al que denominamos v resulta:

= − = −_ _

. .v v vit i iit it (28)

El nuevo término de error está "libre" de la heterogeneidad no observable asociada al

agente.

Este resultado es clave para garantizar una propiedad importante del estimador, tal como

será discutido más adelante. Por lo pronto, démonos cuenta de que este nuevo error

tampoco exhibe una matriz de varianzas-covarianzas escalar debido a la existencia de

correlación serial entre errores correspondientes a un mismo agente. Formalmente:


− = − = − + =

= − − = − + = −

_2 2 2 2 2

.

_ _2 2 2

. .

1(v ) (u u ) (2 / T) (1 / )

(v ,v ) (u u ) (u u ) (2 / ) (1 / ) (1 / )

it it i u u u u

it is it i st i u u u

TVar E T

T

Cov E T T T

(29)

O de manera compacta:

= = + =

' ' 2 2 2( v v ) (Qvv Q) Qu NT u

E E I TP Q Q (30)

Al igual que el estimador mínimo cuadrático, el estimador Within es insesgado. El

resultado dado en (27.) (y, en particular, la existencia de correlación serial en los errores)

implica que el estimador Within no es eficiente, excepto si =2 0u

o T tiende a infinito

( )→T .

2.5 Estimador Between

Así como existe un estimador Within que aprovecha la variabilidad intra agentes, es

posible construir un estimador Between que tome en cuenta la variabilidad inter agentes.

Para esto basta con tomar los promedios para cada agente y utilizar esta información

como si se tratase de una base de datos de corte transversal. Como sabemos, estos

promedios son tomados por el proyector P, por lo que:

= ' -1 '(W PW) W QyBetween (31)


Lo que equivale a regresionar

'_ _ _

..

1_ _ _ _

' '. . . .

' =

( )( ) ( )( )

Between Between

it iii

i i iBetween i

i i

y x u

x x x x x x y y

y x

− = = = =

=

= + + +

= − − − −

= −

(32)

Al igual que sus predecesores (y siempre y cuando el error sea independiente en media

de los regresores: =(v / ) 0E X el estimador Between es insesgado. Asimismo, tampoco es

eficiente. De hecho, el término de error del modelo transformado = +_ _

it .v ii también

exhibe autocorrelación.

= = + = +

2 _ _ _ __

2 2it isit

1Var(v) (v ,v ) ii u u

Cov E uT (33)

O, en términos más compactos:

= = + = +

_ _' 2 2 2 2( v v ) E(PvvP) P ( )P

u NT uE I TP P

(34)


2.6 Estimador de mínimos cuadrados generalizados

Ninguno de los tres estimadores presentados anteriormente son eficientes. Para

garantizar esto, es preciso convertir el modelo de modo que el “nuevo” error del modelo

exhiba una matriz de varianzas-covarianzas escalar. Ninguna de las tres

transformaciones consideradas hasta ahora lo consigue5.

Definamos como R a la matriz que transforma al modelo de modo que el nuevo error

tenga una estructura de varianzas-covarianzas escalar. Esto implica que R debe ser tal

que:

' 1R R c −= (35)

Donde c es un escalar positivo. Es posible demostrar que la forma de esta matriz viene

dada por:

2

2 2

(1 )NT

u

u

R I P Q P

= − = +

=+

(36)

Es decir que la transformación que garantiza un estimador eficiente es aquella que

remueve de cada observación una proporción (1 )− de su media, donde es función de

las varianzas de los dos componentes del error. De hecho, no es difícil demostrar que la

estructura de varianzas-covarianzas del error transformado Rv es escalar:

' ' 2 2 2 2( ) ( ) ( )u NT u uE RVV R Q I TP Q P Q P I = + + + = + = (37)


Lo anterior garantiza que el estimador asociado sea eficiente, y, por lo mismo, pertenece

a la clase de estimadores de mínimos cuadrados generalizados (MCG).

' 1 ' 1 1 1( ) ( )MCG WR RW WR Ry W W W y

− − − −= = (38)

Lo que equivale a regresionar

_

.(1 )it i

y y− − sobre una constante y _

.(1 ) iitx x− −

1_ _ _ _

. . . .(x (1 ) x )(x (1 ) x ) (x (1 ) x )(y (1 ) )i i iMCG it it it it i

it it

x x x y y

− = = = =

= − − − − − − − − − − − − (39)

De manera compacta podemos escribirlo:

' '_ _ _ _

' 2 ' 2. . . .

'

x x xi i iMCG i

i i

MCG MCG

X QX x x X QX x y y

y x

= = = =

= =

= + − − + − −

−

(40)

La expresión anterior nos sugiere que el estimador MCG combina la información

contenida en los estimadores7 withinβ y Betwenβ .No debe extrañarnos, por tanto, que se trate

7 De hecho, es posible demostrar que el estimador MCG es un promedio ponderado de los estimadores Within y

Between:

(1 )B W

= + − , donde: 1

' _ _

2 '1 i iXQX x x x x X QX

−= =

− = − − −


de un estimador eficiente, en la medida en que explota la variabilidad tanto intra como

Inter agente.

Tan o más interesante es verificar bajo qué condiciones especiales el estimador MCG

coincide con el estimador Within o el mínimo cuadrático. Para el primer caso, recordemos

bajo qué circunstancias es el estimador Within eficiente 2 0u = o cuando T tienda a

infinito. En cualquier caso, desaparecería la correlación serial entre los errores del modelo

transformado con el proyector. Es fácil verificar que, bajo cualquiera de estas dos

situaciones, se cumple que

MCG Betwenβ =β

8 .

2

2

2 2

, 0 0

0

/ 0

R/ I

u

u

u

T

NT P Q

→ =

=

=+

=

= − = (41)

Regresemos ahora a la estructura de varianzas-covarianzas del error del modelo original

(dada en (20.)) y notemos que esta matriz sería escalar (garantizando la· eficiencia de

MICO

en caso

0MICO

= . También es fácil verificar que, en este caso, se cumple que

MCG MICOβ =β

·

8 Si

2 0u = , los efectos no observados son solo específicos del individuo, no hay generales, por lo que basta con

corregir por la presencia de a; para eliminar el problema de autocorrelación que presenta el modelo original.


2

2

2 2

0

1

/ 1

R/

u

u

NT

T

I

=

=

=+

=

= (42)

2.7 Mínimos cuadrados generalizados factibles

¿Por qué no presentar únicamente al estimador eficiente? ¿Qué utilidad puede tener la

discusión de los estimadores

Whitin

y

Betwen

La respuesta a esta pregunta tiene dos partes.

En primer lugar, es necesario notar que para construir el proyector R es necesario conocer

las varianzas de los dos componentes del error de nuestro modelo. En la práctica, esto

difícilmente será posible, así que tendremos que utilizar un estimado de dichas varianzas.

Es para la estimación de estas varianzas que 1os estimadores

Whitin

y

Betwen

nos pueden

ser útiles.

En particular, es posible demostrar que la varianza estimada del error del modelo

transformado con el proyector ( ) itQ v es un estimador consistente de 2

u . Formalmente9

2_ _

'.2 2. Pr

(y y ) (x )

iit it Whithini obit

v u

x

NT N K

− − −

= →− −

(43)

9 Si

2 0 = , directamente se elimina el problema de autocorrelación del modelo original por lo que MICO es el

estimador eficiente.


Tal como se muestra en la expresión anterior, nuestro estimador consistente de 2

u no es

otra cosa que la suma de cuadrados residual de la estimación Within, corregida por el

número apropiado de grados de libertad (Barco & Castro, 2010)

Por otro lado, la varianza estimada del error del modelo transformado con el proyector P

( )itv también nos provee información valiosa. De hecho, es posible demostrar que,

conforme N tienda a infinito, dicha varianza converge en probabilidad a una suma

ponderada de 2

u y 2

. Formalmente:

2

_ _ '

..2 2 2Pr

(y y) ( )

1 +

1

i Betweni

it ob

v u

x x

N K T

= =

− − − = →

− −

(44)

Si combinamos los resultados indicados en (40) y (41), es posible construir estimados de

2

y 2

u , con esto, nuestro estimado de y del proyector R. Esto configura lo que se

conoce como "estimador de mínimos cuadrados generalizados factibles". En particular

2

v

, provee directamente un estimador consistente de 2

u , mientras que la resta

2 21

v v

T

− nos provee un estimador consistente de 2

. Formalmente:

2 2 Pr21 ob

v v

T

− → 10

10 Nótese que el resultado de esta resta podría ser negativo. En este caso, conviene reconsiderar el uso del estimador

de efectos aleatorios.


2.8 Estimador a usar

La discusión anterior revela que hay dos preguntas claves que deben ser resueltas antes

de determinar cuál es el mejor estimador por utilizar. La primera pregunta está asociada

a la idoneidad del marco de análisis propuesto. La segunda, por su parte, se refiere a la

posibilidad de que exista correlación contemporánea entre los regresares y el término de

error.

2.9 Efectos no observados

Como se dijo, esta primera pregunta está relacionada con el marco de análisis propuesto

y, en particular, con la estructura del término de error. Al respecto, nótese que la ausencia

de efectos no observados específicos del individuo equivale a suponer que el error se

comporta de la siguiente manera: it itv u= . Dado que se asume que ( ) 0iE = , lo anterior

equivale a decir que 2 0 = .Para comprobar esta hipótesis se dispone del test de Breusch-

Pagan, cuyo estadístico (LM) se construye sobre la base de los residuos mínimo

cuadráticos (e) y, bajo la hipótesis nula, se distribuye chi-cuadrado con un grado de

libertad. Formalmente:


= = =

= = = =

= =

+

− = − − −

2

0

22 2

_

.1 1 21

2 2

1 1 1 1

: v ( 0)

: v =

LM= 1 1 (1)2( 1) 2( 1)

it it

a it it i

N T N

it ii t i

N T N T

it iti t i t

H u

H u

e T eNT NT

T Te e

(45)

Si se rechaza la hipótesis nula, se concluye que la estructura supuesta para el error es la

correcta y que, por lo mismo, se aplica el análisis desarrollado en el acápite anterior. Es

decir, que es necesario construir el estimador de mínimos cuadrados generalizados si lo

que se busca es un estimador eficiente.

Si se acepta la hipótesis nula, por otro lado, bastará con estimar las pendientes a través

de mínimos cuadrados ordinarios. De hecho, cabe recordar que en caso de 2 0 = , el

proyector R es igual a la matriz identidad y el estimador eficiente es el mínimo cuadrático.

Una estimación como esta también se conoce como un POOL: se dispone solo de los datos

agrupados y, en el momento de hacer la estimación, no hay nada que identifique a la

información de un agente o momento del tiempo particular. La ganancia, en este caso, se

debe al hecho de contar con un significativo número de grados de libertad. Al respecto,

es posible evaluar la ganancia de ajuste asociada a la introducción de interceptas

múltiples (específicos ya sea a agentes o períodos de tiempo). Para esto, se puede utilizar


una típica prueba F11; y, de encontrarse una ganancia de ajuste significativa (si se rechaza

la prueba F), se preferiría el modelo de interceptas múltiples12

2.10 Existe correlación entre los efectos no observados y los Regresores

Como se dijo, si se acepta que el error tiene la estructura it i itv u= + la búsqueda de

eficiencia requiere la construcción del estimador de mínimos cuadrados generalizados.

No obstante, esto puede poner en riesgo la propiedad de consistencia si es que existe

correlación contemporánea entre la heterogeneidad individual no observable y el término

de error. Para verificar esto y decidir si trabajamos con el estimador de mínimos

cuadrados generalizados o el estimador Within, es posible construir una prueba de

Hausman.

De acuerdo con el planteamiento general de dicha prueba, se propone comparar dos

estimadores: uno eficiente pero solo consistente bajo la hipótesis nula, y otro no eficiente

pero consistente tanto bajo la hipótesis nula como bajo la alternativa. La hipótesis nula

por evaluar es la existencia de correlación entre el error y los regreso res. Por lo mismo, y

11 Nos referimos al típico contraste basado en pérdida de ajuste, el cual también puede ser expresado sobre la base de

los R-cuadrado:

2 2

2

( )( 1, )

(1 R ) / (NT N K)

SR Pool

SR

R RF F N NT N k

−= − − − −

− − − , donde

2R SR se refiere al R-cuadrado

del modelo con interceptas múltiples (sin restringir) y

2

PoolR, corresponde al R-cuadrado del modelo pool (restringido

a un solo intercepto común). 12 Cabe recordar que la estimación con interceptas múltiples es, en principio, equivalente a la construcción del

estimador Within. Nótese, sin embargo, que existe una diferencia en los objetivos. Cuando el error se comporta de

acuerdo con nuestro marco de análisis y construimos el estimador Within, nos interesa remover la heterogeneidad no

observable del término de error para garantizar consistencia. Para esto, desviamos cada observación de su media, y la

inclusión de un intercepto distinto para cada agente es una de las maneras de hacerlo. En el caso que aquí discutimos,

donde el error ya no es un error compuesto, nuestra motivación es la ganancia de ajuste: estamos interesados en estimar

un intercepto distinto para cada agente, y el hecho de que esto sea equivalente a desviar cada dato de su media podría

entenderse como un subproducto.


de acuerdo con las propiedades discutidas hasta ahora, nuestros candidatos ideales

serían el estimador de mínimos cuadrados generalizados y el estimador Within.

El primero es eficiente pero solo consistente en ausencia de correlación, mientras que

Within no es eficiente, pero retiene la propiedad de consistencia incluso bajo la presencia

de correlación entre el término a; y los regresores.

La intuición detrás la prueba es clara: una diferencia significativa entre los estimadores

de mínimos cuadrados generalizados y Within, constituye evidencia en contra de la

consistencia del primero y esto, a su vez, constituye evidencia en contra de la ausencia de

correlación entre a; y los regresores. Por lo mismo, si se rechaza la hipótesis nula de esta

prueba, convendrá utilizar el estimador Within. Si se acepta la hipótesis nula, en tanto, se

privilegiará el uso del estimador de mínimos cuadrados generalizados13.

0

1

: ( ) 0

: ( ) 0

( )

( ) ( ) Var( )

i it

a i i it

MCG Whitin

MCG Whitin

H E x

H E x

S q Var q q

q

Var q Var

−

=

=

= −

= +

(46)

13 De hecho, cualquier combinación entre los estimadores Wíthín, Between o mínimos cuadrados generalizados

sería válida en la medida en que este último es un promedio ponderado de los dos primeros.


Antes de concluir, conviene destacar que esta no es una prueba para determinar si los

efectos individuales son "fijos" o "aleatorios''. Lo que sí es cierto es que, dependiendo de

sus resultados, se decidirá si utilizar el estimador de mínimos cuadrados generalizados

("efectos aleatorios") o el estimador Within ("efectos fijos"). Esta decisión, no obstante, no

responde a la posibilidad de que los efectos individuales no exhiban una naturaleza

aleatoria, sino a la posibilidad de que, siendo aleatorios, estén correlacionados con los

regresores (Barco & Castro, 2010)

3. Aplicaciones

Ejemplo 1.1 heterogeneidad individual: conjunto de datos de fatalidades

El conjunto de datos de Fatalities de Stock y Watson (2007) es un buen ejemplo de la

importancia de heterogeneidad individual y efectos de tiempo en un entorno de panel.

La pregunta de la investigación es si gravar a los alcohólicos puede reducir el número de

muertos en las carreteras. Lo básico La especificación relaciona la tasa de mortalidad en

la carretera con la tasa impositiva sobre la cerveza en un entorno de regresión clásico:

n i nfrate beertax = + + (47)

Los datos son de 1982 a 1988 para cada uno de los estados continentales de EE. UU. Los

elementos básicos de cualquier comando de estimación en R son una fórmula que

especifica el modelo diseño y un conjunto de datos, generalmente en forma de marco de

datos. Los conjuntos de datos de ejemplo pre empaquetados son la forma más sencilla de

importar datos, ya que solo necesita ser llamado por su nombre para recuperarlos. A


continuación, el modelo se especifica en su forma más simple, una relación bivariada

entre tasa de mortalidad y el impuesto a la cerveza.

El paso más básico es un análisis transversal de un solo año (aquí, 1982). Uno procede

primero creando un objeto modelo a través de una llamada a lm, luego mostrando un

summary. lm del mismo.

La impresión en pantalla se produce cuando se llama interactivamente a un objeto por

su nombre. Note que subconjunto se puede hacer dentro de la llamada a lm alimentando

una expresión que resuelva en un vector lógico al argumento de subconjunto: se

seleccionarán los puntos de datos correspondientes a VERDADEROS, se descartarán los

FALSOS.

data("Fatalities", package="AER")

Fatalities$frate <- with(Fatalities, fatal / pop * 10000)

fm <- frate ̃ beertax


3.1. Explorando el Panel Data

Datos de panel (también conocidos como datos de series de tiempo longitudinales o

transversales) es un conjunto de datos en el que el comportamiento de las entidades es

observado a lo largo del tiempo. Estas entidades pueden ser estados, empresas,

individuos, países, etc. Los datos del panel se ven así:


library(foreign)

Panel <-read.dta("http://dss.princeton.edu/training/Panel101.dta")

coplot(y ~ year|country, type="l", data=Panel) # Lines

coplot(y ~ year|country, type="b", data=Panel) # Points and lines

# Bars at top indicates corresponding graph (i.e. countries) from left to right

# starting on the bottom to (Muenchen/Hilbe:355)


Figura N º 1

library(foreign)


library(car)

scatterplot (y~year|country, boxplots=FALSE, smooth=TRUE, reg.line=FALSE, data=Panel)


Figura N º 2

3.2. Uso de ExPanD para la exploración de datos de panel

ExPanD es una aplicación brillante basada en las funciones del paquete ExPanDaR. Su

intención es hacer que la exploración de datos del panel sea entretenida y fácil. Con

ExPanD se puede explorar rápidamente los datos del panel, independientemente de su

origen, prototipo de diseños de prueba simples y verificarlos fuera de la muestra y brinde

a los usuarios la oportunidad de evaluar la solidez de sus hallazgos sin brindarles acceso

a los datos subyacentes.

Esta sección lo guiará a través del proceso de uso de ExPanD discutiendo tres casos de

uso. Mientras que los dos primeros utilizan datos macroeconómicos para explorar la

asociación de la Producción Interna Bruta (PIB) per cápita con la esperanza de vida al


nacer, el último caso de uso explora la asociación entre las medidas de desempeño

contable financiero y los rendimientos de las acciones concurrentes14.

3.3. Inicio de ExPanD para cargar un archivo local que contiene datos

del panel

La forma más fácil de comenzar a usar ExPanD es usarlo con un archivo de datos local

que contenga datos de panel. ExPanD admite formatos de archivo Stata, SAS, CSV, Excel

y R. Para usar ExPanD desde dentro de R, debe instalar el paquete ExPanDaR e iniciar

ExPanD.

Figura N º 3

14 Si no usa R, aún puede usar la aplicación ExPanD para explorar los datos del panel. En este caso, acceda

a la variante alojada de la aplicación ExPanD aquí y siga los consejos a continuación sobre cómo cargar un

archivo de datos de panel adecuado para la exploración en línea. No se preocupe: sus datos no se

almacenarán en el servidor y se eliminarán de la memoria una vez que se cierre la conexión al servidor.

devtools::install_github("joachim-gassen/ExPanDaR")

library(ExPanDaR)

ExPanD()


Ahora necesitas un archivo para explorar. Siéntase libre de usar lo que quiera, pero para

nuestro primer caso de uso usaré el conocido conjunto de datos gapminder

proporcionado por el paquete gapminder.

library(gapminder)

# write.csv(gapminder, file = "gapminder.csv", row.names = FALSE)

head(gapminder, 10)

#> # A tibble: 10 x 6

https://www.gapminder.org/


Para usar ExPanD, necesita lo siguiente:

• Un conjunto de datos de panel en formato largo con al menos dos variables

numéricas y sin observaciones duplicadas (identificadas por la dimensión

transversal y de serie temporal)

• Una variable o un vector de variables dentro de este conjunto de datos que

identifique la dimensión transversal

• Una variable que es coercible a un factor ordenado y que identifica (y ordena) la

dimensión de tiempo de su panel.

Como puede ver, el archivo gapminder contiene datos del año del país. Está organizado

en un formato largo utilizando el país como identificador transversal y el año como

identificador de serie temporal. Luego, cada una de las variables adicionales se almacena

en una columna separada. Tiene un factor (continente) y tres variables numéricas

country continent year lifeExp pop gdpPercap

<fct> <fct> <int> <dbl> <int> <dbl> 1 Afghanistan Asia 1952 28.8 8425333 779.

2 Afghanistan Asia 1957 30.3 9240934 821.









any(duplicated(gapminder[,c("country", "year")]))

#> [1] FALSE


(lifeExp, pop y gdpPercap). Por lo tanto, cumple con los requisitos anteriores, asumiendo

que no tiene duplicados:

Utilice la llamada a la función write.csv () comentada anterior para guardar el archivo

CSV en su sistema y el cuadro de diálogo del archivo para cargarlo en ExPanD (si no está

utilizando R, puede descargar el archivo CSV aquí). Después de cargar el archivo,

aparecerán dos cuadros de diálogo pidiéndole que seleccione los identificadores

transversales y el identificador de serie temporal.

Figura N º 4

any(duplicated(gapminder[,c("country", "year")]))

#> [1] FALSE


Seleccione el país como identificador transversal y el año como identificador de serie

temporal. ExPanD ahora procesará los datos para mostrarlos para que pueda comenzar

a explorar.

Iniciar ExPanD con un marco de datos que contiene datos de panel

Alternativamente, si está utilizando R, puede omitir el cuadro de diálogo de carga de

archivos especificando un marco de datos y sus identificadores transversales y de serie

temporal.

3.4. Modelo de Efectos Fijos: Modelo de covarianza, estimador Within,

modelo de variable Dummy individual, modelo de variable

Dummy de mínimos cuadrados

Efectos fijos: heterogeneidad entre países (o entidades)

Explorando los Datos

devtools::install_github("joachim-gassen/ExPanDaR")

library(ExPanDaR)

library(gapminder)

ExPanD(df = gapminder, cs_id = "country", ts_id = "year")

library(foreign)


coplot(y ~ year|country, type="l", data=Panel) # Lines

coplot(y ~ year|country, type="b", data=Panel) # Points and lines

# Bars at top indicates corresponding graph (i.e. countries) from left to right starting on

the bottom row #(Muenchen/Hilbe:355)


Figura N º 5

Las barras en la parte superior indican el gráfico correspondiente (es decir, países) de izquierda

a derecha comenzando en la fila inferior # (Muenchen / Hilbe: 355)


Figura N º 6


Efectos fijos: heterogeneidad a lo largo de los años

Figura N º 7


library(gplots)

plotmeans(y ~ year, main="Heterogeineityacross years", data=Panel)

# plotmeansdraw a 95% confidence interval around the means

detach("package:gplots")

# Remove package ‘gplots’ from the workspace


Regresión OLS

La regresión de MCO regular no considera la heterogeneidad entre grupos o

tiempo.

Call:

lm(formula = y ~ x1, data = Panel)

Residuals:

Min 1Q Median 3Q Max

-9.546e+09 -1.578e+09 1.554e+08 1.422e+09 7.183e+09

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 1.524e+09 6.211e+08 2.454 0.0167 *

x1 4.950e+08 7.789e+08 0.636 0.5272

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.028e+09 on 68 degrees of freedom

Multiple R-squared: 0.005905, Adjusted R-squared: -0.008714

F-statistic: 0.4039 on 1 and 68 DF, p-value: 0.5272

library(foreign)


ols<-lm(y ~ x1, data=Panel)

summary(ols)


Figura N º 8

Comparación del modelo OLS vsLSDV

Cada componente de la variable factorial (país) está absorbiendo los efectos particulares de cada

país. El predictor x1 no fue significativo en el modelo OLS, una vez que se controlaron las

diferencias entre países, x1 se volvió significativo en el OLS_DUM (es decir, el modelo LSDV).

library(foreign)


ols<-lm(y ~ x1, data=Panel)

summary(ols)

yhat <-ols$fitted

plot(Panel$x1, Panel$y, pch=19, xlab="x1", ylab="y")

abline(lm(Panel$y~Panel$x1),lwd=3, col="red")


Figura N º 9

yhat <-ols$fitted

plot(Panel$x1, Panel$y, pch=19, xlab="x1", ylab="y")


install.packages("apsrtable")

library(apsrtable)

apsrtable(ols,fixed.dum, model.names= c("OLS", "OLS_DUM"))

# Displays a table in Latex form


Call:

lm(formula = y ~ x1, data = Panel)

Residuals:


-9.546e+09 -1.578e+09 1.554e+08 1.422e+09 7.183e+09

Coefficients:


(Intercept) 1.524e+09 6.211e+08 2.454 0.0167 *

x1 4.950e+08 7.789e+08 0.636 0.5272

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Multiple R-squared: 0.005905, Adjusted R-squared: -0.008714


library(foreign)


fixed.dum <-lm(y ~ x1 + factor(country) -1, data=Panel)

summary(fixed.dum)


Call:

lm(formula = y ~ x1 + factor(country) - 1, data = Panel)

Residuals:


-8.634e+09 -9.697e+08 5.405e+08 1.386e+09 5.612e+09

Coefficients:


x1 2.476e+09 1.107e+09 2.237 0.02889 *

factor(country)A 8.805e+08 9.618e+08 0.916 0.36347

factor(country)B -1.058e+09 1.051e+09 -1.006 0.31811

factor(country)C -1.723e+09 1.632e+09 -1.056 0.29508

factor(country)D 3.163e+09 9.095e+08 3.478 0.00093 ***

factor(country)E -6.026e+08 1.064e+09 -0.566 0.57329

factor(country)F 2.011e+09 1.123e+09 1.791 0.07821 .

factor(country)G -9.847e+08 1.493e+09 -0.660 0.51190

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Multiple R-squared: 0.4402, Adjusted R-squared: 0.368

F-statistic: 6.095 on 8 and 62 DF, p-value: 8.892e-06

yhat<-fixed.dum$fitted

library(car)

scatterplot(yhat~Panel$x1|Panel$country, boxplots=FALSE, xlab="x1",

ylab="yhat",smooth=FALSE)



Figura N º 10

Comparación del modelo OLS vsLSDV

Cada componente de la variable factorial (país) está absorbiendo los efectos particulares de cada

país. El predictor x1 no fue significativo en el modelo OLS, una vez que se controlaron las

diferencias entre países, x1 se volvió significativo en el OLS_DUM (es decir, el modelo LSDV).

library(apsrtable)

apsrtable(ols,fixed.dum, model.names= c("OLS", "OLS_DUM")) # Displays a table in Latex form


Figura N º 11

Efectos fijos: intersecciones específicas de la entidad (usando plm)

\begin{table}[!ht]

\caption{}

\label{}

\begin{tabular}{ l D{.}{.}{2}D{.}{.}{2} }

\hline

& \multicolumn{ 1 }{ c }{ OLS } & \multicolumn{ 1 }{ c }{ OLS_DUM } \\ \hline

% & OLS & OLS_DUM \\

(Intercept) & 1524319070.05 ^* & \\

& (621072623.86) & \\

x1 & 494988913.90 & 2475617827.10 ^*\\

& (778861260.95) & (1106675593.60) \\

factor(country)A & & 880542403.99 \\

& & (961807052.24) \\

factor(country)B & & -1057858363.16 \\

& & (1051067684.19) \\

factor(country)C & & -1722810754.55 \\

& & (1631513751.40) \\

factor(country)D & & 3162826897.32 ^*\\

& & (909459149.66) \\

factor(country)E & & -602622000.33 \\

& & (1064291684.41) \\

factor(country)F & & 2010731793.24 \\

& & (1122809097.35) \\

factor(country)G & & -984717493.45 \\

& & (1492723118.24) \\

$N$ & 70 & 70 \\

$R^2$ & 0.01 & 0.44 \\

adj. $R^2$ & -0.01 & 0.37 \\

Resid. sd & 3028276248.26 & 2795552570.60 \\ \hline

\multicolumn{3}{l}{\footnotesize{Standard errors in parentheses}}\\

\multicolumn{3}{l}{\footnotesize{$^*$ indicates significance at $p< 0.05 $}}

\end{tabular}

\end{table}

El coeficiente de x1

indica cuánto

cambia Y cuando X

aumenta en una

unidad. Observe

que x1 no es

significativo en el

modelo OLS

El coeficiente de x1

indica cuánto cambia Y

con el tiempo,

controlando por las

diferencias entre

países, cuando X

aumenta en una

unidad. Observe que x1

es significativo en el

modelo LSDV

library(plm)

fixed <-plm(y ~ x1, data=Panel, index=c("country", "year"), model="within")

summary(fixed)


Figura N º 12


MODELO DE EFECTOS ALEATORIOS (Intercepción aleatoria, modelo de

agrupación parcial)

Oneway (individual) effect Random Effect Model

(Swamy-Arora's transformation)

Call:

plm(formula = y ~ x1, data = Panel.set, model = "random")

Balanced Panel: n = 7, T = 10, N = 70

Effects:

var std.dev share

idiosyncratic 7.815e+18 2.796e+09 0.873

individual 1.133e+18 1.065e+09 0.127

theta: 0.3611

Residuals:

Min. 1st Qu. Median Mean 3rd Qu. Max.

-8.94e+09 -1.51e+09 2.82e+08 0.00e+00 1.56e+09 6.63e+09

Coefficients:

Estimate Std. Error z-value Pr(>|z|)

(Intercept) 1037014284 790626206 1.3116 0.1896

x1 1247001782 902145601 1.3823 0.1669

Total Sum of Squares: 5.6595e+20

Residual Sum of Squares: 5.5048e+20

R-Squared: 0.02733

Adj. R-Squared: 0.013026

Chisq: 1.91065 on 1 DF, p-value: 0.16689


Efectos Fijos versus efectos Aleatorios

Para decidir entre efectos fijos o aleatorios, se puede ejecutar el test de Hausman donde la

hipótesis nula es que el modelo preferido son los efectos aleatorios frente a la alternativa los

efectos fijos (ver Green, 2008, capítulo 9). Básicamente, prueba si los errores únicos ( )iu están

correlacionados con los regresores, la hipótesis nula es que no.

Se ejecuta un modelo de efectos fijos y se guardan las estimaciones, luego se ejecutan un modelo

de efectos aleatorios y se guardan las estimaciones, finalmente se realiza la prueba. Si el valor p

es significativo (por ejemplo, <0,05), utilice el modelo de efectos fijos, si no, utilice el modelo

efectos aleatorios.

Figura N º 13

Otras pruebas / diagnósticos

Prueba de efectos fijos en el tiempo

> phtest(fixed, random)

Hausman Test

data: y ~ x1

chisq = 3.674, df = 1, p-value = 0.05527

alternative hypothesis: one model is inconsistent

Si este número es <0,05, utilice el modelo de efectos fijos

library(plm)


fixed.time<-plm(y ~ x1 + factor(year), data=Panel, index=c("country", "year"), model="within")

summary(fixed.time)


Figura N º 14

Oneway (individual) effect Within Model

Call:

plm(formula = y ~ x1 + factor(year), data = Panel, model = "within",

index = c("country", "year"))


Residuals:


-7.92e+09 -1.05e+09 -1.40e+08 0.00e+00 1.63e+09 5.49e+09

Coefficients:

Estimate Std. Error t-value Pr(>|t|)

x1 1389050354 1319849567 1.0524 0.29738

factor(year)1991 296381559 1503368528 0.1971 0.84447

factor(year)1992 145369666 1547226548 0.0940 0.92550

factor(year)1993 2874386795 1503862554 1.9113 0.06138 .

factor(year)1994 2848156288 1661498927 1.7142 0.09233 .

factor(year)1995 973941306 1567245748 0.6214 0.53698

factor(year)1996 1672812557 1631539254 1.0253 0.30988

factor(year)1997 2991770063 1627062032 1.8388 0.07156 .

factor(year)1998 367463593 1587924445 0.2314 0.81789

factor(year)1999 1258751933 1512397632 0.8323 0.40898

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1



R-Squared: 0.23229

Adj. R-Squared: 0.00052851


pFtest(fixed.time, fixed)

plmtest(fixed, c("time"), type=("bp"))


Figura N º 15

Prueba de efectos aleatorios: multiplicador de Breusch-

Pagan Lagrange (LM)

pFtest(fixed.time, fixed)

F test for individual effects

data: y ~ x1 + factor(year)

F = 1.209, df1 = 9, df2 = 53, p-value = 0.3094

alternative hypothesis: significant effects

> plmtest(fixed, c("time"), type=("bp"))

Lagrange Multiplier Test - time effects (Breusch-Pagan) for

balanced panels

data: y ~ x1

chisq = 0.16532, df = 1, p-value = 0.6843


Si este número es

<0,05, utilice efectos

de tiempo fijo. En

este ejemplo, no es

necesario utilizar

efectos de tiempo

fijo.

# Regular OLS (pooling model) using plm

pool <-plm(y ~ x1, data=Panel, index=c("country", "year"), model="pooling")

summary(pool)


Figura N º 16

La prueba LM le ayuda a decidir entre una regresión de efectos aleatorios y una regresión OLS

simple.

La hipótesis nula en la prueba LM es que las varianzas entre entidades es cero. Es decir, no hay

diferencias significativas entre las unidades (es decir, sin efecto de panel).

Pooling Model

Call:

plm(formula = y ~ x1, data = Panel, model = "pooling",

index = c("country", "year"))


Residuals:


-9.55e+09 -1.58e+09 1.55e+08 0.00e+00 1.42e+09 7.18e+09

Coefficients:

Estimate Std. Error t-value Pr(>|t|)

(Intercept) 1524319070 621072624 2.4543 0.01668 *

x1 494988914 778861261 0.6355 0.52722

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1



R-Squared: 0.0059046

Adj. R-Squared: -0.0087145


# Breusch-Pagan Lagrange Multiplier for random effects.

# Null is no panel effect (i.e. OLS better).

plmtest(pool, type=c("bp"))


Figura N º 17

Prueba de dependencia transversal / correlación contemporánea:

utilizando la prueba de independencia Breusch-Pagan LM y la prueba CD

de Pasaran

Según Baltagi, la dependencia transversal es un problema en paneles macro con series de

tiempo largas. Esto no es un gran problema en los micropaneles (pocos años y gran

número de casos).

La hipótesis nula en las pruebas de independencia B-P / LM y Pasaran CD es que los

residuos entre entidades no están correlacionados. Las pruebas B-P / LM y Pasaran CD

(dependencia transversal) se utilizan para probar si los residuos están correlacionados

entre entidades *. La dependencia transversal puede conducir a sesgos en los resultados

de las pruebas (también llamada correlación contemporánea).

Lagrange Multiplier Test - (Breusch-Pagan) for balanced

panels

data: y ~ x1

chisq = 2.6692, df = 1, p-value = 0.1023


Aquí no podemos rechazar la hipótesis nula y concluir que los efectos aleatorios no son

apropiados. Esto es, no hay evidencia de diferencias significativas entre países, por lo tanto,

puede ejecutar una regresión OLS simple.


Prueba de correlación serial

Las pruebas de correlación en serie se aplican a paneles macro con series de tiempo largas.

No hay problema en micropaneles (con muy pocos años). La hipótesis nula es que no

hay correlación serial.

pcdtest(fixed, test = c("lm"))

Breusch-Pagan LM test for cross-sectional dependence in

panels

data: y ~ x1

chisq = 28.914, df = 21, p-value = 0.1161

alternative hypothesis: cross-sectional dependence

pcdtest(fixed, test = c("cd"))

Pesaran CD test for cross-sectional dependence in panels

data: y ~ x1

z = 1.1554, p-value = 0.2479

alternative hypothesis: cross-sectional dependence


pcdtest(fixed, test = c("lm"))

pcdtest(fixed, test = c("cd"))

Sin dependencia transversal


Prueba de raíces unitarias / estacionariedad

La prueba de Dickey-Fuller para verificar las tendencias estocásticas. La hipótesis nula es

que la serie tiene una raíz unitaria (es decir, no estacionaria). Si la raíz unitaria está

presente, puede tomar la primera diferencia de la variable.

Breusch-Godfrey/Wooldridge test for serial correlation in

panel models

data: y ~ x1

chisq = 14.137, df = 10, p-value = 0.1668

alternative hypothesis: serial correlation in idiosyncratic errors

Augmented Dickey-Fuller Test

data: Panel.set$y

Dickey-Fuller = -3.9051, Lag order = 2, p-value = 0.0191

alternative hypothesis: stationary

pbgtest(fixed)

No existe Correlación Serial

Si el valor p <0.05, entonces no hay raíces unitarias

presentes.


Prueba de heterocedasticidad

La hipótesis nula para la prueba de Breusch-Pagan es la homocedasticidad.

Si se detecta hetersokedaticity, puede utilizar una matriz de covarianza robusta para dar

cuenta de ello. Consulte las páginas siguientes.

Control de heterocedasticidad: estimación de matriz de

covarianza robusta (estimador de sándwich)

La función --vcovHC – estima tres estimadores de covarianza consistentes con

heterocedasticidad:

• "white 1": para heterocedasticidad general, pero sin correlación serial.

Recomendado para efectos aleatorios.

• "white2" -es "white1" restringido a una variación común dentro de los grupos.

Recomendado para efectos aleatorios.

• "arellano" -tanto heterocedasticidad como correlación serial. Recomendado para

efectos fijos Se aplican las siguientes opciones *:

✓ HC0 -heteroscedasticidad consistente. El valor por defecto.

✓ HC1, HC2, HC3: recomendado para muestras pequeñas. HC3 da menos peso a las

observaciones influyentes.

✓ HC4: muestras pequeñas con observaciones influyentes

Breusch-Pagan test

data: y ~ x1 + factor(country)

BP = 14.606, df = 7, p-value = 0.04139

Presencia de

heterocedasticidad


✓ HAC -heteroscedasticidad y autocorrelación consistente (escriba? VcovHAC para

más detalles) Consulte las páginas siguientes para ver ejemplos

For more details see:

http://cran.r-project.org/web/packages/plm/vignettes/plm.pdf

http://cran.r-project.org/web/packages/sandwich/vignettes/sandwich.pdf (see page 4)

Stock and Watson 2006. *Kleiberand Zeileis, 2008.

Controlando la heterocedasticidad: efectos aleatorios

random <-plm(y ~ x1, data=Panel, index=c("country", "year"), model="random")

coeftest(random) # Original coefficients

coeftest(random, vcovHC) # Heteroskedasticityconsistent coefficients

coeftest(random, vcovHC(random, type = "HC3")) # Heteroskedasticityconsistent coefficients,

type 3

# The following shows the HC standard errors of the coefficients

t(sapply(c("HC0", "HC1", "HC2", "HC3", "HC4"), function(x) sqrt(diag(vcovHC(random, type = x)))))

http://cran.r-project.org/web/packages/plm/vignettes/plm.pdf

http://cran.r-project.org/web/packages/sandwich/vignettes/sandwich.pdf


Figura N º 19

random <-plm(y ~ x1, data=Panel, index=c("country", "year"), model="random")

coeftest(random) # Original coefficients

t test of coefficients:


(Intercept) 1037014284 790626206 1.3116 0.1941

x1 1247001782 902145601 1.3823 0.1714

coeftest(random, vcovHC) # Heteroskedasticityconsistent coefficients



(Intercept) 1037014284 907983029 1.1421 0.2574

x1 1247001782 828970247 1.5043 0.1371

coeftest(random, vcovHC(random, type = "HC3")) # Heteroskedasticityconsistent coefficients, type 3



(Intercept) 1037014284 943438284 1.0992 0.2756

x1 1247001782 867137585 1.4381 0.1550


t(sapply(c("HC0", "HC1", "HC2", "HC3", "HC4"), function(x) sqrt(diag(vcovHC(random, type = x)))))

(Intercept) x1

HC0 907983029 828970247

HC1 921238957 841072643

HC2 925403820 847733474

HC3 943438284 867137584

HC4 941376033 866024033

Errores estándar dan diferentes tipos de HC.


Controlar la heterocedasticidad: Efectos Fijos


coeftest(fixed) # Original coefficients

coeftest(fixed, vcovHC) # Heteroskedasticityconsistent coefficients

coeftest(fixed, vcovHC(fixed, method = "arellano")) # Heteroskedasticityconsistent coefficients (Arellano)

coeftest(fixed, vcovHC(fixed, type = "HC3")) # Heteroskedasticityconsistent coefficients, type 3


t(sapply(c("HC0", "HC1", "HC2", "HC3", "HC4"), function(x) sqrt(diag(vcovHC(fixed, type = x)))))


Figura N º 20


coeftest(fixed) # Original coefficients



x1 2475617827 1106675594 2.237 0.02889 *

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

coeftest(fixed, vcovHC) # Heteroskedasticityconsistent coefficients



x1 2475617827 1358388942 1.8225 0.07321 .

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

coeftest(fixed, vcovHC(fixed, method = "arellano")) # Heteroskedasticityconsistent coefficients (Arellano)



x1 2475617827 1358388942 1.8225 0.07321 .

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

coeftest(fixed, vcovHC(fixed, type = "HC3")) # Heteroskedasticityconsistent coefficients, type 3



x1 2475617827 1439083523 1.7203 0.09037 .

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


t(sapply(c("HC0", "HC1", "HC2", "HC3", "HC4"), function(x) sqrt(diag(vcovHC(fixed, type = x)))))

HC0.x1 HC1.x1 HC2.x1 HC3.x1 HC4.x1

[1,] 1358388942 1368196931 1397037369 1439083523 1522166034

Errores estándar nos dan diferentes tipos de HC.


Referencias / Enlaces útiles

✓ DSS Online Training Section http://dss.princeton.edu/training/

✓ Princeton DSS Libguideshttp://libguides.princeton.edu/dss

✓ John Fox’s site http://socserv.mcmaster.ca/jfox/

✓ Quick-R http://www.statmethods.net/

✓ UCLA Resources to learn and use R http://www.ats.ucla.edu/stat/R/

✓ UCLA Resources to learn and use Stata http://www.ats.ucla.edu/stat/stata/

✓ DSS -Stata http://dss/online_help/stats_packages/stata/

✓ DSS -R http://dss.princeton.edu/online_help/stats_packages/r

✓ Panel Data Econometrics in R: theplmpackagehttp://cran.r-

project.org/web/packages/plm/vignettes/plm.pdf

✓ Econometric Computing with HC and HAC Covariance Matrix Estimators

✓ http://cran.r-project.org/web/packages/sandwich/vignettes/sandwich.pdf

4. Bibliografía

Colin Cameron , A., & Trivedi, P. (2005). Microeconometrics: Methods and

Applications. (C. U. Press, Ed.) New York.

Orihuela, A. (2011). Stata Avanzado Aplicado a la Investigación Económica. Grupo

Iddea, Lima.

Paradis, E. (2010). R para principiantes. Universit Montpellier II. París: Institut des

Sciences de l’E´volution.

Rivera Loredo, C. (2018). Elementos de Cálculo Actuarial con R. Centro

Universitario UAEM, Valle de México, Atizapán de Zaragoza.


Beltrán Barco, A. (2003). Econometría de series de tiempo. Lima: . Universidad del

Pacífico. Obtenido de

https://econometriaii.files.wordpress.com/2010/01/beltran.pdf

Beltran Barco, Arlette; Castro Carlin, Juan;. (2010). Modelos de datos de panel y

variables dependientes limitadas: teoría y práctica. (U. d. Pacífico, Ed.)

Bravo, D., & Vásquez, J. (2008). Microeconometria Aplicada. Notas de Clase,

Centro Micro Datos., Santiago. Obtenido de

http://www.academia.edu/9494003/MICROECONOMETR%C3%8DA_CON_

STATA

de Arce, R., & Mahía, R. (2007). Técnicas de Previsión de variables

financieras:Modelos Arima. (M. d. Citius, Ed.)

González, A., & González, S. (2000). Introdución al R. Notas sobre R: Un entorno de

programación para Análisis de Datos y Gráficos. cran.r-project.org.

Greene, W. (1997). Análisis Econometrico (Tercera ed.). Prentice Hall.

Greene, William. (1999). Análisis Econométrico. (S. &. Schuster, Trad.) Madrid:

Prentice Hall Iberia.

INFOPUC. (2011). Stata para Economistas. Pontificia Universidad Católica .

Rodríguez, F. P. (2016). Curso de Estadística con R. DOC. Nº 2/2016, Instituto

Canabro de Estadística, Servicio de Estadísticas Económicas y

Sociodemográficas.

Software Shop. (2013). Introducion al Stata 12: Ejercicios aplicados a la Economía

y Econometría Financiera.

Download - Serie Apuntes de Clase F&E N° 02 Octubre de 2020

Top Related