econometria preguntas
DESCRIPTION
Preguntas para curso de econometria básico.TRANSCRIPT
Econometría Preguntas
I. Regresión lineal
1. Explique la importancia de la distribución de muestreo de las Betas en el modelo de
regresión lineal.
La distribución beta viene de la familia de distribuciones continuas de probabilidad
definida en el intervalo [0, 1] parametrizada por dos parámetros de forma positiva, denotadas por
α y β, que aparecen como exponentes de la variable aleatoria y controlan la forma de la
distribución en su función matemática. Ésta se utiliza para explicar el comportamiento de
variables aleatorias. La importancia de la distribución de muestreo de las Betas en el modelo de
regresión lineal es que al estudiar variables aleatorias, este viene a ser un modelo adecuado para
el comportamiento de porcentajes y proporciones.
2. ¿Cuál es la importancia de la propiedad de insesgación de los betas?
Decimos que un parámetro es insesgado cuando el estimador de un parámetro θ, en
promedio, sus valores son igual a θ. Cuando sucede esto decimos que el estimador es insesgado.
Contar con un estimador insesgado nos asegura que el valor esperado de nuestro cálculo coincide
con el valor real del parámetro. La importancia de la propiedad de insesgación es que nos
asegura que tenemos un estimador óptimo que nos permite continuar con el estudio.
3. Bajo qué circunstancias se puede usar la distribución normal en esos modelos. ¿Cómo
se puede examinar ese supuesto empíricamente?
Daniel necesita ayuda con esta pregunta. Sería bueno que los chicos que solo contestaron
una pregunta nos den una ayudita.
4. Bajo qué condiciones la propiedad de consistencia no supera a la de insesgación.
Es importante notar que consistencia no implica insesgadez asintótica ni viceversa, un
estimador consistente no tiene porque ser insesgado asintóticamente. De igual forma un
estimador insesgado asintóticamente no tiene porque ser consistente. Sin embargo, si un
estimador es insesgado asintóticamente y además su varianza en el límite es cero el estimador es
consistente. La unión de estas dos condiciones, insesgadez asintótica y varianza asintótica que
tienda a cero cuando el tamaño de muestra tiende a infinito conforman las condiciones
suficientes, aunque no necesarias, de consistencia. Esto sucede en muestras grandes, es decir, el
límite cuando n tiende a infinito, del sesgo, que tiene que dar 0. Si haces el sesgo te quedará algo
que depende de n y al aumentar n a infinito se te va el término que genera el sesgo.
5. ¿Por qué es importante que los elementos aleatorios no padezcan de correlación serial?
La autocorrelación se puede definir como la correlación entre miembros de series de
tiempo. El modelo de regresión lineal supone que no debe existir autocorrelación en los errores,
es decir, el término de perturbación relacionado con una observación cualquiera no debería estar
influenciado por el término de perturbación relacionado con cualquier otra observación.
La consecuencia más grave de la autocorrelación de las perturbaciones es que la
estimación MCO deja de ser eficiente y la inferencia estadística también se verá afectada. Las
consecuencias dependen del tipo de autocorrelación (positiva o negativa):
o Cuando se tiene autocorrelación positiva, la matriz de varianza y covarianza de los
residuos esta subestimada, si el tipo de autocorrelación es negativa, se tiene una
sobrestimación de la misma.
o Cuando se tiene autocorrelación positiva, los intervalos de confianza son angostos, si
el tipo de autocorrelación es negativa, se tienen intervalos de confianza más amplios.
o Cuando se tiene autocorrelación positiva, se tiende a cometer error tipo I (rechazar la
hipótesis nula cuando es verdadera), si el tipo de autocorrelación es negativa, se
tiende a cometer error tipo II (no rechazar la hipótesis nula cuando es falsa).
o Los MCO son lineales, insesgados, pero ineficientes (no tienen varianza mínima).
o Las pruebas pierden validez.
6. ¿Cómo se detecta ese problema empíricamente?
Para analizar la posible presencia de autocorrelación en el modelo se suele recurrir a dos
técnicas complementarias: (1) el análisis gráfico de los residuos (obtenidos al realizar la
regresión por MCO), y (2) los contrastes de hipótesis específicos (test de Durbin-Watson).
Análisis Gráfico:
Al realizar la regresión por MCO, se pueden graficar los residuos (o, alternativamente, los
residuos estandarizados, es simplemente dividir por el error estándar de la estimación) frente al
tiempo. Dado que los residuos MCO son estimadores consistentes de los términos de
perturbación, si se aprecian en el gráfico anterior patrones de comportamiento sistemático (no
aleatorio) podremos afirmar que los términos de perturbación presentan algún tipo de
autocorrelación.
Test de Durbin-Watson:
Es la prueba más conocida para detectar correlación serial; permite contrastar si el término de
perturbación está autocorrelacionado. Dicha prueba presenta algunos supuestos: Es válido para
autocorrelación serial de 1° orden en los residuos, no aplica para modelos con variable
dependiente rezagada como variable explicativa, las variables explicativas son no estocásticas
(son fijas en muestreo repetido), el modelo de regresión lineal debe incluir el intercepto, y no hay
observaciones faltantes en los datos.
Una vez hallado DW, es posible usar su valor para estimar el coeficiente de
autocorrelación simple mediante la expresión: El estadístico DW es un valor comprendido entre
0 y 4. Como se observa en el siguiente gráfico, para valores de DW cercanos a 2 no
rechazaremos la hipótesis nula, por el contrario, para valores de DW alejados de 2, sí
rechazaremos la hipótesis nula.
En resumen los pasos a seguir de este contraste son:
o Estimación por mínimos cuadrados ordinarios (MCO) del modelo de regresión.
o Cálculo de los residuos MCO.
o Obtención del estadístico d (experimental) de Durbin-Watson.
o Búsqueda de los niveles críticos del contraste.
o Aplicación de la regla de decisión.
7. ¿Por qué con datos de series de tiempo es importante la estacionalidad? Señale 2 formas
de detectar esa condición
Las series de tiempo pueden presentar variaciones en las observaciones que presentan un
patrón que se repite en determinado periodo de la serie una y otra vez, ósea presentan
periodicidad. Las causas de estas periodicidades son consideradas exógenas a la serie, o sea que
no representan las variaciones de un ciclo económico (por el ejemplo el mes de diciembre el
consumo siempre aumenta independientemente de si la economía se encuentra recesión). En una
serie con datos mensuales se puede revisar gráficamente las variaciones en mensuales de de cada
año, estas pueden presentar variaciones regulares en meses específicos. Otro método para
identificar el efecto estacional es realizando un estudio de los coeficientes de cada mes de todos
los años. Es decir se busca la media (Mi= ene+feb+…dic/12) de los meses de todos los años en
estudio y se resta a cada mes (Mi – M= coef), con este método se pueden verificar los meses con
coeficientes más altos y los que tienen coeficientes más altos para verificar variaciones
periódicas en la serie.
8. ¿Qué implica el que los elementos estocásticos del modelo de regresión lineal exhiban el
problema de heteroscedasticidad cuando el mismo es estimado con series de tiempo (Y-
XBeta + épsilon)?
Implica una violación al modelo de regresión lineal clásico, específicamente el de
residuos con variancia constante. El problema con los residuos (elemento estocástico) con una
variancia no-constante es que la misma aumentara su variancia con respecto al tiempo. Si los
residuos no son (0, ) el modelo mantiene insesgacion pero no brindara buenos estimados
porque no tendrá la variancia mínima entre todos los estimadores lineales.
9. ¿Cómo se resuelve dicho problema?
Este problema se puede resolver mediante la diferenciación del modelo, también se puede
corregir introduciendo la forma funcional correcta a la serie o transformando el modelo a
Mínimos Cuadrados Generales (“GLS”).
10. Bajo que circunstancia la prueba de Chow es superior a la de Quantd=Andrews.
Explique.
La prueba clásica para un cambio estructural es atribuida a Chow (1960). Su famoso
procedimiento divide la muestra en dos sub-períodos, estima los parámetros para cada sub-
período y luego prueba la igualdad entre los dos conjuntos de parámetros utilizando un
estadístico F clásico.
Sin embargo, la prueba de Chow tiene una limitación importante que la fecha de cambio
de la tendencia debe ser conocida de antemano. Entonces, sólo existen dos opciones: primero,
escoger en forma arbitraria una posible fecha de cambio de la tendencia, lo cual podría omitir la
verdadera fecha del cambio; y segundo, escoger una fecha de cambio basada en alguna
característica conocida de los datos, que puede llegar a indicar un cambio estructural falso,
incluso cuando de hecho no exista ninguno. ¿Cómo se puede confiar en estos resultados, si dos
fechas de cambios similares dan respuestas tan diferentes?
La solución a esta pregunta es tomar la fecha de cambio estructural como
desconocida. Quandt (1960) propuso tomar como fecha de cambio estructural, la que tenga el
valor más alto de la prueba de Chow de todas las posibles fechas de cambio, esto se conoce
como el Estadístico de Quandt. Una de las formas de construir el estadístico de Quandt es
graficar la secuencia de las pruebas de Chow como una función de posibles fechas de cambio
estructural.
Sin embargo, si la fecha de cambio estructural es desconocida, el valor crítico del Chi-
cuadrado es inapropiado. Entonces, ¿qué valores críticos deberían utilizarse en su lugar? Por
muchos años esta pregunta no fue respondida y el Estadístico de Quandt no tenía aplicación
práctica. A principios de los noventa, el problema fue resuelto simultáneamente por algunos
autores, tales como Andrews (1993), y Andrews y Ploberger (1994). Estos autores crearon tablas
de valores críticos, en tanto que Hansen (1997) creó un método de valores p para medir el nivel
de significancia.
Los valores críticos asintóticos son considerablemente más grandes que los valores
críticos de Chi cuadrado, esto depende del número de parámetros en el modelo y de otros
factores. Chow es superior a Quandt-Andrews en la circunstancia donde se conozca la fecha del
cambio estructural. Además hay que hacer una prueba para ver los cambios en los parámetros en
datos cronológicos.
11. ¿Cuál forma es superior para remover la tendencia de una serie diferenciar o usar un
polinomio de tendencia? Explique el proceso que se usa en cada técnica.
El polinomio de tendencia es superior para remover la tendencia este ajuste del polinomio
de tendencia a la serie produce la estimación de sus parámetros lo cual equivale a seleccionar,
dentro de la familia de los polinomios especificada por el grado, aquel que disperse a su
alrededor a todos los valores observados en la variable de forma balanceada. El método
empleado para este ajuste es el de minimización de error medio. Una vez estimado el polinomio
particular se extrae la tendencia de la serie restando o dividiendo, según sea la composición, los
valores tomados por el polinomio en cada momento de tiempo de los valores correspondientes de
la variable en la serie. Este residuo es tomado para la estimación de la bondad de ajuste del
modelo. La primera diferenciación implica que toda la información útil en la serie de tiempo es
un cambio de observación a partir del próximo periodo, y que el nivel del original de la serie es
poco importante.
12. ¿Qué significa que hubo un cambio estructural en el contexto de regresión lineal? ¿Qué
significa en términos generales?
En contexto de regresión lineal significa un cambio en los parámetros. La tendencia
cambia y las variables que la definen cambian también, la estructura se define por las relaciones
económicas si la estructura cambia los parámetros ya no son fijos. Los parámetros, miden la
influencia que las variables explicativas tienen sobre el modelo.
En términos generales un cambio estructural es un cambio en la estructura fundamental
de la economía que afecta a largo plazo. Esto implica que para que en el periodo Y+1 cambiara
la estructura en el periodo Y ocurrió un evento muy particular que cambió la tendencia de como
se comportaba la economía esto puede significar que la tendencia dio un salto y ahora maneja
por encima de donde se manejaba anteriormente o que de un periodo a otro cae repentinamente
etc.
13. Para que se usan las variables instrumentales. ¿Cuál es el problema con los MCO en ese
caso?
Las variables instrumentales son variables exógenas correlacionadas con otra variable
endógena utilizada como una variable explicativa en una regresión. Estas variables
instrumentales se utilizan cuando la variable independiente original está altamente
correlacionada con el término de error en una regresión. Debido a que si utilizamos la variable
original de la regresión obtendremos estimadores tanto sesgados como inconsistentes, las
variables instrumentales nos ayudan con este problema.
El problema de los mínimos cuadrados ordinarios en la variable instrumental es que al
utilizar una variable independiente no correlacionada con el error los estimadores continúan
siendo sesgados, pero al menos son consistentes. Si aumentamos el tamaño de la muestra,
obtendremos al menos unos estimadores que converjan a sus verdaderos valores.
II. Series de Tiempo
14. ¿Dentro del proceso para construir los modelos Box-Jenskins cuál el paso más
importante?
En el proceso de Box jenkings tenemos los pasos de identificación, estimación,
diagnostico y proyección. Dentro de todos estos procesos el de mayor importancia es el de
identificación. Esto se debe a que para que tanto la estimación y la proyección puedan tener
validez, los datos tienen que ser analizados con el fin de poder examinar si los mismos son no
estacionarios y bajo el FAC y el FACP verificar a qué tipo de modelo ARIMA se tendrá que
utilizar. Este paso es el más importante ya que de no haber estacionariedad los modelos solo
describirán la tendencia de las variables y no necesariamente su comportamiento.
15. Para qué se usan esos modelos.
Los modelos de series de tiempo se utilizan mayormente para hacer análisis de
proyecciones basados en el comportamiento de una variable en relación con valores anteriores o
rezagados de la misma variable. También nos ayudan a poder hacer análisis al corto plazo del
comportamiento de las variables sin utilizar modelos clásicos estructurales los cuales pueden ser
de mayor complejidad.
16. ¿Por qué los modelo VAR se usan tanto en macroeconometría?
VAR models are used because of their many benefits:
It is very simple - econometrician does not have to worry about which variables are
endogenous or exogenous.
Estimation is also very simple - each equation can be estimated separately with the usual
OLS method.
Forecasting - forecasts obtained from VAR models are in most cases better than those
obtained from the far more complex simultaneous equation models.
17. ¿Qué interpretación tiene las funciones de impulso respuesta?
Decomposition of variance is interpreted as the measure of the percent variation of the
fluctuation of a variable as a response to an impulse, innovation or shock to that same variable or
to other variable in the model. Variance decomposition lets the researcher analyze and compare
the short-term and long-term effects of the shock to a variable.
Ex. VAR (GDP and Exports)
In the short run, that is quarter 3, a shock to GDP accounts for 97.66% variation of the
fluctuation in GDP (own shock). On the other hand, shock to export can cause 1.06% fluctuation
in GDP.
In the long run, that is quarter 10, a shock to GDP accounts for 56.92% of the variation of
the fluctuation in GDP (own shock). On the other hand, shock to exports can cause 41.96%
fluctuation in GDP.
Conclusión:
Shock to GDP has short-term effects on GDP (own shock) and shock to exports has long-
term effects on GDP.
18. ¿Qué interpretación tiene la descomposición de la varianza del error de proyección?
The impulse response function is a shock to a VAR system. Impulse responses are
interpreted as a measure of the responsiveness in the VAR when a shock is put to the error term.
A unit shock is applied to each variable to see its effects on the VAR system. The shock may
have a positive, negative or no effect.
19. Explique los pasos que hay que realizar para construir y estimar un modelo VAR
20. Explique los pasos a seguir para determinar si X es I(1) o I(2).
Observando los residuos de la regresión y verificando que los mismos sean distribuidos
normal con media 0 y varianza
constante. Jarque-Bera del histograma de los residuos. (Esto sale en el capítulo de
Applied)
Verificando la forma funcional por medio de EDA
Pruebas de omisión/inclusión.
III. Problemas más aplicados
21. En ocasiones existe más de una teoría económica para explicar un mismo fenómeno.
¿Cómo se puede determinar si existe un problema de especificación?
El problema de especificación se puede determinar de dos maneras:
A. Haciendo un test de variable omitida:
Con este test de variable omitida podemos observar cómo se comporta cada variable
como prueba de exclusión. Prueba de F y t de cero restricciones en los parámetros.
B. Examinando los residuos para determinar su forma funcional:
En data cross sectional, la omisión de una variable importante se puede analizar por
medio de los residuos y un scatter plot de los mismos que van a reflejar ciertos patrones
de comportamiento notables. Si estos comportamientos en los residuos reflejan que los
residuos están correlacionados es un signo de que puede existir mala especificación.
C. Examinando Durbin Watson:
a) Para detectar problemas de especificación con Durbin Watson:
b) Obtenemos los residuos OLS y se asume primero que el modelo no está especificado
porque excluye una variable importante que explica el modelo.
c) Luego, ordenamos los residuos según los criterios obtenidos por OLS. Calcular el
valor significativo del Durbin Watson para ver si uno puede rechazar o no la hipótesis
de mala especificación en el modelo
D. Prueba de forma estructural:
En esta categoría cae la consistencia de los parámetros del modelo. Con la prueba de
Chow o el Chow Teste podemos predecir los fallos de los parámetros. Donde, con la
prueba F, observamos si hubo cambios estructurales drásticos entre las variables actuales
y sus valores estimados.
E. Prueba de outliers:
Esta prueba, que generalmente se utiliza para probar la distribución normal, es usada en
ocasiones como prueba de especificación. Como por ejemplo, el Jarque Bera también
puede ser utilizado como prueba de mala especificación.
F. Prueba de Ramsey RESET (prueba de error de especificación en el modelo)
a) Obtenemos Yi estimada
b) Volvemos a correr la regresión con “Yi” estimada en alguna forma de regresores
adicionales lo que infla el “R^2”.
c) Si infla “R^2” de manera estadísticamente significante, basado en la prueba F, el
modelo está mal especificado.
d) Si el valor de F nuevamente estimado presenta, por ejemplo, un nivel de 5%, no
rechazamos la hipótesis nula de que el modelo está mal especificado.
G. Una prueba de especificación derivada de la teoría del caos BDS test:
Es la prueba particularmente más fuerte para detectar la no-linealidad en los modelos
estimados.
Tipos de errores que pueden cometerse en la especificación de la ecuación estimada.
Omisión de variables relevantes.
Inclusión de Variables
superfluas.
Mala Especificación.
22. ¿Qué relación hay entre el problema de especificación y el de autocorrelación?
Al igual que la especificación, la auto correlación tiene muchas pruebas que detecta la
relación de los residuos generados por la estimación de una combinación de modelos lineales de
corte seccional.
La auto correlación puede, muchas veces ser causada por la mala especificación de las
variables. Por mala especificación podemos deducir el sesgo entre los valores de las variables y
la poca variabilidad que proporcionan a la explicación del modelo. Este sesgo se forma cuando
se elige mal la forma funcional de las variables o se omiten variables importantes, lo cual genera
un comportamiento sistemático en el término estocástico.
23. El siguiente modelo de inversión consumo fue estimado para una economía: I(t)=23.6
+.12Y(t) + ε(t) (2.8) R2=.98 DW=.67 n=35; I(t) es la inversión real en t, Y(t) es la
producción agregada real en t, los valores en paréntesis son el estadístico t. ¿Qué
problema (s) econométrico manifiestan los resultados? ¿Cómo usted lo (s) resolvería?
Alexander dice que esta pregunta no viene, por tanto no la contestó
24. Una teoría implica que Y es función de X & Z. Un investigador estimó ese modelo por
OLS y encontró que aunque en conjunto las 2 variables explicaban Y (mirando R2 y el
estadístico-F) no se podía rechazar la hipótesis de que individualmente los parámetros
eran iguales a cero. El investigador solucionó el problema eliminado la variable Z (la
que tenía el valor del estadístico t más bajo) de la regresión y encontró que en el modelo
ahora la variable X era estadísticamente significativa, por lo que continúo su estudio
con esa ecuación. ¿Considera usted que se hizo lo apropiado? Explique.
Claramente, el investigador se había topado con un problema de multicolinealidad entre
las variables X y Z. Ante este problema, resolver multicolinealidad es posible mediante
componentes principales, pero este método es altamente complejo. Como segunda mejor opción
el investigador debía mantener las variables que ya tenía y probar para la ausencia de otras
variables explicativas mediante una prueba de variables omitidas. El eliminar una de las
variables en este caso afectaría el poder del modelo ya que, debido a la naturaleza de la relación
entre X y Z, ambas deben permanecer juntas para ejercer efectivamente su rol explicativo.
25. El problema de multicolinealidad infla los estimados de la variancia de los estimadores
OLS. ¿Qué otros efectos tiene?
La multicolinealidad está definida cuando existen relaciones lineares aproximadas entre
las variables independientes de un modelo. Cuando hay multicolinealidad, el procedimiento de
los mínimos cuadrados ordinarios no le da suficiente variación independiente a una variable
como para poder calcular el efecto que tiene esa variable particular en la variable dependiente.
En otras palabras, los efectos de las variables independientes se confunden unos con los otros
como consecuencia de esa variabilidad inadecuada. Como la variación que se le pueda atribuir a
una variable particular es poca, la información que se puede utilizar en el proceso de MCO para
estimar el coeficiente también es poca y por lo tanto, la varianza de los betas estará inflada; no
son de varianza mínima. Sin embargo, siguen siendo insesgados y el R² no se afecta. En fin, el
problema general además de las varianzas infladas, es que no se puede aislar el efecto que tiene
una variable particular en la variable dependiente. Es un problema de los datos.
26. El estimador (MCO) está dado por: β=(X'X)-1X'Y .
A. Obtenga el Valor esperado de β y demuestre que el estimador es insesgado.
B. Obtenga la Varianza de β.
o
27. Comente brevemente las siguientes aseveraciones:
a. Una serie es ergódica si su promedio y varianza son constantes a través del tiempo.
Las condiciones de promedio y varianza constante a través del tiempo son condiciones de
estacionariedad. La ergodicidad requiere que valores del proceso suficientemente separados en el
tiempo casi no estén correlacionados. Por tanto, decimos que una serie estacionaria es ergódica si
______cuando _________. Esta condición permite que al promediar una serie de tiempo uno esté
continuamente información nueva y relevante al promedio.
b. Añadir variables a una regresión no resuelve el problema de autocorrelación.
En algunos casos añadir variables independientes al modelo de regresión resuelve el
problema de autocorrelación. Uno de los métodos más comunes para resolver el problema de
autocorrelación es añadir una variable dependiente definida como sus propios rezagos. Otra
posible solución es tomar diferencias en las variables. Además se pueden utilizar métodos de
GLS y filtrados ARIMA.
c. Si hace la prueba DW de autocorrelación y no se rechaza la hipótesis nula, entonces
los residuos son aleatorios.
La prueba de Durbin-Watson tiene la hipótesis nula de que los residuos en un OLS no
están autocorrelacionados entre ellos, o que los residuos se comportan como un AR(1). Por tanto
si no se rechaza la hipótesis nula los residuos son aleatorios. De lo contrario se pudiera observar
un patrón de comportamiento o tendencia en los residuos de la regresión.
d. En el modelo de regresión lineal la varianza de Y es igual a la varianza de Є.
Héctor necesita ayuda con esta pregunta. Sería bueno que los chicos que solo contestaron
una pregunta nos den una ayudita.
28. Considere el siguiente modelo (Contestación en PDF)
Yi=Xiβ + εi
εi~N(0, σ2i)
σ2i = σ2/xi
a. Discuta la propiedad de insesgación y eficiencia de los MCO bajo esta situación.
b. Transforme el modelo para resolver el problema que existe en la estimación de
acuerdo a lo discutido en (a).
c. Calcule la varianza del modelo transformado.
29. Considere los siguientes resultados de la estimación por MCO: (Mihaly dice que
esta pregunta no viene, por tanto no la contestó)
A. C= 50 +.85YD + Є (.14) (.147)
R2=.89 F=45.7 valor P=.000
R2 ajustado=.875 Aic=8.92 DW=1 .45
Prueba de White de Heteroscedasticidad
n*Rcuadrado = 5.9967
22
Valor
P=.02
Estimado en una muestra de 1000 observaciones.
Donde: C es el consumo real de los individuos; YD es el ingreso personal disponible real
de los individuos;. Las cifras en paréntesis son los valores-p asociados al estadístico-t.
Evalúe los resultados de las estimaciones, en su respuesta tome en cuenta:
a. Bondad del ajuste.
b. Significancia de las variables
c. Problemas econométricos que se puedan observar
30. Discuta los problemas que surgen al utilizar datos a través del tiempo para estimar los
MCO y como se pueden tratar los mismos.
El problema principal con el uso de datos a través del tiempo para estimar los MCO es
que los datos contienen tendencia. Dos variables con tendencia similar se pueden comportar de
manera similar aunque no exista una conexión lógica entre ellas. Por ejemplo, si ambas tienen
tendencia creciente, se encontrará una correlación positiva y fuerte. Esto es un ejemplo de una
regresión espuria, caso que surge cuando las variables en la regresión no son estacionarias.
Cuando las variables en una regresión son no-estacionarias los valores de R^2 y el estadístico t
no siguen la distribución usual y pueden estar exageradamente inflados. Además, los MCO
suponen que los residuos de la regresión son aleatorios, pero los residuos de variables en serie de
tiempo presentan correlación serial.
En las muestras de corte seccional, la ley de los grandes números nos asegura que las
variaciones aleatorias se tienden a "nivelar" con una muestra suficientemente grande de
observaciones independientes. Esto pasa debido a que las medias, varianzas y covarianzas entre
las variables convergen a momentos fijos y finitos, pero la convergencia no se da en variables
no-estacionarias. El problema es mucho más severo si las variables no son ergódicas. Estas
variables tienen "memoria larga", por lo que las observaciones que son muy separadas en el
tiempo están todavía fuertemente correlacionadas. Lo que esto significa para el análisis de
regresión es que aun cuando acumulamos una gran cantidad de observaciones, la cantidad de
nueva información en esas observaciones se ve limitada por su correlación con los datos
anteriores.
En caso de tener una serie con tendencia, se puede obtener estacionaridad diferenciando
la serie. En caso de que la varianza no sea constante, la misma se puede disminuir buscando el
logaritmo de la serie lo cual ayuda a obtener estacionaridad. Para obtener mejores resultados con
datos de series de tiempo, se debe utilizar un modelo ARIMA.