regressão - aula 04/04
Post on 29-Jun-2015
8.556 Views
Preview:
TRANSCRIPT
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Análise de Regressão:Relaxando as hipóteses
Rodrigo de Sá
Fundação de Economia e Estatística, 2011
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Livro texto
Damodar GujaratiEconometria Básica3ª ed. 2005.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Multicolinearidade
Uma das hipóteses do modelo clássico de regressão linear éa ausência de multicolinearidade entre as variáveisexplicativas.
Multicolinearidade perfeita: X1 = a + bX2.
Variáveis correlacionadas, mas não perfeitamente:X1 = a + bX2 + u.
Consequências da multicolinearidade perfeita:
O valor dos coe�cientes da regressão é indeterminado;A variância desses estimadores é in�nita.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Multicolinearidade
Uma das hipóteses do modelo clássico de regressão linear éa ausência de multicolinearidade entre as variáveisexplicativas.
Multicolinearidade perfeita: X1 = a + bX2.
Variáveis correlacionadas, mas não perfeitamente:X1 = a + bX2 + u.
Consequências da multicolinearidade perfeita:
O valor dos coe�cientes da regressão é indeterminado;A variância desses estimadores é in�nita.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Multicolinearidade
Uma das hipóteses do modelo clássico de regressão linear éa ausência de multicolinearidade entre as variáveisexplicativas.
Multicolinearidade perfeita: X1 = a + bX2.
Variáveis correlacionadas, mas não perfeitamente:X1 = a + bX2 + u.
Consequências da multicolinearidade perfeita:
O valor dos coe�cientes da regressão é indeterminado;A variância desses estimadores é in�nita.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Multicolinearidade
Figura: Multicolinearidade & Diagramas de Venn
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Possíveis fontes de multicolinearidade
Método de coleta de dados: uma amostra que cubra umapequena parte dos valores possíveis de X .
Restrições presentes no modelo ou na população: se asvariáveis explicativas forem renda e consumo de energiaelétrica, na amostra elas serão altamente correlacionadaspor que pessoas com maior renda em geral consomem umaquantidade maior de energia elétrica.
Especi�cação do modelo: regressão polinomial quando ointervalo a que pertence o X é pequeno.
Em séries temporais, tendência comum: todas as variáveisexplicativas crescem ou decrescem com o passar do tempo.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Estimação na presença de multicolinearidade perfeita
Seja um modelo de regressão linear com duas variáveisexplicativas.
β1 mede em quantas unidades a esperança condicional deY muda em função da variação de uma unidade em X1,mantendo constante X2.
Mas se X1e X2 são perfeitamente correlacionados,X2 = λX1, então NÃO É POSSÍVEL que X1 aumente emuma unidade e X2 se mantenha constante - X2 variará λ.
Isto é, não se tem como se separar os efeitos de X1 e X2
sobre o Y .
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Consequências práticas da multicolinearidade
Os estimadores de MQO continuam sendo MELNV.
Apesar disso, apresentam variância e covariância altas,di�cultando estimações precisas.
Fator de in�ação da variância
FIV =1
1− r212
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Fator de in�ação da variância
Figura: Efeito do crescimento da correlação sobre a variância
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Consequências práticas da multicolinearidade
Os intervalos de con�ança tendem a ser maiores, levando àaceitação da �hipótese nula zero� mais facilmente.
A estatística t de um ou mais estimadores tende a serinsigni�cativa.
Apesar das estatísticas t baixas, o R2 tende a ser alto.
Os estimadores de MQO e suas variâncias tendem a �carmais sensível a mudanças na amostra.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Detecção da multicolinearidade
R2 alto mas poucas estatísticas t signi�cativas.
Correlação entre pares de regressores alta. (Condiçãosu�ciente mas não necessária, exceto no caso de apenasdois regressores.)
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Detecção da multicolinearidade
Regressões auxiliares.
Regressões auxiliares
Regride-se cada uma das variáveis explicativas Xi contra asdemais, Xj , j 6= i , e computa-se o R2
i da regressão (Porexemplo, para i = 2,X2 = a0 + a1X1 + a2X2 + a3X3 + ...akXk + u
Usa-se o seguinte teste F com a hipótese nula que a variávelexplicativa i não é correlacionada com as demais.
Fi =R2
i / (k − 2)(1− R2
i
)/ (n − k + 1)
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Algumas medidas corretivas
Informação a priori. Por exemplo, suponha que saibamosque β1 = λβ2; então utilizamos essa informação parareescrever a regressão.
Eliminação de uma ou mais variáveis. Por exemplo, excluira variável riqueza da regressão consumo-renda-riqueza.Deve-se tomar cuidado para não se incorrer em viés deespeci�cação.
Transformação das variáveis. Em séries temporais, utilizara primeira diferença das variáveis.
Aumento da amostra.
Reduzir a colinearidade em regressões polinomiais,expressando as variáveis na forma de desvio.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Heterocedasticidade
A homoscedasticidade é uma das hipóteses do modeloclássico de regressão linear.
Homoscedasticidade: E(u2i)= σ2 para todo i = 1, 2, ..., n.
Heterocedasticidade: E(u2i)= σ2i .
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Heterocedasticidade
A homoscedasticidade é uma das hipóteses do modeloclássico de regressão linear.
Homoscedasticidade: E(u2i)= σ2 para todo i = 1, 2, ..., n.
Heterocedasticidade: E(u2i)= σ2i .
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Homoscedasticidade e heterocedasticidade
Figura: Comparação
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Possíveis causas da heterocedasticidade
Modelos de aprendizagem e erro. À medida que as pessoasaprendem, diminuem seus erros, assim como a suavariabilidade.
À medida que a renda aumenta, as pessoas têm maiorrenda discricionária e, consequentemente, maior liberdadepara decidir como dispor sua renda, fazendo com que σ2iseja positivamente correlacionado com a renda.
Erro de especi�cação.
Observações aberrantes (outliers).
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Observações aberrantes
Figura: Relação entre preço das ações e preços ao consumidor
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Consequências da heterocedasticidade
O estimadores dos β's continuam sendo não viesados.
Porém, a fórmula da variância do estimador da inclinação édiferente, var
(β1
)=(∑
x2i σ2
i
)/(∑
x2i)2.
Os estimadores de MQO deixam de ser e�cientes, isto é,existe outro estimador não viesado com menor variância: oMétodo dos Mínimos Quadrados Generalizados (MQG).
Assim, os testes de hipótese tendem a aceitar a �hipótesenula zero� mas facilmente.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Método dos Mínimos Quadrados Generalizados(MQG)
MQG
Supondo que as variâncias σ2i sejam CONHECIDAS, pondera-secada observação inversamente ao seu desvio-padrão, chegandoa uma regressão do tipo MQO.
Yi = β0 + β1Xi + ui
Yi
σi= β0
(1σi
)+ β1
(Xi
σi
)+
(ui
σi
)Y ∗
i = β∗0X∗0i + β∗1X
∗i + u∗i
Pode-se mostrar que var (u∗i ) = 1, ou seja, os resíduostornam-se homocedásticos com esta transformação. Note que aregressão a ser estimada tem uma variável explicativa adicional(1/σi ) e não tem intercepto.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
MQG - exemplo
Figura: Ilustração de MQG
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Métodos informais de detecção
Natureza do problema. Novamente, o exemploconsumo-renda.
Métodos grá�cos. Os resíduos da regressão originalapresentam algum padrão?
Alguns métodos formais:
Teste de Park;Teste de Glejser;Teste de Goldfeld-Quandt;Teste de Breusch-Pagan-Godfrey.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Métodos grá�cos
Figura: Padrões hipotéticos dos resíduos ao quadrado estimados
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Teste geral de heterocedasticidade de White
Teste de White
Com os resíduos da regressão estimada rodamos a seguinteregressão auxiliar:
u2i = α1 + α2X2i + α3X3i + α4X2
2i + α5X2
3i + α6X2iX3i + vi
A variável nR2 ∼ χ2gl , com gl igual ao número de regressores naregressão auxiliar.Se o teste exceder o valor crítico, a conclusão é de que háheterocedasticidade.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Medidas quando σ2inão é conhecida
Variâncias e erros padrão consistentes emheterocedasticidade segundo White.
Hipóteses plausíveis a respeito do padrão deheteroscedasticidade:
E(u2i)
= σ2X 2
i =⇒ modelo/Xi
E(u2i)
= σ2Xi =⇒ modelo/√
Xi
E(u2i)
= σ2 [E (Yi )]2 =⇒ modelo/Yi
Estimar o modelo com as variáveis em escala logaritma.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
E(u2i
)= σ2
X2i
Figura: Variância proporcional a X 2
i
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
E(u2i
)= σ2
Xi
Figura: Variância proporcional a Xi
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Autocorrelação
A ausência de AUTOCORRELAÇÃO entre os resíduos éuma das hipóteses do modelo clássico de regressão.
É usual o termo CORRELAÇÃO SERIAL para designar aautocorrelação entre os resíduos em um modelo de sériesde tempo.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Padrões de autocorrelação
Figura: Padrões de autocorrelação
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Possíveis causas da autocorrelação
Inércia ou rigidez das séries temporais.
Viés de especi�cação:
Exclusão de variável;Forma funcional incorreta.
Fenômeno da teia de aranha. Exemplo clássico da ofertade produtos agrícolas, onde a decisão da área plantada(oferta) depende do preço do ano anterior.
Defasagens. Um exemplo é a suavização do consumo, ondeo consumo atual depende do passado.
Manipulação de dados, como interpolação ou extrapolação.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Estimativa por MQO desconsiderando aautocorrelação
Os estimadores dos βs continuam não viesados econsistentes, mas deixam de ser e�cientes (variânciamínima).
A variância dos resíduos σ2 provavelmente irá superestimaro verdadeiro σ2.
Provavelmente o R2 será superestimado.
Os testes de signi�cância usuais tendem a levar aconclusões errôneas.
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Método grá�co para detecção
Figura: Resíduos com autocorrelação
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Teste d de Durbin-Watson
Estatística d
d =
∑t=nt=2
(ut − ut−1)2∑t=n
t=2u2t
Hipóteses fundamentais:
A regressão inclui o intercepto.As perturbações ut são geradas pelo esquemaauto-regressivo de primeira ordem, ut = ρut−1 + εt .O modelo de regressão não inclui termos defasados davariável dependente (Yt−1).
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Teste d de Durbin-Watson
Estatística d
d =
∑t=nt=2
(ut − ut−1)2∑t=n
t=2u2t
Hipóteses fundamentais:
A regressão inclui o intercepto.As perturbações ut são geradas pelo esquemaauto-regressivo de primeira ordem, ut = ρut−1 + εt .O modelo de regressão não inclui termos defasados davariável dependente (Yt−1).
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Teste d de Durbin-Watson
Figura: Estatística d
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Teste d de Durbin-Watson
Figura: Regras de decisão
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Método de Cochrane-Orcutt em duas etapas
Cochrane-Orcutt
Seja a regressão Yt = β0 + β1Xt + ut , onde se supõe que osresíduos seguem ut = ρut−1 + εt .
Estime a regressão pela rotina usual do MQO e obtenha osresíduos ut .
Usando os resíduos estimados, rode ut = ρut−1 + vt .
Usando o ρ estimado, estime
(Yt − ρYt−1) = [β0 (1− ρ)] + β1 [Xt − ρXt−1] + [ut − ρut−1] .
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Método de Cochrane-Orcutt em duas etapas
Cochrane-Orcutt
Seja a regressão Yt = β0 + β1Xt + ut , onde se supõe que osresíduos seguem ut = ρut−1 + εt .
Estime a regressão pela rotina usual do MQO e obtenha osresíduos ut .
Usando os resíduos estimados, rode ut = ρut−1 + vt .
Usando o ρ estimado, estime
(Yt − ρYt−1) = [β0 (1− ρ)] + β1 [Xt − ρXt−1] + [ut − ρut−1] .
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Exemplo - salários
Seja o seguinte modelo
Yi = α1 + α2Di + βXi + ui ,
onde Yi é o salário de um professor(a) universitário(a), Xi são os anos deexperiência de ensino e Di é uma variável qualitativa tal que
Di = 1 se homem
= 0 se mulher.
Assim, o salário médio de um professor(a) será
E (Yi |Xi , Di = 0) = α1 + βXi
E (Yi |Xi , Di = 1) = (α1 + α2) + βXi .
Este modelo postula que as inclinações da função salário de homens emulheres são iguais, mas que o seu intercepto é diferente (o intercepto dogrupo masculino é maior do que o feminino se α2 > 0, e o oposto casoα2 < 0).
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Possíveis representações
Figura: Regressões plausíveis
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Possíveis representações
Regressões coincidentes: nenhuma dummy.
Regressões paralelas: mesma inclinação e interceptosdiferentes.
Yi = α1 + α2Di + βXi + ui
Regressões convergentes: mesmo intercepto e inclinaçõesdiferentes.
Yi = α+ β1Xi + β2XiDi + ui
Regressões dissimilares: interceptos e inclinaçõesdiferentes.
Yi = α1 + α2Di + β1Xi + β2XiDi + ui
Análise deRegressão:
Relaxando ashipóteses
Rodrigo deSá
Multicolin.
Heterocedast.
Autocorrel.
Dummies
Exercício
Exercício
Escolhe um modelo econômico que possa ser estimado porMQO e estime-o. O modelo deve ter duas ou mais variáveisexplicativas.
Teste o modelo quanto a presença de multicolinearidade,heterocedasticidade e autocorrelação, corrigindo-o se necessário.
Faça um relatório que contemple os seguintes pontos:
Explique o modelo econômico.Descreva as variáveis.Mostre os resultados da estimação (coe�cientes, testes designi�cância, teste F, R2, grá�co da estimação, etc.)Mostre os testes das hipóteses do modelo(multicolinearidade, heterocedasticidade e autocorrelação)e as correções, caso feitas.Interprete os resultados economicamente. Os resultadosdiferiram dos resultados esperados antes da estimação domodelo?
Data da entrega: até dia 2 de dezembro.
top related