curso de anÁlise de sÉries temporais –...

1

FACE – Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação do Curso de Ciências Econômicas Prof.ª Priscila Casari NEPEC – Núcleo de Estudos e Pesquisas Econômicas Coordenação Sérgio Fornazier Meyrelles Filho Endereço Campus Samambaia, Prédio da FACE – Rodovia Goiânia/Nova Veneza, km. 0 – Caixa Postal 131, CEP 74001-970, Goiânia – GO. Tel. (62) 3521 – 1390 URL http://www.face.ufg.br/economia

CURSO DE ANÁLISE DE SÉRIES

TEMPORAIS – MODELO ARIMA

MATERIAL DE APOIO

Professor:

Sandro Eduardo Monsueto

NEPEC/FACE/UFG

Goiânia – Setembro/Outubro 2014

Versão 1.0

2

1. Introdução e conceitos básicos

Esta apostila serve de material de apoio para a realização do curso. Longe de ser

abrangente, tem como objetivo servir de guia ou de lembrete para a execução de

tarefas. Outros materiais, melhores e mais completos, podem ser facilmente

encontrados de forma gratuita na internet e em livros especializados no assunto. Para

realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar

gratuitamente no site gretl.sourceforge.net.

A primeira definição necessária para nossa análise é o conceito de série

temporal. Uma série temporal é uma sequência de dados no tempo com uma

determinada periodicidade. Alguns exemplos:

- PIB brasileiro trimestral.

- taxa de juros mensal.

- índice pluviométrico semanal.

- valor das ações da Petrobras minuto a minuto.

Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de

vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação

algébrica para representar os dados no tempo:

Yt: a observação no tempo t da variável Y. Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal. Yt+1: a observação um período a frente. Generalizando: Yt±j: a observação no período t±j Exemplo:

Mês Período Yt Yt-1 Yt+1

1991.01 Y1 3,6 3,9

1991.02 Y2 3,9 3,6 2,5

1991.03 Y3 2,5 3,9 1,9

1991.04 Y4 1,9 2,5 2,7

1991.05 Y5 2,7 1,9 2,4

1991.06 Y6 2,4 2,7 1,6

1991.07 Y7 1,6 2,4 1,6

1991.08 Y8 1,6 1,6 1,7

1991.09 Y9 1,7 1,6 2,5

1991.10 Y10 2,5 1,7 -

O restante do material está constituído de uma série de exemplos estimados com

dados reais ou fictícios e telas explicativas das funções do programa Gretl. Ao longo do

curso serão acrescentados novos exemplos.

3

2. Exemplos de Modelos Autoregressivos – AR(p) AR(1)

Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,571725 0,11237 5,0879 <0,00001 ***

phi_1 0,788617 0,0471062 16,7413 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,006069 D.P. das inovações 0,326753

Log da verossimilhança -55,45739 Critério de Akaike 116,9148

Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2680 0,0000 1,2680 0,0000

AR(2) Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)




const 0,569602 0,108703 5,2400 <0,00001 ***

phi_1 0,815008 0,0755062 10,7939 <0,00001 ***

phi_2 -0,0338969 0,0758055 -0,4472 0,65476






AR

Raiz 1 1,2969 0,0000 1,2969 0,0000

Raiz 2 22,7468 0,0000 22,7468 0,0000

AR(3) Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)




const 0,574432 0,115983 4,9527 <0,00001 ***

phi_1 0,819322 0,0755966 10,8381 <0,00001 ***

phi_2 -0,0819083 0,0988616 -0,8285 0,40738

phi_3 0,0579267 0,0767865 0,7544 0,45062






AR

Raiz 1 1,2395 0,0000 1,2395 0,0000

Raiz 2 0,0873 -3,7310 3,7320 -0,2463

Raiz 3 0,0873 3,7310 3,7320 0,2463

4

Exemplos de modelos AR(p) usando dados da Sefaz/GO:

ICMS – Taxa de crescimento


Variável dependente: d_l_ICMS



const 0,00567966 0,00816623 0,6955 0,48674

phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***


Média de inovações 0,000328 D.P. das inovações 0,130597

Log da verossimilhança 80,70000 Critério de Akaike -155,4000

Critério de Schwarz -146,7744 Critério Hannan-Quinn -151,8950


AR

Raiz 1 -2,4979 0,0000 2,4979 0,5000





const 0,00586463 0,00564463 1,0390 0,29882

phi_1 -0,542985 0,0815173 -6,6610 <0,00001 ***

phi_2 -0,354886 0,0815606 -4,3512 0,00001 ***






AR

Raiz 1 -0,7650 -1,4942 1,6786 -0,3253

Raiz 2 -0,7650 1,4942 1,6786 0,3253

5

3. Exemplos de Modelos de Média Móvel – MA(q) MA(1)





const 0,543279 0,0464909 11,6857 <0,00001 ***

theta_1 0,611094 0,0422925 14,4492 <0,00001 ***






MA

Raiz 1 -1,6364 0,0000 1,6364 0,5000

MA(2)





const 0,546989 0,0585125 9,3482 <0,00001 ***

theta_1 0,881548 0,0774425 11,3833 <0,00001 ***

theta_2 0,387895 0,0583002 6,6534 <0,00001 ***






MA

Raiz 1 -1,1363 -1,1344 1,6056 -0,3751

Raiz 2 -1,1363 1,1344 1,6056 0,3751

MA(3)





const 0,550957 0,0646414 8,5233 <0,00001 ***

theta_1 0,782521 0,0735914 10,6333 <0,00001 ***

theta_2 0,5313 0,0810619 6,5542 <0,00001 ***

theta_3 0,251944 0,0703504 3,5813 0,00034 ***






MA

Raiz 1 -1,6714 0,0000 1,6714 0,5000

Raiz 2 -0,2187 -1,5254 1,5410 -0,2727

Raiz 3 -0,2187 1,5254 1,5410 0,2727

6

Exemplos de modelos MA(q) usando dados da Sefaz/GO:





const 0,00560753 0,00080953 6,9269 <0,00001 ***

theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***






MA

Raiz 1 1,0815 0,0000 1,0815 0,0000





const 0,00570155 0,000691485 8,2454 <0,00001 ***

theta_1 -0,824861 0,0936196 -8,8108 <0,00001 ***

theta_2 -0,115467 0,0992711 -1,1632 0,24477






MA

Raiz 1 1,0562 0,0000 1,0562 0,0000

Raiz 2 -8,1999 0,0000 8,1999 0,5000

7

4. Exemplos de Modelos ARMA (1,1)

Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto

prazo:





const 0,00569386 0,000702447 8,1057 <0,00001 ***

phi_1 0,102099 0,0982049 1,0397 0,29850

theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***






AR

Raiz 1 9,7944 0,0000 9,7944 0,0000

MA

Raiz 1 1,0578 0,0000 1,0578 0,0000


Variável dependente: d_l_agropecuaria



const 0,00140343 0,00101435 1,3836 0,16649

phi_1 0,681096 0,0674072 10,1042 <0,00001 ***

theta_1 -1 0,0236957 -42,2017 <0,00001 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097





AR

Raiz 1 1,4682 0,0000 1,4682 0,0000

MA

Raiz 1 1,0000 0,0000 1,0000 0,0000

8

5. Estimar modelos ARMA/ARIMA no Gretl

Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique

na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:

Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será

utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo

ARMA tradicional não possui regressores extras.

Selecione a variável e clique no botão lilás

Define a ordem AR(p) - longo prazo

Define a ordem MA(q) - curto prazo

9

6. O método Box-Jenkins de previsão

O objetivo do método é gerar um modelo com as seguintes características:

i. Estabilidade (módulo das raízes fora do círculo unitário)

ii. Resíduos na forma de Ruído Branco

a. Sem memória

b. Normalmente distribuído

c. Homocedástico

O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA

10

7. O correlograma

Para gerar o correlograma de uma série temporal, clique sobre uma variável com

o botão direito do mouse e selecione a opção Correlograma:

O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que

ultrapassam o intervalo de confiança são estatisticamente diferente de zero, indicando

presença de algum tipo de memória na série.

A interpretação do correlograma segue o esperado para cada tipo de modelo

teórico. Seguindo Bueno (2011), temos:

Fonte: Bueno (2011)

Função de Autocorrelação Simples (FAC)

Função de Autocorrelação Parcial (FACP)

11

Correlograma esperado para um AR(1) FAC – decaimento exponencial

FACP – truncada na primeira defasagem

Correlograma esperado para um AR(2)

FAC – decaimento exponencial

FACP – truncada na segunda defasagem

Correlograma esperado para um MA(2)

FAC – truncada na segunda defasagem

FACP – decaimento exponencial

Correlograma esperado para um ARMA(2,1)

FAC – truncada na primeira e decaimento exponencial a partir da segunda defasagem

FACP – truncada na segunda e decaimento exponencial a partir da terceira defasagem

Contudo, lembre-se que na prática a identificação visual do modelo é

complicada, devendo o pesquisador utilizar o processo de tentativa e erro do

fluxograma apresentado anteriormente. Ou seja, a próxima etapa é verificar se o

modelo é estável para, em seguida, realizar o diagnóstico dos resíduos.

12

8. Estabilidade do modelo

Para verificar a estabilidade, basta observar se os módulos das raízes do modelo

são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-

estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se

obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.

Exemplo de modelo não-estável (raízes no círculo unitário).

Exemplo de modelo estável (raízes fora do círculo unitário).

O módulo da raiz MA(1) não está fora do círculo unitário

O módulo de cada raiz está fora do círculo unitário

13

9. Diagnóstico de resíduos

Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou

seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).

Para testar a presença de memória, são usados dois testes: o Correlograma dos

Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do

modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:

Teste da memória dos resíduos (correlograma e Ljung-Box)

Basta clicar em OK para o Gretl gerar

o correlograma dos resíduos e o

teste de Ljung-Box.

Neste resultado, vemos que o

correlograma dos resíduos

apresenta correlações

(memórias) significativamente

diferente de zero (barras

rompendo o intervalo de

confiança)

É um indício de que o modelo

não está bem estimado.

14

Da mesma forma, o Ljung-Box

confirma a presença de memória

nos resíduos, como mostram os

baixo [p-valores] obtidos após a 5ª

defasagem.

Um bom modelo exibe um [p-

valor] alto para todas as

defasagens, evidenciando a não

rejeição da hipótese nula de

correlação igual a zero.

Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo

estimado, sem memória tanto pelo correlograma como pelo teste Ljung-Box:

Teste de normalidade dos resíduos

Para testar a

normalidade dos

resíduos, na tela do

modelo estimado,

clique no menu Testes

e na opção

Normalidade dos

resíduos.

15

O GRETL exibe um histograma dos

resíduos e o resultado do teste de

Doornik-Hansen na parte superior

esquerda da tela. Um p-valor (entre

colchetes) alto revela a não rejeição da

hipótese nula de normalidade dos

resíduos.

Um p-valor muito baixo mostra a

necessidade de se estimar um novo

modelo.

Teste ARCH para heterocedasticidade

O teste ARCH tem como

objetivo verificar se os resíduos

do modelo apresentam

variância constante

(homocedasticidade).

Menu Testes, opção ARCH.

Um p-valor muito alto revela a

não rejeição da hipótese nula de

homocedasticidade.

Um p-valor muito baixo mostra

que os resíduos são

heterocedásticos e um novo

modelo deve ser estimado

10. Comparação entre modelos

Na prática, mais de um modelo pode ser usado para representar a evolução da

série analisada. O pesquisador deve selecionar ao menos dois “modelos candidatos”

para compará-los e escolher qual deles será usado para a previsão. Um modelo

16

candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,

em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de

ajustamento. Desta forma, três critérios gerais são comumente empregados:

1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão disponíveis automaticamente sempre que um modelo é estimado.

Deve-se buscar privilegiar o modelo que gerar os menores critérios de informação

2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção

Mostrar efetivo, ajustado, resíduos.

Quanto menores os erros médios, melhor é o nível de ajustamento do modelo e melhor tende a ser a qualidade da previsão

3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de

memória que são não significativos, principalmente os últimos de cada ordem (AR ou MA).

Coeficiente significativo a 10% Coeficiente não significativo (p-valor muito alto)

17

11. Previsão Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL

a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável

k períodos a frente:

A previsão k períodos a

frente pode ser feita por

meio do menu Análise,

opção Previsões....

• Período para realizar a previsão

• Método de previsão (o mais usado

é a previsão automática)

• Opções para exibir o intervalo de

confiança da previsão

18

12. Séries não estacionárias Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que

mantinham constante suas características fundamentais. Contudo, a maior parte das

séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se

altere ao longo do tempo.

De maneira geral, trabalhamos com dois tipos de tendência:

• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no

tempo. Também conhecidas como séries TSP (Trend Stationary Process -

Processo de Tendência Estacionária).

• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se

altera com o passar do tempo. É também denominada de DSP (Difference

Stationary Process – Processo Estacionário por Diferença) ou ainda processo com

Raiz Unitária.

Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar

a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de

uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,

transformando a variável em sua primeira diferença. Em geral, a primeira diferença de

uma série é estacionaria.

Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença

Logarítmo da Arrecadação na Agropecuária (em nível)

Primeira difeença do logaritmo da arrecadação na agropecuária

3

4

5

6

7

8

9

10

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

desem

pre

go

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

d_desem

pre

go

16

16,2

16,4

16,6

16,8

17

17,2

2004 2006 2008 2010 2012 2014

l_agro

pecuaria

-0,6

-0,5

-0,4

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

0,4

2004 2006 2008 2010 2012 2014

d_l_

agro

pecuaria

19

Para a situação de tendência determinística (TSP) deve-se primeiro extrair o

componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos

estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,

onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X

seria a tendência temporal determinística. As próximas seções mostram como

operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.

13. Modelo ARIMA (p,d,q) O modelo ARIMA (p,d,q) é o indicado quando a série apresenta uma raiz unitária

ou tendência estocástica. Neste caso, podem ser tomados dois caminhos pelo Gretl. A

primeira opção é gerar a primeira diferença da variável e estimar um modelo ARMA (p,q)

sobre esta nova série estacionária.

Para gerar a primeira diferença de

uma série, selecione a variável e siga

até o menu Acrescentar, e depois na

opção Primeiras diferenças das

variáveis selecionadas.

Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA

(p,d,q) onde d é a quantidade de vezes que é preciso diferenciar a série original para se

obter algo estacionário. A estimação de um modelo ARIMA no Gretl segue os mesmos

passos de um modelo ARMA, com o adicional de que agora precisamos definir a ordem

de integração da série:

Define a ordem de integração da série

Após entrar pelo menu Modelos, opção Séries

Temporais, ARIMA, selecione as ordem p,d,q

20

Note que, em termos de modelo, é a mesma coisa estimar um modelo

ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a

primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2

respectivamente:

Estimando um ARIMA (1,1,1) para a série de L_energia original Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_ENERGIA



const 0,00468105 0,00806734 0,5802 0,56175

phi_1 -0,22456 0,112379 -1,9982 0,04569 **

theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***






AR

Raiz 1 -4,4532 0,0000 4,4532 0,5000

MA

Raiz 1 1,3396 0,0000 1,3396 0,0000

Estimando um ARMA(1,1) para a primeira diferença da série de L_energia Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ENERGIA



const 0,00468105 0,00806734 0,5802 0,56175

phi_1 -0,22456 0,112379 -1,9982 0,04569 **

theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***






AR

Raiz 1 -4,4532 0,0000 4,4532 0,5000

MA

Raiz 1 1,3396 0,0000 1,3396 0,0000

A diferença entre eles está no resultado da previsão. Enquanto o Modelo 1 faz a

previsão da série original, o Modelo 2 tem como previsão a primeira diferença da série.

Desta forma, na maior parte dos casos, é mais interessante estimar diretamente um

modelo ARIMA.

21

Observações importantes:

i. O correlograma para identificação inicial das ordens AR(p) e MA(q)

devem ser feitas em cima da primeira diferença da série.

ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.

14. Séries com tendência determinística Para se estimar um modelo com tenência determinística, devemos primeiro

extrair o componente determinístico por meio de um modelo de Mínimos Quadrados

Ordinários. As etapas são:

1. Rodar um modelo de M.Q.O. com a tendência temporal como variável

dependente.

2. Extrair os resíduos deste modelo estimado.

3. Estimar um modelo ARMA(p,q) sobre os resíduos.

Para acrescentar uma tendência

temporal, clique no menu

Acrescentar e depois na opção

Tendência Temporal.

No menu Modelo, selecione a

opção Mínimos Quadrados

Ordinários. Acrescente a variável

time na lista de Regressores e

estime o modelo.

22

Depois de estimado o modelo, salve os resíduos por meio do menu Salvar, opção Resíduos. Isso irá gerar uma nova variável na base de dados.

Abaixo, seguem os resultados para o tratamento da tendência determinística da

arrecadação do setor de Energia (em logaritmos).

Extração da tendência determinística Modelo 12: MQO, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: l_ENERGIA

Coeficiente Erro Padrão razão-t p-valor

const 17,7131 0,0773861 228,8933 <0,00001 ***

time 0,0050459 0,00100969 4,9975 <0,00001 ***


Soma resíd. quadrados 25,40026 E.P. da regressão 0,442026

R-quadrado 0,161153 R-quadrado ajustado 0,154700

F(1, 130) 24,97460 P-valor(F) 1,84e-06



rô 0,021395 Durbin-Watson 1,956131

Arrecadação do setor de energia Resíduos do modelo de M.Q.O.

16

16,5

17

17,5

18

18,5

19

19,5

20

2004 2006 2008 2010 2012 2014

l_EN

ER

GIA

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2004 2006 2008 2010 2012 2014

resíd

uo

Resíduos da regressão (= observados - ajustados l_ENERGIA)

23

Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência determinística


Variável dependente: uhat12



const 0,00370065 0,0635819 0,0582 0,95359

phi_1 0,852921 0,0951371 8,9652 <0,00001 ***

theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***

Média var. dependente -1,16e-15 D.P. var. dependente 0,440335





AR

Raiz 1 1,1724 0,0000 1,1724 0,0000

MA

Raiz 1 1,3426 0,0000 1,3426 0,0000

15. Modelo ARMAX para a tendência determinística Alternativamente, a tendência determinística pode ser modelada junto com o

modelo ARMA (p,q), utilizando a tendência temporal como variável exógena. Neste contexto, o modelo ARMA passa a ser conhecido como ARMAX, onde o X representa o conjunto de variáveis extra.

Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.

Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: l_ENERGIA



const 17,7187 0,123729 143,2058 <0,00001 ***

phi_1 0,852917 0,0951118 8,9675 <0,00001 ***

theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***

time 0,00501748 0,00159592 3,1439 0,00167 ***






AR

Raiz 1 1,1724 0,0000 1,1724 0,0000

MA

Raiz 1 1,3426 0,0000 1,3426 0,0000

24

Para estimar um modelo ARMAX, basta acrescentar variáveis extra na lista de Regressores. No nosso caso, acrescentamos a variável time, que é a tendência temporal.

16. Teste de Dickey-Fuller Aumentado (ADF)

O teste ADF foi originalmente desenhado para captar a presença de raiz unitária

na série (DSP). Contudo, também pode ser empregado para detectar a ocorrência de

tendência determinística (TSP). O teste possui a seguinte hipótese nula:

Ho: Presença de Raiz Unitária

Ha: Sem Raiz Unitária

Pode-se comparar o valor da estatística calculada com a tabela de valores críticos

de Dickey-fuller ou utilizar diretamente o p-valor. Um p-valor elevado (geralmente acima de 0,10) aponta para a não rejeição de Ho e evidencia a presença de raiz unitária na série. Por exemplo, o quadro abaixo mostra as três versões do teste para a taxa de desemprego no Brasil. A esquerda, os p-valores elevados mostram que a série original apresenta uma raiz unitária, enquanto sua primeira diferença aparenta ser estacionária.

Teste para Desemprego em nível Teste para a primeira diferença do desemprego

Teste de Dickey-Fuller para desemprego

dimensão de amostragem 111

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,029

valor estimado de (a - 1): 0,000551086

estatística de teste: tau_nc(1) = 0,0669027

p-valor 0,702

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: 0,014

valor estimado de (a - 1): -0,0750893

estatística de teste: tau_c(1) = -1,9269

p-valor 0,319

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e



estatística de teste: tau_ct(1) = -3,01459

p-valor 0,133

Teste de Dickey-Fuller para d_desemprego



teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e



estatística de teste: tau_nc(1) = -10,7045

p-valor 1,639e-068

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e




p-valor 3,585e-015


modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e




p-valor 4,921e-014

25

Contudo, a ausência de raiz unitária não implica necessariamente em uma série estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para identificação correta, deve-se aplicar o teste ADF em sua versão mais completa disponível no Gretl.

Para realizar o teste ADF, siga o esquema abaixo:

Selecione a variável, clique no menu Variável, e depois na opção Testes de raiz

unitária, teste de Dickey-Fuller aumentado.

• Determina a ordem máxima para o teste. O Gretl calcula automaticamente usando a fórmula

� = �� 12 ∗ � �100��/��

Onde T é o número de observações da base de dados.

• Marcar essa opção para visualizar todo o resultado do teste.

26

O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste ADF e identificar o tipo de tendência da série.

Abaixo, seguem alguns exemplos de aplicação do teste, seguindo a interpretação

deste fluxograma:

27

Teste ADF para L_agropecuaria Teste Aumentado de Dickey-Fuller para l_agropecuaria

incluindo 10 defasagens de (1-L)l_agropecuaria

(o máximo foi 12, critério estatística-t)



teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e


diferenças defasadas: F(10, 110) = 5,480 [0,0000]



p-valor assintótico 0,777

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)


coeficiente erro padrão razão-t p-valor

----------------------------------------------------------------

l_agropecuaria_1 0,000232479 0,000735252 0,3162 0,7770

d_l_agropecuar~_1 -0,368625 0,0945622 -3,898 0,0002 ***

d_l_agropecuar~_2 -0,411156 0,0988597 -4,159 6,36e-05 ***

d_l_agropecuar~_3 -0,191574 0,0980168 -1,955 0,0532 *

d_l_agropecuar~_4 -0,279691 0,0916272 -3,052 0,0028 ***

d_l_agropecuar~_5 -0,377815 0,0883527 -4,276 4,07e-05 ***

d_l_agropecuar~_6 -0,289086 0,0865691 -3,339 0,0011 ***

d_l_agropecuar~_7 -0,466409 0,0905514 -5,151 1,15e-06 ***

d_l_agropecuar~_8 -0,391866 0,0980797 -3,995 0,0001 ***

d_l_agropecuar~_9 -0,169873 0,100041 -1,698 0,0923 *

d_l_agropecua~_10 -0,263887 0,0928801 -2,841 0,0054 ***

AIC: -131,382 BIC: -100,629 HQC: -118,892

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e










---------------------------------------------------------------

const 2,13351 1,69898 1,256 0,2119

l_agropecuaria_1 -0,127696 0,101876 -1,253 0,6533

d_l_agropecuar~_1 -0,256666 0,129785 -1,978 0,0505 *

d_l_agropecuar~_2 -0,306019 0,129352 -2,366 0,0198 **

d_l_agropecuar~_3 -0,100402 0,121772 -0,8245 0,4115

d_l_agropecuar~_4 -0,198588 0,111906 -1,775 0,0788 *

d_l_agropecuar~_5 -0,306871 0,104676 -2,932 0,0041 ***

d_l_agropecuar~_6 -0,229387 0,0985655 -2,327 0,0218 **

d_l_agropecuar~_7 -0,412725 0,0999217 -4,130 7,12e-05 ***

d_l_agropecuar~_8 -0,348893 0,103636 -3,367 0,0011 ***

d_l_agropecuar~_9 -0,138856 0,102791 -1,351 0,1795

d_l_agropecua~_10 -0,241807 0,0942914 -2,564 0,0117 **

AIC: -131,12 BIC: -97,5709 HQC: -117,495


modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e










---------------------------------------------------------------

const 3,37431 1,99834 1,689 0,0942 *

l_agropecuaria_1 -0,204218 0,120792 -1,691 0,7557

d_l_agropecuar~_1 -0,198983 0,138563 -1,436 0,1539

d_l_agropecuar~_2 -0,259038 0,135186 -1,916 0,0580 *

d_l_agropecuar~_3 -0,0581789 0,126769 -0,4589 0,6472

d_l_agropecuar~_4 -0,160038 0,116437 -1,374 0,1721

d_l_agropecuar~_5 -0,271180 0,108827 -2,492 0,0142 **

d_l_agropecuar~_6 -0,203823 0,100775 -2,023 0,0456 **

d_l_agropecuar~_7 -0,394122 0,100999 -3,902 0,0002 ***

d_l_agropecuar~_8 -0,338045 0,103868 -3,255 0,0015 ***

d_l_agropecuar~_9 -0,132927 0,102737 -1,294 0,1985

d_l_agropecua~_10 -0,236548 0,0942346 -2,510 0,0135 **

time 0,000492543 0,000419508 1,174 0,2429

AIC: -130,655 BIC: -94,3098 HQC: -115,894

Sem evidência de tendência determinística. Mas com p-valor auto para o teste de raiz unitária. Subir para a versão sem tendência.

Constante não significativa e p-valor alto para o teste de raiz unitária. Subir para a versão sem constante.

Evidência de raiz unitária

28

Teste ADF para L_deduções Teste Aumentado de Dickey-Fuller para l_deducoes

incluindo 9 defasagens de (1-L)l_deducoes




teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e








Variável dependente: d_l_deducoes


----------------------------------------------------------------

l_deducoes_1 0,00223531 0,00115875 1,929 0,9876

d_l_deducoes_1 -0,690832 0,0933976 -7,397 2,74e-011 ***

d_l_deducoes_2 -0,490202 0,113904 -4,304 3,61e-05 ***

d_l_deducoes_3 -0,143804 0,122894 -1,170 0,2444

d_l_deducoes_4 -0,192615 0,123442 -1,560 0,1215

d_l_deducoes_5 -0,0733609 0,124632 -0,5886 0,5573

d_l_deducoes_6 -0,0598205 0,123578 -0,4841 0,6293

d_l_deducoes_7 0,0466701 0,122876 0,3798 0,7048

d_l_deducoes_8 0,0462044 0,113691 0,4064 0,6852

d_l_deducoes_9 0,153787 0,0931313 1,651 0,1015

AIC: -28,9695 BIC: -0,929251 HQC: -17,5804

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e










-----------------------------------------------------------------

const 0,0595967 0,416673 0,1430 0,8865

l_deducoes_1 -0,00125760 0,0222483 -0,05653 0,9522

d_l_deducoes_1 -0,674027 0,0837187 -8,051 5,50e-013 ***

d_l_deducoes_2 -0,403558 0,0824872 -4,892 3,00e-06 ***

AIC: -42,6647 BIC: -31,2255 HQC: -38,0168


modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e










---------------------------------------------------------------

const 2,92584 1,27459 2,296 0,0236 **

l_deducoes_1 -0,169562 0,0739674 -2,292 0,4376

d_l_deducoes_1 -0,573802 0,107125 -5,356 4,71e-07 ***

d_l_deducoes_2 -0,410086 0,120289 -3,409 0,0009 ***

d_l_deducoes_3 -0,0885861 0,126511 -0,7002 0,4853

d_l_deducoes_4 -0,144025 0,126401 -1,139 0,2570

d_l_deducoes_5 -0,0372025 0,126578 -0,2939 0,7694

d_l_deducoes_6 -0,0316024 0,124664 -0,2535 0,8004

d_l_deducoes_7 0,0707518 0,123450 0,5731 0,5677

d_l_deducoes_8 0,0647471 0,113449 0,5707 0,5694

d_l_deducoes_9 0,161771 0,0921629 1,755 0,0820 *

time 0,00409814 0,00164218 2,496 0,0141 **

AIC: -31,6994 BIC: 1,94888 HQC: -18,0325

Evidência de misto TSP/DSP

29

Teste ADF para L_Folha Teste Aumentado de Dickey-Fuller para l_Folha

incluindo 7 defasagens de (1-L)l_Folha




teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e








Variável dependente: d_l_Folha


-------------------------------------------------------------

l_Folha_1 0,00132659 0,00208376 0,6366 0,8538

d_l_Folha_1 -0,793613 0,0914723 -8,676 2,94e-014 ***

d_l_Folha_2 -0,625926 0,112921 -5,543 1,89e-07 ***

d_l_Folha_3 -0,488779 0,121801 -4,013 0,0001 ***

d_l_Folha_4 -0,478322 0,121962 -3,922 0,0001 ***

d_l_Folha_5 -0,398513 0,121483 -3,280 0,0014 ***

d_l_Folha_6 -0,321879 0,112567 -2,859 0,0050 ***

d_l_Folha_7 -0,173662 0,0898867 -1,932 0,0558 *

AIC: 168,31 BIC: 190,873 HQC: 177,476

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e










------------------------------------------------------------

const 9,82062 2,32168 4,230 4,48e-05 ***

l_Folha_1 -0,490125 0,116011 -4,225 0,0006 ***

d_l_Folha_1 -0,306429 0,110517 -2,773 0,0064 ***

d_l_Folha_2 -0,144649 0,0878458 -1,647 0,1021

AIC: 167,034 BIC: 178,473 HQC: 171,682


modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e










-------------------------------------------------------------

const 30,9189 6,95904 4,443 2,19e-05 ***

l_Folha_1 -1,58200 0,355932 -4,445 0,0018 ***

d_l_Folha_1 0,605438 0,333554 1,815 0,0723 *

d_l_Folha_2 0,620036 0,313240 1,979 0,0504 *

d_l_Folha_3 0,611657 0,294133 2,080 0,0400 **

d_l_Folha_4 0,478752 0,275824 1,736 0,0855 *

d_l_Folha_5 0,421578 0,253303 1,664 0,0990 *

d_l_Folha_6 0,353092 0,228215 1,547 0,1248

d_l_Folha_7 0,339274 0,203769 1,665 0,0989 *

d_l_Folha_8 0,341226 0,178363 1,913 0,0584 *

d_l_Folha_9 0,277195 0,156155 1,775 0,0787 *

d_l_Folha_10 0,228383 0,129193 1,768 0,0800 *

d_l_Folha_11 0,164162 0,0929386 1,766 0,0802 *

time 0,0105217 0,00253157 4,156 6,58e-05 ***

AIC: 154,267 BIC: 193,291 HQC: 170,115

Sem evidência de raiz unitária e com tendência determinística significativa. Evidência de série TSP

30

17. Sazonalidade As séries econômicas, principalmente as brasileiras, podem estar sujeitos à

sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um componente de memória e pode ser modelada juntamente com uma estimativa ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a sazonalidade da série e trabalhar com um processo livre deste componente.

Métodos para retirar a Sazonalidade Métodos para modelar a Sazonalidade

• Suavização por média móvel

• Suavização exponencial

• X-12-ARIMA

• ARMA degenerado

• SARMA(p,q)(P,Q)

• ARMAX com dummies periódicas

17. Suavização por média móvel

Salvar a série suavizada

Define a quantidade de meses usada na média móvel

31

18. Suavização exponencial

19. X-12-ARIMA Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário

instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:

1. Na página principal do Gretl na internet, clique na opção “Gretl for Windows” na parte esquerda.

Determina o valor de α. Quanto maior este valor, maior o peso no presente.

Yt*=αYt-1 + (1-α)Y*t-1

32

2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe 3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será

iniciado.

4. Instale o programa baixado seguindo os passos do instalador. É necessário que o Gretl

não esteja aberto neste momento.

5. Depois de instalado o programa, o pacote X-12-ARIMA estará disponível no Gretl

sempre que o usuário abrir uma base de dados como série temporal mensal ou

trimestral.

6. O pacote X-12-ARIMA pode ser acessado no menu Variável �� Análise X-12-ARIMA OBS: TEM QUE SELECIONAR A VARIÁVEL PRIMEIRO !!

33

7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM dessazonalizado.

20. ARMA degenerado

• Define as ordens específicas de defasagens

34

Exemplo de um modelo ARIMA[(1,12), 1, 1] Modelo 5: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria



const -0,000919328 0,0154457 -0,0595 0,95254

phi_1 -0,179238 0,084197 -2,1288 0,03327 **

phi_12 0,36066 0,0891847 4,0440 0,00005 ***






AR

Raiz 1 -1,0696 0,0000 1,0696 0,5000

Raiz 2 1,1052 0,0000 1,1052 0,0000

Raiz 3 -0,0176 -1,0900 1,0901 -0,2526

Raiz 4 -0,0176 1,0900 1,0901 0,2526

Raiz 5 0,9516 -0,5585 1,1034 -0,0845

Raiz 6 0,9516 0,5585 1,1034 0,0845

Raiz 7 -0,5546 -0,9276 1,0808 -0,3358

Raiz 8 -0,5546 0,9276 1,0808 0,3358

Raiz 9 -0,9341 -0,5276 1,0728 -0,4182

Raiz 10 -0,9341 0,5276 1,0728 0,4182

Raiz 11 0,5367 -0,9581 1,0982 -0,1687

Raiz 12 0,5367 0,9581 1,0982 0,1687

21. SARMA(p,q)(P,Q)

• Define as ordens sazonais

35

Exemplo de um modelo SARIMA(1,1,1)(1,0) Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)




const 0,00126219 0,00109948 1,1480 0,25097

phi_1 0,605108 0,0757161 7,9918 <0,00001 ***

Phi_1 0,409892 0,090208 4,5439 <0,00001 ***

theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***






AR

Raiz 1 1,6526 0,0000 1,6526 0,0000

AR

(sazonal)

Raiz 1 2,4397 0,0000 2,4397 0,0000

MA

Raiz 1 1,0000 0,0000 1,0000 0,0000

22. ARMAX com dummies periódicas

Para acrescentar as binárias de períodos, clique no menu Acrescentar e na opção Dummies periódicas

Com isso, são criadas binárias para cada período. No exemplo, foram criadas 12 dummies, uma para cada mês do ano.

36

Para estimar o modelo, basta acrescentar as binárias na lista de Regressores. Lembre-se de sempre acrescentar um número a menos que a quantidade total de binárias. No exemplo, são 12 meses. Logo, devem ser incluídas no máximo 11 binárias no modelo.

Exemplo de um modelo ARMAX com dummies periódicas

Modelo 1: ARMAX, usando as observações 2003:02-2013:12 (T = 131)




const 0,000610663 0,00324124 0,1884 0,85056

phi_1 0,345129 0,156311 2,2080 0,02725 **

theta_1 -0,79347 0,106849 -7,4261 <0,00001 ***

dm2 0,0285772 0,0379625 0,7528 0,45159

dm3 0,0176125 0,0445928 0,3950 0,69287

dm4 0,148899 0,0470598 3,1640 0,00156 ***

dm5 0,276885 0,0481692 5,7482 <0,00001 ***

dm6 0,178553 0,0486953 3,6667 0,00025 ***

dm7 0,25779 0,0488848 5,2734 <0,00001 ***

dm8 0,299158 0,0488054 6,1296 <0,00001 ***

dm9 0,265164 0,0484063 5,4779 <0,00001 ***

dm10 0,187742 0,0474609 3,9557 0,00008 ***

dm11 0,0240094 0,0452392 0,5307 0,59561

dm12 -0,123349 0,0391174 -3,1533 0,00161 ***






AR

Raiz 1 2,8975 0,0000 2,8975 0,0000

MA

Raiz 1 1,2603 0,0000 1,2603 0,0000

curso de anÁlise de sÉries temporais –...

Documents