curso de anÁlise de sÉries temporais –...
TRANSCRIPT
1
FACE – Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação do Curso de Ciências Econômicas Prof.ª Priscila Casari NEPEC – Núcleo de Estudos e Pesquisas Econômicas Coordenação Sérgio Fornazier Meyrelles Filho Endereço Campus Samambaia, Prédio da FACE – Rodovia Goiânia/Nova Veneza, km. 0 – Caixa Postal 131, CEP 74001-970, Goiânia – GO. Tel. (62) 3521 – 1390 URL http://www.face.ufg.br/economia
CURSO DE ANÁLISE DE SÉRIES
TEMPORAIS – MODELO ARIMA
MATERIAL DE APOIO
Professor:
Sandro Eduardo Monsueto
NEPEC/FACE/UFG
Goiânia – Setembro/Outubro 2014
Versão 1.0
2
1. Introdução e conceitos básicos
Esta apostila serve de material de apoio para a realização do curso. Longe de ser
abrangente, tem como objetivo servir de guia ou de lembrete para a execução de
tarefas. Outros materiais, melhores e mais completos, podem ser facilmente
encontrados de forma gratuita na internet e em livros especializados no assunto. Para
realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar
gratuitamente no site gretl.sourceforge.net.
A primeira definição necessária para nossa análise é o conceito de série
temporal. Uma série temporal é uma sequência de dados no tempo com uma
determinada periodicidade. Alguns exemplos:
- PIB brasileiro trimestral.
- taxa de juros mensal.
- índice pluviométrico semanal.
- valor das ações da Petrobras minuto a minuto.
Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de
vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação
algébrica para representar os dados no tempo:
Yt: a observação no tempo t da variável Y. Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal. Yt+1: a observação um período a frente. Generalizando: Yt±j: a observação no período t±j Exemplo:
Mês Período Yt Yt-1 Yt+1
1991.01 Y1 3,6 3,9
1991.02 Y2 3,9 3,6 2,5
1991.03 Y3 2,5 3,9 1,9
1991.04 Y4 1,9 2,5 2,7
1991.05 Y5 2,7 1,9 2,4
1991.06 Y6 2,4 2,7 1,6
1991.07 Y7 1,6 2,4 1,6
1991.08 Y8 1,6 1,6 1,7
1991.09 Y9 1,7 1,6 2,5
1991.10 Y10 2,5 1,7 -
O restante do material está constituído de uma série de exemplos estimados com
dados reais ou fictícios e telas explicativas das funções do programa Gretl. Ao longo do
curso serão acrescentados novos exemplos.
3
2. Exemplos de Modelos Autoregressivos – AR(p) AR(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,571725 0,11237 5,0879 <0,00001 ***
phi_1 0,788617 0,0471062 16,7413 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006069 D.P. das inovações 0,326753
Log da verossimilhança -55,45739 Critério de Akaike 116,9148
Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177
Real Imaginária Módulo Frequência
AR
Raiz 1 1,2680 0,0000 1,2680 0,0000
AR(2) Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,569602 0,108703 5,2400 <0,00001 ***
phi_1 0,815008 0,0755062 10,7939 <0,00001 ***
phi_2 -0,0338969 0,0758055 -0,4472 0,65476
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,005716 D.P. das inovações 0,326574
Log da verossimilhança -55,35740 Critério de Akaike 118,7148
Critério de Schwarz 131,5527 Critério Hannan-Quinn 123,9187
Real Imaginária Módulo Frequência
AR
Raiz 1 1,2969 0,0000 1,2969 0,0000
Raiz 2 22,7468 0,0000 22,7468 0,0000
AR(3) Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,574432 0,115983 4,9527 <0,00001 ***
phi_1 0,819322 0,0755966 10,8381 <0,00001 ***
phi_2 -0,0819083 0,0988616 -0,8285 0,40738
phi_3 0,0579267 0,0767865 0,7544 0,45062
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006535 D.P. das inovações 0,326053
Log da verossimilhança -55,07385 Critério de Akaike 120,1477
Critério de Schwarz 136,1951 Critério Hannan-Quinn 126,6525
Real Imaginária Módulo Frequência
AR
Raiz 1 1,2395 0,0000 1,2395 0,0000
Raiz 2 0,0873 -3,7310 3,7320 -0,2463
Raiz 3 0,0873 3,7310 3,7320 0,2463
4
Exemplos de modelos AR(p) usando dados da Sefaz/GO:
ICMS – Taxa de crescimento
Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00567966 0,00816623 0,6955 0,48674
phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações 0,000328 D.P. das inovações 0,130597
Log da verossimilhança 80,70000 Critério de Akaike -155,4000
Critério de Schwarz -146,7744 Critério Hannan-Quinn -151,8950
Real Imaginária Módulo Frequência
AR
Raiz 1 -2,4979 0,0000 2,4979 0,5000
Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00586463 0,00564463 1,0390 0,29882
phi_1 -0,542985 0,0815173 -6,6610 <0,00001 ***
phi_2 -0,354886 0,0815606 -4,3512 0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações 0,000412 D.P. das inovações 0,121990
Log da verossimilhança 89,49711 Critério de Akaike -170,9942
Critério de Schwarz -159,4934 Critério Hannan-Quinn -166,3209
Real Imaginária Módulo Frequência
AR
Raiz 1 -0,7650 -1,4942 1,6786 -0,3253
Raiz 2 -0,7650 1,4942 1,6786 0,3253
5
3. Exemplos de Modelos de Média Móvel – MA(q) MA(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,543279 0,0464909 11,6857 <0,00001 ***
theta_1 0,611094 0,0422925 14,4492 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,001839 D.P. das inovações 0,391161
Log da verossimilhança -88,12918 Critério de Akaike 182,2584
Critério de Schwarz 191,8868 Critério Hannan-Quinn 186,1612
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,6364 0,0000 1,6364 0,5000
MA(2)
Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,546989 0,0585125 9,3482 <0,00001 ***
theta_1 0,881548 0,0774425 11,3833 <0,00001 ***
theta_2 0,387895 0,0583002 6,6534 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,002213 D.P. das inovações 0,350163
Log da verossimilhança -68,05490 Critério de Akaike 144,1098
Critério de Schwarz 156,9477 Critério Hannan-Quinn 149,3136
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,1363 -1,1344 1,6056 -0,3751
Raiz 2 -1,1363 1,1344 1,6056 0,3751
MA(3)
Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,550957 0,0646414 8,5233 <0,00001 ***
theta_1 0,782521 0,0735914 10,6333 <0,00001 ***
theta_2 0,5313 0,0810619 6,5542 <0,00001 ***
theta_3 0,251944 0,0703504 3,5813 0,00034 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,003248 D.P. das inovações 0,342610
Log da verossimilhança -64,02861 Critério de Akaike 138,0572
Critério de Schwarz 154,1046 Critério Hannan-Quinn 144,5620
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,6714 0,0000 1,6714 0,5000
Raiz 2 -0,2187 -1,5254 1,5410 -0,2727
Raiz 3 -0,2187 1,5254 1,5410 0,2727
6
Exemplos de modelos MA(q) usando dados da Sefaz/GO:
Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00560753 0,00080953 6,9269 <0,00001 ***
theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações -0,000695 D.P. das inovações 0,109008
Log da verossimilhança 103,4931 Critério de Akaike -200,9861
Critério de Schwarz -192,3605 Critério Hannan-Quinn -197,4812
Real Imaginária Módulo Frequência
MA
Raiz 1 1,0815 0,0000 1,0815 0,0000
Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00570155 0,000691485 8,2454 <0,00001 ***
theta_1 -0,824861 0,0936196 -8,8108 <0,00001 ***
theta_2 -0,115467 0,0992711 -1,1632 0,24477
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações -0,002216 D.P. das inovações 0,108390
Log da verossimilhança 104,1715 Critério de Akaike -200,3431
Critério de Schwarz -188,8423 Critério Hannan-Quinn -195,6698
Real Imaginária Módulo Frequência
MA
Raiz 1 1,0562 0,0000 1,0562 0,0000
Raiz 2 -8,1999 0,0000 8,1999 0,5000
7
4. Exemplos de Modelos ARMA (1,1)
Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto
prazo:
Modelo 1: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00569386 0,000702447 8,1057 <0,00001 ***
phi_1 0,102099 0,0982049 1,0397 0,29850
theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***
Média var. dependente 0,005959 D.P. var. dependente 0,143210
Média de inovações -0,002089 D.P. das inovações 0,108501
Log da verossimilhança 104,0450 Critério de Akaike -200,0900
Critério de Schwarz -188,5892 Critério Hannan-Quinn -195,4167
Real Imaginária Módulo Frequência
AR
Raiz 1 9,7944 0,0000 9,7944 0,0000
MA
Raiz 1 1,0578 0,0000 1,0578 0,0000
Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00140343 0,00101435 1,3836 0,16649
phi_1 0,681096 0,0674072 10,1042 <0,00001 ***
theta_1 -1 0,0236957 -42,2017 <0,00001 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações -0,000652 D.P. das inovações 0,148405
Log da verossimilhança 62,41573 Critério de Akaike -116,8315
Critério de Schwarz -105,3307 Critério Hannan-Quinn -112,1582
Real Imaginária Módulo Frequência
AR
Raiz 1 1,4682 0,0000 1,4682 0,0000
MA
Raiz 1 1,0000 0,0000 1,0000 0,0000
8
5. Estimar modelos ARMA/ARIMA no Gretl
Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique
na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:
Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será
utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo
ARMA tradicional não possui regressores extras.
Selecione a variável e clique no botão lilás
Define a ordem AR(p) - longo prazo
Define a ordem MA(q) - curto prazo
9
6. O método Box-Jenkins de previsão
O objetivo do método é gerar um modelo com as seguintes características:
i. Estabilidade (módulo das raízes fora do círculo unitário)
ii. Resíduos na forma de Ruído Branco
a. Sem memória
b. Normalmente distribuído
c. Homocedástico
O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA
10
7. O correlograma
Para gerar o correlograma de uma série temporal, clique sobre uma variável com
o botão direito do mouse e selecione a opção Correlograma:
O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que
ultrapassam o intervalo de confiança são estatisticamente diferente de zero, indicando
presença de algum tipo de memória na série.
A interpretação do correlograma segue o esperado para cada tipo de modelo
teórico. Seguindo Bueno (2011), temos:
Fonte: Bueno (2011)
Função de Autocorrelação Simples (FAC)
Função de Autocorrelação Parcial (FACP)
11
Correlograma esperado para um AR(1) FAC – decaimento exponencial
FACP – truncada na primeira defasagem
Correlograma esperado para um AR(2)
FAC – decaimento exponencial
FACP – truncada na segunda defasagem
Correlograma esperado para um MA(2)
FAC – truncada na segunda defasagem
FACP – decaimento exponencial
Correlograma esperado para um ARMA(2,1)
FAC – truncada na primeira e decaimento exponencial a partir da segunda defasagem
FACP – truncada na segunda e decaimento exponencial a partir da terceira defasagem
Contudo, lembre-se que na prática a identificação visual do modelo é
complicada, devendo o pesquisador utilizar o processo de tentativa e erro do
fluxograma apresentado anteriormente. Ou seja, a próxima etapa é verificar se o
modelo é estável para, em seguida, realizar o diagnóstico dos resíduos.
12
8. Estabilidade do modelo
Para verificar a estabilidade, basta observar se os módulos das raízes do modelo
são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-
estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se
obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.
Exemplo de modelo não-estável (raízes no círculo unitário).
Exemplo de modelo estável (raízes fora do círculo unitário).
O módulo da raiz MA(1) não está fora do círculo unitário
O módulo de cada raiz está fora do círculo unitário
13
9. Diagnóstico de resíduos
Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou
seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).
Para testar a presença de memória, são usados dois testes: o Correlograma dos
Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do
modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:
Teste da memória dos resíduos (correlograma e Ljung-Box)
Basta clicar em OK para o Gretl gerar
o correlograma dos resíduos e o
teste de Ljung-Box.
Neste resultado, vemos que o
correlograma dos resíduos
apresenta correlações
(memórias) significativamente
diferente de zero (barras
rompendo o intervalo de
confiança)
É um indício de que o modelo
não está bem estimado.
14
Da mesma forma, o Ljung-Box
confirma a presença de memória
nos resíduos, como mostram os
baixo [p-valores] obtidos após a 5ª
defasagem.
Um bom modelo exibe um [p-
valor] alto para todas as
defasagens, evidenciando a não
rejeição da hipótese nula de
correlação igual a zero.
Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo
estimado, sem memória tanto pelo correlograma como pelo teste Ljung-Box:
Teste de normalidade dos resíduos
Para testar a
normalidade dos
resíduos, na tela do
modelo estimado,
clique no menu Testes
e na opção
Normalidade dos
resíduos.
15
O GRETL exibe um histograma dos
resíduos e o resultado do teste de
Doornik-Hansen na parte superior
esquerda da tela. Um p-valor (entre
colchetes) alto revela a não rejeição da
hipótese nula de normalidade dos
resíduos.
Um p-valor muito baixo mostra a
necessidade de se estimar um novo
modelo.
Teste ARCH para heterocedasticidade
O teste ARCH tem como
objetivo verificar se os resíduos
do modelo apresentam
variância constante
(homocedasticidade).
Menu Testes, opção ARCH.
Um p-valor muito alto revela a
não rejeição da hipótese nula de
homocedasticidade.
Um p-valor muito baixo mostra
que os resíduos são
heterocedásticos e um novo
modelo deve ser estimado
10. Comparação entre modelos
Na prática, mais de um modelo pode ser usado para representar a evolução da
série analisada. O pesquisador deve selecionar ao menos dois “modelos candidatos”
para compará-los e escolher qual deles será usado para a previsão. Um modelo
16
candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,
em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de
ajustamento. Desta forma, três critérios gerais são comumente empregados:
1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão disponíveis automaticamente sempre que um modelo é estimado.
Deve-se buscar privilegiar o modelo que gerar os menores critérios de informação
2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção
Mostrar efetivo, ajustado, resíduos.
Quanto menores os erros médios, melhor é o nível de ajustamento do modelo e melhor tende a ser a qualidade da previsão
3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de
memória que são não significativos, principalmente os últimos de cada ordem (AR ou MA).
Coeficiente significativo a 10% Coeficiente não significativo (p-valor muito alto)
17
11. Previsão Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL
a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável
k períodos a frente:
A previsão k períodos a
frente pode ser feita por
meio do menu Análise,
opção Previsões....
• Período para realizar a previsão
• Método de previsão (o mais usado
é a previsão automática)
• Opções para exibir o intervalo de
confiança da previsão
18
12. Séries não estacionárias Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que
mantinham constante suas características fundamentais. Contudo, a maior parte das
séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se
altere ao longo do tempo.
De maneira geral, trabalhamos com dois tipos de tendência:
• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no
tempo. Também conhecidas como séries TSP (Trend Stationary Process -
Processo de Tendência Estacionária).
• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se
altera com o passar do tempo. É também denominada de DSP (Difference
Stationary Process – Processo Estacionário por Diferença) ou ainda processo com
Raiz Unitária.
Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar
a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de
uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,
transformando a variável em sua primeira diferença. Em geral, a primeira diferença de
uma série é estacionaria.
Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença
Logarítmo da Arrecadação na Agropecuária (em nível)
Primeira difeença do logaritmo da arrecadação na agropecuária
3
4
5
6
7
8
9
10
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
desem
pre
go
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
d_desem
pre
go
16
16,2
16,4
16,6
16,8
17
17,2
2004 2006 2008 2010 2012 2014
l_agro
pecuaria
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
2004 2006 2008 2010 2012 2014
d_l_
agro
pecuaria
19
Para a situação de tendência determinística (TSP) deve-se primeiro extrair o
componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos
estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,
onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X
seria a tendência temporal determinística. As próximas seções mostram como
operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.
13. Modelo ARIMA (p,d,q) O modelo ARIMA (p,d,q) é o indicado quando a série apresenta uma raiz unitária
ou tendência estocástica. Neste caso, podem ser tomados dois caminhos pelo Gretl. A
primeira opção é gerar a primeira diferença da variável e estimar um modelo ARMA (p,q)
sobre esta nova série estacionária.
Para gerar a primeira diferença de
uma série, selecione a variável e siga
até o menu Acrescentar, e depois na
opção Primeiras diferenças das
variáveis selecionadas.
Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA
(p,d,q) onde d é a quantidade de vezes que é preciso diferenciar a série original para se
obter algo estacionário. A estimação de um modelo ARIMA no Gretl segue os mesmos
passos de um modelo ARMA, com o adicional de que agora precisamos definir a ordem
de integração da série:
Define a ordem de integração da série
Após entrar pelo menu Modelos, opção Séries
Temporais, ARIMA, selecione as ordem p,d,q
20
Note que, em termos de modelo, é a mesma coisa estimar um modelo
ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a
primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2
respectivamente:
Estimando um ARIMA (1,1,1) para a série de L_energia original Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***
Média var. dependente 0,006812 D.P. var. dependente 0,618222
Média de inovações 0,003483 D.P. das inovações 0,434964
Log da verossimilhança -77,41286 Critério de Akaike 162,8257
Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990
Real Imaginária Módulo Frequência
AR
Raiz 1 -4,4532 0,0000 4,4532 0,5000
MA
Raiz 1 1,3396 0,0000 1,3396 0,0000
Estimando um ARMA(1,1) para a primeira diferença da série de L_energia Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***
Média var. dependente 0,006812 D.P. var. dependente 0,618222
Média de inovações 0,003483 D.P. das inovações 0,434964
Log da verossimilhança -77,41286 Critério de Akaike 162,8257
Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990
Real Imaginária Módulo Frequência
AR
Raiz 1 -4,4532 0,0000 4,4532 0,5000
MA
Raiz 1 1,3396 0,0000 1,3396 0,0000
A diferença entre eles está no resultado da previsão. Enquanto o Modelo 1 faz a
previsão da série original, o Modelo 2 tem como previsão a primeira diferença da série.
Desta forma, na maior parte dos casos, é mais interessante estimar diretamente um
modelo ARIMA.
21
Observações importantes:
i. O correlograma para identificação inicial das ordens AR(p) e MA(q)
devem ser feitas em cima da primeira diferença da série.
ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.
14. Séries com tendência determinística Para se estimar um modelo com tenência determinística, devemos primeiro
extrair o componente determinístico por meio de um modelo de Mínimos Quadrados
Ordinários. As etapas são:
1. Rodar um modelo de M.Q.O. com a tendência temporal como variável
dependente.
2. Extrair os resíduos deste modelo estimado.
3. Estimar um modelo ARMA(p,q) sobre os resíduos.
Para acrescentar uma tendência
temporal, clique no menu
Acrescentar e depois na opção
Tendência Temporal.
No menu Modelo, selecione a
opção Mínimos Quadrados
Ordinários. Acrescente a variável
time na lista de Regressores e
estime o modelo.
22
Depois de estimado o modelo, salve os resíduos por meio do menu Salvar, opção Resíduos. Isso irá gerar uma nova variável na base de dados.
Abaixo, seguem os resultados para o tratamento da tendência determinística da
arrecadação do setor de Energia (em logaritmos).
Extração da tendência determinística Modelo 12: MQO, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
Coeficiente Erro Padrão razão-t p-valor
const 17,7131 0,0773861 228,8933 <0,00001 ***
time 0,0050459 0,00100969 4,9975 <0,00001 ***
Média var. dependente 18,04870 D.P. var. dependente 0,480775
Soma resíd. quadrados 25,40026 E.P. da regressão 0,442026
R-quadrado 0,161153 R-quadrado ajustado 0,154700
F(1, 130) 24,97460 P-valor(F) 1,84e-06
Log da verossimilhança -78,52907 Critério de Akaike 161,0581
Critério de Schwarz 166,8237 Critério Hannan-Quinn 163,4010
rô 0,021395 Durbin-Watson 1,956131
Arrecadação do setor de energia Resíduos do modelo de M.Q.O.
16
16,5
17
17,5
18
18,5
19
19,5
20
2004 2006 2008 2010 2012 2014
l_EN
ER
GIA
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2004 2006 2008 2010 2012 2014
resíd
uo
Resíduos da regressão (= observados - ajustados l_ENERGIA)
23
Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência determinística
Modelo 13: ARMA, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: uhat12
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00370065 0,0635819 0,0582 0,95359
phi_1 0,852921 0,0951371 8,9652 <0,00001 ***
theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***
Média var. dependente -1,16e-15 D.P. var. dependente 0,440335
Média de inovações -0,001374 D.P. das inovações 0,429159
Log da verossimilhança -75,68339 Critério de Akaike 159,3668
Critério de Schwarz 170,8980 Critério Hannan-Quinn 164,0525
Real Imaginária Módulo Frequência
AR
Raiz 1 1,1724 0,0000 1,1724 0,0000
MA
Raiz 1 1,3426 0,0000 1,3426 0,0000
15. Modelo ARMAX para a tendência determinística Alternativamente, a tendência determinística pode ser modelada junto com o
modelo ARMA (p,q), utilizando a tendência temporal como variável exógena. Neste contexto, o modelo ARMA passa a ser conhecido como ARMAX, onde o X representa o conjunto de variáveis extra.
Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.
Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 17,7187 0,123729 143,2058 <0,00001 ***
phi_1 0,852917 0,0951118 8,9675 <0,00001 ***
theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***
time 0,00501748 0,00159592 3,1439 0,00167 ***
Média var. dependente 18,04870 D.P. var. dependente 0,480775
Média de inovações -0,001349 D.P. das inovações 0,429158
Log da verossimilhança -75,68323 Critério de Akaike 161,3665
Critério de Schwarz 175,7805 Critério Hannan-Quinn 167,2237
Real Imaginária Módulo Frequência
AR
Raiz 1 1,1724 0,0000 1,1724 0,0000
MA
Raiz 1 1,3426 0,0000 1,3426 0,0000
24
Para estimar um modelo ARMAX, basta acrescentar variáveis extra na lista de Regressores. No nosso caso, acrescentamos a variável time, que é a tendência temporal.
16. Teste de Dickey-Fuller Aumentado (ADF)
O teste ADF foi originalmente desenhado para captar a presença de raiz unitária
na série (DSP). Contudo, também pode ser empregado para detectar a ocorrência de
tendência determinística (TSP). O teste possui a seguinte hipótese nula:
Ho: Presença de Raiz Unitária
Ha: Sem Raiz Unitária
Pode-se comparar o valor da estatística calculada com a tabela de valores críticos
de Dickey-fuller ou utilizar diretamente o p-valor. Um p-valor elevado (geralmente acima de 0,10) aponta para a não rejeição de Ho e evidencia a presença de raiz unitária na série. Por exemplo, o quadro abaixo mostra as três versões do teste para a taxa de desemprego no Brasil. A esquerda, os p-valores elevados mostram que a série original apresenta uma raiz unitária, enquanto sua primeira diferença aparenta ser estacionária.
Teste para Desemprego em nível Teste para a primeira diferença do desemprego
Teste de Dickey-Fuller para desemprego
dimensão de amostragem 111
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,029
valor estimado de (a - 1): 0,000551086
estatística de teste: tau_nc(1) = 0,0669027
p-valor 0,702
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: 0,014
valor estimado de (a - 1): -0,0750893
estatística de teste: tau_c(1) = -1,9269
p-valor 0,319
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: 0,038
valor estimado de (a - 1): -0,153099
estatística de teste: tau_ct(1) = -3,01459
p-valor 0,133
Teste de Dickey-Fuller para d_desemprego
dimensão de amostragem 110
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,005
valor estimado de (a - 1): -1,02869
estatística de teste: tau_nc(1) = -10,7045
p-valor 1,639e-068
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,005
valor estimado de (a - 1): -1,03106
estatística de teste: tau_c(1) = -10,6734
p-valor 3,585e-015
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,006
valor estimado de (a - 1): -1,03417
estatística de teste: tau_ct(1) = -10,6509
p-valor 4,921e-014
25
Contudo, a ausência de raiz unitária não implica necessariamente em uma série estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para identificação correta, deve-se aplicar o teste ADF em sua versão mais completa disponível no Gretl.
Para realizar o teste ADF, siga o esquema abaixo:
Selecione a variável, clique no menu Variável, e depois na opção Testes de raiz
unitária, teste de Dickey-Fuller aumentado.
• Determina a ordem máxima para o teste. O Gretl calcula automaticamente usando a fórmula
� = ��� �12 ∗ � �100��/��
Onde T é o número de observações da base de dados.
• Marcar essa opção para visualizar todo o resultado do teste.
26
O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste ADF e identificar o tipo de tendência da série.
Abaixo, seguem alguns exemplos de aplicação do teste, seguindo a interpretação
deste fluxograma:
27
Teste ADF para L_agropecuaria Teste Aumentado de Dickey-Fuller para l_agropecuaria
incluindo 10 defasagens de (1-L)l_agropecuaria
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 121
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,036
diferenças defasadas: F(10, 110) = 5,480 [0,0000]
valor estimado de (a - 1): 0,000232479
estatística de teste: tau_nc(1) = 0,31619
p-valor assintótico 0,777
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
Variável dependente: d_l_agropecuaria
coeficiente erro padrão razão-t p-valor
----------------------------------------------------------------
l_agropecuaria_1 0,000232479 0,000735252 0,3162 0,7770
d_l_agropecuar~_1 -0,368625 0,0945622 -3,898 0,0002 ***
d_l_agropecuar~_2 -0,411156 0,0988597 -4,159 6,36e-05 ***
d_l_agropecuar~_3 -0,191574 0,0980168 -1,955 0,0532 *
d_l_agropecuar~_4 -0,279691 0,0916272 -3,052 0,0028 ***
d_l_agropecuar~_5 -0,377815 0,0883527 -4,276 4,07e-05 ***
d_l_agropecuar~_6 -0,289086 0,0865691 -3,339 0,0011 ***
d_l_agropecuar~_7 -0,466409 0,0905514 -5,151 1,15e-06 ***
d_l_agropecuar~_8 -0,391866 0,0980797 -3,995 0,0001 ***
d_l_agropecuar~_9 -0,169873 0,100041 -1,698 0,0923 *
d_l_agropecua~_10 -0,263887 0,0928801 -2,841 0,0054 ***
AIC: -131,382 BIC: -100,629 HQC: -118,892
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,029
diferenças defasadas: F(10, 109) = 3,331 [0,0008]
valor estimado de (a - 1): -0,127696
estatística de teste: tau_c(1) = -1,25345
p-valor assintótico 0,6533
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
Variável dependente: d_l_agropecuaria
coeficiente erro padrão razão-t p-valor
---------------------------------------------------------------
const 2,13351 1,69898 1,256 0,2119
l_agropecuaria_1 -0,127696 0,101876 -1,253 0,6533
d_l_agropecuar~_1 -0,256666 0,129785 -1,978 0,0505 *
d_l_agropecuar~_2 -0,306019 0,129352 -2,366 0,0198 **
d_l_agropecuar~_3 -0,100402 0,121772 -0,8245 0,4115
d_l_agropecuar~_4 -0,198588 0,111906 -1,775 0,0788 *
d_l_agropecuar~_5 -0,306871 0,104676 -2,932 0,0041 ***
d_l_agropecuar~_6 -0,229387 0,0985655 -2,327 0,0218 **
d_l_agropecuar~_7 -0,412725 0,0999217 -4,130 7,12e-05 ***
d_l_agropecuar~_8 -0,348893 0,103636 -3,367 0,0011 ***
d_l_agropecuar~_9 -0,138856 0,102791 -1,351 0,1795
d_l_agropecua~_10 -0,241807 0,0942914 -2,564 0,0117 **
AIC: -131,12 BIC: -97,5709 HQC: -117,495
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,026
diferenças defasadas: F(10, 108) = 3,298 [0,0009]
valor estimado de (a - 1): -0,204218
estatística de teste: tau_ct(1) = -1,69067
p-valor assintótico 0,7557
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
Variável dependente: d_l_agropecuaria
coeficiente erro padrão razão-t p-valor
---------------------------------------------------------------
const 3,37431 1,99834 1,689 0,0942 *
l_agropecuaria_1 -0,204218 0,120792 -1,691 0,7557
d_l_agropecuar~_1 -0,198983 0,138563 -1,436 0,1539
d_l_agropecuar~_2 -0,259038 0,135186 -1,916 0,0580 *
d_l_agropecuar~_3 -0,0581789 0,126769 -0,4589 0,6472
d_l_agropecuar~_4 -0,160038 0,116437 -1,374 0,1721
d_l_agropecuar~_5 -0,271180 0,108827 -2,492 0,0142 **
d_l_agropecuar~_6 -0,203823 0,100775 -2,023 0,0456 **
d_l_agropecuar~_7 -0,394122 0,100999 -3,902 0,0002 ***
d_l_agropecuar~_8 -0,338045 0,103868 -3,255 0,0015 ***
d_l_agropecuar~_9 -0,132927 0,102737 -1,294 0,1985
d_l_agropecua~_10 -0,236548 0,0942346 -2,510 0,0135 **
time 0,000492543 0,000419508 1,174 0,2429
AIC: -130,655 BIC: -94,3098 HQC: -115,894
Sem evidência de tendência determinística. Mas com p-valor auto para o teste de raiz unitária. Subir para a versão sem tendência.
Constante não significativa e p-valor alto para o teste de raiz unitária. Subir para a versão sem constante.
Evidência de raiz unitária
28
Teste ADF para L_deduções Teste Aumentado de Dickey-Fuller para l_deducoes
incluindo 9 defasagens de (1-L)l_deducoes
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 122
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: 0,018
diferenças defasadas: F(9, 112) = 7,901 [0,0000]
valor estimado de (a - 1): 0,00223531
estatística de teste: tau_nc(1) = 1,92907
p-valor assintótico 0,9876
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:11-2013:12 (T = 122)
Variável dependente: d_l_deducoes
coeficiente erro padrão razão-t p-valor
----------------------------------------------------------------
l_deducoes_1 0,00223531 0,00115875 1,929 0,9876
d_l_deducoes_1 -0,690832 0,0933976 -7,397 2,74e-011 ***
d_l_deducoes_2 -0,490202 0,113904 -4,304 3,61e-05 ***
d_l_deducoes_3 -0,143804 0,122894 -1,170 0,2444
d_l_deducoes_4 -0,192615 0,123442 -1,560 0,1215
d_l_deducoes_5 -0,0733609 0,124632 -0,5886 0,5573
d_l_deducoes_6 -0,0598205 0,123578 -0,4841 0,6293
d_l_deducoes_7 0,0466701 0,122876 0,3798 0,7048
d_l_deducoes_8 0,0462044 0,113691 0,4064 0,6852
d_l_deducoes_9 0,153787 0,0931313 1,651 0,1015
AIC: -28,9695 BIC: -0,929251 HQC: -17,5804
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,012
diferenças defasadas: F(2, 125) = 32,965 [0,0000]
valor estimado de (a - 1): -0,0012576
estatística de teste: tau_c(1) = -0,0565259
p-valor assintótico 0,9522
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:04-2013:12 (T = 129)
Variável dependente: d_l_deducoes
coeficiente erro padrão razão-t p-valor
-----------------------------------------------------------------
const 0,0595967 0,416673 0,1430 0,8865
l_deducoes_1 -0,00125760 0,0222483 -0,05653 0,9522
d_l_deducoes_1 -0,674027 0,0837187 -8,051 5,50e-013 ***
d_l_deducoes_2 -0,403558 0,0824872 -4,892 3,00e-06 ***
AIC: -42,6647 BIC: -31,2255 HQC: -38,0168
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: 0,017
diferenças defasadas: F(9, 110) = 4,740 [0,0000]
valor estimado de (a - 1): -0,169562
estatística de teste: tau_ct(1) = -2,29238
p-valor assintótico 0,4376
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:11-2013:12 (T = 122)
Variável dependente: d_l_deducoes
coeficiente erro padrão razão-t p-valor
---------------------------------------------------------------
const 2,92584 1,27459 2,296 0,0236 **
l_deducoes_1 -0,169562 0,0739674 -2,292 0,4376
d_l_deducoes_1 -0,573802 0,107125 -5,356 4,71e-07 ***
d_l_deducoes_2 -0,410086 0,120289 -3,409 0,0009 ***
d_l_deducoes_3 -0,0885861 0,126511 -0,7002 0,4853
d_l_deducoes_4 -0,144025 0,126401 -1,139 0,2570
d_l_deducoes_5 -0,0372025 0,126578 -0,2939 0,7694
d_l_deducoes_6 -0,0316024 0,124664 -0,2535 0,8004
d_l_deducoes_7 0,0707518 0,123450 0,5731 0,5677
d_l_deducoes_8 0,0647471 0,113449 0,5707 0,5694
d_l_deducoes_9 0,161771 0,0921629 1,755 0,0820 *
time 0,00409814 0,00164218 2,496 0,0141 **
AIC: -31,6994 BIC: 1,94888 HQC: -18,0325
Evidência de misto TSP/DSP
29
Teste ADF para L_Folha Teste Aumentado de Dickey-Fuller para l_Folha
incluindo 7 defasagens de (1-L)l_Folha
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 124
hipótese nula de raiz unitária: a = 1
teste sem constante
modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,013
diferenças defasadas: F(7, 116) = 11,119 [0,0000]
valor estimado de (a - 1): 0,00132659
estatística de teste: tau_nc(1) = 0,636633
p-valor assintótico 0,8538
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:09-2013:12 (T = 124)
Variável dependente: d_l_Folha
coeficiente erro padrão razão-t p-valor
-------------------------------------------------------------
l_Folha_1 0,00132659 0,00208376 0,6366 0,8538
d_l_Folha_1 -0,793613 0,0914723 -8,676 2,94e-014 ***
d_l_Folha_2 -0,625926 0,112921 -5,543 1,89e-07 ***
d_l_Folha_3 -0,488779 0,121801 -4,013 0,0001 ***
d_l_Folha_4 -0,478322 0,121962 -3,922 0,0001 ***
d_l_Folha_5 -0,398513 0,121483 -3,280 0,0014 ***
d_l_Folha_6 -0,321879 0,112567 -2,859 0,0050 ***
d_l_Folha_7 -0,173662 0,0898867 -1,932 0,0558 *
AIC: 168,31 BIC: 190,873 HQC: 177,476
teste com constante
modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,004
diferenças defasadas: F(2, 125) = 3,846 [0,0239]
valor estimado de (a - 1): -0,490125
estatística de teste: tau_c(1) = -4,22483
p-valor assintótico 0,0005936
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:04-2013:12 (T = 129)
Variável dependente: d_l_Folha
coeficiente erro padrão razão-t p-valor
------------------------------------------------------------
const 9,82062 2,32168 4,230 4,48e-05 ***
l_Folha_1 -0,490125 0,116011 -4,225 0,0006 ***
d_l_Folha_1 -0,306429 0,110517 -2,773 0,0064 ***
d_l_Folha_2 -0,144649 0,0878458 -1,647 0,1021
AIC: 167,034 BIC: 178,473 HQC: 171,682
com constante e tendência
modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,002
diferenças defasadas: F(11, 106) = 0,668 [0,7658]
valor estimado de (a - 1): -1,582
estatística de teste: tau_ct(1) = -4,44467
p-valor assintótico 0,001802
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2004:01-2013:12 (T = 120)
Variável dependente: d_l_Folha
coeficiente erro padrão razão-t p-valor
-------------------------------------------------------------
const 30,9189 6,95904 4,443 2,19e-05 ***
l_Folha_1 -1,58200 0,355932 -4,445 0,0018 ***
d_l_Folha_1 0,605438 0,333554 1,815 0,0723 *
d_l_Folha_2 0,620036 0,313240 1,979 0,0504 *
d_l_Folha_3 0,611657 0,294133 2,080 0,0400 **
d_l_Folha_4 0,478752 0,275824 1,736 0,0855 *
d_l_Folha_5 0,421578 0,253303 1,664 0,0990 *
d_l_Folha_6 0,353092 0,228215 1,547 0,1248
d_l_Folha_7 0,339274 0,203769 1,665 0,0989 *
d_l_Folha_8 0,341226 0,178363 1,913 0,0584 *
d_l_Folha_9 0,277195 0,156155 1,775 0,0787 *
d_l_Folha_10 0,228383 0,129193 1,768 0,0800 *
d_l_Folha_11 0,164162 0,0929386 1,766 0,0802 *
time 0,0105217 0,00253157 4,156 6,58e-05 ***
AIC: 154,267 BIC: 193,291 HQC: 170,115
Sem evidência de raiz unitária e com tendência determinística significativa. Evidência de série TSP
30
17. Sazonalidade As séries econômicas, principalmente as brasileiras, podem estar sujeitos à
sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um componente de memória e pode ser modelada juntamente com uma estimativa ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a sazonalidade da série e trabalhar com um processo livre deste componente.
Métodos para retirar a Sazonalidade Métodos para modelar a Sazonalidade
• Suavização por média móvel
• Suavização exponencial
• X-12-ARIMA
• ARMA degenerado
• SARMA(p,q)(P,Q)
• ARMAX com dummies periódicas
17. Suavização por média móvel
Salvar a série suavizada
Define a quantidade de meses usada na média móvel
31
18. Suavização exponencial
19. X-12-ARIMA Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário
instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:
1. Na página principal do Gretl na internet, clique na opção “Gretl for Windows” na parte esquerda.
Determina o valor de α. Quanto maior este valor, maior o peso no presente.
Yt*=αYt-1 + (1-α)Y*t-1
32
2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe 3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será
iniciado.
4. Instale o programa baixado seguindo os passos do instalador. É necessário que o Gretl
não esteja aberto neste momento.
5. Depois de instalado o programa, o pacote X-12-ARIMA estará disponível no Gretl
sempre que o usuário abrir uma base de dados como série temporal mensal ou
trimestral.
6. O pacote X-12-ARIMA pode ser acessado no menu Variável ���� Análise X-12-ARIMA OBS: TEM QUE SELECIONAR A VARIÁVEL PRIMEIRO !!
33
7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM dessazonalizado.
20. ARMA degenerado
• Define as ordens específicas de defasagens
34
Exemplo de um modelo ARIMA[(1,12), 1, 1] Modelo 5: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const -0,000919328 0,0154457 -0,0595 0,95254
phi_1 -0,179238 0,084197 -2,1288 0,03327 **
phi_12 0,36066 0,0891847 4,0440 0,00005 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações 0,000271 D.P. das inovações 0,150173
Log da verossimilhança 61,60090 Critério de Akaike -115,2018
Critério de Schwarz -103,7010 Critério Hannan-Quinn -110,5285
Real Imaginária Módulo Frequência
AR
Raiz 1 -1,0696 0,0000 1,0696 0,5000
Raiz 2 1,1052 0,0000 1,1052 0,0000
Raiz 3 -0,0176 -1,0900 1,0901 -0,2526
Raiz 4 -0,0176 1,0900 1,0901 0,2526
Raiz 5 0,9516 -0,5585 1,1034 -0,0845
Raiz 6 0,9516 0,5585 1,1034 0,0845
Raiz 7 -0,5546 -0,9276 1,0808 -0,3358
Raiz 8 -0,5546 0,9276 1,0808 0,3358
Raiz 9 -0,9341 -0,5276 1,0728 -0,4182
Raiz 10 -0,9341 0,5276 1,0728 0,4182
Raiz 11 0,5367 -0,9581 1,0982 -0,1687
Raiz 12 0,5367 0,9581 1,0982 0,1687
21. SARMA(p,q)(P,Q)
• Define as ordens sazonais
35
Exemplo de um modelo SARIMA(1,1,1)(1,0) Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00126219 0,00109948 1,1480 0,25097
phi_1 0,605108 0,0757161 7,9918 <0,00001 ***
Phi_1 0,409892 0,090208 4,5439 <0,00001 ***
theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações -0,000195 D.P. das inovações 0,137608
Log da verossimilhança 71,55078 Critério de Akaike -133,1016
Critério de Schwarz -118,7256 Critério Hannan-Quinn -127,2600
Real Imaginária Módulo Frequência
AR
Raiz 1 1,6526 0,0000 1,6526 0,0000
AR
(sazonal)
Raiz 1 2,4397 0,0000 2,4397 0,0000
MA
Raiz 1 1,0000 0,0000 1,0000 0,0000
22. ARMAX com dummies periódicas
Para acrescentar as binárias de períodos, clique no menu Acrescentar e na opção Dummies periódicas
Com isso, são criadas binárias para cada período. No exemplo, foram criadas 12 dummies, uma para cada mês do ano.
36
Para estimar o modelo, basta acrescentar as binárias na lista de Regressores. Lembre-se de sempre acrescentar um número a menos que a quantidade total de binárias. No exemplo, são 12 meses. Logo, devem ser incluídas no máximo 11 binárias no modelo.
Exemplo de um modelo ARMAX com dummies periódicas
Modelo 1: ARMAX, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,000610663 0,00324124 0,1884 0,85056
phi_1 0,345129 0,156311 2,2080 0,02725 **
theta_1 -0,79347 0,106849 -7,4261 <0,00001 ***
dm2 0,0285772 0,0379625 0,7528 0,45159
dm3 0,0176125 0,0445928 0,3950 0,69287
dm4 0,148899 0,0470598 3,1640 0,00156 ***
dm5 0,276885 0,0481692 5,7482 <0,00001 ***
dm6 0,178553 0,0486953 3,6667 0,00025 ***
dm7 0,25779 0,0488848 5,2734 <0,00001 ***
dm8 0,299158 0,0488054 6,1296 <0,00001 ***
dm9 0,265164 0,0484063 5,4779 <0,00001 ***
dm10 0,187742 0,0474609 3,9557 0,00008 ***
dm11 0,0240094 0,0452392 0,5307 0,59561
dm12 -0,123349 0,0391174 -3,1533 0,00161 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097
Média de inovações 0,001485 D.P. das inovações 0,114141
Log da verossimilhança 98,19136 Critério de Akaike -166,3827
Critério de Schwarz -123,2548 Critério Hannan-Quinn -148,8579
Real Imaginária Módulo Frequência
AR
Raiz 1 2,8975 0,0000 2,8975 0,0000
MA
Raiz 1 1,2603 0,0000 1,2603 0,0000