curso de anÁlise de sÉries temporais –...

36
1 FACE – Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação do Curso de Ciências Econômicas Prof.ª Priscila Casari NEPEC – Núcleo de Estudos e Pesquisas Econômicas Coordenação Sérgio Fornazier Meyrelles Filho Endereço Campus Samambaia, Prédio da FACE – Rodovia Goiânia/Nova Veneza, km. 0 – Caixa Postal 131, CEP 74001-970, Goiânia – GO. Tel. (62) 3521 – 1390 URL http://www.face.ufg.br/economia CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO Professor: Sandro Eduardo Monsueto NEPEC/FACE/UFG Goiânia – Setembro/Outubro 2014 Versão 1.0

Upload: duongtram

Post on 22-Aug-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

1

FACE – Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação do Curso de Ciências Econômicas Prof.ª Priscila Casari NEPEC – Núcleo de Estudos e Pesquisas Econômicas Coordenação Sérgio Fornazier Meyrelles Filho Endereço Campus Samambaia, Prédio da FACE – Rodovia Goiânia/Nova Veneza, km. 0 – Caixa Postal 131, CEP 74001-970, Goiânia – GO. Tel. (62) 3521 – 1390 URL http://www.face.ufg.br/economia

CURSO DE ANÁLISE DE SÉRIES

TEMPORAIS – MODELO ARIMA

MATERIAL DE APOIO

Professor:

Sandro Eduardo Monsueto

NEPEC/FACE/UFG

Goiânia – Setembro/Outubro 2014

Versão 1.0

Page 2: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

2

1. Introdução e conceitos básicos

Esta apostila serve de material de apoio para a realização do curso. Longe de ser

abrangente, tem como objetivo servir de guia ou de lembrete para a execução de

tarefas. Outros materiais, melhores e mais completos, podem ser facilmente

encontrados de forma gratuita na internet e em livros especializados no assunto. Para

realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar

gratuitamente no site gretl.sourceforge.net.

A primeira definição necessária para nossa análise é o conceito de série

temporal. Uma série temporal é uma sequência de dados no tempo com uma

determinada periodicidade. Alguns exemplos:

- PIB brasileiro trimestral.

- taxa de juros mensal.

- índice pluviométrico semanal.

- valor das ações da Petrobras minuto a minuto.

Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de

vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação

algébrica para representar os dados no tempo:

Yt: a observação no tempo t da variável Y. Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal. Yt+1: a observação um período a frente. Generalizando: Yt±j: a observação no período t±j Exemplo:

Mês Período Yt Yt-1 Yt+1

1991.01 Y1 3,6 3,9

1991.02 Y2 3,9 3,6 2,5

1991.03 Y3 2,5 3,9 1,9

1991.04 Y4 1,9 2,5 2,7

1991.05 Y5 2,7 1,9 2,4

1991.06 Y6 2,4 2,7 1,6

1991.07 Y7 1,6 2,4 1,6

1991.08 Y8 1,6 1,6 1,7

1991.09 Y9 1,7 1,6 2,5

1991.10 Y10 2,5 1,7 -

O restante do material está constituído de uma série de exemplos estimados com

dados reais ou fictícios e telas explicativas das funções do programa Gretl. Ao longo do

curso serão acrescentados novos exemplos.

Page 3: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

3

2. Exemplos de Modelos Autoregressivos – AR(p) AR(1)

Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,571725 0,11237 5,0879 <0,00001 ***

phi_1 0,788617 0,0471062 16,7413 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,006069 D.P. das inovações 0,326753

Log da verossimilhança -55,45739 Critério de Akaike 116,9148

Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2680 0,0000 1,2680 0,0000

AR(2) Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,569602 0,108703 5,2400 <0,00001 ***

phi_1 0,815008 0,0755062 10,7939 <0,00001 ***

phi_2 -0,0338969 0,0758055 -0,4472 0,65476

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,005716 D.P. das inovações 0,326574

Log da verossimilhança -55,35740 Critério de Akaike 118,7148

Critério de Schwarz 131,5527 Critério Hannan-Quinn 123,9187

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2969 0,0000 1,2969 0,0000

Raiz 2 22,7468 0,0000 22,7468 0,0000

AR(3) Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,574432 0,115983 4,9527 <0,00001 ***

phi_1 0,819322 0,0755966 10,8381 <0,00001 ***

phi_2 -0,0819083 0,0988616 -0,8285 0,40738

phi_3 0,0579267 0,0767865 0,7544 0,45062

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,006535 D.P. das inovações 0,326053

Log da verossimilhança -55,07385 Critério de Akaike 120,1477

Critério de Schwarz 136,1951 Critério Hannan-Quinn 126,6525

Real Imaginária Módulo Frequência

AR

Raiz 1 1,2395 0,0000 1,2395 0,0000

Raiz 2 0,0873 -3,7310 3,7320 -0,2463

Raiz 3 0,0873 3,7310 3,7320 0,2463

Page 4: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

4

Exemplos de modelos AR(p) usando dados da Sefaz/GO:

ICMS – Taxa de crescimento

Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00567966 0,00816623 0,6955 0,48674

phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações 0,000328 D.P. das inovações 0,130597

Log da verossimilhança 80,70000 Critério de Akaike -155,4000

Critério de Schwarz -146,7744 Critério Hannan-Quinn -151,8950

Real Imaginária Módulo Frequência

AR

Raiz 1 -2,4979 0,0000 2,4979 0,5000

Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00586463 0,00564463 1,0390 0,29882

phi_1 -0,542985 0,0815173 -6,6610 <0,00001 ***

phi_2 -0,354886 0,0815606 -4,3512 0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações 0,000412 D.P. das inovações 0,121990

Log da verossimilhança 89,49711 Critério de Akaike -170,9942

Critério de Schwarz -159,4934 Critério Hannan-Quinn -166,3209

Real Imaginária Módulo Frequência

AR

Raiz 1 -0,7650 -1,4942 1,6786 -0,3253

Raiz 2 -0,7650 1,4942 1,6786 0,3253

Page 5: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

5

3. Exemplos de Modelos de Média Móvel – MA(q) MA(1)

Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,543279 0,0464909 11,6857 <0,00001 ***

theta_1 0,611094 0,0422925 14,4492 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,001839 D.P. das inovações 0,391161

Log da verossimilhança -88,12918 Critério de Akaike 182,2584

Critério de Schwarz 191,8868 Critério Hannan-Quinn 186,1612

Real Imaginária Módulo Frequência

MA

Raiz 1 -1,6364 0,0000 1,6364 0,5000

MA(2)

Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,546989 0,0585125 9,3482 <0,00001 ***

theta_1 0,881548 0,0774425 11,3833 <0,00001 ***

theta_2 0,387895 0,0583002 6,6534 <0,00001 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,002213 D.P. das inovações 0,350163

Log da verossimilhança -68,05490 Critério de Akaike 144,1098

Critério de Schwarz 156,9477 Critério Hannan-Quinn 149,3136

Real Imaginária Módulo Frequência

MA

Raiz 1 -1,1363 -1,1344 1,6056 -0,3751

Raiz 2 -1,1363 1,1344 1,6056 0,3751

MA(3)

Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)

Variável dependente: ipca

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,550957 0,0646414 8,5233 <0,00001 ***

theta_1 0,782521 0,0735914 10,6333 <0,00001 ***

theta_2 0,5313 0,0810619 6,5542 <0,00001 ***

theta_3 0,251944 0,0703504 3,5813 0,00034 ***

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Média de inovações -0,003248 D.P. das inovações 0,342610

Log da verossimilhança -64,02861 Critério de Akaike 138,0572

Critério de Schwarz 154,1046 Critério Hannan-Quinn 144,5620

Real Imaginária Módulo Frequência

MA

Raiz 1 -1,6714 0,0000 1,6714 0,5000

Raiz 2 -0,2187 -1,5254 1,5410 -0,2727

Raiz 3 -0,2187 1,5254 1,5410 0,2727

Page 6: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

6

Exemplos de modelos MA(q) usando dados da Sefaz/GO:

Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00560753 0,00080953 6,9269 <0,00001 ***

theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações -0,000695 D.P. das inovações 0,109008

Log da verossimilhança 103,4931 Critério de Akaike -200,9861

Critério de Schwarz -192,3605 Critério Hannan-Quinn -197,4812

Real Imaginária Módulo Frequência

MA

Raiz 1 1,0815 0,0000 1,0815 0,0000

Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00570155 0,000691485 8,2454 <0,00001 ***

theta_1 -0,824861 0,0936196 -8,8108 <0,00001 ***

theta_2 -0,115467 0,0992711 -1,1632 0,24477

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações -0,002216 D.P. das inovações 0,108390

Log da verossimilhança 104,1715 Critério de Akaike -200,3431

Critério de Schwarz -188,8423 Critério Hannan-Quinn -195,6698

Real Imaginária Módulo Frequência

MA

Raiz 1 1,0562 0,0000 1,0562 0,0000

Raiz 2 -8,1999 0,0000 8,1999 0,5000

Page 7: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

7

4. Exemplos de Modelos ARMA (1,1)

Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto

prazo:

Modelo 1: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ICMS

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00569386 0,000702447 8,1057 <0,00001 ***

phi_1 0,102099 0,0982049 1,0397 0,29850

theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Média de inovações -0,002089 D.P. das inovações 0,108501

Log da verossimilhança 104,0450 Critério de Akaike -200,0900

Critério de Schwarz -188,5892 Critério Hannan-Quinn -195,4167

Real Imaginária Módulo Frequência

AR

Raiz 1 9,7944 0,0000 9,7944 0,0000

MA

Raiz 1 1,0578 0,0000 1,0578 0,0000

Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00140343 0,00101435 1,3836 0,16649

phi_1 0,681096 0,0674072 10,1042 <0,00001 ***

theta_1 -1 0,0236957 -42,2017 <0,00001 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações -0,000652 D.P. das inovações 0,148405

Log da verossimilhança 62,41573 Critério de Akaike -116,8315

Critério de Schwarz -105,3307 Critério Hannan-Quinn -112,1582

Real Imaginária Módulo Frequência

AR

Raiz 1 1,4682 0,0000 1,4682 0,0000

MA

Raiz 1 1,0000 0,0000 1,0000 0,0000

Page 8: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

8

5. Estimar modelos ARMA/ARIMA no Gretl

Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique

na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:

Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será

utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo

ARMA tradicional não possui regressores extras.

Selecione a variável e clique no botão lilás

Define a ordem AR(p) - longo prazo

Define a ordem MA(q) - curto prazo

Page 9: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

9

6. O método Box-Jenkins de previsão

O objetivo do método é gerar um modelo com as seguintes características:

i. Estabilidade (módulo das raízes fora do círculo unitário)

ii. Resíduos na forma de Ruído Branco

a. Sem memória

b. Normalmente distribuído

c. Homocedástico

O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA

Page 10: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

10

7. O correlograma

Para gerar o correlograma de uma série temporal, clique sobre uma variável com

o botão direito do mouse e selecione a opção Correlograma:

O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que

ultrapassam o intervalo de confiança são estatisticamente diferente de zero, indicando

presença de algum tipo de memória na série.

A interpretação do correlograma segue o esperado para cada tipo de modelo

teórico. Seguindo Bueno (2011), temos:

Fonte: Bueno (2011)

Função de Autocorrelação Simples (FAC)

Função de Autocorrelação Parcial (FACP)

Page 11: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

11

Correlograma esperado para um AR(1) FAC – decaimento exponencial

FACP – truncada na primeira defasagem

Correlograma esperado para um AR(2)

FAC – decaimento exponencial

FACP – truncada na segunda defasagem

Correlograma esperado para um MA(2)

FAC – truncada na segunda defasagem

FACP – decaimento exponencial

Correlograma esperado para um ARMA(2,1)

FAC – truncada na primeira e decaimento exponencial a partir da segunda defasagem

FACP – truncada na segunda e decaimento exponencial a partir da terceira defasagem

Contudo, lembre-se que na prática a identificação visual do modelo é

complicada, devendo o pesquisador utilizar o processo de tentativa e erro do

fluxograma apresentado anteriormente. Ou seja, a próxima etapa é verificar se o

modelo é estável para, em seguida, realizar o diagnóstico dos resíduos.

Page 12: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

12

8. Estabilidade do modelo

Para verificar a estabilidade, basta observar se os módulos das raízes do modelo

são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-

estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se

obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.

Exemplo de modelo não-estável (raízes no círculo unitário).

Exemplo de modelo estável (raízes fora do círculo unitário).

O módulo da raiz MA(1) não está fora do círculo unitário

O módulo de cada raiz está fora do círculo unitário

Page 13: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

13

9. Diagnóstico de resíduos

Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou

seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).

Para testar a presença de memória, são usados dois testes: o Correlograma dos

Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do

modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:

Teste da memória dos resíduos (correlograma e Ljung-Box)

Basta clicar em OK para o Gretl gerar

o correlograma dos resíduos e o

teste de Ljung-Box.

Neste resultado, vemos que o

correlograma dos resíduos

apresenta correlações

(memórias) significativamente

diferente de zero (barras

rompendo o intervalo de

confiança)

É um indício de que o modelo

não está bem estimado.

Page 14: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

14

Da mesma forma, o Ljung-Box

confirma a presença de memória

nos resíduos, como mostram os

baixo [p-valores] obtidos após a 5ª

defasagem.

Um bom modelo exibe um [p-

valor] alto para todas as

defasagens, evidenciando a não

rejeição da hipótese nula de

correlação igual a zero.

Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo

estimado, sem memória tanto pelo correlograma como pelo teste Ljung-Box:

Teste de normalidade dos resíduos

Para testar a

normalidade dos

resíduos, na tela do

modelo estimado,

clique no menu Testes

e na opção

Normalidade dos

resíduos.

Page 15: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

15

O GRETL exibe um histograma dos

resíduos e o resultado do teste de

Doornik-Hansen na parte superior

esquerda da tela. Um p-valor (entre

colchetes) alto revela a não rejeição da

hipótese nula de normalidade dos

resíduos.

Um p-valor muito baixo mostra a

necessidade de se estimar um novo

modelo.

Teste ARCH para heterocedasticidade

O teste ARCH tem como

objetivo verificar se os resíduos

do modelo apresentam

variância constante

(homocedasticidade).

Menu Testes, opção ARCH.

Um p-valor muito alto revela a

não rejeição da hipótese nula de

homocedasticidade.

Um p-valor muito baixo mostra

que os resíduos são

heterocedásticos e um novo

modelo deve ser estimado

10. Comparação entre modelos

Na prática, mais de um modelo pode ser usado para representar a evolução da

série analisada. O pesquisador deve selecionar ao menos dois “modelos candidatos”

para compará-los e escolher qual deles será usado para a previsão. Um modelo

Page 16: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

16

candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,

em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de

ajustamento. Desta forma, três critérios gerais são comumente empregados:

1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão disponíveis automaticamente sempre que um modelo é estimado.

Deve-se buscar privilegiar o modelo que gerar os menores critérios de informação

2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção

Mostrar efetivo, ajustado, resíduos.

Quanto menores os erros médios, melhor é o nível de ajustamento do modelo e melhor tende a ser a qualidade da previsão

3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de

memória que são não significativos, principalmente os últimos de cada ordem (AR ou MA).

Coeficiente significativo a 10% Coeficiente não significativo (p-valor muito alto)

Page 17: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

17

11. Previsão Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL

a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável

k períodos a frente:

A previsão k períodos a

frente pode ser feita por

meio do menu Análise,

opção Previsões....

• Período para realizar a previsão

• Método de previsão (o mais usado

é a previsão automática)

• Opções para exibir o intervalo de

confiança da previsão

Page 18: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

18

12. Séries não estacionárias Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que

mantinham constante suas características fundamentais. Contudo, a maior parte das

séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se

altere ao longo do tempo.

De maneira geral, trabalhamos com dois tipos de tendência:

• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no

tempo. Também conhecidas como séries TSP (Trend Stationary Process -

Processo de Tendência Estacionária).

• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se

altera com o passar do tempo. É também denominada de DSP (Difference

Stationary Process – Processo Estacionário por Diferença) ou ainda processo com

Raiz Unitária.

Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar

a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de

uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,

transformando a variável em sua primeira diferença. Em geral, a primeira diferença de

uma série é estacionaria.

Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença

Logarítmo da Arrecadação na Agropecuária (em nível)

Primeira difeença do logaritmo da arrecadação na agropecuária

3

4

5

6

7

8

9

10

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

desem

pre

go

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

d_desem

pre

go

16

16,2

16,4

16,6

16,8

17

17,2

2004 2006 2008 2010 2012 2014

l_agro

pecuaria

-0,6

-0,5

-0,4

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

0,4

2004 2006 2008 2010 2012 2014

d_l_

agro

pecuaria

Page 19: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

19

Para a situação de tendência determinística (TSP) deve-se primeiro extrair o

componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos

estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,

onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X

seria a tendência temporal determinística. As próximas seções mostram como

operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.

13. Modelo ARIMA (p,d,q) O modelo ARIMA (p,d,q) é o indicado quando a série apresenta uma raiz unitária

ou tendência estocástica. Neste caso, podem ser tomados dois caminhos pelo Gretl. A

primeira opção é gerar a primeira diferença da variável e estimar um modelo ARMA (p,q)

sobre esta nova série estacionária.

Para gerar a primeira diferença de

uma série, selecione a variável e siga

até o menu Acrescentar, e depois na

opção Primeiras diferenças das

variáveis selecionadas.

Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA

(p,d,q) onde d é a quantidade de vezes que é preciso diferenciar a série original para se

obter algo estacionário. A estimação de um modelo ARIMA no Gretl segue os mesmos

passos de um modelo ARMA, com o adicional de que agora precisamos definir a ordem

de integração da série:

Define a ordem de integração da série

Após entrar pelo menu Modelos, opção Séries

Temporais, ARIMA, selecione as ordem p,d,q

Page 20: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

20

Note que, em termos de modelo, é a mesma coisa estimar um modelo

ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a

primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2

respectivamente:

Estimando um ARIMA (1,1,1) para a série de L_energia original Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_ENERGIA

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00468105 0,00806734 0,5802 0,56175

phi_1 -0,22456 0,112379 -1,9982 0,04569 **

theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***

Média var. dependente 0,006812 D.P. var. dependente 0,618222

Média de inovações 0,003483 D.P. das inovações 0,434964

Log da verossimilhança -77,41286 Critério de Akaike 162,8257

Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990

Real Imaginária Módulo Frequência

AR

Raiz 1 -4,4532 0,0000 4,4532 0,5000

MA

Raiz 1 1,3396 0,0000 1,3396 0,0000

Estimando um ARMA(1,1) para a primeira diferença da série de L_energia Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: d_l_ENERGIA

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00468105 0,00806734 0,5802 0,56175

phi_1 -0,22456 0,112379 -1,9982 0,04569 **

theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***

Média var. dependente 0,006812 D.P. var. dependente 0,618222

Média de inovações 0,003483 D.P. das inovações 0,434964

Log da verossimilhança -77,41286 Critério de Akaike 162,8257

Critério de Schwarz 174,3265 Critério Hannan-Quinn 167,4990

Real Imaginária Módulo Frequência

AR

Raiz 1 -4,4532 0,0000 4,4532 0,5000

MA

Raiz 1 1,3396 0,0000 1,3396 0,0000

A diferença entre eles está no resultado da previsão. Enquanto o Modelo 1 faz a

previsão da série original, o Modelo 2 tem como previsão a primeira diferença da série.

Desta forma, na maior parte dos casos, é mais interessante estimar diretamente um

modelo ARIMA.

Page 21: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

21

Observações importantes:

i. O correlograma para identificação inicial das ordens AR(p) e MA(q)

devem ser feitas em cima da primeira diferença da série.

ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.

14. Séries com tendência determinística Para se estimar um modelo com tenência determinística, devemos primeiro

extrair o componente determinístico por meio de um modelo de Mínimos Quadrados

Ordinários. As etapas são:

1. Rodar um modelo de M.Q.O. com a tendência temporal como variável

dependente.

2. Extrair os resíduos deste modelo estimado.

3. Estimar um modelo ARMA(p,q) sobre os resíduos.

Para acrescentar uma tendência

temporal, clique no menu

Acrescentar e depois na opção

Tendência Temporal.

No menu Modelo, selecione a

opção Mínimos Quadrados

Ordinários. Acrescente a variável

time na lista de Regressores e

estime o modelo.

Page 22: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

22

Depois de estimado o modelo, salve os resíduos por meio do menu Salvar, opção Resíduos. Isso irá gerar uma nova variável na base de dados.

Abaixo, seguem os resultados para o tratamento da tendência determinística da

arrecadação do setor de Energia (em logaritmos).

Extração da tendência determinística Modelo 12: MQO, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: l_ENERGIA

Coeficiente Erro Padrão razão-t p-valor

const 17,7131 0,0773861 228,8933 <0,00001 ***

time 0,0050459 0,00100969 4,9975 <0,00001 ***

Média var. dependente 18,04870 D.P. var. dependente 0,480775

Soma resíd. quadrados 25,40026 E.P. da regressão 0,442026

R-quadrado 0,161153 R-quadrado ajustado 0,154700

F(1, 130) 24,97460 P-valor(F) 1,84e-06

Log da verossimilhança -78,52907 Critério de Akaike 161,0581

Critério de Schwarz 166,8237 Critério Hannan-Quinn 163,4010

rô 0,021395 Durbin-Watson 1,956131

Arrecadação do setor de energia Resíduos do modelo de M.Q.O.

16

16,5

17

17,5

18

18,5

19

19,5

20

2004 2006 2008 2010 2012 2014

l_EN

ER

GIA

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2004 2006 2008 2010 2012 2014

resíd

uo

Resíduos da regressão (= observados - ajustados l_ENERGIA)

Page 23: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

23

Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência determinística

Modelo 13: ARMA, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: uhat12

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00370065 0,0635819 0,0582 0,95359

phi_1 0,852921 0,0951371 8,9652 <0,00001 ***

theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***

Média var. dependente -1,16e-15 D.P. var. dependente 0,440335

Média de inovações -0,001374 D.P. das inovações 0,429159

Log da verossimilhança -75,68339 Critério de Akaike 159,3668

Critério de Schwarz 170,8980 Critério Hannan-Quinn 164,0525

Real Imaginária Módulo Frequência

AR

Raiz 1 1,1724 0,0000 1,1724 0,0000

MA

Raiz 1 1,3426 0,0000 1,3426 0,0000

15. Modelo ARMAX para a tendência determinística Alternativamente, a tendência determinística pode ser modelada junto com o

modelo ARMA (p,q), utilizando a tendência temporal como variável exógena. Neste contexto, o modelo ARMA passa a ser conhecido como ARMAX, onde o X representa o conjunto de variáveis extra.

Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.

Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)

Variável dependente: l_ENERGIA

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 17,7187 0,123729 143,2058 <0,00001 ***

phi_1 0,852917 0,0951118 8,9675 <0,00001 ***

theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***

time 0,00501748 0,00159592 3,1439 0,00167 ***

Média var. dependente 18,04870 D.P. var. dependente 0,480775

Média de inovações -0,001349 D.P. das inovações 0,429158

Log da verossimilhança -75,68323 Critério de Akaike 161,3665

Critério de Schwarz 175,7805 Critério Hannan-Quinn 167,2237

Real Imaginária Módulo Frequência

AR

Raiz 1 1,1724 0,0000 1,1724 0,0000

MA

Raiz 1 1,3426 0,0000 1,3426 0,0000

Page 24: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

24

Para estimar um modelo ARMAX, basta acrescentar variáveis extra na lista de Regressores. No nosso caso, acrescentamos a variável time, que é a tendência temporal.

16. Teste de Dickey-Fuller Aumentado (ADF)

O teste ADF foi originalmente desenhado para captar a presença de raiz unitária

na série (DSP). Contudo, também pode ser empregado para detectar a ocorrência de

tendência determinística (TSP). O teste possui a seguinte hipótese nula:

Ho: Presença de Raiz Unitária

Ha: Sem Raiz Unitária

Pode-se comparar o valor da estatística calculada com a tabela de valores críticos

de Dickey-fuller ou utilizar diretamente o p-valor. Um p-valor elevado (geralmente acima de 0,10) aponta para a não rejeição de Ho e evidencia a presença de raiz unitária na série. Por exemplo, o quadro abaixo mostra as três versões do teste para a taxa de desemprego no Brasil. A esquerda, os p-valores elevados mostram que a série original apresenta uma raiz unitária, enquanto sua primeira diferença aparenta ser estacionária.

Teste para Desemprego em nível Teste para a primeira diferença do desemprego

Teste de Dickey-Fuller para desemprego

dimensão de amostragem 111

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,029

valor estimado de (a - 1): 0,000551086

estatística de teste: tau_nc(1) = 0,0669027

p-valor 0,702

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: 0,014

valor estimado de (a - 1): -0,0750893

estatística de teste: tau_c(1) = -1,9269

p-valor 0,319

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: 0,038

valor estimado de (a - 1): -0,153099

estatística de teste: tau_ct(1) = -3,01459

p-valor 0,133

Teste de Dickey-Fuller para d_desemprego

dimensão de amostragem 110

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,005

valor estimado de (a - 1): -1,02869

estatística de teste: tau_nc(1) = -10,7045

p-valor 1,639e-068

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,005

valor estimado de (a - 1): -1,03106

estatística de teste: tau_c(1) = -10,6734

p-valor 3,585e-015

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e

coeficiente de 1ª ordem para e: -0,006

valor estimado de (a - 1): -1,03417

estatística de teste: tau_ct(1) = -10,6509

p-valor 4,921e-014

Page 25: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

25

Contudo, a ausência de raiz unitária não implica necessariamente em uma série estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para identificação correta, deve-se aplicar o teste ADF em sua versão mais completa disponível no Gretl.

Para realizar o teste ADF, siga o esquema abaixo:

Selecione a variável, clique no menu Variável, e depois na opção Testes de raiz

unitária, teste de Dickey-Fuller aumentado.

• Determina a ordem máxima para o teste. O Gretl calcula automaticamente usando a fórmula

� = ��� �12 ∗ � �100��/��

Onde T é o número de observações da base de dados.

• Marcar essa opção para visualizar todo o resultado do teste.

Page 26: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

26

O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste ADF e identificar o tipo de tendência da série.

Abaixo, seguem alguns exemplos de aplicação do teste, seguindo a interpretação

deste fluxograma:

Page 27: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

27

Teste ADF para L_agropecuaria Teste Aumentado de Dickey-Fuller para l_agropecuaria

incluindo 10 defasagens de (1-L)l_agropecuaria

(o máximo foi 12, critério estatística-t)

dimensão de amostragem 121

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,036

diferenças defasadas: F(10, 110) = 5,480 [0,0000]

valor estimado de (a - 1): 0,000232479

estatística de teste: tau_nc(1) = 0,31619

p-valor assintótico 0,777

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)

Variável dependente: d_l_agropecuaria

coeficiente erro padrão razão-t p-valor

----------------------------------------------------------------

l_agropecuaria_1 0,000232479 0,000735252 0,3162 0,7770

d_l_agropecuar~_1 -0,368625 0,0945622 -3,898 0,0002 ***

d_l_agropecuar~_2 -0,411156 0,0988597 -4,159 6,36e-05 ***

d_l_agropecuar~_3 -0,191574 0,0980168 -1,955 0,0532 *

d_l_agropecuar~_4 -0,279691 0,0916272 -3,052 0,0028 ***

d_l_agropecuar~_5 -0,377815 0,0883527 -4,276 4,07e-05 ***

d_l_agropecuar~_6 -0,289086 0,0865691 -3,339 0,0011 ***

d_l_agropecuar~_7 -0,466409 0,0905514 -5,151 1,15e-06 ***

d_l_agropecuar~_8 -0,391866 0,0980797 -3,995 0,0001 ***

d_l_agropecuar~_9 -0,169873 0,100041 -1,698 0,0923 *

d_l_agropecua~_10 -0,263887 0,0928801 -2,841 0,0054 ***

AIC: -131,382 BIC: -100,629 HQC: -118,892

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,029

diferenças defasadas: F(10, 109) = 3,331 [0,0008]

valor estimado de (a - 1): -0,127696

estatística de teste: tau_c(1) = -1,25345

p-valor assintótico 0,6533

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)

Variável dependente: d_l_agropecuaria

coeficiente erro padrão razão-t p-valor

---------------------------------------------------------------

const 2,13351 1,69898 1,256 0,2119

l_agropecuaria_1 -0,127696 0,101876 -1,253 0,6533

d_l_agropecuar~_1 -0,256666 0,129785 -1,978 0,0505 *

d_l_agropecuar~_2 -0,306019 0,129352 -2,366 0,0198 **

d_l_agropecuar~_3 -0,100402 0,121772 -0,8245 0,4115

d_l_agropecuar~_4 -0,198588 0,111906 -1,775 0,0788 *

d_l_agropecuar~_5 -0,306871 0,104676 -2,932 0,0041 ***

d_l_agropecuar~_6 -0,229387 0,0985655 -2,327 0,0218 **

d_l_agropecuar~_7 -0,412725 0,0999217 -4,130 7,12e-05 ***

d_l_agropecuar~_8 -0,348893 0,103636 -3,367 0,0011 ***

d_l_agropecuar~_9 -0,138856 0,102791 -1,351 0,1795

d_l_agropecua~_10 -0,241807 0,0942914 -2,564 0,0117 **

AIC: -131,12 BIC: -97,5709 HQC: -117,495

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,026

diferenças defasadas: F(10, 108) = 3,298 [0,0009]

valor estimado de (a - 1): -0,204218

estatística de teste: tau_ct(1) = -1,69067

p-valor assintótico 0,7557

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:12-2013:12 (T = 121)

Variável dependente: d_l_agropecuaria

coeficiente erro padrão razão-t p-valor

---------------------------------------------------------------

const 3,37431 1,99834 1,689 0,0942 *

l_agropecuaria_1 -0,204218 0,120792 -1,691 0,7557

d_l_agropecuar~_1 -0,198983 0,138563 -1,436 0,1539

d_l_agropecuar~_2 -0,259038 0,135186 -1,916 0,0580 *

d_l_agropecuar~_3 -0,0581789 0,126769 -0,4589 0,6472

d_l_agropecuar~_4 -0,160038 0,116437 -1,374 0,1721

d_l_agropecuar~_5 -0,271180 0,108827 -2,492 0,0142 **

d_l_agropecuar~_6 -0,203823 0,100775 -2,023 0,0456 **

d_l_agropecuar~_7 -0,394122 0,100999 -3,902 0,0002 ***

d_l_agropecuar~_8 -0,338045 0,103868 -3,255 0,0015 ***

d_l_agropecuar~_9 -0,132927 0,102737 -1,294 0,1985

d_l_agropecua~_10 -0,236548 0,0942346 -2,510 0,0135 **

time 0,000492543 0,000419508 1,174 0,2429

AIC: -130,655 BIC: -94,3098 HQC: -115,894

Sem evidência de tendência determinística. Mas com p-valor auto para o teste de raiz unitária. Subir para a versão sem tendência.

Constante não significativa e p-valor alto para o teste de raiz unitária. Subir para a versão sem constante.

Evidência de raiz unitária

Page 28: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

28

Teste ADF para L_deduções Teste Aumentado de Dickey-Fuller para l_deducoes

incluindo 9 defasagens de (1-L)l_deducoes

(o máximo foi 12, critério estatística-t)

dimensão de amostragem 122

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: 0,018

diferenças defasadas: F(9, 112) = 7,901 [0,0000]

valor estimado de (a - 1): 0,00223531

estatística de teste: tau_nc(1) = 1,92907

p-valor assintótico 0,9876

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:11-2013:12 (T = 122)

Variável dependente: d_l_deducoes

coeficiente erro padrão razão-t p-valor

----------------------------------------------------------------

l_deducoes_1 0,00223531 0,00115875 1,929 0,9876

d_l_deducoes_1 -0,690832 0,0933976 -7,397 2,74e-011 ***

d_l_deducoes_2 -0,490202 0,113904 -4,304 3,61e-05 ***

d_l_deducoes_3 -0,143804 0,122894 -1,170 0,2444

d_l_deducoes_4 -0,192615 0,123442 -1,560 0,1215

d_l_deducoes_5 -0,0733609 0,124632 -0,5886 0,5573

d_l_deducoes_6 -0,0598205 0,123578 -0,4841 0,6293

d_l_deducoes_7 0,0466701 0,122876 0,3798 0,7048

d_l_deducoes_8 0,0462044 0,113691 0,4064 0,6852

d_l_deducoes_9 0,153787 0,0931313 1,651 0,1015

AIC: -28,9695 BIC: -0,929251 HQC: -17,5804

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,012

diferenças defasadas: F(2, 125) = 32,965 [0,0000]

valor estimado de (a - 1): -0,0012576

estatística de teste: tau_c(1) = -0,0565259

p-valor assintótico 0,9522

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:04-2013:12 (T = 129)

Variável dependente: d_l_deducoes

coeficiente erro padrão razão-t p-valor

-----------------------------------------------------------------

const 0,0595967 0,416673 0,1430 0,8865

l_deducoes_1 -0,00125760 0,0222483 -0,05653 0,9522

d_l_deducoes_1 -0,674027 0,0837187 -8,051 5,50e-013 ***

d_l_deducoes_2 -0,403558 0,0824872 -4,892 3,00e-06 ***

AIC: -42,6647 BIC: -31,2255 HQC: -38,0168

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: 0,017

diferenças defasadas: F(9, 110) = 4,740 [0,0000]

valor estimado de (a - 1): -0,169562

estatística de teste: tau_ct(1) = -2,29238

p-valor assintótico 0,4376

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:11-2013:12 (T = 122)

Variável dependente: d_l_deducoes

coeficiente erro padrão razão-t p-valor

---------------------------------------------------------------

const 2,92584 1,27459 2,296 0,0236 **

l_deducoes_1 -0,169562 0,0739674 -2,292 0,4376

d_l_deducoes_1 -0,573802 0,107125 -5,356 4,71e-07 ***

d_l_deducoes_2 -0,410086 0,120289 -3,409 0,0009 ***

d_l_deducoes_3 -0,0885861 0,126511 -0,7002 0,4853

d_l_deducoes_4 -0,144025 0,126401 -1,139 0,2570

d_l_deducoes_5 -0,0372025 0,126578 -0,2939 0,7694

d_l_deducoes_6 -0,0316024 0,124664 -0,2535 0,8004

d_l_deducoes_7 0,0707518 0,123450 0,5731 0,5677

d_l_deducoes_8 0,0647471 0,113449 0,5707 0,5694

d_l_deducoes_9 0,161771 0,0921629 1,755 0,0820 *

time 0,00409814 0,00164218 2,496 0,0141 **

AIC: -31,6994 BIC: 1,94888 HQC: -18,0325

Evidência de misto TSP/DSP

Page 29: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

29

Teste ADF para L_Folha Teste Aumentado de Dickey-Fuller para l_Folha

incluindo 7 defasagens de (1-L)l_Folha

(o máximo foi 12, critério estatística-t)

dimensão de amostragem 124

hipótese nula de raiz unitária: a = 1

teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,013

diferenças defasadas: F(7, 116) = 11,119 [0,0000]

valor estimado de (a - 1): 0,00132659

estatística de teste: tau_nc(1) = 0,636633

p-valor assintótico 0,8538

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:09-2013:12 (T = 124)

Variável dependente: d_l_Folha

coeficiente erro padrão razão-t p-valor

-------------------------------------------------------------

l_Folha_1 0,00132659 0,00208376 0,6366 0,8538

d_l_Folha_1 -0,793613 0,0914723 -8,676 2,94e-014 ***

d_l_Folha_2 -0,625926 0,112921 -5,543 1,89e-07 ***

d_l_Folha_3 -0,488779 0,121801 -4,013 0,0001 ***

d_l_Folha_4 -0,478322 0,121962 -3,922 0,0001 ***

d_l_Folha_5 -0,398513 0,121483 -3,280 0,0014 ***

d_l_Folha_6 -0,321879 0,112567 -2,859 0,0050 ***

d_l_Folha_7 -0,173662 0,0898867 -1,932 0,0558 *

AIC: 168,31 BIC: 190,873 HQC: 177,476

teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,004

diferenças defasadas: F(2, 125) = 3,846 [0,0239]

valor estimado de (a - 1): -0,490125

estatística de teste: tau_c(1) = -4,22483

p-valor assintótico 0,0005936

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2003:04-2013:12 (T = 129)

Variável dependente: d_l_Folha

coeficiente erro padrão razão-t p-valor

------------------------------------------------------------

const 9,82062 2,32168 4,230 4,48e-05 ***

l_Folha_1 -0,490125 0,116011 -4,225 0,0006 ***

d_l_Folha_1 -0,306429 0,110517 -2,773 0,0064 ***

d_l_Folha_2 -0,144649 0,0878458 -1,647 0,1021

AIC: 167,034 BIC: 178,473 HQC: 171,682

com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e

coeficiente de 1ª ordem para e: -0,002

diferenças defasadas: F(11, 106) = 0,668 [0,7658]

valor estimado de (a - 1): -1,582

estatística de teste: tau_ct(1) = -4,44467

p-valor assintótico 0,001802

Regressão aumentada de Dickey-Fuller

MQO, usando as observações 2004:01-2013:12 (T = 120)

Variável dependente: d_l_Folha

coeficiente erro padrão razão-t p-valor

-------------------------------------------------------------

const 30,9189 6,95904 4,443 2,19e-05 ***

l_Folha_1 -1,58200 0,355932 -4,445 0,0018 ***

d_l_Folha_1 0,605438 0,333554 1,815 0,0723 *

d_l_Folha_2 0,620036 0,313240 1,979 0,0504 *

d_l_Folha_3 0,611657 0,294133 2,080 0,0400 **

d_l_Folha_4 0,478752 0,275824 1,736 0,0855 *

d_l_Folha_5 0,421578 0,253303 1,664 0,0990 *

d_l_Folha_6 0,353092 0,228215 1,547 0,1248

d_l_Folha_7 0,339274 0,203769 1,665 0,0989 *

d_l_Folha_8 0,341226 0,178363 1,913 0,0584 *

d_l_Folha_9 0,277195 0,156155 1,775 0,0787 *

d_l_Folha_10 0,228383 0,129193 1,768 0,0800 *

d_l_Folha_11 0,164162 0,0929386 1,766 0,0802 *

time 0,0105217 0,00253157 4,156 6,58e-05 ***

AIC: 154,267 BIC: 193,291 HQC: 170,115

Sem evidência de raiz unitária e com tendência determinística significativa. Evidência de série TSP

Page 30: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

30

17. Sazonalidade As séries econômicas, principalmente as brasileiras, podem estar sujeitos à

sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um componente de memória e pode ser modelada juntamente com uma estimativa ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a sazonalidade da série e trabalhar com um processo livre deste componente.

Métodos para retirar a Sazonalidade Métodos para modelar a Sazonalidade

• Suavização por média móvel

• Suavização exponencial

• X-12-ARIMA

• ARMA degenerado

• SARMA(p,q)(P,Q)

• ARMAX com dummies periódicas

17. Suavização por média móvel

Salvar a série suavizada

Define a quantidade de meses usada na média móvel

Page 31: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

31

18. Suavização exponencial

19. X-12-ARIMA Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário

instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:

1. Na página principal do Gretl na internet, clique na opção “Gretl for Windows” na parte esquerda.

Determina o valor de α. Quanto maior este valor, maior o peso no presente.

Yt*=αYt-1 + (1-α)Y*t-1

Page 32: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

32

2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe 3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será

iniciado.

4. Instale o programa baixado seguindo os passos do instalador. É necessário que o Gretl

não esteja aberto neste momento.

5. Depois de instalado o programa, o pacote X-12-ARIMA estará disponível no Gretl

sempre que o usuário abrir uma base de dados como série temporal mensal ou

trimestral.

6. O pacote X-12-ARIMA pode ser acessado no menu Variável ���� Análise X-12-ARIMA OBS: TEM QUE SELECIONAR A VARIÁVEL PRIMEIRO !!

Page 33: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

33

7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM dessazonalizado.

20. ARMA degenerado

• Define as ordens específicas de defasagens

Page 34: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

34

Exemplo de um modelo ARIMA[(1,12), 1, 1] Modelo 5: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const -0,000919328 0,0154457 -0,0595 0,95254

phi_1 -0,179238 0,084197 -2,1288 0,03327 **

phi_12 0,36066 0,0891847 4,0440 0,00005 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações 0,000271 D.P. das inovações 0,150173

Log da verossimilhança 61,60090 Critério de Akaike -115,2018

Critério de Schwarz -103,7010 Critério Hannan-Quinn -110,5285

Real Imaginária Módulo Frequência

AR

Raiz 1 -1,0696 0,0000 1,0696 0,5000

Raiz 2 1,1052 0,0000 1,1052 0,0000

Raiz 3 -0,0176 -1,0900 1,0901 -0,2526

Raiz 4 -0,0176 1,0900 1,0901 0,2526

Raiz 5 0,9516 -0,5585 1,1034 -0,0845

Raiz 6 0,9516 0,5585 1,1034 0,0845

Raiz 7 -0,5546 -0,9276 1,0808 -0,3358

Raiz 8 -0,5546 0,9276 1,0808 0,3358

Raiz 9 -0,9341 -0,5276 1,0728 -0,4182

Raiz 10 -0,9341 0,5276 1,0728 0,4182

Raiz 11 0,5367 -0,9581 1,0982 -0,1687

Raiz 12 0,5367 0,9581 1,0982 0,1687

21. SARMA(p,q)(P,Q)

• Define as ordens sazonais

Page 35: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

35

Exemplo de um modelo SARIMA(1,1,1)(1,0) Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,00126219 0,00109948 1,1480 0,25097

phi_1 0,605108 0,0757161 7,9918 <0,00001 ***

Phi_1 0,409892 0,090208 4,5439 <0,00001 ***

theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações -0,000195 D.P. das inovações 0,137608

Log da verossimilhança 71,55078 Critério de Akaike -133,1016

Critério de Schwarz -118,7256 Critério Hannan-Quinn -127,2600

Real Imaginária Módulo Frequência

AR

Raiz 1 1,6526 0,0000 1,6526 0,0000

AR

(sazonal)

Raiz 1 2,4397 0,0000 2,4397 0,0000

MA

Raiz 1 1,0000 0,0000 1,0000 0,0000

22. ARMAX com dummies periódicas

Para acrescentar as binárias de períodos, clique no menu Acrescentar e na opção Dummies periódicas

Com isso, são criadas binárias para cada período. No exemplo, foram criadas 12 dummies, uma para cada mês do ano.

Page 36: CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – …monsueto.50webs.com/cursos/Apostila_ARIMA_SEFAZ_Gretl.pdf · CURSO DE ANÁLISE DE SÉRIES TEMPORAIS – MODELO ARIMA MATERIAL DE APOIO

36

Para estimar o modelo, basta acrescentar as binárias na lista de Regressores. Lembre-se de sempre acrescentar um número a menos que a quantidade total de binárias. No exemplo, são 12 meses. Logo, devem ser incluídas no máximo 11 binárias no modelo.

Exemplo de um modelo ARMAX com dummies periódicas

Modelo 1: ARMAX, usando as observações 2003:02-2013:12 (T = 131)

Variável dependente: (1-L) l_agropecuaria

Erros padrão baseados na Hessiana

Coeficiente Erro Padrão z p-valor

const 0,000610663 0,00324124 0,1884 0,85056

phi_1 0,345129 0,156311 2,2080 0,02725 **

theta_1 -0,79347 0,106849 -7,4261 <0,00001 ***

dm2 0,0285772 0,0379625 0,7528 0,45159

dm3 0,0176125 0,0445928 0,3950 0,69287

dm4 0,148899 0,0470598 3,1640 0,00156 ***

dm5 0,276885 0,0481692 5,7482 <0,00001 ***

dm6 0,178553 0,0486953 3,6667 0,00025 ***

dm7 0,25779 0,0488848 5,2734 <0,00001 ***

dm8 0,299158 0,0488054 6,1296 <0,00001 ***

dm9 0,265164 0,0484063 5,4779 <0,00001 ***

dm10 0,187742 0,0474609 3,9557 0,00008 ***

dm11 0,0240094 0,0452392 0,5307 0,59561

dm12 -0,123349 0,0391174 -3,1533 0,00161 ***

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Média de inovações 0,001485 D.P. das inovações 0,114141

Log da verossimilhança 98,19136 Critério de Akaike -166,3827

Critério de Schwarz -123,2548 Critério Hannan-Quinn -148,8579

Real Imaginária Módulo Frequência

AR

Raiz 1 2,8975 0,0000 2,8975 0,0000

MA

Raiz 1 1,2603 0,0000 1,2603 0,0000