econometria das séries de tempo: alguns conceitos … das séries de tempo: alguns conceitos...

Post on 28-May-2018

224 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Econometria das Séries de Tempo: Alguns Conceitos Básicos

Gujarati & Porter (2011), cap.21

Prof. C.D. Shikida

Conceitos: introdução

• Séries de Tempo

• Estacionariedade

• Regressão Espúria

• Passeio Aleatório

• Processo Estocástico • Processo Estacionário • Processo puramente aleatório • Processo Não-Estacionário • Variáveis Integradas • Modelos de Passeio Aleatório • Cointegração • Tendências Deterministas e Estocásticas • Testes de Raízes Unitárias

• Processos Estocásticos

– Estacionários

• Fraco (2ª ordem)

• Reversão à média

– Puramente aleatório

– Ruído branco (tipos)

• Processos Não-Estacionários

– Modelo do Passeio Aleatório

• Com drift (deslocamento)

• Sem drift

– Tendência Estocástica

– Raiz unitária

• Processos com Raiz Unitária

– Problema da Raiz Unitária

– Nelson & Plosser

• Tendência Determinista (TS) e Tendência Estocástica (DS)

– Modelo Geral (21.5.1) e seus casos particulares

0 100 200 300 400 500

05

01

00

15

02

00

25

0

Time

rw.n

d

-50

51

01

5

det. trend + noise (ls)

rw drift (ls)

rw (rs)

4000

6000

8000

10000

12000

14000

16000

18000

20000

0 5000 10000 15000 20000 25000 30000 35000

IBO

VESPA

• Processos Estocásticos Integrados

– Ordem de integração

– Propriedades das Séries Integradas

• O problema da Regressão Simples/Múltipla quando se desconsidera a característica de integração das séries

• O fenômeno da Regressão Espúria – Granger (1976)

• Testes de Estacionariedade – Análise Gráfica

– ACF, PACF: Correlograma

– Significância Estatística dos Coeficientes de Autocorrelação

– Box-Pierce, Ljung-Box • O problema da sobrediferenciação

Time

rw.n

d

0 100 200 300 400 500

-50

51

01

5

0 5 10 15 20 25 30

-0.5

0.0

0.5

1.0

Series: diff(diff(rw.nd))

LAG

AC

F

0 5 10 15 20 25 30

-0.5

0.0

0.5

1.0

LAG

PA

CF

0 5 10 15 20 25 30

0.0

0.2

0.4

0.6

0.8

1.0

Series: diff(rw.nd)

LAG

AC

F

0 5 10 15 20 25 30

0.0

0.2

0.4

0.6

0.8

1.0

LAG

PA

CF

• Mais sobre correlogramas:

– A correlação entre yt e yt-k será a razão da covariância entre elas relativamente ao produto dos respectivos desvios-padrões.

– Como a variância é a mesma, este produto do denominador será a variância.

– Logo, ver (21.8.1) e, amostral, (21.8.4).

– Exemplo: consumo anual, Brasil, logaritmo, a preços constantes de média de 1980.

-1

-0.5

0

0.5

1

0 2 4 6 8 10 12

lag

ACF for l_c

+- 1.96/T^0.5

-1

-0.5

0

0.5

1

0 2 4 6 8 10 12

lag

PACF for l_c

+- 1.96/T^0.5

• Teste de Ljung-Box (também conhecido como teste de portmanteau). Este teste, cuja estatística é conhecida como “Q”, é distribuído segundo uma χ2 com s graus de liberdade.

• •

• s = comprimento das defasagens • n = número de observações • k = total de defasagens incluídas (p + q, no caso de

modelos ARMA)

Regressões Espúrias

• Lembre-se do DW

• Os dl e du determinados a partir dos graus de liberdade (= no de regressores, exceto a constante)

http://userwww.sfsu.edu/~efc/classes/biol710/timeseries/TimeSeriesAnalysis.html

• Geramos dois passeios aleatórios

• library(lmtest) • set.seed(123456) • e1 <- rnorm(500) • e2 <- rnorm(500) • trd <- 1:500 • y1 <- 0.8*trd + cumsum(e1) • y2 <- 0.6*trd + cumsum(e2) • sr.reg <- lm(y1 ~ y2) • sr.dw <- dwtest(sr.reg)$statistic

• summary(sr.reg) • sr.dw

A solução do passeio aleatório com “drift” (lembra?) Substituições iterativas ...

Estima-se a regressão de y1 contra y2, com intercepto

dl e du aproximadamente: 1.758 e 1.778

• Veja, por exemplo, a regressão das variáveis em diferença

O novo durbin watson é aproximadamente 1.963.

• Agora imagine que consumo e renda possam ser representadas por passeios aleatórios.

• Exemplo ilustrativo (consumo e PIB em R$ milhões de 1980)

– Regressão log-log

0

1e-006

2e-006

3e-006

4e-006

5e-006

6e-006

7e-006

8e-006

9e-006

1e-005

1950 1960 1970 1980 1990 2000 2010

c

y

Viu só? (veja o DW e o coeficiente de l_y)

Duas séries não-estacionárias, a regressão em diferenças, neste caso, deu-nos que dlc parece ter uma relação de um para um com dly. (que função consumo lhe parece esta? Constante não significativa, PMgC = 1...)

Veja a tendência comum entre as variáveis. Veja também o Durbin-Watson.

• Exemplo

• O Teste de Raiz Unitária

– DF (entenda primeiro)

– ADF

• Teste F (irrestrito/restrito)

• Teste de Phillips-Perron (seguimos o livro)

• Teste(s) de Mudança Estrutural

• Crítica dos Testes de Raiz Unitária

– Extra: teste KPSS

• Exemplo:

– Distribuição de Dickey-Fuller

– Qual dos modelos abaixo é o irrestrito?

– Hipótese nula, portanto...

tktktt yyy 11

tktkttt yyTy 11

• Estatística de teste:

• m = número de restrições • RSS = soma dos resíduos quadráticos • UR = irrestrito • K = número de parâmetros do modelo irrestrito. • N = número de observações

• Hipótese nula: não se rejeita o modelo restrito. • Distribuição de Dickey-Fuller, (apêndice D, D.7).

)/(

/

knRSS

mRSSRSSF

UR

URR

• d

48.1

)561/(059887.0

2/059887.0063054.0

F

F(2,56) = 3.16 Dica: Gretl, Tools (não se aplica neste caso, pois a tabela correta é a D.7)

Olhando a tabela D.7, descobre-se que H0 se mantém, ou seja, o modelo restrito não é rejeitado.

• Usar o bom senso na implementação do teste.

• Bom senso = ler Gujarati

• Outra forma: usar o método de Enders (2004). Entretanto, o mesmo é mais complexo e sujeito a falhas. Ver Elder & Kennedy (2001). – Notas de aula sobre isto em pdf disponível aos

interessados. Solicitar via email: claudiods@ibmecmg.br

Quebras Estruturais

• Perron (data da quebra conhecida)

– Quebra: surge de uma mudança discreta nos coeficientes da regressão populacional e uma data precisa ou de uma evolução gradual (mudança nos valores) dos coeficientes ao longo de um período de tempo maior. [adaptado de Stock & Watson (2004), cap.12, p.318-324, a seguir citado para tabelas]

• No método de Perron, sabe-se a data de quebra e testa-se o tipo da mesma.

• Tabelas originais em Perron (1988).

• Zivot & Andrews (1992) ampliam o teste para endogeneizar a data de quebra.

• Outras formas de se detectar a data da quebra:

– Estatística da razão de verossimilhança de Quandt (RVQ), também chamada de estatística de sup-Wald (para regressões).

– Veremos apenas esta.

ttttttttt uxDyDDxyy 1211011110

Definir 0 = 0.15T e 1 = 0.85T . Testar para o intervalo entre 0 e 1.

Raiz unitária ou Não-estacionaridade?

• Teste KPSS

• Exercícios – fazer e entregar/apresentar na aula de laboratório.

• 21.16, 21.17 e 21.18

• Nesta aula, você poderá corrigir seu trabalho juntamente com todos os demais.

• Transformação de Séries Não-Estacionárias.

– DS

– TS

• Subdiferenciar/Sobrediferenciar (já falamos, não?)

• Cointegração

– Teste de Cointegração

– Teste AEG (Engle-Granger aumentado)

– Cointegração e Mecanismo de Correção de Erros

• Cointegração em séries econômicas – Geralmente se estudam casos em que as séries

possuem o mesmo número de raízes unitária (geralmente uma, ou I(1)).

– Há desenvolvimentos recentes para séries I(2).

– Há outros desenvolvimentos (multi-cointegração, ver Enders (2004)).

– Veremos casos em que existe (ao menos) uma combinação linear de duas séries I(1) que seja I(0).

• Cointegração e Mecanismo de Correção de Erros

• Considere o seguinte ADL(1, 1):

• Este modelo dá origem a vários casos particulares, conforme as restrições que se estabeleça sobre os parâmetros.

ttttt uzyzy 13121

• Veja este caso do ADL(1,1):

• Se existir um equilíbrio entre x e y:

**** 1010 xxyy

**)(

)1(

***)1(*

10

1

1001001

xKKyyE

xyxy

• Agora, com duas pequenas manipulações algébricas:

• Co-integração e o Teorema de Engle-Granger

• Notas de aula

Raízes Unitárias - complemento

• Vide Enders (2004) reproduzido a seguir.

Observações adicionais sobre o passeio aleatório

ttt uYY 1

1

00

123

12

1

:

)(

)(

t

sst

tttt

ttt

ttt

uY

uuuY

uuY

uYY

Se u é um ruído branco, E(Yt) = Y0. Mas, a variância...

21

0

21

0

)()( tuVarYVart

s

t

sstt

Modelos ARMA(p,d,q)

• 1. Todo processo ARMA(p,q) pode ser escrito como um AR puro ou como um MA puro.

– Vimos que um AR(1) se transforma em um MA() (sob uma condição especial...qual?)

– No caso de um MA(1) é fácil ver que ele pode ser escrito como um AR().

• De forma geral: todo processo ARMA(p,q) estacionário pode ser representado na forma:

...

1

11

2

2

111

0

1

1

1

tttt

t

i

t

i

tttt

YYuY

uYLuYL

uLY

tt uLYL )()(

• O modelo ainda pode ser representado por um AR() ou um MA().

• Entretanto, a representação não é sinônimo de comportamento igual.

q

q

p

p

LLLLL

LLLLL

...1)(

...1)(

3

3

2

21

3

3

2

21

• Não entraremos em detalhes sobre os processos neste curso (seguimos Gujarati e estas notas apenas).

• Detalhes adicionais, Enders (2004).

Estimação de modelos ARMA (p,q)

• Modelos AR(p) – MQO

• Modelos ARMA (p,q) – otimização não-linear (por conta da parte MA)

• Testes de especificação do modelo: – Sob a hipótese nula de que o modelo ARMA(p,q)

está corretamente especificado, Q é assintoticamente distribuída como uma qui-quadrado com K-p-q graus de liberdade.

• Problemas do teste LB:

– Para valores elevados de K, o teste pode apresentar baixa potência;

– O teste apenas indica se o modelo é inadequado, mas não sugere como o modelo deveria ser modificado.

• Outras opções: Multiplicador de Lagrange de Breusch-Godfrey

• Além disso,

• BIC (SBC) e AIC

– Já vimos, não?

Previsão

Previsão

Sazonalidade

• Como tratá-la?

– Para fins de previsão, Granger & Newbold: não a retire, modele-a.

– O tratamento adequado consiste em saber se a sazonalidade é determinista ou estocástica.

– Na metodologia Box-Jenkins, modela-se a sazonalidade.

• Outros métodos: dessazonalizar

– Dummies

– Médias móveis

– Census X-11

– Census X-12 ARIMA

• Exemplo:

– Modelo SARIMA(1,0,0)x(1,0,0)12:

– Modelo SARIMA(0,1,1)x(0,1,0)12:

ttttt

tt

uYYYY

uYBB

13121121211

12

121 11

113121

12 111

tttttt

tt

uuYYYY

uBYBB

• Correlograma

– Para processos puramente sazonais, os

correlogramas são similares aos dos processos puramente não-sazonais (AR e MA), só que a truncagem ocorre na defasagem sazonal.

– Ex: um SAR(1) mensal tem uma FACP que trunca após a 12ª defasagem. Sua FAC declina exponencialmente.

Função

Processo ACF PACF

MA(Q) trunca no lag “Q” Declina exponencialmente

AR(P) Declina exponencialmente trunca no lag “P”

ARMA(P,Q) Decai exponencialmente se j > Q Decai exponencialmente se j > P

Exemplo: índice da produção industrial (IBGE)

60

70

80

90

100

110

120

130

140

1995 2000 2005 2010

pro

din

d

-1

-0.5

0

0.5

1

0 5 10 15 20 25

lag

ACF for prodind

+- 1.96/T^0.5

-1

-0.5

0

0.5

1

0 5 10 15 20 25

lag

PACF for prodind

+- 1.96/T^0.5

Trabalhamos aqui já com o logaritmo da série!

• Que modelo estimar?

• Problema: teste de raiz unitária – Dessazonalizar a série?

– Ou fazer um teste de raiz unitária sazonal?

– No caso de uma raiz unitária sazonal, diferencia-se a série. • Sim, é possível ter uma raiz unitária e uma raiz unitária

sazonal. – Ex: SARIMA (0,1,1) x (0,1,1)

• Tente analisar a estacionariedade da série.

• Depois verifique se existem “não-estacionaridades” sazonais. Se existirem, diferencie sazonalmente.

• A partir daí, prossiga como anteriormente.

-1

-0.5

0

0.5

1

0 5 10 15 20 25

lag

ACF for d_l_prodind

+- 1.96/T^0.5

-1

-0.5

0

0.5

1

0 5 10 15 20 25

lag

PACF for d_l_prodind

+- 1.96/T^0.5

• Sobre testes de raízes unitárias sazonais, ver, por exemplo, o teste HEGY

• Entretanto, nem todos os programas de computador fazem o cálculo deste teste.

0.0 0.5 1.0 1.5 2.0

-0.4

0.0

0.4

0.8

Series: diff(log(prod))

LAG

AC

F

0.0 0.5 1.0 1.5 2.0

-0.4

0.0

0.4

0.8

LAG

PA

CF

Após o exame do correlograma foram estimados alguns modelos. O melhor foi este.

Standardized Residuals

Time

1995 2000 2005 2010

-4-2

02

0.5 1.0 1.5 2.0

-0.2

0.2

ACF of Residuals

LAG

AC

F

-3 -2 -1 0 1 2 3

-4-2

02

Normal Q-Q Plot of Std Residuals

Theoretical Quantiles

Sam

ple

Quantil

es

5 10 15 20 25 30 35

0.0

0.4

0.8

p values for Ljung-Box statistic

lag

p v

alu

e

A previsão gerada, convertida para índice, indica que a produção industrial deve ter um aumento modesto em fevereiro/2012: 0.396%. Será?

O mesmo resultado no Gretl

4

4.1

4.2

4.3

4.4

4.5

4.6

4.7

4.8

4.9

5

1995 2000 2005 2010

l_pro

din

d

Actual and fitted l_prodind

fitted

actual

4.5

4.55

4.6

4.65

4.7

4.75

4.8

4.85

4.9

4.95

5

2004 2005 2006 2007 2008 2009 2010 2011 2012

l_prodind

forecast

95 percent interval

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-1)

log(p

rod)(

t) 0.92

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-2)

log(p

rod)(

t) 0.86

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-3)

log(p

rod)(

t) 0.78

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-4)

log(p

rod)(

t) 0.73

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-5)

log(p

rod)(

t) 0.7

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-6)

log(p

rod)(

t) 0.67

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-7)

log(p

rod)(

t) 0.67

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-8)

log(p

rod)(

t) 0.69

4.2 4.4 4.6 4.84.2

4.6

log(prod)(t-9)

log(p

rod)(

t) 0.71

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-10)

log(p

rod)(

t) 0.76

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-11)

log(p

rod)(

t) 0.79

4.2 4.4 4.6 4.8

4.2

4.6

log(prod)(t-12)

log(p

rod)(

t) 0.82

• Laboratório

– Duas partes: Co-integração e modelos ARIMA

– Na parte dos modelos ARIMA: • Cada um terá que estimar um modelo diferente do meu

(pré-estabelecido) para esta mesma base.

• Fazer todas as etapas.

• Entregar na mesma aula.

• O exercício será feito individualmente.

– Na parte de co-integração, ver o exercício 21.19.

Exemplo

• Vamos seguir o exemplo do PNB dos EUA (1947.1 – 2002.3, trimestral).

• N= 233.

• Fonte dos dados (FRED – o banco de dados do FED de St. Louis).

Time

gn

p

1950 1960 1970 1980 1990 2000

20

00

40

00

60

00

80

00

• Os dados foram dessazonalizados e estão a preços de 1996.

• O correlograma indica que a diferenciação...

0 2 4 6 8 10 12

0.0

0.4

0.8

Series: gnp

LAG

AC

F

0 2 4 6 8 10 12

0.0

0.4

0.8

LAG

PA

CF

• Fazendo a taxa de variação do PNB (veja comando abaixo), obtemos o seguinte gráfico:

• gnpgr = diff(log(gnp)) # growth rate

Time

gn

pg

r

1950 1960 1970 1980 1990 2000

-0.0

2-0

.01

0.0

00

.01

0.0

20

.03

0.0

4

• Veja a ACF e a PACF da taxa de crescimento do PNB.

• Intuições: ACF trunca em k = 2 e a PACF está caindo (MA(2)). Ou será que a ACF está caindo a a PACF trunca em k = 1 (AR(1))?

1 2 3 4 5 6

-0.2

0.2

0.6

1.0

Series: gnpgr

LAG

AC

F

1 2 3 4 5 6

-0.2

0.2

0.6

1.0

LAG

PA

CF

• ARIMA (1,1,0)

• AIC = -8.2944

• BIC = -9.2637

Standardized Residuals

Time

1950 1960 1970 1980 1990 2000

-30

24

1 2 3 4 5 6

-0.2

0.2

ACF of Residuals

LAG

AC

F

-3 -2 -1 0 1 2 3

-30

24

Normal Q-Q Plot of Std Residuals

Theoretical Quantiles

Sam

ple

Quantil

es

5 10 15 20

0.0

0.4

0.8

p values for Ljung-Box statistic

lag

p v

alu

e

ttt uGNPGNP

1

005.0

3467.03467.010083.0

• ARIMA(0,1,2)

• AIC = -8.2976

• BIC = -9.2517

Standardized Residuals

Time

1950 1960 1970 1980 1990 2000

-30

24

1 2 3 4 5 6

-0.2

0.1

0.4

ACF of Residuals

LAG

AC

F

-3 -2 -1 0 1 2 3

-30

24

Normal Q-Q Plot of Std Residuals

Theoretical Quantiles

Sam

ple

Quantil

es

5 10 15 20

0.0

0.4

0.8

p values for Ljung-Box statistic

lag

p v

alu

e

tttt uuuGNP 21 2035.0303.00083.0

Atenção

• Reparou no que eu fiz na hora de escrever as equações?

• Os programas Eviews, Gretl e R estimaram os mesmos resultados.

• Entretanto, os autores do livro do qual usei o exemplo mostram que há um problema nestas saídas.

• A questão é simples e diz respeito a como os programas tratam a estimação em diferença. Investigando os resultados do R, esta foi a descoberta deles.

• Se o intercepto é estatisticamente igual a zero, isto não é um problema.

• Mas se não for, então haverá um problema nas previsões dos modelos.

• O que fazer?

• Como acabei de citar, todos os programas sofrem do mesmo problema.

• A única forma de não ter o problema, entre os três programas, é usar as rotinas criadas pelos autores.

• Veja o item 2 em: http://www.stat.pitt.edu/stoffer/tsa3/Rissues.htm . Note que a explicação vale para o Eviews e para o Gretl também.

• Não é um grande problema em termos das elasticidades estimadas porque diz respeito ao intercepto.

• Mas em termos de previsão, isto pode ser um problema.

Voltando ao exemplo...

SARIMA(3,1,0) x (1,0,1) sem intercepto SARIMA(3,1,0) x (1,0,1) com intercepto SARIMA(1,1,0) x (1,0,1) sem intercepto SARIMA(2,1,0) x (1,0,1) com intercepto SARIMA(2,1,0) x (1,0,1) sem intercepto SARIMA(3,1,0) x (0,0,0) sem intercepto - SARIMA(3,1,0) x (1,0,0) sem intercepto SARIMA(3,1,0) x (1,0,0) com intercepto SARIMA(3,1,0) x (1,0,2) sem interpecto SARIMA(3,1,0) x (1,0,2) com intercepto SARIMA(3,1,1) x (1,0,1) sem intercepto SARIMA(3,1,1) x (1,0,1) com intercepto SARIMA(1,1,0) x (1,0,1) com intercepto SARIMA(1,1,0) x (1,0,1) sem intercepto SARIMA(3,1,0) x (0,0,1) com intercepto SARIMA(3,1,0) x (0,0,1) sem intercepto SARIMA(0,1,0) x (1,0,1) sem intercepto SARIMA(0,1,0) x (1,0,1) com intercepto SARIMA(2,1,0) x (0,0,1) sem intercepto SARIMA(2,1,0) x (0,0,1) com intercepto SARIMA(1,1,0) x (0,0,1) sem intercepto SARIMA(1,1,0) x (0,0,1) com intercepto SARIMA(3,1,1) x (1,0,1) sem intercepto SARIMA(3,1,1) x (1,0,1) com intercepto

Nosso exercício do laboratório excluiu os modelos destacados. Seu próximo trabalho será escolher entre os restantes. Use o Eviews.

Modelos ARCH

• Leptocúrticas (caudas “pesadas”) – o problema da leptocurtose

• Dados financeiros: decisões no curto, não no longo prazo.

• Alavacangem (leverage effects) - Basicamente, dizem respeito à assimetria na volatilidade: a mesma aumenta mais após uma queda no preço do que após um aumento de mesma magnitude do mesmo.

• Com os resíduos da regressão...

• Fácil. Use o correlograma dos resíduos ao quadrado!

• A segunda observação diz respeito à ordem “q”. Mas acabei de falar: use o correlograma.

– Note que neste exemplo eu, inicialmente,

arbitrariamente, supus que q = 4 e fiz o teste.

• O problema do modelo ARCH: pode-se violar as condições de não-negatividade conforme o q escolhido. O que fazer?

• GARCH (1,1)

Para checar os resíduos, precisamos gerar a série normalizada. Isto é facilmente obtido através do cálculo da variância condicional. Para gerar esta variância, escreva o comando de linha “eq1.makegarch cvar”. Isto gerará a série “cvar” da variância condicional. Em seguida, crie a série dos resíduos padronizados, dividindo a série dos resíduos (esta você já sabe gerar, certo?) pela raiz da série cvar. No caso deste exemplo: genr resid_padron = resid1/(cvar)^(0.5). Sobre este resíduo aplica-se o teste de normalidade.

0

4

8

12

16

20

-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0

Series: RESID_PADRON

Sample 1980M01 2008M04

Observations 340

Mean 0.000308

Median -0.007503

Maximum 1.974694

Minimum -1.856102

Std. Dev. 1.001256

Skewness -0.014773

Kurtosis 1.813285

Jarque-Bera 19.96318

Probability 0.000046

Ainda não é um bom modelo, certo?

• ARCH, GARCH, etc.

• Várias extensões.

• Mas vamos ficar por aqui, senão vamos nos perder.

top related