modelos arima rodrigo gabriel de miranda robert samohyl
TRANSCRIPT
Modelos ARIMA Rodrigo Gabriel de Miranda
Robert Samohyl
Introdução
• Os modelos ARIMA fazem parte da classe de modelos univariados.
• Início 70’s
• Definição ARIMA (Auto-Regressivo Integrado de Auto-Regressivo Integrado de Médias Móveis)Médias Móveis)
Metodologia Box-Jenkins
• Fase 1 – IdentificaçãoPreparação dos dados• Transformar os dados para estabilizar a variância• Diferenciar os dados para estacionar a série
Seleção do modelo• Examinar os dados, FAC e FACP para identificar os modelos potenciais
Séries não estacionárias
Exemplos de séries não estacionárias
Função de Autocorrelação (FAC)
• Função
• Intervalo de confiança (aproximação)
1
2
1
n
t t kt k
k n
tt
Y Y Y Yr
Y Y
2n
Função de Autocorrelação Parcial (FACP)
• Mede o grau de associação de entre Yt e Yt-k, quando o efeito de outras defasagens no tempo – 1,2,3,...,k-1 – são removidos
• Ex. Se existir uma autocorrelação entre Yt e Yt-1, então existe uma correlação entre entre Yt-1 e Yt-2. Consequentemente existe uma correlaçao entre Yt e Yt-2, pois ambos estão relacionadas a Yt-1.
Exemplo – pib da industria
• Produção industrial (índice)
• Fonte: IBGE
• Série: 1991-1, 2006-12.
Time
ind
1995 2000 2005
6070
8090
100
110
120
FAC para uma série não estacionária
• O primeiro coeficiente de autocorrelação é grande
• As autocorrelações decaem lentamente
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
ind
FACP para uma série não estacionária
• O FACP apresenta um prego perto do valor 1 para uma defasagem.
0.5 1.0 1.5
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
Lag
Par
tial A
CF
Series pib
Dicas para estacionar a série• Os dois exemplos são de
séries já estacionárias.
• A primeira é uma série não sazonal com média constante
• A segunda é uma série com sazonalidade aditiva e média constante
AA
Horizonte
Prev
isão
NA
HorizontePr
evis
ão
Dicas para estacionar a série
AN
Horizonte
Prev
isão
• As séries não são estacionárias na média (tendência linear e tendência linear com sazonalidade aditiva)
• Transformação: primeira diferença• Y’ = Yt – Yt-1
AA
Horizonte
Prev
isão
Dicas para estacionar a série
• Série não estacionária na média e na variância• Série com tendência linear e sazonalidade multiplicativa.• Transformação: primeira diferença do ln• Y’ = ln(Yt)-ln(Yt-1)
AM
HorizontePr
evis
ão
Dicas para estacionar a série
• As séries não são estacionárias na média• Série com tendência quadrática• Transformação: segunda diferença• Y’’ = Y’t – Y’t-1 = (Yt – Yt-1) – (Yt-1 – Yt-2) = Yt – 2Yt-1 + Yt-2
MN
Horizonte
Prev
isão
MA
Horizonte
Prev
isão
Dicas para estacionar a série
• Série não estacionária na média e na variância• Série com tendência quadrática e sazonalidade
multiplicativa.• Transformação: segunda diferença do ln
MM
HorizontePr
evis
ão
Exemplo – transformação: primeira diferença (série)
Time
ind
1995 2000 2005
-10
-50
510
15
Time
ind
1995 2000 2005
6070
8090
100
110
120
Transformado Original
Exemplo – transformação: primeira diferença (FAC)
0.0 0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
ind
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
ind
Transformado Original
Exemplo – transformação: primeira diferença (FACP)
0.5 1.0 1.5
-0.4
-0.2
0.0
0.2
0.4
Lag
Par
tial A
CF
Series diff(pib)
0.5 1.0 1.5
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
Lag
Par
tial A
CF
Series pib
Transformado Original
Modelo AR(1) ou ARIMA (1,0,0)
5 10 15 20
-0.2
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
Lag
Par
tial A
CF
Series b
0 5 10 15 20
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series b
• Modelo auto regressivo de ordem 1
1 1t t tY a Y e
Modelo AR(2) ou ARIMA (2,0,0)
• Modelo auto regressivo de ordem 2
0 5 10 15 20
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series b
5 10 15 20
-0.3
-0.2
-0.1
0.0
0.1
0.2
0.3
0.4
Lag
Par
tial A
CF
Series b
1 1 2 2t t t tY a Y Y e
Modelo MA(1) ou ARIMA (0,0,1)
• Modelo de médias móveis de grau 1Modelo de médias móveis de grau 1
0 5 10 15 20
-0.5
0.0
0.5
1.0
Lag
AC
F
Series b
5 10 15 20
-0.5
-0.4
-0.3
-0.2
-0.1
0.0
0.1
0.2
Lag
Par
tial A
CF
Series b
0 1 1t t tY e e
Modelo MA(2) ou ARIMA (0,0,2)
• Modelo de médias móveis de grau 2Modelo de médias móveis de grau 2
0 5 10 15 20
-0.5
0.0
0.5
1.0
Lag
AC
F
Series b
5 10 15 20
-0.6
-0.4
-0.2
0.0
0.2
Lag
Par
tial A
CF
Series b
0 1 1 2 2t t t tY e e e
Modelo ARIMA (1,0,1)
1 1 1 1t t t tY a Y e e Time
b
0 20 40 60 80 100
-2-1
01
23
• Modelo misto AR(1), MA(1)Modelo misto AR(1), MA(1)• Genericamente os modelos ARIMA são definir por ARIMA(p,d,q)Genericamente os modelos ARIMA são definir por ARIMA(p,d,q)• p – número de termos auto regressivos(defasagens no lado direito p – número de termos auto regressivos(defasagens no lado direito
da equaçãoda equação• d – número de diferenças para estacionar a séried – número de diferenças para estacionar a série• q – número de médias móveis (erros defasados no lado direito da q – número de médias móveis (erros defasados no lado direito da
equação)equação)
Time
b
0 20 40 60 80 100
-3-2
-10
12
AR1 = -0.6, MA1 = 0.3AR1 = 0.9, MA1 = -0.7
FAC e FACP – ARIMA(1,0,1)
0 5 10 15 20
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series b
5 10 15 20
-0.2
-0.1
0.0
0.1
0.2
Lag
Par
tial A
CF
Series b
0 5 10 15 20
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series b
5 10 15 20
-0.2
-0.1
0.0
0.1
0.2
0.3
Lag
Par
tial A
CF
Series b
AR1 = -0.6, MA1 = 0.3
AR1 = 0.9, MA1 = -0.7
Identificação de modelos AR ou MA puros
Decai exponencialmente ou uma curva de sino amortecida. O padrão exato depende do valor e sinal de θ1 ....θp
Prego nas defasagens de 1 até q, depois corta para zero
MA(q)
Prego nas defasagens de 1 até p, depois corta para zero
Decai exponencialmente ou uma curva de sino amortecida. O padrão exato depende do valor e sinal de φ1 ....φp
AR(p)
FACPFACProcesso
Identificação ARIMA
• De acordo a tabela anterior verificar se o modelo é um AR ou MA puro
ARMA(p,q)• Queda gradual ou pregos bem definidos
em ambos os CORRELOGRAMAS
Modelo ARIMA sazonal• Notação: SARIMA (0,0,0) (1,0,0)Notação: SARIMA (0,0,0) (1,0,0)1212
• Notação: SARIMA (0,0,0) (0,0,1)Notação: SARIMA (0,0,0) (0,0,1)1212
• Generalizando: Sarima(p,d,q)(P,D,Q)Generalizando: Sarima(p,d,q)(P,D,Q)ss• P - número de termos auto regressivos sazonais P - número de termos auto regressivos sazonais
(defasagens no lado direito da equação)(defasagens no lado direito da equação)• d – número de diferenças sazonaisd – número de diferenças sazonais• q – número de médias móveis sazonais (erros q – número de médias móveis sazonais (erros
defasados no lado direito da equação)defasados no lado direito da equação)• s – ciclo sazonals – ciclo sazonal
12 12t t tY a Y e
12 12t t tY a e e
Exemplo: identificação
• Modelo possível
• ARIMA(1,1,0)(1,0,1)12
0.0 0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
ind
0.5 1.0 1.5
-0.4
-0.2
0.0
0.2
0.4
Lag
Par
tial A
CF
Series diff(pib)
Primeira diferença do pib ind
Metodologia Box-Jenkins
• Fase 2 – Estimação e testeEstimação• Estimar parâmetros dos modelos potenciais• Selecionar o melhor modelo por algum critério
Diagnóstico• Checar a FAC e FACP dos resíduos•Verificar de os resíduos possuem distribuição normal, com média zero e variância constante
Estimação dos parâmetros
• Nos modelos ARIMA a estimação através de uma função de verossimilhança
• Para o exemplo anterior:• Y’t = φ1Y’t-1 + φ2Y’t-12 + θ1et-12 + et
• Y’t = Yt – Yt-1
• Y’t = -0.3689 Y’t-1 + 0.9976 Y’t-12 + -0.8844et-12
• s.e. 0.0677 0.0036 0.0831• sigma^2 estimated as 10.16: log likelihood = -
507.82, aic = 1023.64
Selecionar modelo
• AIC – critério de informação de AKaike• AIC = -2logL+2m• L – verossimilhança• m = p+q+P+Q• Este critério penaliza os modelos com
maior número de variáveis• Selecionar o modelos com menor AIC.
Checar o FAC e FACP dos resíduos(exemplo)
• Não deve existir nenhuma altocorrelação nos resíduos
• Se isto ocorrer outro modelo deve ser tentado.
0.0 0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
Series b$residuals
0.5 1.0 1.5
-0.2
-0.1
0.0
0.1
0.2
Lag
Par
tial A
CF
Series b$residuals
Testar a normalidade dos resíduos (exemplo)
• O histograma deve apresentar uma forma de sino, com a maioria dos valores em torno de zero.
• Teste estatístico de normalidade - Shapiro-Wilk
• data: b$residuals • W = 0.9961, p-value =
0.9104• Obs: hipótese nula de
normalidade
Histogram of b$residuals
b$residuals
Freq
uenc
y
-10 -5 0 5 10
010
2030
40
Previsão• Jan 2007 109.1996• Feb 2007 106.2918• Mar 2007 117.7317• Apr 2007 114.5179• May 2007 120.2556• Jun 2007 118.9860• Jul 2007 122.7341• Aug 2007 125.6595• Sep 2007 123.2329• Oct 2007 126.7847• Nov 2007 123.4185• Dec 2007 113.3679
Previsão (exemplo)
Forecasts from ARIMA(1,1,0)(1,0,1)12
1995 2000 2005
6080
100
120