infer^encia sequencial em modelos din^amicos...
TRANSCRIPT
Inferencia Sequencial em Modelos
Dinamicos Generalizados
Carlos Tadeu Pagani Zanini
Universidade Federal do Rio de Janeiro
Instituto de Matematica
Departamento de Metodos Estatısticos
2015
Inferencia Sequencial em Modelos
Dinamicos Generalizados
Carlos Tadeu Pagani Zanini
Dissertacao de Mestrado submetida ao Programa de Pos-Graduacao em Estatıstica
do Instituto de Matematica da Universidade Federal do Rio de Janeiro - UFRJ, como
parte dos requisitos necessarios a obtencao do tıtulo de Mestre em Estatıstica.
Aprovada por:
Prof. Helio dos Santos Migon
PhD - IM - UFRJ - Orientador.
Profa Mariane Branco Alves
D.Sc - IM - UFRJ - Co-orientadora.
Dani Gamerman
PhD - IM - UFRJ.
Glaura Conceicao Franco
D.Sc - ICE - UFMG.
Rio de Janeiro, RJ - Brasil
2015
ii
A minha famılia, amigos e professores.
iii
“Do you remember standing on the shore,
Head in the clouds, your pockets filled with dreams
Bound for glory on the seven seas of life,
But the ocean is deeper than it seems
Sail your ship across the water,
Spread your wings across the sky
Take the time to see
You’re the one who holds the key,
Or sailing ships will pass you by
(...)
Spread your wings and you will see
You control your destiny,
So sailing ships don’t pass you by
Sailing ships - Whitesnake
COVERDALE, DAVID & VANDENBERG, ADRIAN ”
iv
Agradecimentos
Os ultimos dois anos foram, sem duvida alguma, os mais desafiadores da minha vida e,
se consegui completar mais essa etapa, nao foi sem ajuda das pessoas mais maravilhosas
e compreensivas deste mundo. Sendo assim, dedico esta pequena secao do meu trabalho a
agradacer a estas pessoas por estarem ao meu lado nas mais diversas e adversas situacoes.
Primeiramente, agradeco a minha famılia. Meus pais, que souberam estimular em
mim o amor incondicional pelo conhecimento desde de crianca, pelos valores e princıpios
que me ensinaram e pelo amor e carinho que sempre tiveram comigo. Ao meu irmao,
agradeco por absolutamente tudo, por ser o melhor amigo que alguem pode ter, por estar
sempre do meu lado pra me alegrar com as suas piadas, me inspirar com seus conselhos
ou mesmo rir dos meus acessos de raiva quando meus programas nao rodavam. Talvez
voce nem saiba disso, Gabriel, mas voce me ensinou que a melhor maneira de resolver os
problemas e com um largo sorriso na cara e nao com um murro na mesa.
Aos meus amigos da pos-graduacao, agradeco por dividirem comigo todos esses mo-
mentos memoraveis que passamos juntos estudando, programando, reclamando, rindo e
outros gerundios. Voces foram as pessoas com quem passei mais tempo nesses dois anos
em que praticamente vivi no fundao. Aqui incluo todos os meu amigos da pos-graduacao
em estatıstica, ao pessoal da matematica e da matematica aplicada. Sem todos voces,
essa etapa seria muito mais difıcil e menos divertida. Em especial, Marianas, Rafael e
Ingrid, muitıssimo obrigado pelo convıvio e companheirismo em absolutamente todos os
momentos, desde as caronas, onibus lotados, confraternizacoes, aulas, congressos e ate
os almocos no bandejao (porque e claro que eu tenho que lembrar de comida sempre).
Como vou sentir falta de tudo isso nos proximos anos...
Aos meus amigos de mais longa data, agradeco por continuarem ao meu lado mesmo
nos varios momentos em que me ausentei por conta dos compromissos com o mestrado.
v
Gustavo, Fred, Raphael, Lucas, Vicente, Daniel, Bianca, Alexandre, Luciana, Paraıba
e Mirna dedicar a voces este trabalho e uma singela forma de agradecer a tudo o que
voces significam pra mim; afinal crescemos juntos como uma grande (na verdade, imensa)
famılia. Vou sempre levar na minha memoria os seus conselhos, conversas, piadas e as
jogatinas de videogame nos fins de semana.
Agradeco a todo o corpo docente da pos graduacao por atuar com tanta dedicacao
para nos transmitir da melhor forma possıvel o conhecimento academico necessario para
o nosso futuro profissional. Agradeco a Mariane e ao Migon por me orientarem pelos in-
trincados caminhos dessa jornada de pesquisa que chamamos de dissertacao de mestrado.
Tem sido uma grande honra e um grande prazer trabalhar com voces dois. Faco um agra-
decimento especial a Mariane, que alem de excelente coorientadora e uma grande amiga.
Obrigado por confiar em meu potencial desde quando entrei na UFRJ ao me oferecer um
projeto de iniciacao cientıfica (o que foi a fagulha inicial que iluminou minha decisao pela
carreira academica) e cujos conselhos me levaram onde estou hoje. Agradeco tambem a
Alexandra e ao Migon pelo constante incentivo que me dao a participar de congressos. A
participacao nesses eventos contribuiu muito para o meu aprendizado e foi, certamente,
o fator que mais ajudou a nortear meu caminho para o doutorado. Vejo nesta nova etapa
que se inicia, uma excelente oportunidade de retribuir a todo conhecimento que voces,
professores, transmitiram a mim e aos meus colegas nestes ultimos anos.
Aos professores Carlos Abanto Valle, Dani Gamerman e Glaura Franco, agradeco por
aceitarem fazer parte da banca.
Finalmente, Agradeco ao CNPQ e a Faperj pelo apoio financeiro no primeiro e segundo
ano de mestrado, respectivamente.
vi
Resumo
Na pratica, analises estatısticas de series temporais requerem atualizacao constante
da inferencia a medida que novas observacoes tornam-se disponıveis. Nesse sentido, o
ideal e utilizar procedimentos sequenciais de inferencia, sobretudo quando os intervalos
de tempo em que se recebe novas informacoes sao curtos.
Tendo como base esta motivacao de carater pratico, este trabalho propoe uma meto-
dologia sequencial bayesiana aplicada a modelos dinamicos nao-lineares com resposta na
famılia exponencial. Utiliza-se de expansao do vetor de estados e linearizacao da equacao
de evolucao resultante para estimar hiperparametros originalmente pertencentes a matriz
de evolucao, permitindo estimacao dos estados e hiperparametros conjuntamente. Para
estimacao da variancia de evolucao de componentes dinamicas, utiliza-se quadratura de
Gauss Hermite.
A aplicacao da metodologia sequencial proposta aqui e exemplificada em contextos
de modelos na famılia exponencial com estrutura latente autorregressiva e tambem em
modelos com efeito de funcao de transferencia para descrever o impacto de regressoras
sobre a variavel resposta.
Palavras-Chaves: modelos dinamicos, linear bayes, processos autoregressivos, com-
putacao sequencial bayesiana, quadratura de Gauss-Hermite.
vii
Abstract
From a practical point of view, statistical time series analysis often require the infe-
rence procedure to be constantly updated as new observations become available. In this
sense, the use of sequential inference procedures is desirable, specially when new data
arrive in short time intervals.
Focusing on this practical motivation, this work proposes a sequential Bayesian metho-
dology that applies to non-linear dynamic models with response variable belonging to the
exponential family of distributions. Expansion of the state vector and linearization of the
resulting evolution equation are used to estimate hyperparameters originally belonging
to the evolution matrix, which allows the estimation of the states and hyperparameters
jointly. In order to estimate the evolution variances related to dynamic components in
the model, Gauss-Hermite quadrature is used.
The aplication of the sequential methodology proposed here is shown in examples
that concern dynamic models in the exponential family with latent autorregressive struc-
ture and in models with transfer function effects describing how covariates impact the
response variable.
Keywords: dynamic models,linear bayes, autorregressive processes, sequential baye-
sian computation, Gauss-Hermite quadrature.
viii
Sumario
1 Introducao 1
2 Estimacao bayesiana e modelos dinamicos 4
2.1 Inferencia bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 Estimacao por intervalo . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.3 Aspecto sequencial do Teorema de Bayes . . . . . . . . . . . . . . 7
2.1.4 Previsoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.5 Estimador linear de Bayes . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Modelos dinamicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1 Modelos lineares dinamicos . . . . . . . . . . . . . . . . . . . . . . 11
2.2.2 Modelos lineares generalizados dinamicos . . . . . . . . . . . . . . 17
2.2.3 Procedimento sequencial de inferencia em MLGD . . . . . . . . . 19
2.3 Especificacao dos erros de evolucao via fatores de desconto . . . . . . . . 24
3 Inferencia sequencial em modelos dinamicos nao lineares 26
3.1 Modelos dinamicos nao lineares . . . . . . . . . . . . . . . . . . . . . . . 26
3.2 Processos autorregressivos . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3 Funcoes de transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4 Inferencia em modelos dinamicos nao-lineares . . . . . . . . . . . . . . . 34
3.4.1 Expansao do vetor de estados . . . . . . . . . . . . . . . . . . . . 35
3.4.2 Linearizacao da equacao de evolucao . . . . . . . . . . . . . . . . 36
3.4.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
ix
3.5 Quadratura de Gauss-Hermite em modelos
dinamicos nao-lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.6 Fatores de desconto para componentes autorregressivas . . . . . . . . . . 45
4 Estudo de simulacao 48
4.1 Descricao e objetivos do estudo simulado . . . . . . . . . . . . . . . . . . 48
4.2 Modelo Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2.1 Modelo normal com estrutura latente AR(1) . . . . . . . . . . . . 51
4.2.2 Modelo normal com estrutura latente AR(2) . . . . . . . . . . . . 58
4.2.3 Modelo normal com estrutura latente AR(3) . . . . . . . . . . . . 63
4.3 Modelo Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.1 Modelo poisson com estrutura latente AR(1) . . . . . . . . . . . . 69
4.3.2 modelo Poisson com estrutura latente AR(2) . . . . . . . . . . . . 76
4.3.3 modelo Poisson com estrutura latente AR(3) . . . . . . . . . . . . 80
4.4 Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.4.1 Modelo binomial com estrutura latente AR(1) . . . . . . . . . . . 85
4.4.2 Modelo binomial com estrutura latente AR(2) . . . . . . . . . . . 90
4.4.3 Modelo binomial com estrutura latente AR(3) . . . . . . . . . . . 94
4.5 Conclusoes do estudo simulado . . . . . . . . . . . . . . . . . . . . . . . 98
5 Aplicacao a dados reais 101
5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.2 Descricao do conjunto de dados . . . . . . . . . . . . . . . . . . . . . . . 102
5.3 Descricao dos modelos propostos . . . . . . . . . . . . . . . . . . . . . . 103
5.3.1 Simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.3.2 Aplicacao aos dados . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.4 Conclusoes da aplicacao aos dados reais . . . . . . . . . . . . . . . . . . . 115
6 Conclusoes e trabalhos futuros 117
A Distribuicoes de Probabilidade 120
x
Lista de Tabelas
4.1 Tempo computacional medio em segundos para implementacao da me-
todologia sequencial baseada na expansao do vetor de estados e uso da
quadratura de Gauss-Hermite aos modelos dinamicos normais, poisson e
binomial com estrutura latente AR(1), AR(2) e AR(3). Foram utilizados
15 pontos na quadratura de Gauss-Hermite. . . . . . . . . . . . . . . . . 100
5.1 Logaritmo da verossimilhanca preditiva para cada um dos modelos ajustados.112
5.2 Resumo a posteriori para os parametros estaticos considerando toda a serie
de dados. LI e LS (limites inferior e superior, respectivamente) referem-se
aos extremos do intervalos de credibilidade marginais (media ± 2 desvios). 113
xi
Lista de Figuras
2.1 Estimacao de θt ∼ AR(1) em MLD1, φ, V,W com φ,W e V conhecidos.
mt = E(θt | Dt), Ct = V ar(θt | Dt). A esquerda, exibe-se a sequencia
Ct juntamente com o valor limite C dado pela Proposicao 2.2. A direita,
exibe-se a sequencia de estimativas e intervalos de credibilidade a posteriori
para os estados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.1 Estimacao de θt ∼ AR(1) em MLD1, φ, V,Wt com φ conhecido e Wt
especificado pelo fator de desconto δ. Priori: θ1 ∼ N(0, 100). mt = E(θt |
Dt), Ct = V ar(θt | Dt). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.1 Resultados para uma replica simulada do modelo normal AR(1) com φ =
0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) considerando a variancia
de evolucao fixa em seu valor real no processo de estimacao. . . . . . . . 53
4.2 Histogramas suavizados para a distribuicao das estimativas de φ condicio-
nais a W no tempo N com base nas 100 series simuladas do modelo normal
AR(1). Os pontos representam a media amostral do respectivo conjunto
de estimativas pontuais E(φ | W,DN). A linha tracejada representa o
valor verdadeiro de φ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3 Histogramas suavizados para a distribuicao das estimativas de V condici-
onais a W no tempo N com base nas 100 series simuladas para o modelo
normal AR(1). Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(V | W,DN). A linha tracejada repre-
senta o valor verdadeiro de V . . . . . . . . . . . . . . . . . . . . . . . . . 54
xii
4.4 Resultados para uma replica simulada do modelo normal AR(1) com φ =
0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) estimando a variancia
de evolucao via quadratura de Gauss-Hermite. . . . . . . . . . . . . . . . 56
4.5 Estimacao da variancia de evolucao W para a primeira replica simulada
do modelo normal AR(1) com φ ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a coluna,
respectivamente). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.6 Histogramas suavizados para a distribuicao das estimativas de φ, W e
V (1a, 2a e 3a linhas, respectivamente) no tempo N , incondicionalente a
W, com base nas 100 series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pon-
tos representam a media amostral do respectivo conjunto de estimativas
pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro de φ. 58
4.7 Resultados para a 1a replica simulada do modelo normal AR(2) com φ =
(φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor
real no processo de estimacao. . . . . . . . . . . . . . . . . . . . . . . . . 59
4.8 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2
condicionais a W no tempo N com base nas 100 series simuladas do modelo
normal AR(2). Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(φ1 | W,DN) (1a linha) e E(φ1 | W,DN)
(2a linha). A linha tracejada representa o valor verdadeiro de φ1 ou φ2. . 60
4.9 Resultados para a primeira replica simulada do modelo normal AR(2) com
φ1 = 0.1, φ2 = 0.8 estimando a variancia de evolucao via quadratura de
Gauss-Hermite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.10 Estimacao da variancia de evolucao W para a primeira replica simulada
do modelo normal AR(2) com φ1 = 0.1 e φ2 = 0.8 . . . . . . . . . . . . . 62
4.11 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 no
tempo N com base nas 100 series simuladas do modelos normal AR(2). Os
pontos representam a media amostral do respectivo conjunto de estimati-
vas pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro
de φ1, φ2,W e V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
xiii
4.12 Resultados para a primeira replica simulada do modelo normal AR(3) com
φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao
fixa em seu valor real no processo de estimacao. . . . . . . . . . . . . . . 65
4.13 Histogramas suavizados para a distribuicao das estimativas de φ condici-
onalmente a W no tempo N com base nas 100 series simuladas do modelo
normal AR(3). Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(φ | W,DN), i ∈ 1, . . . , 5. A linha
tracejada representa o valor verdadeiro de φi. . . . . . . . . . . . . . . . 66
4.14 Histogramas suavizados para a distribuicao das estimativas de V no tempo
N com base nas 100 series simuladas do modelo normal AR(3) condici-
onalmente a W. Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(V | W,DN). A linha tracejada repre-
senta o valor verdadeiro de V . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.15 Resultados para a 1a replica simulada do modelo normal AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao W via
quadratura de Gauss-Hermite. . . . . . . . . . . . . . . . . . . . . . . . . 68
4.16 Resultados referentes a estimacao da variancia de evolucao W e de ob-
servacao V para uma replica simulada do modelo normal AR(3) com
φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86). . . . . . . . . . . . . . . . . . . . . 68
4.17 Histogramas suavizados para a distribuicao das estimativas de φi, i ∈
1, . . . , 5, W e V no tempo N com base nas 100 series simuladas do mo-
delo normal AR(3). Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(φi | DN), E(W | DN) e E(V | DN).
A linha tracejada representa o valor verdadeiro de φi, W e V . . . . . . . 69
4.18 Resultados para a 1a replica simulada do modelo Poisson AR(1) com
φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a
variancia de evolucao fixa em seu valor real no processo de estimacao. . . 71
4.19 Estimativas a posteriori para a soma do nıvel do preditor com o processo
AR(1): βt + µ para a primeira replica simulada do modelo Poisson AR(1). 72
xiv
4.20 Histogramas suavizados para a distribuicao das estimativas de φ condicio-
nalmente a W, no tempo N com base nas 100 series simuladas do modelo
Poisson AR(1). Os pontos representam a media amostral do respectivo
conjunto de estimativas E(φ | W,DN). A linha tracejada representa o
valor verdadeiro de φ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.21 Resultados para a 1a replica simulada do modelo Poisson AR(1) com φ1 ∈
0.5, 0.7, 0.95 (1a, 2a e 3a colunas respectivamente) estimando a variancia
de evolucao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.22 Resultados referentes a estimacao da variancia de evolucao W para uma
replica simulada do modelo Poisson AR(1) com φ1 ∈ 0.5, 0.7, 0.95 (1a,
2a e 3a linhas respectivamente). . . . . . . . . . . . . . . . . . . . . . . . 75
4.23 Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N com base nas 100 series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pon-
tos representam a media amostral do respectivo conjunto de estimativas
pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro de φ. 76
4.24 Resultados para uma replica simulada do modelo Poisson AR(2) com φ =
(φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor
real no processo de estimacao. . . . . . . . . . . . . . . . . . . . . . . . 77
4.25 Histogramas suavizados para a distribuicao das estimativas de φ condi-
cionais a W no tempo N com base nas 100 series simuladas com φ =
(φ1, φ2) = (0.1, 0.8). Os pontos representam a media amostral do respec-
tivo conjunto de estimativas pontuais E(φ1 | W,DN) ou E(φ2 | W,DN).
A linha tracejada representa o valor verdadeiro de φ1 e φ2. . . . . . . . . 78
4.26 Resultados para uma replica simulada do modelo Poisson AR(2) com
φ = (φ1, φ2) = (0.1, 0.8) estimando a variancia de evolucao atraves de
quadratura de Gauss Hermite. . . . . . . . . . . . . . . . . . . . . . . . . 79
xv
4.27 Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N com base nas 100 series simuladas do modelo Poisson AR(2) com
φ = (φ1, φ2) = (0.1, 0.8). Os pontos representam a media amostral do
respectivo conjunto de estimativas pontuais E(φ1 | DN), E(φ2 | DN) e
E(W | DN). A linha tracejada representa o valor verdadeiro de φ1, φ2 e W. 79
4.28 Resultados para uma replica simulada do modelo Poisson AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao fixa
em seu valor real no processo de estimacao. . . . . . . . . . . . . . . . . . 81
4.29 Histogramas suavizados para a distribuicao das estimativas de φi, i1, . . . , 5
condicionais a W no tempo N com base nas 100 series simuladas do mo-
delo Poisson AR(3). Os pontos representam a media amostral do respec-
tivo conjunto de estimativas pontuais E(φi | W,DN). A linha tracejada
representa o valor verdadeiro de φi. . . . . . . . . . . . . . . . . . . . . . 82
4.30 Resultados para uma replica simulada do modelo Poisson AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao. . . . 83
4.31 Resultados referentes a estimacao da variancia de evolucao W para a pri-
meira replica simulada do modelo Poisson AR(3) com φ = (φ1, φ2, φ3) =
(0.81, 0.77,−0.86). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.32 Histogramas suavizados para a distribuicao das estimativas de φi, i ∈
1, . . . , 5 e W no tempo N com base nas 100 series simuladas do modelo
Poisson AR(3). Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(φi | DN) ou E(W | DN). . . . . . . . 84
4.33 Resultados para uma replica simulada do modelo binomial AR(1) com
φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a
variancia de evolucao fixa em seu valor real no processo de estimacao. . 86
4.34 Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N condicionalmente a W com base nas 100 series simuladas do modelo
binomial AR(1). Os pontos representam a media amostral do respectivo
conjunto de estimativas pontuais E(φ | W,DN). . . . . . . . . . . . . . . 87
xvi
4.35 Resultados para a primeira replica simulada do modelo binomial AR(1)
com φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a colunas, respectivamente) estimando
a variancia de evolucao. . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.36 Resultados referentes a estimacao da variancia de evolucao W para uma
replica simulada do modelo binomial AR(1) com φ1 ∈ 0.5, 0.7, 0.95. . . 89
4.37 Histogramas suavizados para a distribuicao das estimativas de φ e W no
tempo N com base nas 100 series simuladas com do modelo binomial
AR(1). Os pontos representam a media amostral do respectivo conjunto
de estimativas pontuais E(φ | DN) e E(W | DN). . . . . . . . . . . . . . 90
4.38 Resultados para a primeira replica simulada do modelo binomial AR(2)
considerando a variancia de evolucao fixa em seu valor real no processo de
estimacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.39 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 con-
dicionalmente a W no tempo N com base nas 100 series simuladas do
modelo binomial AR(2). Os pontos representam a media amostral do res-
pectivo conjunto de estimativas pontuais E(φi | W,DN), i ∈ 1, 2. . . . 91
4.40 Resultados para a primeira replica simulada do modelo binomial AR(2)
estimando a variancia de evolucao. . . . . . . . . . . . . . . . . . . . . . 92
4.41 Resultados referentes a estimacao da variancia de evolucao W para a pri-
meira replica simulada do modelo binomial AR(2). . . . . . . . . . . . . 93
4.42 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 no
tempo N com base nas 100 series simuladas com φ = (φ1, φ2) = (0.1, 0.8).
Os pontos representam a media amostral do respectivo conjunto de esti-
mativas pontuais E(φi | DN), i ∈ 1, 2 e E(W | DN). . . . . . . . . . . 93
4.43 Resultados para a primeira replica simulada do modelo binomial AR(3)
considerando a variancia de evolucao fixa em seu valor real no processo de
estimacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
xvii
4.44 Histogramas suavizados para a distribuicao das estimativas de φi condi-
cionais a W no tempo N com base nas 100 series simuladas do modelo
binomial AR(3) com φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86). Os pontos
representam a media amostral do respectivo conjunto de estimativas pon-
tuais E(φi | W,DN), i ∈ 1, . . . , 5. . . . . . . . . . . . . . . . . . . . . . 96
4.45 Resultados para a primeira replica simulada do modelo binomial AR(3)
estimando a variancia de evolucao. . . . . . . . . . . . . . . . . . . . . . 97
4.46 Resultados referentes a estimacao da variancia de evolucao W para a pri-
eira replica simulada do modelo nbinomial AR(3). . . . . . . . . . . . . 97
4.47 Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N com base nas 100 series simuladas do modelo binomial AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86). Os pontos representam a media amostral
do respectivo conjunto de estimativas pontuais E(φi | DN), i ∈ 1, . . . , 5
e E(W | DN). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.1 Series temporais da variavel resposta e das regressoras. . . . . . . . . . . 102
5.2 Intervalos de credibilidade a posteriori (media± 2 desvios) para os parametros
estaticos do modelo 7, condicionalmente a toda a serie de dados, obtidos
via metodologia sequencial e via MCMC. . . . . . . . . . . . . . . . . . . 109
5.3 Funcao de resposta imediata ao impulso (γt) estimada sequencialmente e
via MCMC no modelo 7. Exibe-se a serie real e intervalos de credibilidade
a posteriori (media ± 2 desvios) condicionalmente a toda a serie de dados. 110
5.4 Histograma (MCMC) e curva de densidade aproximada (metodologia se-
quencial) para a variancia de evolucao a posteriori no modelo 7. Curva
obtida com 15 pontos na quadratura de Gauss-Hermite. . . . . . . . . . . 111
5.5 Intervalos de credibilidade a posteriori (media ± 2 desvios-padroes) para
os parametros estaticos considerando-se toda a serie de dados. . . . . . . 114
5.6 Funcao de resposta ao impulso estimada para o modelo 4. . . . . . . . . . 114
5.7 Previsoes um passo a frente para o numero de obitos de criancas por doenca
respiratoria em Sao Paulo . . . . . . . . . . . . . . . . . . . . . . . . . . 115
xviii
Capıtulo 1
Introducao
Em muitas situacoes de carater pratico, existe o interesse, ou a necessidade, em com-
preender o comportamento de alguma variavel no decorrer do tempo ou mesmo em prever
a trajetoria de tal variavel em tempos futuros. Nesses contextos, e comum que se receba
novas informacoes com o passar do tempo, o que requer multiplas aplicacoes do procedi-
mento inferencial adotado, visando incorporar novas observacoes de variaveis ao modelo
conforme elas se tornam disponıveis. Assim, e natural recorrer a procedimentos sequen-
ciais de inferencia para modelagem de series temporais.
Os modelos de espaco de estados, tambem conhecidos como modelos dinamicos, tem
sido amplamente utilizados nos ultimos anos para tratar de dados com dependencia tem-
poral sob enfoque bayesiano. Essa classe de modelos e bastante flexıvel, permitindo efeitos
latentes estaticos e dinamicos sobre a resposta. A dinamica de tais efeitos e determinada
por uma matriz de evolucao que pode depender de hiperparametros, em geral, desco-
nhecidos. Nessas circunstancias, e fundamental a inferencia sobre tais parametros, uma
vez que eles determinam a dinamica de processos latentes que por sua vez descreverao o
comportamento da variavel resposta ao longo do tempo.
Nos modelos dinamicos em que a variavel resposta e um membro da famılia exponen-
cial e nao ha parametros desconhecidos na matriz de evolucao, West et al. (1985) des-
crevem metodologia sequencial de inferencia para os estados (feita em termos de media
e matriz de covariancias), propondo especificacao da sequencia de variancias de evolucao
via fatores de desconto. Em contextos onde existem parametros a serem estimados na ma-
1
triz de evolucao, Pole (1988) e Pole e West (1990) propoem a estimacao sequencial de tais
parametros utilizando quadratura de Gauss-Hermite, tambem especificando a sequencia
de variancias de evolucao atraves de fatores de desconto, porem somente abordam casos
em que se tem normalidade para a variavel resposta.
Nesta dissertacao, propoe-se um esquema sequencial de inferencia bayesiana em mo-
delos dinamicos na famılia exponencial com hiperparametros na matriz de evolucao. Para
inferir sobre os hiperparametros utilizamos a expansao do vetor de estados e linearizacao
da equacao de evolucao. A variancia de evolucao de componentes dinamicas e suposta
constante e estimada via quadratura de Gauss-Hermite.
A implementacao da metodologia sequencial proposta foi feita em linguagem R (R
Development Core Team, 2008), com utilizacao do pacote fastGHQuad (Blocker, 2014)
para obter os pontos da quadratura de Gauss-Hermite e pesos associados.
A seguir, descreve-se brevemente a estrutura da dissertacao.
No capıtulo 2, apresenta-se conceitos gerais sobre inferencia bayesiana e modelos
dinamicos que servirao como base para o restante da dissertacao. Neste capıtulo, considera-
se modelos dinamicos com resposta pertencente a famılia exponencial e descreve-se em
linhas gerais o procedimento sequencial proposto por West et al. (1985) em tais modelos.
O capıtulo 3 aborda modelos dinamicos nao lineares, apresentando a metodologia
sequencial proposta para estimacao dos estados, dos parametros de nao-linearidade (ou
hiperparametros) que caracterizam a dinamica dos estados e das variancias de evolucao.
As variancias de evolucao sao estimadas via quadratura de Gauss Hermite ou especi-
ficadas via fatores de desconto. A estimacao dos hiperparametros e feita incluindo-os
como componentes do vetor de estados aplicando-se, em seguida, tecnicas de linearizacao
que possibilitam aplicar do esquema sequencial para estimacao dos estados, descrito em
West et al. (1985). Alem disso, descreve-se brevemente dois tipos de processos latentes
(processos autorregressivos e de funcao de transferencia), que serao abordados no estudo
simulado e na aplicacao a dados reais.
O capıtulo 4 consiste num estudo simulado de modelos dinamicos normal, poisson e
binomial com estrutura latente autorregressiva de ordem 1, 2 e 3 aplicando-se a metodolo-
gia sequencial descrita no capıtulo 3. O objetivo e identificar a eficiencia do procedimento
2
sequencial em estimar tais processos, bem como os parametros que os definem.
O capıtulo 5 descreve uma aplicacao a dados reais no contexto de desfechos epide-
miologicos, onde estuda-se a modelagem de efeitos cumulativos de regressoras sobre a
resposta atraves de funcoes de transferencia. Neste capıtulo, faz-se uma comparacao
entre as estimativas obtidas sequencialmente atraves da metodologia proposta neste tra-
balho e obtidas por metodo de Monte Carlo via Cadeias de Markov (MCMC), utilizando
o esquema proposto por Gamerman (1998) e aplicado a esse contexto de funcoes de
transferencia por Alves et al. (2010).
Em seguida, o capıtulo 6 apresenta as conclusoes gerais sobre a metodologia proposta
na dissertacao, descrevendo possıveis extensoes do metodo e aplicacoes para trablhos
futuros.
Por fim, o apendice apresenta a parametrizacao adotada para algumas das distri-
buicoes que aparecem ao longo do texto. Sao elas: beta binomial, binomial negativa,
gama, gama inversa, log normal, t-student com parametros de posicao e escala e t-student
multivariada com posicao e escala.
3
Capıtulo 2
Estimacao bayesiana e modelos
dinamicos
Este capıtulo faz uma breve introducao a inferencia parametrica sob enfoque baye-
siano, apresentando os conceitos basicos referentes a estimacao de parametros e a rea-
lizacao de previsoes. Apresenta-se, em seguida, a classe dos modelos dinamicos (tambem
conhecidos na literatura como modelos de espaco de estados), os quais permitem que um
conjunto de parametros responsaveis pela descricao probabilıstica das observacoes varie
com o decorrer do tempo. Considera-se primeiramente o caso em que a variavel resposta
tem distribuicao normal para, em seguida, tratar do caso mais geral em que a resposta e
um membro da famılia exponencial. O caso em que a evolucao dos parametros do modelo
ocorre de forma nao linear e tratado no capıtulo 3.
2.1 Inferencia bayesiana
Considere Y uma variavel de interesse com distribuicao de probabilidade caracteri-
zada por um vetor de parametros θ. Em geral, visando compreender o comportamento
probabilıstico de Y , obtem-se uma amostra aleatoria y1, . . . , yn dessa variavel, a partir
da qual obtem-se estimativas para θ. A plausibilidade desse procedimento reside no fato
de que os dados observados carregam consigo informacao sobre os parametros θ, sendo
essa informacao traduzida formalmente em termos matematicos pela funcao de verossi-
4
milhanca l(· ; y1, . . . , yn) : Θ→ R+, dada por l(θ ; y1, . . . , yn) = p(y1, . . . , yn | θ), onde
Θ e o espaco parametrico e p(y1, . . . , yn | θ) e a funcao de densidade de (y1, . . . , yn) no
caso em que o vetor e contınuo, ou a funcao de probabilidades quando o vetor e discreto.
A verossimilhanca pode ser vista, portanto, como medida de plausibilidade para o valor
θ ∈ Θ a luz das observacoes (y1, . . . , yn).
Sob o paradigma bayesiano considera-se tambem a informacao subjetiva sobre o ve-
tor parametrico θ. Essa informacao e traduzida matematicamente pela distribuicao de
probabilidades a priori p : Θ→ R+, a qual e especificada previamente a observacao dos
dados, de modo que toda informacao proveniente dos dados esteja contida apenas na
funcao de verossimilhanca.
O Teorema de Bayes, enunciado a seguir, estabelece a relacao entre priori e verossi-
milhanca na composicao da incerteza acerca dos parametros.
Teorema 2.1. (Teorema de Bayes) Sejam θ ∈ Θ o vetor de parametros, p(θ) a densidade
(ou funcao de probabilidade) a priori, e y o vetor de observacoes com verossimilhanca
l(θ;y) = p(y | θ). Entao, a distribuicao a posteriori e dada por
p(θ | y) =p(y | θ)p(θ)∫p(y | θ)p(θ)dθ
∝ p(y | θ)p(θ),
em que o produto p(y | θ)π(θ), bem como qualquer de seus multiplos por funcoes que nao
dependam de θ, e chamado nucleo da distribuicao a posteriori.
A incerteza sobre θ apos a observacao dos dados e representada em termos proba-
bilısticos atraves da distribuicao a posteriori, cuja densidade (ou funcao de probabilidade)
e denotada por p(· | y1, . . . , yn) : Θ→ R+. A partir da distribuicao a posteriori sao cal-
culadas as estimativas pontuais dos parametros e medidas de incerteza referentes ao
processo de estimacao, dentre outras quantidades de interesse possıveis.
5
2.1.1 Estimacao pontual
O processo de estimacao pontual do vetor parametrico θ com dimensao, digamos, p×1
pode ser visto sob o paradigma da teoria da decisao (Migon et al., 2014). O objetivo
e sintetizar a informacao sobre θ em um unico ponto θ do suporte da distribuicao a
posteriori.
Considere Ω o conjunto de todos os valores possıveis para um vetor de observacoes
y = (y1, . . . , yn). Define-se a regra de decisao δ : Ω→ A como a funcao que associa a cada
vetor de observacoes y a decisao δ(y) no espaco das acoes A. Em seguida, especifica-se a
funcao de perda L : A×Θ→ R+ que associa a decisao δ(y) ∈ A uma perda que depende
do verdadeiro valor de θ ∈ Θ. Por fim, define-se a funcao de risco R(δ) = E[L(δ,θ) | y],
que representa a perda esperada quando se adota a decisao δ = δ(y).
O objetivo e, dadas a funcao de perdas L e as observacoes y, tomar a decisao otima
δ = δ(y) que minimiza o risco R(δ) = E[L(δ,θ) | y]. A regra de decisao otima e
conhecida em pelo menos 3 importantes casos:
• Perda quadratica: L(δ,θ) = (δ − θ)′(δ − θ). A decisao otima e a media a pos-
teriori δ = θ = E(θ | y).
• Perda absoluta: L(δ,θ) = ‖δ − θ‖.A decisao otima e a mediana a posteriori:
δ = θ = med, onde P (θ < med | y) = 0, 5. Aqui, quando θ e multidimensional,
a desigualdade θ < med significa que cada entrada de θ e menor que a respectiva
entrada do vetor med.
• Perda 0− 1:
L(δ,θ) = I(δ = θ) =
1 se δ = θ,
0 se δ 6= θ.
A decisao otima nesse caso e a moda a posteriori δ = θ = arg maxθ∈Θ
p(θ | y).
6
2.1.2 Estimacao por intervalo
Em muitos problemas praticos, existe interesse nao apenas em estimativas pontuais
dos parametros, mas tambem na incerteza associada a essas medidas. Dessa forma, tem-
se o interesse em considerar alguma medida resumo da posteriori que seja capaz de refletir
a incerteza associada ao procedimento de estimacao pontual. No caso, uma possibilidade
e realizar estimacao atraves de intervalos de credibilidade a posteriori.
Uma regiao C ⊂ Rp e dita regiao de credibilidade com probabilidade γ a posteriori
para θ se P (θ ∈ C | y) = γ, onde p e a dimensao de θ. No caso θ unidimensional, refere-
se a C como intervalo de credibilidade. Alem disso, no caso em que p > 1, costuma-se
reportar intervalos de credibilidade marginais unidimensionais para cada componente do
vetor de estados θ.
2.1.3 Aspecto sequencial do Teorema de Bayes
O Teorema de Bayes pode tambem ser visto sob o aspecto sequencial, segundo o
qual cada observacao e incorporada em sequencia a informacao a priori para compor a
distribuicao a posteriori. Mais especificamente, denotando o vetor de observacoes por
y = (y1, y2, ..., yn), temos no instante zero a distribuicao a priori p(θ). Incorporada a
primeira observacao y1 a informacao a priori, atualiza-se a incerteza a respeito de θ
atraves do Teorema de Bayes, obtendo assim a distribuicao a posteriori no tempo 1:
p(θ | y1) ∝ p(y1 | θ)p(θ)
Agora, no instante 2, toda a informacao previa a respeito de θ (representada pela
posteriori no instante 1: p(θ | y1)) e considerada informacao a priori e, ao ser combinada
com a observacao no tempo corrente, resulta na posteriori no instante 2:
p(θ | y1, y2) ∝ p(y2 | θ, y1)p(θ | y1) = p(y2 | θ)p(θ | y1),
onde a igualdade ocorre quando se supoe independencia entre as observacoes dado o
conhecimento do vetor parametrico, o que significa assumir que o vetor parametrico sin-
tetiza toda a informacao necessaria para determinacao do comportamento probabilıstico
7
de yi. Em outras palavras, o conhecimento de yj , para qualquer j 6= i, nao altera em
nada a distribuicao probabilıstica de yi se os parametros sao conhecidos.
Prosseguindo com o mesmo raciocınio, tem-se no tempo n a relacao de recorrencia
p(θ | y1, ..., yn) ∝ p(yn | θ)p(θ | yn−1, ..., y1),
que permite chegar a formula enunciada no Teorema de Bayes:
p(θ | y1, ..., yn) ∝ p(yn | θ)p(yn−1 | θ)...p(y1 | θ)p(θ)
= p(y | θ)p(θ),
onde a igualdade novamente ocorre quando se supoe independencia entre as observacoes
condicionalmente ao vetor parametrico. Portanto, a distribuicao a posteriori obtida se-
quencialmente e a mesma que se obtem com uma unica aplicacao do Teorema de Bayes
considerando o vetor completo y = (y1, ..., yn).
Nesse ponto, cabe uma breve consideracao sobre a notacao que por vezes sera usada
ao longo deste trabalho no que se refere a atualizacao sequencial de informacao segundo
a otica bayesiana. Considera-se D0 o conjunto contendo a informacao necessaria para
compor a distribuicao a priori p(θ). Recursivamente, tem-se no instante t o conjunto
Dt−1 representando toda informacao disponıvel a priori, ou seja, ate o instante t − 1.
Com a chegada de uma nova observacao yt, tem-se Dt = yt ∪ Dt−1 no caso em que
nao se deseja incorporar nenhuma informacao externa aos dados do instante t − 1 para
o instante t. Portanto, em problemas onde se utiliza de informacao subjetiva apenas no
instante previo a observacao do primeiro dado y1, tem-se Dt = y1, . . . , yt ∪D0.
2.1.4 Previsoes
A distribuicao preditiva e um objeto probabilıstico que permite nao so fazer previsoes
como tambem avaliar a adequacao do modelo teorico formulado pelo estatıstico, pois
permite verificar se o modelo obtido e capaz de reproduzir dados proximos dos que foram
observados sob o ponto de vista preditivo.
8
A distribuicao preditiva para um vetor de dados nao observados z a partir do con-
junto de observacoes y e a funcao densidade (ou funcao de probabilidade) dada por
p(z | y) =
∫Θp(z | θ)p(θ | y)dθ = Eθ|y [p(z | θ)] .
A distribuicao preditiva para z pode ser interpretada como uma media dos valores de
l(θ; z) = p(z | θ) ponderados pela posteriori p(θ | y). Neste ponto, e importante obser-
var que a predicao feita desta forma esta condicionada apenas ao vetor de observacoes,
sem nenhuma dependencia analıtica com respeito ao vetor parametrico.
2.1.5 Estimador linear de Bayes
Conforme visto na subsecao 2.1.1, fixada uma funcao de perda, a teoria da decisao
fornece o estimador otimo para o vetor parametrico θ procurando dentre todas as funcoes
dos dados, que aqui representamos por δ = δ(y), aquela que minimiza o risco a posteriori
R(δ) = E[L(δ,θ) | y].
Existem casos em que nao se conhece a forma analıtica do estimador otimo de θ
segundo o criterio de minimizacao do risco a posteriori, mesmo quando se utiliza uma
das funcoes de perda apresentadas na subsecao 2.1.1. Isso pode ocorrer, por exemplo,
quando nao se tem forma analıtica disponıvel para a densidade posteriori p(θ | y) e, por
consequencia, nao se consegue obter a media, moda ou mediana para θ | y.
Nessas circunstancias, o processo de estimacao linear de Bayes fornece uma apro-
ximacao para a solucao otima dada pela teoria da decisao quando se considera a funcao
de perda quadratica. O procedimento, ao inves de minimizar o risco a posteriori sob
todas as possıveis funcoes dos dados, minimiza o risco a priori E[L(δ,θ)], restringindo-se
as decisoes a funcoes lineares d(y) do vetor de observacoes. O estimador obtido dessa
forma recebe o nome de estimador linear de Bayes, e sua perda quadratica e usada como
aproximacao para a variancia a posteriori de θ.
9
Proposicao 2.1. (Estimador Linear de Bayes) O estimador linear de Bayes para θ e
a funcao linear das observacoes d = d(y) que minimiza a perda quadratica esperada a
priori E[(θ − d)′(θ − d)].
Em suma, o estimador linear de Bayes pode ser visto como uma aproximacao linear
para a funcao δ(y) = E(θ | y) e o risco associado ao estimador linear de Bayes constitui
uma aproximacao para V ar(θ | y).
A obtencao de estimadores lineares de Bayes e parte essencial do procedimento de in-
ferencia sequencial em modelos dinamicos descrito na secao 2.2. Em particular, utiliza-se
a proposicao a seguir, cuja demonstracao pode ser vista em West e Harrison (1997).
Proposicao 2.1. Suponha um vetor aleatorio (θ,y) com vetor de medias e matriz de
covariancias dados por
yθ
∼f
a
,
Q S′
S R
.
Nesse caso, o estimador linear de Bayes para θ e d = d(y) = a + SQ−1(y − f) e a
perda quadratica esperada para esse estimador e R − SQ−1S′. Naturalmente, o valor
R − SQ−1S corresponde a menor perda esperada a priori sob funcoes lineares das ob-
servacoes y.
Note-se que, sob normalidade da distribuicao conjunta (y,θ), o estimador linear de
Bayes para θ coincide com a esperanca a posteriori E(θ | y) e o risco associado coincide
com a variancia a posteriori V ar(θ | y).
10
2.2 Modelos dinamicos
Os modelos dinamicos, tambem conhecidos como modelos de espaco de estados, assu-
mem que a cada tempo t ∈ N a observacao yt e caracterizada probabilisticamente por um
vetor de parametros θt (denominado vetor de estados) cujas componentes podem variar
ao longo do tempo.
2.2.1 Modelos lineares dinamicos
Um modelo linear dinamico (MLD) em sua forma geral e descrito por duas equacoes:
a equacao de observacao, que descreve a relacao entre covariaveis e a variavel resposta, e
a equacao de evolucao, que descreve a forma com que os parametros do modelo evoluem
com o tempo:
yt = F ′tθt + vt, vt ∼ N(0, Vt)
θt = Gtθt−1 +wt, wt ∼ N(0,W t), (2.1)
sendo (vt)t∈N e (wt)t∈N sequencias de variaveis aleatorias tais que vt⊥vs, e wt⊥ws, ∀t 6=
s. Alem disso, vt⊥ws,∀s, t. O erro vt e chamado erro de observacao e wt e chamado
erro de evolucao.
Um MLD e, portanto, caracterizado pela quadrupla (F t,Gt, Vt,W t), onde:
• F t e o vetor de planejamento no tempo t, com valores conhecidos que podem conter
variaveis explicativas: F t = (x1t, . . . , xpt)′;
• yt e a resposta observada no tempo t;
• θt e o vetor parametrico no tempo t: θt = (θ1t, . . . , θpt)′;
• Gt e a matriz de evolucao no tempo t (dimensao p× p).
11
As variancias Vt e W t controlam a magnitude dos erros de observacao e de evolucao,
respectivamente. Quanto maiores os valores na posicao i, i ∈ 1, . . . , p da diagonal das
matrizes de covariancias W t, t ∈ 1, . . . , p, mais volatil e a trajetoria da componente
θi,t do vetor de estados θt ao longo do tempo, e quanto maiores os valores de Vt, maior
e a variabilidade das observacoes em torno do preditor linear ηt = F ′tθt que, no caso
normal, coincide com a media da variavel resposta: E(yt) = µt = ηt.
A classe MLD abrange varios tipos de modelos importantes, como os Modelos de Re-
gressao Linear Normais (F t,Gt = I, Vt = σ2,W t = 0) e os Modelos de Series Temporais
(F t = F ,Gt = G, Vt,W t).
Sob o enfoque Bayesiano necessita-se ainda especificar as distribuicoes a priori para
os parametros de interesse de modo a completar a descricao do modelo. Adotando priori
normal para θ1 e conhecidos Vt e W t, tem-se forma analıtica fechada para as posterioris
θt | Dt, t = 1, 2, . . . , conforme analise bayesiana sequencial do modelo (2.1) dada pelas
equacoes a seguir, em que θt−1 | Dt−1 ∼ N(mt−1,Ct−1).
Priori no tempo t: θt | Dt−1 ∼ N(at,Rt),at = Gtmt−1
Rt = GtCt−1G′t +W t,
Preditiva no tempo t: yt | Dt−1 ∼ N(ft, Qt),ft = F ′tat
Qt = F ′tRtF t + Vt,
Vetor de coeficientes adaptativos At e erro de previsao et:At = RtF tQ−1t
et = yt − ft,
Posteriori no tempo t: θt | Dt ∼ N(mt,Ct),mt = at +Atet
Ct = Rt −AtA′tQt.
12
Note-se, a partir das equacoes, que yt nao consta na expressao analıtica de nenhuma
das variancias Rt, Qt, Ct, portanto, as variancias a posteriori diag(Ct) decrescem em
funcao apenas da quantidade de observacoes contida no vetor de dados, independente-
mente dos particulares valores observados para yt.
Nessas circunstancias tem-se conjugacao para o vetor de estados, portanto θt | Dt e
θt | Dt−1 tem distribuicao normal ∀t ∈ N e as preditivas yt | Dt−1 tambem sao obtidas
analiticamente e possuem distribuicao normal.
Tambem e possıvel obter forma analıtica fechada para as posterioris via conjugacao no
caso em que Vt = V, ∀t ∈ N com V desconhecido. Nessas circunstancias, obtem-se con-
jugacao adotando priori Normal-Gama (West e Harrison, 1997) para o vetor (θt, τ) | Dt,
onde τ = 1/V . Marginalmente, o vetor de estados θt tem distribuicao T-Student multi-
variada (tanto a priori quanto a posteriori) e a precisao dos erros de observacao τ | Dt
tem distribuicao Gama. As equacoes do procedimento sequencial bayesiano para o caso
em que V e desconhecido estao descritas a seguir, onde V | Dt−1 ∼ GamaInv(nt−1
2, dt−1
2)
e θt−1 | Dt−1 ∼ N(mt−1,Ct−1). Esse conjunto de equacoes consta em West e Harrison
(1997) pp. 119 a 122.
Priori no tempo t: θt | Dt−1 ∼ Tnt−1(at,Rt),at = Gtmt−1
Rt = GtCt−1G′t +W t,
(2.2)
Preditiva no tempo t: yt | Dt−1 ∼ Tnt−1(ft, Qt), (St−1 = dt−1/nt−1)ft = F ′tat
Qt = F ′tRtF t + St−1,
(2.3)
Vetor de coeficientes adaptativos At e erro de previsao et:At = RtF tQ−1t
et = yt − ft,(2.4)
Variancia observacional a posteriori: V | Dt ∼ GamaInv(nt2, dt
2),
13
nt = nt−1 + 1
dt = dt−1 + St−1e2t/Qt,
(2.5)
Posteriori no tempo t: θt | Dt ∼ Tnt(mt,Ct), (St = dt/nt)mt = at +Atet
Ct = (Rt −AtA′tQt)St/St−1.
(2.6)
No caso em que se desconhece as variancias de evolucao, as posterioris marginais
(tanto para os estados quanto para a variancia observacional) nao sao mais conhecidas
analiticamente. Existem diversas propostas na literatura para tratar deste caso, dentre
as quais cita-se aqui apenas algumas delas a tıtulo de exeplificacao. Fruhwirth-Schnater
(1994) e Carter e Kohn (1994) descrevem um esquema MCMC para o caso em que V eW
sao constantes no tempo onde as condicionais completas de V , W e θt sao conhecidas,
permitindo assim a simulacao de cadeias atraves do amostrador de Gibbs. Posterior-
mente, Gamerman (1998) descreve outro amostrador de Gibbs obtido reparametrizando
o modelo em termos dos erros de evolucao wt, reconstruindo-se o vetor de estados θt ao
final da geracao das cadeias. No que tange aplicacao de metodologia sequencial, diversos
esquemas para implementacao de filtros de partıculas podem ser considerados, dentre os
quais cita-se aqui Liu e West (2001), Storvik (2002) e Carvalho et al. (2010) por tratarem
do caso geral em que θt contem, possivelmente, componentes estaticas e as variancias
V e W sao desconhecidas. Cada um dos tres trabalhos propoe uma forma diferente de
tratar o problema de degeneracao das partıculas conforme o tempo progride.
E possıvel incorporar aos modelos dinamicos diversos tipos de estruturas latentes para
descrever a evolucao do processo observado yt. Essa classe de modelos permite tratar,
por exemplo, de series que apresentem simultaneamente uma tendencia polinomial linear,
sazonalidade, influencia de covariaveis e assim por diante. Mais precisamente, cada uma
das p estruturas latentes corresponde a um bloco θi,t de componentes do vetor de estados,
a uma matriz de evolucao Gi,t, a uma matriz de planejamento F i,t e uma matriz de
covariancias W i,t, de modo que o modelo dinamico constituıdo por F t = (F 1, ...,F p)t,
Gt = BlocoDiag(G1, ...,Gp)t, W t = BlocoDiag(W 1, ...,W p)t com vetor de estados θt =
14
(θi, ...,θp)t incorpora simultaneamente todas as p estruturas latentes. Para uma descricao
mais detalhada quanto a especificacao deGi,t, F i,t eW i,t para diversos tipos de estruturas
latentes, referencia-se West e Harrison (1997) capıtulos 6 a 9.
O exemplo a seguir considera um MLD com um unico componente no vetor de estados
com dinamica dada por um processo autorregressivo.
Exemplo 2.1. Considere o MLD dado pela quadrupla 1, φ, Vt,Wt, onde Vt, Wt e φ
sao conhecidos:
yt = θt + vt, vt ∼ N(0, Vt)
θt = φθt−1 + wt, wt ∼ N(0,Wt).
As equacoes de atualizacao aplicadas ao MLD 1, φ, Vt,Wt resultam em
at = φmt−1
Rt = φ2Ct−1 +Wt,
ft = at = φmt−1,
Qt = Rt + Vt,
At =Rt
Rt + Vt,
et = yt − φmt−1,
mt = φmt−1 +Rt
Rt + Vt(yt − φmt−1)
Ct = AtVt.
No caso especıfico do modelo tratado no exemplo 2.1, e possıvel obter facilmente
expressoes analıticas para o limite da sequencia de variancias a posteriori (Ct)t∈N, se
(Vt)t∈N e (Wt)t∈N sao sequencias convergentes, como aponta a Proposicao 2.2 a seguir.
Proposicao 2.2. Considere o MLD dado pela quadrupla 1, φ, Vt,Wt, onde Vt e Wt
sao conhecidos ∀t ∈ N. Suponha que limt→∞ Vt = V > 0 e limt→∞Wt = W > 0. Se a
15
sequencia Ct converge, entao seu valor limite e
C =−(W + V − φ2V ) +
√(V +W + φ2V )2 + 4φWV
2φ2.
Demonstracao. No MLD 1, φ, Vt,Wt, tem-se
Ct = AtVt =RtVtRt + Vt
=(φ2Ct−1 +Wt)Vtφ2Ct−1 +Wt + Vt
.
Supondo limWt = W e limVt = V e que ∃C = limCt, tem-se
C =(φ2C +W )V
φ2C +W + V,
donde φ2C2 + (W + V )C − φ2CV −WV = 0. Resolvendo para C, obtem-se
C =−(W + V − φ2V )±
√(W + V − φ2V )2 + 4φ2WV
2φ2.
Como C ≥ 0, segue que o unico limite possıvel para Ct e
C =−(W + V − φ2V ) +
√(W + V − φ2V )2 + 4φ2WV
2φ2.
Cabe citar aqui o Teorema 2.3 em West e Harrison (1997), que garante que a sequencia
Ct de variancias a posteriori converge em qualquer MLD com vetor de estados unidimen-
sional, desde que as variancias (observacionais e de evolucao) sejam constantes e conhe-
cidas. Sendo esse o caso, a Proposicao 2.2 fornece explicitamente o limite de Ct no caso
particular em que Gt = φ, ∀t ∈ N.
O comportamento assintotico explicitado na Proposicao 2.2 pode ser verificado em-
piricamente, como ilustrado pela figura 2.1 para uma serie simulada com φ = 1 e outra
com φ = 0, 8. Verifica-se que o comportamento limite para as variancias a posteriori e
alcancado rapidamente. A partir de 20 observacoes, praticamente nao se observa dimi-
nuicao na incerteza a respeito do processo autorregressivo latente. A partir de tal ponto,
16
as observacoes acrescentam informacao apenas na media das estimativas pontuais de θt,
permitindo-as acompanhar as variacoes na trajetoria efetiva do processo latente θt. A
distribuicao a priori adotada e θ1 | D0 ∼ N(0, 100).
0 20 40 60 80 100
02
46
810
t
Ct
C
(a) φ = 1
0 20 40 60 80 100
−10
−5
05
10
t
mt
mt ± 2 × Ct
(b) φ = 1
0 20 40 60 80 100
01
23
45
6
t
Ct
C
(c) φ = 0.8
0 20 40 60 80 100
−5
05
10
t
mt
mt ± 2 × Ct
(d) φ = 0.8
Figura 2.1: Estimacao de θt ∼ AR(1) em MLD1, φ, V,W com φ,W e V conhecidos.
mt = E(θt | Dt), Ct = V ar(θt | Dt). A esquerda, exibe-se a sequencia Ct juntamente com
o valor limite C dado pela Proposicao 2.2. A direita, exibe-se a sequencia de estimativas
e intervalos de credibilidade a posteriori para os estados.
2.2.2 Modelos lineares generalizados dinamicos
Os Modelos Lineares Generalizados Dinamicos permitem descrever o comportamento
probabilıstico de observacoes yt, cujo indıce t geralmente se refere a uma determinada
unidade de tempo, segundo uma distribuicao pertencente a famılia exponencial, com
17
parametros variando com o passar do tempo. A classe MLGD e uma extensao dos
chamados Modelos Lineares Generalizados (MLG) (Nelder e Wedderburn, 1972) devido
a evolucao temporal dos parametros de estado θt que descrevem o preditor linear ηt. Em
termos praticos, considerar um MLGD para observacoes yt permite que os efeitos latetes
sobre a variavel resposta se diferenciem ao longo do tempo.
Mais precisamente, um MLGD e descrito por 3 equacoes:
p(yt | ψt) = exp(V −1t [ft(yt)ψt − a(ψt)]
)bt(yt, Vt) (2.7)
ηt = g(ψt) = F ′tθt (2.8)
θt = Gtθt−1 + ωt, ωt ∼ [0,W t] (2.9)
onde a equacao (2.7) representa a densidade ou funcao de probabilidade das observacoes
yt como membro da famılia exponencial, a equacao (2.8) relaciona o parametro natural ψt
e o preditor linear ηt atraves da funcao de ligacao g, descrevendo o preditor linear como
funcao linear dos estados θt e, por fim, a equacao (2.9), chamada equacao de evolucao,
descreve a dinamica do vetor de estados de maneira linear determinada pela matriz de
evolucao Gt.
Em geral, ao longo do texto, usaremos a notacao x ∼ [a, b] para indicar que a
variavel aleatoria (vetor aleatorio) x tem media (vetor de medias) a e variancia (ma-
triz de variancia) b, como no caso da equacao (2.9). Usaremos tambem os termos matriz
de variancia e matriz de covariancias de forma indistinta, uma vez que tal matriz pode
ser vista como uma generalizacao do conceito de variancia para vetores aleatorios (por
isso matriz de variancia), bem como suas entradas representam as covariancias dois a dois
entre as respectivas componentes do vetor aleatorio (por isso matriz de covariancias).
Com respeito a estimacao bayesiana de parametros em MLGD, as equacoes (2.2),
(2.3), (2.4), (2.5) e (2.6) fornecem solucao analıtica no caso particular em que a resposta
e normal (e portanto, tem-se em particular um Modelo Linear Dinamico), a variancia de
observacao e conhecida e as variancias dos erros de evolucao sao desconhecidas. No caso
geral em que a resposta pertence a qualquer membro da famılia exponencial, West et al.
(1985) descrevem uma metodologia sequencial para inferencia em MLGD, que se da em
termos de primeiro e segundo momentos para os estados fazendo uso do procedimento
18
de estimacao linear de Bayes. Ainda nesse contexto de modelos dinamicos parcialmente
especificados, distribuicoes preditivas podem ser obtidas analiticamente, bem como dis-
tribuicoes a posteriori para os parametros naturais, desde que utilizadas distribuicoes
a priori conjugadas. A necessidade de metodos alternativos para inferencia se da em
funcao da estimacao dos estados e demais parametros, tais como variancias de evolucao
e quantidades desconhecidas na matriz Gt.
2.2.3 Procedimento sequencial de inferencia em MLGD
Um procedimento para realizar inferencia na classe dos MLGD com variancias W t co-
nhecidas de forma sequencial e apresentado em West et al. (1985). Tal metodologia nao
especifica de forma completa (isto e, fixando-se uma classe de distribuicoes especıfica) os
vetores dos erros de evolucao, mas apenas por meio de um vetor de medias e das matrizes
de variancia W t.
A especificacao parcial via 1o e 2o momentos para o vetor de erros de evolucao se
estende para o vetor de estados, cujas posterioris a cada tempo sao obtidas apenas via
media e matriz de covariancias.
O esquema iterativo a seguir resume o procedimento inferencial que permite obter
vetor de medias e matriz de variancia da distribuicao a posteriori e os parametros da
distribuicao preditiva no tempo corrente como funcao do vetor de medias e matriz de
variancia no tempo imediatamente anterior.
Inicialmente, suponha que a posteriori no tempo t−1 esteja parcialmente especificada
por θt−1 | Dt−1 ∼ [mt−1,Ct−1]. Entao, temos para o tempo t,
1. Priori dos estados: θt | Dt−1 ∼ [at,Rt]
at = Gtmt−1,
Rt = GtCt−1G′t +W t,
2. Priori para o parametro canonico: g−1(ηt) = ψt | Dt−1 ∼ Priori Conj.(rt, st)
3. Preditor a priori: ηt | Dt−1 ∼ [ft, qt]
ηt=F′tθt︷︸︸︷⇒
ft = F ′tat = f1(rt, st),
qt = F ′tRtF t = f2(rt, st),
19
4. Posteriori para o parametro canonico: ψt | Dt ∼ Posteriori Conj.(r∗t , s∗t )
5. Preditor a posteriori: ηt = g(ψt) | Dt ∼ [f ∗t , q∗t ]
f ∗t = f1(r∗t , s∗t ),
q∗t = f2(r∗t , s∗t ),
6. Posteriori dos estados (tempo t): θt | Dt ∼ [mt,Ct]
mt = at +RtF t(f∗t − ft)/qt,
Ct = Rt −RtF tF′t(1− q∗t /qt)/qt.
Primeiramente, no item 1, obtem-se media e matriz de variancia a priori para θt a
partir das mesmas quantidades referentes a posteriori de θt−1.
O item 2 consiste em especificar priori conjugada para o parametro canonico ψt (para-
metrizada por quantidades rt e st) segundo a teoria de conjugacao na famılia exponencial
(Migon et al., 2014).
A passagem entre os itens 2 e 3 consiste em calcular os momentos a priori (ft, qt)
para o preditor linear ηt a partir dos momentos a priori (at, Rt) para o vetor de estados
θt utilizando-se da relacao linear ηt = F ′tθt.
Como preditor e parametro canonico estao relacionados (nao-linearmente) de forma
determinıstica pela funcao de ligacao g, os parametros rt e st devem ser escolhidos de tal
modo que a media e a variancia a priori de ηt sejam iguais aos valores ft e qt obtidos no
passo 3, de modo a compatibilizar a forma analıtica de p(ηt | Dt−1) com os momentos
obtidos no passo 3. Isso e feito resolvendo o sistema nao-linear em 3, o que, em geral,
nao pode ser feito analiticamente. O que se recomenda em West et al. (1985) e West e
Harrison (1997) e tomar alguma aproximacao para as funcoes f1 e f2 de tal modo que o
novo sistema seja possıvel de ser resolvido analiticamente. Nesse trabalho, para obtencao
de f1 e f2, utilizaremos a aproximacao de Taylor de 1a ordem para a funcao g(ψt) para
escrever o preditor linear ηt como funcao linear do parametro canonico ψt, de modo que
media e variancia a priori para ηt sao trivialmente obtidos em funcao da media e variancia
do parametro canonico. Em outras palavras, denotando ψt | Dt−1 ∼ [xt, vt], obtem-se:
20
ft = E(ηt | Dt−1) = E(g(ψt) | Dt−1) ≈ E [g(xt) + g′(xt)(ψt − xt)]
= g(xt). (2.10)
qt = V ar(ηt | Dt−1) ≈ V ar [g(xt) + g′(xt)(ψt − xt)]
= g′(xt)2vt (2.11)
Por fim, a conjugacao especificada desta forma e responsavel por garantir, a cada
tempo t, que a posteriori para o parametro canonico ψt tenha forma analıtica conhecida,
bem como a distribuicao preditiva p(yt | Dt−1).
Note-se pelos passos 3, 4 e 5 que o parametro canonico poderia ser substituıdo nesse
esquema sequencial por qualquer outro parametro que caracterizasse a distribuicao dos
dados na famılia exponencial, desde que se consiga encontrar conjugacao da priori com
a funcao de verossimilhanca. Dessa forma, pode-se utilizar, por exemplo, a media µt =
E(yt | ψt) no lugar do parametro canonico ψt nos casos em que essa escolha for mais
conveniente do ponto de vista analıtico.
O passo 6 conclui o procedimento sequencial obtendo media e matriz de covariancias
a posteriori para os estados. Essa passagem faz uso da proposicao 2.1 para obter o
estimador linear de Bayes para θt como funcao de Dt−1 e ηt a partir do vetor de medias
e matriz de covariancias da distribuicao a priori conjunta
ηt
θt
∣∣∣∣∣∣ Dt−1
∼f t
at
,
qt F ′tRt
F tR′t Rt
,
que se obtem facilmente a partir da relacao ηt = F tθt. Conforme enunciado na Pro-
posicao 2.1, o estimador linear de Bayes at +RtF t(ηt− ft)/qt pode ser visto como uma
aproximacao para E[θt | ηt, Dt−1] e o risco associado Rt −RtF tF′tRt/qt constitui uma
aproximacao para V ar[θt | ηt, Dt−1].
A media e matriz de covariancias incondicionais de θt a posteriori sao obtidas fazendo
E(θt | Dt) = E[E(θt | ηt, Dt−1) | Dt]
21
V ar(θt | Dt) = V ar[E(θt | ηt, Dt−1) | Dt] + E[V ar(θt | ηt, Dt−1) | Dt],
donde obtem-se
mt = E(θt | Dt) = at +RtF t(f∗t − ft)/qt,
Ct = V ar(θt | Dt) = Rt −RtF tF′t(1− q∗/qt)/qt.
A seguir, explicita-se as contas necessarias para realizacao dos passos 2 a 5 descri-
tos nessa secao aos modelos com resposta Binomial e Poisson que serao utilizados nas
aplicacoes nos capıtulos 4 e 5.
Modelo Poisson
Escrevendo a distribuicao Poisson como membro da famılia exponencial, tem-se
p(yt | µt) = expytlogµt − µt(yt!)−1
, onde µt = E(ytµt) e portanto ψt = log µt = ηt, onde ηt representa o preditor linear e ψt
representa o parametro canonico da famılia exponencial.
Especificamos priori conjugada para λt ao inves do parametro canonico ψt. Entao λt |
Dt−1 ∼ Gama(rt, st) e a funcao g que aparece em (2.10) e (2.11) e a funcao logarıtmica.
Assim, escrevendo xt = E(λt | Dt−1) e vt = V ar(λt | Dt−1) temos o sistema
ft = g(xt) = log rtst,
qt = g′(xt)2vt = 1
rt,
cuja solucao e st = e−ftqt
e rt = 1qt
.
Pela conjugacao na famılia exponencial, temos λt | Dt ∼ Gama(r∗t , s∗t ), onde r∗t =
rt + yt e s∗t = st + 1. Assim,
f ∗t = logr∗ts∗t,
q∗t = 1r∗t,
22
Por fim, resolvendo a integral
∫ ∞0
p(yt | λt, Dt−1)p(λt | Dt−1)dλt,
temos a distribuicao preditiva: yt | Dt−1 ∼ BinNeg(rt, 1/(st + 1)).
Modelo Binomial
Escrevendo yt ∼ Bin(nt, pt) como membro da famılia exponencial, tem-se
p(yt | ηt) = exp
ytnt
logpt
1− pt− log
1
1− pt
(ntyt
)portanto ψt = log pt
1−pt = ηt, onde ηt representa o preditor linear e ψt representa o
parametro canonico da famılia exponencial.
Aqui, o parametro canonico ψt coincide com o preditor linear no caso em que se
utiliza a funcao logito como funcao de ligacao. Nesse caso, podemos especificar priori
conjugada para a probabilidade de sucesso pt | Dt−1 ∼ Beta(rt, st) e a funcao g que
aparece em (2.10) e (2.11) e a funcao logito. Assim, escrevendo xt = E(pt | Dt−1) e
vt = V ar(pt | Dt−1) temos o sistema
ft = g(xt) = log rtst,
qt = g′(xt)2vt = (rt+st)2
rtst(rt+st+1),
cuja solucao e st = eft+e−ft+2−qtqt(eft+1)
e rt = eftst.
Pela conjugacao na famılia exponencial, temos pt | Dt ∼ Beta(r∗t , s∗t ), onde r∗t = rt+
ytnt
e s∗t = st + 1− ytnt
. Assim,
f ∗t = logr∗ts∗t,
q∗t =(r∗t+s
∗t )
2
r∗t s∗t (r∗t+s
∗t+1)
,
23
Resolvendo a integral
∫ ∞0
p(yt | pt, Dt−1)p(pt | Dt−1)dpt,
temos a distribuicao preditiva: yt | Dt−1 ∼ BetaBinomial(nt, rt, st).
2.3 Especificacao dos erros de evolucao via fatores
de desconto
De acordo com as equacoes de atualizacao no contexto dos modelos dinamicos com res-
posta na famılia exponencial exibidas na subsecao 2.2.3, os erros de evolucao wt influem
na estimacao de θt unicamente atraves do aumento da incerteza sobre θt ao passar do
tempo t−1 (priori) para t (posteriori) com o acesso a uma nova observacao yt. De fato, se
nao existisse a sequencia de erros wt, ou equivalentemente se tivessemos W t = 0,∀t ∈ N,
a unica alteracao a ser feita seria na equacao Rt = GtCt−1G′t +W t, que daria lugar a
Rt = GtCt−1G′t.
Tratando primeiramente o caso W t escalar (denotando portanto Wt ao inves de W t),
esse acrescimo de incerteza devido a adicao de Wt pode ser alternativamente representado
pelo produto
Rt =1
δ×GtCt−1G
′t,
onde δ ∈ (0, 1]. Assim, a quantidade δ denominada fator de desconto, garante equi-
valencia entre as duas formas alternativas de inflacao de incerteza, se fizermos
Rt = GtCt−1G′t +Wt =
1
δ×GtCt−1G
′t,
donde
24
Wt =
(1
δ− 1
)×GtCt−1G
′t
=
(1− δδ
)×GtCt−1G
′t.
Portando, o uso de fatores de desconto faz com que o papel da variancia Wt seja gerar
um acrescimo multiplicativo de 1−δδ
sobre GtCt−1G′t = Var(Gtθt−1 | Dt−1) para compor a
variancia a priori Rt.
Usualmente, os valores especificados para o fator de desconto δ variam entre 0.9 e 1
(nesse ultimo caso, temos uma evolucao determinıstica para θt onde, no caso particular
em que Gt = 1, temos θt constante), representando um acrescimo percentual de 0 a
11% sobre Var(Gtθt−1 | Dt−1) para compor Var(θt | Dt−1). Valores muito menores do
que 0.9 para δ sao usados no contexto de analise de intervencao nos instantes em que se
anteve alguma mudanca estrutural na serie observada. Tal medida aumenta a incerteza a
priori para θt+1 | Dt, fazendo com que a observacao yt+1 tenha peso muito maior sobre as
estimativas para θt+1 | Dt+1 e, com isso, as estimativas conseguem acompanhar mudancas
bruscas no nıvel da serie. Para maiores detalhes, ver West e Harrison (1997) capıtulo 11.
No caso mais geral em que θt e um vetor p-dimensional, existe mais de um modo de
especificar diferentes valores para os fatores de desconto associados as componentes do
vetor de estados. Pode-se considerar um fator de desconto diferente para cada entrada
de θ, calculando P t = GtCt−1G′t e multiplicando o i-esimo valor da sua diagonal por
1/δi, com δi ∈ (0, 1]. Uma segunda abordagem consiste em definir uma matriz ∆ =
diag(1/√δi, ..., 1/
√δp) e fazer Rt = ∆GtCt−1G
′t∆. Por fim, no caso em que Gt =
BlocoDiag(G1, ...,Gk)t, pode-se ainda considerar um fator de desconto para cada bloco
estrutural multiplicando cada bloco da matriz P t = GtCt−1G′t por 1/δi, i ∈ 1, ..., k.
No capıtulo seguinte, apresenta-se os modelos dinamicos nao lineares, que permitem
a existencia de hiperparametros que caracterizam a matriz de evolucao Gt. Alem disso,
descreve-se uma metodologia capaz de estimar esses hiperparametros juntamente com os
parametros de estado de modo sequencial. Propoe-se duas formas de tratar das variancias
de evolucao: primeiramente, especificando-as atraves de fatores de desconto e a segunda,
estimando uma variancia fixa via quadratura de Gauss-Hermite.
25
Capıtulo 3
Inferencia sequencial em modelos
dinamicos nao lineares
No capıtulo 2, foram apresentados os modelos dinamicos lineares com resposta normal
(MLD) e, no caso mais geral, com resposta na famılia exponencial. Nos casos menciona-
dos, considera-se a matrizGt, que governa a evolucao dos estados, conhecida. Entretanto,
modelos considerando quantidades desconhecidas na matriz de evolucao tem sido propos-
tos, bem como metodologias para estimacao dessas quantidades. Por exemplo, Franco
et al. (2015) discutem estimacao bayesiana de parametros autorregressivos no contexto
da classe parameter driven models (Cox et al., 1981), que incluem erros autorregressi-
vos na equacao do preditor linear no caso em que a variavel resposta tem distribuicao
Poisson. A estimacao classica dos parametros desse modelo e abordada em Zeger et al.
(1988).
Dentre os mais diversos exemplos de modelos dinamicos em que a matriz de evolucao e
caracterizada por hiperparametros, destaca-se aqui os modelos de funcao de transferencia
e os processos autorregressivos.
3.1 Modelos dinamicos nao lineares
Modelos dinamicos nao lineares com resposta na famılia exponencial sao uma extensao
dos modelos lineares generalizados dinamicos devido a presenca de hiperparametros que
26
caracterizam a matriz de planejamento F t ou a matriz de transicao Gt. Conhecidos esses
hiperparametros, tem-se um MLGD.
Mais especificamente, um modelo dinamico nao linear com resposta na famılia expo-
nencial e definido pelo conjunto de equacoes
p(yt | ψt) = exp(V −1t [ft(yt)ψt − a(ψt)]
)bt(yt, Vt) (3.1)
ηt = g(ψt) = F ′t(Ψ)θt (3.2)
θt = Gt(φ)θt−1 + ωt, ωt ∼ [0,W t] (3.3)
que sao simplesmente as equacoes (2.7), (2.8) e (2.9) onde tanto F t quato Gt podem
depender de hiperparametros (Ψ e φ respectivamente), caso esse em que explicita-se a
dependencia dos hiperparametros denotando F t(Ψ) e Gt(φ). Todos os modelos aborda-
dos nesta dissertacao podem ser escritos sem necessidade de incluir parametros na matriz
de planejamento, portanto consideraremos F t conhecida a cada instante t nas secoes e
capıtulos subsequentes.
As proximas duas secoes descrevem exemplos de processos que podem ser incorpora-
dos a um modelo linear generalizado dinamico e que serao utilizados nas aplicacoes do
capıtulo 5, a saber, processos autorregressivos e funcoes de transferencia. Ambas as clas-
ses de processos sao caracterizadas por hiperparametros e, ao incorporar tais processos
a um MLGD, os hiperparametros do processo tornam o modelo nao-linear.
3.2 Processos autorregressivos
Nesta secao, define-se os processos autorregressivos de ordem p, mostrando como in-
cluir processos desse tipo como componentes do vetor de estados de um modelo dinamico.
Definicao 3.1. Um processo estocastico βt; t ∈ N e dito atorregressivo de ordem p (ou
simplesmente βt ∼ AR(p)) caracterizado pelo parametro autorregressivo φ = (φ1, . . . , φp)
se e descrito por
βt = φ1βt−1 + · · ·+ φpβt−p + wt, wt ∼ [0,Wt], ∀t ∈ N, (3.4)
27
onde os erros de evolucao wt sao independentes.
A equacao (3.4) pode ser escrita em forma matricial se considerarmos p− 1 variaveis
auxiliares βi,t, i ∈ 2, . . . , p que representam o processo autorregressivo β1,t = βt de-
fasado de i unidades no tempo. Para isso, definimos βi,t = βi−1,t−1. De fato, temos
βi,t = βi−1,t−1 ⇒ βi,t = β1,t−i+1 ⇒ βi,t−1 = β1,t−i, donde
β1,t = φ1β1,t−1 + φ2β2,t−1 + ...+ φpβp,t−1 + wt
= φ1β1,t−1 + φ2β1,t−2 + ...+ φpβ1,t−p + wt.
Denotando θt = (β1, . . . , βp)′t = (β1,t, . . . , βp,t)
′, φ1:(p−1) = (φ1, . . . , φp−1)′ e In a
matriz identidade de ordem n, temos o processo AR(p) descrito como equacao de evolucao
de um modelo dinamico:
θt = Gt(φ)θt−1 + ωt, ωt ∼ [0,W t], (3.5)
onde
Gt(φ) =
φ′1:(p−1) φp
Ip−1 0
e W t = diag(Wt,0).
A primeira linha da equacao matricial (3.5) define o processo β1,t ∼ AR(p) e as demais
linhas definem recursivamente as variaveis auxiliares βi,t i ∈ 2, . . . , p de acordo com a
equacao βi,t = βi−1,t−1.
Dessa forma, e possıvel especificar uma componente qualquer do vetor de estados de
um modelo dinamico com evolucao temporal segundo um processo AR(p).
Estacionariedade em processos autorregressivos
Processos autorregressivos estacionarios apresentam comportamento estavel com o
decorrer do tempo, conforme sera visto com maior detalhamento adiante, e sao bastante
utilizados em aplicacoes praticas.
28
Definicao 3.2. (Estacionariedade forte) Um processo estocastico βt, t ∈ N e dito
fortemente estacionario se ∀n, h ∈ N os vetores aleatorios (βt1 , . . . , βtn) e (βt1+h, . . . ,
βtn+h) tem a mesma distribuicao para quaisquer que sejam t1, . . . , tn naturais.
Em aplicacoes praticas, costuma ser muito difıcil verificar se a serie temporal estudada
provem de um processo fortemente estacionario, uma vez que se faz necessario verificar se
vetores aleatorios de todos os tamanhos finitos possıveis possuem distribuicao invariante
a translacoes.
Portanto, e comum utilizar uma definicao mais fraca para classificar um processo
estocastico como estacionario que, em suma, leva em conta apenas distribuicoes conjuntas
bivariadas e requer invariancia apenas em termos de momentos de segunda ordem. Mais
especificamente, temos
Definicao 3.3. (Estacionariedade fraca) Um processo estocastico βt, t ∈ N e dito fraca-
mente estacionario se ∀h ∈ N os vetores aleatorios bidimensionais (βt1 , βt2) e (βt1+h, βt2+h)
tem o mesmo vetor de medias e matriz de covariancias para quaisquer que sejam t1, t2
naturais.
Em outras palavras, a definicao 3.3 diz que a media de um processo fracamente
estacionario e constante no tempo e a matriz de covariancias entre βt e βs depende
apenas da distancia | t− s | entre os instantes de tempo.
Deste ponto em diante, sempre que se menciar estacionariedade, refere-se a versao
fraca dada pela definicao 3.3, a menos que se diga explicitamente que se trata de estaci-
onariedade forte.
No contexto de processos autorregressivos, existem condicoes sobre o vetor de parame-
tros φ de modo que o processo apresente comportamento assintoticamente estacionario,
no sentido de que a sequencia de medias do processo converge para um valor finito e as
sequencias (Cov(βt, βt+h))t∈N convergem para qualquer que seja a defasagem h fixada.
Para maiores detalhes refencia-se Enders (2009) pp 55 e 56.
A cada processo AR(p) com parametros autorregressivos φ1, . . . , φp, associa-se a
equacao carcterıstica
29
1− φ1x− . . .− φp−1xp−1 − φpxp = 0 (3.6)
cujas raızes determinam caracterısticas do processo autorregressivo e tambem fornecem
condicoes de estacionariedade. A saber, o processo sera estacionario se, e somente se,
os recıprocos das raızes de sua equacao caracterıstica pertencerem ao interior do cırculo
unitario complexo, ou seja, se forem todos menores do que 1 em modulo (Enders, 2009).
No caso de processos autorregressvos de ordem 1, a condicao para estacionariedade e
−1 < φ1 < 1 onde o processo apresenta um comportamento oscilatorio em torno de zero
nos instantes iniciais se φ1 < 0. Ja no caso de processos AR(2), obtem-se estacionariedade
se −1 < φ2 < min(1 − φ1, φ1 + 1), onde as raızes da equacao caracterıstica sao comple-
xas conjugadas se φ2 < −14φ21, caso esse em que o processo apresenta comportamento
oscilatorio em torno de zero nos instantes iniciais.
3.3 Funcoes de transferencia
As funcoes de transferencia permitem tratar do efeito cumulativo no tempo de uma
regressora sobre a variavel resposta. Portanto, para este tipo de modelagem, assume-se
que o efeito da regressora sobre a resposta media nao seja apenas imediato, mas sim que
perdure ao longo de um determinado perıodo de tempo.
Assuma que uma das componentes do vetor de estados θt seja Et, que denota o efeito
de uma regressora X sobre o preditor linear, relacionado a variavel resposta atraves da
funcao de ligacao. A forma mais simples possıvel para Et sao as defasagens distribuıdas:
Et = β0Xt + β1Xt−1 + . . .+ βsXt−s (3.7)
com β0, . . . , βs geralmente seguindo alguma restricao, por exemplo polinomial de grau d
(Almon, 1965):
βj =d∑
k=0
ζkjk, j = 0, 1, . . . , s.
30
Sob essa abordagem, e necessario especificar o horizonte de influencia (s) da regressora
sobre a resposta, uma vez que a partir da equacao (3.7), nota-se que Xt compoe apenas os
efeitos Et, Et+1, . . . , Et+s. Alem disso, e necessario ainda especificar a ordem do polinomio
que descreve os efeitos βj em funcao da defasagem j.
Uma alternativa e utilizar efeitos de funcao de transferencia. Sob esta abordagem,
assumimos que o efeito cumulativo de X sobre o preditor possa ser expresso por:
Et = φ1Et−1 + . . .+ φrEt−r + γ1Xt−b + . . .+ γsXt−b−s+1, (3.8)
ou equivalentemente,
Et − φ1Et−1 − . . .− φrEt−r = γ1Xt−b + . . .+ γsXt−b−s+1
(1− φ1B − . . .− φrBr)Et = (γ1Bb + . . .+ γsB
b+s−1)Xt
φ(B)Et = γ(B)Xt, (3.9)
onde B e o operador defasagem, (i.e., BXt = Xt−1) e as funcoes φ e γ sao definidas
respectivamente por φ(B) = 1− φ1B − . . .− φrBr, e γ(B) = γ1Bb + . . .+ γsB
b+s−1.
Em analogia aos processos ARMA, φ(B) corresponde a parte autorregressiva AR(r)
e γ(B) a parte medias moveis MA(s) na equacao (3.9) no caso especial em que Xt e um
ruıdo branco. Denotaremos por TF(r,b,s) o processo definido pela equacao (3.9).
Aplicando sucessivamente a equacao (3.8), vemos que o processo Et pode ser escrito
como uma combinacao linear finita de termos defasados da regressora Xt:
Et = v0Xt−b + v1Xt−b−1 + v2Xt−b−2 + . . . (3.10)
em que omitimos a regressora medida em tempos anteriores a t− b− 2, alem de r termos
iniciais da sequencia Et. Portanto, vk representa o efeito da regressora b + k unidades a
frente no tempo. A funcao v : N∪ 0 → R, v(k) = vk e chamada funcao de resposta ao
impulso.
Outra funcao importante neste contexto e a funcao S : N ∪ 0 → R, S(n) = Sn =∑nk=0 vk que recebe o nome de funcao de transferencia e representa a soma dos impactos
31
(tambem chamado efeito cumulativo) da regressora sobre o preditor linear desde b ate
b+ n instantes de tempo a frente.
Para ilustrar os conceitos de resposta ao impulso e funcao de transferencia, considere
o exemplo TF(1,0,1) apresentado a seguir:
Exemplo 3.1. Seja o modelo de funcao de transferencia TF(1,0,1):
Et = φEt−1 + γXt. (3.11)
Aplicando sucessivamente a equacao (3.11) aos termos Et, Et−1, . . . , E2, temos
Et = φt−1E1 +t−1∑k=0
φkγXt−k. (3.12)
Portanto, nesse caso, a funcao de resposta ao impulso e dada por vk = φkγ, e a
funcao de transferencia e Sn =∑n
k=0 φkγ. Nos casos praticos em que nao se espera um
comportamento crescente no tempo e ilimitado para o efeito de uma regressora, espera-se
ter φ ∈ (−1, 1) e portanto o impacto da regressora sobre o preditor linear decai exponen-
cialmente com uma intensidade φ, com efeito imediato (tambem chamado de resposta
imediata ao impulso) de magnitude γ sobre o preditor. Ja a funcao de transferencia
Sn =∑n
k=0 γφk nos diz, por exemplo, que o impacto cumulativo total de X sobre o pre-
ditor no tempo corrente e em todos os instantes de tempo futuros e γ1−φ (no caso em que
−1 < φ < 1).
Escrevendo o modelo como componente do vetor de estados no contexto de modelos
dinamicos, tem-se
Etγt
=
φ Xt
0 1
Et−1γt
Portanto, fazendo θt = (Et, γt)′, Gt(φ) =
φ Xt
0 1
e W t =
0 0
0 0
, temos a
equacao de evolucao
32
θt = Gt(φ)θt−1 +wt, wt ∼ [0,W t]
como em (3.3).
O Exemplo 3.1 mostrou como escrever o modelo TF (1, 0, 1) na forma de estrutura
latente em modelos dinamicos atraves da equacao de evolucao (3.3). O caso geral, ou seja,
TF (r, b, s) usa ideias bastante similares as que foram descritas na secao 3.2, referente aos
processos autorregressivos, como sera visto logo a seguir.
Considera-se inicialmente r−1 variaveis auxiliares Ei,t, i ∈ 2, . . . , r que representam
a parte autorregressiva E1,t = Et com defasagem de i unidades no tempo bastando-se,
para isso, definir Ei,t = Ei−1,t−1, i ∈ 2, . . . , r e E1,t = Et. De fato, Ei,t = Ei−1,t−1 ⇒
Ei,t = E1,t−i+1 ⇒ Ei,t−1 = E1,t−i, donde
E1,t = φ1E1,t−1 + φ2E2,t−1 + ...+ φpEp,t−1 + γ1Xt−b + . . .+ γsXt−b−s
= φ1E1,t−1 + φ2E1,t−2 + ...+ φpE1,t−p + γ1Xt−b + . . .+ γsXt−b−s.
O vetor de estados e definido entao como θt = (E1, E2, . . . , Er, γ1, . . . , γs)′t. Denotando
φ1:(p−1) = (φ1, . . . , φp−1)′, X = (Xt−b, . . . , Xt−b−s+1) e In a matriz identidade de ordem n,
temos o processo TF (b, r, s) descrito como equacao de evolucao de um modelo dinamico:
θt = Gt(φ)θt−1 + ωt, ωt ∼ [0,W t], (3.13)
onde
Gt(φ) =
φ′1:(r−1) φp X
Ir−1 0 0
0 0 Is
e W t = diag(Wt,0).
A primeira linha da equacao matricial (3.13) descreve o efeito de funcao de trans-
ferencia Et ∼ TF (r, b, s), as linhas 2 a r definem as variaveis auxiliares Ei,t = Ei−1,t−1 e
as linhas de r+1 a r+s determinam os coeficientes γ1, . . . γs criando a dinamica artificial
γi,t = γi,t−1.
33
Na secao seguinte, aponta-se brevemente alguns procedimentos de inferencia na classe
de modelos dinamicos nao lineares presentes na literatura e, em seguida, descreve-se a
metodologia sequencial proposta neste trabalho.
3.4 Inferencia em modelos dinamicos nao-lineares
Existe uma gama diversa de metodologias inferenciais para estimacao de parametros
em modelos dinamicos nao-lineares.
No contexto de processos autorregressivos, Huerta e West (1999) utilizam metodos
MCMC, portanto nao-sequenciais, parametrizando o processo em termos dos recıprocos
das raızes do polinomio caracterıstico associado. A classe de prioris utilizada contempla
raızes reais e complexas restritas a regiao de estacionariedade. Ainda no contexto de pro-
cessos autorregressivos, Prado e Lopes (2013) descrevem metodologia sequencial atraves
de filtros de partıcula com aprendizagem para estimacao dos parametros autorregressivos
em contextos em que a variavel resposta e normal.
Em Pole (1988) e Pole e West (1990), descreve-se uma metodologia sequencial em
modelos dinamicos normais com efeitos de funcao de transferencia. Nestes trabalhos,
utiliza-se do esquema sequencial descrito em West e Harrison (1997), capıtulo 4, para
conjugacao normal-gama para o par (θt, V ) onde θt representa um efeito de funcao de
transferencia. A estimacao do hiperparametro e feita atraves de quadratura adaptativa
de Gauss-Hermite. A metodologia proposta nesta dissertacao segue as linhas descritas
em Pole (1988) e Pole e West (1990) no que se refere ao uso de quadratura de Gauss-
Hermite, porem aqui nao nos restringimos ao caso normal e investigamos tambem outras
formas de processos latentes alem das funcoes de transferencia.
As subsecoes 3.4.1, 3.4.2 e 3.4.3 a seguir descrevem e exemplificam uma metodologia
alternativa aquelas referenciadas nos dois paragrafos anteriores no que se refere a es-
timacao de hiperparametros em modelos dinamicos. Resumidamente, expande-se o vetor
de estados para incluir os hiperparametros do modelo linearizando a equacao de evolucao
resultante para aplicar a metodologia sequencial desenvolvida em West et al. (1985) aos
estados, conforme descrito na subsecao 2.2.3. Ja na secao 3.5, apresenta-se o uso de
34
quadratura de Gauss-Hermite, que pode ser visto como alternativa a expansao do vetor
de estados para estimar os hiperparametros da matriz de evolucao, ou entao para estimar
a variancia de evolucao de componentes dinamicas.
3.4.1 Expansao do vetor de estados
Em situacoes mais gerais do que aquelas mencionadas no capıtulo 2, existem parame-
tros desconhecidos a serem estimados na matriz de evolucaoGt, ou no vetor de covariaveis
F t, o que introduz uma nao-linearidade na evolucao temporal do vetor de estados.
Para tratar do caso em que a matriz de evolucaoGt e definida em funcao de parametros
φ, caso este em que denotaremos Gt = Gt(φ), o procedimento descrito nesta secao con-
siste em incorporar ao vetor de estados θt o vetor de hiperparametros φ de modo que o
vetor de estados expandido passa a ser θ′t = (θ′t,φ
′t) criando-se uma relacao artificial de
evolucao para os hiperparametros: φt = φt−1.
Apesar de nao ser abordado neste trabalho, o caso em que a matriz de planejamento
F t depende de hiperparametros e similar ao caso em que existem hiperparametros na
matriz Gt.
Dessa forma, o modelo dinamico apresentado em (2.7), (2.8) e (2.9) passa a ser descrito
por
p(yt | ψt) = exp(V −1t [ft(yt)ψt − a(ψt)]
)bt(yt, Vt) (3.14)
ηt = g(ψt) = F tθt (3.15)
θt = f(θt−1) + ωt, ωt ∼ (0, W t), (3.16)
onde f(θt−1) = (Gt−1(φt−1)θt−1, φt−1) e W t = diag(W t, 0). Note-se que a funcao f
em (3.16) agora e nao-linear, portanto, o vetor de medias e matriz de covariancias para
a posteriori do vetor de estados expandido nao podem ser obtidos atraves dos momentos
de primeira e segunda ordem do vetor de estados a priori conforme descrito no passo 1
da subsecao 2.2.3. Para tanto, procede-se para a linearizacao desta relacao.
35
3.4.2 Linearizacao da equacao de evolucao
O modelo dinamico descrito pelas equacoes (3.14), (3.15) e (3.16) que resulta do
processo de expansao do vetor de estados de modo a incorporar hiperparametros e dito
nao linear porque a evolucao na media dos estados em tempos subsequentes se da atraves
de uma funcao nao linear f . No caso dos modelos lineares generalizados dinamicos
descritos por (2.7), (2.8) e (2.9), a funcao f e definida por f(θt−1) = Gtθt−1 e portanto
e linear em θt.
A metodologia adotada para manter o carater sequencial de inferencia sobre θt em
termos de momentos de primeira e segunda ordem, consiste em aplicar uma tecnica de
linearizacao a equacao de evolucao (3.16) com o objetivo de aproximar o modelo nao-
linear por um MLGD. Procedendo deste modo, estamos aproximando o modelo dinamico
original (nao-linear) por um MLGD e utilizando a inferencia realizada sob o modelo linear,
tal como exibido na subsecao 2.2.3, como aproximacao para a inferencia sob o modelo
nao-linear.
Mais especificamente, considerando a equacao de evolucao nao-linear (3.16), tome a
expansao de Taylor de ordem 1 para f ao redor de mt−1 = E(θt−1 | Dt−1). Desse modo,
segue que
θt ≈ f(mt−1) + f ′(mt−1)(θt−1 −mt−1) + ωt
= ht +H tθt−1 + ωt, (3.17)
onde ht = f(mt−1)− f ′(mt−1)mt−1 e H t = f ′(mt−1).
Aqui, para D ⊂ Rp, f : D → Rp uma funcao derivavel com x = (x1, . . . , xp) ∈ D e
f(x) = (f1(x), . . . , fp(x)), a notacao f ′(x) representa a matriz de derivadas de f avaliada
no ponto x:
f ′(x) =
∂f1(x)∂x1
. . . ∂f1(x)∂xp
.... . .
...
∂fp(x)
∂x1. . . ∂fp(x)
∂xp
.36
Note-se que a unica distincao entre a equacao (3.17) e a equacao de evolucao apresen-
tada em (2.9) se deve a existencia do vetor ht, conhecido no tempo t, como consequencia
da aproximacao linear de Taylor aplicada a evolucao dos estados. Dessa forma, o proce-
dimento sequencial descrito na subsecao 2.2.3 e aplicado ao modelo dinamico descrito por
(3.14), (3.15) e (3.17) alterando-se apenas o passo 1 onde se obtem at = ht +H tmt−1 =
f(mt−1) e Rt = H tCt−1H t +W t.
3.4.3 Exemplos
A seguir, descreve-se resumidamente os calculos para aplicacao das tecnicas de linea-
rizacao e expansao do vetor de estados no contexto de processos latentes autorregressivos
e funcoes de transferencia.
Exemplo 3.2. (Processos AR(p)). Na secao 3.2, mostrou-se que para incluir um pro-
cesso βt ∼ Ar(p) como componente do vetor de estados, considera-se
θ′t = (β1, . . . , βp)t
com β1,t = βt e
Gt(φ) =
φ′1:(p−1) φp
Ip−1 0
e W t = diag(Wt,0).
Para estimar o vetor de parametros autorregressivos φ, expande-se o vetor de estados
fazendo θ′t = (θ′t,φ
′t) onde φt = φ = (φ1, . . . , φp)
′, ∀t ∈ N de forma que a evolucao dos
parametros ocorre de modo nao linear de acordo com a equacao (3.16), em que
f(θt−1) =
(p∑i=1
φiβi, β1, . . . , βp−1, φ1, . . . , φp
)′t−1
.
Para aplicar o esquema sequencial de inferencia ao modelo, basta descrever a matriz
H t. Denotando o vetor de medias a posteriori no tempo t− 1 por
37
m = mt−1 = (mβ1 , . . . ,mβp ,mφ1 , . . . ,mφp)′,
onde mβi = E(βi,t−1 | Dt−1) e mφi = E(φi | Dt−1) , segue que
H t = f ′(mt−1) =
m(p+1):(2p−1) mφp m1:p
Ip−1 0 0
0 0 Ip
.
onde ma:b denota o vetor obtido tomando-se as b− a+ 1 entradas de m desde a posicao
a ate a posicao b e In denota a matriz identidade de dimensao n.
Exemplo 3.3. (Processos TF(r,b,s)). Na secao 3.3, mostrou-se que para incluir um
processo Et ∼ TF (r, b, s) como componente do vetor de estados, considera-se
θ′t = (E1, . . . , Er, γ1, . . . , γs)t
com E1,t = Et e
Gt(φ) =
φ′1:(r−1) φp X
Ir−1 0 0
0 0 Is
e W t = diag(0),
onde X = (Xt−b, . . . , Xt−b−s+1).
Para estimar o vetor de parametros autorregressivos φ, expande-se o vetor de estados
fazendo θt = (θ′t,φ′t) onde φt = φ = (φ1, . . . , φp)
′, ∀t ∈ N de forma que a evolucao dos
parametros ocorre de modo nao linear de acordo com a equacao (3.16), em que
f(θt−1) =
(r∑i=1
φiEi +s−1∑i=0
γi+1Xt−b−i, E1, . . . , Er−1, φ1, . . . , φr, γ1, . . . , γs
)′t−1
.
Para aplicar o esquema sequencial de inferencia ao modelo, basta descrever a matriz
H t. Denotando o vetor de medias a posteriori no tempo t− 1 por
38
m = mt−1 = (mE1 , . . . ,mEr ,mφ1 , . . . ,mφr ,mγ1 , . . . ,mγs)′,
onde mEi = E(Ei,t−1 | Dt − 1), mφi = E(φi | Dt−1) e mγi = E(γi,t−1 | Dt−1), segue que
H t = f ′(mt−1) =
m(r+1):(2r−1) mφr m1:r X
Ir−1 0 0 0
0 0 Ir 0
0 0 0 Ir
.
onde ma:b denota o vetor obtido tomando-se as b− a+ 1 entradas de m desde a posicao
a ate a posicao b e In denota a matriz identidade de dimensao n.
3.5 Quadratura de Gauss-Hermite em modelos
dinamicos nao-lineares
A quadratura de Gauss-Hermite foi bastante utilizada na decada de 80 para estimacao
de hiperparametros tanto em modelos estaticos (Naylor e Smith, 1982) quanto em mo-
delos dinamicos com resposta normal (Pole 1988, Pole e West 1990). Ate o momento,
porem, nao se tem na literatura aplicacao de tais metodos em modelos dinamicos nao-
lineares, tais como os que foram apresentados nas secoes 3.2 e 3.3, quando a variavel
resposta nao e normal. Pode-se, portanto, adotar tal metodo para estimacao de com-
ponentes desconhecidas na matriz Gt como alternativa a expansao do vetor de estados
e linearizacao da equacao de evolucao. O metodo da quadratura de Gauss Hermite
tambem pode ser adotado para estimacao de variancias de evolucao, omo alternativa a
especificacao indireta via fatores de desconto.
O procedimento inferencial no caso dos modelos dinamicos consiste em criar uma
grade para o hiperparametro, que denotaremos nessa secao por α, grade esta que evo-
lui dinamicamente a medida que novas observacoes se tornam disponıveis. Desse modo,
preserva-se o carater sequencial de inferencia tambem quando se quer estimar os hiper-
39
parametros do modelo dinamico. A unica exigencia que se faz sobre o hiperparametro α
e que, condicionalmente a ele, tenhamos um MLGD. Portanto, no contexto dos modelos
dinamicos nao-lineares tratados aqui, pode-se ter α = φ onde φ caracteriza a matriz
de evolucao Gt ou α = W = W t ∀t ∈ N, ou ainda α = (φ,W ). Nesta dissertacao,
sera dado foco ao segundo caso, ou seja, utilizaremos a quadratura adaptativa de Gauss-
Hermite para estimar a variancia dos erros de evolucao em conjunto com a metodologia
de expansao do vetor de estados para estimar o vetor de hiperparametros φ nos estu-
dos de simulacao e as aplicacoes a dados reais que constam nos capıtulos 4 e 5. Para a
descricao que sera feita a seguir, considera-se α unidimensional (portanto escrevemos α
ao inves de α), porem o caso mais geral em que α e um vetor de hiperparametros pode
ser estendido com algumas adaptacoes a partir do caso unidimensional (West e Harrison
1997 e Smith et al. 1987).
A quadratura de Gauss-Hermite fornece aproximacao para integrais da forma
∫ ∞−∞
e−t2
f(t)dt (3.18)
pela combinacao linear
n∑i=1
wif(ti), (3.19)
onde os pontos ti, i ∈ 1, . . . , n formam uma grade em torno de zero e correspondem
as raızes do polinomio de Hermite de grau n (Salzer et al., 1952). Tanto os pesos wi
quanto as raızes dos polinomios de Hermite estao calculados para diversos valores de n
(Salzer et al., 1952). A aproximacao (3.19) e exata para toda funcao polinomial f de
grau menor que ou igual a 2n−1. Como o fator multiplicativo e−t2
apresenta decaimento
exponencial quadratico conforme t se distancia de zero, em geral, valores de t distantes
da origem sao desprezıveis no calculo da integral (3.18), o que torna o comportamento
aproximadamente polinomial para a funcao f necessario apenas ao redor de zero, em
termos praticos.
Aplicando a mudanca de variavel α =√
2σt+ µ na integral (3.18), temos
40
∫ ∞−∞
e−t2
f(t)dt =
∫ ∞−∞
1√2σe−
12(α−µσ )
2
f
(α− µ√
2σ
)dα
=
∫ ∞−∞
N(α;µ, σ2)√πf
(α− µ√
2σ
)dα,
onde N(x;µ, σ2) representa a densidade da normal com media µ e variancia σ2 avaliada
no ponto x.
Assim, e possıvel extender a aplicacao da quadratura de Gauss-Hermite para integrais
da forma
∫ ∞−∞
g(α)N(α;µ, σ2)dα
definindo a funcao f em (3.18) atraves da relacao g(α) = f(α−µ√2σ
)√π, ou seja, f(α) =
g(√2σα+µ)√π
. Assim, temos
∫ ∞−∞
g(α)N(α;µ, σ2)dα ≈n∑i=1
wi√πg(√
2tiσ + µ). (3.20)
Para descricao do metodo aplicado ao contexto de modelos dinamicos utilizaremos
uma forma equivalente de expressar a integral (3.20), agora como combinacao linear do
integrando avaliado nos pontos da grade.
Considere uma funcao h qualquer de domınio R. Entao,
∫ ∞−∞
h(α)dα =
∫ ∞−∞
h(α)
N(α;µ, σ2)N(α;µ, σ2)dα
≈n∑i=1
h(√
2σti + µ)
N(√
2σti + µ;µ, σ2).wi√π
=n∑i=1
h(√
2σti + µ)wi1√2πσ
e−t2i ×√π
=n∑i=1
h(αi)mi,
onde os novos pesos sao dados por
41
mi =√
2σwiet2i (3.21)
e os respectivos pontos da grade
αi =√
2σti + µ (3.22)
agora estao centrados em µ com um fator de dispersao σ. Em suma, a aproximacao por
n pontos via Gauss-Hermite sera boa se o integrando puder ser escrito como produto de
uma densidade normal por uma funcao g que apresente comportamento aproximadamente
polinomial de grau ate 2n− 1 na regiao central de valores nao-desprezıveis da densidade
normal em questao. Tal regiao e definida pelos parametros µ e σ2, sendo assim cruciais
para a eficiencia do metodo de quadratura. Veremos logo a seguir que µ e σ2 serao
escolhidos como a moda e a variancia a posteriori do hiperparametro α, e portanto a
densidade N(α;µ, σ2) sera utilizada como aproximacao para p(α | Dt).
O procedimento inferencial no contexto de modelos dinamicos nao-lineares pode ser
resumido do seguinte modo:
1. No tempo t, considere disponıveis E(α | Dt−1), V ar(α | Dt−1) e uma grade L0 para
α | Dt−1 em que tenhamos avaliado p(αi | Dt−1), ∀αi ∈ L0. Alem disso, suponha
conhecidos media mt−1 = E(θt−1 | Dt−1) e variancia Ct−1 = V ar(θt−1 | Dt−1)
incondicionais para o vetor de estados.
2. Calcula-se E(α | Dt), V ar(α | Dt) e p(αi | Dt), ∀αi ∈ L0 usando quadratura de
42
Gauss-Hermite para aproximar as integrais
p(α | Dt) = kp(yt | α,Dt−1)p(α | Dt−1) (3.23)
k−1 =
∫ ∞−∞
p(yt | α,Dt−1)p(α | Dt−1)dα (3.24)
≈∑αi∈L0
mip(yt | αi, Dt−1)p(αi | Dt−1) (3.25)
E(α | Dt) =
∫ ∞−∞
αp(α | Dt)dα ≈∑αi∈L0
miαip(αi | Dt) (3.26)
E(α2 | Dt) =
∫ ∞−∞
α2p(α | Dt)dα ≈∑αi∈L0
miα2i p(αi | Dt), (3.27)
V ar(α | Dt) = E(α2 | Dt)− E(α | Dt)2 (3.28)
lembrando que p(yt | αi, Dt−1) e a preditiva condicional ao hiperparametro αi e tem
forma analıtica conhecida tanto no caso MLD quanto MLGD.
3. Fazendo µ = E(α | Dt) e σ2 = V ar(α | Dt) em (3.21) e (3.22), atualize a grade de
L0 para L1, construıda agora com base na posteriori α | Dt.
4. Calcule a densidade p(αi | Dt), avaliada nos pontos da nova grade αi ∈ L1 usando
as equacoes (3.23), (3.24) e (3.25). Nesse ponto, recomenda-se utilizar interpolacao
via splines cubicos no log da densidade p(αi | Dt) de modo que, ao retornar para
a escala original, tenhamos a garantia de que a densidade seja positiva em todo
ponto. Feito isso, recalcule E(α | Dt), E(α2 | Dt) e V ar(α | Dt) como em (3.26),
(3.27) e (3.28) usando dessa vez a grade L1.
43
5. Obtenha esperanca e variancia para θt | Dt:
E(θt | Dt) = E[E(θt | α,Dt) | Dt]
=
∫ ∞−∞
E(θt | α,Dt)p(α | Dt)dα
≈∑αi∈L1
miE(θt | αi, Dt)p(αi | Dt)
E(θtθ′t | Dt) =
∫ ∞−∞
E(θtθ′t | α,Dt)p(α | Dt)dα
≈∑αi∈L1
miE(θtθ′t | αi, Dt)p(αi | Dt)
V ar(θt | Dt) = E(θtθ′t | Dt)− E(θt | Dt)E(θ′t | Dt)
Os vetores mt(αi) = E(θt | αi, Dt), e matrizes Ct(αi) = V ar(θt | αi, Dt), αi ∈ L0
podem ser facilmente calculados atraves demt−1(αi) e Ct−1(αi) obtidos na iteracao
t−1, atualizando-os a luz da observacao corrente yt segundo o procedimento escrito
na secao 2. Obtem-se mt(αi), αi ∈ L1 interpolando (digamos, linearmente) cada
uma das componentes do vetor mt interpretando-as como funcoes de α, usando-se
para a interpolacao os pontos da grade antiga αi ∈ L0. Para obter Ct(αi), αi ∈ L1,
o procedimento e inteiramente analogo.
6. Faca L0 = L1 e itere.
Conforme discutido anteriormente, as funcoes de densidade a posteriori p(α | Dt−1)
para o hiperparametro α precisam ser aproximadamente normais, portanto e aconselhavel
que o suporte de α seja a reta real para aumentar a eficiencia do metodo da quadratura.
O caso geral em que o hiperparametro nao esta definido em todo R pode ser facilmente
contornado utilizando uma transformacao adequada do hiperparametro.
Conforme mencionado no inıcio dessa secao, optou-se por utilizar o metodo de qua-
dratura de Gauss Hermite para estimar variancias de evolucao de componentes dinamicas
do vetor de estados. A primeira vista, esta pode nao parecer a melhor escolha, uma vez
que fatores de desconto, por exemplo, poderiam ser usados para esta finalidade e sua
implementacao e, certamente, muito mais simples e rapida que a quadratura de Gauss
Hermite. Porem, existem contextos especıficos em que a utilizacao de fatores de desconto
44
podem levar a posterioris degeneradas, como e o caso dos processos autorregressivos nor-
mais, que sera discutido brevemente na secao seguinte.
3.6 Fatores de desconto para componentes autorre-
gressivas
Esta secao trata de algumas consideracoes em relacao a especificacao da sequencia
dos erros de evolucao de uma componente autorregressiva em modelos dinamicos. Es-
sencialmente, apresenta-se uma breve discussao sobre restricoes de ordem pratica para o
intervalo de valores do desconto relacionadas a convergencia da sequencia de variancias a
posteriori em modelos com componentes autorregressivas. Veremos que em alguns casos
bastante simples, o nao cumprimento de tais restricoes pode fazer com que as estimati-
vas para o processo autorregressivo sejam assintoticamente constantes com convergencia
sendo atingida muito rapidamente, o que nao condiz com o comportamento do processo
real.
De acordo com as equacoes de atualizacao no contexto dos modelos dinamicos com
resposta naral e variancia de observacao conhecida na subsecao 2.2.1, observa-se que yt
nao consta na expressao analıtica de nenhuma das variancias Rt, Qt, Ct quando se usa
fatores de desconto, portanto, a variancia a posteriori Ct decresce em funcao apenas da
quantidade de observacoes contida no vetor de dados, independentemente dos particulares
valores observados para yt. No caso especıfico do MLD com uma unica componente AR(1)
e variancias Vt e Wt conhecidas, tambem e possıvel obter expressao analıtica para o limite
da sequencia de variancias a posteriori (Ct)t∈N, como dito na
Proposicao 3.1. Considere o MLD dado pela quadrupla 1, φ, Vt,Wt, onde Vt e Wt sao
conhecidos ∀t ∈ N. Suponha que limt→∞ Vt = V > 0 e que a sequencia Wt e especificada
atraves do fator de desconto δ ∈ (0, 1]. Se a sequencia Ct converge, entao os unicos va-
lores limites possıveis para Ct sao 0 e(
1− δφ2
)V (neste ultimo caso, desde que se tenha
δ < φ2).
45
Demonstracao. Usando fator de desconto para declarar as variancias Wt no MLD dado
pela quadrupla 1, φ, Vt,Wt, temos Rt = φ2
δCt−1, e At = Rt
Rt+Vtdonde, dadas as hipoteses
da proposicao,
Ct = AtVt ⇒ C =φ2
δCV
φ2
δC + V
⇒ C2φ2
δ+ CV − φ2
δCV = 0
⇒ C
(φ2
δC +
(1− φ2
δ
)V
)= 0
⇒ C
(C +
(δ
φ2− 1
)V
)= 0
⇒ C = 0 ou C =
(1− δ
φ2
)V.
Em processos autorregressivos estacionarios de 1a ordem, a condicao δ < φ2 para
limite estritamente positivo da sequencia de variancias a posteriori Ct dada na Proposicao
3.1 pode ser bastante restritiva. Para processos autorregressivos θt = φθt−1 + wt onde,
por exemplo, φ = 0.9, devemos ter δ < 0.81 a fim de que tenhamos variancia limite
estritamente positiva. Para valores menores de φ, a restricao sobre o fator de desconto e
ainda mais severa; para φ = 0.7, por exemplo, devemos ter δ < 0.49.
A figura 3.6 ilustra o efeito da restricao δ < φ2 sobre as estimativas a posteriori para
os estados no modelo do exemplo 2.1 simulado com Wt = 1,∀t ∈ N, fazendo uso de
fator de desconto no processo de estimacao dos estados. A priori usada foi θ1 | D0 ∼
N(0, 100). Quando a condicao δ < φ2 nao e satisfeita, Ct rapidamente converge a zero
e as estimativas para θt se tornam constantes, o que claramente nao corresponde ao
comportamento observado nos dados.
Para maiores detalhes, referencia-se Ameen (1984) e Ameen e Harrison (1984) onde
a Proposicao 3.1 esta demonstrada e e discutida de modo mais aprofundado.
46
0 20 40 60 80 100
05
1015
20
t
Ctlim Ct
(a) δ = 0.9, φ = 1
0 20 40 60 80 100
−5
05
1015
t
mt
mt ± 2 × Ct
(b) δ = 0.9, φ = 1
0 20 40 60 80 100
−10
−5
05
1015
t
Ctlim Ct
(c) δ = 0.9, φ = 0.8
0 20 40 60 80 100
−4
−2
02
4
t
mt
mt ± 2 × Ct
(d) δ = 0.9, φ = 0.8
Figura 3.1: Estimacao de θt ∼ AR(1) em MLD1, φ, V,Wt com φ conhecido e Wt
especificado pelo fator de desconto δ. Priori: θ1 ∼ N(0, 100). mt = E(θt | Dt), Ct =
V ar(θt | Dt).
47
Capıtulo 4
Estudo de simulacao
4.1 Descricao e objetivos do estudo simulado
O principal objetivo do estudo simulado desenvolvido neste capıtulo e investigar em-
piricamente o precedimento sequencial baseado no uso simultaneo da expansao do vetor
de estados e da quadratura adaptativa de Gauss Hermite. Tal procedimento pode ser
aplicado a qualquer modelo dinamico com resposta na famılia exponencial permitindo
estimar hiperparametros na matriz de evolucao, alem das variancias de evolucao das
componentes dinamicas do modelo. Aqui, o foco e dado a estimacao de hiperparametros
em processos autorregressivos como componentes latentes de modelos dinamicos com
resposta na famılia exponencial.
Considerou-se modelos dinamicos com resposta normal, poisson e binomial com com-
ponentes autorregressivas de ordens 1, 2 e 3 compondo o vetor de estados. Os valores
fixados para os parametros autorregressivos e variancias observacional (V) e de evolucao
(W) sao os mesmos utilizados em Prado e Lopes (2013), a saber, φ1 = 0.95 para os proces-
sos AR(1), (φ1, φ2) = (0.1, 0.8) para os processos AR(2) e (φ1, φ2, φ3) = (0.81, 0.77, 0.86)
para processos AR(3), com W=0.1 e V=0.02. No caso βt ∼ AR(2) com φ = (0.1, 0.8),
os recıprocos das raızes do polinomio caracterıstico definido na equacao (3.6) valem 0.95
e 0.85. No caso AR(3), temos uma raız real, cujo recıproco vale -0.95, e um par de raızes
complexas nao-reais cujos recıprocos valem 0.95e±2πi16 Portanto, a metodologia descrita
aqui pode ser vista como uma alternativa, tambem sequencial, aos filtros de partıcula de
48
Carvalho et al. (2010), Liu e West (2001) e Storvik (2002) aplicados por Prado e Lopes
(2013) ao contexto de modelos dinamicos normais com estrutura autorregressiva. Alem
disso, estendemos o estudo a modelos dinamicos com resposta na famılia exponencial,
estimando tambem os hiperparametros que caracterizam os processos autorregressivos
latentes.
Ao desenvolver metodologia sequencial para tais modelos possibilita-se que a es-
timacao de parametros e obtencao de previsoes a cada tempo t sejam feitas condicio-
nalmente a inferencia ja obtida no tempo t− 1, o que nao ocorre nos esquemas MCMC.
Alem disso, esquemas MCMC costumam demandar mais tempo computacional para se-
rem implementados.
No contexto inferencial bayesiano aplicado a modelos autorregressivos (resposta nor-
mal), Huerta e West (1999) desenvolvem um esquema MCMC, parametrizando o processo
em termos das raızes do polinomio caracteristico associado. Em Huerta e West (1999),
trata-se formalmente da estimacao da ordem do processo autorregressivo incluindo uma
variavel auxiliar com suporte −1, 0, 1 que atribui probabilidade positiva de que o
modulo de cada raız do polinomio caracterıstico assuma os valores -1, 0 e 1. Assim,
se ordenarmos o modulo das raızes r1 < r2 < ... < rq e observarmos P (ri = 0 | DN) alta
para i ∈ q−p+ 1, ..., q, temos fortes indıcios de que a serie observada seja um processo
AR(p).
Descrevendo em maiores detalhes a metodologia aplicada neste estudo de simulacao,
utilizamos a expansao do vetor de estados para incorporar os parametros dos processos
autorregressivos latentes, tal como descrito na subsecao 3.4.1, e linearizacao da equacao de
evolucao resultante do processo de expansao dos estados, conforme descrito na subsecao
3.4.2. Condicionalmente ao conhecimento da variancia dos erros de evolucao, aplica-se
o esquema sequencial de inferencia mencionado nas subsecoes 2.2.1 (resposta normal)
e 2.2.3 (resposta binomial e Poisson). Para estimar a variancia dos erros de evolucao,
utilizou-se a quadratura adaptativa de Gauss-Hermite, descrita na secao 3.5.
Os resultados estao agrupados nas proximas tres secoes segundo a distribuicao da
variavel resposta (normal, poisson e binomial, respectivamente). Dentro destas, cada
subsecao trata de modelos com estrutura autorregressiva latente de ordem 1, 2 ou 3. Em
49
todos os casos, foram simuladas 100 replicas de cada modelo, com series de tamanho 1000,
para as quais exibem-se resultados considerando as primeiras 50, 250 e 1000 observacoes
da serie no processo de estimacao. A estimacao via quadratura de Gauss-Hermite foi feita
a partir de uma grade de 15 pontos nos modelos normal e Poisson. No caso binomial,
utilizou-se 9 pontos. A intencao inicial era considerar grades de 9 pontos tambem para
os modelos normal e Poisson, porem, nestas circunstancias, obtivemos matrizes de co-
variancia nao positivas definidas para alguns instantes de tempo para algumas das series
simuladas.
Primeiramente, sao exibidos resultados considerando a variancia de evolucao W co-
nhecida, com a finalidade de estudar a sensibilidade do procedimento inferencial proposto
a especificacoes erroneas de W sobre os parametros do processo autorregressivo. Em se-
guida, sao exibidos os resultados obtidos estimando W via quadratura de Gauss Hermite.
Investiga-se ainda a capacidade do procedimento inferencial proposto em identificar a or-
dem do processo autorregresivo subjacente. Especificamente, isso e feito verificando se,
dadas observacoes provenientes de um modelo dinamico com estrutura latente AR(p),
consegue-se recuperar o valor de p especificando estrutura latente AR(q), onde q > p, e
as estimativas a posteriori para os parametros autorregressivos φp+1, . . . , φq sao proximas
de zero. Isso e ilustrado nas subsecoes referentes aos processos AR(3), em que especifi-
camos estrutura AR(5) ao fazer o ajuste dos modelos.
4.2 Modelo Normal
Descreve-se nessa secao os resultados da aplicacao da metolodogia sequencial proposta
a modelos dinamicos normais. As series foram simuladas com variancia observacional
V = 0.02 e variancia de evolucao W = 0.1. A baixa magnitude de V se comparada a W
faz com que as series simuladas tenham comportamento muito proximo de um processo
AR(p) sem adicao de ruıdo.
50
4.2.1 Modelo normal com estrutura latente AR(1)
Todas as series de dados que constam nessa secao foram simuladas a partir do
MLD1, φ, V,W :
Modelo normal AR(1):
yt ∼ N(βt, V )
βt = φβt−1 + wt, wt ∼ N(0,W ),
com W = 0.1 e V = 0.02. Especificou-se as distribuicoes marginais a priori (independen-
tes):
β1 | D0 ∼ T4.02(0, 10)
V ∼ GamaInversa(2.01, 0.101)
φ ∼ T4.02(0, 0.5).
Os parametros da distribuicao a priori marginal para φ foram escolhidos de forma
que φ esteja entre -1 e 1 (regiao de estacionaridade) com probabilidade bastante alta
(aproximadamente igual a 0,884) porem admitindo probabilidade nao desprezıvel para a
regiao de nao estacionaridade. Ja para a variancia observacional V , temos E(V | D0) =
0.1 e V ar(V | D0) = 0.099 ≈ 0.1 (ver apendice). Assim, temos priori Normal-Gama para
o vetor (φ, βt, V−1) de modo a obter conjugacao a posteriori, conforme mencionado na
secao 2.2.
Primeiramente, consideramos a variancia dos erros de evolucao W conhecida no pro-
cesso de estimacao. A figura 4.1 supoe W = 0.1 (valor verdadeiro usado na simulacao),
enquanto que as figuras 4.2 e 4.3 supoem W fixo igual a 0.1, 0.2 e 0.4 durante o processo
de estimacao.
A figura 4.1 mostra resultados da aplicacao da metodologia sequencial proposta a
3 diferentes series simuladas a partir do modelo MLD1, φ, V,W, cada uma supondo
51
um valor diferente para φ no conjunto 0.5, 0.7, 0.95. As estimativas de φ se situam
proximas aos respectivos valores verdadeiros utilizados na simulacao. Note-se ainda que
as estimativas para a serie simulada com φ = 0.95 sao mais acuradas, o que e esperado
pois estas series apresentam memoria mais longa em comparacao com as series geradas
com valores de φ mais proximos de zero. As previsoes um passo a frente acompanham
bem as respectivas series simuladas, porem a verdadeira variancia observacional, em geral,
nao esta contida nos intervalos de credibilidade a posteriori.
Analisando a figura 4.2 com as estimativas do parametro autorregressivo sob a es-
pecificacao de diferentes valores de W , percebe-se que os valores de φ sao subestimados
quando se especifica W > 0.1. O vieis das estimativas, porem, e muito menor quando φ
e proximo de 1, indicando que φ e mais facil de estimar quando esta no limite da regiao
de estacionaridade, mesmo quando especificamos W > 0.1.
A variancia de observacao, por sua vez, e muito mais sensıvel a especificacao da
variancia de evolucao, como ilustra a figura 4.3. Conforme especifica-se valores maiores
para W , resta ao procedimento inferencial diminuir o valor de V de modo a represen-
tar a mesma variabilidade total observada na serie. A figura 4.3 tambem mostra que
temos valores de V sendo estimados entre 0.01 e 0.04 quando se dispoe de todas os 1000
observacoes das series fixando W=0.1.
52
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(a) φ = 0.5
−2
−1
01
2
t901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(b) Previsoes
0 200 400 600 800 1000
0.00
0.01
0.02
0.03
0.04
0.05
t
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(c) V | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(d) φ = 0.7
−2
−1
01
2
t901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(e) Previsoes
0 200 400 600 800 1000
0.00
0.01
0.02
0.03
0.04
0.05
t
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(f) V | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(g) φ = 0.95
−3
−2
−1
01
23
4
t901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(h) Previsoes
0 200 400 600 800 1000
0.00
0.01
0.02
0.03
0.04
0.05
t
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(i) V | Dt
Figura 4.1: Resultados para uma replica simulada do modelo normal AR(1) com φ =
0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) considerando a variancia de evolucao
fixa em seu valor real no processo de estimacao.
53
0.0 0.2 0.4 0.6 0.8 1.00
24
68
φ = 0.5W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
φ = 0.5W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
φ = 0.5W = 0.4
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
Den
sida
de
φ = 0.7W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
04
812
Den
sida
de
φ = 0.7W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
Den
sida
de
φ = 0.7W = 0.4
0.0 0.2 0.4 0.6 0.8 1.0
010
2030
Den
sida
de
φ = 0.95W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
05
1525
Den
sida
de
φ = 0.95W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
Den
sida
de
φ = 0.95W = 0.4
N=1000 N=250 N=50
Figura 4.2: Histogramas suavizados para a distribuicao das estimativas de φ condicionais
a W no tempo N com base nas 100 series simuladas do modelo normal AR(1). Os
pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φ | W,DN). A linha tracejada representa o valor verdadeiro de φ.
0.00 0.02 0.04 0.06 0.08 0.10
020
4060
φ = 0.5W = 0.1
0.00 0.02 0.04 0.06 0.08 0.10
010
025
0
φ = 0.5W = 0.2
0.00 0.02 0.04 0.06 0.08 0.10
010
0020
00
φ = 0.5W = 0.4
0.00 0.02 0.04 0.06 0.08 0.10
020
4060
80
Den
sida
de
φ = 0.7W = 0.1
0.00 0.02 0.04 0.06 0.08 0.10
010
025
0
Den
sida
de
φ = 0.7W = 0.2
0.00 0.02 0.04 0.06 0.08 0.10
050
015
00
Den
sida
de
φ = 0.7W = 0.4
0.00 0.02 0.04 0.06 0.08 0.10
040
80
Den
sida
de
φ = 0.95W = 0.1
0.00 0.02 0.04 0.06 0.08 0.10
010
025
0
Den
sida
de
φ = 0.95W = 0.2
0.00 0.02 0.04 0.06 0.08 0.10
050
015
00
Den
sida
de
φ = 0.95W = 0.4
N=1000 N=250 N=50
Figura 4.3: Histogramas suavizados para a distribuicao das estimativas de V condicionais
a W no tempo N com base nas 100 series simuladas para o modelo normal AR(1). Os
pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(V | W,DN). A linha tracejada representa o valor verdadeiro de V .
54
Resultados obtidos estimando a variancia de evolucao
Considera-se agora a variancia dos erros de evolucao desconhecida. O processo de
estimacao e feito via quadratura de Gauss-Hermite com uma grade de 15 pontos. A
distribuicao marginal a priori adotada para logW e normal com media -0.5 e variancia
1, o que equivale a uma distribuicao Log Normal para W com media 1 e variancia 1.718.
A figura 4.4 mostra que os resultados para estimacao de φ e as previsoes um passo
a frente se mantem boas, com pouco acrescimo de incerteza devido ao fato de estarmos
estimando W . Conforme antecipado durante a analise com W conhecido sob as diferentes
series simuladas, a variancia de observacao V nao e bem captada ainda que a variancia
de evolucao seja.
A figura 4.5 detalha o procedimento de estimacao de W para a primeira replica
simulada, onde e possıvel verificar a evolucao dos pontos da grade a posteriori de Gauss
Hermite, que se estabilizam em torno da regiao de maior massa de probabilidade para
W a posteriori. O metodo permite tambem tracar a densidade a posteriori de W, obtida
via interpolacao por splines cubicos na escala logarıtmica da densidade de W.
A figura 4.6 mostra que as estimativas para V sao viesadas e nao se distribuem em
torno do verdadeiro valor 0.02, situando-se no intervalo (0.02, 0.06). As estimativas de
W e de φ nao apresentam vies quando φ = 0.95, diferentemente do que ocorre no caso
em que φ ∈ 0.5, 0.7, onde as estimativas apresentam um pequeno vies.
55
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(a) φ = 0.5−
4−
20
24
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(b) Previsoes
0 200 400 600 800 1000
0.00
0.05
0.10
0.15
0.20
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(c) V | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(d) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(e) φ = 0.7
−4
−2
02
4
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(f) Previsoes
0 200 400 600 800 10000.
000.
050.
100.
150.
20
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(g) V | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(h) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(i) φ = 0.95
−4
−2
02
4
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(j) Previsoes
0 200 400 600 800 1000
0.00
0.05
0.10
0.15
0.20
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(k) V | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(l) W | Dt
Figura 4.4: Resultados para uma replica simulada do modelo normal AR(1) com φ =
0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) estimando a variancia de evolucao via
quadratura de Gauss-Hermite.
56
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(a) Grade a posteriori
de W
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
de W
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(c) Grade a posteriori
de W
0.05 0.10 0.15 0.20 0.25
010
2030
40
(d) p(W | D1000)
0.05 0.10 0.15 0.20 0.25
010
2030
4050
(e) p(W | D1000)
0.05 0.10 0.15 0.20 0.25
010
2030
4050
(f) p(W | D1000)
Figura 4.5: Estimacao da variancia de evolucao W para a primeira replica simulada do
modelo normal AR(1) com φ ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a coluna, respectivamente).
57
0.0 0.2 0.4 0.6 0.8 1.00
24
68
φ = 0.5
0.00 0.05 0.10 0.15 0.20
010
2030
40
W=0.1
0.00 0.02 0.04 0.06 0.08 0.10
040
80
V=0.02
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
φ = 0.7
0.00 0.05 0.10 0.15 0.20
010
2030
40
W=0.1
0.00 0.02 0.04 0.06 0.08 0.10
040
80
V=0.02
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
010
2030
φ = 0.95
0.00 0.05 0.10 0.15 0.20
010
2030
40
W=0.1
0.00 0.02 0.04 0.06 0.08 0.10
040
80
V=0.02
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.6: Histogramas suavizados para a distribuicao das estimativas de φ, W e V (1a,
2a e 3a linhas, respectivamente) no tempo N , incondicionalente a W, com base nas 100
series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pontos representam a media amostral do
respectivo conjunto de estimativas pontuais E(φ | DN). A linha tracejada representa o
valor verdadeiro de φ.
4.2.2 Modelo normal com estrutura latente AR(2)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
Normal AR(2)
yt ∼ N(βt, V )
βt = φ1βt−1 + φ2βt−2 + ωt, ωt ∼ N(0,W ),
com V = 0.02 e W = 0.1. Para simulacao das series, considerou-se (φ1, φ2) = (0.1, 0.8),
que correspondem a raızes reais para o polinomio caracterıstico do processo AR(2) de
modulo 0.95 e 0.85, respectivamente. As distribuicoes a priori marginais para (V, φ1, β1)
sao as mesmas exibidas para o modelo com estrutura AR(1). Para φ2 especificou-se
φ2 | D0 ∼ T2.01(0, 0.5).
Primeiramente, consideramos a variancia dos erros de evolucao W conhecida no pro-
cesso de estimacao. Os resultados obtidos estao ilustrados nas figuras 4.7 e 4.8.
58
A figura 4.7 mostra resultados da estimacao da primeira replica do modelo normal com
estrutura AR(2), onde pode-se perceber que as estimativas acompanham os respectivos
parametros autorregressivos. As previsoes um passo a frente tambem acompanham a
serie real. Novamente, a variancia de observacao V nao esta sendo bem estimada mesmo
quando se usa todas as observacoes que compoem a serie simulada.
Ao analisar a figura 4.8 contendo as estimativas pontuais para os para os parametros
autorregressivos obtidas para cada uma das 100 series simuladas, percebe-se que, para
esta configuracao de (φ1, φ2), as estimativas de φ1 e φ2 apresentam pequeno vies mesmo
quando se especifica W = 0.1 (valor verdadeiro da variancia de evolucao).
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ1 | Dt )ICφ1 | Dt
(0.95)
(a) φ1 = 0.1
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ2 | Dt )ICφ2 | Dt
(0.95)
(b) φ2 = 0.8
−4
−2
02
46
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(c) Previsoes yt | Dt−1
0 200 400 600 800 1000
0.00
0.02
0.04
0.06
0.08
0.10
t
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(d) V | Dt
Figura 4.7: Resultados para a 1a replica simulada do modelo normal AR(2) com
φ = (φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor real
no processo de estimacao.
59
−0.4 −0.2 0.0 0.2 0.4
05
1015
20
φ1 = 0.1W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
φ2 = 0.8W = 0.1
−0.4 −0.2 0.0 0.2 0.4
05
1015
φ1 = 0.1W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
φ2 = 0.8W = 0.2
−0.4 −0.2 0.0 0.2 0.4
02
46
810
12
φ1 = 0.1W = 0.4
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
12
φ2 = 0.8W = 0.4
N=1000 N=250 N=50
Figura 4.8: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 con-
dicionais a W no tempo N com base nas 100 series simuladas do modelo normal AR(2).
Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φ1 | W,DN) (1a linha) e E(φ1 | W,DN) (2a linha). A linha tracejada representa o
valor verdadeiro de φ1 ou φ2.
60
Resultados obtidos estimando a variancia de evolucao
Considera-se agora a variancia dos erros de evolucao desconhecida. A priori marginal
para W (LogNormal com media 1 e variancia 1.718) e a mesma especificada para o
modelo normal AR(1), com uma grade de 15 pontos usada no processo de estimacao por
quadratura de Gauss-Hermite.
Para a primeira serie simulada, mantem-se basicamente as mesmas caracterısticas
exibidas na figura 4.7 para a evolucao sequencial das estimativas para os parametros au-
torregressivos agora que se esta estimando W, como podemos ver na figura 4.9. O mesmo
vale para as previsoes. A variancia observacional, por sua vez, e bastante superestimada.
A variancia de evolucao W se encontra bastante proxima do limite inferior do intervalo
de credibilidade a posteriori, portanto temos estimativas razoaveis para W.
A curva de densidade a posteriori aproximada para W na primeira replica do modelo
normal AR(2) e apresentada na figura 4.10, juntamente com os pontos da grade dinamica
para W.
A figura 4.11 mostra as estimativas a posteriori para os parametros estaticos com base
nas 100 series simuladas. A distribuicao das estimativas para a variancia observacional V
esta bastante deslocada com respeito ao verdadeiro valor V = 0.02 e que as estimativas
de φ1 apresentam um pequeno vieis.
61
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(a) φ1 = 0.1
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )
(b) φ2 = −0.8
−6
−4
−2
02
46
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(c) Previsoes
0 200 400 600 800 1000
0.00
0.05
0.10
0.15
0.20
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(d) V | Dt
0 200 400 600 800 10000.
00.
20.
40.
60.
81.
0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(e) W | Dt
Figura 4.9: Resultados para a primeira replica simulada do modelo normal AR(2) com
φ1 = 0.1, φ2 = 0.8 estimando a variancia de evolucao via quadratura de Gauss-Hermite.
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(a) Grade a posteriori
de W
0.05 0.10 0.15 0.20 0.25
05
1015
2025
30
(b) p(W | D1000)
Figura 4.10: Estimacao da variancia de evolucao W para a primeira replica simulada do
modelo normal AR(2) com φ1 = 0.1 e φ2 = 0.8 .
62
0.0 0.1 0.2 0.3 0.4 0.5
05
1015
20
φ1 = 0.1
−0.5 0.0 0.5 1.0
05
1015
20
φ2 = 0.8
0.0 0.1 0.2 0.3 0.4 0.5
05
1015
20
W=0.1
0.00 0.05 0.10 0.15
010
2030
40
V=0.02
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.11: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2
no tempo N com base nas 100 series simuladas do modelos normal AR(2). Os pontos
representam a media amostral do respectivo conjunto de estimativas pontuais E(φ | DN).
A linha tracejada representa o valor verdadeiro de φ1, φ2,W e V .
4.2.3 Modelo normal com estrutura latente AR(3)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
yt ∼ N(βt, V )
βt = φ1βt−1 + φ2βt−2 + φ3βt−3 + ωt, ωt ∼ N(0,W ),
com V = 0, 02 e W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2, φ3) =
(0.81, 0.77,−0.86), que pertence a regiao de estacionaridade do processo AR(3). As
distribuicoes a priori marginais sao as mesmas especificadas para o caso AR(1) e AR(2)
conforme descrito anteriormente, com φ3 | D0 ∼ T4.02(0, 0.5).
Nessa subsecao, a ordem do processo autorregressivo latente foi suposta maior do que
a das series simuladas com o intuito de verificar se o procedimento inferencial e capaz
de recuperar tambem a ordem do processo real. No caso, escolheu-se definir βt ∼ AR(5)
para a estimacao dos parametros do modelo e tem-se o interesse, portanto, em verificar
se as estimativas de φ4 e φ5 sao proximas de zero.
A figura 4.12 mostra resultados da estimacao para a primeira replica simulada do
modelo normal AR(3) supondo W conhecido igual a 0.1 (valor verdadeiro utilizado na
simulacao). As previsoes acompanham bem os valores da serie que parece apresentar
63
memoria longa, ou seja, valores relativamente distantes no passado da serie exercem in-
fluencia nao desprezıvel sobre o valor da serie no presente. As estimativas para φ1, φ2, φ3
nao estao muito distantes dos respectivos valores verdadeiros (os intervalos de credibi-
lidade se situam bem proximos aos verdadeiros valores). Para esta serie, identificou-se
ordem 4 para o processo autorregressivo, porem com estimativas para φ4 tendo magnitude
proxima de zero.
Na figura 4.13, podemos ver que as estimativas para os parametros autorregressivos se
distribuem ao redor dos valores corretos quando W=0.1, o que mostra que conseguimos,
em media, recuperar a ordem dos processos autorregressivos latentes quando conside-
ramos W=0.1 durante o processo de estimacao. Especificacoes de W maiores que 0.1
acarretam vies nas estimativas de φ1, φ2, φ3 e φ5. O mesmo pode ser observado para o
parametro V, conforme mostra a figura 4.14.
64
−4
−2
02
4
t901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(a) Preditiva yt | Dt−1
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ1 | Dt )ICφ1 | Dt
(0.95)
(b) φ1 = 0.81
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ2 | Dt )ICφ2 | Dt
(0.95)
(c) φ2 = 0.77
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ3 | Dt )ICφ3 | Dt
(0.95)
(d) φ3 = −0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ4 | Dt )ICφ4 | Dt
(0.95)
(e) φ4 = 0
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ5 | Dt )ICφ5 | Dt
(0.95)
(f) φ5 = 0
Figura 4.12: Resultados para a primeira replica simulada do modelo normal AR(3) com
φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao fixa em seu
valor real no processo de estimacao.
65
−1.0 −0.5 0.0 0.5 1.00
24
68
φ1 = 0.81W = 0.1
−1.0 −0.5 0.0 0.5 1.0
02
4
φ2 = 0.77W = 0.1
−1.0 −0.5 0.0 0.5 1.0
02
4
φ3 = − 0.86W = 0.1
−1.0 −0.5 0.0 0.5 1.0
02
4
φ4 = 0W = 0.1
−1.0 −0.5 0.0 0.5 1.0
02
46
φ5 = 0W = 0.1
−1.0 −0.5 0.0 0.5 1.0
04
8
φ1 = 0.81W = 0.2
−1.0 −0.5 0.0 0.5 1.0
02
46
φ2 = 0.77W = 0.2
−1.0 −0.5 0.0 0.5 1.0
02
46
φ3 = − 0.86W = 0.2
−1.0 −0.5 0.0 0.5 1.0
04
8
φ4 = 0W = 0.2
−1.0 −0.5 0.0 0.5 1.0
04
8
φ5 = 0W = 0.2
−1.0 −0.5 0.0 0.5 1.0
04
8
φ1 = 0.81W = 0.4
−1.0 −0.5 0.0 0.5 1.0
02
46
φ2 = 0.77W = 0.4
−1.0 −0.5 0.0 0.5 1.0
02
46
φ3 = − 0.86W = 0.4
−1.0 −0.5 0.0 0.5 1.0
02
46
8
φ4 = 0W = 0.4
−1.0 −0.5 0.0 0.5 1.0
04
8
φ5 = 0W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.13: Histogramas suavizados para a distribuicao das estimativas de φ condicio-
nalmente a W no tempo N com base nas 100 series simuladas do modelo normal AR(3).
Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φ | W,DN), i ∈ 1, . . . , 5. A linha tracejada representa o valor verdadeiro de φi.
0.00 0.02 0.04 0.06 0.08 0.10
040
80
V = 0.02W = 0.1
0.00 0.02 0.04 0.06 0.08 0.10
050
150
V = 0.02W = 0.2
0.00 0.02 0.04 0.06 0.08 0.10
040
080
0
V = 0.02W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.14: Histogramas suavizados para a distribuicao das estimativas de V no tempo
N com base nas 100 series simuladas do modelo normal AR(3) condicionalmente a W.
Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(V | W,DN). A linha tracejada representa o valor verdadeiro de V .
66
Resultados obtidos estimando a variancia de evolucao
Considera-se agora a variancia dos erros de evolucao desconhecida. A priori marginal
para W (LogNormal com media 1 e variancia 1.718) e a mesma especificada para o
modelo normal AR(1), com uma grade de 15 pontos utilizada no processo de estimacao
via quadratura de Gauss-Hermite.
As previsoes e estimativas para os parametros estaticos com base na primeira replica
simulada, conforme ilustra a figura 4.15, nao apresentam grandes mudancas em com-
paracao aquelas obtidas supondo W conhecido durante o processo de estimacao (vide
figura 4.12). As estimativas para a variancia de observacao e de evolucao sao razoaveis,
porem no caso da variancia de observacao V, o valor real esta proximo mas nao contido
nos intervalos de credibilidade a posteriori, conforme ilustra a figura 4.16.
Analisando as estimativas de φ, V W para as 100 series simuladas (figura 4.17), veri-
ficamos que elas se concentram ao redor dos respectivos valores utilizados na simulacao,
exceto para a variancia observacional, porem as estimativas pontuais sao proximas do
valor real 0.02 nesse caso. Em media, consegue-se recuperar a ordem dos processos au-
torregressivos latentes.
67
−4
−2
02
4
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(a) Preditiva yt | Dt−1
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(b) φ1 = 0.81
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )
(c) φ2 = 0.77
0 200 400 600 800 1000
−1.
5−
1.0
−0.
50.
00.
5
E( φ3 | Dt )E( φ3 | Dt ) ± 2 × Var( φ3 | Dt )
(d) φ3 = −0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ4 | Dt )E( φ4 | Dt ) ± 2 × Var( φ4 | Dt )
(e) φ4 = 0
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ5 | Dt )E( φ5 | Dt ) ± 2 × Var( φ5 | Dt )
(f) φ5 = 0
Figura 4.15: Resultados para a 1a replica simulada do modelo normal AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao W via quadratura de
Gauss-Hermite.
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(a) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
0.00 0.05 0.10 0.15 0.20
010
2030
40
(c) p(W | D1000)
0 200 400 600 800 1000
0.00
0.05
0.10
0.15
0.20
E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )
(d) V | Dt
Figura 4.16: Resultados referentes a estimacao da variancia de evolucao W e de ob-
servacao V para uma replica simulada do modelo normal AR(3) com φ = (φ1, φ2, φ3) =
(0.81, 0.77,−0.86).
68
−0.5 0.0 0.5 1.00
24
6
φ1 = 0.81
−0.5 0.0 0.5 1.0
01
23
4
φ2 = 0.77
−1.0 −0.5 0.0 0.5
02
46
φ3 = − 0.86
−0.5 0.0 0.5 1.0
01
23
4
φ4 = 0
−0.5 0.0 0.5 1.0
02
46
φ5 = 0
0.0 0.1 0.2 0.3 0.4 0.5
010
2030
40
W=0.1
0.00 0.02 0.04 0.06 0.08 0.10
040
8012
0
V=0.02
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.17: Histogramas suavizados para a distribuicao das estimativas de φi, i ∈
1, . . . , 5, W e V no tempo N com base nas 100 series simuladas do modelo normal
AR(3). Os pontos representam a media amostral do respectivo conjunto de estimativas
pontuais E(φi | DN), E(W | DN) e E(V | DN). A linha tracejada representa o valor
verdadeiro de φi, W e V .
4.3 Modelo Poisson
Descreve-se nesta secao alguns resultados da aplicacao da metolodogia sequencial pro-
posta a modelos dinamicos com resposta poisson. As series foram simuladas com variancia
de evolucao W = 0.1. Diferentemente do caso normal tratado na secao anterior, para os
modelos poisson descritos nesta secao, considerou-se tambem uma componente estatica
compondo o vetor de estados, alem da componente autorregressiva, representando o nıvel
base do preditor. Isso foi feito com o intuito de permitir que as series simuladas nao as-
sumissem apenas valores pequenos.
4.3.1 Modelo poisson com estrutura latente AR(1)
Todas as series de dados que constam nessa subsecao foram simuladas a partir do
modelo
69
yt ∼ Poisson(λt)
log λt = βt + µ
βt = φ1βt−1 + ωt, ωt ∼ N(0,W ),
com W = 0.1. Para simulacao das series, considerou-se φ1 ∈ 0.5, 0.7, 0.95 e µ = 1.
As prioris marginais especificadas foram φ1 | D0 ∼ [0, 0.5] e µ | D0 ∼ [0, 10], β1 | D0 ∼
[0, 10] independentes, lembrando que para os casos de nao-normalidade para a variavel
resposta a inferencia e feita em termos de media e variancia para os estados. O vetores de
medias e as matrizes de covariancias a priori descritos acima coincidem com o parametro
de locacao e escala da T-student multivariada utilizada como priori no instante inicial
para o vetor de estados estendido no caso normal. A mesma observacao sera valida para
os modelos Poisson AR(2) e AR(3) que serao descritos nas duas secoes a seguir.
Primeramente descreve-se os resultados obtidos considerando W conhecido (figuras
4.18, 4.19 e 4.20).
Na figura 4.18, percebe-se que a incerteza associada a estimacao de φ1 e muito menor
para o caso φ1 = 0.95 em comparacao aos demais, novamente devido ao fato de que o
processo autorregressivo associado (e por consequencia a serie de dados observada) possui
memoria mais longa. Por isso as previsoes tambem acompanham melhor a serie quando
se tem φ1 = 0.95. Ainda no caso φ1 = 0.95, observa-se um problema de identificacao
entre o nıvel µ e o processo autorregressivo βt. A soma de ambos, porem, e identificada
pelo modelo, como mostra a figura 4.19.
Em geral, considerando-se as 100 series simuladas, podemos verificar pela figura 4.20
que o parametro autorregressivo e mais facil de estimar para o valor 0.95 em comparacao
com os demais valores fixados. Especificacoes de W > 0.1 geram vies nas estimativas de
φ1, tal como observado no caso normal.
70
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(a) φ1 = 0.5
0 200 400 600 800 1000
0.6
0.7
0.8
0.9
1.0
1.1
1.2
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(b) µ = 1
−2
−1
01
2
t
901 925 950 975 1000
E( βt | Dt−1 )E( βt | Dt−1 ) + 2 Var( βt | Dt−1 )
(c) βt ∼ AR(1)
05
1015
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(d) Previsoes yt | Dt−1
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(e) φ1 = 0.7
0 200 400 600 800 1000
0.6
0.7
0.8
0.9
1.0
1.1
1.2
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(f) µ = 1
−2
−1
01
23
t901 925 950 975 1000
E( βt | Dt−1 )E( βt | Dt−1 ) + 2 Var( βt | Dt−1 )
(g) βt ∼ AR(1)
05
1015
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(h) Previsoes yt | Dt−1
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(i) φ1 = 0.95
0 200 400 600 800 1000
0.5
1.0
1.5
2.0
2.5
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(j) µ = 1
−6
−4
−2
02
t901 925 950 975 1000
E( βt | Dt−1 )E( βt | Dt−1 ) + 2 Var( βt | Dt−1 )
(k) βt ∼ AR(1)
05
1015
20
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(l) Previsoes yt | Dt−1
Figura 4.18: Resultados para a 1a replica simulada do modelo Poisson AR(1) com φ1 ∈
0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a variancia de evolucao
fixa em seu valor real no processo de estimacao.
71
0 50 100 150 200−
4−
20
24
t
E( βt + µ | Dt )E( βt + µ | Dt ) + 2 Var( βt + µ | Dt )
Figura 4.19: Estimativas a posteriori para a soma do nıvel do preditor com o processo
AR(1): βt + µ para a primeira replica simulada do modelo Poisson AR(1).
−0.5 0.0 0.5 1.0
01
23
45
φ = 0.5W = 0.4
−0.5 0.0 0.5 1.0
01
23
45
Den
sida
de
φ = 0.5W = 0.2
−0.5 0.0 0.5 1.0
01
23
45
Den
sida
de
φ = 0.5W = 0.4
−0.5 0.0 0.5 1.0
02
46
8
φ = 0.7W = 0.1
−0.5 0.0 0.5 1.0
02
46
8
Den
sida
de
φ = 0.7W = 0.2
−0.5 0.0 0.5 1.0
02
46
8
Den
sida
de
φ = 0.7W = 0.4
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
05
1015
φ = 0.95W = 0.1
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
05
1015
Den
sida
de
φ = 0.95W = 0.2
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
05
1015
Den
sida
de
φ = 0.95W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.20: Histogramas suavizados para a distribuicao das estimativas de φ condi-
cionalmente a W, no tempo N com base nas 100 series simuladas do modelo Poisson
AR(1). Os pontos representam a media amostral do respectivo conjunto de estimativas
E(φ | W,DN). A linha tracejada representa o valor verdadeiro de φ.
Resultados obtidos estimando a variancia de evolucao
Considera-se agora a variancia dos erros de evolucao desconhecida. A priori marginal
para W (LogNormal com media 1 e variancia 1.718) e a mesma especificada para os
modelos normais, com uma grade de 15 pontos no processo de estimacao via quadratura
de Gauss-Hermite.
72
A figura 4.21 mostra que o fato de estarmos estimando W gera um aumento consi-
deravel na incerteza sobre a estimacao dos parametros autorregressivos, o que nao se ob-
servou com tanta intensidade no caso normal. Ainda assim, as estimativas acompanham
bem os valores simulados para os processos autorregressivos e as previsoes acompanham
bem as series de dados simuladas (pelo menos para o caso em que φ = 0.95 e φ = 0.7 no
que se refere a previsao).
Analisando as estimativas para W na figura 4.22, vemos que se situam proximas do
verdadeiro valor 0.1 apesar de os intervalos de credibilidade a posteriori nao incluırem o
valor 0.1.
As estimativas pontuais de φ estao razoavelmente concentradas em torno dos respec-
tivos valores verdadeiros utilizados na simulacao, conforme mostra a figura 4.23.
73
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(a) φ1 = 0.5
0 200 400 600 800 1000
−0.
20.
20.
40.
60.
81.
0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(b) φ1 = 0.7
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(c) φ1 = 0.95
0 200 400 600 800 1000−0.
50.
00.
51.
0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(d) µ = 1
0 200 400 600 800 1000
0.4
0.6
0.8
1.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(e) µ = 1
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
2.5
3.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(f) µ = 1
−1.
00.
00.
51.
01.
52.
0
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(g) βt ∼ Ar(1)
−2
−1
01
23
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(h) βt ∼ Ar(1)
−4
−2
02
4
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(i) βt ∼ Ar(1)
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(j) Previsoes yt | Dt−1
05
1015
20
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(k) Previsoes yt | Dt−1
05
1015
20
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(l) Previsoes yt | Dt−1
Figura 4.21: Resultados para a 1a replica simulada do modelo Poisson AR(1) com φ1 ∈
0.5, 0.7, 0.95 (1a, 2a e 3a colunas respectivamente) estimando a variancia de evolucao.
74
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(a) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
de W
0.05 0.10 0.15 0.20 0.25
05
1015
20
(c) p(W | D1000)
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(d) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(e) Grade a posteriori
de W
0.05 0.10 0.15 0.20 0.25
05
1015
(f) p(W | D1000)
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(g) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(h) Grade a posteriori
de W
0.05 0.10 0.15 0.20 0.25
010
2030
40
(i) p(W | D1000)
Figura 4.22: Resultados referentes a estimacao da variancia de evolucao W para uma
replica simulada do modelo Poisson AR(1) com φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas
respectivamente).
75
−0.5 0.0 0.5 1.0
01
23
φ = 0.5
−0.5 0.0 0.5 1.0
01
23
45
67
φ = 0.7
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
05
1015
φ = 0.95
N=1000 N=250 N=50 φ
Figura 4.23: Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N com base nas 100 series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pontos representam
a media amostral do respectivo conjunto de estimativas pontuais E(φ | DN). A linha
tracejada representa o valor verdadeiro de φ.
4.3.2 modelo Poisson com estrutura latente AR(2)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
modelo Poisson AR(2)
yt ∼ Poisson(λt)
log λt = βt + µ
βt = φ1βt−1 + φ2βt−2 + ωt, ωt ∼ [0,W ],
com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2) = (0.1, 0.8). As prioris
marginais especificadas sao as mesmas descritas no modelo Poisson AR(1), com φ2 | D0 ∼
[0, 0.5].
A figura 4.24 mostra resultados da estimacao de φ1 e φ2 para a 1a repllica simulada
do modelo Poisson AR(2), fixando-se a variancia de evolucao em seu valor real 0.1.
Percebe-se que as estimativas de φ1 e φ2 acompanham os respectivos parametros a partir
do instante de tempo 300, aproximadamente. Apesar disso, o processo autorregressivo
76
nao parece ter sido tao bem estimado quanto em outros casos descritos anteriormente.
O nıvel do preditor consegue ser bem estimado pelo procedimento sequencial proposto
mesmo quando se dispoe de poucas observacoes.
Em geral, para as 100 replicas do modelo Poisson AR(1), obteve-se estimativas bem
proximas aos valores reais dos parametros autorregressivos considerando-se W=0.1, con-
forme ilustra a figura 4.25. O vieis decorrente de especificacoes erroneas de W e maior
para o parametro φ2 nessa configuracao, tal como foi observado no modelo normal AR(2).
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(a) φ1 = 0.1
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )
(b) φ1 = 0.8−
2−
10
12
34
5
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(c) βt ∼ AR(2)
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) + 2 Var( yt | Dt−1 )
(d) Previsoes yt | Dt−1
0 200 400 600 800 1000
0.5
1.0
1.5
2.0
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(e) µ = 1
Figura 4.24: Resultados para uma replica simulada do modelo Poisson AR(2) com
φ = (φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor real
no processo de estimacao.
77
−0.4 −0.2 0.0 0.2 0.4
02
46
810
φ1 = 0.1W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
φ2 = 0.8W = 0.1
−0.4 −0.2 0.0 0.2 0.4
02
46
810
Den
sida
de
φ1 = 0.1W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
02
46
8
Den
sida
de
φ2 = 0.8W = 0.2
−0.4 −0.2 0.0 0.2 0.4
02
46
8
Den
sida
de
φ1 = 0.1W = 0.4
0.0 0.2 0.4 0.6 0.8 1.0
01
23
45
6
Den
sida
de
φ2 = 0.8W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.25: Histogramas suavizados para a distribuicao das estimativas de φ condicionais
a W no tempo N com base nas 100 series simuladas com φ = (φ1, φ2) = (0.1, 0.8). Os
pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φ1 | W,DN) ou E(φ2 | W,DN). A linha tracejada representa o valor verdadeiro de φ1
e φ2.
Resultados obtidos estimando a variancia de evolucao
Novamente, especificou-se priori Log Normal com media 1 e variancia 1.7182 para
W, que foi sequencialmente estimado atraves de quadratura de Gauss Hermite com 15
pontos.
Percebe-se na figura 4.26 um ligeiro aumento na incerteza a posteriori para os parametros
do modelo devido ao fato de estarmos considerando W desconhecido. As estimativas de
W estao bem proximas do valor verdadeiro 0.1, nao apenas na primeira replica simulada
do modelo como nas demais, conforme mostra a figura 4.27. Assim, as estimativas para
φ1 e φ2 sob as 100 replicas nao apresentaram vies e se mantiveram concentradas ao redor
dos valores corretos.
Cabe ressaltar que nao foram observados problemas de identificacao do processo au-
torregressivo com o nıvel da serie em nenhuma das replicas simuladas, ao contrario do
que aconteceu no modelo Poisson AR(1) com φ1 = 0.95.
78
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(a) φ1 = 0.1
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )
(b) φ1 = 0.8
−3
−2
−1
01
23
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt−1 )
(c) βt ∼ Ar(2)
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(d) µ = 1
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(e) Previsoes yt | Dt−1
0 200 400 600 800 1000
0.0
0.1
0.2
0.3
0.4
0.5
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(f) W = 0.1
Figura 4.26: Resultados para uma replica simulada do modelo Poisson AR(2) com φ =
(φ1, φ2) = (0.1, 0.8) estimando a variancia de evolucao atraves de quadratura de Gauss
Hermite.
−0.5 0.0 0.5 1.0
02
46
810
φ1 = 0.1
−0.5 0.0 0.5 1.0
02
46
8
φ2 = 0.8
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
W = 0.1
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.27: Histogramas suavizados para a distribuicao das estimativas de φ no tempoN
com base nas 100 series simuladas do modelo Poisson AR(2) com φ = (φ1, φ2) = (0.1, 0.8).
Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φ1 | DN), E(φ2 | DN) e E(W | DN). A linha tracejada representa o valor verdadeiro
de φ1, φ2 e W.
79
4.3.3 modelo Poisson com estrutura latente AR(3)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
Poisson AR(3)
yt ∼ Poisson(λt)
log λt = βt + µ
βt = φ1βt−1 + φ2βt−2 + φ3βt−3 + ωt, ωt ∼ [0,W ],
com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2, φ3) = (0.81, 0.77,−0.86).
Aqui, a ordem do processo autorregressivo latente foi suposta maior do que a das series
simuladas com o intuito de verificar se o procedimento inferencial e capaz de recuperar
tambem a ordem do processo. Definimos βt ∼ AR(5) para a estimacao dos parametros
do modelo com o interesse em verificar se as estimativas de φ4 e φ5 sao proximas de zero.
As prioris marginais especificadas sao as mesmas descritas no modelo Poisson AR(2) com
φi ∼ [0, 0.5], i = 1, ..., 5.
A figura 4.28 mostra os resultados obtidos para a primeira replica simulada do modelo
Poisson AR(3). Os parametros aotorregressivos sao pontualmente bem estimados quando
se considera W conhecido igual ao valor utilizado na simulacao, porem, a incerteza a
posteriori e bastante grande. A magnitude das estimativas de φ4 e φ5 e pequena, o que
faz sentido, uma vez que o processo simulado e de ordem 3. Estimativas para µ, bem
como para o processo autorregressivo βt sao bastante boas, bem como as previsoes um
passo a frente.
Analisando as estimativas pontuais para as 100 series simuladas com W fixo na es-
timacao (figura 4.29), percebe-se que as estimativas nao apresentam vies quando W=0.1,
porem sao consideravelmente dispersas ao redor dos verdadeiros valores dos parametros
autorregressivos. Ao considerarW > 0.1, obtem-se estimativas viesadas para os parametros.
80
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(a) φ1 = 0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )
(b) φ2 = 0.77
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ3 | Dt )E( φ3 | Dt ) + 2 Var( φ3 | Dt )
(c) φ3 = −0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ4 | Dt )E( φ4 | Dt ) + 2 Var( φ4 | Dt )
(d) φ4 = 0
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ5 | Dt )E( φ5 | Dt ) + 2 Var( φ5 | Dt )
(e) φ5 = 0
0 50 100 150 200
−3
−2
−1
01
23
t
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(f) βt ∼ AR(3)
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(g) Nıvel: µ = 1
05
1015
2025
30
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(h) Previsoes: yt | Dt−1
Figura 4.28: Resultados para uma replica simulada do modelo Poisson AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao fixa em seu valor
real no processo de estimacao.
81
−1.0 −0.5 0.0 0.5 1.0
0.0
2.5
φ1 = 0.81W = 0.1
−1.0 −0.5 0.0 0.5 1.0
0.0
1.5
φ2 = 0.77W = 0.1
−1.0 −0.5 0.0 0.5 1.0
0.0
2.0
φ3 = − 0.86W = 0.1
−1.0 −0.5 0.0 0.5 1.0
0.0
1.5
φ4 = 0W = 0.1
−1.0 −0.5 0.0 0.5 1.0
0.0
1.5
φ5 = 0W = 0.1
−1.0 −0.5 0.0 0.5 1.0
0.0
2.5
Den
sida
de
φ1 = 0.81W = 0.2
−1.0 −0.5 0.0 0.5 1.0
0.0
1.5
Den
sida
de
φ2 = 0.77W = 0.2
−1.0 −0.5 0.0 0.5 1.0
0.0
2.0
Den
sida
de
φ3 = − 0.86W = 0.2
−1.0 −0.5 0.0 0.5 1.00.
01.
5
Den
sida
de
φ4 = 0W = 0.2
−1.0 −0.5 0.0 0.5 1.0
0.0
2.0
Den
sida
de
φ5 = 0W = 0.2
−1.0 −0.5 0.0 0.5 1.0
02
4
Den
sida
de
φ1 = 0.81W = 0.4
−1.0 −0.5 0.0 0.5 1.0
0.0
2.0
Den
sida
de
φ2 = 0.77W = 0.4
−1.0 −0.5 0.0 0.5 1.0
0.0
2.5
Den
sida
de
φ3 = − 0.86W = 0.4
−1.0 −0.5 0.0 0.5 1.0
0.0
2.0
Den
sida
de
φ4 = 0W = 0.4
−1.0 −0.5 0.0 0.5 1.0
02
4
Den
sida
de
φ5 = 0W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.29: Histogramas suavizados para a distribuicao das estimativas de φi, i1, . . . , 5
condicionais a W no tempo N com base nas 100 series simuladas do modelo Poisson
AR(3). Os pontos representam a media amostral do respectivo conjunto de estimativas
pontuais E(φi | W,DN). A linha tracejada representa o valor verdadeiro de φi.
Estimando variancia de evolucao via quadratura de Gauss-Hermite
Apresenta-se agora os resultados considerando a variancia evolucional W desconhe-
cida. O procedimento de estimacao de W e feito via quadratura de Gauss-Hermite. A
priori para W, tal como nos outros casos, e Log Normal com media 1 e variancia 1.718.
Analisando a figura 4.30, nao se nota muita diferenca na estimacao dos demais
parametros ao considerar W conhecido e ao estima-lo via quadratura de Gauss Her-
mite, exceto por um pequeno aumento na incerteza a posteriori em comparacao com o
caso W fixo.
Vemos que W esta sendo, em media, superestimado ao considerarmos as 100 replicas
simuladas (figuras 4.31 e 4.32), embora as estimativas em media estejam proximas de 0.1
(0.2 para N=1000, aproximadamente). Este pequeno vies na estimacao de W pode ser
uma explicacao para as estimativas viesadas tambem para os parametros autorregressivos,
tomando como base o que foi discutido sobre os resultados da figura 4.29.
82
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(a) φ1 = 0.81
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )
(b) φ2 = 0.77
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ3 | Dt )E( φ3 | Dt ) ± 2 × Var( φ3 | Dt )
(c) φ3 = −0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ4 | Dt )E( φ4 | Dt ) ± 2 × Var( φ4 | Dt )
(d) φ4 = 0
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ5 | Dt )E( φ5 | Dt ) ± 2 × Var( φ5 | Dt )
(e) φ5 = 0−
4−
3−
2−
10
12
3
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(f) βt ∼ AR(3)
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(g) Nıvel: µ = 1
05
1015
2025
30
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(h) Previsoes: yt | Dt−1
Figura 4.30: Resultados para uma replica simulada do modelo Poisson AR(3) com φ =
(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao.
83
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(a) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
de W
0.1 0.2 0.3 0.4 0.5 0.6
05
1015
(c) p(W | D1000)
Figura 4.31: Resultados referentes a estimacao da variancia de evolucao W para
a primeira replica simulada do modelo Poisson AR(3) com φ = (φ1, φ2, φ3) =
(0.81, 0.77,−0.86).
−0.5 0.0 0.5 1.0
01
23
45
φ1 = 0.81
−0.5 0.0 0.5 1.0
01
23
45
φ = 0.77
−1.0 −0.5 0.0 0.5
01
23
45
φ = − 0.86
−0.4 −0.2 0.0 0.2 0.4
01
23
45
φ4 = 0
−0.4 −0.2 0.0 0.2 0.4
01
23
45
φ5 = 0
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
W = 0.1
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.32: Histogramas suavizados para a distribuicao das estimativas de φi, i ∈
1, . . . , 5 e W no tempo N com base nas 100 series simuladas do modelo Poisson AR(3).
Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φi | DN) ou E(W | DN).
4.4 Modelo Binomial
Nesta secao, descreve-se os resultados do estudo de simulacao para os modelos dinamicos
com resposta Binomial(n, pt) onde n e considerado conhecido e igual a 10. Foi abordado
tambem o caso em que n = 1, porem, verificou-se que apenas com series de dados muito
84
longas (40000 observacoes ou mais), era possıvel recuperar os valores dos parametros
autorregressivos. Considerando esse fato como uma restricao indesejavel para a apli-
cabilidade a conjuntos de dados reais, optou-se por nao exibir resultados para o caso
n=1.
4.4.1 Modelo binomial com estrutura latente AR(1)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
Binomial Ar(1)
yt ∼ Binomial(10, pt)
log
(pt
1− pt
)= βt + µ
βt = φ1βt−1 + ωt, ωt ∼ N(0,W ),
com W = 0, 1. Para simulacao das series, considerou-se φ1 ∈ 0.5, 0.7, 0.95. Note-se
que estamos simulando um modelo com nıvel fixo no preditor linear. Isso foi feito com o
intuito de obter series mais concentradas em valores entre 5 e 10.
As prioris especificadas foram φ1 | D0 ∼ [0, 0.5], e µ | D0 ∼ [0, 10], β1 | D0 ∼ [0, 10]
independentes tal como no modelo Poisson AR(1).
Analisando os resultados obtidos para a primeira replica simulada do modelo bino-
mial AR(1) ilustrados na figura 4.33 , vemos que o parametro autorregressivo, bem como
o processo autorregressivo, sao bem estimados. As previsoes acompanham bem as ob-
servacoes em especial no caso em que φ1 = 0.95. O nıvel do preditor, em contrapartida, e
estimado com variancia muito pequena e os intervalos de credibilidade parecem distantes
do real valor µ = 1 mesmo com as estimativas pontuais de 0,9 e 0,11 para este parametro.
A figura 4.34 mostra que as estimativas de φ1 estao centradas no verdadeiro valor do
parametro quando W=0,1. Para W > 0.1, as estimativas apresentam vies, subestimando
φ1. A razao para termos observado a media dos histogramas suavizados para as estima-
tivas de φ1 deslocada em temos da moda se deve ao fato de que para uma das replicas
estimou-se um valor negativo para φ1. Isso acontceu nos tres casos φ1 = 0.5, 0.7, 0.95.
85
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(a) φ1 = 0.5
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(b) φ1 = 0.7
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(c) φ1 = 0.95
0 200 400 600 800 1000
0.6
0.7
0.8
0.9
1.0
1.1
1.2
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(d) µ = 1
0 200 400 600 800 1000
0.6
0.7
0.8
0.9
1.0
1.1
1.2
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(e) µ = 1
0 200 400 600 800 1000
0.6
0.7
0.8
0.9
1.0
1.1
1.2
t
E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )
(f) µ = 1
−5
−4
−3
−2
−1
01
2
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(g) βt ∼ AR(1)
−5
−4
−3
−2
−1
01
2
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(h) βt ∼ AR(1)
−5
−4
−3
−2
−1
01
2
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(i) βt ∼ AR(1)
02
46
810
12
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(j) Previsoes yt | Dt−1
02
46
810
12
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(k) Previsoes yt | Dt−1
05
1015
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(l) Previsoes yt | Dt−1
Figura 4.33: Resultados para uma replica simulada do modelo binomial AR(1) com
φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a variancia de
evolucao fixa em seu valor real no processo de estimacao.
86
−0.5 0.0 0.5 1.0
02
46
φ = 0.5W = 0.1
−0.5 0.0 0.5 1.0
02
46
φ = 0.5W = 0.2
−0.5 0.0 0.5 1.0
02
46
φ = 0.5W = 0.4
−0.5 0.0 0.5 1.0
02
46
φ = 0.7W = 0.1
−0.5 0.0 0.5 1.0
02
46
φ = 0.7W = 0.2
−0.5 0.0 0.5 1.0
02
46
φ = 0.7W = 0.4
0.5 0.6 0.7 0.8 0.9 1.0
010
20
φ = 0.95W = 0.1
0.5 0.6 0.7 0.8 0.9 1.0
010
20
φ = 0.95W = 0.2
0.5 0.6 0.7 0.8 0.9 1.0
010
20
φ = 0.95W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.34: Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N condicionalmente a W com base nas 100 series simuladas do modelo binomial AR(1).
Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais
E(φ | W,DN).
Resultados obtidos estimando W
Aqui, considera-se priori Log Normal com media 1 e variancia 1.718 para W, que sera
estimado via quadratura de Gauss Hermite com uma grade de 9 pontos.
Analisando a figura 4.35, pode-se perceber um aumento na incerteza a posteriori asso-
ciada a estimacao dos parametros autorregressivos na rimeira replica simulada, sobretudo
para os primeiros instantes de tempo. Os processos autorregressivos latentes continuam
sendo bem estimados e as previsoes sao capazes de acompanhar mudancas na serie de
dados para o caso φ = 0.95. Vemos na figura 4.36 que tambem obteve-se boas estimativas
para a variancia de evolucao W nessas replicas.
A figura 4.37 mostra que as estimativas para φ se concentram em torno de seu ver-
dadeiro valor, com pouca dispersao para os casos φ = 0.7 e φ = 0.95. O mesmo pode ser
verificado com respeito as estimativas para as variancias de evolucao.
87
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )
(a) φ1 = 0.5
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(b) φ1 = 0.7
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(c) φ1 = 0.95
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(d) µ = 1
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(e) µ = 1
0 200 400 600 800 1000
0.0
0.5
1.0
1.5
2.0
E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )
(f) µ = 1
−4
−2
02
4
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(g) βt ∼ AR(1)
−4
−2
02
4
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(h) βt ∼ AR(1)
−4
−2
02
4
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(i) βt ∼ AR(1)
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(j) Previsoes yt | Dt−1
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(k) Previsoes yt | Dt−1
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(l) Previsoes yt | Dt−1
Figura 4.35: Resultados para a primeira replica simulada do modelo binomial AR(1)
com φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a colunas, respectivamente) estimando a variancia de
evolucao.
88
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(a) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
0.05 0.10 0.15 0.20 0.25
05
1015
(c) p(W | D1000)
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(d) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(e) Grade a posteriori
0.05 0.10 0.15 0.20 0.25
05
1015
(f) p(W | D1000)
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(g) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(h) Grade a posteriori
0.05 0.10 0.15 0.20 0.25
05
1015
20
(i) p(W | D1000)
Figura 4.36: Resultados referentes a estimacao da variancia de evolucao W para uma
replica simulada do modelo binomial AR(1) com φ1 ∈ 0.5, 0.7, 0.95.
89
−0.5 0.0 0.5 1.0
0.0
1.0
2.0
3.0
φ = 0.5
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
W=0.1(φ = 0.5)
−0.5 0.0 0.5 1.0
02
46
φ = 0.7
0.0 0.2 0.4 0.6 0.8 1.0
02
46
812
W=0.1(φ = 0.7)
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
05
1015
20
φ = 0.95
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
W=0.1(φ = 0.95)
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.37: Histogramas suavizados para a distribuicao das estimativas de φ e W no
tempo N com base nas 100 series simuladas com do modelo binomial AR(1). Os pontos
representam a media amostral do respectivo conjunto de estimativas pontuais E(φ | DN)
e E(W | DN).
4.4.2 Modelo binomial com estrutura latente AR(2)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
Binomial AR(2)
yt ∼ Binomial(10, pt)
log
(pt
1− pt
)= βt + µ
βt = φ1βt−1 + φ2βt− 2 + ωt, ωt ∼ [0,W ],
com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2) = (0.1, 0.8).
As prioris marginais especificadas foram φi | D0 ∼ [0, 0.5], i ∈ 1, 2, β1 | D0 ∼
[0, 10]e µ | D0 ∼ [0, 10] independentes de forma a representar pouca informacao subjetiva
a respeito dos parametros.
Analisando a figura 4.38, percebe-se que, fixado W em seu valor verdadeiro, as es-
timativas para os parametros autorregressivos na primeira replica simulada do modelo
binomial AR(2) estao bem proximas dos valores usados na simulacao a partir do instante
de tempo 400 (aproximadamente). Essa nao e uma caracterıstica somente desta serie
90
simulada, como pode-se perceber na figura 4.39. Note-se que, como no caso do modelo
normal e poisson, a superestimacao da variancia dos erros de evolucao acarreta em vies
nas estimativas do processo autorregressivo, que e mais acentuado para φ2 do que para
φ1 nesse caso.
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(a) φ1 = 0.1
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
t
E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )
(b) φ2 = 0.8
−5
−4
−3
−2
−1
01
2
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(c) βt ∼ AR(2)
02
46
810
12
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(d) Previsoes yt | Dt−1
Figura 4.38: Resultados para a primeira replica simulada do modelo binomial AR(2)
considerando a variancia de evolucao fixa em seu valor real no processo de estimacao.
−0.4 0.0 0.2 0.4
02
46
810
12
φ1 = 0.1W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
12
φ2 = 0.8W = 0.1
−0.4 0.0 0.2 0.4
02
46
810
12
φ1 = 0.1W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
12
φ2 = 0.8W = 0.2
−0.4 0.0 0.2 0.4
02
46
810
12
φ1 = 0.1W = 0.4
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
12
φ2 = 0.8W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.39: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 con-
dicionalmente a W no tempo N com base nas 100 series simuladas do modelo binomial
AR(2). Os pontos representam a media amostral do respectivo conjunto de estimativas
pontuais E(φi | W,DN), i ∈ 1, 2.
91
Resultados obtidos estimando a variancia de evolucao
Aqui, considera-se priori Log Normal com media 1 e variancia 1.718 para W, que sera
estimado via quadratura de Gauss Hermite com uma grade de 9 pontos.
Em geral, as estimativas para os parametros autorregressivos para a primeira replica
simulada do modelo binomial AR(2), desta vez estimando W, nao mudam muito se
comparadas aquelas obtidas fixando-se W em seu verdadeiro valor (figuras 4.40 e 4.38).
Nota-se apenas um pequeno acrescimo nas incertezas a posteriori. O mesmo pode ser dito
a respeito das previsoes e do processo autorregressivo βt. As esimativas para a variancia
de evolucao W tambem estao bastante proximas do verdadeiro valor 0.1 (figura 4.41).
Analisando as estimativas pontuais para os parametros estaticos obtidas para as 100
replicas (figura 4.42), percebe-se que elas se concentram em torno dos valores verdadeiros
usados na simulacao para N=1000.
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(a) φ1 = 0.1
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )
(b) φ2 = 0.8
−4
−2
02
4
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(c) βt ∼ AR(2)
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(d) Previsoes yt | Dt−1
Figura 4.40: Resultados para a primeira replica simulada do modelo binomial AR(2)
estimando a variancia de evolucao.
92
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(a) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
de W
0.05 0.10 0.15 0.20 0.25
05
1015
20
(c) p(W | D1000)
Figura 4.41: Resultados referentes a estimacao da variancia de evolucao W para a pri-
meira replica simulada do modelo binomial AR(2).
−0.5 0.0 0.5 1.0
02
46
810
φ1 = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
01
23
45
6
φ2 = 0.8
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
W=0.1
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.42: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 no
tempo N com base nas 100 series simuladas com φ = (φ1, φ2) = (0.1, 0.8). Os pontos
representam a media amostral do respectivo conjunto de estimativas pontuais E(φi |
DN), i ∈ 1, 2 e E(W | DN).
93
4.4.3 Modelo binomial com estrutura latente AR(3)
Todas as series de dados que constam nessa secao foram simuladas a partir do modelo
Binomial AR(3)
yt ∼ Binomial(10, pt)
log
(pt
1− pt
)= βt + µ
βt = φ1βt−1 + φ2βt−2 + φ3βt−3 + ωt, ωt ∼ [0,W ],
com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2, φ3) = (0.81, 0.77,−0.86).
As series serao estimadas supondo um processo latente AR(5) com o objetivo de verificar
se as estimativas de φ4 e φ5 se concentram em torno de 0, identificando assim a ordem
do processo.
As prioris especificadas foram φi | D0 ∼ [0, 0.5], i ∈ 1, . . . , 5, β1 | D0 ∼ [0, 10]e µ |
D0 ∼ [0, 10] independentes de forma a representar pouca informacao subjetiva a respeito
dos parametros.
Analisando a inferencia para a primeira serie simulada do modelo binomial AR(3)
considerando W fixo igual a 0.1, percebe-se quebras estruturais nas estimativas pontuais
dos parametros autorregressivos a medida que se dispoe de mais observacoes, mas a partir
do instante de tempo 500 as estimativas ja se concentram proximas aos valores utilizados
na simulacao (figura 4.43).
Para as demais series, as estimativas pontuais nao se concentram em torno dos valores
reais para N=250 e N=50, mesmo fixando W=0.1 exceto para φ5 (figura 4.44). O vies
decorrente do fato de se fixar W > 0.1 e bastante grande, mesmo fazendo W=0.2, o
que indica que a inferencia para os parametros do processo latente AR(5) e altamente
sensıvel ao valor da variancia de evolucao.
94
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
t
E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )
(a) φ1 = 0.81
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )
(b) φ2 = 0.77
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ3 | Dt )E( φ3 | Dt ) + 2 Var( φ3 | Dt )
(c) φ3 = −0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ4 | Dt )E( φ4 | Dt ) + 2 Var( φ4 | Dt )
(d) φ4 = 0
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
t
E( φ5 | Dt )E( φ5 | Dt ) + 2 Var( φ5 | Dt )
(e) φ5 = 0
−5
−4
−3
−2
−1
01
2
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )
(f) βt ∼ AR(3)
05
1015
t901 925 950 975 1000
E( yt | Dt−1 )ICyt | Dt−1
(0.95)
(g) Previsoes yt | Dt−1
Figura 4.43: Resultados para a primeira replica simulada do modelo binomial AR(3)
considerando a variancia de evolucao fixa em seu valor real no processo de estimacao.
95
0.0 0.2 0.4 0.6 0.8 1.00
24
6
φ1 = 0.81W = 0.1
0.0 0.2 0.4 0.6 0.8 1.0
02
46
φ2 = 0.77W = 0.1
−1.0 −0.8 −0.6 −0.4 −0.2 0.0
02
46
φ3 = − 0.86W = 0.1
−0.4 −0.2 0.0 0.2 0.4
02
46
φ4 = 0W = 0.1
−0.4 −0.2 0.0 0.2 0.4
02
46
0.0 0.2 0.4 0.6 0.8 1.0
02
46
φ1 = 0.81W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
02
46
φ2 = 0.77W = 0.2
−1.0 −0.8 −0.6 −0.4 −0.2 0.00
24
6
φ3 = − 0.86W = 0.2
−0.4 −0.2 0.0 0.2 0.4
02
46
φ4 = 0W = 0.2
−0.4 −0.2 0.0 0.2 0.4
02
46
φ5 = 0W = 0.2
0.0 0.2 0.4 0.6 0.8 1.0
02
46
φ1 = 0.81W = 0.4
0.0 0.2 0.4 0.6 0.8 1.0
02
46
φ2 = 0.77W = 0.4
−1.0 −0.8 −0.6 −0.4 −0.2 0.0
02
46
φ3 = − 0.86W = 0.4
−0.4 −0.2 0.0 0.2 0.4
02
46
φ4 = 0W = 0.4
−0.4 −0.2 0.0 0.2 0.4
02
46
φ5 = 0W = 0.4
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.44: Histogramas suavizados para a distribuicao das estimativas de φi condici-
onais a W no tempo N com base nas 100 series simuladas do modelo binomial AR(3)
com φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86). Os pontos representam a media amostral do
respectivo conjunto de estimativas pontuais E(φi | W,DN), i ∈ 1, . . . , 5.
Resultados obtidos estimando a variancia de evolucao
Aqui, considera-se priori Log Normal com media 1 e variancia 1.718 para W, que sera
estimado via quadratura de Gauss Hermite com uma grade de 9 pontos.
Analisando a inferencia para a primeira serie simulada do modelo binomial AR(3),
vemos que a incerteza a posteriori para estimacao dos parametros autorregressivos e
bastante elevada, mas as estimativas pontuais estao proximas dos valores usados na si-
mulacao a partir do instante de tempo 500 (figura 4.45). Note-se que a evolucao temporal
das estimativas dos parametros autorregressivos se diferencia bastante do que foi obser-
vado considerando W fixo igual a 0.1. O valor 0.1 nao esta contido nos intervalos de
credibilidade a posteriori para W, que ao final esta sendo estimada pontualmente entre
96
0.15 e 0.2, conforme mostra a figura 4.46.
Analisando as estimativas pontuais para as 100 replicas simuladas (figura 4.47), vemos
que W esta sendo superestimado, o que explica o vies observado nas estimativas dos
parametros autorregressivos.
0 200 400 600 800 1000
−0.
50.
00.
51.
01.
5
E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )
(a) φ1 = 0.81
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )
(b) φ2 = 0.77
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ3 | Dt )E( φ3 | Dt ) ± 2 × Var( φ3 | Dt )
(c) φ3 = −0.86
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ4 | Dt )E( φ4 | Dt ) ± 2 × Var( φ4 | Dt )
(d) φ4 = 0
0 200 400 600 800 1000
−1.
0−
0.5
0.0
0.5
1.0
E( φ5 | Dt )E( φ5 | Dt ) ± 2 × Var( φ5 | Dt )
(e) φ5 = 0
−4
−2
02
4
t901 925 950 975 1000
E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )
(f) βt ∼ AR(3)
05
1015
901 925 950 975 1000
E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )
(g) Previsoes yt | Dt−1
Figura 4.45: Resultados para a primeira replica simulada do modelo binomial AR(3)
estimando a variancia de evolucao.
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )
(a) W | Dt
0 200 400 600 800 1000
0.0
0.2
0.4
0.6
0.8
1.0
tempo
(b) Grade a posteriori
0.05 0.10 0.15 0.20 0.25
05
1015
(c) p(W | D1000)
Figura 4.46: Resultados referentes a estimacao da variancia de evolucao W para a prieira
replica simulada do modelo nbinomial AR(3).
97
−0.5 0.0 0.5 1.0
0.0
1.0
2.0
3.0
φ1 = 0.81
−0.5 0.0 0.5 1.0
0.0
1.0
2.0
φ2 = 0.77
−1.0 −0.5 0.0 0.5
0.0
1.0
2.0
φ3 = − 0.86
−0.5 0.0 0.5 1.0
0.0
1.0
2.0
φ4 = 0
−0.5 0.0 0.5 1.0
0.0
1.0
2.0
3.0
φ5 = 0
0.0 0.2 0.4 0.6 0.8 1.0
02
46
812
W=0.1
N=1000 N=250 N=50 Valor verdadeiro
Figura 4.47: Histogramas suavizados para a distribuicao das estimativas de φ no tempo
N com base nas 100 series simuladas do modelo binomial AR(3) com φ = (φ1, φ2, φ3) =
(0.81, 0.77,−0.86). Os pontos representam a media amostral do respectivo conjunto de
estimativas pontuais E(φi | DN), i ∈ 1, . . . , 5 e E(W | DN).
4.5 Conclusoes do estudo simulado
Apresentou-se neste capıtulo uma aplicacao da metodologia sequencial bayesiana des-
crita no capıtulo 3 para inferencia em modelos dinamicos nao-lineares com resposta
na famılia exponencial. Basicamente, estende-se o vetor de estados de modo a incluir
parametros que compoem a matriz de evolucao Gt enquanto a variancia de evolucao de
componentes dinamicas e estimada via quadratura de Gauss-Hermite. Para os parametros
pertencentes ao vetor de estados estendido, a inferencia em modelos nao-gaussianos e feita
em termos de media e variancia apenas, mas para a componente estimada via quadratura
de Gauss Hermite, e possıvel obter aproximacao para sua curva de densidade e, a partir
dela, estimar outras medidas referentes a posteriori, como quantis e moda, por exemplo,
apesar de nao o termos feito neste momento.
Estudou-se a aplicacao desta metodologia no contexto de modelos dinamicos gaussi-
anos e nao-gaussianos (poisson e binomial) com estrutura autorregressiva latente como
componente do vetor de estados. De modo geral, verificou-se bons resultados na es-
timacao dos parametros autorregressivos e da variancia de evolucao para series de ta-
manho 1000 e, em alguns casos, para series de tamanho 250. Para series curtas (50 ob-
98
servacoes) nao foram obtidos resultados razoaveis na grande maioria dos casos. Verificou-
se tambem que subestimacao e superestimacao da variancia de evolucao gera vies nas
estimativas dos parametros autorregressivos.
Nos modelos normais, obteve-se dificuldades em estimar a variancia observacional,
mesmo em alguns casos nos quais a inferencia foi feita fixando a variancia de evolucao.
No que diz respeito a verificacao da ordem do processo autorregressivo, propos-se
verificar se a magnitude das estimativas pontuais dos parametros autorregressivos de
ordem mais altas eram proximas de zero. No caso normal, esse procedimento simples
se mostrou razoavel, porem e preciso considerar o fato de que a variancia observacional
fixada na simulacao era bastante baixa e, portanto, a ”variabilidade adicional”ao processo
autorregressivo latente (representada pela distribuicao de probabilidades das observacoes)
era bastante baixa. Para valores mais elevados, espera-se que os resultados sejam mais
semelhantes aos obtidos com resposta Poisson e binomial. Nesses dois ultimos casos,
em media nao conseguimos recuperar a ordem dos processos autorregressivos. Nesse
sentido, talvez seja mais recomendavel aumentar progressivamente a ordem do processo
autorregressivo latente ate que se comece a observar estimativas proximas de zero e entao
inferir sobre a ordem do processo.
Sobre o numero de pontos na grade adaptativa de Gauss Hermite para a variancia
de observacao, tentou-se utilizar 9 pontos para as series com distribuicao normal e Pois-
son, tal como feito na binomial, porem obtivemos matrizes de covariancias nao-positivas
definidas para a posteriori dos estados em alguns instantes de tempo para algumas das
series simuladas, o que foi contornado ao aumentar o numero de pontos para 15. Realizar
as interpolacoes do metodo de Gauss-Hermite nas entradas da matriz de Choleskey dos
estados (ao inves de intorpolar diretamente as entradas da matriz de covariancias) devera
resolver o problema e tal alternativa sera implementada em trabalhos futuros.
Por fim, exibe-se na tabela 4.1 o tempo computacional medio para implementacao
da metodologia sequencial proposta aos modelos do estudo simulado. Verifica-se que
nao foram necessarios muito mais do que 30 segundos para realizar a inferencia para as
1000 observacoes que compoem cada uma das series simuladas. A diferenca em termos de
tempo computacional observada nos casos AR(3) em relacao aos demais e notavel, porem
99
e preciso ressaltar que estamos propondo um modelo AR(5) no processo de estimacao e
que portanto as matrizes de covariancia e vetores de media para os estados tem dimensao
10 ou 11 (dependendo da presenca ou nao do nıvel do preditor a ser estimado). Como
as interpolacoes dos vetores de medias e matrizes de covariancia a posteriori sao feitas
entrada por entrada, temos de 55 a 66 funcoes para serem interpoladas a cada instante
de tempo. Sendo assim, considera-se o tempo computacional para implementacao da
metodologia proposta bastante baixo, o que possibilita realizacao de inferencia para todos
os parametros desconhecidos sequencialmente e em tempo real.
Tabela 4.1: Tempo computacional medio em segundos para implementacao da metodo-
logia sequencial baseada na expansao do vetor de estados e uso da quadratura de Gauss-
Hermite aos modelos dinamicos normais, poisson e binomial com estrutura latente AR(1),
AR(2) e AR(3). Foram utilizados 15 pontos na quadratura de Gauss-Hermite.
AR(p) Normal Poisson Binomial
1 9.207 7.914 6.281
2 11.93 10.316 7.285
3 30.687 31.109 25.12
100
Capıtulo 5
Aplicacao a dados reais
5.1 Introducao
Neste capıtulo, apresenta-se uma aplicacao da metodologia sequencial de inferencia
descrita neste trabalho a dados reais no contexto de epidemiologia. Mais especificamente,
estuda-se a relacao entre condicoes atmosfericas (concentracao de poluente, temperatura
e umidade) e numero de obitos por doencas respiratorias. O interesse maior neste capıtulo
e estudar a aplicacao de funcao transferencia em modelos dinamicos e a avaliar a eficiencia
da metodologia sequencial proposta nesse contexto. O capıtulo esta estruturado da se-
guinte forma: na secao 5.2, descreve-se o conjunto de dados utilizados, e a secao 5.3
descreve os modelos dinamicos poisson com funcao de transferencia que serao utiliza-
dos para ajuste aos dados reais. Na subsecao 5.3.1, apresenta-se um breve estudo de
simulacao em que se procura obter uma serie artificial similar a serie de dados reais com
o objetivo de verificar a eficiencia do metodo proposto para estimacao dos parametros no
contexto de modelos de poisson com funcao de transferencia. Nesta secao, apresenta-se
ainda uma comparacao do metodo sequencial com os esquemas MCMC descritos em Al-
ves et al. (2010), em que os autores utilizam propostas de Metropolis construıdas segundo
Gamerman (1998) aplicados a esse mesmo conjunto de dados. A subsecao 5.3.2 descreve
os modelos ajustados aos dados reais e mostra resultados da inferencia sequencial para
as quantidades desconhecidas. Por fim, a secao 5.4 apresenta as conclusoes da aplicacao
aos dados reais.
101
5.2 Descricao do conjunto de dados
A variavel de interesse do conjunto de dados utilizado para ilustrar a implementacao
da metodologia sequencial descrita no capıtulo 3 e a contagem diaria de obitos de criancas,
devido a doencas respiratorias, na cidade de Sao Paulo durante os anos de 1994 a 1997,
totalizando 1461 observacoes. Como covariaveis, temos as temperaturas mınimas (em
oC), umidade relativa do ar media (%) e nıvel medio de monoxido de carbono em partes
por milhao (ppm), todas medidas diariamente. Atraves da figura 5.1 pode-se verificar
que, em geral, valores elevados para o numero de obitos por doenca respiratoria acorrem
quando a concentracao de monoxido de carbono e alta e quando temperatura e umidade
sao baixas. E possıvel observar, alem disso, um comportamento sazonal na serie de
obitos, que parece apresentar uma tendencia de queda ao longo do tempo.
02
46
810
12
Jan1994
May1994
Sep1994
Jan1995
May1995
Sep1995
Jan1996
May1996
Sep1996
Jan1997
May1997
Sep1997
Dec1997
(a) Serie de obitos
02
46
Jan1994
May1994
Sep1994
Jan1995
May1995
Sep1995
Jan1996
May1996
Sep1996
Jan1997
May1997
Sep1997
Dec1997
(b) Concentracao de monoxido de carbono
(ppm)
−4
−3
−2
−1
01
2
Jan1994
May1994
Sep1994
Jan1995
May1995
Sep1995
Jan1996
May1996
Sep1996
Jan1997
May1997
Sep1997
Dec1997
(c) Umidade
−4
−3
−2
−1
01
2
Jan1994
May1994
Sep1994
Jan1995
May1995
Sep1995
Jan1996
May1996
Sep1996
Jan1997
May1997
Sep1997
Dec1997
(d) Temperatura (oC)
Figura 5.1: Series temporais da variavel resposta e das regressoras.
102
Por questoes de simplicidade, daqui por diante iremos nos referir a variavel resposta
como numero de obitos, ou numero de obitos por doenca respiratoria, ao inves de usar
a denominacao mais precisa: numero de obitos de criancas com menos de 5 anos por
doenca respiratoria na cidade de Sao Paulo.
5.3 Descricao dos modelos propostos
Existem diversos modelos discretos que poderiam ser usados para modelar contagens,
como a Poisson, Poisson inflacionada de zeros, binomial, binomial negativa, entre outras.
Aqui, optou-se por modelar a variavel resposta, numero de obitos por doenca respiratoria,
como uma Poisson.
E bastante plausıvel pensar que fatores atmosfericos como concentracao de poluente,
temperatura e umidade estejam, de alguma forma, relacionadas a ocorrencia de problemas
respiratorios. A observacao das series temporais que constam na figura 5.1 reforca essa
conjectura. Por essas razoes, considerou-se importante incorporar tais regressoras na
modelagem da serie de obitos.
Avaliou-se diferentes formas de impacto do poluente, temperatura e umidade sobre a
serie de obitos. Primeiramente, nao se acredita que quaisquer dessas regressoras afetem
de imediato o numero de obitos observados, ou seja, nao acreditamos que uma elevacao
na concentracao de poluente num determinado dia seja capaz de gerar qualquer impacto
sobre o numero de obitos observados naquele mesmo dia, o mesmo sendo valido para
temperatura e umidade. Porem, e razoavel pensar que tais eventos afetem o numero de
obitos observados em dias futuros e por isso considerou-se medicoes defasadas das regres-
soras sobre a resposta. Em todos os modelos propostos, consideramos uma defasagem
de 3 dias para o poluente, 2 dias para a temperatura e 3 para umidade, em relacao a
observacao do numero de obitos no dia corrente. Esses valores foram definidos escolhendo
o trio (dpol, dtemp, dumid) ∈ 1, . . . , 63 que maximizava a correlacao linear marginal das
regressoras com o logaritmo da resposta.
Em cada um dos modelos propostos, considera-se uma das regressoras (poluente, tem-
peratura ou umidade) com impacto sobre o preditor descrito por uma funcao de trans-
103
ferencia. Assim, podemos verificar, por exemplo, o horizonte de impacto da regressora
sobre o numero de obitos em dias futuros, como sera ilustrado na subsecao 5.3.2.
Alem disso, todos os modelos propostos incluem um bloco sazonal de regressoras de
modo a captar as oscilacoes periodicas na serie de obitos, alem de um nıvel base no
preditor linear.
Os modelos 1 a 3 descritos a seguir consideram o efeito latente do poluente, tempe-
ratura e umidade, respectivamente, com evolucao dinamica determinada pela funcao de
transferencia TF (1, d, 1), com d = 2 (efeito referente a temperatura) ou d = 3 (efeito
referente a poluente ou umidade).
Modelo 1
yt ∼ Poisson(λt)
log λt = Et + α + δtempTempt−2 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γPolt−3
Modelo 2
yt ∼ Poisson(λt)
log λt = Et + α + δpolPolt−3 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γTempt−2
Modelo 3
yt ∼ Poisson(λt)
log λt = Et + α + δpolPolt−3 + δtempTempt−2 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γUmidt−3
104
Os modelos 4 a 6 descritos a seguir consideram o efeito latente do poluente, tempera-
tura e umidade, respectivamente, descrito pela funcao de transferencia TF (1, d, 1) com
choques aleatorios iid representados pela sequencia εt.
Modelo 4
yt ∼ Poisson(λt)
log λt = Et + α + δtempTempt−2 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γPolt−3 + εt, εt ∼ [0,W ]
Modelo 5
yt ∼ Poisson(λt)
log λt = Et + α + δpolPolt−3 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γTempt−2 + εt, εt ∼ [0,W ]
Modelo 6
yt ∼ Poisson(λt)
log λt = Et + α + δpolUmidt−3 + δtempTempt−2 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γUmidt−3 + εt, εt ∼ [0,W ]
Os modelos 7 a 9 descritos a seguir consideram o efeito latente do poluente, tempera-
tura e umidade, respectivamente, descrito pela funcao de transferencia TF (1, d, 1) com
resposta imediata ao impulso variando no tempo segundo um passeio aleatorio simetrico.
Nesses modelos, a resposta ao impulso da regressora varia, nao so de acordo com o ho-
rizonte de tempo entre a medicao da regressora e a observacao do desfecho no futuro,
mas tambem de acordo com o instante de tempo em que a regressora e observada. Em
105
termos praticos, estes modelos permitem, por exemplo, que a influencia cumulativa da
regressora sobre o numero de obitos em horizontes futuros seja diferente ao decorrer dos
anos.
Modelo 7
yt ∼ Poisson(λt)
log λt = Et + α + δtempTempt−2 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γtPolt−3
γt = γt−1 + εt, εt ∼ [0,W ]
Modelo 8
yt ∼ Poisson(λt)
log λt = Et + α + δpolPolt−3 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γtTempt−2
γt = γt−1 + εt, εt ∼ [0,W ]
Modelo 9
yt ∼ Poisson(λt)
log λt = Et + α + δpolPolt−3 + δtempTempt−2 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γtUmidt−3
γt = γt−1 + εt, εt ∼ [0,W ]
A metodologia sequencial de estimacao proposta para os modelos 1 a 9 consiste em
expandir o vetor de estados, incluindo os hiperparametros φ e γ (ou γt nos modelos 7,
8 e 9). Nos modelos que apresentam evolucao estocastica, a variancia e estimada por
quadratura de Gauss-Hermite.
106
5.3.1 Simulacao
Para avaliar se a metodologia sequencial proposta consegue recuperar os valores dos
parametros dos modelos descritos anteriormente, foi gerada uma serie artificial com base
no modelo 7:
yt ∼ Poisson(λt)
log λt = Et + α + δtempTempt−2 + δumidUmidt−3 + δcoscos
(2πt
365
)+ δsensen
(2πt
365
)Et = φEt−1 + γtPolt−3
γt = γt−1 + εt, εt ∼ [0,W ]
que considera o efeito latente do poluente como funcao de transferencia TF(1,3,1) com
dinamica na resposta imediata ao impulso segundo um passeio aleatorio.
Para a simulacao, fixou-se W = 10−5, δtemp = 0.01, δumid = 0.009, δsen = 0.8, δcos =
0.1, φ = 0.8, α = 1.
Fazemos uma comparacao com as estimativas obtidas via MCMC, e tambem uti-
lizando fatores de desconto para especificacao da sequencia de variancias de evolucao.
Como foi fixado um valor baixo para W , utilizou-se fator de desconto bastante proximo
de 1 no processo de estimacao (0.99 mais precisamente). A estimacao via MCMC foi feita
com base em Gamerman (1998), em que o modelo e reparametrizado em funcao dos erros
de evolucao e, a partir das cadeias simuladas para os erros, constroi-se a amostra simu-
lada da posteriori para os estados. A implementacao deste esquema MCMC a modelos de
funcao de transferencia, tratada em (Alves et al., 2010), foi feita em linguagem Fortran,
simulando uma cadeia de 50000 iteracoes, das quais foram discartadas as 10000 primeiras
para obtencao das amostras a posteriori, bem como das medidas resumo a posteriori.
As distribuicoes a priori marginais utilizadas no procedimento MCMC foram W |
D0 ∼ GamaInv(10−5, 10−5), δtemp | D0 ∼ N(0, 10−5), δumid | D0 ∼ N(0, 10−5), δsen |
D0 ∼ N(0, 10−5), δcos | D0 ∼ N(0, 10−5), α | D0 ∼ N(0, 10−5), φ | D0 ∼ U(0, 1),
que consistem em distribuicoes bastante vagas em termos de informacao subjetiva sobre
107
os parametros. Para o procedimento sequencial baseado na expansao e linearizacao do
vetor de estados, considerou-se prioris marginais δtemp | D0 ∼ [0, 100], δumid | D0 ∼
[0, 100], δsen | D0 ∼ [0, 100], δcos | D0 ∼ [0, 100], α | D0 ∼ [0, 100], φ ∼ [0.5, 0.02]. Para
o procedimento que utiliza quadratura de Gauss Hermite para estimar a variancia de
evolucao, considerou-se priori Log Normal para W , com media 0,01 e variancia 0,1. Note-
se que as variancias marginais especificadas a priori nos esquemas sequenciais sao menores
do que as que foram adotadas no esquema MCMC. Utilizando 105 para as variancias a
priori nos esquemas sequenciais, obtivemos problemas numericos que impediram a ob-
tencao das estimativas a posteriori. Entretando, note-se, que dada a magnitude baixa dos
valores verdadeiros fixados para os parametros durante a simulacao, ainda consideramos
vagas as prioris sob os esquemas sequenciais.
Como observacao final a respeito das distribuicoes marginais a priori adotadas nos
esquemas sequenciais, a priori marginal referente a φ foi escolhida de modo que a media ±
3 desvios padroes resultassem em valores proximos de 0 e de 1, de modo que, se tivessimos
normalidade a priori, esperarıamos valores entre 0 e 1 para φ com probabilidade quase
igual a 1.
Os resultados da aplicacao das tres metodologias ao conjunto de dados artificiais sao
ilustrados nas figuras 5.2, 5.3 e 5.4. Em geral, as 3 figuras mostram resultados bastante
proximos sob as 3 metodologias adotadas.
A figura 5.2 mostra que os intervalos de credibilidade a posteriori para os parametros
estaticos contem os valores verdadeiros. Note-se que os intervalos obtidos sequencial-
mente sao mais largos que os intervalos obtidos via MCMC, apesar da diferenca ser
muito pequena.
108
0.0 0.2 0.4 0.6 0.8 1.0
φα
δsen
δtempδumid
δcos
Descontos Gauss−Hermite MCMC
Figura 5.2: Intervalos de credibilidade a posteriori (media ± 2 desvios) para os
parametros estaticos do modelo 7, condicionalmente a toda a serie de dados, obtidos
via metodologia sequencial e via MCMC.
A dinamica que rege a trajetoria da resposta imediata ao impulso no tempo consegue
ser captada pelos tres procedimentos de estimacao, conforme ilustra a figura 5.3. Como
as estimativas dos parametros via MCMC sao feitas condicionalmente a toda a serie de
dados, a comparacao foi feita considerando as estimativas suavizadas no contexto sequen-
cial. Para obter estimativas suavizadas nesse contexto, fez-se a suposicao de normalidade
conjunta do vetor γ1:T = (γ1, . . . , γT ), em que T e o ultimo instante de tempo da serie.
Para aproximar as estimativas suavizadas nesse contexto, foi feita a suposicao de
normalidade conjunta para o vetor γ1:T | W,DT . Nessas circunstancias, E(γ1:T | W,DT )
e V ar(γ1:T | W,DT ) coincidem com o vetor de medias e matriz de covariancias que se
obtem em West e Harrison (1997) pp. 112 a 115 supondo normalidade para a variavel
resposta. A dependencia em W e suprimida calculando as integrais
∫ ∞0
E(γ1:T | W,DT )p(W | DT )dW
e
∫ ∞0
V ar(γ1:T | W,DT )p(W | DT )dW
109
via quadratura de Gauss-Hermite utilizando a grade de pontos e os respectivos pesos
obtidos ao final do algoritmo para inferencia sequencial.
A figura 5.3 mostra uma grande proximidade entre as estimativas sequenciais obtidas
com quadratura de Gauss-Hermite e MCMC. Utilizando fator de desconto, as diferencas
em comparacao a metodologia MCMC sao mais claras, o que e intuitivo uma vez que, com
fatores de desconto, supoe-se as variancias Wt conhecidas variando ao longo do tempo,
portanto se diferenciam mais em relacao ao modelo estimado via MCMC.
No que diz respeito a estimacao da variancia de evolucao W , a figura 5.4 mostra uma
grande similaridade entre a densidade aproximada obtida via quadratura e a amostra a
posteriori fornecida pelo algoritmo MCMC. Ambas as metodologias geram estimativas
pontuais bastante proximas do verdadeiro valor de W .
0 200 400 600 800 1000 1200 1400
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Resposta imediata ao impulso
tempo
Gauss−HermiteDescontosMCMCγt simulado
Figura 5.3: Funcao de resposta imediata ao impulso (γt) estimada sequencialmente e
via MCMC no modelo 7. Exibe-se a serie real e intervalos de credibilidade a posteriori
(media ± 2 desvios) condicionalmente a toda a serie de dados.
110
W | D1000
Den
sida
de
0e+00 1e−05 2e−05 3e−05 4e−05 5e−05
010
000
2000
030
000
4000
050
000
6000
070
000
Figura 5.4: Histograma (MCMC) e curva de densidade aproximada (metodologia sequen-
cial) para a variancia de evolucao a posteriori no modelo 7. Curva obtida com 15 pontos
na quadratura de Gauss-Hermite.
5.3.2 Aplicacao aos dados
Na subsecao 5.3.1, verificou-se maior proximidade dos resultados da metodologia se-
quencial em relacao aos resultados via MCMC quando usavamos a quadratura de Gauss-
Hermite. Portanto, escolheu-se a quadratura, em detrimento da especificacao via fator
de desconto, para estimacao dos modelos 1 a 9 propostos no inıcio desta secao.
Adotou-se para cada um dos modelos as mesmas prioris marginais adotadas na si-
mulacao descrita na subsecao anterior, com 15 pontos compondo a grade de Gauss-
Hermite.
Os nove modelos foram comparados de forma a maximizar a verossimilhanca preditiva.
Conforme mostra a tabela 5.1, o melhor modelo dentre os nove ajustados foi o modelo 4,
que considera efeito de funcao de transferencia TF(1,3,1) com erros iid para o poluente.
Em geral, a tabela mostra que os modelos com choques aleatorios iid compondo a funcao
de transferencia apresentam melhores resultados do ponto de vista preditivo.
A seguir, sao exibidos os resultados da estimacao sequencial referente ao modelo 4.
Para o ajuste, considerou-se as regressoras: poluente, temperatura e humidade padroni-
111
zadas (subtraıdas de sua media e divididas pelo desvio-padrao).
Tabela 5.1: Logaritmo da verossimilhanca preditiva para cada um dos modelos ajustados.
Descricao do modelo∑
t log p(yt | Dt−1)
1 Poluente: TF(1,3,1) -1740.167
2 Temperatura: TF(1,2,1) -1742.127
3 Umidade: TF(1,3,1) -1740.966
4 Poluente: TF(1,3,1) com choques iid -1698.248
5 Temperatura: TF(1,2,1) com choques iid -1709.145
6 Umidade: TF(1,3,1) com choques iid -1707.025
7 Poluente: TF(1,3,1) com resp. imediata ao impulso dinamica -1728.989
8 Temperatura: TF(1,2,1) com resp. imediata ao impulso dinamica -1710.803
9 Umidade: TF(1,3,1) com resp. imediata ao impulso dinamica -1738.646
A tabela 5.2 exibe as estimativas pontuais e intervalos de credibilidade de extremos
iguais a media ± 2 desvios padroes a posteriori para os parametros estaticos conside-
rando toda a serie de dados. O unico efeito que nao se mostrou significativo foi o da
umidade sobre a taxa de obitos. Note-se tambem que os efeitos sazonais apresentam
magnitude mais elevada que a concentracao de poluente, temperatura e umidade. Os
mesmos intervalos de credibilidade estao ilustrados na figura 5.5.
A funcao de resposta ao impulso para o modelo 4 pode ser obtida por aplicacoes
sucessivas da equacao
Et = φEt−1 + γPolt−3 + εt,
que nos permite chegar a
Et =t−2∑k=0
γφkPolt−k−3 +t+1∑k=0
φkεt−k + φtE0.
Portanto, a funcao de resposta ao impulso e vk = γφk. Fixando-se k, a resposta ao
impulso e uma funcao nao-linear de (φ, γ), portanto nao conseguimos obter media a pos-
teriori para esta quantidade utilizando a metodologia sequencial proposta. Entretanto,
112
Tabela 5.2: Resumo a posteriori para os parametros estaticos considerando toda a serie
de dados. LI e LS (limites inferior e superior, respectivamente) referem-se aos extremos
do intervalos de credibilidade marginais (media ± 2 desvios).
Media Desvio-padrao LI LS
φ 0.889 0.056 0.776 1.002
γ 0.046 0.016 0.014 0.078
δtemp -0.066 0.033 -0.132 -0.001
δumid -0.030 0.021 -0.072 0.011
δcos -0.261 0.052 -0.365 -0.156
δsen 0.130 0.036 0.059 0.202
para termos uma ideia do comportamento dessa funcao, fixamos as estimativas pontuais
φ = E(φ | D1458) e γ = E(γ | D1458) e plotamos γφk na figura 5.6. Pode-se perceber pela
figura que a janela de impacto do poluente sobre a taxa de obitos parece durar cerca de
30 dias, quando passa a ter magnitude praticamente nula. Tambem estimamos o tempo
de meia vida para o efeito do poluente em 6 dias, uma vez que γφ6 = 0.0227 ≈ γ/2, ou
seja, apos 6 dias, aproximadamente, o efeito do poluente sobre os desfechos se reduz a
metade.
113
−0.5 0.0 0.5 1.0
φδsen
γδumid
δcosδtemp
Figura 5.5: Intervalos de credibilidade a posteriori (media ± 2 desvios-padroes) para os
parametros estaticos considerando-se toda a serie de dados.
0 10 20 30 40 50 60
0.00
0.01
0.02
0.03
0.04
0.05
0.06
Resposta ao impulso estimada
k
q0.95(γφk | DN)q0.5(γφk | DN)q0.05(γφk | DN)
Figura 5.6: Funcao de resposta ao impulso estimada para o modelo 4.
Por fim, a figura 5.7 exibe as previsoes um passo a frente para o numero de obitos de
criancas por doenca respiratoria em Sao Paulo ao longo dos anos de 94 a 97. Percebe-se
que as previsoes acompanham o comportamento sazonal dos desfechos mas nao apresen-
tam grandes oscilacoes em janelas de tempo curtas.
114
0 500 1000 1500
05
1015
20
tempo
Série observadaE(yt | Dt−1)E(yt | Dt−1) ± 2 × Var(yt | Dt−1)
Figura 5.7: Previsoes um passo a frente para o numero de obitos de criancas por doenca
respiratoria em Sao Paulo
5.4 Conclusoes da aplicacao aos dados reais
Neste capıtulo, foi apresentada uma aplicacao a dados reais de contagens de desfechos
epidemiologicos, onde foram propostos modelos dinamicos Poisson com efeitos latentes
de funcao de transferencia como forma de modelar o impacto cumulativo de regressoras
sobre a variavel resposta.
A metodologia sequencial aplicada consiste na expansao e linearizacao do vetor de
estados em conjunto com o uso de quadratura de Gauss Hermite para estimar a variancia
de evolucao das componentes dinamicas.
Primeiramente, vimos que adotar prioris marginais com variancia demasiadamente
alta acarreta problemas numericos no procedimento sequencial proposto, porem isso nao
impediu que fossem utilizadas prioris vagas para os parametros dos modelos.
Verificou-se que as estimativas obtidas sequencialmente sao bastante proximas do
que se obtem via MCMC, porem a um custo computacional consideravelmente mais
115
baixo. Enquanto necessitou-se mais de 13 horas para simulacao das 50000 iteracoes, a
implementacao da metodologia sequencial com uso de quadratura de Gauss Hermite foi
feita em 42 segundos. Mesmo com cadeias de comprimento menor, 5000 iteracoes por
exemplo, o tempo computacional esperado seria algo proximo de 1 hora e 20 minutos,
ainda assim consideravelmente mais elevado que obtido sequencialmente.
Dentre os modelos propostos, o que apresentou melhores resultados do ponto de vista
preditivo foi o modelo que considera efeito do poluente sobre os obitos atraves de funcao
de transferencia com adicao de choques aleatorios iid. Segundo o ajuste obtido para este
modelo, o efeito do poluente sobre a resposta em tempos futuros apresenta magnitude
baixa, porem perdura por um horizonte de aproximadamente 30 dias. As componentes
sazonais sao as que apresentam efeito de magnitude mais elevada, indicando comporta-
mento sazonal marcante na serie observada.
116
Capıtulo 6
Conclusoes e trabalhos futuros
Neste trabalho, propoe-se uma metodologia sequencial para realizacao de inferencia
em modelos dinamicos nao-lineares sob enfoque bayesiano.
Condicionalmente a variancia dos erros de evolucao, a metodologia proposta utiliza
expansao do vetor de estados para incorporar parametros desconhecidos presentes na
matriz de evolucao. Em seguida, lineariza-se a equacao de evolucao resultante de modo
a permitir que media e matriz de variancia para os estados sejam atualizadas sequencial-
mente conforme feito em West et al. (1985). O procedimento de expansao e linearizacao
do vetor de estados esta descrito em West e Harrison (1997) capıtulo 13.
Para estimacao das variancias de evolucao dos parametros dinamicos, constroi-se uma
grade de pontos que evolui dinamicamente levando em consideracao a media e variancia
obtidas sequencialmente via quadratura adaptativa de Gauss Hermite. Aplicacoes do
metodo de quadratura adaptativa de Gauss Hermite em modelos dinamicos estao dis-
ponıveis na literatura, porem apenas em contextos de resposta normal (Naylor e Smith
1982, Pole 1988, Pole e West 1990). Sendo assim, a contribuicao deste trabalho consiste
em aliar as ideias da quadratura adaptativa aos procedimentos de expansao e linearizacao
dos estados em contextos de modelos dinamicos nao-gaussianos com hiperparametros,
possibilitando realizacao de inferencia sequencial para todos os parametros do modelo.
No capıtulo 4, a metodologia proposta foi aplicada considerando-se resposta normal,
Poisson e binomial com estrutura latente autorregressiva e em modelos dinamicos Poisson
com efeito de funcao de transferencia, no capıtulo 5. No caso dos processos autorregres-
117
sivos, percebeu-se que, em geral, nao se consegue obter boas estimativas dos parametros
dos processos autorregressivos dispondo de poucas observacoes (no caso, 50). Porem,
esse problema nao foi observado para series mais longas (250 a 1000 observacoes). Em
geral, foi difıcil recuperar os parametros do processo latente supondo ordem alta para o
processo autorregressivo esperando obter estimativas proximas de zero para os coeficien-
tes de ordem maior que a verdadeira ordem do processo. Ainda no contexto de processos
autorregressivos, foram constatadas dificuldades em utilizar fatores de desconto para es-
pecificar a sequencia de variancias de evolucao, pois obtınhamos posterioris degeneradas
em um unico ponto para os processos autorregressivos βt. Acreditamos que isso se deva
a restricoes de ordem teorica para os valores dos descontos em contextos de modelos
autorregressivos, tais como a restricao citada na secao 3.6 para o caso normal AR(1).
No capıtulo 5, aplicou-se a metodologia sequencial proposta a modelos Poisson di-
namicos com efeitos latentes de funcao de transferencia num contexto epidemiologico.
As estimativas a posteriori obtidas foram bem proximas daquelas que se obteve via
MCMC conforme Gamerman (1998), o que nos permite validar o codigo escrito para
implementacao da metodologia inferencial proposta. O esquema sequencial mostrou-se
capaz de lidar com funcoes de transferencia com evolucao temporal estocastica, o que
permite grande flexibilidade de modelagem dos efeitos cumulativos de regressoras sobre
a resposta.
Em todos os modelos, o procedimento de inferencia sequencial proposto neste trabalho
foi realizado praticamente em tempo real. Em nenhum dos modelos tratados aqui, foi
necessario mais do que 1 minuto para executar todo o procedimento inferencial. Aliando-
se a isso o carater sequencial da inferencia, considera-se que a metodologia proposta
apresenta um grande atrativo, por exemplo, para aplicacoes praticas considerando longas
series de dados, para as quais e fundamental a aplicacao de algoritmos que exigem pouco
esforco computacional.
Como desvantagens do metodo, observa-se que a inferencia e realizada apenas em
termos de media e variancia para os parametros do vetor de estados. Outro ponto diz
respeito a instabilidade observada ao considerar prioris marginais muito vagas, tanto para
os parametros do vetor de estados quanto para a variancia evolucional das componentes
118
dinamicas. Porem, isso nao nos impediu de adotar prioris vagas para os parametros dos
modelos apresentados aqui.
E necessario esclarecer ainda que foram observadas algumas dificuldades do ponto de
vista numerico para implementacao da metodologia sequencial proposta em alguns dos
casos apresentados nesta dissertacao. Para algumas das series artificiais com estrutura la-
tente autorregressiva, obteve-se matrizes de covariancia que nao eram positivas-definidas
para alguns instantes de tempo. Interpolar as entradas da matriz de decomposicao de
Choleskey para as matrizes de variancia V ar(θt | αi), i ∈ L0 provavelmente resolveria o
problema, tal como aponta Pole (1988), e sera abordada em trabalhos futuros.
Como trabalhos futuros, pretende-se aplicar a metodologia descrita nesta dissertacao
a outros modelos, como por exemplo os modelos de volatilidade estocastica. Tambem
seria interessante comparar a metodologia proposta a outras alem de MCMC, como por
exemplo Integrated Nested Laplace Approximation (INLA) (Rue et al., 2009) e filtro de
partıculas. A comparacao com filtro de partıculas e particularmente interessante por
tambem se tratar de um esquema sequencial de inferencia que esta bastante difundido
na literatura.
Como extensoes, e interessante investigar a aplicacao da quadratura tambem aos
hiperparametros que aparecem na matriz de evolucao, uma vez que se consegue inferencia
de forma completa para tais parametros. Isso possibilitaria, por exemplo, a obtencao de
incerteza associada a estimacao de funcoes nao-lineares dos hiperparametros, como no
caso da funcao de resposta ao impulso que foi exibida no capıtulo 5. Nesse sentido, e de
suma importancia considerar a aplicacao da quadratura de Gauss Hermite em mais de
uma dimensao.
119
Apendice A
Distribuicoes de Probabilidade
Aqui, descreve-se a parametrizacao usada para algumas distribuicoes de probabilida-
des consideradas ao longo do texto. Sao elas: Beta Binomial, Gama, Gama Inversa, Log
Normal, T-student com posicao e escala, T-student multivariada com posicao e escala.
Em questao de notacao, dado um conjunto A ⊂ Rd definimos I(x ∈ A) a funcao
indicadora que assume valor 1 se x ∈ A e 0 se x /∈ A. Por exemplo, se x = 1 e A = (0, 1],
temos I(x ∈ A) = I(0 < x ≤ 1) = 1.
Distribuicao Beta Binomial
Dizemos que uma variavel aleatoria discreta X tem distribuicao Beta Binomial de
parametros n ∈ N, a > 0, b > 0, se X tem funcao de probabilidade
pX(x) =B(x+ a, n− x+ b)
B(a, b)
(n
x
)I(x ∈ 0, . . . , n),
onde B(α, β) e a funcao beta definida por
B(α, β) =Γ(α)Γ(β)
Γ(β + α).
Nesse caso, denotamos X ∼ BetaBinomial(n, a, b).
Nessa parametrizacao, temos E(X) = naa+b
e V ar(X) = nab(a+b)2(a+b+1)
.
120
Distribuicao Binomial Negativa
Dizemos que uma variavel aleatoria discreta X tem distribuicao Binomial Negativa
de parametros n ∈ R+ e p ∈ (0, 1), se X tem funcao de probabilidade
pX(x) =Γ(x+ n)
Γ(x+ 1)Γ(n)(1− p)npxI(x ∈ 0, 1, . . .),
Nesse caso, denotamos X ∼ BinomialNegativa(n, p).
Nessa parametrizacao, temos E(X) = np1−p e V ar(X) = np
(1−p)2 .
Distribuicao Log Normal
Dizemos que uma variavel aleatoria contınua X tem distribuicao LogNormal(µ, σ) se
a variavel aleatoria Y = logX tem distribuicao N(µ, σ2).
Nesse caso, a densidade de X e dada por
fX(x) =1
x√
2πσ2exp
−(log(x)− µ
σ
)2I(x > 0).
Nessa parametrizacao, temos E(X) = eµ+σ2
2 e V ar(X) = (eσ2 − 1)e2µ+σ
2.
Distribuicao Gama
Dizemos que uma variavel aleatoria contınua X tem distribuicao Gama(a, b), i.e.
X ∼ Gama(a, b) se sua densidade e dada por
fX(x) =ba
Γ(a)xa−1e−bxI(x > 0).
121
Nessa parametrizacao, temos E(X) = ab
e V ar(X) = ab2
.
Distribuicao Gama Inversa
Dizemos que uma variavel aleatoria contınua X tem distribuicao GamaInversa(a,b),
i.e. X ∼ GamaInv(a, b) se a variavel aleatoria Y = 1/X tem distribuicao Gama(a, b).
Nesse caso, a densidade de X e dada por
fX(x) =ba
Γ(a)x−a−1e−
bx I(x > 0).
Nessa parametrizacao, temos E(X) = ba−1 e V ar(X) = b2
(a−1)2(a−2) .
Distribuicao T-student com posicao e escala
Dizemos que uma variavel aleatoria contınua X tem distribuicao T-student com n
graus de liberdade e parametros de locacao µ e escala σ, se sua densidade e dada por
fX(x) =Γ(n+12
)σ√nπΓ(n
2)
[(x− µσ
)2
+ n
]−n+12
× I(x ∈ R).
Nesse caso, denotamos X ∼ Tn(µ, σ2).
Repare que a parametrizacao adota e feita em funcao do numero de graus de liber-
dade (n), do parametro de posicao (µ) e do quadrado do parametro de escala (σ2). Nessa
parametrizacao, temos E(X) = µ se n > 1 e V ar(X) = σ2× nn−2 para n > 2. Para n < 1,
a media da T-student nao esta bem definida e, se n < 2, o mesmo tambem acontece para
a variancia.
Distribuicao T-student multivariada com posicao e escala
Dizemos que um vetor aleatorio contınuo X com suporte Rd tem distribuicao T-
student multivariada com n graus de liberdade e parametros µ e Σ, se sua densidade e
122
dada por
fX (x) ∝[d+ (x− µ)′Σ−1(x− µ)
]−n+d2 × I(x ∈ Rd).
Nesse caso, denotamos X ∼ Tn(µ,Σ)
Aqui, µ faz o papel de parametro de posicao e a matriz Σ faz o papel de matriz de
escala. Nessa parametrizacao, temos E(X) = µ se n > 1 e V ar(X) = Σ × nn−2 para
n > 2. Para n < 1, a media da T-student multivariada nao esta bem definida e, se n < 2,
o mesmo tambem acontece para a variancia.
Um resultado importante diz que se X ∼ Tn(µ,Σ), entao as marginais sao T-student
univariadas com n graus de liberdade. Os parametros das distribuicoes marginais podem
ser facilmente obtidos a partir da conjunta: Xi ∼ Tn(µi, σ2i ) onde µi e a i-esima entrada
do vetor de medias µ e σ2i = Σi,i.
123
Referencias Bibliograficas
Almon, S. (1965) The distributed lag between capital appropriations and expenditures.
Econometrica, 33, pp. 178–196. URLhttp://www.jstor.org/stable/1911894.
Alves, M. B., Gamerman, D. e Ferreira, M. A. (2010) Transfer functions in dynamic
generalized linear models. Statistical Modelling, 10, 03–40.
Ameen, J. R. M. (1984) Discount bayesian models and forecasting. URLhttp://wrap.
warwick.ac.uk/3955/.
Ameen, J. R. M. e Harrison, P. J. (1984) Discount weighted estimation. Journal of
Forecasting, 3, 285–296. URLhttp://dx.doi.org/10.1002/for.3980030306.
Blocker, A. W. (2014) fastGHQuad: Fast Rcpp implementation of Gauss-Hermite qua-
drature. URLhttp://CRAN.R-project.org/package=fastGHQuad. R package version
0.2.
Carter, C. e Kohn, R. (1994) On Gibbs sampling for state space models. Biometrika, 81,
541–553.
Carvalho, C. M., Johannes, M. S., Lopes, H. F. e Polson, N. G. (2010) Particle lear-
ning and smoothing. Statist. Sci., 25, 88–106. URLhttp://dx.doi.org/10.1214/
10-STS325.
Cox, D. R., Gudmundsson, G., Lindgren, G., Bondesson, L., Harsaae, E., Laake, P.,
Juselius, K. e Lauritzen, S. L. (1981) Statistical analysis of time series: Some recent
developments [with discussion and reply]. Scandinavian Journal of Statistics, 8, pp.
93–115. URLhttp://www.jstor.org/stable/4615819.
124
Enders, W. (2009) Applied Econometric Time Series. Wiley.
Franco, G. C., Migon, H. S. e Prates, M. O. (2015) A monte carlo study and data
analysis for time series of counts. Relatorio Tecnico Relatorio Tecnico RTP-01/2015,
Belo Horizonte: Departamento de Estatıstica - UFMG.
Fruhwirth-Schnater, S. (1994) Data augmentation and dynamic linear models. Journal
of Time Series Analysis, 15, 183–202.
Gamerman, D. (1998) Markov chain Monte Carlo for dynamic generalized linear models.
Biometrika, 85, 215–227.
Huerta, G. e West, M. (1999) Priors and component structures in autoregressive time
series models. Journal of the Royal Statistical Society: Series B (Statistical Methodo-
logy), 61, 881–899. URLhttp://dx.doi.org/10.1111/1467-9868.00208.
Liu, J. e West, M. (2001) Combined parameter and state estimation in simulation-based
filtering. Em Sequential Monte Carlo Methods in Practice (eds. A. Doucet, N. de Freitas
e N. Gordon), Statistics for Engineering and Information Science, 197–223. Springer
New York. URLhttp://dx.doi.org/10.1007/978-1-4757-3437-9_10.
Migon, H., Gamerman, D. e Louzada, F. (2014) Statistical Inference: an Integrated
Approach. Chapman and Hall/CRC.
Naylor, J. C. e Smith, A. F. M. (1982) Applications of a method for the efficient com-
putation of posterior distributions. Journal of the Royal Statistical Society. Series C
(Applied Statistics), 31, pp. 214–225. URLhttp://www.jstor.org/stable/2347995.
Nelder, J. A. e Wedderburn, R. W. M. (1972) Generalized linear models. Journal of
the Royal Statistical Society. Series A (General), 135, pp. 370–384. URLhttp://www.
jstor.org/stable/2344614.
Pole, A. (1988) Transfer response models: a numerical approach. Bayesian Statistics, 3,
pp. 733–745.
125
Pole, A. e West, M. (1990) Efficient bayesian learning in non-linear dynamic models.
Journal of Forecasting, 9, pp. 119–136.
Prado, R. e Lopes, H. (2013) Sequential parameter learning and filtering in structured
autoregressive state-space models. Statistics and Computing, 23, 43–57. URLhttp:
//dx.doi.org/10.1007/s11222-011-9289-1.
R Development Core Team (2008) R: A Language and Environment for Statistical
Computing. R Foundation for Statistical Computing, Vienna, Austria. URLhttp:
//www.R-project.org. ISBN 3-900051-07-0.
Rue, H., Martino, S. e Chopin, N. (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations. Journal of the
royal statistical society: Series b (statistical methodology), 71, 319–392.
Salzer, H., E., Zucker, R. e Capuano, R. (1952) Tables of the zeroes and weight factors of
the first twenty hermite polynomials. J. Research of the National Bureau of Standards,
48, pp. 111–116.
Smith, A. F. M., Skene, A. M., Shaw, J. E. H. e Naylor, J. C. (1987) Progress with
numerical and graphical methods for practical bayesian statistics. Journal of the
Royal Statistical Society. Series D (The Statistician), 36, pp. 75–82. URLhttp:
//www.jstor.org/stable/2348499.
Storvik, G. (2002) Particle filters for state-space models with the presence of unknown
static parameters. Signal Processing, IEEE Transactions on, 50, 281–289.
West, M. e Harrison, J. (1997) Bayesian Forecasting and Dynamic Models. New York:
Springer-Verlag, 2nd edn.
West, M., Harrison, J. e Migon, H. (1985) Dynamic generalized linear models and baye-
sian forecasting. Journal of the American Statistical Association, 80, 73–83.
Zeger, S. L., Liang, K.-Y. e Albert, P. S. (1988) Models for longitudinal data: A ge-
neralized estimating equation approach. Biometrics, 44, pp. 1049–1060. URLhttp:
//www.jstor.org/stable/2531734.
126