infer^encia sequencial em modelos din^amicos...

Inferencia Sequencial em Modelos

Dinamicos Generalizados

Carlos Tadeu Pagani Zanini

Universidade Federal do Rio de Janeiro

Instituto de Matematica

Departamento de Metodos Estatısticos

2015

Inferencia Sequencial em Modelos

Dinamicos Generalizados

Carlos Tadeu Pagani Zanini

Dissertacao de Mestrado submetida ao Programa de Pos-Graduacao em Estatıstica

do Instituto de Matematica da Universidade Federal do Rio de Janeiro - UFRJ, como

parte dos requisitos necessarios a obtencao do tıtulo de Mestre em Estatıstica.

Aprovada por:

Prof. Helio dos Santos Migon

PhD - IM - UFRJ - Orientador.

Profa Mariane Branco Alves

D.Sc - IM - UFRJ - Co-orientadora.

Dani Gamerman

PhD - IM - UFRJ.

Glaura Conceicao Franco

D.Sc - ICE - UFMG.

Rio de Janeiro, RJ - Brasil

2015

ii

A minha famılia, amigos e professores.

iii

“Do you remember standing on the shore,

Head in the clouds, your pockets filled with dreams

Bound for glory on the seven seas of life,

But the ocean is deeper than it seems

Sail your ship across the water,

Spread your wings across the sky

Take the time to see

You’re the one who holds the key,

Or sailing ships will pass you by

(...)

Spread your wings and you will see

You control your destiny,

So sailing ships don’t pass you by

Sailing ships - Whitesnake

COVERDALE, DAVID & VANDENBERG, ADRIAN ”

iv

Agradecimentos

Os ultimos dois anos foram, sem duvida alguma, os mais desafiadores da minha vida e,

se consegui completar mais essa etapa, nao foi sem ajuda das pessoas mais maravilhosas

e compreensivas deste mundo. Sendo assim, dedico esta pequena secao do meu trabalho a

agradacer a estas pessoas por estarem ao meu lado nas mais diversas e adversas situacoes.

Primeiramente, agradeco a minha famılia. Meus pais, que souberam estimular em

mim o amor incondicional pelo conhecimento desde de crianca, pelos valores e princıpios

que me ensinaram e pelo amor e carinho que sempre tiveram comigo. Ao meu irmao,

agradeco por absolutamente tudo, por ser o melhor amigo que alguem pode ter, por estar

sempre do meu lado pra me alegrar com as suas piadas, me inspirar com seus conselhos

ou mesmo rir dos meus acessos de raiva quando meus programas nao rodavam. Talvez

voce nem saiba disso, Gabriel, mas voce me ensinou que a melhor maneira de resolver os

problemas e com um largo sorriso na cara e nao com um murro na mesa.

Aos meus amigos da pos-graduacao, agradeco por dividirem comigo todos esses mo-

mentos memoraveis que passamos juntos estudando, programando, reclamando, rindo e

outros gerundios. Voces foram as pessoas com quem passei mais tempo nesses dois anos

em que praticamente vivi no fundao. Aqui incluo todos os meu amigos da pos-graduacao

em estatıstica, ao pessoal da matematica e da matematica aplicada. Sem todos voces,

essa etapa seria muito mais difıcil e menos divertida. Em especial, Marianas, Rafael e

Ingrid, muitıssimo obrigado pelo convıvio e companheirismo em absolutamente todos os

momentos, desde as caronas, onibus lotados, confraternizacoes, aulas, congressos e ate

os almocos no bandejao (porque e claro que eu tenho que lembrar de comida sempre).

Como vou sentir falta de tudo isso nos proximos anos...

Aos meus amigos de mais longa data, agradeco por continuarem ao meu lado mesmo

nos varios momentos em que me ausentei por conta dos compromissos com o mestrado.

v

Gustavo, Fred, Raphael, Lucas, Vicente, Daniel, Bianca, Alexandre, Luciana, Paraıba

e Mirna dedicar a voces este trabalho e uma singela forma de agradecer a tudo o que

voces significam pra mim; afinal crescemos juntos como uma grande (na verdade, imensa)

famılia. Vou sempre levar na minha memoria os seus conselhos, conversas, piadas e as

jogatinas de videogame nos fins de semana.

Agradeco a todo o corpo docente da pos graduacao por atuar com tanta dedicacao

para nos transmitir da melhor forma possıvel o conhecimento academico necessario para

o nosso futuro profissional. Agradeco a Mariane e ao Migon por me orientarem pelos in-

trincados caminhos dessa jornada de pesquisa que chamamos de dissertacao de mestrado.

Tem sido uma grande honra e um grande prazer trabalhar com voces dois. Faco um agra-

decimento especial a Mariane, que alem de excelente coorientadora e uma grande amiga.

Obrigado por confiar em meu potencial desde quando entrei na UFRJ ao me oferecer um

projeto de iniciacao cientıfica (o que foi a fagulha inicial que iluminou minha decisao pela

carreira academica) e cujos conselhos me levaram onde estou hoje. Agradeco tambem a

Alexandra e ao Migon pelo constante incentivo que me dao a participar de congressos. A

participacao nesses eventos contribuiu muito para o meu aprendizado e foi, certamente,

o fator que mais ajudou a nortear meu caminho para o doutorado. Vejo nesta nova etapa

que se inicia, uma excelente oportunidade de retribuir a todo conhecimento que voces,

professores, transmitiram a mim e aos meus colegas nestes ultimos anos.

Aos professores Carlos Abanto Valle, Dani Gamerman e Glaura Franco, agradeco por

aceitarem fazer parte da banca.

Finalmente, Agradeco ao CNPQ e a Faperj pelo apoio financeiro no primeiro e segundo

ano de mestrado, respectivamente.

vi

Resumo

Na pratica, analises estatısticas de series temporais requerem atualizacao constante

da inferencia a medida que novas observacoes tornam-se disponıveis. Nesse sentido, o

ideal e utilizar procedimentos sequenciais de inferencia, sobretudo quando os intervalos

de tempo em que se recebe novas informacoes sao curtos.

Tendo como base esta motivacao de carater pratico, este trabalho propoe uma meto-

dologia sequencial bayesiana aplicada a modelos dinamicos nao-lineares com resposta na

famılia exponencial. Utiliza-se de expansao do vetor de estados e linearizacao da equacao

de evolucao resultante para estimar hiperparametros originalmente pertencentes a matriz

de evolucao, permitindo estimacao dos estados e hiperparametros conjuntamente. Para

estimacao da variancia de evolucao de componentes dinamicas, utiliza-se quadratura de

Gauss Hermite.

A aplicacao da metodologia sequencial proposta aqui e exemplificada em contextos

de modelos na famılia exponencial com estrutura latente autorregressiva e tambem em

modelos com efeito de funcao de transferencia para descrever o impacto de regressoras

sobre a variavel resposta.

Palavras-Chaves: modelos dinamicos, linear bayes, processos autoregressivos, com-

putacao sequencial bayesiana, quadratura de Gauss-Hermite.

vii

Abstract

From a practical point of view, statistical time series analysis often require the infe-

rence procedure to be constantly updated as new observations become available. In this

sense, the use of sequential inference procedures is desirable, specially when new data

arrive in short time intervals.

Focusing on this practical motivation, this work proposes a sequential Bayesian metho-

dology that applies to non-linear dynamic models with response variable belonging to the

exponential family of distributions. Expansion of the state vector and linearization of the

resulting evolution equation are used to estimate hyperparameters originally belonging

to the evolution matrix, which allows the estimation of the states and hyperparameters

jointly. In order to estimate the evolution variances related to dynamic components in

the model, Gauss-Hermite quadrature is used.

The aplication of the sequential methodology proposed here is shown in examples

that concern dynamic models in the exponential family with latent autorregressive struc-

ture and in models with transfer function effects describing how covariates impact the

response variable.

Keywords: dynamic models,linear bayes, autorregressive processes, sequential baye-

sian computation, Gauss-Hermite quadrature.

viii

Sumario

1 Introducao 1

2 Estimacao bayesiana e modelos dinamicos 4

2.1 Inferencia bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.1.1 Estimacao pontual . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.1.2 Estimacao por intervalo . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.3 Aspecto sequencial do Teorema de Bayes . . . . . . . . . . . . . . 7

2.1.4 Previsoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1.5 Estimador linear de Bayes . . . . . . . . . . . . . . . . . . . . . . 9

2.2 Modelos dinamicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2.1 Modelos lineares dinamicos . . . . . . . . . . . . . . . . . . . . . . 11

2.2.2 Modelos lineares generalizados dinamicos . . . . . . . . . . . . . . 17

2.2.3 Procedimento sequencial de inferencia em MLGD . . . . . . . . . 19

2.3 Especificacao dos erros de evolucao via fatores de desconto . . . . . . . . 24

3 Inferencia sequencial em modelos dinamicos nao lineares 26

3.1 Modelos dinamicos nao lineares . . . . . . . . . . . . . . . . . . . . . . . 26

3.2 Processos autorregressivos . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.3 Funcoes de transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.4 Inferencia em modelos dinamicos nao-lineares . . . . . . . . . . . . . . . 34

3.4.1 Expansao do vetor de estados . . . . . . . . . . . . . . . . . . . . 35

3.4.2 Linearizacao da equacao de evolucao . . . . . . . . . . . . . . . . 36

3.4.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

ix

3.5 Quadratura de Gauss-Hermite em modelos

dinamicos nao-lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.6 Fatores de desconto para componentes autorregressivas . . . . . . . . . . 45

4 Estudo de simulacao 48

4.1 Descricao e objetivos do estudo simulado . . . . . . . . . . . . . . . . . . 48

4.2 Modelo Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.2.1 Modelo normal com estrutura latente AR(1) . . . . . . . . . . . . 51



4.3 Modelo Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.3.1 Modelo poisson com estrutura latente AR(1) . . . . . . . . . . . . 69

4.3.2 modelo Poisson com estrutura latente AR(2) . . . . . . . . . . . . 76

4.3.3 modelo Poisson com estrutura latente AR(3) . . . . . . . . . . . . 80

4.4 Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.4.1 Modelo binomial com estrutura latente AR(1) . . . . . . . . . . . 85



4.5 Conclusoes do estudo simulado . . . . . . . . . . . . . . . . . . . . . . . 98

5 Aplicacao a dados reais 101

5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5.2 Descricao do conjunto de dados . . . . . . . . . . . . . . . . . . . . . . . 102

5.3 Descricao dos modelos propostos . . . . . . . . . . . . . . . . . . . . . . 103

5.3.1 Simulacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

5.3.2 Aplicacao aos dados . . . . . . . . . . . . . . . . . . . . . . . . . 111

5.4 Conclusoes da aplicacao aos dados reais . . . . . . . . . . . . . . . . . . . 115

6 Conclusoes e trabalhos futuros 117

A Distribuicoes de Probabilidade 120

x

Lista de Tabelas

4.1 Tempo computacional medio em segundos para implementacao da me-

todologia sequencial baseada na expansao do vetor de estados e uso da

quadratura de Gauss-Hermite aos modelos dinamicos normais, poisson e

binomial com estrutura latente AR(1), AR(2) e AR(3). Foram utilizados

15 pontos na quadratura de Gauss-Hermite. . . . . . . . . . . . . . . . . 100

5.1 Logaritmo da verossimilhanca preditiva para cada um dos modelos ajustados.112

5.2 Resumo a posteriori para os parametros estaticos considerando toda a serie

de dados. LI e LS (limites inferior e superior, respectivamente) referem-se

aos extremos do intervalos de credibilidade marginais (media ± 2 desvios). 113

xi

Lista de Figuras

2.1 Estimacao de θt ∼ AR(1) em MLD1, φ, V,W com φ,W e V conhecidos.

mt = E(θt | Dt), Ct = V ar(θt | Dt). A esquerda, exibe-se a sequencia

Ct juntamente com o valor limite C dado pela Proposicao 2.2. A direita,

exibe-se a sequencia de estimativas e intervalos de credibilidade a posteriori

para os estados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.1 Estimacao de θt ∼ AR(1) em MLD1, φ, V,Wt com φ conhecido e Wt

especificado pelo fator de desconto δ. Priori: θ1 ∼ N(0, 100). mt = E(θt |

Dt), Ct = V ar(θt | Dt). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.1 Resultados para uma replica simulada do modelo normal AR(1) com φ =

0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) considerando a variancia

de evolucao fixa em seu valor real no processo de estimacao. . . . . . . . 53

4.2 Histogramas suavizados para a distribuicao das estimativas de φ condicio-

nais a W no tempo N com base nas 100 series simuladas do modelo normal

AR(1). Os pontos representam a media amostral do respectivo conjunto

de estimativas pontuais E(φ | W,DN). A linha tracejada representa o

valor verdadeiro de φ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.3 Histogramas suavizados para a distribuicao das estimativas de V condici-

onais a W no tempo N com base nas 100 series simuladas para o modelo

normal AR(1). Os pontos representam a media amostral do respectivo

conjunto de estimativas pontuais E(V | W,DN). A linha tracejada repre-

senta o valor verdadeiro de V . . . . . . . . . . . . . . . . . . . . . . . . . 54

xii

4.4 Resultados para uma replica simulada do modelo normal AR(1) com φ =

0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) estimando a variancia

de evolucao via quadratura de Gauss-Hermite. . . . . . . . . . . . . . . . 56

4.5 Estimacao da variancia de evolucao W para a primeira replica simulada

do modelo normal AR(1) com φ ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a coluna,

respectivamente). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.6 Histogramas suavizados para a distribuicao das estimativas de φ, W e

V (1a, 2a e 3a linhas, respectivamente) no tempo N , incondicionalente a

W, com base nas 100 series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pon-

tos representam a media amostral do respectivo conjunto de estimativas

pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro de φ. 58

4.7 Resultados para a 1a replica simulada do modelo normal AR(2) com φ =

(φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor

real no processo de estimacao. . . . . . . . . . . . . . . . . . . . . . . . . 59

4.8 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2

condicionais a W no tempo N com base nas 100 series simuladas do modelo


conjunto de estimativas pontuais E(φ1 | W,DN) (1a linha) e E(φ1 | W,DN)

(2a linha). A linha tracejada representa o valor verdadeiro de φ1 ou φ2. . 60

4.9 Resultados para a primeira replica simulada do modelo normal AR(2) com

φ1 = 0.1, φ2 = 0.8 estimando a variancia de evolucao via quadratura de

Gauss-Hermite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.10 Estimacao da variancia de evolucao W para a primeira replica simulada

do modelo normal AR(2) com φ1 = 0.1 e φ2 = 0.8 . . . . . . . . . . . . . 62

4.11 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 no

tempo N com base nas 100 series simuladas do modelos normal AR(2). Os

pontos representam a media amostral do respectivo conjunto de estimati-

vas pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro

de φ1, φ2,W e V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

xiii

4.12 Resultados para a primeira replica simulada do modelo normal AR(3) com

φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao

fixa em seu valor real no processo de estimacao. . . . . . . . . . . . . . . 65

4.13 Histogramas suavizados para a distribuicao das estimativas de φ condici-

onalmente a W no tempo N com base nas 100 series simuladas do modelo


conjunto de estimativas pontuais E(φ | W,DN), i ∈ 1, . . . , 5. A linha

tracejada representa o valor verdadeiro de φi. . . . . . . . . . . . . . . . 66

4.14 Histogramas suavizados para a distribuicao das estimativas de V no tempo

N com base nas 100 series simuladas do modelo normal AR(3) condici-

onalmente a W. Os pontos representam a media amostral do respectivo

conjunto de estimativas pontuais E(V | W,DN). A linha tracejada repre-

senta o valor verdadeiro de V . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.15 Resultados para a 1a replica simulada do modelo normal AR(3) com φ =

(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao W via

quadratura de Gauss-Hermite. . . . . . . . . . . . . . . . . . . . . . . . . 68

4.16 Resultados referentes a estimacao da variancia de evolucao W e de ob-

servacao V para uma replica simulada do modelo normal AR(3) com

φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86). . . . . . . . . . . . . . . . . . . . . 68

4.17 Histogramas suavizados para a distribuicao das estimativas de φi, i ∈

1, . . . , 5, W e V no tempo N com base nas 100 series simuladas do mo-

delo normal AR(3). Os pontos representam a media amostral do respectivo

conjunto de estimativas pontuais E(φi | DN), E(W | DN) e E(V | DN).

A linha tracejada representa o valor verdadeiro de φi, W e V . . . . . . . 69

4.18 Resultados para a 1a replica simulada do modelo Poisson AR(1) com

φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a

variancia de evolucao fixa em seu valor real no processo de estimacao. . . 71

4.19 Estimativas a posteriori para a soma do nıvel do preditor com o processo

AR(1): βt + µ para a primeira replica simulada do modelo Poisson AR(1). 72

xiv

4.20 Histogramas suavizados para a distribuicao das estimativas de φ condicio-

nalmente a W, no tempo N com base nas 100 series simuladas do modelo

Poisson AR(1). Os pontos representam a media amostral do respectivo

conjunto de estimativas E(φ | W,DN). A linha tracejada representa o

valor verdadeiro de φ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.21 Resultados para a 1a replica simulada do modelo Poisson AR(1) com φ1 ∈

0.5, 0.7, 0.95 (1a, 2a e 3a colunas respectivamente) estimando a variancia

de evolucao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.22 Resultados referentes a estimacao da variancia de evolucao W para uma

replica simulada do modelo Poisson AR(1) com φ1 ∈ 0.5, 0.7, 0.95 (1a,

2a e 3a linhas respectivamente). . . . . . . . . . . . . . . . . . . . . . . . 75

4.23 Histogramas suavizados para a distribuicao das estimativas de φ no tempo

N com base nas 100 series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pon-

tos representam a media amostral do respectivo conjunto de estimativas

pontuais E(φ | DN). A linha tracejada representa o valor verdadeiro de φ. 76

4.24 Resultados para uma replica simulada do modelo Poisson AR(2) com φ =

(φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor

real no processo de estimacao. . . . . . . . . . . . . . . . . . . . . . . . 77

4.25 Histogramas suavizados para a distribuicao das estimativas de φ condi-

cionais a W no tempo N com base nas 100 series simuladas com φ =

(φ1, φ2) = (0.1, 0.8). Os pontos representam a media amostral do respec-

tivo conjunto de estimativas pontuais E(φ1 | W,DN) ou E(φ2 | W,DN).

A linha tracejada representa o valor verdadeiro de φ1 e φ2. . . . . . . . . 78

4.26 Resultados para uma replica simulada do modelo Poisson AR(2) com

φ = (φ1, φ2) = (0.1, 0.8) estimando a variancia de evolucao atraves de

quadratura de Gauss Hermite. . . . . . . . . . . . . . . . . . . . . . . . . 79

xv


N com base nas 100 series simuladas do modelo Poisson AR(2) com

φ = (φ1, φ2) = (0.1, 0.8). Os pontos representam a media amostral do

respectivo conjunto de estimativas pontuais E(φ1 | DN), E(φ2 | DN) e

E(W | DN). A linha tracejada representa o valor verdadeiro de φ1, φ2 e W. 79


(φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao fixa

em seu valor real no processo de estimacao. . . . . . . . . . . . . . . . . . 81

4.29 Histogramas suavizados para a distribuicao das estimativas de φi, i1, . . . , 5

condicionais a W no tempo N com base nas 100 series simuladas do mo-

delo Poisson AR(3). Os pontos representam a media amostral do respec-

tivo conjunto de estimativas pontuais E(φi | W,DN). A linha tracejada

representa o valor verdadeiro de φi. . . . . . . . . . . . . . . . . . . . . . 82


(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao. . . . 83

4.31 Resultados referentes a estimacao da variancia de evolucao W para a pri-

meira replica simulada do modelo Poisson AR(3) com φ = (φ1, φ2, φ3) =

(0.81, 0.77,−0.86). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

4.32 Histogramas suavizados para a distribuicao das estimativas de φi, i ∈

1, . . . , 5 e W no tempo N com base nas 100 series simuladas do modelo

Poisson AR(3). Os pontos representam a media amostral do respectivo

conjunto de estimativas pontuais E(φi | DN) ou E(W | DN). . . . . . . . 84

4.33 Resultados para uma replica simulada do modelo binomial AR(1) com

φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a

variancia de evolucao fixa em seu valor real no processo de estimacao. . 86


N condicionalmente a W com base nas 100 series simuladas do modelo

binomial AR(1). Os pontos representam a media amostral do respectivo

conjunto de estimativas pontuais E(φ | W,DN). . . . . . . . . . . . . . . 87

xvi

4.35 Resultados para a primeira replica simulada do modelo binomial AR(1)

com φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a colunas, respectivamente) estimando

a variancia de evolucao. . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

4.36 Resultados referentes a estimacao da variancia de evolucao W para uma

replica simulada do modelo binomial AR(1) com φ1 ∈ 0.5, 0.7, 0.95. . . 89

4.37 Histogramas suavizados para a distribuicao das estimativas de φ e W no

tempo N com base nas 100 series simuladas com do modelo binomial

AR(1). Os pontos representam a media amostral do respectivo conjunto

de estimativas pontuais E(φ | DN) e E(W | DN). . . . . . . . . . . . . . 90


considerando a variancia de evolucao fixa em seu valor real no processo de

estimacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4.39 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 con-

dicionalmente a W no tempo N com base nas 100 series simuladas do

modelo binomial AR(2). Os pontos representam a media amostral do res-

pectivo conjunto de estimativas pontuais E(φi | W,DN), i ∈ 1, 2. . . . 91


estimando a variancia de evolucao. . . . . . . . . . . . . . . . . . . . . . 92


meira replica simulada do modelo binomial AR(2). . . . . . . . . . . . . 93

4.42 Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 no

tempo N com base nas 100 series simuladas com φ = (φ1, φ2) = (0.1, 0.8).

Os pontos representam a media amostral do respectivo conjunto de esti-

mativas pontuais E(φi | DN), i ∈ 1, 2 e E(W | DN). . . . . . . . . . . 93


considerando a variancia de evolucao fixa em seu valor real no processo de

estimacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

xvii

4.44 Histogramas suavizados para a distribuicao das estimativas de φi condi-

cionais a W no tempo N com base nas 100 series simuladas do modelo

binomial AR(3) com φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86). Os pontos

representam a media amostral do respectivo conjunto de estimativas pon-

tuais E(φi | W,DN), i ∈ 1, . . . , 5. . . . . . . . . . . . . . . . . . . . . . 96


estimando a variancia de evolucao. . . . . . . . . . . . . . . . . . . . . . 97


eira replica simulada do modelo nbinomial AR(3). . . . . . . . . . . . . 97


N com base nas 100 series simuladas do modelo binomial AR(3) com φ =

(φ1, φ2, φ3) = (0.81, 0.77,−0.86). Os pontos representam a media amostral

do respectivo conjunto de estimativas pontuais E(φi | DN), i ∈ 1, . . . , 5

e E(W | DN). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

5.1 Series temporais da variavel resposta e das regressoras. . . . . . . . . . . 102

5.2 Intervalos de credibilidade a posteriori (media± 2 desvios) para os parametros

estaticos do modelo 7, condicionalmente a toda a serie de dados, obtidos

via metodologia sequencial e via MCMC. . . . . . . . . . . . . . . . . . . 109

5.3 Funcao de resposta imediata ao impulso (γt) estimada sequencialmente e

via MCMC no modelo 7. Exibe-se a serie real e intervalos de credibilidade

a posteriori (media ± 2 desvios) condicionalmente a toda a serie de dados. 110

5.4 Histograma (MCMC) e curva de densidade aproximada (metodologia se-

quencial) para a variancia de evolucao a posteriori no modelo 7. Curva

obtida com 15 pontos na quadratura de Gauss-Hermite. . . . . . . . . . . 111

5.5 Intervalos de credibilidade a posteriori (media ± 2 desvios-padroes) para

os parametros estaticos considerando-se toda a serie de dados. . . . . . . 114

5.6 Funcao de resposta ao impulso estimada para o modelo 4. . . . . . . . . . 114

5.7 Previsoes um passo a frente para o numero de obitos de criancas por doenca

respiratoria em Sao Paulo . . . . . . . . . . . . . . . . . . . . . . . . . . 115

xviii

Capıtulo 1

Introducao

Em muitas situacoes de carater pratico, existe o interesse, ou a necessidade, em com-

preender o comportamento de alguma variavel no decorrer do tempo ou mesmo em prever

a trajetoria de tal variavel em tempos futuros. Nesses contextos, e comum que se receba

novas informacoes com o passar do tempo, o que requer multiplas aplicacoes do procedi-

mento inferencial adotado, visando incorporar novas observacoes de variaveis ao modelo

conforme elas se tornam disponıveis. Assim, e natural recorrer a procedimentos sequen-

ciais de inferencia para modelagem de series temporais.

Os modelos de espaco de estados, tambem conhecidos como modelos dinamicos, tem

sido amplamente utilizados nos ultimos anos para tratar de dados com dependencia tem-

poral sob enfoque bayesiano. Essa classe de modelos e bastante flexıvel, permitindo efeitos

latentes estaticos e dinamicos sobre a resposta. A dinamica de tais efeitos e determinada

por uma matriz de evolucao que pode depender de hiperparametros, em geral, desco-

nhecidos. Nessas circunstancias, e fundamental a inferencia sobre tais parametros, uma

vez que eles determinam a dinamica de processos latentes que por sua vez descreverao o

comportamento da variavel resposta ao longo do tempo.

Nos modelos dinamicos em que a variavel resposta e um membro da famılia exponen-

cial e nao ha parametros desconhecidos na matriz de evolucao, West et al. (1985) des-

crevem metodologia sequencial de inferencia para os estados (feita em termos de media

e matriz de covariancias), propondo especificacao da sequencia de variancias de evolucao

via fatores de desconto. Em contextos onde existem parametros a serem estimados na ma-

1

triz de evolucao, Pole (1988) e Pole e West (1990) propoem a estimacao sequencial de tais

parametros utilizando quadratura de Gauss-Hermite, tambem especificando a sequencia

de variancias de evolucao atraves de fatores de desconto, porem somente abordam casos

em que se tem normalidade para a variavel resposta.

Nesta dissertacao, propoe-se um esquema sequencial de inferencia bayesiana em mo-

delos dinamicos na famılia exponencial com hiperparametros na matriz de evolucao. Para

inferir sobre os hiperparametros utilizamos a expansao do vetor de estados e linearizacao

da equacao de evolucao. A variancia de evolucao de componentes dinamicas e suposta

constante e estimada via quadratura de Gauss-Hermite.

A implementacao da metodologia sequencial proposta foi feita em linguagem R (R

Development Core Team, 2008), com utilizacao do pacote fastGHQuad (Blocker, 2014)

para obter os pontos da quadratura de Gauss-Hermite e pesos associados.

A seguir, descreve-se brevemente a estrutura da dissertacao.

No capıtulo 2, apresenta-se conceitos gerais sobre inferencia bayesiana e modelos

dinamicos que servirao como base para o restante da dissertacao. Neste capıtulo, considera-

se modelos dinamicos com resposta pertencente a famılia exponencial e descreve-se em

linhas gerais o procedimento sequencial proposto por West et al. (1985) em tais modelos.

O capıtulo 3 aborda modelos dinamicos nao lineares, apresentando a metodologia

sequencial proposta para estimacao dos estados, dos parametros de nao-linearidade (ou

hiperparametros) que caracterizam a dinamica dos estados e das variancias de evolucao.

As variancias de evolucao sao estimadas via quadratura de Gauss Hermite ou especi-

ficadas via fatores de desconto. A estimacao dos hiperparametros e feita incluindo-os

como componentes do vetor de estados aplicando-se, em seguida, tecnicas de linearizacao

que possibilitam aplicar do esquema sequencial para estimacao dos estados, descrito em

West et al. (1985). Alem disso, descreve-se brevemente dois tipos de processos latentes

(processos autorregressivos e de funcao de transferencia), que serao abordados no estudo

simulado e na aplicacao a dados reais.

O capıtulo 4 consiste num estudo simulado de modelos dinamicos normal, poisson e

binomial com estrutura latente autorregressiva de ordem 1, 2 e 3 aplicando-se a metodolo-

gia sequencial descrita no capıtulo 3. O objetivo e identificar a eficiencia do procedimento

2

sequencial em estimar tais processos, bem como os parametros que os definem.

O capıtulo 5 descreve uma aplicacao a dados reais no contexto de desfechos epide-

miologicos, onde estuda-se a modelagem de efeitos cumulativos de regressoras sobre a

resposta atraves de funcoes de transferencia. Neste capıtulo, faz-se uma comparacao

entre as estimativas obtidas sequencialmente atraves da metodologia proposta neste tra-

balho e obtidas por metodo de Monte Carlo via Cadeias de Markov (MCMC), utilizando

o esquema proposto por Gamerman (1998) e aplicado a esse contexto de funcoes de

transferencia por Alves et al. (2010).

Em seguida, o capıtulo 6 apresenta as conclusoes gerais sobre a metodologia proposta

na dissertacao, descrevendo possıveis extensoes do metodo e aplicacoes para trablhos

futuros.

Por fim, o apendice apresenta a parametrizacao adotada para algumas das distri-

buicoes que aparecem ao longo do texto. Sao elas: beta binomial, binomial negativa,

gama, gama inversa, log normal, t-student com parametros de posicao e escala e t-student

multivariada com posicao e escala.

3

Capıtulo 2

Estimacao bayesiana e modelos

dinamicos

Este capıtulo faz uma breve introducao a inferencia parametrica sob enfoque baye-

siano, apresentando os conceitos basicos referentes a estimacao de parametros e a rea-

lizacao de previsoes. Apresenta-se, em seguida, a classe dos modelos dinamicos (tambem

conhecidos na literatura como modelos de espaco de estados), os quais permitem que um

conjunto de parametros responsaveis pela descricao probabilıstica das observacoes varie

com o decorrer do tempo. Considera-se primeiramente o caso em que a variavel resposta

tem distribuicao normal para, em seguida, tratar do caso mais geral em que a resposta e

um membro da famılia exponencial. O caso em que a evolucao dos parametros do modelo

ocorre de forma nao linear e tratado no capıtulo 3.

2.1 Inferencia bayesiana

Considere Y uma variavel de interesse com distribuicao de probabilidade caracteri-

zada por um vetor de parametros θ. Em geral, visando compreender o comportamento

probabilıstico de Y , obtem-se uma amostra aleatoria y1, . . . , yn dessa variavel, a partir

da qual obtem-se estimativas para θ. A plausibilidade desse procedimento reside no fato

de que os dados observados carregam consigo informacao sobre os parametros θ, sendo

essa informacao traduzida formalmente em termos matematicos pela funcao de verossi-

4

milhanca l(· ; y1, . . . , yn) : Θ→ R+, dada por l(θ ; y1, . . . , yn) = p(y1, . . . , yn | θ), onde

Θ e o espaco parametrico e p(y1, . . . , yn | θ) e a funcao de densidade de (y1, . . . , yn) no

caso em que o vetor e contınuo, ou a funcao de probabilidades quando o vetor e discreto.

A verossimilhanca pode ser vista, portanto, como medida de plausibilidade para o valor

θ ∈ Θ a luz das observacoes (y1, . . . , yn).

Sob o paradigma bayesiano considera-se tambem a informacao subjetiva sobre o ve-

tor parametrico θ. Essa informacao e traduzida matematicamente pela distribuicao de

probabilidades a priori p : Θ→ R+, a qual e especificada previamente a observacao dos

dados, de modo que toda informacao proveniente dos dados esteja contida apenas na

funcao de verossimilhanca.

O Teorema de Bayes, enunciado a seguir, estabelece a relacao entre priori e verossi-

milhanca na composicao da incerteza acerca dos parametros.

Teorema 2.1. (Teorema de Bayes) Sejam θ ∈ Θ o vetor de parametros, p(θ) a densidade

(ou funcao de probabilidade) a priori, e y o vetor de observacoes com verossimilhanca

l(θ;y) = p(y | θ). Entao, a distribuicao a posteriori e dada por

p(θ | y) =p(y | θ)p(θ)∫p(y | θ)p(θ)dθ

∝ p(y | θ)p(θ),

em que o produto p(y | θ)π(θ), bem como qualquer de seus multiplos por funcoes que nao

dependam de θ, e chamado nucleo da distribuicao a posteriori.

A incerteza sobre θ apos a observacao dos dados e representada em termos proba-

bilısticos atraves da distribuicao a posteriori, cuja densidade (ou funcao de probabilidade)

e denotada por p(· | y1, . . . , yn) : Θ→ R+. A partir da distribuicao a posteriori sao cal-

culadas as estimativas pontuais dos parametros e medidas de incerteza referentes ao

processo de estimacao, dentre outras quantidades de interesse possıveis.

5

2.1.1 Estimacao pontual

O processo de estimacao pontual do vetor parametrico θ com dimensao, digamos, p×1

pode ser visto sob o paradigma da teoria da decisao (Migon et al., 2014). O objetivo

e sintetizar a informacao sobre θ em um unico ponto θ do suporte da distribuicao a

posteriori.

Considere Ω o conjunto de todos os valores possıveis para um vetor de observacoes

y = (y1, . . . , yn). Define-se a regra de decisao δ : Ω→ A como a funcao que associa a cada

vetor de observacoes y a decisao δ(y) no espaco das acoes A. Em seguida, especifica-se a

funcao de perda L : A×Θ→ R+ que associa a decisao δ(y) ∈ A uma perda que depende

do verdadeiro valor de θ ∈ Θ. Por fim, define-se a funcao de risco R(δ) = E[L(δ,θ) | y],

que representa a perda esperada quando se adota a decisao δ = δ(y).

O objetivo e, dadas a funcao de perdas L e as observacoes y, tomar a decisao otima

δ = δ(y) que minimiza o risco R(δ) = E[L(δ,θ) | y]. A regra de decisao otima e

conhecida em pelo menos 3 importantes casos:

• Perda quadratica: L(δ,θ) = (δ − θ)′(δ − θ). A decisao otima e a media a pos-

teriori δ = θ = E(θ | y).

• Perda absoluta: L(δ,θ) = ‖δ − θ‖.A decisao otima e a mediana a posteriori:

δ = θ = med, onde P (θ < med | y) = 0, 5. Aqui, quando θ e multidimensional,

a desigualdade θ < med significa que cada entrada de θ e menor que a respectiva

entrada do vetor med.

• Perda 0− 1:

L(δ,θ) = I(δ = θ) =

1 se δ = θ,

0 se δ 6= θ.

A decisao otima nesse caso e a moda a posteriori δ = θ = arg maxθ∈Θ

p(θ | y).

6

2.1.2 Estimacao por intervalo

Em muitos problemas praticos, existe interesse nao apenas em estimativas pontuais

dos parametros, mas tambem na incerteza associada a essas medidas. Dessa forma, tem-

se o interesse em considerar alguma medida resumo da posteriori que seja capaz de refletir

a incerteza associada ao procedimento de estimacao pontual. No caso, uma possibilidade

e realizar estimacao atraves de intervalos de credibilidade a posteriori.

Uma regiao C ⊂ Rp e dita regiao de credibilidade com probabilidade γ a posteriori

para θ se P (θ ∈ C | y) = γ, onde p e a dimensao de θ. No caso θ unidimensional, refere-

se a C como intervalo de credibilidade. Alem disso, no caso em que p > 1, costuma-se

reportar intervalos de credibilidade marginais unidimensionais para cada componente do

vetor de estados θ.

2.1.3 Aspecto sequencial do Teorema de Bayes

O Teorema de Bayes pode tambem ser visto sob o aspecto sequencial, segundo o

qual cada observacao e incorporada em sequencia a informacao a priori para compor a

distribuicao a posteriori. Mais especificamente, denotando o vetor de observacoes por

y = (y1, y2, ..., yn), temos no instante zero a distribuicao a priori p(θ). Incorporada a

primeira observacao y1 a informacao a priori, atualiza-se a incerteza a respeito de θ

atraves do Teorema de Bayes, obtendo assim a distribuicao a posteriori no tempo 1:

p(θ | y1) ∝ p(y1 | θ)p(θ)

Agora, no instante 2, toda a informacao previa a respeito de θ (representada pela

posteriori no instante 1: p(θ | y1)) e considerada informacao a priori e, ao ser combinada

com a observacao no tempo corrente, resulta na posteriori no instante 2:

p(θ | y1, y2) ∝ p(y2 | θ, y1)p(θ | y1) = p(y2 | θ)p(θ | y1),

onde a igualdade ocorre quando se supoe independencia entre as observacoes dado o

conhecimento do vetor parametrico, o que significa assumir que o vetor parametrico sin-

tetiza toda a informacao necessaria para determinacao do comportamento probabilıstico

7

de yi. Em outras palavras, o conhecimento de yj , para qualquer j 6= i, nao altera em

nada a distribuicao probabilıstica de yi se os parametros sao conhecidos.

Prosseguindo com o mesmo raciocınio, tem-se no tempo n a relacao de recorrencia

p(θ | y1, ..., yn) ∝ p(yn | θ)p(θ | yn−1, ..., y1),

que permite chegar a formula enunciada no Teorema de Bayes:

p(θ | y1, ..., yn) ∝ p(yn | θ)p(yn−1 | θ)...p(y1 | θ)p(θ)

= p(y | θ)p(θ),

onde a igualdade novamente ocorre quando se supoe independencia entre as observacoes

condicionalmente ao vetor parametrico. Portanto, a distribuicao a posteriori obtida se-

quencialmente e a mesma que se obtem com uma unica aplicacao do Teorema de Bayes

considerando o vetor completo y = (y1, ..., yn).

Nesse ponto, cabe uma breve consideracao sobre a notacao que por vezes sera usada

ao longo deste trabalho no que se refere a atualizacao sequencial de informacao segundo

a otica bayesiana. Considera-se D0 o conjunto contendo a informacao necessaria para

compor a distribuicao a priori p(θ). Recursivamente, tem-se no instante t o conjunto

Dt−1 representando toda informacao disponıvel a priori, ou seja, ate o instante t − 1.

Com a chegada de uma nova observacao yt, tem-se Dt = yt ∪ Dt−1 no caso em que

nao se deseja incorporar nenhuma informacao externa aos dados do instante t − 1 para

o instante t. Portanto, em problemas onde se utiliza de informacao subjetiva apenas no

instante previo a observacao do primeiro dado y1, tem-se Dt = y1, . . . , yt ∪D0.

2.1.4 Previsoes

A distribuicao preditiva e um objeto probabilıstico que permite nao so fazer previsoes

como tambem avaliar a adequacao do modelo teorico formulado pelo estatıstico, pois

permite verificar se o modelo obtido e capaz de reproduzir dados proximos dos que foram

observados sob o ponto de vista preditivo.

8

A distribuicao preditiva para um vetor de dados nao observados z a partir do con-

junto de observacoes y e a funcao densidade (ou funcao de probabilidade) dada por

p(z | y) =

∫Θp(z | θ)p(θ | y)dθ = Eθ|y [p(z | θ)] .

A distribuicao preditiva para z pode ser interpretada como uma media dos valores de

l(θ; z) = p(z | θ) ponderados pela posteriori p(θ | y). Neste ponto, e importante obser-

var que a predicao feita desta forma esta condicionada apenas ao vetor de observacoes,

sem nenhuma dependencia analıtica com respeito ao vetor parametrico.

2.1.5 Estimador linear de Bayes

Conforme visto na subsecao 2.1.1, fixada uma funcao de perda, a teoria da decisao

fornece o estimador otimo para o vetor parametrico θ procurando dentre todas as funcoes

dos dados, que aqui representamos por δ = δ(y), aquela que minimiza o risco a posteriori

R(δ) = E[L(δ,θ) | y].

Existem casos em que nao se conhece a forma analıtica do estimador otimo de θ

segundo o criterio de minimizacao do risco a posteriori, mesmo quando se utiliza uma

das funcoes de perda apresentadas na subsecao 2.1.1. Isso pode ocorrer, por exemplo,

quando nao se tem forma analıtica disponıvel para a densidade posteriori p(θ | y) e, por

consequencia, nao se consegue obter a media, moda ou mediana para θ | y.

Nessas circunstancias, o processo de estimacao linear de Bayes fornece uma apro-

ximacao para a solucao otima dada pela teoria da decisao quando se considera a funcao

de perda quadratica. O procedimento, ao inves de minimizar o risco a posteriori sob

todas as possıveis funcoes dos dados, minimiza o risco a priori E[L(δ,θ)], restringindo-se

as decisoes a funcoes lineares d(y) do vetor de observacoes. O estimador obtido dessa

forma recebe o nome de estimador linear de Bayes, e sua perda quadratica e usada como

aproximacao para a variancia a posteriori de θ.

9

Proposicao 2.1. (Estimador Linear de Bayes) O estimador linear de Bayes para θ e

a funcao linear das observacoes d = d(y) que minimiza a perda quadratica esperada a

priori E[(θ − d)′(θ − d)].

Em suma, o estimador linear de Bayes pode ser visto como uma aproximacao linear

para a funcao δ(y) = E(θ | y) e o risco associado ao estimador linear de Bayes constitui

uma aproximacao para V ar(θ | y).

A obtencao de estimadores lineares de Bayes e parte essencial do procedimento de in-

ferencia sequencial em modelos dinamicos descrito na secao 2.2. Em particular, utiliza-se

a proposicao a seguir, cuja demonstracao pode ser vista em West e Harrison (1997).

Proposicao 2.1. Suponha um vetor aleatorio (θ,y) com vetor de medias e matriz de

covariancias dados por

yθ

∼f

a

,

Q S′

S R

.

Nesse caso, o estimador linear de Bayes para θ e d = d(y) = a + SQ−1(y − f) e a

perda quadratica esperada para esse estimador e R − SQ−1S′. Naturalmente, o valor

R − SQ−1S corresponde a menor perda esperada a priori sob funcoes lineares das ob-

servacoes y.

Note-se que, sob normalidade da distribuicao conjunta (y,θ), o estimador linear de

Bayes para θ coincide com a esperanca a posteriori E(θ | y) e o risco associado coincide

com a variancia a posteriori V ar(θ | y).

10

2.2 Modelos dinamicos

Os modelos dinamicos, tambem conhecidos como modelos de espaco de estados, assu-

mem que a cada tempo t ∈ N a observacao yt e caracterizada probabilisticamente por um

vetor de parametros θt (denominado vetor de estados) cujas componentes podem variar

ao longo do tempo.

2.2.1 Modelos lineares dinamicos

Um modelo linear dinamico (MLD) em sua forma geral e descrito por duas equacoes:

a equacao de observacao, que descreve a relacao entre covariaveis e a variavel resposta, e

a equacao de evolucao, que descreve a forma com que os parametros do modelo evoluem

com o tempo:

yt = F ′tθt + vt, vt ∼ N(0, Vt)

θt = Gtθt−1 +wt, wt ∼ N(0,W t), (2.1)

sendo (vt)t∈N e (wt)t∈N sequencias de variaveis aleatorias tais que vt⊥vs, e wt⊥ws, ∀t 6=

s. Alem disso, vt⊥ws,∀s, t. O erro vt e chamado erro de observacao e wt e chamado

erro de evolucao.

Um MLD e, portanto, caracterizado pela quadrupla (F t,Gt, Vt,W t), onde:

• F t e o vetor de planejamento no tempo t, com valores conhecidos que podem conter

variaveis explicativas: F t = (x1t, . . . , xpt)′;

• yt e a resposta observada no tempo t;

• θt e o vetor parametrico no tempo t: θt = (θ1t, . . . , θpt)′;

• Gt e a matriz de evolucao no tempo t (dimensao p× p).

11

As variancias Vt e W t controlam a magnitude dos erros de observacao e de evolucao,

respectivamente. Quanto maiores os valores na posicao i, i ∈ 1, . . . , p da diagonal das

matrizes de covariancias W t, t ∈ 1, . . . , p, mais volatil e a trajetoria da componente

θi,t do vetor de estados θt ao longo do tempo, e quanto maiores os valores de Vt, maior

e a variabilidade das observacoes em torno do preditor linear ηt = F ′tθt que, no caso

normal, coincide com a media da variavel resposta: E(yt) = µt = ηt.

A classe MLD abrange varios tipos de modelos importantes, como os Modelos de Re-

gressao Linear Normais (F t,Gt = I, Vt = σ2,W t = 0) e os Modelos de Series Temporais

(F t = F ,Gt = G, Vt,W t).

Sob o enfoque Bayesiano necessita-se ainda especificar as distribuicoes a priori para

os parametros de interesse de modo a completar a descricao do modelo. Adotando priori

normal para θ1 e conhecidos Vt e W t, tem-se forma analıtica fechada para as posterioris

θt | Dt, t = 1, 2, . . . , conforme analise bayesiana sequencial do modelo (2.1) dada pelas

equacoes a seguir, em que θt−1 | Dt−1 ∼ N(mt−1,Ct−1).

Priori no tempo t: θt | Dt−1 ∼ N(at,Rt),at = Gtmt−1

Rt = GtCt−1G′t +W t,

Preditiva no tempo t: yt | Dt−1 ∼ N(ft, Qt),ft = F ′tat

Qt = F ′tRtF t + Vt,

Vetor de coeficientes adaptativos At e erro de previsao et:At = RtF tQ−1t

et = yt − ft,

Posteriori no tempo t: θt | Dt ∼ N(mt,Ct),mt = at +Atet

Ct = Rt −AtA′tQt.

12

Note-se, a partir das equacoes, que yt nao consta na expressao analıtica de nenhuma

das variancias Rt, Qt, Ct, portanto, as variancias a posteriori diag(Ct) decrescem em

funcao apenas da quantidade de observacoes contida no vetor de dados, independente-

mente dos particulares valores observados para yt.

Nessas circunstancias tem-se conjugacao para o vetor de estados, portanto θt | Dt e

θt | Dt−1 tem distribuicao normal ∀t ∈ N e as preditivas yt | Dt−1 tambem sao obtidas

analiticamente e possuem distribuicao normal.

Tambem e possıvel obter forma analıtica fechada para as posterioris via conjugacao no

caso em que Vt = V, ∀t ∈ N com V desconhecido. Nessas circunstancias, obtem-se con-

jugacao adotando priori Normal-Gama (West e Harrison, 1997) para o vetor (θt, τ) | Dt,

onde τ = 1/V . Marginalmente, o vetor de estados θt tem distribuicao T-Student multi-

variada (tanto a priori quanto a posteriori) e a precisao dos erros de observacao τ | Dt

tem distribuicao Gama. As equacoes do procedimento sequencial bayesiano para o caso

em que V e desconhecido estao descritas a seguir, onde V | Dt−1 ∼ GamaInv(nt−1

2, dt−1

2)

e θt−1 | Dt−1 ∼ N(mt−1,Ct−1). Esse conjunto de equacoes consta em West e Harrison

(1997) pp. 119 a 122.

Priori no tempo t: θt | Dt−1 ∼ Tnt−1(at,Rt),at = Gtmt−1


(2.2)

Preditiva no tempo t: yt | Dt−1 ∼ Tnt−1(ft, Qt), (St−1 = dt−1/nt−1)ft = F ′tat

Qt = F ′tRtF t + St−1,

(2.3)

Vetor de coeficientes adaptativos At e erro de previsao et:At = RtF tQ−1t

et = yt − ft,(2.4)

Variancia observacional a posteriori: V | Dt ∼ GamaInv(nt2, dt

2),

13

nt = nt−1 + 1

dt = dt−1 + St−1e2t/Qt,

(2.5)

Posteriori no tempo t: θt | Dt ∼ Tnt(mt,Ct), (St = dt/nt)mt = at +Atet

Ct = (Rt −AtA′tQt)St/St−1.

(2.6)

No caso em que se desconhece as variancias de evolucao, as posterioris marginais

(tanto para os estados quanto para a variancia observacional) nao sao mais conhecidas

analiticamente. Existem diversas propostas na literatura para tratar deste caso, dentre

as quais cita-se aqui apenas algumas delas a tıtulo de exeplificacao. Fruhwirth-Schnater

(1994) e Carter e Kohn (1994) descrevem um esquema MCMC para o caso em que V eW

sao constantes no tempo onde as condicionais completas de V , W e θt sao conhecidas,

permitindo assim a simulacao de cadeias atraves do amostrador de Gibbs. Posterior-

mente, Gamerman (1998) descreve outro amostrador de Gibbs obtido reparametrizando

o modelo em termos dos erros de evolucao wt, reconstruindo-se o vetor de estados θt ao

final da geracao das cadeias. No que tange aplicacao de metodologia sequencial, diversos

esquemas para implementacao de filtros de partıculas podem ser considerados, dentre os

quais cita-se aqui Liu e West (2001), Storvik (2002) e Carvalho et al. (2010) por tratarem

do caso geral em que θt contem, possivelmente, componentes estaticas e as variancias

V e W sao desconhecidas. Cada um dos tres trabalhos propoe uma forma diferente de

tratar o problema de degeneracao das partıculas conforme o tempo progride.

E possıvel incorporar aos modelos dinamicos diversos tipos de estruturas latentes para

descrever a evolucao do processo observado yt. Essa classe de modelos permite tratar,

por exemplo, de series que apresentem simultaneamente uma tendencia polinomial linear,

sazonalidade, influencia de covariaveis e assim por diante. Mais precisamente, cada uma

das p estruturas latentes corresponde a um bloco θi,t de componentes do vetor de estados,

a uma matriz de evolucao Gi,t, a uma matriz de planejamento F i,t e uma matriz de

covariancias W i,t, de modo que o modelo dinamico constituıdo por F t = (F 1, ...,F p)t,

Gt = BlocoDiag(G1, ...,Gp)t, W t = BlocoDiag(W 1, ...,W p)t com vetor de estados θt =

14

(θi, ...,θp)t incorpora simultaneamente todas as p estruturas latentes. Para uma descricao

mais detalhada quanto a especificacao deGi,t, F i,t eW i,t para diversos tipos de estruturas

latentes, referencia-se West e Harrison (1997) capıtulos 6 a 9.

O exemplo a seguir considera um MLD com um unico componente no vetor de estados

com dinamica dada por um processo autorregressivo.

Exemplo 2.1. Considere o MLD dado pela quadrupla 1, φ, Vt,Wt, onde Vt, Wt e φ

sao conhecidos:

yt = θt + vt, vt ∼ N(0, Vt)

θt = φθt−1 + wt, wt ∼ N(0,Wt).

As equacoes de atualizacao aplicadas ao MLD 1, φ, Vt,Wt resultam em

at = φmt−1

Rt = φ2Ct−1 +Wt,

ft = at = φmt−1,

Qt = Rt + Vt,

At =Rt

Rt + Vt,

et = yt − φmt−1,

mt = φmt−1 +Rt

Rt + Vt(yt − φmt−1)

Ct = AtVt.

No caso especıfico do modelo tratado no exemplo 2.1, e possıvel obter facilmente

expressoes analıticas para o limite da sequencia de variancias a posteriori (Ct)t∈N, se

(Vt)t∈N e (Wt)t∈N sao sequencias convergentes, como aponta a Proposicao 2.2 a seguir.

Proposicao 2.2. Considere o MLD dado pela quadrupla 1, φ, Vt,Wt, onde Vt e Wt

sao conhecidos ∀t ∈ N. Suponha que limt→∞ Vt = V > 0 e limt→∞Wt = W > 0. Se a

15

sequencia Ct converge, entao seu valor limite e

C =−(W + V − φ2V ) +

√(V +W + φ2V )2 + 4φWV

2φ2.

Demonstracao. No MLD 1, φ, Vt,Wt, tem-se

Ct = AtVt =RtVtRt + Vt

=(φ2Ct−1 +Wt)Vtφ2Ct−1 +Wt + Vt

.

Supondo limWt = W e limVt = V e que ∃C = limCt, tem-se

C =(φ2C +W )V

φ2C +W + V,

donde φ2C2 + (W + V )C − φ2CV −WV = 0. Resolvendo para C, obtem-se

C =−(W + V − φ2V )±

√(W + V − φ2V )2 + 4φ2WV

2φ2.

Como C ≥ 0, segue que o unico limite possıvel para Ct e

C =−(W + V − φ2V ) +

√(W + V − φ2V )2 + 4φ2WV

2φ2.

Cabe citar aqui o Teorema 2.3 em West e Harrison (1997), que garante que a sequencia

Ct de variancias a posteriori converge em qualquer MLD com vetor de estados unidimen-

sional, desde que as variancias (observacionais e de evolucao) sejam constantes e conhe-

cidas. Sendo esse o caso, a Proposicao 2.2 fornece explicitamente o limite de Ct no caso

particular em que Gt = φ, ∀t ∈ N.

O comportamento assintotico explicitado na Proposicao 2.2 pode ser verificado em-

piricamente, como ilustrado pela figura 2.1 para uma serie simulada com φ = 1 e outra

com φ = 0, 8. Verifica-se que o comportamento limite para as variancias a posteriori e

alcancado rapidamente. A partir de 20 observacoes, praticamente nao se observa dimi-

nuicao na incerteza a respeito do processo autorregressivo latente. A partir de tal ponto,

16

as observacoes acrescentam informacao apenas na media das estimativas pontuais de θt,

permitindo-as acompanhar as variacoes na trajetoria efetiva do processo latente θt. A

distribuicao a priori adotada e θ1 | D0 ∼ N(0, 100).

0 20 40 60 80 100

02

46

810

t

Ct

C

(a) φ = 1

0 20 40 60 80 100

−10

−5

05

10

t

mt

mt ± 2 × Ct

(b) φ = 1

0 20 40 60 80 100

01

23

45

6

t

Ct

C

(c) φ = 0.8

0 20 40 60 80 100

−5

05

10

t

mt

mt ± 2 × Ct

(d) φ = 0.8

Figura 2.1: Estimacao de θt ∼ AR(1) em MLD1, φ, V,W com φ,W e V conhecidos.

mt = E(θt | Dt), Ct = V ar(θt | Dt). A esquerda, exibe-se a sequencia Ct juntamente com

o valor limite C dado pela Proposicao 2.2. A direita, exibe-se a sequencia de estimativas

e intervalos de credibilidade a posteriori para os estados.

2.2.2 Modelos lineares generalizados dinamicos

Os Modelos Lineares Generalizados Dinamicos permitem descrever o comportamento

probabilıstico de observacoes yt, cujo indıce t geralmente se refere a uma determinada

unidade de tempo, segundo uma distribuicao pertencente a famılia exponencial, com

17

parametros variando com o passar do tempo. A classe MLGD e uma extensao dos

chamados Modelos Lineares Generalizados (MLG) (Nelder e Wedderburn, 1972) devido

a evolucao temporal dos parametros de estado θt que descrevem o preditor linear ηt. Em

termos praticos, considerar um MLGD para observacoes yt permite que os efeitos latetes

sobre a variavel resposta se diferenciem ao longo do tempo.

Mais precisamente, um MLGD e descrito por 3 equacoes:

p(yt | ψt) = exp(V −1t [ft(yt)ψt − a(ψt)]

)bt(yt, Vt) (2.7)

ηt = g(ψt) = F ′tθt (2.8)

θt = Gtθt−1 + ωt, ωt ∼ [0,W t] (2.9)

onde a equacao (2.7) representa a densidade ou funcao de probabilidade das observacoes

yt como membro da famılia exponencial, a equacao (2.8) relaciona o parametro natural ψt

e o preditor linear ηt atraves da funcao de ligacao g, descrevendo o preditor linear como

funcao linear dos estados θt e, por fim, a equacao (2.9), chamada equacao de evolucao,

descreve a dinamica do vetor de estados de maneira linear determinada pela matriz de

evolucao Gt.

Em geral, ao longo do texto, usaremos a notacao x ∼ [a, b] para indicar que a

variavel aleatoria (vetor aleatorio) x tem media (vetor de medias) a e variancia (ma-

triz de variancia) b, como no caso da equacao (2.9). Usaremos tambem os termos matriz

de variancia e matriz de covariancias de forma indistinta, uma vez que tal matriz pode

ser vista como uma generalizacao do conceito de variancia para vetores aleatorios (por

isso matriz de variancia), bem como suas entradas representam as covariancias dois a dois

entre as respectivas componentes do vetor aleatorio (por isso matriz de covariancias).

Com respeito a estimacao bayesiana de parametros em MLGD, as equacoes (2.2),

(2.3), (2.4), (2.5) e (2.6) fornecem solucao analıtica no caso particular em que a resposta

e normal (e portanto, tem-se em particular um Modelo Linear Dinamico), a variancia de

observacao e conhecida e as variancias dos erros de evolucao sao desconhecidas. No caso

geral em que a resposta pertence a qualquer membro da famılia exponencial, West et al.

(1985) descrevem uma metodologia sequencial para inferencia em MLGD, que se da em

termos de primeiro e segundo momentos para os estados fazendo uso do procedimento

18

de estimacao linear de Bayes. Ainda nesse contexto de modelos dinamicos parcialmente

especificados, distribuicoes preditivas podem ser obtidas analiticamente, bem como dis-

tribuicoes a posteriori para os parametros naturais, desde que utilizadas distribuicoes

a priori conjugadas. A necessidade de metodos alternativos para inferencia se da em

funcao da estimacao dos estados e demais parametros, tais como variancias de evolucao

e quantidades desconhecidas na matriz Gt.

2.2.3 Procedimento sequencial de inferencia em MLGD

Um procedimento para realizar inferencia na classe dos MLGD com variancias W t co-

nhecidas de forma sequencial e apresentado em West et al. (1985). Tal metodologia nao

especifica de forma completa (isto e, fixando-se uma classe de distribuicoes especıfica) os

vetores dos erros de evolucao, mas apenas por meio de um vetor de medias e das matrizes

de variancia W t.

A especificacao parcial via 1o e 2o momentos para o vetor de erros de evolucao se

estende para o vetor de estados, cujas posterioris a cada tempo sao obtidas apenas via

media e matriz de covariancias.

O esquema iterativo a seguir resume o procedimento inferencial que permite obter

vetor de medias e matriz de variancia da distribuicao a posteriori e os parametros da

distribuicao preditiva no tempo corrente como funcao do vetor de medias e matriz de

variancia no tempo imediatamente anterior.

Inicialmente, suponha que a posteriori no tempo t−1 esteja parcialmente especificada

por θt−1 | Dt−1 ∼ [mt−1,Ct−1]. Entao, temos para o tempo t,

1. Priori dos estados: θt | Dt−1 ∼ [at,Rt]

at = Gtmt−1,


2. Priori para o parametro canonico: g−1(ηt) = ψt | Dt−1 ∼ Priori Conj.(rt, st)

3. Preditor a priori: ηt | Dt−1 ∼ [ft, qt]

ηt=F′tθt︷︸︸︷⇒

ft = F ′tat = f1(rt, st),

qt = F ′tRtF t = f2(rt, st),

19

4. Posteriori para o parametro canonico: ψt | Dt ∼ Posteriori Conj.(r∗t , s∗t )

5. Preditor a posteriori: ηt = g(ψt) | Dt ∼ [f ∗t , q∗t ]

f ∗t = f1(r∗t , s∗t ),

q∗t = f2(r∗t , s∗t ),

6. Posteriori dos estados (tempo t): θt | Dt ∼ [mt,Ct]

mt = at +RtF t(f∗t − ft)/qt,

Ct = Rt −RtF tF′t(1− q∗t /qt)/qt.

Primeiramente, no item 1, obtem-se media e matriz de variancia a priori para θt a

partir das mesmas quantidades referentes a posteriori de θt−1.

O item 2 consiste em especificar priori conjugada para o parametro canonico ψt (para-

metrizada por quantidades rt e st) segundo a teoria de conjugacao na famılia exponencial

(Migon et al., 2014).

A passagem entre os itens 2 e 3 consiste em calcular os momentos a priori (ft, qt)

para o preditor linear ηt a partir dos momentos a priori (at, Rt) para o vetor de estados

θt utilizando-se da relacao linear ηt = F ′tθt.

Como preditor e parametro canonico estao relacionados (nao-linearmente) de forma

determinıstica pela funcao de ligacao g, os parametros rt e st devem ser escolhidos de tal

modo que a media e a variancia a priori de ηt sejam iguais aos valores ft e qt obtidos no

passo 3, de modo a compatibilizar a forma analıtica de p(ηt | Dt−1) com os momentos

obtidos no passo 3. Isso e feito resolvendo o sistema nao-linear em 3, o que, em geral,

nao pode ser feito analiticamente. O que se recomenda em West et al. (1985) e West e

Harrison (1997) e tomar alguma aproximacao para as funcoes f1 e f2 de tal modo que o

novo sistema seja possıvel de ser resolvido analiticamente. Nesse trabalho, para obtencao

de f1 e f2, utilizaremos a aproximacao de Taylor de 1a ordem para a funcao g(ψt) para

escrever o preditor linear ηt como funcao linear do parametro canonico ψt, de modo que

media e variancia a priori para ηt sao trivialmente obtidos em funcao da media e variancia

do parametro canonico. Em outras palavras, denotando ψt | Dt−1 ∼ [xt, vt], obtem-se:

20

ft = E(ηt | Dt−1) = E(g(ψt) | Dt−1) ≈ E [g(xt) + g′(xt)(ψt − xt)]

= g(xt). (2.10)

qt = V ar(ηt | Dt−1) ≈ V ar [g(xt) + g′(xt)(ψt − xt)]

= g′(xt)2vt (2.11)

Por fim, a conjugacao especificada desta forma e responsavel por garantir, a cada

tempo t, que a posteriori para o parametro canonico ψt tenha forma analıtica conhecida,

bem como a distribuicao preditiva p(yt | Dt−1).

Note-se pelos passos 3, 4 e 5 que o parametro canonico poderia ser substituıdo nesse

esquema sequencial por qualquer outro parametro que caracterizasse a distribuicao dos

dados na famılia exponencial, desde que se consiga encontrar conjugacao da priori com

a funcao de verossimilhanca. Dessa forma, pode-se utilizar, por exemplo, a media µt =

E(yt | ψt) no lugar do parametro canonico ψt nos casos em que essa escolha for mais

conveniente do ponto de vista analıtico.

O passo 6 conclui o procedimento sequencial obtendo media e matriz de covariancias

a posteriori para os estados. Essa passagem faz uso da proposicao 2.1 para obter o

estimador linear de Bayes para θt como funcao de Dt−1 e ηt a partir do vetor de medias

e matriz de covariancias da distribuicao a priori conjunta

ηt

θt

∣∣∣∣∣∣ Dt−1

∼f t

at

,

qt F ′tRt

F tR′t Rt

,

que se obtem facilmente a partir da relacao ηt = F tθt. Conforme enunciado na Pro-

posicao 2.1, o estimador linear de Bayes at +RtF t(ηt− ft)/qt pode ser visto como uma

aproximacao para E[θt | ηt, Dt−1] e o risco associado Rt −RtF tF′tRt/qt constitui uma

aproximacao para V ar[θt | ηt, Dt−1].

A media e matriz de covariancias incondicionais de θt a posteriori sao obtidas fazendo

E(θt | Dt) = E[E(θt | ηt, Dt−1) | Dt]

21

V ar(θt | Dt) = V ar[E(θt | ηt, Dt−1) | Dt] + E[V ar(θt | ηt, Dt−1) | Dt],

donde obtem-se

mt = E(θt | Dt) = at +RtF t(f∗t − ft)/qt,

Ct = V ar(θt | Dt) = Rt −RtF tF′t(1− q∗/qt)/qt.

A seguir, explicita-se as contas necessarias para realizacao dos passos 2 a 5 descri-

tos nessa secao aos modelos com resposta Binomial e Poisson que serao utilizados nas

aplicacoes nos capıtulos 4 e 5.

Modelo Poisson

Escrevendo a distribuicao Poisson como membro da famılia exponencial, tem-se

p(yt | µt) = expytlogµt − µt(yt!)−1

, onde µt = E(ytµt) e portanto ψt = log µt = ηt, onde ηt representa o preditor linear e ψt

representa o parametro canonico da famılia exponencial.

Especificamos priori conjugada para λt ao inves do parametro canonico ψt. Entao λt |

Dt−1 ∼ Gama(rt, st) e a funcao g que aparece em (2.10) e (2.11) e a funcao logarıtmica.

Assim, escrevendo xt = E(λt | Dt−1) e vt = V ar(λt | Dt−1) temos o sistema

ft = g(xt) = log rtst,

qt = g′(xt)2vt = 1

rt,

cuja solucao e st = e−ftqt

e rt = 1qt

.

Pela conjugacao na famılia exponencial, temos λt | Dt ∼ Gama(r∗t , s∗t ), onde r∗t =

rt + yt e s∗t = st + 1. Assim,

f ∗t = logr∗ts∗t,

q∗t = 1r∗t,

22

Por fim, resolvendo a integral

∫ ∞0

p(yt | λt, Dt−1)p(λt | Dt−1)dλt,

temos a distribuicao preditiva: yt | Dt−1 ∼ BinNeg(rt, 1/(st + 1)).

Modelo Binomial

Escrevendo yt ∼ Bin(nt, pt) como membro da famılia exponencial, tem-se

p(yt | ηt) = exp

ytnt

logpt

1− pt− log

1

1− pt

(ntyt

)portanto ψt = log pt

1−pt = ηt, onde ηt representa o preditor linear e ψt representa o

parametro canonico da famılia exponencial.

Aqui, o parametro canonico ψt coincide com o preditor linear no caso em que se

utiliza a funcao logito como funcao de ligacao. Nesse caso, podemos especificar priori

conjugada para a probabilidade de sucesso pt | Dt−1 ∼ Beta(rt, st) e a funcao g que

aparece em (2.10) e (2.11) e a funcao logito. Assim, escrevendo xt = E(pt | Dt−1) e

vt = V ar(pt | Dt−1) temos o sistema

ft = g(xt) = log rtst,

qt = g′(xt)2vt = (rt+st)2

rtst(rt+st+1),

cuja solucao e st = eft+e−ft+2−qtqt(eft+1)

e rt = eftst.

Pela conjugacao na famılia exponencial, temos pt | Dt ∼ Beta(r∗t , s∗t ), onde r∗t = rt+

ytnt

e s∗t = st + 1− ytnt

. Assim,

f ∗t = logr∗ts∗t,

q∗t =(r∗t+s

∗t )

2

r∗t s∗t (r∗t+s

∗t+1)

,

23

Resolvendo a integral

∫ ∞0

p(yt | pt, Dt−1)p(pt | Dt−1)dpt,

temos a distribuicao preditiva: yt | Dt−1 ∼ BetaBinomial(nt, rt, st).

2.3 Especificacao dos erros de evolucao via fatores

de desconto

De acordo com as equacoes de atualizacao no contexto dos modelos dinamicos com res-

posta na famılia exponencial exibidas na subsecao 2.2.3, os erros de evolucao wt influem

na estimacao de θt unicamente atraves do aumento da incerteza sobre θt ao passar do

tempo t−1 (priori) para t (posteriori) com o acesso a uma nova observacao yt. De fato, se

nao existisse a sequencia de erros wt, ou equivalentemente se tivessemos W t = 0,∀t ∈ N,

a unica alteracao a ser feita seria na equacao Rt = GtCt−1G′t +W t, que daria lugar a

Rt = GtCt−1G′t.

Tratando primeiramente o caso W t escalar (denotando portanto Wt ao inves de W t),

esse acrescimo de incerteza devido a adicao de Wt pode ser alternativamente representado

pelo produto

Rt =1

δ×GtCt−1G

′t,

onde δ ∈ (0, 1]. Assim, a quantidade δ denominada fator de desconto, garante equi-

valencia entre as duas formas alternativas de inflacao de incerteza, se fizermos

Rt = GtCt−1G′t +Wt =

1

δ×GtCt−1G

′t,

donde

24

Wt =

(1

δ− 1

)×GtCt−1G

′t

=

(1− δδ

)×GtCt−1G

′t.

Portando, o uso de fatores de desconto faz com que o papel da variancia Wt seja gerar

um acrescimo multiplicativo de 1−δδ

sobre GtCt−1G′t = Var(Gtθt−1 | Dt−1) para compor a

variancia a priori Rt.

Usualmente, os valores especificados para o fator de desconto δ variam entre 0.9 e 1

(nesse ultimo caso, temos uma evolucao determinıstica para θt onde, no caso particular

em que Gt = 1, temos θt constante), representando um acrescimo percentual de 0 a

11% sobre Var(Gtθt−1 | Dt−1) para compor Var(θt | Dt−1). Valores muito menores do

que 0.9 para δ sao usados no contexto de analise de intervencao nos instantes em que se

anteve alguma mudanca estrutural na serie observada. Tal medida aumenta a incerteza a

priori para θt+1 | Dt, fazendo com que a observacao yt+1 tenha peso muito maior sobre as

estimativas para θt+1 | Dt+1 e, com isso, as estimativas conseguem acompanhar mudancas

bruscas no nıvel da serie. Para maiores detalhes, ver West e Harrison (1997) capıtulo 11.

No caso mais geral em que θt e um vetor p-dimensional, existe mais de um modo de

especificar diferentes valores para os fatores de desconto associados as componentes do

vetor de estados. Pode-se considerar um fator de desconto diferente para cada entrada

de θ, calculando P t = GtCt−1G′t e multiplicando o i-esimo valor da sua diagonal por

1/δi, com δi ∈ (0, 1]. Uma segunda abordagem consiste em definir uma matriz ∆ =

diag(1/√δi, ..., 1/

√δp) e fazer Rt = ∆GtCt−1G

′t∆. Por fim, no caso em que Gt =

BlocoDiag(G1, ...,Gk)t, pode-se ainda considerar um fator de desconto para cada bloco

estrutural multiplicando cada bloco da matriz P t = GtCt−1G′t por 1/δi, i ∈ 1, ..., k.

No capıtulo seguinte, apresenta-se os modelos dinamicos nao lineares, que permitem

a existencia de hiperparametros que caracterizam a matriz de evolucao Gt. Alem disso,

descreve-se uma metodologia capaz de estimar esses hiperparametros juntamente com os

parametros de estado de modo sequencial. Propoe-se duas formas de tratar das variancias

de evolucao: primeiramente, especificando-as atraves de fatores de desconto e a segunda,

estimando uma variancia fixa via quadratura de Gauss-Hermite.

25

Capıtulo 3

Inferencia sequencial em modelos

dinamicos nao lineares

No capıtulo 2, foram apresentados os modelos dinamicos lineares com resposta normal

(MLD) e, no caso mais geral, com resposta na famılia exponencial. Nos casos menciona-

dos, considera-se a matrizGt, que governa a evolucao dos estados, conhecida. Entretanto,

modelos considerando quantidades desconhecidas na matriz de evolucao tem sido propos-

tos, bem como metodologias para estimacao dessas quantidades. Por exemplo, Franco

et al. (2015) discutem estimacao bayesiana de parametros autorregressivos no contexto

da classe parameter driven models (Cox et al., 1981), que incluem erros autorregressi-

vos na equacao do preditor linear no caso em que a variavel resposta tem distribuicao

Poisson. A estimacao classica dos parametros desse modelo e abordada em Zeger et al.

(1988).

Dentre os mais diversos exemplos de modelos dinamicos em que a matriz de evolucao e

caracterizada por hiperparametros, destaca-se aqui os modelos de funcao de transferencia

e os processos autorregressivos.

3.1 Modelos dinamicos nao lineares

Modelos dinamicos nao lineares com resposta na famılia exponencial sao uma extensao

dos modelos lineares generalizados dinamicos devido a presenca de hiperparametros que

26

caracterizam a matriz de planejamento F t ou a matriz de transicao Gt. Conhecidos esses

hiperparametros, tem-se um MLGD.

Mais especificamente, um modelo dinamico nao linear com resposta na famılia expo-

nencial e definido pelo conjunto de equacoes


)bt(yt, Vt) (3.1)

ηt = g(ψt) = F ′t(Ψ)θt (3.2)

θt = Gt(φ)θt−1 + ωt, ωt ∼ [0,W t] (3.3)

que sao simplesmente as equacoes (2.7), (2.8) e (2.9) onde tanto F t quato Gt podem

depender de hiperparametros (Ψ e φ respectivamente), caso esse em que explicita-se a

dependencia dos hiperparametros denotando F t(Ψ) e Gt(φ). Todos os modelos aborda-

dos nesta dissertacao podem ser escritos sem necessidade de incluir parametros na matriz

de planejamento, portanto consideraremos F t conhecida a cada instante t nas secoes e

capıtulos subsequentes.

As proximas duas secoes descrevem exemplos de processos que podem ser incorpora-

dos a um modelo linear generalizado dinamico e que serao utilizados nas aplicacoes do

capıtulo 5, a saber, processos autorregressivos e funcoes de transferencia. Ambas as clas-

ses de processos sao caracterizadas por hiperparametros e, ao incorporar tais processos

a um MLGD, os hiperparametros do processo tornam o modelo nao-linear.

3.2 Processos autorregressivos

Nesta secao, define-se os processos autorregressivos de ordem p, mostrando como in-

cluir processos desse tipo como componentes do vetor de estados de um modelo dinamico.

Definicao 3.1. Um processo estocastico βt; t ∈ N e dito atorregressivo de ordem p (ou

simplesmente βt ∼ AR(p)) caracterizado pelo parametro autorregressivo φ = (φ1, . . . , φp)

se e descrito por

βt = φ1βt−1 + · · ·+ φpβt−p + wt, wt ∼ [0,Wt], ∀t ∈ N, (3.4)

27

onde os erros de evolucao wt sao independentes.

A equacao (3.4) pode ser escrita em forma matricial se considerarmos p− 1 variaveis

auxiliares βi,t, i ∈ 2, . . . , p que representam o processo autorregressivo β1,t = βt de-

fasado de i unidades no tempo. Para isso, definimos βi,t = βi−1,t−1. De fato, temos

βi,t = βi−1,t−1 ⇒ βi,t = β1,t−i+1 ⇒ βi,t−1 = β1,t−i, donde

β1,t = φ1β1,t−1 + φ2β2,t−1 + ...+ φpβp,t−1 + wt

= φ1β1,t−1 + φ2β1,t−2 + ...+ φpβ1,t−p + wt.

Denotando θt = (β1, . . . , βp)′t = (β1,t, . . . , βp,t)

′, φ1:(p−1) = (φ1, . . . , φp−1)′ e In a

matriz identidade de ordem n, temos o processo AR(p) descrito como equacao de evolucao

de um modelo dinamico:

θt = Gt(φ)θt−1 + ωt, ωt ∼ [0,W t], (3.5)

onde

Gt(φ) =

φ′1:(p−1) φp

Ip−1 0

e W t = diag(Wt,0).

A primeira linha da equacao matricial (3.5) define o processo β1,t ∼ AR(p) e as demais

linhas definem recursivamente as variaveis auxiliares βi,t i ∈ 2, . . . , p de acordo com a

equacao βi,t = βi−1,t−1.

Dessa forma, e possıvel especificar uma componente qualquer do vetor de estados de

um modelo dinamico com evolucao temporal segundo um processo AR(p).

Estacionariedade em processos autorregressivos

Processos autorregressivos estacionarios apresentam comportamento estavel com o

decorrer do tempo, conforme sera visto com maior detalhamento adiante, e sao bastante

utilizados em aplicacoes praticas.

28

Definicao 3.2. (Estacionariedade forte) Um processo estocastico βt, t ∈ N e dito

fortemente estacionario se ∀n, h ∈ N os vetores aleatorios (βt1 , . . . , βtn) e (βt1+h, . . . ,

βtn+h) tem a mesma distribuicao para quaisquer que sejam t1, . . . , tn naturais.

Em aplicacoes praticas, costuma ser muito difıcil verificar se a serie temporal estudada

provem de um processo fortemente estacionario, uma vez que se faz necessario verificar se

vetores aleatorios de todos os tamanhos finitos possıveis possuem distribuicao invariante

a translacoes.

Portanto, e comum utilizar uma definicao mais fraca para classificar um processo

estocastico como estacionario que, em suma, leva em conta apenas distribuicoes conjuntas

bivariadas e requer invariancia apenas em termos de momentos de segunda ordem. Mais

especificamente, temos

Definicao 3.3. (Estacionariedade fraca) Um processo estocastico βt, t ∈ N e dito fraca-

mente estacionario se ∀h ∈ N os vetores aleatorios bidimensionais (βt1 , βt2) e (βt1+h, βt2+h)

tem o mesmo vetor de medias e matriz de covariancias para quaisquer que sejam t1, t2

naturais.

Em outras palavras, a definicao 3.3 diz que a media de um processo fracamente

estacionario e constante no tempo e a matriz de covariancias entre βt e βs depende

apenas da distancia | t− s | entre os instantes de tempo.

Deste ponto em diante, sempre que se menciar estacionariedade, refere-se a versao

fraca dada pela definicao 3.3, a menos que se diga explicitamente que se trata de estaci-

onariedade forte.

No contexto de processos autorregressivos, existem condicoes sobre o vetor de parame-

tros φ de modo que o processo apresente comportamento assintoticamente estacionario,

no sentido de que a sequencia de medias do processo converge para um valor finito e as

sequencias (Cov(βt, βt+h))t∈N convergem para qualquer que seja a defasagem h fixada.

Para maiores detalhes refencia-se Enders (2009) pp 55 e 56.

A cada processo AR(p) com parametros autorregressivos φ1, . . . , φp, associa-se a

equacao carcterıstica

29

1− φ1x− . . .− φp−1xp−1 − φpxp = 0 (3.6)

cujas raızes determinam caracterısticas do processo autorregressivo e tambem fornecem

condicoes de estacionariedade. A saber, o processo sera estacionario se, e somente se,

os recıprocos das raızes de sua equacao caracterıstica pertencerem ao interior do cırculo

unitario complexo, ou seja, se forem todos menores do que 1 em modulo (Enders, 2009).

No caso de processos autorregressvos de ordem 1, a condicao para estacionariedade e

−1 < φ1 < 1 onde o processo apresenta um comportamento oscilatorio em torno de zero

nos instantes iniciais se φ1 < 0. Ja no caso de processos AR(2), obtem-se estacionariedade

se −1 < φ2 < min(1 − φ1, φ1 + 1), onde as raızes da equacao caracterıstica sao comple-

xas conjugadas se φ2 < −14φ21, caso esse em que o processo apresenta comportamento

oscilatorio em torno de zero nos instantes iniciais.

3.3 Funcoes de transferencia

As funcoes de transferencia permitem tratar do efeito cumulativo no tempo de uma

regressora sobre a variavel resposta. Portanto, para este tipo de modelagem, assume-se

que o efeito da regressora sobre a resposta media nao seja apenas imediato, mas sim que

perdure ao longo de um determinado perıodo de tempo.

Assuma que uma das componentes do vetor de estados θt seja Et, que denota o efeito

de uma regressora X sobre o preditor linear, relacionado a variavel resposta atraves da

funcao de ligacao. A forma mais simples possıvel para Et sao as defasagens distribuıdas:

Et = β0Xt + β1Xt−1 + . . .+ βsXt−s (3.7)

com β0, . . . , βs geralmente seguindo alguma restricao, por exemplo polinomial de grau d

(Almon, 1965):

βj =d∑

k=0

ζkjk, j = 0, 1, . . . , s.

30

Sob essa abordagem, e necessario especificar o horizonte de influencia (s) da regressora

sobre a resposta, uma vez que a partir da equacao (3.7), nota-se que Xt compoe apenas os

efeitos Et, Et+1, . . . , Et+s. Alem disso, e necessario ainda especificar a ordem do polinomio

que descreve os efeitos βj em funcao da defasagem j.

Uma alternativa e utilizar efeitos de funcao de transferencia. Sob esta abordagem,

assumimos que o efeito cumulativo de X sobre o preditor possa ser expresso por:

Et = φ1Et−1 + . . .+ φrEt−r + γ1Xt−b + . . .+ γsXt−b−s+1, (3.8)

ou equivalentemente,

Et − φ1Et−1 − . . .− φrEt−r = γ1Xt−b + . . .+ γsXt−b−s+1

(1− φ1B − . . .− φrBr)Et = (γ1Bb + . . .+ γsB

b+s−1)Xt

φ(B)Et = γ(B)Xt, (3.9)

onde B e o operador defasagem, (i.e., BXt = Xt−1) e as funcoes φ e γ sao definidas

respectivamente por φ(B) = 1− φ1B − . . .− φrBr, e γ(B) = γ1Bb + . . .+ γsB

b+s−1.

Em analogia aos processos ARMA, φ(B) corresponde a parte autorregressiva AR(r)

e γ(B) a parte medias moveis MA(s) na equacao (3.9) no caso especial em que Xt e um

ruıdo branco. Denotaremos por TF(r,b,s) o processo definido pela equacao (3.9).

Aplicando sucessivamente a equacao (3.8), vemos que o processo Et pode ser escrito

como uma combinacao linear finita de termos defasados da regressora Xt:

Et = v0Xt−b + v1Xt−b−1 + v2Xt−b−2 + . . . (3.10)

em que omitimos a regressora medida em tempos anteriores a t− b− 2, alem de r termos

iniciais da sequencia Et. Portanto, vk representa o efeito da regressora b + k unidades a

frente no tempo. A funcao v : N∪ 0 → R, v(k) = vk e chamada funcao de resposta ao

impulso.

Outra funcao importante neste contexto e a funcao S : N ∪ 0 → R, S(n) = Sn =∑nk=0 vk que recebe o nome de funcao de transferencia e representa a soma dos impactos

31

(tambem chamado efeito cumulativo) da regressora sobre o preditor linear desde b ate

b+ n instantes de tempo a frente.

Para ilustrar os conceitos de resposta ao impulso e funcao de transferencia, considere

o exemplo TF(1,0,1) apresentado a seguir:

Exemplo 3.1. Seja o modelo de funcao de transferencia TF(1,0,1):

Et = φEt−1 + γXt. (3.11)

Aplicando sucessivamente a equacao (3.11) aos termos Et, Et−1, . . . , E2, temos

Et = φt−1E1 +t−1∑k=0

φkγXt−k. (3.12)

Portanto, nesse caso, a funcao de resposta ao impulso e dada por vk = φkγ, e a

funcao de transferencia e Sn =∑n

k=0 φkγ. Nos casos praticos em que nao se espera um

comportamento crescente no tempo e ilimitado para o efeito de uma regressora, espera-se

ter φ ∈ (−1, 1) e portanto o impacto da regressora sobre o preditor linear decai exponen-

cialmente com uma intensidade φ, com efeito imediato (tambem chamado de resposta

imediata ao impulso) de magnitude γ sobre o preditor. Ja a funcao de transferencia

Sn =∑n

k=0 γφk nos diz, por exemplo, que o impacto cumulativo total de X sobre o pre-

ditor no tempo corrente e em todos os instantes de tempo futuros e γ1−φ (no caso em que

−1 < φ < 1).

Escrevendo o modelo como componente do vetor de estados no contexto de modelos

dinamicos, tem-se

Etγt

=

φ Xt

0 1

Et−1γt

Portanto, fazendo θt = (Et, γt)′, Gt(φ) =

φ Xt

0 1

e W t =

0 0

0 0

, temos a

equacao de evolucao

32

θt = Gt(φ)θt−1 +wt, wt ∼ [0,W t]

como em (3.3).

O Exemplo 3.1 mostrou como escrever o modelo TF (1, 0, 1) na forma de estrutura

latente em modelos dinamicos atraves da equacao de evolucao (3.3). O caso geral, ou seja,

TF (r, b, s) usa ideias bastante similares as que foram descritas na secao 3.2, referente aos

processos autorregressivos, como sera visto logo a seguir.

Considera-se inicialmente r−1 variaveis auxiliares Ei,t, i ∈ 2, . . . , r que representam

a parte autorregressiva E1,t = Et com defasagem de i unidades no tempo bastando-se,

para isso, definir Ei,t = Ei−1,t−1, i ∈ 2, . . . , r e E1,t = Et. De fato, Ei,t = Ei−1,t−1 ⇒

Ei,t = E1,t−i+1 ⇒ Ei,t−1 = E1,t−i, donde

E1,t = φ1E1,t−1 + φ2E2,t−1 + ...+ φpEp,t−1 + γ1Xt−b + . . .+ γsXt−b−s

= φ1E1,t−1 + φ2E1,t−2 + ...+ φpE1,t−p + γ1Xt−b + . . .+ γsXt−b−s.

O vetor de estados e definido entao como θt = (E1, E2, . . . , Er, γ1, . . . , γs)′t. Denotando

φ1:(p−1) = (φ1, . . . , φp−1)′, X = (Xt−b, . . . , Xt−b−s+1) e In a matriz identidade de ordem n,

temos o processo TF (b, r, s) descrito como equacao de evolucao de um modelo dinamico:

θt = Gt(φ)θt−1 + ωt, ωt ∼ [0,W t], (3.13)

onde

Gt(φ) =

φ′1:(r−1) φp X

Ir−1 0 0

0 0 Is

e W t = diag(Wt,0).

A primeira linha da equacao matricial (3.13) descreve o efeito de funcao de trans-

ferencia Et ∼ TF (r, b, s), as linhas 2 a r definem as variaveis auxiliares Ei,t = Ei−1,t−1 e

as linhas de r+1 a r+s determinam os coeficientes γ1, . . . γs criando a dinamica artificial

γi,t = γi,t−1.

33

Na secao seguinte, aponta-se brevemente alguns procedimentos de inferencia na classe

de modelos dinamicos nao lineares presentes na literatura e, em seguida, descreve-se a

metodologia sequencial proposta neste trabalho.

3.4 Inferencia em modelos dinamicos nao-lineares

Existe uma gama diversa de metodologias inferenciais para estimacao de parametros

em modelos dinamicos nao-lineares.

No contexto de processos autorregressivos, Huerta e West (1999) utilizam metodos

MCMC, portanto nao-sequenciais, parametrizando o processo em termos dos recıprocos

das raızes do polinomio caracterıstico associado. A classe de prioris utilizada contempla

raızes reais e complexas restritas a regiao de estacionariedade. Ainda no contexto de pro-

cessos autorregressivos, Prado e Lopes (2013) descrevem metodologia sequencial atraves

de filtros de partıcula com aprendizagem para estimacao dos parametros autorregressivos

em contextos em que a variavel resposta e normal.

Em Pole (1988) e Pole e West (1990), descreve-se uma metodologia sequencial em

modelos dinamicos normais com efeitos de funcao de transferencia. Nestes trabalhos,

utiliza-se do esquema sequencial descrito em West e Harrison (1997), capıtulo 4, para

conjugacao normal-gama para o par (θt, V ) onde θt representa um efeito de funcao de

transferencia. A estimacao do hiperparametro e feita atraves de quadratura adaptativa

de Gauss-Hermite. A metodologia proposta nesta dissertacao segue as linhas descritas

em Pole (1988) e Pole e West (1990) no que se refere ao uso de quadratura de Gauss-

Hermite, porem aqui nao nos restringimos ao caso normal e investigamos tambem outras

formas de processos latentes alem das funcoes de transferencia.

As subsecoes 3.4.1, 3.4.2 e 3.4.3 a seguir descrevem e exemplificam uma metodologia

alternativa aquelas referenciadas nos dois paragrafos anteriores no que se refere a es-

timacao de hiperparametros em modelos dinamicos. Resumidamente, expande-se o vetor

de estados para incluir os hiperparametros do modelo linearizando a equacao de evolucao

resultante para aplicar a metodologia sequencial desenvolvida em West et al. (1985) aos

estados, conforme descrito na subsecao 2.2.3. Ja na secao 3.5, apresenta-se o uso de

34

quadratura de Gauss-Hermite, que pode ser visto como alternativa a expansao do vetor

de estados para estimar os hiperparametros da matriz de evolucao, ou entao para estimar

a variancia de evolucao de componentes dinamicas.

3.4.1 Expansao do vetor de estados

Em situacoes mais gerais do que aquelas mencionadas no capıtulo 2, existem parame-

tros desconhecidos a serem estimados na matriz de evolucaoGt, ou no vetor de covariaveis

F t, o que introduz uma nao-linearidade na evolucao temporal do vetor de estados.

Para tratar do caso em que a matriz de evolucaoGt e definida em funcao de parametros

φ, caso este em que denotaremos Gt = Gt(φ), o procedimento descrito nesta secao con-

siste em incorporar ao vetor de estados θt o vetor de hiperparametros φ de modo que o

vetor de estados expandido passa a ser θ′t = (θ′t,φ

′t) criando-se uma relacao artificial de

evolucao para os hiperparametros: φt = φt−1.

Apesar de nao ser abordado neste trabalho, o caso em que a matriz de planejamento

F t depende de hiperparametros e similar ao caso em que existem hiperparametros na

matriz Gt.

Dessa forma, o modelo dinamico apresentado em (2.7), (2.8) e (2.9) passa a ser descrito

por


)bt(yt, Vt) (3.14)

ηt = g(ψt) = F tθt (3.15)

θt = f(θt−1) + ωt, ωt ∼ (0, W t), (3.16)

onde f(θt−1) = (Gt−1(φt−1)θt−1, φt−1) e W t = diag(W t, 0). Note-se que a funcao f

em (3.16) agora e nao-linear, portanto, o vetor de medias e matriz de covariancias para

a posteriori do vetor de estados expandido nao podem ser obtidos atraves dos momentos

de primeira e segunda ordem do vetor de estados a priori conforme descrito no passo 1

da subsecao 2.2.3. Para tanto, procede-se para a linearizacao desta relacao.

35

3.4.2 Linearizacao da equacao de evolucao

O modelo dinamico descrito pelas equacoes (3.14), (3.15) e (3.16) que resulta do

processo de expansao do vetor de estados de modo a incorporar hiperparametros e dito

nao linear porque a evolucao na media dos estados em tempos subsequentes se da atraves

de uma funcao nao linear f . No caso dos modelos lineares generalizados dinamicos

descritos por (2.7), (2.8) e (2.9), a funcao f e definida por f(θt−1) = Gtθt−1 e portanto

e linear em θt.

A metodologia adotada para manter o carater sequencial de inferencia sobre θt em

termos de momentos de primeira e segunda ordem, consiste em aplicar uma tecnica de

linearizacao a equacao de evolucao (3.16) com o objetivo de aproximar o modelo nao-

linear por um MLGD. Procedendo deste modo, estamos aproximando o modelo dinamico

original (nao-linear) por um MLGD e utilizando a inferencia realizada sob o modelo linear,

tal como exibido na subsecao 2.2.3, como aproximacao para a inferencia sob o modelo

nao-linear.

Mais especificamente, considerando a equacao de evolucao nao-linear (3.16), tome a

expansao de Taylor de ordem 1 para f ao redor de mt−1 = E(θt−1 | Dt−1). Desse modo,

segue que

θt ≈ f(mt−1) + f ′(mt−1)(θt−1 −mt−1) + ωt

= ht +H tθt−1 + ωt, (3.17)

onde ht = f(mt−1)− f ′(mt−1)mt−1 e H t = f ′(mt−1).

Aqui, para D ⊂ Rp, f : D → Rp uma funcao derivavel com x = (x1, . . . , xp) ∈ D e

f(x) = (f1(x), . . . , fp(x)), a notacao f ′(x) representa a matriz de derivadas de f avaliada

no ponto x:

f ′(x) =

∂f1(x)∂x1

. . . ∂f1(x)∂xp

.... . .

...

∂fp(x)

∂x1. . . ∂fp(x)

∂xp

.36

Note-se que a unica distincao entre a equacao (3.17) e a equacao de evolucao apresen-

tada em (2.9) se deve a existencia do vetor ht, conhecido no tempo t, como consequencia

da aproximacao linear de Taylor aplicada a evolucao dos estados. Dessa forma, o proce-

dimento sequencial descrito na subsecao 2.2.3 e aplicado ao modelo dinamico descrito por

(3.14), (3.15) e (3.17) alterando-se apenas o passo 1 onde se obtem at = ht +H tmt−1 =

f(mt−1) e Rt = H tCt−1H t +W t.

3.4.3 Exemplos

A seguir, descreve-se resumidamente os calculos para aplicacao das tecnicas de linea-

rizacao e expansao do vetor de estados no contexto de processos latentes autorregressivos

e funcoes de transferencia.

Exemplo 3.2. (Processos AR(p)). Na secao 3.2, mostrou-se que para incluir um pro-

cesso βt ∼ Ar(p) como componente do vetor de estados, considera-se

θ′t = (β1, . . . , βp)t

com β1,t = βt e

Gt(φ) =

φ′1:(p−1) φp

Ip−1 0

e W t = diag(Wt,0).

Para estimar o vetor de parametros autorregressivos φ, expande-se o vetor de estados

fazendo θ′t = (θ′t,φ

′t) onde φt = φ = (φ1, . . . , φp)

′, ∀t ∈ N de forma que a evolucao dos

parametros ocorre de modo nao linear de acordo com a equacao (3.16), em que

f(θt−1) =

(p∑i=1

φiβi, β1, . . . , βp−1, φ1, . . . , φp

)′t−1

.

Para aplicar o esquema sequencial de inferencia ao modelo, basta descrever a matriz

H t. Denotando o vetor de medias a posteriori no tempo t− 1 por

37

m = mt−1 = (mβ1 , . . . ,mβp ,mφ1 , . . . ,mφp)′,

onde mβi = E(βi,t−1 | Dt−1) e mφi = E(φi | Dt−1) , segue que

H t = f ′(mt−1) =

m(p+1):(2p−1) mφp m1:p

Ip−1 0 0

0 0 Ip

.

onde ma:b denota o vetor obtido tomando-se as b− a+ 1 entradas de m desde a posicao

a ate a posicao b e In denota a matriz identidade de dimensao n.

Exemplo 3.3. (Processos TF(r,b,s)). Na secao 3.3, mostrou-se que para incluir um

processo Et ∼ TF (r, b, s) como componente do vetor de estados, considera-se

θ′t = (E1, . . . , Er, γ1, . . . , γs)t

com E1,t = Et e

Gt(φ) =

φ′1:(r−1) φp X

Ir−1 0 0

0 0 Is

e W t = diag(0),

onde X = (Xt−b, . . . , Xt−b−s+1).

Para estimar o vetor de parametros autorregressivos φ, expande-se o vetor de estados

fazendo θt = (θ′t,φ′t) onde φt = φ = (φ1, . . . , φp)

′, ∀t ∈ N de forma que a evolucao dos

parametros ocorre de modo nao linear de acordo com a equacao (3.16), em que

f(θt−1) =

(r∑i=1

φiEi +s−1∑i=0

γi+1Xt−b−i, E1, . . . , Er−1, φ1, . . . , φr, γ1, . . . , γs

)′t−1

.

Para aplicar o esquema sequencial de inferencia ao modelo, basta descrever a matriz

H t. Denotando o vetor de medias a posteriori no tempo t− 1 por

38

m = mt−1 = (mE1 , . . . ,mEr ,mφ1 , . . . ,mφr ,mγ1 , . . . ,mγs)′,

onde mEi = E(Ei,t−1 | Dt − 1), mφi = E(φi | Dt−1) e mγi = E(γi,t−1 | Dt−1), segue que

H t = f ′(mt−1) =

m(r+1):(2r−1) mφr m1:r X

Ir−1 0 0 0

0 0 Ir 0

0 0 0 Ir

.

onde ma:b denota o vetor obtido tomando-se as b− a+ 1 entradas de m desde a posicao

a ate a posicao b e In denota a matriz identidade de dimensao n.

3.5 Quadratura de Gauss-Hermite em modelos

dinamicos nao-lineares

A quadratura de Gauss-Hermite foi bastante utilizada na decada de 80 para estimacao

de hiperparametros tanto em modelos estaticos (Naylor e Smith, 1982) quanto em mo-

delos dinamicos com resposta normal (Pole 1988, Pole e West 1990). Ate o momento,

porem, nao se tem na literatura aplicacao de tais metodos em modelos dinamicos nao-

lineares, tais como os que foram apresentados nas secoes 3.2 e 3.3, quando a variavel

resposta nao e normal. Pode-se, portanto, adotar tal metodo para estimacao de com-

ponentes desconhecidas na matriz Gt como alternativa a expansao do vetor de estados

e linearizacao da equacao de evolucao. O metodo da quadratura de Gauss Hermite

tambem pode ser adotado para estimacao de variancias de evolucao, omo alternativa a

especificacao indireta via fatores de desconto.

O procedimento inferencial no caso dos modelos dinamicos consiste em criar uma

grade para o hiperparametro, que denotaremos nessa secao por α, grade esta que evo-

lui dinamicamente a medida que novas observacoes se tornam disponıveis. Desse modo,

preserva-se o carater sequencial de inferencia tambem quando se quer estimar os hiper-

39

parametros do modelo dinamico. A unica exigencia que se faz sobre o hiperparametro α

e que, condicionalmente a ele, tenhamos um MLGD. Portanto, no contexto dos modelos

dinamicos nao-lineares tratados aqui, pode-se ter α = φ onde φ caracteriza a matriz

de evolucao Gt ou α = W = W t ∀t ∈ N, ou ainda α = (φ,W ). Nesta dissertacao,

sera dado foco ao segundo caso, ou seja, utilizaremos a quadratura adaptativa de Gauss-

Hermite para estimar a variancia dos erros de evolucao em conjunto com a metodologia

de expansao do vetor de estados para estimar o vetor de hiperparametros φ nos estu-

dos de simulacao e as aplicacoes a dados reais que constam nos capıtulos 4 e 5. Para a

descricao que sera feita a seguir, considera-se α unidimensional (portanto escrevemos α

ao inves de α), porem o caso mais geral em que α e um vetor de hiperparametros pode

ser estendido com algumas adaptacoes a partir do caso unidimensional (West e Harrison

1997 e Smith et al. 1987).

A quadratura de Gauss-Hermite fornece aproximacao para integrais da forma

∫ ∞−∞

e−t2

f(t)dt (3.18)

pela combinacao linear

n∑i=1

wif(ti), (3.19)

onde os pontos ti, i ∈ 1, . . . , n formam uma grade em torno de zero e correspondem

as raızes do polinomio de Hermite de grau n (Salzer et al., 1952). Tanto os pesos wi

quanto as raızes dos polinomios de Hermite estao calculados para diversos valores de n

(Salzer et al., 1952). A aproximacao (3.19) e exata para toda funcao polinomial f de

grau menor que ou igual a 2n−1. Como o fator multiplicativo e−t2

apresenta decaimento

exponencial quadratico conforme t se distancia de zero, em geral, valores de t distantes

da origem sao desprezıveis no calculo da integral (3.18), o que torna o comportamento

aproximadamente polinomial para a funcao f necessario apenas ao redor de zero, em

termos praticos.

Aplicando a mudanca de variavel α =√

2σt+ µ na integral (3.18), temos

40

∫ ∞−∞

e−t2

f(t)dt =

∫ ∞−∞

1√2σe−

12(α−µσ )

2

f

(α− µ√

2σ

)dα

=

∫ ∞−∞

N(α;µ, σ2)√πf

(α− µ√

2σ

)dα,

onde N(x;µ, σ2) representa a densidade da normal com media µ e variancia σ2 avaliada

no ponto x.

Assim, e possıvel extender a aplicacao da quadratura de Gauss-Hermite para integrais

da forma

∫ ∞−∞

g(α)N(α;µ, σ2)dα

definindo a funcao f em (3.18) atraves da relacao g(α) = f(α−µ√2σ

)√π, ou seja, f(α) =

g(√2σα+µ)√π

. Assim, temos

∫ ∞−∞

g(α)N(α;µ, σ2)dα ≈n∑i=1

wi√πg(√

2tiσ + µ). (3.20)

Para descricao do metodo aplicado ao contexto de modelos dinamicos utilizaremos

uma forma equivalente de expressar a integral (3.20), agora como combinacao linear do

integrando avaliado nos pontos da grade.

Considere uma funcao h qualquer de domınio R. Entao,

∫ ∞−∞

h(α)dα =

∫ ∞−∞

h(α)

N(α;µ, σ2)N(α;µ, σ2)dα

≈n∑i=1

h(√

2σti + µ)

N(√

2σti + µ;µ, σ2).wi√π

=n∑i=1

h(√

2σti + µ)wi1√2πσ

e−t2i ×√π

=n∑i=1

h(αi)mi,

onde os novos pesos sao dados por

41

mi =√

2σwiet2i (3.21)

e os respectivos pontos da grade

αi =√

2σti + µ (3.22)

agora estao centrados em µ com um fator de dispersao σ. Em suma, a aproximacao por

n pontos via Gauss-Hermite sera boa se o integrando puder ser escrito como produto de

uma densidade normal por uma funcao g que apresente comportamento aproximadamente

polinomial de grau ate 2n− 1 na regiao central de valores nao-desprezıveis da densidade

normal em questao. Tal regiao e definida pelos parametros µ e σ2, sendo assim cruciais

para a eficiencia do metodo de quadratura. Veremos logo a seguir que µ e σ2 serao

escolhidos como a moda e a variancia a posteriori do hiperparametro α, e portanto a

densidade N(α;µ, σ2) sera utilizada como aproximacao para p(α | Dt).

O procedimento inferencial no contexto de modelos dinamicos nao-lineares pode ser

resumido do seguinte modo:

1. No tempo t, considere disponıveis E(α | Dt−1), V ar(α | Dt−1) e uma grade L0 para

α | Dt−1 em que tenhamos avaliado p(αi | Dt−1), ∀αi ∈ L0. Alem disso, suponha

conhecidos media mt−1 = E(θt−1 | Dt−1) e variancia Ct−1 = V ar(θt−1 | Dt−1)

incondicionais para o vetor de estados.

2. Calcula-se E(α | Dt), V ar(α | Dt) e p(αi | Dt), ∀αi ∈ L0 usando quadratura de

42

5. Obtenha esperanca e variancia para θt | Dt:

E(θt | Dt) = E[E(θt | α,Dt) | Dt]

=

∫ ∞−∞

E(θt | α,Dt)p(α | Dt)dα

≈∑αi∈L1

miE(θt | αi, Dt)p(αi | Dt)

E(θtθ′t | Dt) =

∫ ∞−∞

E(θtθ′t | α,Dt)p(α | Dt)dα

≈∑αi∈L1

miE(θtθ′t | αi, Dt)p(αi | Dt)

V ar(θt | Dt) = E(θtθ′t | Dt)− E(θt | Dt)E(θ′t | Dt)

Os vetores mt(αi) = E(θt | αi, Dt), e matrizes Ct(αi) = V ar(θt | αi, Dt), αi ∈ L0

podem ser facilmente calculados atraves demt−1(αi) e Ct−1(αi) obtidos na iteracao

t−1, atualizando-os a luz da observacao corrente yt segundo o procedimento escrito

na secao 2. Obtem-se mt(αi), αi ∈ L1 interpolando (digamos, linearmente) cada

uma das componentes do vetor mt interpretando-as como funcoes de α, usando-se

para a interpolacao os pontos da grade antiga αi ∈ L0. Para obter Ct(αi), αi ∈ L1,

o procedimento e inteiramente analogo.

6. Faca L0 = L1 e itere.

Conforme discutido anteriormente, as funcoes de densidade a posteriori p(α | Dt−1)

para o hiperparametro α precisam ser aproximadamente normais, portanto e aconselhavel

que o suporte de α seja a reta real para aumentar a eficiencia do metodo da quadratura.

O caso geral em que o hiperparametro nao esta definido em todo R pode ser facilmente

contornado utilizando uma transformacao adequada do hiperparametro.

Conforme mencionado no inıcio dessa secao, optou-se por utilizar o metodo de qua-

dratura de Gauss Hermite para estimar variancias de evolucao de componentes dinamicas

do vetor de estados. A primeira vista, esta pode nao parecer a melhor escolha, uma vez

que fatores de desconto, por exemplo, poderiam ser usados para esta finalidade e sua

implementacao e, certamente, muito mais simples e rapida que a quadratura de Gauss

Hermite. Porem, existem contextos especıficos em que a utilizacao de fatores de desconto

44

podem levar a posterioris degeneradas, como e o caso dos processos autorregressivos nor-

mais, que sera discutido brevemente na secao seguinte.

3.6 Fatores de desconto para componentes autorre-

gressivas

Esta secao trata de algumas consideracoes em relacao a especificacao da sequencia

dos erros de evolucao de uma componente autorregressiva em modelos dinamicos. Es-

sencialmente, apresenta-se uma breve discussao sobre restricoes de ordem pratica para o

intervalo de valores do desconto relacionadas a convergencia da sequencia de variancias a

posteriori em modelos com componentes autorregressivas. Veremos que em alguns casos

bastante simples, o nao cumprimento de tais restricoes pode fazer com que as estimati-

vas para o processo autorregressivo sejam assintoticamente constantes com convergencia

sendo atingida muito rapidamente, o que nao condiz com o comportamento do processo

real.

De acordo com as equacoes de atualizacao no contexto dos modelos dinamicos com

resposta naral e variancia de observacao conhecida na subsecao 2.2.1, observa-se que yt

nao consta na expressao analıtica de nenhuma das variancias Rt, Qt, Ct quando se usa

fatores de desconto, portanto, a variancia a posteriori Ct decresce em funcao apenas da

quantidade de observacoes contida no vetor de dados, independentemente dos particulares

valores observados para yt. No caso especıfico do MLD com uma unica componente AR(1)

e variancias Vt e Wt conhecidas, tambem e possıvel obter expressao analıtica para o limite

da sequencia de variancias a posteriori (Ct)t∈N, como dito na

Proposicao 3.1. Considere o MLD dado pela quadrupla 1, φ, Vt,Wt, onde Vt e Wt sao

conhecidos ∀t ∈ N. Suponha que limt→∞ Vt = V > 0 e que a sequencia Wt e especificada

atraves do fator de desconto δ ∈ (0, 1]. Se a sequencia Ct converge, entao os unicos va-

lores limites possıveis para Ct sao 0 e(

1− δφ2

)V (neste ultimo caso, desde que se tenha

δ < φ2).

45

Demonstracao. Usando fator de desconto para declarar as variancias Wt no MLD dado

pela quadrupla 1, φ, Vt,Wt, temos Rt = φ2

δCt−1, e At = Rt

Rt+Vtdonde, dadas as hipoteses

da proposicao,

Ct = AtVt ⇒ C =φ2

δCV

φ2

δC + V

⇒ C2φ2

δ+ CV − φ2

δCV = 0

⇒ C

(φ2

δC +

(1− φ2

δ

)V

)= 0

⇒ C

(C +

(δ

φ2− 1

)V

)= 0

⇒ C = 0 ou C =

(1− δ

φ2

)V.

Em processos autorregressivos estacionarios de 1a ordem, a condicao δ < φ2 para

limite estritamente positivo da sequencia de variancias a posteriori Ct dada na Proposicao

3.1 pode ser bastante restritiva. Para processos autorregressivos θt = φθt−1 + wt onde,

por exemplo, φ = 0.9, devemos ter δ < 0.81 a fim de que tenhamos variancia limite

estritamente positiva. Para valores menores de φ, a restricao sobre o fator de desconto e

ainda mais severa; para φ = 0.7, por exemplo, devemos ter δ < 0.49.

A figura 3.6 ilustra o efeito da restricao δ < φ2 sobre as estimativas a posteriori para

os estados no modelo do exemplo 2.1 simulado com Wt = 1,∀t ∈ N, fazendo uso de

fator de desconto no processo de estimacao dos estados. A priori usada foi θ1 | D0 ∼

N(0, 100). Quando a condicao δ < φ2 nao e satisfeita, Ct rapidamente converge a zero

e as estimativas para θt se tornam constantes, o que claramente nao corresponde ao

comportamento observado nos dados.

Para maiores detalhes, referencia-se Ameen (1984) e Ameen e Harrison (1984) onde

a Proposicao 3.1 esta demonstrada e e discutida de modo mais aprofundado.

46

0 20 40 60 80 100

05

1015

20

t

Ctlim Ct

(a) δ = 0.9, φ = 1

0 20 40 60 80 100

−5

05

1015

t

mt

mt ± 2 × Ct

(b) δ = 0.9, φ = 1

0 20 40 60 80 100

−10

−5

05

1015

t

Ctlim Ct

(c) δ = 0.9, φ = 0.8

0 20 40 60 80 100

−4

−2

02

4

t

mt

mt ± 2 × Ct

(d) δ = 0.9, φ = 0.8

Figura 3.1: Estimacao de θt ∼ AR(1) em MLD1, φ, V,Wt com φ conhecido e Wt

especificado pelo fator de desconto δ. Priori: θ1 ∼ N(0, 100). mt = E(θt | Dt), Ct =

V ar(θt | Dt).

47

Capıtulo 4

Estudo de simulacao

4.1 Descricao e objetivos do estudo simulado

O principal objetivo do estudo simulado desenvolvido neste capıtulo e investigar em-

piricamente o precedimento sequencial baseado no uso simultaneo da expansao do vetor

de estados e da quadratura adaptativa de Gauss Hermite. Tal procedimento pode ser

aplicado a qualquer modelo dinamico com resposta na famılia exponencial permitindo

estimar hiperparametros na matriz de evolucao, alem das variancias de evolucao das

componentes dinamicas do modelo. Aqui, o foco e dado a estimacao de hiperparametros

em processos autorregressivos como componentes latentes de modelos dinamicos com

resposta na famılia exponencial.

Considerou-se modelos dinamicos com resposta normal, poisson e binomial com com-

ponentes autorregressivas de ordens 1, 2 e 3 compondo o vetor de estados. Os valores

fixados para os parametros autorregressivos e variancias observacional (V) e de evolucao

(W) sao os mesmos utilizados em Prado e Lopes (2013), a saber, φ1 = 0.95 para os proces-

sos AR(1), (φ1, φ2) = (0.1, 0.8) para os processos AR(2) e (φ1, φ2, φ3) = (0.81, 0.77, 0.86)

para processos AR(3), com W=0.1 e V=0.02. No caso βt ∼ AR(2) com φ = (0.1, 0.8),

os recıprocos das raızes do polinomio caracterıstico definido na equacao (3.6) valem 0.95

e 0.85. No caso AR(3), temos uma raız real, cujo recıproco vale -0.95, e um par de raızes

complexas nao-reais cujos recıprocos valem 0.95e±2πi16 Portanto, a metodologia descrita

aqui pode ser vista como uma alternativa, tambem sequencial, aos filtros de partıcula de

48

Carvalho et al. (2010), Liu e West (2001) e Storvik (2002) aplicados por Prado e Lopes

(2013) ao contexto de modelos dinamicos normais com estrutura autorregressiva. Alem

disso, estendemos o estudo a modelos dinamicos com resposta na famılia exponencial,

estimando tambem os hiperparametros que caracterizam os processos autorregressivos

latentes.

Ao desenvolver metodologia sequencial para tais modelos possibilita-se que a es-

timacao de parametros e obtencao de previsoes a cada tempo t sejam feitas condicio-

nalmente a inferencia ja obtida no tempo t− 1, o que nao ocorre nos esquemas MCMC.

Alem disso, esquemas MCMC costumam demandar mais tempo computacional para se-

rem implementados.

No contexto inferencial bayesiano aplicado a modelos autorregressivos (resposta nor-

mal), Huerta e West (1999) desenvolvem um esquema MCMC, parametrizando o processo

em termos das raızes do polinomio caracteristico associado. Em Huerta e West (1999),

trata-se formalmente da estimacao da ordem do processo autorregressivo incluindo uma

variavel auxiliar com suporte −1, 0, 1 que atribui probabilidade positiva de que o

modulo de cada raız do polinomio caracterıstico assuma os valores -1, 0 e 1. Assim,

se ordenarmos o modulo das raızes r1 < r2 < ... < rq e observarmos P (ri = 0 | DN) alta

para i ∈ q−p+ 1, ..., q, temos fortes indıcios de que a serie observada seja um processo

AR(p).

Descrevendo em maiores detalhes a metodologia aplicada neste estudo de simulacao,

utilizamos a expansao do vetor de estados para incorporar os parametros dos processos

autorregressivos latentes, tal como descrito na subsecao 3.4.1, e linearizacao da equacao de

evolucao resultante do processo de expansao dos estados, conforme descrito na subsecao

3.4.2. Condicionalmente ao conhecimento da variancia dos erros de evolucao, aplica-se

o esquema sequencial de inferencia mencionado nas subsecoes 2.2.1 (resposta normal)

e 2.2.3 (resposta binomial e Poisson). Para estimar a variancia dos erros de evolucao,

utilizou-se a quadratura adaptativa de Gauss-Hermite, descrita na secao 3.5.

Os resultados estao agrupados nas proximas tres secoes segundo a distribuicao da

variavel resposta (normal, poisson e binomial, respectivamente). Dentro destas, cada

subsecao trata de modelos com estrutura autorregressiva latente de ordem 1, 2 ou 3. Em

49

todos os casos, foram simuladas 100 replicas de cada modelo, com series de tamanho 1000,

para as quais exibem-se resultados considerando as primeiras 50, 250 e 1000 observacoes

da serie no processo de estimacao. A estimacao via quadratura de Gauss-Hermite foi feita

a partir de uma grade de 15 pontos nos modelos normal e Poisson. No caso binomial,

utilizou-se 9 pontos. A intencao inicial era considerar grades de 9 pontos tambem para

os modelos normal e Poisson, porem, nestas circunstancias, obtivemos matrizes de co-

variancia nao positivas definidas para alguns instantes de tempo para algumas das series

simuladas.

Primeiramente, sao exibidos resultados considerando a variancia de evolucao W co-

nhecida, com a finalidade de estudar a sensibilidade do procedimento inferencial proposto

a especificacoes erroneas de W sobre os parametros do processo autorregressivo. Em se-

guida, sao exibidos os resultados obtidos estimando W via quadratura de Gauss Hermite.

Investiga-se ainda a capacidade do procedimento inferencial proposto em identificar a or-

dem do processo autorregresivo subjacente. Especificamente, isso e feito verificando se,

dadas observacoes provenientes de um modelo dinamico com estrutura latente AR(p),

consegue-se recuperar o valor de p especificando estrutura latente AR(q), onde q > p, e

as estimativas a posteriori para os parametros autorregressivos φp+1, . . . , φq sao proximas

de zero. Isso e ilustrado nas subsecoes referentes aos processos AR(3), em que especifi-

camos estrutura AR(5) ao fazer o ajuste dos modelos.

4.2 Modelo Normal

Descreve-se nessa secao os resultados da aplicacao da metolodogia sequencial proposta

a modelos dinamicos normais. As series foram simuladas com variancia observacional

V = 0.02 e variancia de evolucao W = 0.1. A baixa magnitude de V se comparada a W

faz com que as series simuladas tenham comportamento muito proximo de um processo

AR(p) sem adicao de ruıdo.

50

4.2.1 Modelo normal com estrutura latente AR(1)

Todas as series de dados que constam nessa secao foram simuladas a partir do

MLD1, φ, V,W :

Modelo normal AR(1):

yt ∼ N(βt, V )

βt = φβt−1 + wt, wt ∼ N(0,W ),

com W = 0.1 e V = 0.02. Especificou-se as distribuicoes marginais a priori (independen-

tes):

β1 | D0 ∼ T4.02(0, 10)

V ∼ GamaInversa(2.01, 0.101)

φ ∼ T4.02(0, 0.5).

Os parametros da distribuicao a priori marginal para φ foram escolhidos de forma

que φ esteja entre -1 e 1 (regiao de estacionaridade) com probabilidade bastante alta

(aproximadamente igual a 0,884) porem admitindo probabilidade nao desprezıvel para a

regiao de nao estacionaridade. Ja para a variancia observacional V , temos E(V | D0) =

0.1 e V ar(V | D0) = 0.099 ≈ 0.1 (ver apendice). Assim, temos priori Normal-Gama para

o vetor (φ, βt, V−1) de modo a obter conjugacao a posteriori, conforme mencionado na

secao 2.2.

Primeiramente, consideramos a variancia dos erros de evolucao W conhecida no pro-

cesso de estimacao. A figura 4.1 supoe W = 0.1 (valor verdadeiro usado na simulacao),

enquanto que as figuras 4.2 e 4.3 supoem W fixo igual a 0.1, 0.2 e 0.4 durante o processo

de estimacao.

A figura 4.1 mostra resultados da aplicacao da metodologia sequencial proposta a

3 diferentes series simuladas a partir do modelo MLD1, φ, V,W, cada uma supondo

51

um valor diferente para φ no conjunto 0.5, 0.7, 0.95. As estimativas de φ se situam

proximas aos respectivos valores verdadeiros utilizados na simulacao. Note-se ainda que

as estimativas para a serie simulada com φ = 0.95 sao mais acuradas, o que e esperado

pois estas series apresentam memoria mais longa em comparacao com as series geradas

com valores de φ mais proximos de zero. As previsoes um passo a frente acompanham

bem as respectivas series simuladas, porem a verdadeira variancia observacional, em geral,

nao esta contida nos intervalos de credibilidade a posteriori.

Analisando a figura 4.2 com as estimativas do parametro autorregressivo sob a es-

pecificacao de diferentes valores de W , percebe-se que os valores de φ sao subestimados

quando se especifica W > 0.1. O vieis das estimativas, porem, e muito menor quando φ

e proximo de 1, indicando que φ e mais facil de estimar quando esta no limite da regiao

de estacionaridade, mesmo quando especificamos W > 0.1.

A variancia de observacao, por sua vez, e muito mais sensıvel a especificacao da

variancia de evolucao, como ilustra a figura 4.3. Conforme especifica-se valores maiores

para W , resta ao procedimento inferencial diminuir o valor de V de modo a represen-

tar a mesma variabilidade total observada na serie. A figura 4.3 tambem mostra que

temos valores de V sendo estimados entre 0.01 e 0.04 quando se dispoe de todas os 1000

observacoes das series fixando W=0.1.

52

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )

(a) φ = 0.5

−2

−1

01

2

t901 925 950 975 1000

E( yt | Dt−1 )E( yt | Dt−1 ) ± 2 × Var( yt | Dt−1 )

(b) Previsoes

0 200 400 600 800 1000

0.00

0.01

0.02

0.03

0.04

0.05

t

E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )

(c) V | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )

(d) φ = 0.7

−2

−1

01

2

t901 925 950 975 1000


(e) Previsoes

0 200 400 600 800 1000

0.00

0.01

0.02

0.03

0.04

0.05

t

E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )

(f) V | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )

(g) φ = 0.95

−3

−2

−1

01

23

4

t901 925 950 975 1000


(h) Previsoes

0 200 400 600 800 1000

0.00

0.01

0.02

0.03

0.04

0.05

t

E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )

(i) V | Dt

Figura 4.1: Resultados para uma replica simulada do modelo normal AR(1) com φ =

0.5, 0.7, 0.95 (1a, 2a e 3a linhas, respectivamente) considerando a variancia de evolucao

fixa em seu valor real no processo de estimacao.

53

0.0 0.2 0.4 0.6 0.8 1.00

24

68

φ = 0.5W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

φ = 0.5W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

φ = 0.5W = 0.4

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

Den

sida

de

φ = 0.7W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

04

812

Den

sida

de

φ = 0.7W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

Den

sida

de

φ = 0.7W = 0.4

0.0 0.2 0.4 0.6 0.8 1.0

010

2030

Den

sida

de

φ = 0.95W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

05

1525

Den

sida

de

φ = 0.95W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

Den

sida

de

φ = 0.95W = 0.4

N=1000 N=250 N=50

Figura 4.2: Histogramas suavizados para a distribuicao das estimativas de φ condicionais

a W no tempo N com base nas 100 series simuladas do modelo normal AR(1). Os

pontos representam a media amostral do respectivo conjunto de estimativas pontuais

E(φ | W,DN). A linha tracejada representa o valor verdadeiro de φ.

0.00 0.02 0.04 0.06 0.08 0.10

020

4060

φ = 0.5W = 0.1

0.00 0.02 0.04 0.06 0.08 0.10

010

025

0

φ = 0.5W = 0.2

0.00 0.02 0.04 0.06 0.08 0.10

010

0020

00

φ = 0.5W = 0.4

0.00 0.02 0.04 0.06 0.08 0.10

020

4060

80

Den

sida

de

φ = 0.7W = 0.1

0.00 0.02 0.04 0.06 0.08 0.10

010

025

0

Den

sida

de

φ = 0.7W = 0.2

0.00 0.02 0.04 0.06 0.08 0.10

050

015

00

Den

sida

de

φ = 0.7W = 0.4

0.00 0.02 0.04 0.06 0.08 0.10

040

80

Den

sida

de

φ = 0.95W = 0.1

0.00 0.02 0.04 0.06 0.08 0.10

010

025

0

Den

sida

de

φ = 0.95W = 0.2

0.00 0.02 0.04 0.06 0.08 0.10

050

015

00

Den

sida

de

φ = 0.95W = 0.4

N=1000 N=250 N=50

Figura 4.3: Histogramas suavizados para a distribuicao das estimativas de V condicionais

a W no tempo N com base nas 100 series simuladas para o modelo normal AR(1). Os


E(V | W,DN). A linha tracejada representa o valor verdadeiro de V .

54

Resultados obtidos estimando a variancia de evolucao

Considera-se agora a variancia dos erros de evolucao desconhecida. O processo de

estimacao e feito via quadratura de Gauss-Hermite com uma grade de 15 pontos. A

distribuicao marginal a priori adotada para logW e normal com media -0.5 e variancia

1, o que equivale a uma distribuicao Log Normal para W com media 1 e variancia 1.718.

A figura 4.4 mostra que os resultados para estimacao de φ e as previsoes um passo

a frente se mantem boas, com pouco acrescimo de incerteza devido ao fato de estarmos

estimando W . Conforme antecipado durante a analise com W conhecido sob as diferentes

series simuladas, a variancia de observacao V nao e bem captada ainda que a variancia

de evolucao seja.

A figura 4.5 detalha o procedimento de estimacao de W para a primeira replica

simulada, onde e possıvel verificar a evolucao dos pontos da grade a posteriori de Gauss

Hermite, que se estabilizam em torno da regiao de maior massa de probabilidade para

W a posteriori. O metodo permite tambem tracar a densidade a posteriori de W, obtida

via interpolacao por splines cubicos na escala logarıtmica da densidade de W.

A figura 4.6 mostra que as estimativas para V sao viesadas e nao se distribuem em

torno do verdadeiro valor 0.02, situando-se no intervalo (0.02, 0.06). As estimativas de

W e de φ nao apresentam vies quando φ = 0.95, diferentemente do que ocorre no caso

em que φ ∈ 0.5, 0.7, onde as estimativas apresentam um pequeno vies.

55

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(a) Grade a posteriori

de W

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(b) Grade a posteriori

de W

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(c) Grade a posteriori

de W

0.05 0.10 0.15 0.20 0.25

010

2030

40

(d) p(W | D1000)

0.05 0.10 0.15 0.20 0.25

010

2030

4050

(e) p(W | D1000)

0.05 0.10 0.15 0.20 0.25

010

2030

4050

(f) p(W | D1000)

Figura 4.5: Estimacao da variancia de evolucao W para a primeira replica simulada do

modelo normal AR(1) com φ ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a coluna, respectivamente).

57

0.0 0.2 0.4 0.6 0.8 1.00

24

68

φ = 0.5

0.00 0.05 0.10 0.15 0.20

010

2030

40

W=0.1

0.00 0.02 0.04 0.06 0.08 0.10

040

80

V=0.02

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

φ = 0.7

0.00 0.05 0.10 0.15 0.20

010

2030

40

W=0.1

0.00 0.02 0.04 0.06 0.08 0.10

040

80

V=0.02

0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2

010

2030

φ = 0.95

0.00 0.05 0.10 0.15 0.20

010

2030

40

W=0.1

0.00 0.02 0.04 0.06 0.08 0.10

040

80

V=0.02

N=1000 N=250 N=50 Valor verdadeiro

Figura 4.6: Histogramas suavizados para a distribuicao das estimativas de φ, W e V (1a,

2a e 3a linhas, respectivamente) no tempo N , incondicionalente a W, com base nas 100

series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pontos representam a media amostral do

respectivo conjunto de estimativas pontuais E(φ | DN). A linha tracejada representa o

valor verdadeiro de φ.


Todas as series de dados que constam nessa secao foram simuladas a partir do modelo

Normal AR(2)

yt ∼ N(βt, V )

βt = φ1βt−1 + φ2βt−2 + ωt, ωt ∼ N(0,W ),

com V = 0.02 e W = 0.1. Para simulacao das series, considerou-se (φ1, φ2) = (0.1, 0.8),

que correspondem a raızes reais para o polinomio caracterıstico do processo AR(2) de

modulo 0.95 e 0.85, respectivamente. As distribuicoes a priori marginais para (V, φ1, β1)

sao as mesmas exibidas para o modelo com estrutura AR(1). Para φ2 especificou-se

φ2 | D0 ∼ T2.01(0, 0.5).

Primeiramente, consideramos a variancia dos erros de evolucao W conhecida no pro-

cesso de estimacao. Os resultados obtidos estao ilustrados nas figuras 4.7 e 4.8.

58

A figura 4.7 mostra resultados da estimacao da primeira replica do modelo normal com

estrutura AR(2), onde pode-se perceber que as estimativas acompanham os respectivos

parametros autorregressivos. As previsoes um passo a frente tambem acompanham a

serie real. Novamente, a variancia de observacao V nao esta sendo bem estimada mesmo

quando se usa todas as observacoes que compoem a serie simulada.

Ao analisar a figura 4.8 contendo as estimativas pontuais para os para os parametros

autorregressivos obtidas para cada uma das 100 series simuladas, percebe-se que, para

esta configuracao de (φ1, φ2), as estimativas de φ1 e φ2 apresentam pequeno vies mesmo

quando se especifica W = 0.1 (valor verdadeiro da variancia de evolucao).

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ1 | Dt )ICφ1 | Dt

(0.95)

(a) φ1 = 0.1

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t


(0.95)

(b) φ2 = 0.8

−4

−2

02

46

t901 925 950 975 1000

E( yt | Dt−1 )ICyt | Dt−1

(0.95)

(c) Previsoes yt | Dt−1

0 200 400 600 800 1000

0.00

0.02

0.04

0.06

0.08

0.10

t

E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )

(d) V | Dt

Figura 4.7: Resultados para a 1a replica simulada do modelo normal AR(2) com

φ = (φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor real

no processo de estimacao.

59

−0.4 −0.2 0.0 0.2 0.4

05

1015

20

φ1 = 0.1W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

φ2 = 0.8W = 0.1

−0.4 −0.2 0.0 0.2 0.4

05

1015

φ1 = 0.1W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

φ2 = 0.8W = 0.2

−0.4 −0.2 0.0 0.2 0.4

02

46

810

12

φ1 = 0.1W = 0.4

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

12

φ2 = 0.8W = 0.4

N=1000 N=250 N=50

Figura 4.8: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 con-

dicionais a W no tempo N com base nas 100 series simuladas do modelo normal AR(2).

Os pontos representam a media amostral do respectivo conjunto de estimativas pontuais

E(φ1 | W,DN) (1a linha) e E(φ1 | W,DN) (2a linha). A linha tracejada representa o

valor verdadeiro de φ1 ou φ2.

60


Considera-se agora a variancia dos erros de evolucao desconhecida. A priori marginal

para W (LogNormal com media 1 e variancia 1.718) e a mesma especificada para o

modelo normal AR(1), com uma grade de 15 pontos usada no processo de estimacao por


Para a primeira serie simulada, mantem-se basicamente as mesmas caracterısticas

exibidas na figura 4.7 para a evolucao sequencial das estimativas para os parametros au-

torregressivos agora que se esta estimando W, como podemos ver na figura 4.9. O mesmo

vale para as previsoes. A variancia observacional, por sua vez, e bastante superestimada.

A variancia de evolucao W se encontra bastante proxima do limite inferior do intervalo

de credibilidade a posteriori, portanto temos estimativas razoaveis para W.

A curva de densidade a posteriori aproximada para W na primeira replica do modelo

normal AR(2) e apresentada na figura 4.10, juntamente com os pontos da grade dinamica

para W.

A figura 4.11 mostra as estimativas a posteriori para os parametros estaticos com base

nas 100 series simuladas. A distribuicao das estimativas para a variancia observacional V

esta bastante deslocada com respeito ao verdadeiro valor V = 0.02 e que as estimativas

de φ1 apresentam um pequeno vieis.

61

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(a) φ1 = 0.1

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )

(b) φ2 = −0.8

−6

−4

−2

02

46

901 925 950 975 1000


(c) Previsoes

0 200 400 600 800 1000

0.00

0.05

0.10

0.15

0.20

E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )

(d) V | Dt

0 200 400 600 800 10000.

00.

20.

40.

60.

81.

0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(e) W | Dt

Figura 4.9: Resultados para a primeira replica simulada do modelo normal AR(2) com

φ1 = 0.1, φ2 = 0.8 estimando a variancia de evolucao via quadratura de Gauss-Hermite.

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(a) Grade a posteriori

de W

0.05 0.10 0.15 0.20 0.25

05

1015

2025

30

(b) p(W | D1000)

Figura 4.10: Estimacao da variancia de evolucao W para a primeira replica simulada do

modelo normal AR(2) com φ1 = 0.1 e φ2 = 0.8 .

62

0.0 0.1 0.2 0.3 0.4 0.5

05

1015

20

φ1 = 0.1

−0.5 0.0 0.5 1.0

05

1015

20

φ2 = 0.8

0.0 0.1 0.2 0.3 0.4 0.5

05

1015

20

W=0.1

0.00 0.05 0.10 0.15

010

2030

40

V=0.02


Figura 4.11: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2

no tempo N com base nas 100 series simuladas do modelos normal AR(2). Os pontos

representam a media amostral do respectivo conjunto de estimativas pontuais E(φ | DN).

A linha tracejada representa o valor verdadeiro de φ1, φ2,W e V .



yt ∼ N(βt, V )

βt = φ1βt−1 + φ2βt−2 + φ3βt−3 + ωt, ωt ∼ N(0,W ),

com V = 0, 02 e W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2, φ3) =

(0.81, 0.77,−0.86), que pertence a regiao de estacionaridade do processo AR(3). As

distribuicoes a priori marginais sao as mesmas especificadas para o caso AR(1) e AR(2)

conforme descrito anteriormente, com φ3 | D0 ∼ T4.02(0, 0.5).

Nessa subsecao, a ordem do processo autorregressivo latente foi suposta maior do que

a das series simuladas com o intuito de verificar se o procedimento inferencial e capaz

de recuperar tambem a ordem do processo real. No caso, escolheu-se definir βt ∼ AR(5)

para a estimacao dos parametros do modelo e tem-se o interesse, portanto, em verificar

se as estimativas de φ4 e φ5 sao proximas de zero.

A figura 4.12 mostra resultados da estimacao para a primeira replica simulada do

modelo normal AR(3) supondo W conhecido igual a 0.1 (valor verdadeiro utilizado na

simulacao). As previsoes acompanham bem os valores da serie que parece apresentar

63

memoria longa, ou seja, valores relativamente distantes no passado da serie exercem in-

fluencia nao desprezıvel sobre o valor da serie no presente. As estimativas para φ1, φ2, φ3

nao estao muito distantes dos respectivos valores verdadeiros (os intervalos de credibi-

lidade se situam bem proximos aos verdadeiros valores). Para esta serie, identificou-se

ordem 4 para o processo autorregressivo, porem com estimativas para φ4 tendo magnitude

proxima de zero.

Na figura 4.13, podemos ver que as estimativas para os parametros autorregressivos se

distribuem ao redor dos valores corretos quando W=0.1, o que mostra que conseguimos,

em media, recuperar a ordem dos processos autorregressivos latentes quando conside-

ramos W=0.1 durante o processo de estimacao. Especificacoes de W maiores que 0.1

acarretam vies nas estimativas de φ1, φ2, φ3 e φ5. O mesmo pode ser observado para o

parametro V, conforme mostra a figura 4.14.

64

−4

−2

02

4

t901 925 950 975 1000


(a) Preditiva yt | Dt−1

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t


(0.95)

(b) φ1 = 0.81

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0


(0.95)

(c) φ2 = 0.77

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0


(0.95)

(d) φ3 = −0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0


(0.95)

(e) φ4 = 0

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0


(0.95)

(f) φ5 = 0

Figura 4.12: Resultados para a primeira replica simulada do modelo normal AR(3) com

φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao fixa em seu

valor real no processo de estimacao.

65

−1.0 −0.5 0.0 0.5 1.00

24

68

φ1 = 0.81W = 0.1

−1.0 −0.5 0.0 0.5 1.0

02

4

φ2 = 0.77W = 0.1

−1.0 −0.5 0.0 0.5 1.0

02

4

φ3 = − 0.86W = 0.1

−1.0 −0.5 0.0 0.5 1.0

02

4

φ4 = 0W = 0.1

−1.0 −0.5 0.0 0.5 1.0

02

46

φ5 = 0W = 0.1

−1.0 −0.5 0.0 0.5 1.0

04

8

φ1 = 0.81W = 0.2

−1.0 −0.5 0.0 0.5 1.0

02

46

φ2 = 0.77W = 0.2

−1.0 −0.5 0.0 0.5 1.0

02

46

φ3 = − 0.86W = 0.2

−1.0 −0.5 0.0 0.5 1.0

04

8

φ4 = 0W = 0.2

−1.0 −0.5 0.0 0.5 1.0

04

8

φ5 = 0W = 0.2

−1.0 −0.5 0.0 0.5 1.0

04

8

φ1 = 0.81W = 0.4

−1.0 −0.5 0.0 0.5 1.0

02

46

φ2 = 0.77W = 0.4

−1.0 −0.5 0.0 0.5 1.0

02

46

φ3 = − 0.86W = 0.4

−1.0 −0.5 0.0 0.5 1.0

02

46

8

φ4 = 0W = 0.4

−1.0 −0.5 0.0 0.5 1.0

04

8

φ5 = 0W = 0.4


Figura 4.13: Histogramas suavizados para a distribuicao das estimativas de φ condicio-

nalmente a W no tempo N com base nas 100 series simuladas do modelo normal AR(3).


E(φ | W,DN), i ∈ 1, . . . , 5. A linha tracejada representa o valor verdadeiro de φi.

0.00 0.02 0.04 0.06 0.08 0.10

040

80

V = 0.02W = 0.1

0.00 0.02 0.04 0.06 0.08 0.10

050

150

V = 0.02W = 0.2

0.00 0.02 0.04 0.06 0.08 0.10

040

080

0

V = 0.02W = 0.4


Figura 4.14: Histogramas suavizados para a distribuicao das estimativas de V no tempo

N com base nas 100 series simuladas do modelo normal AR(3) condicionalmente a W.


E(V | W,DN). A linha tracejada representa o valor verdadeiro de V .

66



para W (LogNormal com media 1 e variancia 1.718) e a mesma especificada para o

modelo normal AR(1), com uma grade de 15 pontos utilizada no processo de estimacao

via quadratura de Gauss-Hermite.

As previsoes e estimativas para os parametros estaticos com base na primeira replica

simulada, conforme ilustra a figura 4.15, nao apresentam grandes mudancas em com-

paracao aquelas obtidas supondo W conhecido durante o processo de estimacao (vide

figura 4.12). As estimativas para a variancia de observacao e de evolucao sao razoaveis,

porem no caso da variancia de observacao V, o valor real esta proximo mas nao contido

nos intervalos de credibilidade a posteriori, conforme ilustra a figura 4.16.

Analisando as estimativas de φ, V W para as 100 series simuladas (figura 4.17), veri-

ficamos que elas se concentram ao redor dos respectivos valores utilizados na simulacao,

exceto para a variancia observacional, porem as estimativas pontuais sao proximas do

valor real 0.02 nesse caso. Em media, consegue-se recuperar a ordem dos processos au-

torregressivos latentes.

67

−4

−2

02

4

901 925 950 975 1000


(a) Preditiva yt | Dt−1

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(b) φ1 = 0.81

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )

(c) φ2 = 0.77

0 200 400 600 800 1000

−1.

5−

1.0

−0.

50.

00.

5

E( φ3 | Dt )E( φ3 | Dt ) ± 2 × Var( φ3 | Dt )

(d) φ3 = −0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ4 | Dt )E( φ4 | Dt ) ± 2 × Var( φ4 | Dt )

(e) φ4 = 0

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ5 | Dt )E( φ5 | Dt ) ± 2 × Var( φ5 | Dt )

(f) φ5 = 0

Figura 4.15: Resultados para a 1a replica simulada do modelo normal AR(3) com φ =

(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao W via quadratura de

Gauss-Hermite.

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(a) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo


0.00 0.05 0.10 0.15 0.20

010

2030

40

(c) p(W | D1000)

0 200 400 600 800 1000

0.00

0.05

0.10

0.15

0.20

E( V | Dt )E( V | Dt ) ± 2 × Var( V | Dt )

(d) V | Dt

Figura 4.16: Resultados referentes a estimacao da variancia de evolucao W e de ob-

servacao V para uma replica simulada do modelo normal AR(3) com φ = (φ1, φ2, φ3) =

(0.81, 0.77,−0.86).

68

−0.5 0.0 0.5 1.00

24

6

φ1 = 0.81

−0.5 0.0 0.5 1.0

01

23

4

φ2 = 0.77

−1.0 −0.5 0.0 0.5

02

46

φ3 = − 0.86

−0.5 0.0 0.5 1.0

01

23

4

φ4 = 0

−0.5 0.0 0.5 1.0

02

46

φ5 = 0

0.0 0.1 0.2 0.3 0.4 0.5

010

2030

40

W=0.1

0.00 0.02 0.04 0.06 0.08 0.10

040

8012

0

V=0.02


Figura 4.17: Histogramas suavizados para a distribuicao das estimativas de φi, i ∈

1, . . . , 5, W e V no tempo N com base nas 100 series simuladas do modelo normal

AR(3). Os pontos representam a media amostral do respectivo conjunto de estimativas

pontuais E(φi | DN), E(W | DN) e E(V | DN). A linha tracejada representa o valor

verdadeiro de φi, W e V .

4.3 Modelo Poisson

Descreve-se nesta secao alguns resultados da aplicacao da metolodogia sequencial pro-

posta a modelos dinamicos com resposta poisson. As series foram simuladas com variancia

de evolucao W = 0.1. Diferentemente do caso normal tratado na secao anterior, para os

modelos poisson descritos nesta secao, considerou-se tambem uma componente estatica

compondo o vetor de estados, alem da componente autorregressiva, representando o nıvel

base do preditor. Isso foi feito com o intuito de permitir que as series simuladas nao as-

sumissem apenas valores pequenos.

4.3.1 Modelo poisson com estrutura latente AR(1)

Todas as series de dados que constam nessa subsecao foram simuladas a partir do

modelo

69

yt ∼ Poisson(λt)

log λt = βt + µ

βt = φ1βt−1 + ωt, ωt ∼ N(0,W ),

com W = 0.1. Para simulacao das series, considerou-se φ1 ∈ 0.5, 0.7, 0.95 e µ = 1.

As prioris marginais especificadas foram φ1 | D0 ∼ [0, 0.5] e µ | D0 ∼ [0, 10], β1 | D0 ∼

[0, 10] independentes, lembrando que para os casos de nao-normalidade para a variavel

resposta a inferencia e feita em termos de media e variancia para os estados. O vetores de

medias e as matrizes de covariancias a priori descritos acima coincidem com o parametro

de locacao e escala da T-student multivariada utilizada como priori no instante inicial

para o vetor de estados estendido no caso normal. A mesma observacao sera valida para

os modelos Poisson AR(2) e AR(3) que serao descritos nas duas secoes a seguir.

Primeramente descreve-se os resultados obtidos considerando W conhecido (figuras

4.18, 4.19 e 4.20).

Na figura 4.18, percebe-se que a incerteza associada a estimacao de φ1 e muito menor

para o caso φ1 = 0.95 em comparacao aos demais, novamente devido ao fato de que o

processo autorregressivo associado (e por consequencia a serie de dados observada) possui

memoria mais longa. Por isso as previsoes tambem acompanham melhor a serie quando

se tem φ1 = 0.95. Ainda no caso φ1 = 0.95, observa-se um problema de identificacao

entre o nıvel µ e o processo autorregressivo βt. A soma de ambos, porem, e identificada

pelo modelo, como mostra a figura 4.19.

Em geral, considerando-se as 100 series simuladas, podemos verificar pela figura 4.20

que o parametro autorregressivo e mais facil de estimar para o valor 0.95 em comparacao

com os demais valores fixados. Especificacoes de W > 0.1 geram vies nas estimativas de

φ1, tal como observado no caso normal.

70

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(a) φ1 = 0.5

0 200 400 600 800 1000

0.6

0.7

0.8

0.9

1.0

1.1

1.2

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(b) µ = 1

−2

−1

01

2

t

901 925 950 975 1000

E( βt | Dt−1 )E( βt | Dt−1 ) + 2 Var( βt | Dt−1 )

(c) βt ∼ AR(1)

05

1015

t901 925 950 975 1000


(0.95)

(d) Previsoes yt | Dt−1

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(e) φ1 = 0.7

0 200 400 600 800 1000

0.6

0.7

0.8

0.9

1.0

1.1

1.2

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(f) µ = 1

−2

−1

01

23

t901 925 950 975 1000


(g) βt ∼ AR(1)

05

1015

t901 925 950 975 1000


(0.95)

(h) Previsoes yt | Dt−1

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(i) φ1 = 0.95

0 200 400 600 800 1000

0.5

1.0

1.5

2.0

2.5

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(j) µ = 1

−6

−4

−2

02

t901 925 950 975 1000


(k) βt ∼ AR(1)

05

1015

20

t901 925 950 975 1000


(0.95)

(l) Previsoes yt | Dt−1

Figura 4.18: Resultados para a 1a replica simulada do modelo Poisson AR(1) com φ1 ∈

0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a variancia de evolucao

fixa em seu valor real no processo de estimacao.

71

0 50 100 150 200−

4−

20

24

t

E( βt + µ | Dt )E( βt + µ | Dt ) + 2 Var( βt + µ | Dt )

Figura 4.19: Estimativas a posteriori para a soma do nıvel do preditor com o processo

AR(1): βt + µ para a primeira replica simulada do modelo Poisson AR(1).

−0.5 0.0 0.5 1.0

01

23

45

φ = 0.5W = 0.4

−0.5 0.0 0.5 1.0

01

23

45

Den

sida

de

φ = 0.5W = 0.2

−0.5 0.0 0.5 1.0

01

23

45

Den

sida

de

φ = 0.5W = 0.4

−0.5 0.0 0.5 1.0

02

46

8

φ = 0.7W = 0.1

−0.5 0.0 0.5 1.0

02

46

8

Den

sida

de

φ = 0.7W = 0.2

−0.5 0.0 0.5 1.0

02

46

8

Den

sida

de

φ = 0.7W = 0.4

0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2

05

1015

φ = 0.95W = 0.1

0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2

05

1015

Den

sida

de

φ = 0.95W = 0.2

0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2

05

1015

Den

sida

de

φ = 0.95W = 0.4


Figura 4.20: Histogramas suavizados para a distribuicao das estimativas de φ condi-

cionalmente a W, no tempo N com base nas 100 series simuladas do modelo Poisson


E(φ | W,DN). A linha tracejada representa o valor verdadeiro de φ.



para W (LogNormal com media 1 e variancia 1.718) e a mesma especificada para os

modelos normais, com uma grade de 15 pontos no processo de estimacao via quadratura

de Gauss-Hermite.

72

A figura 4.21 mostra que o fato de estarmos estimando W gera um aumento consi-

deravel na incerteza sobre a estimacao dos parametros autorregressivos, o que nao se ob-

servou com tanta intensidade no caso normal. Ainda assim, as estimativas acompanham

bem os valores simulados para os processos autorregressivos e as previsoes acompanham

bem as series de dados simuladas (pelo menos para o caso em que φ = 0.95 e φ = 0.7 no

que se refere a previsao).

Analisando as estimativas para W na figura 4.22, vemos que se situam proximas do

verdadeiro valor 0.1 apesar de os intervalos de credibilidade a posteriori nao incluırem o

valor 0.1.

As estimativas pontuais de φ estao razoavelmente concentradas em torno dos respec-

tivos valores verdadeiros utilizados na simulacao, conforme mostra a figura 4.23.

73

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(a) φ1 = 0.5

0 200 400 600 800 1000

−0.

20.

20.

40.

60.

81.

0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(b) φ1 = 0.7

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(c) φ1 = 0.95

0 200 400 600 800 1000−0.

50.

00.

51.

0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(d) µ = 1

0 200 400 600 800 1000

0.4

0.6

0.8

1.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(e) µ = 1

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

2.5

3.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(f) µ = 1

−1.

00.

00.

51.

01.

52.

0

t901 925 950 975 1000

E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt )

(g) βt ∼ Ar(1)

−2

−1

01

23

t901 925 950 975 1000


(h) βt ∼ Ar(1)

−4

−2

02

4

t901 925 950 975 1000


(i) βt ∼ Ar(1)

05

1015

901 925 950 975 1000


(j) Previsoes yt | Dt−1

05

1015

20

901 925 950 975 1000


(k) Previsoes yt | Dt−1

05

1015

20

901 925 950 975 1000



Figura 4.21: Resultados para a 1a replica simulada do modelo Poisson AR(1) com φ1 ∈

0.5, 0.7, 0.95 (1a, 2a e 3a colunas respectivamente) estimando a variancia de evolucao.

74

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(a) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo


de W

0.05 0.10 0.15 0.20 0.25

05

1015

20

(c) p(W | D1000)

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(d) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(e) Grade a posteriori

de W

0.05 0.10 0.15 0.20 0.25

05

1015

(f) p(W | D1000)

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(g) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(h) Grade a posteriori

de W

0.05 0.10 0.15 0.20 0.25

010

2030

40

(i) p(W | D1000)

Figura 4.22: Resultados referentes a estimacao da variancia de evolucao W para uma

replica simulada do modelo Poisson AR(1) com φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas

respectivamente).

75

−0.5 0.0 0.5 1.0

01

23

φ = 0.5

−0.5 0.0 0.5 1.0

01

23

45

67

φ = 0.7

0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2

05

1015

φ = 0.95

N=1000 N=250 N=50 φ

Figura 4.23: Histogramas suavizados para a distribuicao das estimativas de φ no tempo

N com base nas 100 series simuladas com φ ∈ 0.5, 0.7, 0.95. Os pontos representam

a media amostral do respectivo conjunto de estimativas pontuais E(φ | DN). A linha

tracejada representa o valor verdadeiro de φ.

4.3.2 modelo Poisson com estrutura latente AR(2)


modelo Poisson AR(2)

yt ∼ Poisson(λt)

log λt = βt + µ

βt = φ1βt−1 + φ2βt−2 + ωt, ωt ∼ [0,W ],

com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2) = (0.1, 0.8). As prioris

marginais especificadas sao as mesmas descritas no modelo Poisson AR(1), com φ2 | D0 ∼

[0, 0.5].

A figura 4.24 mostra resultados da estimacao de φ1 e φ2 para a 1a repllica simulada

do modelo Poisson AR(2), fixando-se a variancia de evolucao em seu valor real 0.1.

Percebe-se que as estimativas de φ1 e φ2 acompanham os respectivos parametros a partir

do instante de tempo 300, aproximadamente. Apesar disso, o processo autorregressivo

76

nao parece ter sido tao bem estimado quanto em outros casos descritos anteriormente.

O nıvel do preditor consegue ser bem estimado pelo procedimento sequencial proposto

mesmo quando se dispoe de poucas observacoes.

Em geral, para as 100 replicas do modelo Poisson AR(1), obteve-se estimativas bem

proximas aos valores reais dos parametros autorregressivos considerando-se W=0.1, con-

forme ilustra a figura 4.25. O vieis decorrente de especificacoes erroneas de W e maior

para o parametro φ2 nessa configuracao, tal como foi observado no modelo normal AR(2).

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(a) φ1 = 0.1

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )

(b) φ1 = 0.8−

2−

10

12

34

5

t901 925 950 975 1000

E( βt | Dt )E( βt | Dt ) + 2 Var( βt | Dt )

(c) βt ∼ AR(2)

05

1015

901 925 950 975 1000

E( yt | Dt−1 )E( yt | Dt−1 ) + 2 Var( yt | Dt−1 )


0 200 400 600 800 1000

0.5

1.0

1.5

2.0

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(e) µ = 1

Figura 4.24: Resultados para uma replica simulada do modelo Poisson AR(2) com

φ = (φ1, φ2) = (0.1, 0.8) considerando a variancia de evolucao fixa em seu valor real

no processo de estimacao.

77

−0.4 −0.2 0.0 0.2 0.4

02

46

810

φ1 = 0.1W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

φ2 = 0.8W = 0.1

−0.4 −0.2 0.0 0.2 0.4

02

46

810

Den

sida

de

φ1 = 0.1W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

Den

sida

de

φ2 = 0.8W = 0.2

−0.4 −0.2 0.0 0.2 0.4

02

46

8

Den

sida

de

φ1 = 0.1W = 0.4

0.0 0.2 0.4 0.6 0.8 1.0

01

23

45

6

Den

sida

de

φ2 = 0.8W = 0.4


Figura 4.25: Histogramas suavizados para a distribuicao das estimativas de φ condicionais

a W no tempo N com base nas 100 series simuladas com φ = (φ1, φ2) = (0.1, 0.8). Os


E(φ1 | W,DN) ou E(φ2 | W,DN). A linha tracejada representa o valor verdadeiro de φ1

e φ2.


Novamente, especificou-se priori Log Normal com media 1 e variancia 1.7182 para

W, que foi sequencialmente estimado atraves de quadratura de Gauss Hermite com 15

pontos.

Percebe-se na figura 4.26 um ligeiro aumento na incerteza a posteriori para os parametros

do modelo devido ao fato de estarmos considerando W desconhecido. As estimativas de

W estao bem proximas do valor verdadeiro 0.1, nao apenas na primeira replica simulada

do modelo como nas demais, conforme mostra a figura 4.27. Assim, as estimativas para

φ1 e φ2 sob as 100 replicas nao apresentaram vies e se mantiveram concentradas ao redor

dos valores corretos.

Cabe ressaltar que nao foram observados problemas de identificacao do processo au-

torregressivo com o nıvel da serie em nenhuma das replicas simuladas, ao contrario do

que aconteceu no modelo Poisson AR(1) com φ1 = 0.95.

78

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(a) φ1 = 0.1

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )

(b) φ1 = 0.8

−3

−2

−1

01

23

t901 925 950 975 1000

E( βt | Dt )E( βt | Dt ) ± 2 × Var( βt | Dt−1 )

(c) βt ∼ Ar(2)

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(d) µ = 1

05

1015

901 925 950 975 1000


(e) Previsoes yt | Dt−1

0 200 400 600 800 1000

0.0

0.1

0.2

0.3

0.4

0.5

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(f) W = 0.1

Figura 4.26: Resultados para uma replica simulada do modelo Poisson AR(2) com φ =

(φ1, φ2) = (0.1, 0.8) estimando a variancia de evolucao atraves de quadratura de Gauss

Hermite.

−0.5 0.0 0.5 1.0

02

46

810

φ1 = 0.1

−0.5 0.0 0.5 1.0

02

46

8

φ2 = 0.8

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

W = 0.1


Figura 4.27: Histogramas suavizados para a distribuicao das estimativas de φ no tempoN

com base nas 100 series simuladas do modelo Poisson AR(2) com φ = (φ1, φ2) = (0.1, 0.8).


E(φ1 | DN), E(φ2 | DN) e E(W | DN). A linha tracejada representa o valor verdadeiro

de φ1, φ2 e W.

79

4.3.3 modelo Poisson com estrutura latente AR(3)


Poisson AR(3)

yt ∼ Poisson(λt)

log λt = βt + µ

βt = φ1βt−1 + φ2βt−2 + φ3βt−3 + ωt, ωt ∼ [0,W ],

com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2, φ3) = (0.81, 0.77,−0.86).

Aqui, a ordem do processo autorregressivo latente foi suposta maior do que a das series

simuladas com o intuito de verificar se o procedimento inferencial e capaz de recuperar

tambem a ordem do processo. Definimos βt ∼ AR(5) para a estimacao dos parametros

do modelo com o interesse em verificar se as estimativas de φ4 e φ5 sao proximas de zero.

As prioris marginais especificadas sao as mesmas descritas no modelo Poisson AR(2) com

φi ∼ [0, 0.5], i = 1, ..., 5.

A figura 4.28 mostra os resultados obtidos para a primeira replica simulada do modelo

Poisson AR(3). Os parametros aotorregressivos sao pontualmente bem estimados quando

se considera W conhecido igual ao valor utilizado na simulacao, porem, a incerteza a

posteriori e bastante grande. A magnitude das estimativas de φ4 e φ5 e pequena, o que

faz sentido, uma vez que o processo simulado e de ordem 3. Estimativas para µ, bem

como para o processo autorregressivo βt sao bastante boas, bem como as previsoes um

passo a frente.

Analisando as estimativas pontuais para as 100 series simuladas com W fixo na es-

timacao (figura 4.29), percebe-se que as estimativas nao apresentam vies quando W=0.1,

porem sao consideravelmente dispersas ao redor dos verdadeiros valores dos parametros

autorregressivos. Ao considerarW > 0.1, obtem-se estimativas viesadas para os parametros.

80

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(a) φ1 = 0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )

(b) φ2 = 0.77

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ3 | Dt )E( φ3 | Dt ) + 2 Var( φ3 | Dt )

(c) φ3 = −0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ4 | Dt )E( φ4 | Dt ) + 2 Var( φ4 | Dt )

(d) φ4 = 0

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ5 | Dt )E( φ5 | Dt ) + 2 Var( φ5 | Dt )

(e) φ5 = 0

0 50 100 150 200

−3

−2

−1

01

23

t


(f) βt ∼ AR(3)

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(g) Nıvel: µ = 1

05

1015

2025

30

t901 925 950 975 1000


(0.95)

(h) Previsoes: yt | Dt−1


(φ1, φ2, φ3) = (0.81, 0.77,−0.86) considerando a variancia de evolucao fixa em seu valor

real no processo de estimacao.

81

−1.0 −0.5 0.0 0.5 1.0

0.0

2.5

φ1 = 0.81W = 0.1

−1.0 −0.5 0.0 0.5 1.0

0.0

1.5

φ2 = 0.77W = 0.1

−1.0 −0.5 0.0 0.5 1.0

0.0

2.0

φ3 = − 0.86W = 0.1

−1.0 −0.5 0.0 0.5 1.0

0.0

1.5

φ4 = 0W = 0.1

−1.0 −0.5 0.0 0.5 1.0

0.0

1.5

φ5 = 0W = 0.1

−1.0 −0.5 0.0 0.5 1.0

0.0

2.5

Den

sida

de

φ1 = 0.81W = 0.2

−1.0 −0.5 0.0 0.5 1.0

0.0

1.5

Den

sida

de

φ2 = 0.77W = 0.2

−1.0 −0.5 0.0 0.5 1.0

0.0

2.0

Den

sida

de

φ3 = − 0.86W = 0.2

−1.0 −0.5 0.0 0.5 1.00.

01.

5

Den

sida

de

φ4 = 0W = 0.2

−1.0 −0.5 0.0 0.5 1.0

0.0

2.0

Den

sida

de

φ5 = 0W = 0.2

−1.0 −0.5 0.0 0.5 1.0

02

4

Den

sida

de

φ1 = 0.81W = 0.4

−1.0 −0.5 0.0 0.5 1.0

0.0

2.0

Den

sida

de

φ2 = 0.77W = 0.4

−1.0 −0.5 0.0 0.5 1.0

0.0

2.5

Den

sida

de

φ3 = − 0.86W = 0.4

−1.0 −0.5 0.0 0.5 1.0

0.0

2.0

Den

sida

de

φ4 = 0W = 0.4

−1.0 −0.5 0.0 0.5 1.0

02

4

Den

sida

de

φ5 = 0W = 0.4


Figura 4.29: Histogramas suavizados para a distribuicao das estimativas de φi, i1, . . . , 5

condicionais a W no tempo N com base nas 100 series simuladas do modelo Poisson


pontuais E(φi | W,DN). A linha tracejada representa o valor verdadeiro de φi.

Estimando variancia de evolucao via quadratura de Gauss-Hermite

Apresenta-se agora os resultados considerando a variancia evolucional W desconhe-

cida. O procedimento de estimacao de W e feito via quadratura de Gauss-Hermite. A

priori para W, tal como nos outros casos, e Log Normal com media 1 e variancia 1.718.

Analisando a figura 4.30, nao se nota muita diferenca na estimacao dos demais

parametros ao considerar W conhecido e ao estima-lo via quadratura de Gauss Her-

mite, exceto por um pequeno aumento na incerteza a posteriori em comparacao com o

caso W fixo.

Vemos que W esta sendo, em media, superestimado ao considerarmos as 100 replicas

simuladas (figuras 4.31 e 4.32), embora as estimativas em media estejam proximas de 0.1

(0.2 para N=1000, aproximadamente). Este pequeno vies na estimacao de W pode ser

uma explicacao para as estimativas viesadas tambem para os parametros autorregressivos,

tomando como base o que foi discutido sobre os resultados da figura 4.29.

82

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(a) φ1 = 0.81

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )

(b) φ2 = 0.77

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ3 | Dt )E( φ3 | Dt ) ± 2 × Var( φ3 | Dt )

(c) φ3 = −0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ4 | Dt )E( φ4 | Dt ) ± 2 × Var( φ4 | Dt )

(d) φ4 = 0

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ5 | Dt )E( φ5 | Dt ) ± 2 × Var( φ5 | Dt )

(e) φ5 = 0−

4−

3−

2−

10

12

3

t901 925 950 975 1000


(f) βt ∼ AR(3)

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(g) Nıvel: µ = 1

05

1015

2025

30

901 925 950 975 1000


(h) Previsoes: yt | Dt−1


(φ1, φ2, φ3) = (0.81, 0.77,−0.86) estimando a variancia de evolucao.

83

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(a) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo


de W

0.1 0.2 0.3 0.4 0.5 0.6

05

1015

(c) p(W | D1000)

Figura 4.31: Resultados referentes a estimacao da variancia de evolucao W para

a primeira replica simulada do modelo Poisson AR(3) com φ = (φ1, φ2, φ3) =

(0.81, 0.77,−0.86).

−0.5 0.0 0.5 1.0

01

23

45

φ1 = 0.81

−0.5 0.0 0.5 1.0

01

23

45

φ = 0.77

−1.0 −0.5 0.0 0.5

01

23

45

φ = − 0.86

−0.4 −0.2 0.0 0.2 0.4

01

23

45

φ4 = 0

−0.4 −0.2 0.0 0.2 0.4

01

23

45

φ5 = 0

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

W = 0.1


Figura 4.32: Histogramas suavizados para a distribuicao das estimativas de φi, i ∈

1, . . . , 5 e W no tempo N com base nas 100 series simuladas do modelo Poisson AR(3).


E(φi | DN) ou E(W | DN).

4.4 Modelo Binomial

Nesta secao, descreve-se os resultados do estudo de simulacao para os modelos dinamicos

com resposta Binomial(n, pt) onde n e considerado conhecido e igual a 10. Foi abordado

tambem o caso em que n = 1, porem, verificou-se que apenas com series de dados muito

84

longas (40000 observacoes ou mais), era possıvel recuperar os valores dos parametros

autorregressivos. Considerando esse fato como uma restricao indesejavel para a apli-

cabilidade a conjuntos de dados reais, optou-se por nao exibir resultados para o caso

n=1.

4.4.1 Modelo binomial com estrutura latente AR(1)


Binomial Ar(1)

yt ∼ Binomial(10, pt)

log

(pt

1− pt

)= βt + µ

βt = φ1βt−1 + ωt, ωt ∼ N(0,W ),

com W = 0, 1. Para simulacao das series, considerou-se φ1 ∈ 0.5, 0.7, 0.95. Note-se

que estamos simulando um modelo com nıvel fixo no preditor linear. Isso foi feito com o

intuito de obter series mais concentradas em valores entre 5 e 10.

As prioris especificadas foram φ1 | D0 ∼ [0, 0.5], e µ | D0 ∼ [0, 10], β1 | D0 ∼ [0, 10]

independentes tal como no modelo Poisson AR(1).

Analisando os resultados obtidos para a primeira replica simulada do modelo bino-

mial AR(1) ilustrados na figura 4.33 , vemos que o parametro autorregressivo, bem como

o processo autorregressivo, sao bem estimados. As previsoes acompanham bem as ob-

servacoes em especial no caso em que φ1 = 0.95. O nıvel do preditor, em contrapartida, e

estimado com variancia muito pequena e os intervalos de credibilidade parecem distantes

do real valor µ = 1 mesmo com as estimativas pontuais de 0,9 e 0,11 para este parametro.

A figura 4.34 mostra que as estimativas de φ1 estao centradas no verdadeiro valor do

parametro quando W=0,1. Para W > 0.1, as estimativas apresentam vies, subestimando

φ1. A razao para termos observado a media dos histogramas suavizados para as estima-

tivas de φ1 deslocada em temos da moda se deve ao fato de que para uma das replicas

estimou-se um valor negativo para φ1. Isso acontceu nos tres casos φ1 = 0.5, 0.7, 0.95.

85

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(a) φ1 = 0.5

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(b) φ1 = 0.7

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(c) φ1 = 0.95

0 200 400 600 800 1000

0.6

0.7

0.8

0.9

1.0

1.1

1.2

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(d) µ = 1

0 200 400 600 800 1000

0.6

0.7

0.8

0.9

1.0

1.1

1.2

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(e) µ = 1

0 200 400 600 800 1000

0.6

0.7

0.8

0.9

1.0

1.1

1.2

t

E( µ | Dt )E( µ | Dt ) + 2 Var( µ | Dt )

(f) µ = 1

−5

−4

−3

−2

−1

01

2

t901 925 950 975 1000


(g) βt ∼ AR(1)

−5

−4

−3

−2

−1

01

2

t901 925 950 975 1000


(h) βt ∼ AR(1)

−5

−4

−3

−2

−1

01

2

t901 925 950 975 1000


(i) βt ∼ AR(1)

02

46

810

12

t901 925 950 975 1000


(0.95)


02

46

810

12

t901 925 950 975 1000


(0.95)


05

1015

t901 925 950 975 1000


(0.95)


Figura 4.33: Resultados para uma replica simulada do modelo binomial AR(1) com

φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a linhas respectivamente) considerando a variancia de

evolucao fixa em seu valor real no processo de estimacao.

86

−0.5 0.0 0.5 1.0

02

46

φ = 0.5W = 0.1

−0.5 0.0 0.5 1.0

02

46

φ = 0.5W = 0.2

−0.5 0.0 0.5 1.0

02

46

φ = 0.5W = 0.4

−0.5 0.0 0.5 1.0

02

46

φ = 0.7W = 0.1

−0.5 0.0 0.5 1.0

02

46

φ = 0.7W = 0.2

−0.5 0.0 0.5 1.0

02

46

φ = 0.7W = 0.4

0.5 0.6 0.7 0.8 0.9 1.0

010

20

φ = 0.95W = 0.1

0.5 0.6 0.7 0.8 0.9 1.0

010

20

φ = 0.95W = 0.2

0.5 0.6 0.7 0.8 0.9 1.0

010

20

φ = 0.95W = 0.4



N condicionalmente a W com base nas 100 series simuladas do modelo binomial AR(1).


E(φ | W,DN).

Resultados obtidos estimando W

Aqui, considera-se priori Log Normal com media 1 e variancia 1.718 para W, que sera

estimado via quadratura de Gauss Hermite com uma grade de 9 pontos.

Analisando a figura 4.35, pode-se perceber um aumento na incerteza a posteriori asso-

ciada a estimacao dos parametros autorregressivos na rimeira replica simulada, sobretudo

para os primeiros instantes de tempo. Os processos autorregressivos latentes continuam

sendo bem estimados e as previsoes sao capazes de acompanhar mudancas na serie de

dados para o caso φ = 0.95. Vemos na figura 4.36 que tambem obteve-se boas estimativas

para a variancia de evolucao W nessas replicas.

A figura 4.37 mostra que as estimativas para φ se concentram em torno de seu ver-

dadeiro valor, com pouca dispersao para os casos φ = 0.7 e φ = 0.95. O mesmo pode ser

verificado com respeito as estimativas para as variancias de evolucao.

87

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ | Dt )E( φ | Dt ) ± 2 × Var( φ | Dt )

(a) φ1 = 0.5

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(b) φ1 = 0.7

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(c) φ1 = 0.95

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(d) µ = 1

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(e) µ = 1

0 200 400 600 800 1000

0.0

0.5

1.0

1.5

2.0

E( µ | Dt )E( µ | Dt ) ± 2 × Var( µ | Dt )

(f) µ = 1

−4

−2

02

4

t901 925 950 975 1000


(g) βt ∼ AR(1)

−4

−2

02

4

t901 925 950 975 1000


(h) βt ∼ AR(1)

−4

−2

02

4

t901 925 950 975 1000


(i) βt ∼ AR(1)

05

1015

901 925 950 975 1000



05

1015

901 925 950 975 1000



05

1015

901 925 950 975 1000



Figura 4.35: Resultados para a primeira replica simulada do modelo binomial AR(1)

com φ1 ∈ 0.5, 0.7, 0.95 (1a, 2a e 3a colunas, respectivamente) estimando a variancia de

evolucao.

88

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(a) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo


0.05 0.10 0.15 0.20 0.25

05

1015

(c) p(W | D1000)

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(d) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(e) Grade a posteriori

0.05 0.10 0.15 0.20 0.25

05

1015

(f) p(W | D1000)

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(g) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo

(h) Grade a posteriori

0.05 0.10 0.15 0.20 0.25

05

1015

20

(i) p(W | D1000)

Figura 4.36: Resultados referentes a estimacao da variancia de evolucao W para uma

replica simulada do modelo binomial AR(1) com φ1 ∈ 0.5, 0.7, 0.95.

89

−0.5 0.0 0.5 1.0

0.0

1.0

2.0

3.0

φ = 0.5

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

W=0.1(φ = 0.5)

−0.5 0.0 0.5 1.0

02

46

φ = 0.7

0.0 0.2 0.4 0.6 0.8 1.0

02

46

812

W=0.1(φ = 0.7)

0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2

05

1015

20

φ = 0.95

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

W=0.1(φ = 0.95)


Figura 4.37: Histogramas suavizados para a distribuicao das estimativas de φ e W no

tempo N com base nas 100 series simuladas com do modelo binomial AR(1). Os pontos

representam a media amostral do respectivo conjunto de estimativas pontuais E(φ | DN)

e E(W | DN).



Binomial AR(2)


log

(pt

1− pt

)= βt + µ

βt = φ1βt−1 + φ2βt− 2 + ωt, ωt ∼ [0,W ],

com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2) = (0.1, 0.8).

As prioris marginais especificadas foram φi | D0 ∼ [0, 0.5], i ∈ 1, 2, β1 | D0 ∼

[0, 10]e µ | D0 ∼ [0, 10] independentes de forma a representar pouca informacao subjetiva

a respeito dos parametros.

Analisando a figura 4.38, percebe-se que, fixado W em seu valor verdadeiro, as es-

timativas para os parametros autorregressivos na primeira replica simulada do modelo

binomial AR(2) estao bem proximas dos valores usados na simulacao a partir do instante

de tempo 400 (aproximadamente). Essa nao e uma caracterıstica somente desta serie

90

simulada, como pode-se perceber na figura 4.39. Note-se que, como no caso do modelo

normal e poisson, a superestimacao da variancia dos erros de evolucao acarreta em vies

nas estimativas do processo autorregressivo, que e mais acentuado para φ2 do que para

φ1 nesse caso.

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(a) φ1 = 0.1

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

t

E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )

(b) φ2 = 0.8

−5

−4

−3

−2

−1

01

2

t901 925 950 975 1000


(c) βt ∼ AR(2)

02

46

810

12

t901 925 950 975 1000


(0.95)



considerando a variancia de evolucao fixa em seu valor real no processo de estimacao.

−0.4 0.0 0.2 0.4

02

46

810

12

φ1 = 0.1W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

12

φ2 = 0.8W = 0.1

−0.4 0.0 0.2 0.4

02

46

810

12

φ1 = 0.1W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

12

φ2 = 0.8W = 0.2

−0.4 0.0 0.2 0.4

02

46

810

12

φ1 = 0.1W = 0.4

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

12

φ2 = 0.8W = 0.4


Figura 4.39: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 con-

dicionalmente a W no tempo N com base nas 100 series simuladas do modelo binomial


pontuais E(φi | W,DN), i ∈ 1, 2.

91




Em geral, as estimativas para os parametros autorregressivos para a primeira replica

simulada do modelo binomial AR(2), desta vez estimando W, nao mudam muito se

comparadas aquelas obtidas fixando-se W em seu verdadeiro valor (figuras 4.40 e 4.38).

Nota-se apenas um pequeno acrescimo nas incertezas a posteriori. O mesmo pode ser dito

a respeito das previsoes e do processo autorregressivo βt. As esimativas para a variancia

de evolucao W tambem estao bastante proximas do verdadeiro valor 0.1 (figura 4.41).

Analisando as estimativas pontuais para os parametros estaticos obtidas para as 100

replicas (figura 4.42), percebe-se que elas se concentram em torno dos valores verdadeiros

usados na simulacao para N=1000.

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(a) φ1 = 0.1

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )

(b) φ2 = 0.8

−4

−2

02

4

t901 925 950 975 1000


(c) βt ∼ AR(2)

05

1015

901 925 950 975 1000




estimando a variancia de evolucao.

92

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(a) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo


de W

0.05 0.10 0.15 0.20 0.25

05

1015

20

(c) p(W | D1000)

Figura 4.41: Resultados referentes a estimacao da variancia de evolucao W para a pri-

meira replica simulada do modelo binomial AR(2).

−0.5 0.0 0.5 1.0

02

46

810

φ1 = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

01

23

45

6

φ2 = 0.8

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

W=0.1


Figura 4.42: Histogramas suavizados para a distribuicao das estimativas de φ1 e φ2 no

tempo N com base nas 100 series simuladas com φ = (φ1, φ2) = (0.1, 0.8). Os pontos

representam a media amostral do respectivo conjunto de estimativas pontuais E(φi |

DN), i ∈ 1, 2 e E(W | DN).

93



Binomial AR(3)


log

(pt

1− pt

)= βt + µ

βt = φ1βt−1 + φ2βt−2 + φ3βt−3 + ωt, ωt ∼ [0,W ],

com W = 0, 1. Para simulacao das series, considerou-se (φ1, φ2, φ3) = (0.81, 0.77,−0.86).

As series serao estimadas supondo um processo latente AR(5) com o objetivo de verificar

se as estimativas de φ4 e φ5 se concentram em torno de 0, identificando assim a ordem

do processo.

As prioris especificadas foram φi | D0 ∼ [0, 0.5], i ∈ 1, . . . , 5, β1 | D0 ∼ [0, 10]e µ |

D0 ∼ [0, 10] independentes de forma a representar pouca informacao subjetiva a respeito

dos parametros.

Analisando a inferencia para a primeira serie simulada do modelo binomial AR(3)

considerando W fixo igual a 0.1, percebe-se quebras estruturais nas estimativas pontuais

dos parametros autorregressivos a medida que se dispoe de mais observacoes, mas a partir

do instante de tempo 500 as estimativas ja se concentram proximas aos valores utilizados

na simulacao (figura 4.43).

Para as demais series, as estimativas pontuais nao se concentram em torno dos valores

reais para N=250 e N=50, mesmo fixando W=0.1 exceto para φ5 (figura 4.44). O vies

decorrente do fato de se fixar W > 0.1 e bastante grande, mesmo fazendo W=0.2, o

que indica que a inferencia para os parametros do processo latente AR(5) e altamente

sensıvel ao valor da variancia de evolucao.

94

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

t

E( φ1 | Dt )E( φ1 | Dt ) + 2 Var( φ1 | Dt )

(a) φ1 = 0.81

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ2 | Dt )E( φ2 | Dt ) + 2 Var( φ2 | Dt )

(b) φ2 = 0.77

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ3 | Dt )E( φ3 | Dt ) + 2 Var( φ3 | Dt )

(c) φ3 = −0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ4 | Dt )E( φ4 | Dt ) + 2 Var( φ4 | Dt )

(d) φ4 = 0

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

t

E( φ5 | Dt )E( φ5 | Dt ) + 2 Var( φ5 | Dt )

(e) φ5 = 0

−5

−4

−3

−2

−1

01

2

t901 925 950 975 1000


(f) βt ∼ AR(3)

05

1015

t901 925 950 975 1000


(0.95)

(g) Previsoes yt | Dt−1


considerando a variancia de evolucao fixa em seu valor real no processo de estimacao.

95

0.0 0.2 0.4 0.6 0.8 1.00

24

6

φ1 = 0.81W = 0.1

0.0 0.2 0.4 0.6 0.8 1.0

02

46

φ2 = 0.77W = 0.1

−1.0 −0.8 −0.6 −0.4 −0.2 0.0

02

46

φ3 = − 0.86W = 0.1

−0.4 −0.2 0.0 0.2 0.4

02

46

φ4 = 0W = 0.1

−0.4 −0.2 0.0 0.2 0.4

02

46

0.0 0.2 0.4 0.6 0.8 1.0

02

46

φ1 = 0.81W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

02

46

φ2 = 0.77W = 0.2

−1.0 −0.8 −0.6 −0.4 −0.2 0.00

24

6

φ3 = − 0.86W = 0.2

−0.4 −0.2 0.0 0.2 0.4

02

46

φ4 = 0W = 0.2

−0.4 −0.2 0.0 0.2 0.4

02

46

φ5 = 0W = 0.2

0.0 0.2 0.4 0.6 0.8 1.0

02

46

φ1 = 0.81W = 0.4

0.0 0.2 0.4 0.6 0.8 1.0

02

46

φ2 = 0.77W = 0.4

−1.0 −0.8 −0.6 −0.4 −0.2 0.0

02

46

φ3 = − 0.86W = 0.4

−0.4 −0.2 0.0 0.2 0.4

02

46

φ4 = 0W = 0.4

−0.4 −0.2 0.0 0.2 0.4

02

46

φ5 = 0W = 0.4


Figura 4.44: Histogramas suavizados para a distribuicao das estimativas de φi condici-

onais a W no tempo N com base nas 100 series simuladas do modelo binomial AR(3)

com φ = (φ1, φ2, φ3) = (0.81, 0.77,−0.86). Os pontos representam a media amostral do

respectivo conjunto de estimativas pontuais E(φi | W,DN), i ∈ 1, . . . , 5.




Analisando a inferencia para a primeira serie simulada do modelo binomial AR(3),

vemos que a incerteza a posteriori para estimacao dos parametros autorregressivos e

bastante elevada, mas as estimativas pontuais estao proximas dos valores usados na si-

mulacao a partir do instante de tempo 500 (figura 4.45). Note-se que a evolucao temporal

das estimativas dos parametros autorregressivos se diferencia bastante do que foi obser-

vado considerando W fixo igual a 0.1. O valor 0.1 nao esta contido nos intervalos de

credibilidade a posteriori para W, que ao final esta sendo estimada pontualmente entre

96

0.15 e 0.2, conforme mostra a figura 4.46.

Analisando as estimativas pontuais para as 100 replicas simuladas (figura 4.47), vemos

que W esta sendo superestimado, o que explica o vies observado nas estimativas dos

parametros autorregressivos.

0 200 400 600 800 1000

−0.

50.

00.

51.

01.

5

E( φ1 | Dt )E( φ1 | Dt ) ± 2 × Var( φ1 | Dt )

(a) φ1 = 0.81

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ2 | Dt )E( φ2 | Dt ) ± 2 × Var( φ2 | Dt )

(b) φ2 = 0.77

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ3 | Dt )E( φ3 | Dt ) ± 2 × Var( φ3 | Dt )

(c) φ3 = −0.86

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ4 | Dt )E( φ4 | Dt ) ± 2 × Var( φ4 | Dt )

(d) φ4 = 0

0 200 400 600 800 1000

−1.

0−

0.5

0.0

0.5

1.0

E( φ5 | Dt )E( φ5 | Dt ) ± 2 × Var( φ5 | Dt )

(e) φ5 = 0

−4

−2

02

4

t901 925 950 975 1000


(f) βt ∼ AR(3)

05

1015

901 925 950 975 1000


(g) Previsoes yt | Dt−1


estimando a variancia de evolucao.

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

E( W | Dt )E( W | Dt ) ± 2 × Var( W | Dt )

(a) W | Dt

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

tempo


0.05 0.10 0.15 0.20 0.25

05

1015

(c) p(W | D1000)

Figura 4.46: Resultados referentes a estimacao da variancia de evolucao W para a prieira

replica simulada do modelo nbinomial AR(3).

97

−0.5 0.0 0.5 1.0

0.0

1.0

2.0

3.0

φ1 = 0.81

−0.5 0.0 0.5 1.0

0.0

1.0

2.0

φ2 = 0.77

−1.0 −0.5 0.0 0.5

0.0

1.0

2.0

φ3 = − 0.86

−0.5 0.0 0.5 1.0

0.0

1.0

2.0

φ4 = 0

−0.5 0.0 0.5 1.0

0.0

1.0

2.0

3.0

φ5 = 0

0.0 0.2 0.4 0.6 0.8 1.0

02

46

812

W=0.1



N com base nas 100 series simuladas do modelo binomial AR(3) com φ = (φ1, φ2, φ3) =

(0.81, 0.77,−0.86). Os pontos representam a media amostral do respectivo conjunto de

estimativas pontuais E(φi | DN), i ∈ 1, . . . , 5 e E(W | DN).

4.5 Conclusoes do estudo simulado

Apresentou-se neste capıtulo uma aplicacao da metodologia sequencial bayesiana des-

crita no capıtulo 3 para inferencia em modelos dinamicos nao-lineares com resposta

na famılia exponencial. Basicamente, estende-se o vetor de estados de modo a incluir

parametros que compoem a matriz de evolucao Gt enquanto a variancia de evolucao de

componentes dinamicas e estimada via quadratura de Gauss-Hermite. Para os parametros

pertencentes ao vetor de estados estendido, a inferencia em modelos nao-gaussianos e feita

em termos de media e variancia apenas, mas para a componente estimada via quadratura

de Gauss Hermite, e possıvel obter aproximacao para sua curva de densidade e, a partir

dela, estimar outras medidas referentes a posteriori, como quantis e moda, por exemplo,

apesar de nao o termos feito neste momento.

Estudou-se a aplicacao desta metodologia no contexto de modelos dinamicos gaussi-

anos e nao-gaussianos (poisson e binomial) com estrutura autorregressiva latente como

componente do vetor de estados. De modo geral, verificou-se bons resultados na es-

timacao dos parametros autorregressivos e da variancia de evolucao para series de ta-

manho 1000 e, em alguns casos, para series de tamanho 250. Para series curtas (50 ob-

98

servacoes) nao foram obtidos resultados razoaveis na grande maioria dos casos. Verificou-

se tambem que subestimacao e superestimacao da variancia de evolucao gera vies nas

estimativas dos parametros autorregressivos.

Nos modelos normais, obteve-se dificuldades em estimar a variancia observacional,

mesmo em alguns casos nos quais a inferencia foi feita fixando a variancia de evolucao.

No que diz respeito a verificacao da ordem do processo autorregressivo, propos-se

verificar se a magnitude das estimativas pontuais dos parametros autorregressivos de

ordem mais altas eram proximas de zero. No caso normal, esse procedimento simples

se mostrou razoavel, porem e preciso considerar o fato de que a variancia observacional

fixada na simulacao era bastante baixa e, portanto, a ”variabilidade adicional”ao processo

autorregressivo latente (representada pela distribuicao de probabilidades das observacoes)

era bastante baixa. Para valores mais elevados, espera-se que os resultados sejam mais

semelhantes aos obtidos com resposta Poisson e binomial. Nesses dois ultimos casos,

em media nao conseguimos recuperar a ordem dos processos autorregressivos. Nesse

sentido, talvez seja mais recomendavel aumentar progressivamente a ordem do processo

autorregressivo latente ate que se comece a observar estimativas proximas de zero e entao

inferir sobre a ordem do processo.

Sobre o numero de pontos na grade adaptativa de Gauss Hermite para a variancia

de observacao, tentou-se utilizar 9 pontos para as series com distribuicao normal e Pois-

son, tal como feito na binomial, porem obtivemos matrizes de covariancias nao-positivas

definidas para a posteriori dos estados em alguns instantes de tempo para algumas das

series simuladas, o que foi contornado ao aumentar o numero de pontos para 15. Realizar

as interpolacoes do metodo de Gauss-Hermite nas entradas da matriz de Choleskey dos

estados (ao inves de intorpolar diretamente as entradas da matriz de covariancias) devera

resolver o problema e tal alternativa sera implementada em trabalhos futuros.

Por fim, exibe-se na tabela 4.1 o tempo computacional medio para implementacao

da metodologia sequencial proposta aos modelos do estudo simulado. Verifica-se que

nao foram necessarios muito mais do que 30 segundos para realizar a inferencia para as

1000 observacoes que compoem cada uma das series simuladas. A diferenca em termos de

tempo computacional observada nos casos AR(3) em relacao aos demais e notavel, porem

99

e preciso ressaltar que estamos propondo um modelo AR(5) no processo de estimacao e

que portanto as matrizes de covariancia e vetores de media para os estados tem dimensao

10 ou 11 (dependendo da presenca ou nao do nıvel do preditor a ser estimado). Como

as interpolacoes dos vetores de medias e matrizes de covariancia a posteriori sao feitas

entrada por entrada, temos de 55 a 66 funcoes para serem interpoladas a cada instante

de tempo. Sendo assim, considera-se o tempo computacional para implementacao da

metodologia proposta bastante baixo, o que possibilita realizacao de inferencia para todos

os parametros desconhecidos sequencialmente e em tempo real.

Tabela 4.1: Tempo computacional medio em segundos para implementacao da metodo-

logia sequencial baseada na expansao do vetor de estados e uso da quadratura de Gauss-

Hermite aos modelos dinamicos normais, poisson e binomial com estrutura latente AR(1),

AR(2) e AR(3). Foram utilizados 15 pontos na quadratura de Gauss-Hermite.

AR(p) Normal Poisson Binomial

1 9.207 7.914 6.281

2 11.93 10.316 7.285

3 30.687 31.109 25.12

100

Capıtulo 5

Aplicacao a dados reais

5.1 Introducao

Neste capıtulo, apresenta-se uma aplicacao da metodologia sequencial de inferencia

descrita neste trabalho a dados reais no contexto de epidemiologia. Mais especificamente,

estuda-se a relacao entre condicoes atmosfericas (concentracao de poluente, temperatura

e umidade) e numero de obitos por doencas respiratorias. O interesse maior neste capıtulo

e estudar a aplicacao de funcao transferencia em modelos dinamicos e a avaliar a eficiencia

da metodologia sequencial proposta nesse contexto. O capıtulo esta estruturado da se-

guinte forma: na secao 5.2, descreve-se o conjunto de dados utilizados, e a secao 5.3

descreve os modelos dinamicos poisson com funcao de transferencia que serao utiliza-

dos para ajuste aos dados reais. Na subsecao 5.3.1, apresenta-se um breve estudo de

simulacao em que se procura obter uma serie artificial similar a serie de dados reais com

o objetivo de verificar a eficiencia do metodo proposto para estimacao dos parametros no

contexto de modelos de poisson com funcao de transferencia. Nesta secao, apresenta-se

ainda uma comparacao do metodo sequencial com os esquemas MCMC descritos em Al-

ves et al. (2010), em que os autores utilizam propostas de Metropolis construıdas segundo

Gamerman (1998) aplicados a esse mesmo conjunto de dados. A subsecao 5.3.2 descreve

os modelos ajustados aos dados reais e mostra resultados da inferencia sequencial para

as quantidades desconhecidas. Por fim, a secao 5.4 apresenta as conclusoes da aplicacao

aos dados reais.

101

5.2 Descricao do conjunto de dados

A variavel de interesse do conjunto de dados utilizado para ilustrar a implementacao

da metodologia sequencial descrita no capıtulo 3 e a contagem diaria de obitos de criancas,

devido a doencas respiratorias, na cidade de Sao Paulo durante os anos de 1994 a 1997,

totalizando 1461 observacoes. Como covariaveis, temos as temperaturas mınimas (em

oC), umidade relativa do ar media (%) e nıvel medio de monoxido de carbono em partes

por milhao (ppm), todas medidas diariamente. Atraves da figura 5.1 pode-se verificar

que, em geral, valores elevados para o numero de obitos por doenca respiratoria acorrem

quando a concentracao de monoxido de carbono e alta e quando temperatura e umidade

sao baixas. E possıvel observar, alem disso, um comportamento sazonal na serie de

obitos, que parece apresentar uma tendencia de queda ao longo do tempo.

02

46

810

12

Jan1994

May1994

Sep1994

Jan1995

May1995

Sep1995

Jan1996

May1996

Sep1996

Jan1997

May1997

Sep1997

Dec1997

(a) Serie de obitos

02

46

Jan1994

May1994

Sep1994

Jan1995

May1995

Sep1995

Jan1996

May1996

Sep1996

Jan1997

May1997

Sep1997

Dec1997

(b) Concentracao de monoxido de carbono

(ppm)

−4

−3

−2

−1

01

2

Jan1994

May1994

Sep1994

Jan1995

May1995

Sep1995

Jan1996

May1996

Sep1996

Jan1997

May1997

Sep1997

Dec1997

(c) Umidade

−4

−3

−2

−1

01

2

Jan1994

May1994

Sep1994

Jan1995

May1995

Sep1995

Jan1996

May1996

Sep1996

Jan1997

May1997

Sep1997

Dec1997

(d) Temperatura (oC)

Figura 5.1: Series temporais da variavel resposta e das regressoras.

102

Por questoes de simplicidade, daqui por diante iremos nos referir a variavel resposta

como numero de obitos, ou numero de obitos por doenca respiratoria, ao inves de usar

a denominacao mais precisa: numero de obitos de criancas com menos de 5 anos por

doenca respiratoria na cidade de Sao Paulo.

5.3 Descricao dos modelos propostos

Existem diversos modelos discretos que poderiam ser usados para modelar contagens,

como a Poisson, Poisson inflacionada de zeros, binomial, binomial negativa, entre outras.

Aqui, optou-se por modelar a variavel resposta, numero de obitos por doenca respiratoria,

como uma Poisson.

E bastante plausıvel pensar que fatores atmosfericos como concentracao de poluente,

temperatura e umidade estejam, de alguma forma, relacionadas a ocorrencia de problemas

respiratorios. A observacao das series temporais que constam na figura 5.1 reforca essa

conjectura. Por essas razoes, considerou-se importante incorporar tais regressoras na

modelagem da serie de obitos.

Avaliou-se diferentes formas de impacto do poluente, temperatura e umidade sobre a

serie de obitos. Primeiramente, nao se acredita que quaisquer dessas regressoras afetem

de imediato o numero de obitos observados, ou seja, nao acreditamos que uma elevacao

na concentracao de poluente num determinado dia seja capaz de gerar qualquer impacto

sobre o numero de obitos observados naquele mesmo dia, o mesmo sendo valido para

temperatura e umidade. Porem, e razoavel pensar que tais eventos afetem o numero de

obitos observados em dias futuros e por isso considerou-se medicoes defasadas das regres-

soras sobre a resposta. Em todos os modelos propostos, consideramos uma defasagem

de 3 dias para o poluente, 2 dias para a temperatura e 3 para umidade, em relacao a

observacao do numero de obitos no dia corrente. Esses valores foram definidos escolhendo

o trio (dpol, dtemp, dumid) ∈ 1, . . . , 63 que maximizava a correlacao linear marginal das

regressoras com o logaritmo da resposta.

Em cada um dos modelos propostos, considera-se uma das regressoras (poluente, tem-

peratura ou umidade) com impacto sobre o preditor descrito por uma funcao de trans-

103

ferencia. Assim, podemos verificar, por exemplo, o horizonte de impacto da regressora

sobre o numero de obitos em dias futuros, como sera ilustrado na subsecao 5.3.2.

Alem disso, todos os modelos propostos incluem um bloco sazonal de regressoras de

modo a captar as oscilacoes periodicas na serie de obitos, alem de um nıvel base no

preditor linear.

Os modelos 1 a 3 descritos a seguir consideram o efeito latente do poluente, tempe-

ratura e umidade, respectivamente, com evolucao dinamica determinada pela funcao de

transferencia TF (1, d, 1), com d = 2 (efeito referente a temperatura) ou d = 3 (efeito

referente a poluente ou umidade).

Modelo 1

yt ∼ Poisson(λt)

log λt = Et + α + δtempTempt−2 + δumidUmidt−3 + δcoscos

(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γPolt−3

Modelo 2

yt ∼ Poisson(λt)

log λt = Et + α + δpolPolt−3 + δumidUmidt−3 + δcoscos

(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γTempt−2

Modelo 3

yt ∼ Poisson(λt)

log λt = Et + α + δpolPolt−3 + δtempTempt−2 + δcoscos

(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γUmidt−3

104

Os modelos 4 a 6 descritos a seguir consideram o efeito latente do poluente, tempera-

tura e umidade, respectivamente, descrito pela funcao de transferencia TF (1, d, 1) com

choques aleatorios iid representados pela sequencia εt.

Modelo 4

yt ∼ Poisson(λt)


(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γPolt−3 + εt, εt ∼ [0,W ]

Modelo 5

yt ∼ Poisson(λt)


(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γTempt−2 + εt, εt ∼ [0,W ]

Modelo 6

yt ∼ Poisson(λt)

log λt = Et + α + δpolUmidt−3 + δtempTempt−2 + δcoscos

(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γUmidt−3 + εt, εt ∼ [0,W ]

Os modelos 7 a 9 descritos a seguir consideram o efeito latente do poluente, tempera-

tura e umidade, respectivamente, descrito pela funcao de transferencia TF (1, d, 1) com

resposta imediata ao impulso variando no tempo segundo um passeio aleatorio simetrico.

Nesses modelos, a resposta ao impulso da regressora varia, nao so de acordo com o ho-

rizonte de tempo entre a medicao da regressora e a observacao do desfecho no futuro,

mas tambem de acordo com o instante de tempo em que a regressora e observada. Em

105

termos praticos, estes modelos permitem, por exemplo, que a influencia cumulativa da

regressora sobre o numero de obitos em horizontes futuros seja diferente ao decorrer dos

anos.

Modelo 7

yt ∼ Poisson(λt)


(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γtPolt−3

γt = γt−1 + εt, εt ∼ [0,W ]

Modelo 8

yt ∼ Poisson(λt)


(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γtTempt−2

γt = γt−1 + εt, εt ∼ [0,W ]

Modelo 9

yt ∼ Poisson(λt)

log λt = Et + α + δpolPolt−3 + δtempTempt−2 + δcoscos

(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γtUmidt−3

γt = γt−1 + εt, εt ∼ [0,W ]

A metodologia sequencial de estimacao proposta para os modelos 1 a 9 consiste em

expandir o vetor de estados, incluindo os hiperparametros φ e γ (ou γt nos modelos 7,

8 e 9). Nos modelos que apresentam evolucao estocastica, a variancia e estimada por


106

5.3.1 Simulacao

Para avaliar se a metodologia sequencial proposta consegue recuperar os valores dos

parametros dos modelos descritos anteriormente, foi gerada uma serie artificial com base

no modelo 7:

yt ∼ Poisson(λt)


(2πt

365

)+ δsensen

(2πt

365

)Et = φEt−1 + γtPolt−3

γt = γt−1 + εt, εt ∼ [0,W ]

que considera o efeito latente do poluente como funcao de transferencia TF(1,3,1) com

dinamica na resposta imediata ao impulso segundo um passeio aleatorio.

Para a simulacao, fixou-se W = 10−5, δtemp = 0.01, δumid = 0.009, δsen = 0.8, δcos =

0.1, φ = 0.8, α = 1.

Fazemos uma comparacao com as estimativas obtidas via MCMC, e tambem uti-

lizando fatores de desconto para especificacao da sequencia de variancias de evolucao.

Como foi fixado um valor baixo para W , utilizou-se fator de desconto bastante proximo

de 1 no processo de estimacao (0.99 mais precisamente). A estimacao via MCMC foi feita

com base em Gamerman (1998), em que o modelo e reparametrizado em funcao dos erros

de evolucao e, a partir das cadeias simuladas para os erros, constroi-se a amostra simu-

lada da posteriori para os estados. A implementacao deste esquema MCMC a modelos de

funcao de transferencia, tratada em (Alves et al., 2010), foi feita em linguagem Fortran,

simulando uma cadeia de 50000 iteracoes, das quais foram discartadas as 10000 primeiras

para obtencao das amostras a posteriori, bem como das medidas resumo a posteriori.

As distribuicoes a priori marginais utilizadas no procedimento MCMC foram W |

D0 ∼ GamaInv(10−5, 10−5), δtemp | D0 ∼ N(0, 10−5), δumid | D0 ∼ N(0, 10−5), δsen |

D0 ∼ N(0, 10−5), δcos | D0 ∼ N(0, 10−5), α | D0 ∼ N(0, 10−5), φ | D0 ∼ U(0, 1),

que consistem em distribuicoes bastante vagas em termos de informacao subjetiva sobre

107

os parametros. Para o procedimento sequencial baseado na expansao e linearizacao do

vetor de estados, considerou-se prioris marginais δtemp | D0 ∼ [0, 100], δumid | D0 ∼

[0, 100], δsen | D0 ∼ [0, 100], δcos | D0 ∼ [0, 100], α | D0 ∼ [0, 100], φ ∼ [0.5, 0.02]. Para

o procedimento que utiliza quadratura de Gauss Hermite para estimar a variancia de

evolucao, considerou-se priori Log Normal para W , com media 0,01 e variancia 0,1. Note-

se que as variancias marginais especificadas a priori nos esquemas sequenciais sao menores

do que as que foram adotadas no esquema MCMC. Utilizando 105 para as variancias a

priori nos esquemas sequenciais, obtivemos problemas numericos que impediram a ob-

tencao das estimativas a posteriori. Entretando, note-se, que dada a magnitude baixa dos

valores verdadeiros fixados para os parametros durante a simulacao, ainda consideramos

vagas as prioris sob os esquemas sequenciais.

Como observacao final a respeito das distribuicoes marginais a priori adotadas nos

esquemas sequenciais, a priori marginal referente a φ foi escolhida de modo que a media ±

3 desvios padroes resultassem em valores proximos de 0 e de 1, de modo que, se tivessimos

normalidade a priori, esperarıamos valores entre 0 e 1 para φ com probabilidade quase

igual a 1.

Os resultados da aplicacao das tres metodologias ao conjunto de dados artificiais sao

ilustrados nas figuras 5.2, 5.3 e 5.4. Em geral, as 3 figuras mostram resultados bastante

proximos sob as 3 metodologias adotadas.

A figura 5.2 mostra que os intervalos de credibilidade a posteriori para os parametros

estaticos contem os valores verdadeiros. Note-se que os intervalos obtidos sequencial-

mente sao mais largos que os intervalos obtidos via MCMC, apesar da diferenca ser

muito pequena.

108

0.0 0.2 0.4 0.6 0.8 1.0

φα

δsen

δtempδumid

δcos

Descontos Gauss−Hermite MCMC

Figura 5.2: Intervalos de credibilidade a posteriori (media ± 2 desvios) para os

parametros estaticos do modelo 7, condicionalmente a toda a serie de dados, obtidos

via metodologia sequencial e via MCMC.

A dinamica que rege a trajetoria da resposta imediata ao impulso no tempo consegue

ser captada pelos tres procedimentos de estimacao, conforme ilustra a figura 5.3. Como

as estimativas dos parametros via MCMC sao feitas condicionalmente a toda a serie de

dados, a comparacao foi feita considerando as estimativas suavizadas no contexto sequen-

cial. Para obter estimativas suavizadas nesse contexto, fez-se a suposicao de normalidade

conjunta do vetor γ1:T = (γ1, . . . , γT ), em que T e o ultimo instante de tempo da serie.

Para aproximar as estimativas suavizadas nesse contexto, foi feita a suposicao de

normalidade conjunta para o vetor γ1:T | W,DT . Nessas circunstancias, E(γ1:T | W,DT )

e V ar(γ1:T | W,DT ) coincidem com o vetor de medias e matriz de covariancias que se

obtem em West e Harrison (1997) pp. 112 a 115 supondo normalidade para a variavel

resposta. A dependencia em W e suprimida calculando as integrais

∫ ∞0

E(γ1:T | W,DT )p(W | DT )dW

e

∫ ∞0

V ar(γ1:T | W,DT )p(W | DT )dW

109

via quadratura de Gauss-Hermite utilizando a grade de pontos e os respectivos pesos

obtidos ao final do algoritmo para inferencia sequencial.

A figura 5.3 mostra uma grande proximidade entre as estimativas sequenciais obtidas

com quadratura de Gauss-Hermite e MCMC. Utilizando fator de desconto, as diferencas

em comparacao a metodologia MCMC sao mais claras, o que e intuitivo uma vez que, com

fatores de desconto, supoe-se as variancias Wt conhecidas variando ao longo do tempo,

portanto se diferenciam mais em relacao ao modelo estimado via MCMC.

No que diz respeito a estimacao da variancia de evolucao W , a figura 5.4 mostra uma

grande similaridade entre a densidade aproximada obtida via quadratura e a amostra a

posteriori fornecida pelo algoritmo MCMC. Ambas as metodologias geram estimativas

pontuais bastante proximas do verdadeiro valor de W .

0 200 400 600 800 1000 1200 1400

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Resposta imediata ao impulso

tempo

Gauss−HermiteDescontosMCMCγt simulado

Figura 5.3: Funcao de resposta imediata ao impulso (γt) estimada sequencialmente e

via MCMC no modelo 7. Exibe-se a serie real e intervalos de credibilidade a posteriori

(media ± 2 desvios) condicionalmente a toda a serie de dados.

110

W | D1000

Den

sida

de

0e+00 1e−05 2e−05 3e−05 4e−05 5e−05

010

000

2000

030

000

4000

050

000

6000

070

000

Figura 5.4: Histograma (MCMC) e curva de densidade aproximada (metodologia sequen-

cial) para a variancia de evolucao a posteriori no modelo 7. Curva obtida com 15 pontos

na quadratura de Gauss-Hermite.

5.3.2 Aplicacao aos dados

Na subsecao 5.3.1, verificou-se maior proximidade dos resultados da metodologia se-

quencial em relacao aos resultados via MCMC quando usavamos a quadratura de Gauss-

Hermite. Portanto, escolheu-se a quadratura, em detrimento da especificacao via fator

de desconto, para estimacao dos modelos 1 a 9 propostos no inıcio desta secao.

Adotou-se para cada um dos modelos as mesmas prioris marginais adotadas na si-

mulacao descrita na subsecao anterior, com 15 pontos compondo a grade de Gauss-

Hermite.

Os nove modelos foram comparados de forma a maximizar a verossimilhanca preditiva.

Conforme mostra a tabela 5.1, o melhor modelo dentre os nove ajustados foi o modelo 4,

que considera efeito de funcao de transferencia TF(1,3,1) com erros iid para o poluente.

Em geral, a tabela mostra que os modelos com choques aleatorios iid compondo a funcao

de transferencia apresentam melhores resultados do ponto de vista preditivo.

A seguir, sao exibidos os resultados da estimacao sequencial referente ao modelo 4.

Para o ajuste, considerou-se as regressoras: poluente, temperatura e humidade padroni-

111

zadas (subtraıdas de sua media e divididas pelo desvio-padrao).

Tabela 5.1: Logaritmo da verossimilhanca preditiva para cada um dos modelos ajustados.

Descricao do modelo∑

t log p(yt | Dt−1)

1 Poluente: TF(1,3,1) -1740.167

2 Temperatura: TF(1,2,1) -1742.127

3 Umidade: TF(1,3,1) -1740.966

4 Poluente: TF(1,3,1) com choques iid -1698.248

5 Temperatura: TF(1,2,1) com choques iid -1709.145

6 Umidade: TF(1,3,1) com choques iid -1707.025

7 Poluente: TF(1,3,1) com resp. imediata ao impulso dinamica -1728.989

8 Temperatura: TF(1,2,1) com resp. imediata ao impulso dinamica -1710.803

9 Umidade: TF(1,3,1) com resp. imediata ao impulso dinamica -1738.646

A tabela 5.2 exibe as estimativas pontuais e intervalos de credibilidade de extremos

iguais a media ± 2 desvios padroes a posteriori para os parametros estaticos conside-

rando toda a serie de dados. O unico efeito que nao se mostrou significativo foi o da

umidade sobre a taxa de obitos. Note-se tambem que os efeitos sazonais apresentam

magnitude mais elevada que a concentracao de poluente, temperatura e umidade. Os

mesmos intervalos de credibilidade estao ilustrados na figura 5.5.

A funcao de resposta ao impulso para o modelo 4 pode ser obtida por aplicacoes

sucessivas da equacao

Et = φEt−1 + γPolt−3 + εt,

que nos permite chegar a

Et =t−2∑k=0

γφkPolt−k−3 +t+1∑k=0

φkεt−k + φtE0.

Portanto, a funcao de resposta ao impulso e vk = γφk. Fixando-se k, a resposta ao

impulso e uma funcao nao-linear de (φ, γ), portanto nao conseguimos obter media a pos-

teriori para esta quantidade utilizando a metodologia sequencial proposta. Entretanto,

112

Tabela 5.2: Resumo a posteriori para os parametros estaticos considerando toda a serie

de dados. LI e LS (limites inferior e superior, respectivamente) referem-se aos extremos

do intervalos de credibilidade marginais (media ± 2 desvios).

Media Desvio-padrao LI LS

φ 0.889 0.056 0.776 1.002

γ 0.046 0.016 0.014 0.078

δtemp -0.066 0.033 -0.132 -0.001

δumid -0.030 0.021 -0.072 0.011

δcos -0.261 0.052 -0.365 -0.156

δsen 0.130 0.036 0.059 0.202

para termos uma ideia do comportamento dessa funcao, fixamos as estimativas pontuais

φ = E(φ | D1458) e γ = E(γ | D1458) e plotamos γφk na figura 5.6. Pode-se perceber pela

figura que a janela de impacto do poluente sobre a taxa de obitos parece durar cerca de

30 dias, quando passa a ter magnitude praticamente nula. Tambem estimamos o tempo

de meia vida para o efeito do poluente em 6 dias, uma vez que γφ6 = 0.0227 ≈ γ/2, ou

seja, apos 6 dias, aproximadamente, o efeito do poluente sobre os desfechos se reduz a

metade.

113

−0.5 0.0 0.5 1.0

φδsen

γδumid

δcosδtemp

Figura 5.5: Intervalos de credibilidade a posteriori (media ± 2 desvios-padroes) para os

parametros estaticos considerando-se toda a serie de dados.

0 10 20 30 40 50 60

0.00

0.01

0.02

0.03

0.04

0.05

0.06

Resposta ao impulso estimada

k

q0.95(γφk | DN)q0.5(γφk | DN)q0.05(γφk | DN)

Figura 5.6: Funcao de resposta ao impulso estimada para o modelo 4.

Por fim, a figura 5.7 exibe as previsoes um passo a frente para o numero de obitos de

criancas por doenca respiratoria em Sao Paulo ao longo dos anos de 94 a 97. Percebe-se

que as previsoes acompanham o comportamento sazonal dos desfechos mas nao apresen-

tam grandes oscilacoes em janelas de tempo curtas.

114

0 500 1000 1500

05

1015

20

tempo

Série observadaE(yt | Dt−1)E(yt | Dt−1) ± 2 × Var(yt | Dt−1)

Figura 5.7: Previsoes um passo a frente para o numero de obitos de criancas por doenca

respiratoria em Sao Paulo

5.4 Conclusoes da aplicacao aos dados reais

Neste capıtulo, foi apresentada uma aplicacao a dados reais de contagens de desfechos

epidemiologicos, onde foram propostos modelos dinamicos Poisson com efeitos latentes

de funcao de transferencia como forma de modelar o impacto cumulativo de regressoras

sobre a variavel resposta.

A metodologia sequencial aplicada consiste na expansao e linearizacao do vetor de

estados em conjunto com o uso de quadratura de Gauss Hermite para estimar a variancia

de evolucao das componentes dinamicas.

Primeiramente, vimos que adotar prioris marginais com variancia demasiadamente

alta acarreta problemas numericos no procedimento sequencial proposto, porem isso nao

impediu que fossem utilizadas prioris vagas para os parametros dos modelos.

Verificou-se que as estimativas obtidas sequencialmente sao bastante proximas do

que se obtem via MCMC, porem a um custo computacional consideravelmente mais

115

baixo. Enquanto necessitou-se mais de 13 horas para simulacao das 50000 iteracoes, a

implementacao da metodologia sequencial com uso de quadratura de Gauss Hermite foi

feita em 42 segundos. Mesmo com cadeias de comprimento menor, 5000 iteracoes por

exemplo, o tempo computacional esperado seria algo proximo de 1 hora e 20 minutos,

ainda assim consideravelmente mais elevado que obtido sequencialmente.

Dentre os modelos propostos, o que apresentou melhores resultados do ponto de vista

preditivo foi o modelo que considera efeito do poluente sobre os obitos atraves de funcao

de transferencia com adicao de choques aleatorios iid. Segundo o ajuste obtido para este

modelo, o efeito do poluente sobre a resposta em tempos futuros apresenta magnitude

baixa, porem perdura por um horizonte de aproximadamente 30 dias. As componentes

sazonais sao as que apresentam efeito de magnitude mais elevada, indicando comporta-

mento sazonal marcante na serie observada.

116

Capıtulo 6

Conclusoes e trabalhos futuros

Neste trabalho, propoe-se uma metodologia sequencial para realizacao de inferencia

em modelos dinamicos nao-lineares sob enfoque bayesiano.

Condicionalmente a variancia dos erros de evolucao, a metodologia proposta utiliza

expansao do vetor de estados para incorporar parametros desconhecidos presentes na

matriz de evolucao. Em seguida, lineariza-se a equacao de evolucao resultante de modo

a permitir que media e matriz de variancia para os estados sejam atualizadas sequencial-

mente conforme feito em West et al. (1985). O procedimento de expansao e linearizacao

do vetor de estados esta descrito em West e Harrison (1997) capıtulo 13.

Para estimacao das variancias de evolucao dos parametros dinamicos, constroi-se uma

grade de pontos que evolui dinamicamente levando em consideracao a media e variancia

obtidas sequencialmente via quadratura adaptativa de Gauss Hermite. Aplicacoes do

metodo de quadratura adaptativa de Gauss Hermite em modelos dinamicos estao dis-

ponıveis na literatura, porem apenas em contextos de resposta normal (Naylor e Smith

1982, Pole 1988, Pole e West 1990). Sendo assim, a contribuicao deste trabalho consiste

em aliar as ideias da quadratura adaptativa aos procedimentos de expansao e linearizacao

dos estados em contextos de modelos dinamicos nao-gaussianos com hiperparametros,

possibilitando realizacao de inferencia sequencial para todos os parametros do modelo.

No capıtulo 4, a metodologia proposta foi aplicada considerando-se resposta normal,

Poisson e binomial com estrutura latente autorregressiva e em modelos dinamicos Poisson

com efeito de funcao de transferencia, no capıtulo 5. No caso dos processos autorregres-

117

sivos, percebeu-se que, em geral, nao se consegue obter boas estimativas dos parametros

dos processos autorregressivos dispondo de poucas observacoes (no caso, 50). Porem,

esse problema nao foi observado para series mais longas (250 a 1000 observacoes). Em

geral, foi difıcil recuperar os parametros do processo latente supondo ordem alta para o

processo autorregressivo esperando obter estimativas proximas de zero para os coeficien-

tes de ordem maior que a verdadeira ordem do processo. Ainda no contexto de processos

autorregressivos, foram constatadas dificuldades em utilizar fatores de desconto para es-

pecificar a sequencia de variancias de evolucao, pois obtınhamos posterioris degeneradas

em um unico ponto para os processos autorregressivos βt. Acreditamos que isso se deva

a restricoes de ordem teorica para os valores dos descontos em contextos de modelos

autorregressivos, tais como a restricao citada na secao 3.6 para o caso normal AR(1).

No capıtulo 5, aplicou-se a metodologia sequencial proposta a modelos Poisson di-

namicos com efeitos latentes de funcao de transferencia num contexto epidemiologico.

As estimativas a posteriori obtidas foram bem proximas daquelas que se obteve via

MCMC conforme Gamerman (1998), o que nos permite validar o codigo escrito para

implementacao da metodologia inferencial proposta. O esquema sequencial mostrou-se

capaz de lidar com funcoes de transferencia com evolucao temporal estocastica, o que

permite grande flexibilidade de modelagem dos efeitos cumulativos de regressoras sobre

a resposta.

Em todos os modelos, o procedimento de inferencia sequencial proposto neste trabalho

foi realizado praticamente em tempo real. Em nenhum dos modelos tratados aqui, foi

necessario mais do que 1 minuto para executar todo o procedimento inferencial. Aliando-

se a isso o carater sequencial da inferencia, considera-se que a metodologia proposta

apresenta um grande atrativo, por exemplo, para aplicacoes praticas considerando longas

series de dados, para as quais e fundamental a aplicacao de algoritmos que exigem pouco

esforco computacional.

Como desvantagens do metodo, observa-se que a inferencia e realizada apenas em

termos de media e variancia para os parametros do vetor de estados. Outro ponto diz

respeito a instabilidade observada ao considerar prioris marginais muito vagas, tanto para

os parametros do vetor de estados quanto para a variancia evolucional das componentes

118

dinamicas. Porem, isso nao nos impediu de adotar prioris vagas para os parametros dos

modelos apresentados aqui.

E necessario esclarecer ainda que foram observadas algumas dificuldades do ponto de

vista numerico para implementacao da metodologia sequencial proposta em alguns dos

casos apresentados nesta dissertacao. Para algumas das series artificiais com estrutura la-

tente autorregressiva, obteve-se matrizes de covariancia que nao eram positivas-definidas

para alguns instantes de tempo. Interpolar as entradas da matriz de decomposicao de

Choleskey para as matrizes de variancia V ar(θt | αi), i ∈ L0 provavelmente resolveria o

problema, tal como aponta Pole (1988), e sera abordada em trabalhos futuros.

Como trabalhos futuros, pretende-se aplicar a metodologia descrita nesta dissertacao

a outros modelos, como por exemplo os modelos de volatilidade estocastica. Tambem

seria interessante comparar a metodologia proposta a outras alem de MCMC, como por

exemplo Integrated Nested Laplace Approximation (INLA) (Rue et al., 2009) e filtro de

partıculas. A comparacao com filtro de partıculas e particularmente interessante por

tambem se tratar de um esquema sequencial de inferencia que esta bastante difundido

na literatura.

Como extensoes, e interessante investigar a aplicacao da quadratura tambem aos

hiperparametros que aparecem na matriz de evolucao, uma vez que se consegue inferencia

de forma completa para tais parametros. Isso possibilitaria, por exemplo, a obtencao de

incerteza associada a estimacao de funcoes nao-lineares dos hiperparametros, como no

caso da funcao de resposta ao impulso que foi exibida no capıtulo 5. Nesse sentido, e de

suma importancia considerar a aplicacao da quadratura de Gauss Hermite em mais de

uma dimensao.

119

Apendice A

Distribuicoes de Probabilidade

Aqui, descreve-se a parametrizacao usada para algumas distribuicoes de probabilida-

des consideradas ao longo do texto. Sao elas: Beta Binomial, Gama, Gama Inversa, Log

Normal, T-student com posicao e escala, T-student multivariada com posicao e escala.

Em questao de notacao, dado um conjunto A ⊂ Rd definimos I(x ∈ A) a funcao

indicadora que assume valor 1 se x ∈ A e 0 se x /∈ A. Por exemplo, se x = 1 e A = (0, 1],

temos I(x ∈ A) = I(0 < x ≤ 1) = 1.

Distribuicao Beta Binomial

Dizemos que uma variavel aleatoria discreta X tem distribuicao Beta Binomial de

parametros n ∈ N, a > 0, b > 0, se X tem funcao de probabilidade

pX(x) =B(x+ a, n− x+ b)

B(a, b)

(n

x

)I(x ∈ 0, . . . , n),

onde B(α, β) e a funcao beta definida por

B(α, β) =Γ(α)Γ(β)

Γ(β + α).

Nesse caso, denotamos X ∼ BetaBinomial(n, a, b).

Nessa parametrizacao, temos E(X) = naa+b

e V ar(X) = nab(a+b)2(a+b+1)

.

120

Distribuicao Binomial Negativa

Dizemos que uma variavel aleatoria discreta X tem distribuicao Binomial Negativa

de parametros n ∈ R+ e p ∈ (0, 1), se X tem funcao de probabilidade

pX(x) =Γ(x+ n)

Γ(x+ 1)Γ(n)(1− p)npxI(x ∈ 0, 1, . . .),

Nesse caso, denotamos X ∼ BinomialNegativa(n, p).

Nessa parametrizacao, temos E(X) = np1−p e V ar(X) = np

(1−p)2 .

Distribuicao Log Normal

Dizemos que uma variavel aleatoria contınua X tem distribuicao LogNormal(µ, σ) se

a variavel aleatoria Y = logX tem distribuicao N(µ, σ2).

Nesse caso, a densidade de X e dada por

fX(x) =1

x√

2πσ2exp

−(log(x)− µ

σ

)2I(x > 0).

Nessa parametrizacao, temos E(X) = eµ+σ2

2 e V ar(X) = (eσ2 − 1)e2µ+σ

2.

Distribuicao Gama

Dizemos que uma variavel aleatoria contınua X tem distribuicao Gama(a, b), i.e.

X ∼ Gama(a, b) se sua densidade e dada por

fX(x) =ba

Γ(a)xa−1e−bxI(x > 0).

121

Nessa parametrizacao, temos E(X) = ab

e V ar(X) = ab2

.

Distribuicao Gama Inversa

Dizemos que uma variavel aleatoria contınua X tem distribuicao GamaInversa(a,b),

i.e. X ∼ GamaInv(a, b) se a variavel aleatoria Y = 1/X tem distribuicao Gama(a, b).

Nesse caso, a densidade de X e dada por

fX(x) =ba

Γ(a)x−a−1e−

bx I(x > 0).

Nessa parametrizacao, temos E(X) = ba−1 e V ar(X) = b2

(a−1)2(a−2) .

Distribuicao T-student com posicao e escala

Dizemos que uma variavel aleatoria contınua X tem distribuicao T-student com n

graus de liberdade e parametros de locacao µ e escala σ, se sua densidade e dada por

fX(x) =Γ(n+12

)σ√nπΓ(n

2)

[(x− µσ

)2

+ n

]−n+12

× I(x ∈ R).

Nesse caso, denotamos X ∼ Tn(µ, σ2).

Repare que a parametrizacao adota e feita em funcao do numero de graus de liber-

dade (n), do parametro de posicao (µ) e do quadrado do parametro de escala (σ2). Nessa

parametrizacao, temos E(X) = µ se n > 1 e V ar(X) = σ2× nn−2 para n > 2. Para n < 1,

a media da T-student nao esta bem definida e, se n < 2, o mesmo tambem acontece para

a variancia.

Distribuicao T-student multivariada com posicao e escala

Dizemos que um vetor aleatorio contınuo X com suporte Rd tem distribuicao T-

student multivariada com n graus de liberdade e parametros µ e Σ, se sua densidade e

122

dada por

fX (x) ∝[d+ (x− µ)′Σ−1(x− µ)

]−n+d2 × I(x ∈ Rd).

Nesse caso, denotamos X ∼ Tn(µ,Σ)

Aqui, µ faz o papel de parametro de posicao e a matriz Σ faz o papel de matriz de

escala. Nessa parametrizacao, temos E(X) = µ se n > 1 e V ar(X) = Σ × nn−2 para

n > 2. Para n < 1, a media da T-student multivariada nao esta bem definida e, se n < 2,

o mesmo tambem acontece para a variancia.

Um resultado importante diz que se X ∼ Tn(µ,Σ), entao as marginais sao T-student

univariadas com n graus de liberdade. Os parametros das distribuicoes marginais podem

ser facilmente obtidos a partir da conjunta: Xi ∼ Tn(µi, σ2i ) onde µi e a i-esima entrada

do vetor de medias µ e σ2i = Σi,i.

123

Referencias Bibliograficas

Almon, S. (1965) The distributed lag between capital appropriations and expenditures.

Econometrica, 33, pp. 178–196. URLhttp://www.jstor.org/stable/1911894.

Alves, M. B., Gamerman, D. e Ferreira, M. A. (2010) Transfer functions in dynamic

generalized linear models. Statistical Modelling, 10, 03–40.

Ameen, J. R. M. (1984) Discount bayesian models and forecasting. URLhttp://wrap.

warwick.ac.uk/3955/.

Ameen, J. R. M. e Harrison, P. J. (1984) Discount weighted estimation. Journal of

Forecasting, 3, 285–296. URLhttp://dx.doi.org/10.1002/for.3980030306.

Blocker, A. W. (2014) fastGHQuad: Fast Rcpp implementation of Gauss-Hermite qua-

drature. URLhttp://CRAN.R-project.org/package=fastGHQuad. R package version

0.2.

Carter, C. e Kohn, R. (1994) On Gibbs sampling for state space models. Biometrika, 81,

541–553.

Carvalho, C. M., Johannes, M. S., Lopes, H. F. e Polson, N. G. (2010) Particle lear-

ning and smoothing. Statist. Sci., 25, 88–106. URLhttp://dx.doi.org/10.1214/

10-STS325.

Cox, D. R., Gudmundsson, G., Lindgren, G., Bondesson, L., Harsaae, E., Laake, P.,

Juselius, K. e Lauritzen, S. L. (1981) Statistical analysis of time series: Some recent

developments [with discussion and reply]. Scandinavian Journal of Statistics, 8, pp.

93–115. URLhttp://www.jstor.org/stable/4615819.

124

http://www.jstor.org/stable/1911894

http://wrap.warwick.ac.uk/3955/

http://wrap.warwick.ac.uk/3955/

http://dx.doi.org/10.1002/for.3980030306

http://CRAN.R-project.org/package=fastGHQuad

http://dx.doi.org/10.1214/10-STS325

http://dx.doi.org/10.1214/10-STS325


Enders, W. (2009) Applied Econometric Time Series. Wiley.

Franco, G. C., Migon, H. S. e Prates, M. O. (2015) A monte carlo study and data

analysis for time series of counts. Relatorio Tecnico Relatorio Tecnico RTP-01/2015,

Belo Horizonte: Departamento de Estatıstica - UFMG.

Fruhwirth-Schnater, S. (1994) Data augmentation and dynamic linear models. Journal

of Time Series Analysis, 15, 183–202.

Gamerman, D. (1998) Markov chain Monte Carlo for dynamic generalized linear models.

Biometrika, 85, 215–227.

Huerta, G. e West, M. (1999) Priors and component structures in autoregressive time

series models. Journal of the Royal Statistical Society: Series B (Statistical Methodo-

logy), 61, 881–899. URLhttp://dx.doi.org/10.1111/1467-9868.00208.

Liu, J. e West, M. (2001) Combined parameter and state estimation in simulation-based

filtering. Em Sequential Monte Carlo Methods in Practice (eds. A. Doucet, N. de Freitas

e N. Gordon), Statistics for Engineering and Information Science, 197–223. Springer

New York. URLhttp://dx.doi.org/10.1007/978-1-4757-3437-9_10.

Migon, H., Gamerman, D. e Louzada, F. (2014) Statistical Inference: an Integrated

Approach. Chapman and Hall/CRC.

Naylor, J. C. e Smith, A. F. M. (1982) Applications of a method for the efficient com-

putation of posterior distributions. Journal of the Royal Statistical Society. Series C

(Applied Statistics), 31, pp. 214–225. URLhttp://www.jstor.org/stable/2347995.

Nelder, J. A. e Wedderburn, R. W. M. (1972) Generalized linear models. Journal of

the Royal Statistical Society. Series A (General), 135, pp. 370–384. URLhttp://www.

jstor.org/stable/2344614.

Pole, A. (1988) Transfer response models: a numerical approach. Bayesian Statistics, 3,

pp. 733–745.

125

http://dx.doi.org/10.1111/1467-9868.00208

http://dx.doi.org/10.1007/978-1-4757-3437-9_10




Pole, A. e West, M. (1990) Efficient bayesian learning in non-linear dynamic models.

Journal of Forecasting, 9, pp. 119–136.

Prado, R. e Lopes, H. (2013) Sequential parameter learning and filtering in structured

autoregressive state-space models. Statistics and Computing, 23, 43–57. URLhttp:

//dx.doi.org/10.1007/s11222-011-9289-1.

R Development Core Team (2008) R: A Language and Environment for Statistical

Computing. R Foundation for Statistical Computing, Vienna, Austria. URLhttp:

//www.R-project.org. ISBN 3-900051-07-0.

Rue, H., Martino, S. e Chopin, N. (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations. Journal of the

royal statistical society: Series b (statistical methodology), 71, 319–392.

Salzer, H., E., Zucker, R. e Capuano, R. (1952) Tables of the zeroes and weight factors of

the first twenty hermite polynomials. J. Research of the National Bureau of Standards,

48, pp. 111–116.

Smith, A. F. M., Skene, A. M., Shaw, J. E. H. e Naylor, J. C. (1987) Progress with

numerical and graphical methods for practical bayesian statistics. Journal of the

Royal Statistical Society. Series D (The Statistician), 36, pp. 75–82. URLhttp:

//www.jstor.org/stable/2348499.

Storvik, G. (2002) Particle filters for state-space models with the presence of unknown

static parameters. Signal Processing, IEEE Transactions on, 50, 281–289.

West, M. e Harrison, J. (1997) Bayesian Forecasting and Dynamic Models. New York:

Springer-Verlag, 2nd edn.

West, M., Harrison, J. e Migon, H. (1985) Dynamic generalized linear models and baye-

sian forecasting. Journal of the American Statistical Association, 80, 73–83.

Zeger, S. L., Liang, K.-Y. e Albert, P. S. (1988) Models for longitudinal data: A ge-

neralized estimating equation approach. Biometrics, 44, pp. 1049–1060. URLhttp:

//www.jstor.org/stable/2531734.

126

http://dx.doi.org/10.1007/s11222-011-9289-1

http://dx.doi.org/10.1007/s11222-011-9289-1

http://www.R-project.org

http://www.R-project.org





infer^encia sequencial em modelos din^amicos...

Documents