calibra˘c~ao espa˘co-temporal de previs~oes num ericas do ... · orientador de ic na fiocruz, e a...

126
Calibra¸ ao Espa¸ co-Temporal de Previs˜ oes Num´ ericas do Modelo de Mesoescala Eta para a Velocidade do Vento em Minas Gerais Luiz Eduardo da Silva Gomes Universidade Federal do Rio de Janeiro Instituto de Matem´ atica Departamento de M´ etodos Estat´ ısticos 2018

Upload: buicong

Post on 17-Dec-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

Calibracao Espaco-Temporal de Previsoes

Numericas do Modelo de Mesoescala Eta

para a Velocidade do Vento em Minas

Gerais

Luiz Eduardo da Silva Gomes

Universidade Federal do Rio de Janeiro

Instituto de Matematica

Departamento de Metodos Estatısticos

2018

Calibracao Espaco-Temporal de PrevisoesNumericas do Modelo de Mesoescala Eta

para a Velocidade do Vento em MinasGerais

Luiz Eduardo da Silva Gomes

Dissertacao de Mestrado submetida ao Programa

de Pos-Graduacao em Estatıstica do Instituto de

Matematica da Universidade Federal do Rio de

Janeiro como parte dos requisitos necessarios a

obtencao do tıtulo de Mestre em Estatıstica.

Orientadoras: Profa. Dra. Thais C. O. Fonseca

Profa. Dra. Kelly C. M. Goncalves

Rio de Janeiro, RJ - Brasil

2018

ii

Calibracao Espaco-Temporal de PrevisoesNumericas do Modelo de Mesoescala Eta

para a Velocidade do Vento em MinasGerais

Luiz Eduardo da Silva Gomes

Dissertacao de Mestrado submetida ao Programa de Pos-Graduacao em Estatıstica

do Instituto de Matematica da Universidade Federal do Rio de Janeiro como parte dos

requisitos necessarios a obtencao do tıtulo de Mestre em Estatıstica.

Aprovada por:

Profa. Dra. Thais C. O. Fonseca

UFRJ – Orientadora

Profa. Dra. Kelly C. M. Goncalves

UFRJ – Co-orientadora

Profa. Dra. Marina S. Paez

UFRJ

Prof. Dr. Marcos O. Prates

UFMG

Prof. Dr. Gustavo S. Ferreira

ENCE/IBGE

Rio de Janeiro, RJ - Brasil

2018

iii

FICHA CATALOGRAFICA

iv

Aos meus pais.

v

“Seja quem voce for, seja qualquer posicao que voce tenha na vida, nıvel altıssimo ou

mais baixo social (sic), tenha sempre como meta muita forca, muita determinacao e

sempre faca tudo com muito amor e com muita fe em Deus, que um dia voce chega la.

De alguma maneira, voce chega la.”

Ayrton Senna.

vi

Agradecimentos

A Deus.

Aos meus amados pais que sempre fizeram de tudo para que eu pudesse chegar ate aqui.

Obrigado pelo suporte, educacao e apoio que voces me proporcionam. Sem voces, grande

momentos como este, nao seriam possıveis. Eu continuarei orgulhando voces. Ate o fim. Eu

amo voces. Incondicionalmente.

A Iuna Alves, minha velha amiga que tornou-se recem companheira. Voce e incrıvel (e

engracada). Obrigado por sempre mostrar-me o lado bom da vida e me fazer sorrir em dias

chuvosos e ensolarados. Te amo.

As minhas orientadoras Thais Fonseca e Kelly Goncalves pelo auxılio e disponibilidade

oferecidos durante o desenvolvimento do trabalho. O conhecimento compartilhado por voces

foram primordiais no meu desenvolvimento academico.

Aos amigos que fiz durante o curso, em especial, Rafael Erbisti, Rebecca Souza, Renato

Gomes, Rodrigo Lassance e Victor Eduardo. Foi um prazer compartilhar aflicoes, notas de aula

e conceitos (nem tao bons assim) com voces.

Aos amigos que fiz previamente e tambem estavam la, em especial, ao Marcel, meu antigo

orientador de IC na Fiocruz, e a Raıra Marotta, uma graduacao inteira nao foi o suficiente ne?

Aos velhos amigos, em especial, a “uniao do transporte coletivo” formada em perıodos

colegiais por Bruno Delgado, Filipe Steikofp, Patrick Martins e Romario Paiva. Nos estaremos

sempre juntos!

A Profa. Marina Paez e ao Prof. Marcos Prates por aceitarem integrar a banca.

Ao Prof. Gustavo Ferreira por, ainda, ser um exemplo profissional e pessoal para mim.

Obrigado pela oportunidade de ir alem do esperado (no passado) e ter chegado ate aqui. Como

proposto por mim no fim da graduacao, obrigado por tambem compor a atual banca.

A Ramiro Cadernas por auxiliar na coordenacao do projeto maior o qual, meu projeto esta

aninhado, e pela disponibilizacao dos dados necessarios para este trabalho.

Por fim, a FAPEMIG e a CEMIG pelo apoio financeiro.

vii

Resumo

Previsoes de variaveis meteorologicas provenientes de modelos numericos estao,

sistematicamente, sujeitas a erros. Tais erros, devem-se a tentativa de simular

deterministicamente processos termodinamicos da atmosfera a partir de suas condicoes

correntes por meio de sistemas de equacoes diferenciais. Alem disto, estes sistemas sao

solucionados em uma grade discreta, apresentando previsoes uniformes para toda regiao

pertencente a mesma celula desta grade. Por consequencia, previsoes procedentes de

modelos numericos podem nao ser representativas em locais especıficos (Chou et al.,

2007). Assim, tecnicas de pos-processamento estatıstico sao apropriadas para a calibracao

destas previsoes, minimizando possıveis distorcoes (Glahn e Lowry, 1972).

O presente trabalho tem por objetivo minimizar os erros das previsoes do modelo

de mesoescala Eta para a velocidade do vento a 10 metros do solo no Estado de Minas

Gerais atraves do desenvolvimento de extensoes aprimoradas dos principais modelos

de pos-processamento estatıstico para campos meteorologicos. Os modelos propostos

foram estruturados atraves da tecnica de aumento de dados (Tanner e Wong, 1987) e

dos Modelos Lineares Dinamicos (MLD, West e Harrison, 1997).

Palavras-Chaves: velocidade do vento; modelo de mesoescala Eta; calibracao; modelos

lineares dinamicos espaco-temporais; tecnica de aumento de dados.

viii

Abstract

Forecasts of meteorological variables from numerical models are systematically subject

to errors. Such errors are due to the attempt to simulate deterministically thermodynamic

processes of the atmosphere from their current conditions through systems of differential

equations. In addition, these systems are solved in a discrete grid, presenting uniform

forecasts for every region belonging to the same grid cell. Consequently, forecasts

from numerical models may not be representative at specific locations (Chou et al.,

2007). Thus, statistical post-processing techniques are appropriate for calibration of

these forecasts, minimizing possible distortions (Glahn e Lowry, 1972).

This work aims to minimize the errors of Eta mesoscale model’s forecasts for the

wind speed at 10 meters above the ground in the State of Minas Gerais through the

development of improved extensions of the main statistical post-processing models for

meteorological fields. The proposed models were structured by the data augmentation

technique (Tanner e Wong, 1987) and Dynamic Linear Models (MLD, West e Harrison,

1997).

Keywords: wind speed; Eta mesoscale model; calibration; dynamical spatio-temporal

linear models; data augmentation technique.

ix

Sumario

Lista de Figuras xiii

Lista de Tabelas xix

1 Motivacao e Introducao 1

1.1 Previsao Numerica em Minas Gerais . . . . . . . . . . . . . . . . . . . . 2

1.2 Previsao Numerica do Tempo . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2.1 Historia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2.2 Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2.3 Classificacao dos modelos . . . . . . . . . . . . . . . . . . . . . . 14

1.2.4 Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.2.5 Fontes de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2.6 Aperfeicoamento dos modelos . . . . . . . . . . . . . . . . . . . . 17

1.3 Pos-Processamento Estatıstico . . . . . . . . . . . . . . . . . . . . . . . . 18

1.4 Modelo de Mesoescala Eta . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Modelos de Pos-Processamento Estatıstico 21

2.1 Metodos de Calibracao Univariados . . . . . . . . . . . . . . . . . . . . . 21

2.1.1 Model Output Statistics . . . . . . . . . . . . . . . . . . . . . . . 21

2.1.2 Ensemble Model Output Statistics . . . . . . . . . . . . . . . . . . 22

2.2 Metodos de Calibracao Espaciais . . . . . . . . . . . . . . . . . . . . . . 23

2.2.1 Geostatistical Output Pertubation . . . . . . . . . . . . . . . . . . 23

2.2.2 Ensemble Model Output Statistics Espacial . . . . . . . . . . . . . 24

x

2.3 Metodos de Calibracao Espaco-temporais . . . . . . . . . . . . . . . . . . 25

2.3.1 Geostatistical Output Pertubation Dinamico . . . . . . . . . . . . 26

2.3.2 Ensemble Model Output Statistics Espaco-temporal . . . . . . . . 29

3 Aplicacao a Previsao da Velocidade do Vento em Minas Gerais 31

3.1 Descricao do Conjunto de Dados . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Selecao de Covariaveis e Definicoes dos Modelos . . . . . . . . . . . . . . 33

3.3 Modelos Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.4.1 Aplicacao: Diaria . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.4.2 Aplicacao: Horaria . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.4.3 Aplicacao: Interpolacao Espacial . . . . . . . . . . . . . . . . . . 58

3.5 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4 Consideracoes Finais e Trabalhos Futuros 65

Referencias Bibliograficas 68

A Outros Modelos de Pos-Processamento Estatıstico 76

A.1 Bayesian Model Average . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

A.2 Bayesian Model Average Espacial . . . . . . . . . . . . . . . . . . . . . . 77

B Criterios de Comparacao de Modelos 79

B.1 Raiz Quadrada do Erro Quadratico Medio . . . . . . . . . . . . . . . . . 79

B.2 Erro Absoluto Medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

B.3 Indice de Concordancia de Willmott . . . . . . . . . . . . . . . . . . . . . 79

B.4 Interval Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

C Distribuicoes Condicionais Completas 81

C.1 Vetor parametrico β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

C.2 Parametro φ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

C.3 Parametro λ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

C.4 Processo Espacial latente Zt(s) . . . . . . . . . . . . . . . . . . . . . . . 82

xi

C.5 Processo Espacial latente Ut(s) . . . . . . . . . . . . . . . . . . . . . . . 83

D Algoritmo Robusto-Adaptativo de Metropolis 84

E Modelos Dinamicos 86

E.1 Modelo Linear Dinamico . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

E.2 Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

E.3 Distribuicoes de Previsao . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

E.4 Fatores de Desconto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

E.5 Esquema de Amostragem para MLD . . . . . . . . . . . . . . . . . . . . 89

E.6 MLD com Covariancias Estocasticas e Aprendizado por Descontos . . . . 90

F Resultados Adicionais 93

G Simulacao dos Modelos Propostos 103

G.1 Scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

G.2 Graficos de Simulacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

xii

Lista de Figuras

1.1 Localizacoes das estacoes de monitoramento meteorologico em Minas

Gerais e vizinhanca. Triangulos solidos representam as estacoes.

Linhas contınuas representam a grade discreta utilizada pelo modelo de

mesoescala Eta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Representacao da interpolacao bilinear feita na grade discreta com celulas

15km × 15km utilizada pelo modelo Eta para obtencao de previsoes

numericas nos locais de observacao. . . . . . . . . . . . . . . . . . . . . . 3

1.3 Serie temporal da velocidade do vento a 10 metros de altura ao longo das

estacoes do ano iniciado as 12 UTC. . . . . . . . . . . . . . . . . . . . . . 5

1.4 FAC da velocidade do vento a 10 metros de altura ao longo das estacoes

do ano iniciado as 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.5 Histograma da velocidade do vento a 10 metros de altura ao longo das

estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.6 Distribuicao espacial de previsoes da refletividade (em dBZ) durante a

passagem do Furacao Gustav. Oceano Atlantico, 2008. . . . . . . . . . . 8

1.7 Exemplos de grade horizontal com diferentes resolucoes. . . . . . . . . . . 14

1.8 Representacao das trajetorias das previsoes numericas inicializadas com

distintas condicoes iniciais. Adaptado de Wilks (2006). . . . . . . . . . . 15

1.9 Organizacao dos membros do ensemble conforme sua classificacao: (a)

Defasados e (b) Tradicional. Adaptado de Warner (2010). . . . . . . . . . 15

xiii

1.10 Ensemble de previsoes para a rota do furacao Katrina. Inicializado em 26

de agosto de 2005, 00 UTC (a) e 12 UTC (b). Adaptado de Leutbecher e

Palmer (2008). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.11 Diagrama do processo de calibracao para ensemble de previsoes da

temperatura de superfıcie. Adaptado de Warner (2010). . . . . . . . . . . 19

1.12 Representacao da topografia pela coordenada vertical eta (η). Adaptado

de Mesinger et al. (1988). . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.1 Diagrama de dispersao relacionando distintos membros do ensemble de

previsoes numericas da velocidade do vento a 10 m em 01 de abril de 2016,

12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2 Criterios de comparacao de modelos na aplicacao diaria ao longo das

estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.3 Criterios de comparacao de modelos na aplicacao diaria ao longo das

estacoes do ano para os modelos propostos. . . . . . . . . . . . . . . . . . 44

3.4 Interval Score na aplicacao diaria ao longo das estacoes do ano. . . . . . 45

3.5 Media a posteriori e intervalos de credibilidade de 95% para o vetor

parametrico estatico do modelo EMOS espaco-temporal na aplicacao

diaria ao longo das estacoes do ano. . . . . . . . . . . . . . . . . . . . . . 47

3.6 Diagrama de dispersao com valores previstos versus observados na

aplicacao diaria para 18 a 21 de janeiro de 2016, 12 UTC. . . . . . . . . . 48

3.7 Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura

em janeiro de 2016, 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.8 Diagrama de dispersao com valores previstos versus observados na

aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. . . . . . . . . 49

3.9 Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura

em outubro de 2016, 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . 50

3.10 Criterios de comparacao de modelos na aplicacao horaria ao longo das

estacoes do ano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

xiv

3.11 Criterios de comparacao de modelos na aplicacao horaria ao longo das

estacoes do ano para os modelos propostos. . . . . . . . . . . . . . . . . . 52

3.12 Interval Score na aplicacao horaria ao longo das estacoes do ano. . . . . . 53

3.13 Mediana a posteriori e intervalos de credibilidade de 95% para o vetor

parametrico estatico do modelo EMOS espaco-temporal na aplicacao

horaria ao longo das estacoes do ano. . . . . . . . . . . . . . . . . . . . . 54

3.14 Diagrama de dispersao com valores previstos versus observados na

aplicacao horaria de 20 de julho de 2016, 13 UTC a 21 de julho de 2016,

12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.15 Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura

de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC. . . . . . 56

3.16 Diagrama de dispersao com valores previstos versus observados na

aplicacao horaria de 20 de agosto de 2016, 13 UTC a 21 de agosto de

2016, 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.17 Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura

de 20 de agosto de 2016, 13 UTC a 21 de agosto de 2016, 12 UTC. . . . . 57

3.18 Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura

de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC obtidos a

partir da interpolacao espacial. Estacoes de monitoramento A505, A517,

A550 e A560 fora da amostra. . . . . . . . . . . . . . . . . . . . . . . . . 59

3.19 Previsoes 6, 12, 18 e 24 horas a frente para a velocidade do vento a 10 m de

altura para o Estado de Minas Gerais. PN: Previsao numerica proveniente

do modelo Eta. PP: Previsao pontual calibrada proveniente do ajuste do

modelo GOP dinamico. ME: Margem de erro, definida como metade do

comprimento do intervalo de credibilidade 95% da previsao probabilıstica. 61

3.20 Mapa contendo a localizacao das regioes enumeradas. . . . . . . . . . . . 62

F.1 Cadeias MCMC para os parametro estaticos do modelo EMOS espacial na

aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha tracejada

vertical representa o perıodo de aquecimento. . . . . . . . . . . . . . . . 93

xv

F.2 Cadeias MCMC para os parametro estaticos do modelo EMOS espaco-

temporal na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC.

Linha tracejada vertical representa o perıodo de aquecimento. . . . . . . 94

F.3 Cadeias MCMC para os parametro estaticos do modelo GOP dinamico na

aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha tracejada

vertical representa o perıodo de aquecimento. . . . . . . . . . . . . . . . 94

F.4 Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espacial na aplicacao diaria para 18 a 21 de outubro de 2016, 12

UTC. Linha tracejada representa a distribuicao a priori. Area sombreada

representa o intervalo de credibilidade de 95%. . . . . . . . . . . . . . . . 95

F.5 Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espaco-temporal na aplicacao diaria para 18 a 21 de outubro de

2016, 12 UTC. Linha tracejada representa a distribuicao a priori. Area

sombreada representa o intervalo de credibilidade de 95%. . . . . . . . . 95

F.6 Trajetoria a posteriori estimada para os parametros dinamicos do modelo

EMOS espaco-temporal na aplicacao diaria para 18 a 21 de outubro de

2016, 12 UTC. Linha contınua representa a media a posteriori. Area

sombreada representa o intervalo de credibilidade de 95%. . . . . . . . . 96

F.7 Distribuicao a posteriori estimada para os parametros estaticos do modelo

GOP dinamico na aplicacao diaria para 18 a 21 de outubro de 2016, 12

UTC. Linha tracejada representa a distribuicao a priori. Area sombreada

representa o intervalo de credibilidade de 95%. . . . . . . . . . . . . . . . 96

F.8 Trajetoria a posteriori estimada para os parametros dinamicos do modelo

GOP dinamico na aplicacao diaria para 18 a 21 de outubro de 2016, 12

UTC. Linha contınua representa a media a posteriori. Area sombreada

representa o intervalo de credibilidade de 95%. . . . . . . . . . . . . . . . 97

F.9 Cadeias MCMC para os parametro estaticos do modelo EMOS espacial na

aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de outubro,

12 UTC. Linha tracejada vertical representa o perıodo de aquecimento. . 98

xvi

F.10 Cadeias MCMC para os parametro estaticos do modelo EMOS espaco-

temporal na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a

21 de outubro, 12 UTC. Linha tracejada vertical representa o perıodo de

aquecimento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

F.11 Cadeias MCMC para os parametro estaticos do modelo GOP dinamico na

aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de outubro,

12 UTC. Linha tracejada vertical representa o perıodo de aquecimento. . 99

F.12 Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espacial na aplicacao horaria para 20 de de outubro de 2016, 13

UTC a 21 de outubro, 12 UTC. Linha tracejada representa a distribuicao

a priori. Area sombreada representa o intervalo de credibilidade de 95%. 100

F.13 Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espaco-temporal na aplicacao horaria para 20 de de outubro de

2016, 13 UTC a 21 de outubro, 12 UTC. Linha tracejada representa

a distribuicao a priori. Area sombreada representa o intervalo de

credibilidade de 95%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

F.14 Trajetoria a posteriori estimada para os parametros dinamicos do modelo

EMOS espaco-temporal na aplicacao horaria para 20 de de outubro de

2016, 13 UTC a 21 de outubro, 12 UTC. Linha contınua representa a

media a posteriori. Area sombreada representa o intervalo de credibilidade

de 95%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

F.15 Distribuicao a posteriori estimada para os parametros estaticos do modelo

GOP dinamico na aplicacao horaria para 20 de de outubro de 2016, 13

UTC a 21 de outubro, 12 UTC. Linha tracejada representa a distribuicao

a priori. Area sombreada representa o intervalo de credibilidade de 95%. 101

F.16 Trajetoria a posteriori estimada para os parametros dinamicos do modelo

GOP dinamico na aplicacao horaria para 20 de de outubro de 2016, 13

UTC a 21 de outubro, 12 UTC. Linha contınua representa a media a

posteriori. Area sombreada representa o intervalo de credibilidade de 95%. 102

xvii

G.1 Tracos das cadeias MCMC dos parametros estaticos (simulados) do modelo

GOP dinamico. Linha vermelha representa o valor verdadeiro. . . . . . . 103

G.2 Distribuicao a posteriori estimada para os parametros estaticos

(simulados) do modelo GOP dinamico. Linha vermelha representa o

valor verdadeiro. Linha tracejada representa a distribuicao a priori e

linha contınua, a distribuicao a posteriori. Area sombreada representa

o intervalo de credibilidade de 95%. . . . . . . . . . . . . . . . . . . . . . 104

G.3 Trajetoria a posteriori estimada para os parametros dinamicos (simulados)

do modelo GOP dinamico. Linha vermelha representa o valor verdadeiro.

Linha tracejada representa a media a posteriori. Area sombreada

representa o intervalo de credibilidade de 95%. . . . . . . . . . . . . . . . 104

G.4 Tracos das cadeias MCMC dos parametros estaticos (simulados) do modelo

EMOS espaco-temporal. Linha vermelha representa o valor verdadeiro. . 105

G.5 Distribuicao a posteriori estimada para os parametros estaticos

(simulados) do modelo EMOS espaco-temporal. Linha vermelha

representa o valor verdadeiro. Linha tracejada representa a distribuicao

a priori e linha contınua, a distribuicao a posteriori. Area sombreada

representa o intervalo de credibilidade de 95%. . . . . . . . . . . . . . . . 106

G.6 Trajetoria a posteriori estimada para os parametros dinamicos (simulados)

do modelo EMOS espaco-temporal. Linha vermelha representa o valor

verdadeiro. Linha tracejada representa a trajetoria estimada. Area

sombreada representa o intervalo de credibilidade de 95%. . . . . . . . . 107

xviii

Lista de Tabelas

3.1 Configuracao dos membros do ensemble para previsoes 24 horas a frente

as 12 UTC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2 Relacao dos criterios de comparacao de modelos para diferentes blocos de

covariaveis e horizontes obtidos nas previsoes realizadas na aplicacao piloto. 36

3.3 Informacoes acerca das cadeias MCMC para os modelos propostos em

diferentes aplicacoes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.4 Tempo medio consumido (em minutos) para aplicacao dos modelos

propostos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

xix

Capıtulo 1

Motivacao e Introducao

As previsoes numericas do modelo de mesoescala Eta (Mesinger et al., 1988; Black,

1994) sao uteis para a previsao de fenomenos climaticos no Brasil. Esses sistemas sao

solucionados em uma grade discreta, i.e., apresentam previsoes uniformes para toda regiao

pertencente a mesma celula desta grade. Como cada previsao e obtida com base em dados

medios da regiao (e.g. altitude media e vegetacao predominante), a representatividade

das previsoes em locais com orografia1 complexa e vegetacao densa se torna deficiente

devido as diferencas nas caracterısticas reais da superfıcie com a homogeneizacao feita

por este modelo. Dessa forma, previsoes geradas pelo modelo Eta podem nao ser

representativas em um local especıfico (Chou et al., 2007).

Para produzir previsoes em pontos distintos, minimizando estas e outras limitacoes

que este tipo de modelo esta sistematicamente submetido, tecnicas de pos-processamento

estatıstico sao apropriadas e auxiliam na melhor acuracia das estimativas num contexto

probabilıstico (Glahn e Lowry, 1972).

Especificamente, a metodologia proposta neste trabalho tem como principal objetivo

corrigir potenciais diferencas verificadas entre valores medidos e previsoes numericas da

velocidade do vento no Estado de Minas Gerais de dezembro de 2015 a novembro de

2016.

1Orografia e a descricao das nuances do relevo de uma regiao.

1

1.1 Previsao Numerica em Minas Gerais

Minas Gerais situa-se na regiao Sudeste do Brasil, sendo inteiramente formado por

planaltos. O relevo acidentado confere ao Estado um recurso hıdrico privilegiado,

abrigando grandes potenciais hidreletricos. A vegetacao predominante e a do Cerrado

consistindo em grandes variacoes na paisagem entre as estacoes chuvosa e seca, resultando

uma influencia sazonal da rugosidade aerodinamica do terreno2 no deslocamento dos

ventos. Toda a porcao leste do Estado e coberta pela Mata Atlantica, sendo a vegetacao

permanentemente verde e densa (Minas Gerais, 2018).

O clima em Minas Gerais varia desde o quente semiarido ate o mesotermico umido.

De maneira geral, a distribuicao das chuvas em Minas Gerais e desigual com o norte

apresentando longos perıodos de estiagem. Nas areas de maior altitude do sul, o regime

pluviometrico e mais intenso. A sazonalizade tambem exerce influencia nas temperaturas,

onde predominantemente as maiores medias ocorrem no verao. Periodicamente, na maior

parte do territorio mineiro, predominam ventos mais intensos no inverno e na primavera

(Amarante et al., 2010).

Ao longo de Minas Gerais e seu entorno, ha 59 estacoes de monitoramento

meteorologico, onde sao recolhidas, de hora em hora, informacoes instantaneas sobre

a velocidade do vento a 10 metros de altura, umidade relativa do ar, temperatura

de superfıcie, pressao atmosferica e precipitacao, distribuıdas conforme a Figura 1.1.

Devido a irregularidade do espacamento das estacoes meteorologicas e a grade discreta

consideravelmente fina, as previsoes numericas para os locais de observacao sao obtidas,

usualmente, por meio de interpolacao bilinear. Metodos de interpolacao mais complexos

podem ser aplicados, no entanto, e pouco provavel que haja ganhos consideraveis (Gel

et al., 2004). A Figura 1.2 ilustra esta interpolacao para previsoes numericas da

velocidade do vento a 10 metros de altura em Minas Gerais.

Assim, ha a possibilidade de analisar o erro pontual destas previsoes, principalmente

em locais que sao afetados por aspectos de posicionamento geografico (e.g. latitude,

2A rugosidade aerodinamica do terreno e a altitude em que a velocidade do vento cai a zero com base

na extrapolacao do perfil de vento neutro (Barry e Chorley, 2009).

2

Figura 1.1: Localizacoes das estacoes de monitoramento meteorologico em Minas Gerais

e vizinhanca. Triangulos solidos representam as estacoes. Linhas contınuas representam

a grade discreta utilizada pelo modelo de mesoescala Eta.

(a) Previsao Numerica (b) Interpolacao Bilinear

Figura 1.2: Representacao da interpolacao bilinear feita na grade discreta com celulas

15km × 15km utilizada pelo modelo Eta para obtencao de previsoes numericas nos locais

de observacao.

longitude e altitude), de proximidade com corpos d’agua e de vegetacao regional. Pode-

se citar algumas estacoes com estas caracterısticas como a estacao meteorologica A507

3

– Uberlandia, pertencente a regiao do Triangulo Mineiro localizada na parte oeste do

Estado, a qual possui majoritariamente vegetacao de cerrado, A530 – Caldas, localizado

ao sul do Estado, no qual ha grande quantidade de registros de velocidade do vento

baixas, A537 – Diamantina, localizada na regiao central, possuindo a maior altitude

(1359 metros) com relacao ao nıvel do mar dentre todas as estacoes; A543 – Espinosa,

localizada no extremo norte, fazendo fronteira com o Estado da Bahia, onde registra-se

maiores medias da velocidade do vento comparado a Minas Gerais e inclusive, contem

instalacoes de parques eolicos; e A547 – Sao Romao, localizada proximo as margens do

Rio Sao Francisco, o qual forma um corredor canalizando o vento. As possıveis influencias

sazonais tambem sao relevantes e entao, a Figura 1.3 ilustra a serie temporal da velocidade

do vento a 10 metros e de suas respectivas previsoes numericas ao longo da estacoes do

ano.

E possıvel observar que nao ha um padrao seguido pelas diferentes localidades.

Estacoes meteorologicas como A507 e A547 apresentam medias maiores durante a

primavera. Para as mesmas estacoes durante o outono, ocorre o menor erro medio das

previsoes numericas, no entanto, para A543, a periodicidade da previsao ao longo de um

dia aparenta inversao. Em ordem de visualizar este padrao periodico existente, a Figura

1.3 ilustra a funcao de autocorrelacao (FAC) para a serie temporal das mesmas estacoes

exibidas previamente.

Ha padroes periodicos bem definidos durante algumas estacoes do ano. As estacoes

A537, A543 e A547 nao registraram este padrao durante a primavera, diferentemente de

A507 e A530. Estes padroes periodicos sao efeitos sazonais devido ao forcamento solar

o qual, tem influencia direta na velocidade do vento. Uma melhor abordagem sobre as

consequencias desta atuacao no comportamento e nas previsoes da velocidade do vento

sera dada na Secao 1.2.5.

Majoritariamente em Minas Gerais, as previsoes numericas do modelo de mesoescala

Eta sobrestimam a velocidade do vento a 10 metros. Uma grande limitacao destas e a

ausencia de previsoes com velocidades baixas e iguais a zero, mesmo sendo observada

uma grande proporcao destes casos, como e evidenciado na Figura 1.5 que apresenta os

histogramas da velocidade do vento a 10 metros de altura para as estacoes meteorologicas

4

(a) A507 - Verao (b) A507 - Outono (c) A507 - Inverno (d) A507 - Primavera

(e) A530 - Verao (f) A530 - Outono (g) A530 - Inverno (h) A530 - Primavera

(i) A537 - Verao (j) A537 - Outono (k) A537 - Inverno (l) A537 - Primavera

(m) A543 - Verao (n) A543 - Outono (o) A543 - Inverno (p) A543 - Primavera

(q) A547 - Verao (r) A547 - Outono (s) A547 - Inverno (t) A547 - Primavera

Figura 1.3: Serie temporal da velocidade do vento a 10 metros de altura ao longo das

estacoes do ano iniciado as 12 UTC.

A517 – Muriae, A549 – Aguas Vermelhas, A557 – Coronel Pacheco e F501 – Belo

Horizonte (Cercadinho). Esta ultima destoa significativamente das demais, apresentando

medias mais elevadas. De forma geral, a distribuicao da velocidade do vento a 10 metros

5

(a) A507 - Verao (b) A507 - Outono (c) A507 - Inverno (d) A507 - Primavera

(e) A530 - Verao (f) A530 - Outono (g) A530 - Inverno (h) A530 - Primavera

(i) A537 - Verao (j) A537 - Outono (k) A537 - Inverno (l) A537 - Primavera

(m) A543 - Verao (n) A543 - Outono (o) A543 - Inverno (p) A543 - Primavera

(q) A547 - Verao (r) A547 - Outono (s) A547 - Inverno (t) A547 - Primavera

Figura 1.4: FAC da velocidade do vento a 10 metros de altura ao longo das estacoes do

ano iniciado as 12 UTC.

em Minas Gerais e assimetrica com grande variabilidade possuindo ponto de massa em

0 e atingindo velocidade maxima de 12 m/s.

6

(a) A517 - Verao (b) A517 - Outono (c) A517 - Inverno (d) A517 - Primavera

(e) A549 - Verao (f) A549 - Outono (g) A549 - Inverno (h) A549 - Primavera

(i) A557 - Verao (j) A557 - Outono (k) A557 - Inverno (l) A557 - Primavera

(m) F501 - Verao (n) F501 - Outono (o) F501 - Inverno (p) F501 - Primavera

Figura 1.5: Histograma da velocidade do vento a 10 metros de altura ao longo das estacoes

do ano.

Com a breve descricao dos erros e limitacoes das previsoes numericas, considera-se

a calibracao destas por meio de modelos estatısticos e portanto, o principal objetivo

deste trabalho e propor modelos de pos-processamento estatıstico considerando dinamica

espaco-temporal para a distribuicao assimetrica da velocidade do vento a 10 metros em

Minas Gerais de forma que minimize o erro sistematico das previsoes numericas do modelo

de mesoescala Eta devido as suas limitacoes intrınsecas.

7

A seguir, uma visao geral de aspectos importantes no contexto da previsao numerica

de fenomenos meteorologicos como aplicacoes, pos-processamento e informacoes acerca

do modelo Eta sera fornecida.

1.2 Previsao Numerica do Tempo3

Previsoes numericas de variaveis climaticas sao baseadas em modelos matematicos que

fazem previsoes determinısticas com base nas condicoes atmosfericas correntes. Baseada

na teoria da dinamica dos fluidos, essas variaveis climaticas podem ser vistas como

um sistema de equacoes diferenciais que nao possuem solucao analıtica e utilizam-se

da integracao numerica para simular processos fısicos, dinamicos e termodinamicos da

atmosfera dependendo de suas condicoes correntes, sendo possıvel a solucao do sistema

para qualquer instante de tempo posterior (Krishnamurti, 1995). Na Figura 1.6 e

ilustrada a forma fluida como a atmosfera se comporta.

Figura 1.6: Distribuicao espacial de previsoes da refletividade (em dBZ) durante a

passagem do Furacao Gustav. Oceano Atlantico, 2008.

1.2.1 Historia

No inıcio do seculo XX, o meteorologista noruegues Vilhelm Bjerknes propos que

a previsao do tempo poderia ser baseada nas leis da fısica e entao, desenvolveu um

conjunto de equacoes, conhecidas como equacoes primitivas, cuja solucao, a princıpio,

previa movimentos atmosfericos em grande escala.

3Historicamente, a expressao “previsao numerica do tempo” foi utilizada para descrever todas as

atividades envolvendo a simulacao numerica de processos atmosfericos.

8

Em 1922, o matematico ingles Lewis Fry Richardson desenvolveu um metodo

diferente para analisar as equacoes, simplificando-as antes de resolve-las numericamente

(Richardson, 1922), sendo este o primeiro sistema de previsao numerica de variaveis

climaticas. No entanto, somente na decada de 1950, com o advento da computacao

e pleno funcionamento do Computador Integrador Numerico Eletronico (ENIAC),

primeiro computador digital eletronico de grande escala, surgiram resultados efetivos

de previsoes meteorologicas computadorizadas sob idealizacao do matematico hungaro,

naturalizado estadunidense, John von Neummann (Charney et al., 1950). Inicialmente,

von Neummann, sob dias de pos-Segunda Guerra Mundial (1939 – 1945), acreditava

que essa modelagem pudesse levar ao conhecimento antecipado de fenomenos climaticos,

podendo ser usada como arma de guerra contra a, entao, Uniao Sovietica (URSS) (Kwa,

2001).

1.2.2 Aplicacoes

Alem de aplicacoes militares, ha uma gama de modelos numericos de previsao

meteorologica que possuem distintas aplicacoes ambientais, epidemiologicas, agrarias,

na seguridade dos meios de transportes e nas industrias de geracao de energia.

Detalhadamente, algumas delas sao:

1. Altura das ondas: A direcao e a velocidade do vento pode influenciar a altura das

ondas formadas nos oceanos e em outros corpos d’agua (Bidlot et al., 2002).

– Atividades marıtimas: A altura das ondas impacta a seguranca das atividades

marıtimas recreativas e comerciais e, portanto, devem ser previstas. Tambem

e desejavel se calcular a probabilidade de ocorrencias de vagalhoes4.

– Energia maremotriz: A acao das ondas nas zonas litorais pode ser usada para

gerar eletricidade e, portanto, as previsoes de ondas estao relacionadas as

previsoes de energia maremotriz.

4Vagalhoes sao grandes ondas que se formam repentinamente em alto-mar.

9

2. Doencas Infecciosas: A atmosfera pode influenciar a propagacao de doencas

infecciosas humanas e agrıcolas (Thomson et al., 2000).

– Saude dos patogenos: A saude dos organismos que transmitem doencas

pode estar relacionada a variaveis atmosfericas, como temperatura, umidade

relativa, intensidade da radiacao ultravioleta e precipitacao.

– Vetores de doencas: Doencas podem se espalhar atraves de vetores, como

pulgas, mosquitos ou roedores, e a quantidade e vitalidade dos vetores podem

depender da temperatura, umidade relativa, verdor da vegetacao e umidade

do solo.

– Comportamento animal: O comportamento animal esta relacionado as

condicoes atmosfericas (e.g. para humanos, a quantidade de tempo gasto

em interiores na proximidade de outras pessoas devido a baixas temperaturas

externas), podendo influenciar a propagacao de doencas.

– Transporte eolico: O vento pode transportar vetores de doencas e expor novas

populacoes.

– Inundacoes: Pode aumentar a incidencia de diversas doencas como resultado

do comprometimento do abastecimento de agua doce, migracao forcada e a

producao de um ambiente favoravel para vetores de doencas.

3. Seguranca e eficiencia do transporte: Operacoes em aeroportos, roteamento de

aeronaves pelos controladores de trafego aereo e as decisoes tomadas pelos pilotos,

bem como o trafego rodoviario e ferroviario sao afetados pelas condicoes climaticas

(Sharman et al., 2006).

– Turbulencia: Resulta de uma variedade de situacoes meteorologicas, como

conveccao e cisalhamento do vento, afetando a seguranca na aviacao.

– Formacao de gelo em aeronaves: A crosta de gelo formada em aeronaves sao

causas significativas de acidentes e possui relacao com a umidade relativa,

temperatura na altura de voo e velocidade vertical do vento.

10

– Visibilidade: A capacidade do aeroporto, em termos de espacamento mınimo

das aeronaves na aproximacao e partida, e geralmente uma funcao da

visibilidade prevalecente a qual, depende da precipitacao e umidade relativa

local. Alem disso, e importante para o fechamento de autoestradas quando

nao ha condicoes mınimas de direcao segura, evitando potenciais acidentes.

– Logıstica de precaucao: Implantacao de equipamentos de remocao de neve

antes de uma tempestade de inverno, evacuacao do publico antes de um

furacao, estimar regioes em que as linhas ferroviarias e rodovias inundarao

como resultado de fortes precipitacoes e pre-posicionamento de mao de obra

qualificada para reparos apos alguma catastrofe natural, como tempestades,

furacoes e maremotos.

4. Agricultura: Eventos climaticos podem influenciar o desempenho e vida util de

colheitas (Mera et al., 2006).

– Plantacao e colheita: Requer condicoes secas e o planejamento necessario e

baseado em previsoes meteorologicas entre 12 a 72 horas. O uso de modelos

adequados de solo, juntamente com modelos de predicao atmosferica, pode

permitir o diagnostico de trafego terrestre por maquinas agrıcolas.

– Aplicacao de pesticidas: Sistemas integrados de manejo de pragas exigem que

os produtos quımicos sejam aplicados um numero especıfico de horas antes da

precipitacao e em temperaturas e umidades apropriadas. Condicoes de vento

fraco tambem permitem uma aplicacao mais precisa.

– Aplicacao de herbicidas: Herbicidas nao devem ser deixados a deriva com o

vento em areas em que ocorrerao danos nao intencionais a vegetacao.

– Aplicacao de fertilizantes: Fertilizantes quımicos ou naturais nao devem ser

aplicados com grande antecedencia da precipitacao pois, o fertilizante pode

escoar para vias navegaveis, contaminando-as com produtos quımicos.

11

– Movimento de insetos: Insetos que podem prejudicar as culturas sao

transportados pelos ventos de suas areas de reproducao para areas agrıcolas e

previsoes dos padroes climaticos podem permitir a avaliacao deste risco.

– Selecao de colheita: Para areas agrıcolas as quais, a agua de irrigacao nao

esta disponıvel, as culturas podem ser selecionadas para plantacao que serao

apropriadas para as condicoes climaticas que se esperam durante a estacao de

crescimento.

5. Aplicacoes Militares: Alem das utilidades semelhantes as citadas, algumas

atividades especıficas requerem a tomada de decisao antecipada com relacao a

variaveis climaticas (Liu et al., 2008).

– Trafego terrestre de veıculos militares: Veıculos pesados tem dificuldade em

operar em solos umidos. Tipos especiais de modelos de superfıcie terrestre,

denominados modelos de trafego de solo, empregam analises e previsoes de

variaveis meteorologicas que afetam a umidade do substrato (precipitacao,

temperatura, velocidade do vento e umidade) e sao usados para estimar a

capacidade do substrato para suportar diferentes tipos de veıculos.

– Trajetorias de mısseis guiados e nao guiados: Os ventos, a turbulencia e a

densidade do ar afetam a trajetoria dos mısseis. O impacto aerodinamico das

condicoes meteorologicas observadas e modeladas nas trajetorias e calculado

usando um modelo de trajetoria.

6. Industria de energia: A logıstica para abertura de comportas em usinas

hidreletricas, a venda de energia eolica no mercado energetico e a avaliacao do

potencial impacto a saude publica de lancamentos de gases na atmosfera pelas

instalacoes nucleares dependem de previsoes meteorologicas com boa acuracia

(Landberg et al., 2003).

– Demanda energetica: Como os provedores de energia eletrica se beneficiam

com a capacidade de antecipar a demanda de energia gerada por diferentes

12

fontes (e.g. hidreletrica, eolica e solar), usam modelos para estimar

a quantidade de muitos fatores governamentais meteorologicos e nao

meteorologicos. As variaveis meteorologicas relevantes sao a nebulosidade,

velocidade do vento, precipitacao, temperatura e a umidade.

– Avaliacao de recursos de energia eolica: A prospeccao dos recursos

de energia eolica envolve a geracao de reanalises do clima proximo a

superfıcie. Os resultados permitem que os desenvolvedores de parques

eolicos determinem onde a instalacao de turbinas seria economicamente bem-

sucedida. Idealmente, reanalises regionais de alta resolucao sao desejaveis,

pois a velocidade do vento de baixa altitude varia muito devido as

diferencas na paisagem, no entanto, sao demasiadamente custosas em termos

computacionais.

– Previsao de energia eolica: A energia eolica disponıvel e uma funcao da

velocidade do vento, em geral, em alturas entre 80 e 100 metros, nos parques

eolicos onde os aerogeradores estao instalados. Portanto, as estimativas de

energia futura requerem previsoes de velocidade do vento nestas alturas. A

velocidade de previsao do vento e traduzida para a producao de energia usando

um algoritmo baseado no numero de turbinas que operam no parque, a mistura

de seus tipos e a eficiencia de cada. Sao necessarias previsoes de producao de

energia eolica para equilibrar a carga entre as varias fontes disponıveis, como

termoeletricas, hidreletricas, solares e nucleares. A medida que a energia eolica

possui maior porcentagem na fonte de energia total, as previsoes do modelo

devem tornar-se cada vez mais precisas para evitar apagoes (ou blecautes)

quando a velocidade do vento diminui inesperadamente e impedir o desperdıcio

de combustıveis fosseis, liberando gases de efeito estufa desnecessariamente,

quando a velocidade do vento aumenta abruptamente. Devido ao carater

sinotico dos modelos numericos, ha um desafio de produzir previsoes acuradas

para essas localizacoes pois, locais vantajosos para parques eolicos estao em

terrenos complexos e zonas litoraneas.

13

1.2.3 Classificacao dos modelos

Operacionalmente, sistemas de previsoes numericas meteorologicas sao solucionados

em uma grade discreta. A Figura 1.7 ilustra diferentes resolucoes de grade, demonstrando

as potenciais diferencas que a amplitude de suas celulas causa nas previsoes.

Figura 1.7: Exemplos de grade horizontal com diferentes resolucoes.

Conforme a extensao de seu domınio espacial de previsao, os modelos numericos

podem ser classificados como globais, quando descrevem a atmosfera em escala global,

identificando fenomenos meteorologicos de escala sinotica (e.g. trajetoria de ciclones,

tornados e furacoes) ou modelos de mesoescala, quando possuem escalas regionais,

permitindo a analise de fenomenos meteorologicos de mesoescala (e.g. brisas marıtimas

e terrestres).

Dada a natureza caotica da atmosfera, os modelos numericos podem apresentar

distorcoes em suas previsoes devido a anomalias captadas nas condicoes iniciais

necessarias para a solucao de seus sistemas de equacoes. A Figura 1.8 esquematiza a

potencial mudanca na trajetoria das previsoes numericas empregando distintas condicoes

iniciais (Wilks, 2006).

1.2.4 Ensembles

Como previsoes unicas nao descrevem completamente o fenomeno, considera-se a

producao de ensembles (ou conjuntos) de previsoes. O ensemble pode ser interpretado

como uma forma de analise de Monte Carlo, visando uma gama de possıveis estados

14

Figura 1.8: Representacao das trajetorias das previsoes numericas inicializadas com

distintas condicoes iniciais. Adaptado de Wilks (2006).

futuros da atmosfera, a partir de diferentes estados atmosfericos iniciais. Multiplas

simulacoes sao realizadas com objetivo de minimizar incertezas nas previsoes (Epstein,

1969). Os ensembles sao classificados como defasados, quando previsoes sao feitas ate

determinado horizonte e se sobrepoem conforme o regime de funcionamento do modelo,

ilustrado intuitivamente na Figura 1.9(a) e tradicionais, quando utilizam condicoes

iniciais ou suposicoes distintas para uma mesma solucao do sistema, ilustrado na Figura

1.9(b).

(a) (b)

Figura 1.9: Organizacao dos membros do ensemble conforme sua classificacao: (a)

Defasados e (b) Tradicional. Adaptado de Warner (2010).

Ensembles sao mais proficientes do que previsoes individuais pois, a media de seus

membros e, geralmente, mais precisa do que uma previsao singular. A dispersao entre

15

seus membros pode indicar maior incerteza associada a previsao pontual. A distribuicao

de frequencia empırica formada fornece informacoes sobre eventos extremos (Grimit e

Mass, 2007). O realismo da dispersao dependera de quao bem as fontes de incerteza

estao sendo representadas pelo modelo. Um exemplo da variabilidade da dispersao e

apresentado na Figura 1.10 que equipara dois ensembles consecutivos para a rota do

furacao Katrina. O ensemble inicializado em 26 de agosto de 2005, 00 UTC exibe uma

grande dispersao a qual, e substancialmente reduzida no ensemble inicializado doze horas

mais tarde. A verdadeira trajetoria do furacao foi proxima a media do ensemble mais

recente.

(a) (b)

Figura 1.10: Ensemble de previsoes para a rota do furacao Katrina. Inicializado em 26

de agosto de 2005, 00 UTC (a) e 12 UTC (b). Adaptado de Leutbecher e Palmer (2008).

1.2.5 Fontes de incerteza

De acordo com Warner (2010), ha uma variedade de fontes conhecidas de erros que

acometem as previsoes dos modelos numericos, brevemente, pode-se citar:

– Incerteza sobre as condicoes iniciais: Ma calibracao e localizacao inadequada

dos instrumentos, pouca representatividade da regiao e condicoes atmosfericas

anomalas implicam em variacoes nas previsoes.

– Incerteza sobre a superfıcie: Depressoes e corpos d’agua sao sub-representados

devido a homogeneizacao da superfıcie feita pelo sistema.

16

– Incerteza nos algoritmos numericos: As equacoes diferenciais que compoem o

sistema sao solucionadas a partir de aproximacoes lineares e consequentemente,

ha erros de truncamento.

– Incerteza na parametrizacao dos processos fısicos e dinamicos: A dinamica

atmosferica possui alta complexidade e fenomenos de pequena escala

sao representados indiretamente pois, elevariam demasiadamente o custo

computacional.

A existencia de variacao diurna e sazonal do forcamento solar na superfıcie e na atmosfera

da Terra impacta diretamente o comportamento de muitas variaveis previstas por esses

sistemas. Alem das fontes de erros sistematicos, existem aspectos naturais que podem

causar variacao na qualidade das previsoes. Sao eles:

– Variabilidade regional e climatologica: O padrao climatico de uma regiao

depende de sua localizacao geografica, orografia e a proximidade com o oceano.

Previsoes para regioes com padrao climatico inconstante requerem ferramentas mais

avancadas.

– Variabilidade sazonal: Pode haver queda de desempenho nas previsoes devido as

diferencas regionais existentes entre as estacoes do ano.

– Dependencia do regime climatico: Alguns fenomenos naturais (e.g. El Nino e La

Nina) causam anomalias no padrao climatico global, podendo ocasionar distorcoes

nas previsoes.

1.2.6 Aperfeicoamento dos modelos

Novos metodos de assimilacao de dados, atualizacao dos algoritmos numericos,

reparametrizacoes de processos fısicos e o aumento da resolucao da grade horizontal

fornecem melhorias aos sistemas de previsao numerica. No entanto, e uma tarefa ardua

representar fenomenos de pequenas escalas em modelos com carater sinotico. Aumentar

sua complexidade eleva demasiadamente os custos financeiros e computacionais para

17

a operacionalizacao desses sistemas e, ainda sim, com possibilidade de queda no

desempenho das previsoes devido a insercao de mais erros sistematicos (Kalnay, 2003).

Uma alternativa as melhorias diretamente feitas no modelo e o pos-processamento

estatıstico das previsoes numericas.

1.3 Pos-Processamento Estatıstico

O pos-processamento estatıstico, ou calibracao, das saıdas operacionais do modelo de

previsao numerica (i.e., ensembles) e util na remocao dos erros sistematicos presentes

e pode resultar em avancos equivalentes a melhorias elaboradas no modelo (Glahn e

Lowry, 1972). Relativamente menos dispendioso do que outras abordagens tradicionais de

melhoria (e.g. aumento da resolucao do modelo), esse refinamento deve ser implementado

como parte integrante do sistema de modelagem para aplicacoes operacionais (Warner,

2010). Historicamente, os metodos de pos-processamento estatısticos foram utilizados

para predizer variaveis que nao eram preditas explicitamente pelos modelos numericos

de baixa resolucao relacionando-as estatisticamente (Klein et al., 1959). Atualmente, com

os modelos bem desenvolvidos, o uso de algoritmos estatısticos e empregado como uma

forma de downscaling5 relacionando aspectos locais (e.g. orografia) para reduzir erros

sistematicos. Alguns dos principais bem estabelecidos metodos de pos-processamento

estatıstico serao apresentados e comentados no Capıtulo 2. A ilustracao do processo de

calibracao do ensemble de previsoes para temperatura de superfıcie se encontra na Figura

1.11, sendo esquematizada a remocao do erro sistematico (i.e., remocao do vies na media)

e o ajuste da dispersao (i.e., remocao do vies na variancia).

1.4 Modelo de Mesoescala Eta

O modelo de mesoescala Eta e um modelo numerico de area limitada desenvolvido

inicialmente na decada de 1970. Apos algumas modificacoes, entrou em operacao no

5Downscaling e o procedimento que faz inferencia sobre informacoes em alta resolucao a partir de

dados provenientes de baixas resolucoes.

18

Figura 1.11: Diagrama do processo de calibracao para ensemble de previsoes da

temperatura de superfıcie. Adaptado de Warner (2010).

Centro Americano de Previsao Ambiental (NCEP) durante a decada de 1980 (Black,

1994). A principal caracterıstica deste modelo e a introducao da coordenada vertical

eta (η), homonima ao modelo, visando a reducao dos erros nas derivadas horizontais

sobre relevos montanhosos (Mesinger et al., 1988). Desta maneira, o terreno passa a ser

representado sob a forma de degraus discretos, onde o topo coincide com a interface do

relevo. A Figura 1.12 ilustra essa discretizacao.

Figura 1.12: Representacao da topografia pela coordenada vertical eta (η). Adaptado de

Mesinger et al. (1988).

Operacionalmente, o modelo Eta vem sendo utilizado pelo Centro de Previsao de

Tempo Estudos Climaticos (CPTEC) do Instituto Nacional de Pesquisas Espaciais

(INPE) desde 1996 com o intuito de fornecer previsoes do tempo de curto a longo prazo

para o Brasil. Seu domınio engloba toda a America do Sul. Suas variaveis prognosticas

sao temperatura do ar, componentes zonal e meridional do vento, umidade especıfica e

19

pressao na superfıcie. A partir destas, sao derivadas as demais variaveis previstas pelo

modelo. Sua atual resolucao horizontal e de 5 km. O funcionamento do modelo ocorre

duas vezes ao dia (00 UTC e 12 UTC) disponibilizando saıdas a cada hora para um

horizonte de previsao de ate 72 horas (INPE/CPTEC, 2018). Os resultados operacionais

sao disponibilizados em http://previsaonumerica.cptec.inpe.br/eta05.

20

Capıtulo 2

Modelos de Pos-Processamento

Estatıstico

Os modelos descritos neste Capıtulo tem por objetivo comum minimizar os

erros sistematicos presentes nas previsoes numericas, como discutido no Capıtulo 1.

Basicamente, exploram padroes estatısticos nas relacoes entre observacoes e previsoes,

buscando melhor representatividade local.

A Secao 2.1 apresenta os precursores metodos univariados. Na Secao 2.2, as extensoes

espacias sao listadas. E por fim, a Secao 2.3 propoe novas extensoes espaco-temporais.

2.1 Metodos de Calibracao Univariados

Nesta secao serao apresentados os principais modelos de pos-processamento

estatıstico os quais, foram desenvolvidos para calibracao em localizacoes fixas, supondo

independencia entre estas, produzindo previsoes probabilısticas calibradas para as

mesmas em um horizonte pre-determinado, sem possibilidade de interpolacao espacial.

2.1.1 Model Output Statistics

A abordagem precursora de pos-processamento estatıstico e conhecida como o metodo

Model Output Statistics (MOS, Glahn e Lowry, 1972). Nesta abordagem, relaciona-

21

se estatisticamente as previsoes feitas pelo modelo com as observacoes correspondentes

de uma mesma variavel, a fim de quantificar os erros sistematicos para cada ponto de

observacao e corrigir futuras previsoes atraves de um modelo de regressao linear multipla

(Montgomery e Peck, 1982), dado por:

Y = θ0 + θ1F1 + ...+ θmFm + ε. (2.1)

Este modelo supoe uma relacao linear entre a variavel climatica de interesse Y a qual,

deseja-se minimizar o erro sistematico em sua previsao, com seu ensemble de m membros

F1, ..., Fm adicional de um termo de erro aleatorio ε para o qual, assume-se:

E(ε) = 0, V ar(ε) = σ2. (2.2)

Os metodos de inferencia para estimacao dos coeficientes da regressao θ0, ..., θm e do

parametro de variancia σ2 sao baseados no metodo dos mınimos quadrados e estao

descritos em Glahn e Lowry (1972).

Com o passar dos anos, a aplicacao de ensembles se tornou usual nas operacoes

e entao, o metodo MOS recebeu diversas versoes que diferem, em geral, no tamanho

do perıodo de treinamento (e.g. Updatable MOS (UMOS, Wilson e Vallee, 2002)), na

modelagem direta do erro de previsao (e.g. MOC (Mao et al., 1999)) e na distribuicao da

variavel resposta (e.g. Piani et al., 2010) por meio dos Modelos Lineares Generalizados

(MLG, Nelder e Baker, 1972). Uma das extensoes mais avancadas em termos estatısticos,

conforme discutido em Gneiting (2014), e o metodo Ensemble MOS, utilizado como base

para os modelos que serao propostos na Secao 2.3.

2.1.2 Ensemble Model Output Statistics

O metodo Ensemble MOS (EMOS, Gneiting et al., 2005), tambem conhecido como

modelo de regressao nao homogenea, e uma extensao do metodo MOS (Secao 2.1.1)

aplicavel a ensembles. A diferenca para o seu antecessor se encontra na incorporacao

da dispersao dos membros do ensemble ao coeficiente de variancia, em vista que, existe

uma relacao positiva entre a amplitude dessa dispersao com o erro absoluto de previsao.

Discussoes sobre essa relacao, conhecida na literatura como relacao dispersao-proficiencia

22

(spread-skill relationship), podem ser encontradas em Whitaker e Loughe (1998). Este

metodo utiliza o modelo de seu sucessor MOS descrito em (2.1) com o erro aleatorio ε

seguindo as seguintes suposicoes:

E(ε) = 0, V ar(ε) = σ2∗ = β0 + β1S

2, (2.3)

com S2 representando a variancia amostral dos membros do ensemble e o vetor

β = (β0, β1)′, coeficientes lineares nao negativos. Para a estimacao dos parametros

desconhecidos do metodo EMOS calibrando a temperatura de superfıcie e a pressao ao

nıvel do mar, Gneiting et al. (2005) supoem normalidade na distribuicao do erro aleatorio

e utilizam a minimizacao do escore probabilıstico de posto contınuo (CRPS, Matheson

e Winkler, 1976) que neste caso, pode ser obtido de forma analıtica. Mais aplicacoes

deste metodo para outros tipos de variaveis climaticas (e.g velocidade, rajada e direcao

do vento) supondo distintas distribuicoes de probabilidade para o erro aleatorio, podem

ser encontradas em Thorarinsdottir e Gneiting (2010), Thorarinsdottir e Johnson (2012)

e Schuhen et al. (2012), respectivamente.

2.2 Metodos de Calibracao Espaciais

Nesta secao serao apresentados as principais extensoes dos modelos de pos-

processamento estatıstico univariados as quais, foram desenvolvidas de forma que haja

interacao espacial da informacao, i.e., produzem previsoes probabilısticas calibradas para

campos meteorologicos com horizonte pre-determinado.

2.2.1 Geostatistical Output Pertubation

O metodo Geostatistical Output Pertubation (GOP, Gel et al., 2004) e uma extensao

do metodo MOS que considera a existencia de correlacao entre as medicoes de um

fenomeno meteorologico medido em diferentes localizacoes possibilitando previsoes para

campos meteorologicos. Foi o metodo de pos-processamento estatıstico pioneiro no

contexto espacial. Seja {Y (s), s ∈ S} um campo meteorologico aleatorio e Ys =

(y(s1), ..., y(sn))′ observacoes deste em um conjunto de n localizacoes pertencentes a S.

23

Considere m membros do ensemble para estas mesmas localizacoes, representados por

Fs1 = (F1(s1), ..., F1(sn))′ , ...,Fsm = (Fm(s1), ..., Fm(sn))′. A forma geral desse modelo e

dada por:

Ys = θ01n + θ1Fs1 + ...+ θmFsm + ε, (2.4)

com 1n representando um n-vetor completo por 1’s, θ = (θ0, ..., θm)′, o vetor parametrico

da regressao e ε = (ε(s1), ..., ε(sn))′, observacoes de um Processo Gaussiano {ε(s), s ∈ S},

com as seguintes suposicoes:

E(ε) = 0n, Cov(ε(si), ε(sj)) = Σi,j = σ2C(si, sj), i, j = 1, ..., n. (2.5)

com 0n representando um n-vetor completo por 0’s. As entradas de C(.) dependem de

uma estrutura de correlacao valida para Processos Espaciais (veja Cressie (1993)). Para

a estimacao dos parametros desconhecidos do modelo GOP calibrando a temperatura

de superfıcie, Gel et al. (2004) propoem um metodo de estimacao em tres estagios

que se aproxima de uma abordagem de maxima verossimilhanca completa. Os autores

indicam a estimacao dos parametros por uma abordagem totalmente Bayesiana devido as

previsoes numericas serem realizadas em uma grade discreta, enquanto que as observacoes

correspondem a locais irregularmente espacados, o chamado problema de mudanca de

suporte, e esta abordagem tem a vantagem de lidar explicitamente e de forma coerente

com tal adversidade. Para mais detalhes sobre mudanca de suporte, consulte Gelfand

et al. (2001).

Uma desvantagem desse metodo e o fato de que nao foi desenvolvido para uso de

ensembles como o EMOS. Extensoes naturais combinando estes metodos com o GOP

serao apresentadas na sequencia.

2.2.2 Ensemble Model Output Statistics Espacial

O metodo Ensemble Model Output Statistics espacial (EMOS espacial, Feldmann

et al., 2015), tambem conhecido como modelo de regressao espacial nao homogenea,

combina os metodos EMOS (Secao 2.1.2) e GOP (Secao 2.2.1). Este metodo utiliza o

24

mesmo modelo que o metodo GOP descrito em (2.4) com {ε(s), s ∈ S} sendo um Processo

Gaussiano com ε = (ε(s1), ..., ε(sn))′ seguindo as seguintes suposicoes:

E(ε) = 0n, Cov(ε(si), ε(sj)) = Σ∗i,j = Di,iC(si, sj)Dj,j, i, j = 1, ..., n, (2.6)

onde D = diag(√β0 + β1S2

1 , ...,√β0 + β1S2

n) e uma matriz diagonal de dimensao n com

S2i representando a variancia amostral dos membros do ensemble para a i-esima localidade

e C(.) e uma matriz de correlacao espacial baseada no metodo GOP. Para a estimacao dos

parametros do EMOS espacial calibrando a temperatura de superfıcie, Feldmann et al.

(2015) consideraram primeiro ajustar o modelo EMOS original de forma semelhante a

feita em Gneiting et al. (2005). Dado as estimativas para os parametros do EMOS, o

modelo GOP e ajustado igualmente como feito em Gel et al. (2004). Nao ha disponıveis

aplicacoes com este modelo para a calibracao de variaveis assimetricas (e.g. velocidade

do vento e chuva) para campos meteorologicos completos na literatura.

2.3 Metodos de Calibracao Espaco-temporais

Comumente nos modelos apresentados, a estimacao dos parametros e feita atraves

de uma janela movel que consiste de um passado recente de valores observados e

previstos pelo modelo numerico, usualmente chamado, no contexto do pos-processamento

estatıstico, de perıodo de treinamento. Conforme discutido em Gneiting (2014), a medida

em que os perıodos de treinamento sao mais longos, permitem, a princıpio, uma melhor

estimativa com menor incerteza. No entanto, como abordado na Secao 1.2.5, podem

tambem introduzir distorcoes devido aos efeitos sazonais provindos do forcamento solar

e de aspectos geograficos (e.g. localizacao geografica, orografia e proximidade com o

oceano). Gneiting et al. (2005) e Raftery et al. (2005) analisam como o comprimento do

perıodo de treinamento afeta a estimacao e incerteza dos parametros, observando que ha

ganhos com o aumento ate 25 dias, especificamente em sua aplicacao. Tambem comentam

que, provavelmente, diferentes comprimentos deste perıodo sejam melhores para outros

tipos de aplicacoes deste modelo (e.g. tipos de variaveis, ciclos, regioes, horizontes, etc.)

e ressaltam a importancia do desenvolvimento de modos automaticos de decisao. Em

25

geral, a sazonalidade de fenomenos meteorologicos e bem definida (e.g. forcamento solar

– 24 horas, estacoes do ano – 3 meses), tornando o uso do Filtro de Kalman (Kalman,

1960) usual para este tipo de aplicacao, contornando a limitacao do comprimento do

perıodo de treinamento e permitindo a dinamica temporal dos parametros de tendencia.

Nesta secao serao apresentados novas extensoes para os principais metodos de pos-

processamento estatıstico apresentados anteriormente as quais, foram desenvolvidas com

a adicao da componente temporal por meio dos Modelos Lineares Dinamicos (MLD,

West e Harrison, 1997), de forma que tambem haja interacao espacial da informacao,

produzindo previsoes probabilısticas calibradas para campos meteorologicos completos

com possibilidade de previsao em um horizonte intervalar, nomeadas, respectivamente,

por Geostatistical Output Pertubation Dinamico (Secao 2.3.1) e Ensemble Model Output

Statistics Espaco-temporal (Secao 2.3.2).

2.3.1 Geostatistical Output Pertubation Dinamico

Um modelo que mostrou-se adequado para descricoes de fenomenos meteorologicos

com distribuicao assimetrica de forma simples (e.g. precipitacao em Bardossy e

Plate (1992)) em diferentes escalas de tempo e o modelo Normal Truncado (Stidd,

1973; Hutchinson, 1995). Seja {Yt(s), s ∈ S ⊂ R2, t = 1, ..., T} um campo meteorologico

aleatorio no tempo discreto t. Assumindo que o vetor de observacoes deste campo em n

localizacoes Yt,s = (yt(s1), ..., yt(sn))′ possui distribuicao Normal Truncada, tem-se que:

Yt(s)|λ =

BC−1 (Xt(s);λ) , se BC−1 (Xt(s);λ) ≥ c,

c∗, se BC−1 (Xt(s);λ) < c.(2.7)

onde c e c∗ sao constantes conhecidas, λ e o parametro desconhecido desta transformacao

especıfica, Xt(s) e um Processo Gaussiano e BC(.;λ) representa a Transformacao Box-

Cox (Box e Cox, 1964) definida por:

BC(y;λ) =

(yλ − 1

)/λ, se λ 6= 0 e y > 0,

log y, se λ = 0 e y > 0,

Assim, supoe-se que Xt(s) e um Processo Gaussiano latente que coordena um outro

Processo Espacial assimetrico a partir de uma transformacao conhecida. Diferentes

26

famılias de transformacoes foram utilizadas em Glasbey e Nevison (1997) e Sanso e

Guenni (1999).

A estruturacao dada em (2.7) baseia-se na tecnica de aumento de dados (Tanner

e Wong, 1987) e lida de forma natural e intuitiva com dados ausentes, eventualidade

corriqueira quando estuda-se simultaneamente um grande numero de localizacoes ao longo

do tempo, e com a suposta “censura” do Processo Espacial assimetrico quando Yt(s) < c,

com adicao de outros Processos Espaciais latentes da seguinte maneira:

Xt(s) =

Ut(s), se Yt(s) e ausente,

BC(Yt(s);λ), se Yt(s) ≥ c,

Zt(s), se Yt(s) < c.

(2.8)

A extensao proposta para o modelo GOP (Secao 2.2.1), nomeada por Geostatistical

Output Pertubation Dinamico (GOP dinamico) combina este com uma dinamica temporal

de seus coeficientes lineares a partir da adaptacao de MLDs. Portanto, GOP dinamico

e um MLD com covariancias estocasticas e aprendizado por descontos a partir de uma

evolucao estocastica Beta-Gama (veja Secao E.6 do Apendice E). Sequencialmente com

(2.7), o modelo GOP dinamico e dado por:

Xt,s = F′t,sθt + εt, εt ∼ N(0n,Σt), (2.9a)

θt = Gtθt−1 + ωt, ωt ∼ Tnt−1(0p,Wt), (2.9b)

onde Xt,s = (xt(s1), ..., xt(sn))′, F′t,sθt descreve a tendencia polinomial com a matriz

F′t,s de dimensao n × r (r ≥ m) composta por covariaveis explicativas (e.g. ensemble

de previsoes, latitude, longitude e altura das localizacoes) e θt representando o vetor de

parametros de estados de dimensao r, Gt e a matriz de evolucao de dimensao r, ωt e o erro

de evolucao com distribuicao t-Student com nt−1 graus de liberdade com vetor de medias

nulo e matriz de forma Wt. Os graus de liberdade nt−1 sao definidos atraves da evolucao

estocastica Beta-Gama. A partir do Processo Gaussiano {εt(s), s ∈ S, t = 1, ..., T},

assume-se que εt = (εt(s1), ..., εt(sn))′ segue as seguintes suposicoes:

E(εt) = 0n, Cov(εt(si), εt(sj)) = Σti,j = σ2tC(si, sj), i, j = 1, ..., n. (2.10)

27

Construiu-se C(.) com base na funcao de correlacao exponencial dada por C(si, sj) =

exp(−φ‖si − sj‖) com φ > 0 representando a taxa de decaimento exponencial e ‖si − sj‖,

a distancia euclidiana entre as localizacoes si e sj, i, j = 1, ..., n.

Para a estimacao dos parametros desconhecidos do modelo GOP dinamico, opta-

se pela abordagem Bayesiana devido a incorporacao das incertezas nas estimativas

dos parametros serem levadas em consideracao na inferencia preditiva atraves de suas

distribuicoes a posteriori. Utiliza-se a tecnica de fatores de desconto como auxılio na

especificacao de W1:T . Mais detalhes sobre fatores de desconto podem ser encontrados na

Secao E.4 do Apendice E. Assim, seguindo o Teorema de Bayes, a distribuicao a posteriori

do vetor parametrico Θ = (θ1:T , σ21:T , φ, λ)′ e proporcional a funcao de verossimilhanca

p(Y1,s, ...,YT,s|θ1:T , σ21:T , φ, λ) multiplicada pela distribuicao a priori p(θ0, σ

20, φ, λ). Para

o modelo espaco-temporal GOP dinamico apresentado em (2.7) a (2.9), a distribuicao a

posteriori do vetor parametrico Θ = (θ1:T , σ21:T , φ, λ)′ e dada por:

p(θ1:T , σ21:T , φ, λ|Y1,s, ...,YT,s) ∝

T∏t=1

|Σt|−1/2

× exp

{−1

2

T∑t=1

(Xt,s − F′t,sθt)′Σt−1(Xt,s − F′t,sθt)

}

× exp

{−1

2

T∑t=1

(θt −Gtθt−1)′Wt

−1(θt −Gtθt−1)

∏{i,t:Yit>c}

Y λ−1it × p(θ0, σ2

0, φ, λ).

(2.11)

Para obter amostras aproximadas da distribuicao a posteriori do vetor parametrico

Θ = (θ1:T , σ21:T , φ, λ)′, a qual nao possui forma analıtica conhecida, metodos de Monte

Carlo via Cadeias de Markov (MCMC, Gamerman, 1997) sao aplicaveis. A partir de

(2.11), obtem-se as distribuicoes condicionais completas dos parametros de interesse.

A descricao completa das distribuicoes condicionais completas poderao ser encontradas

no Apendice C. De forma especıfica para os parametros deste modelo, amostras para

(θ1:T , σ21:T )′ sao obtidas atraves do procedimento Forward Filtering Backward Sampling

(FFBS, Fruhwirth-Schnatter, 1994; Carter e Kohn, 1994) e para (φ, λ)′, usa-se o algoritmo

Robusto-Adaptativo de Metropolis (RAM, Vihola, 2012). Mais detalhes acerca do

28

procedimento FFBS podem ser encontrados na Secao E.5 do Apendice E e do algoritmo

RAM, no Apendice D. Informacoes acerca das distribuicoes a priori, fatores de desconto

utilizados e detalhes computacionais serao dados durante sua aplicacao no Capıtulo 3.

2.3.2 Ensemble Model Output Statistics Espaco-temporal

Analogo ao metodo GOP dinamico, o metodo Ensemble Model Output Statistics

espaco-temporal (EMOS espaco-temporal) combina o metodo EMOS espacial (Secao

2.2.2) com MLDs. Portanto, EMOS espaco-temporal e um MLD Normal Multivariado

(veja Secao E.1 do Apendice E).

Com a estruturacao dada em 2.8, o modelo EMOS espaco-temporal e,

sequencialmente, dado por:

Xt,s = F′t,sθt + εt, εt ∼ N(0n,Σ∗t ), (2.12a)

θt = Gtθt−1 + ωt, ωt ∼ N(0p,Wt), (2.12b)

onde, diferentemente do modelo apresentado anteriormente, ωt e o erro de evolucao

Normalmente distribuıdo com vetor de medias nulo e matriz de covariancia Wt. A partir

do Processo Gaussiano {εt(s), s ∈ S, t = 1, ..., T}, assume-se que εt = (εt(s1), ..., εt(sn))′

segue as seguintes suposicoes:

E(εt) = 0n, Cov(εt(si), εt(sj)) = Σ∗ti,j = Dti,iC(si, sj)Dtj,j , (2.13)

onde Dt = diag(√β0 + β1S2

1,t, ...,√β0 + β1S2

n,t) e uma matriz diagonal de dimensao n

com S2i,t representando a variancia amostral dos membros do ensemble para a i-esima

localidade no tempo t e C(.) e uma matriz de correlacao espacial construıda de mesmo

modo que o modelo GOP dinamico (Secao 2.3.1). Faz-se uso da tecnica de fatores de

desconto para a especificacao de W1:T .

29

A estimacao dos parametros do EMOS espaco-temporal tambem e feita sobre

a abordagem Bayesiana. A distribuicao a posteriori do vetor parametrico Θ∗ =

(θ1:T ,β, φ, λ)′ e dada por:

p(θ1:T ,β, φ, λ|Y1,s, ...,YT,s) ∝T∏t=1

|Σ∗t |−1/2

× exp

{−1

2

T∑t=1

(Xt,s − F′t,sθt)′Σ∗t−1(Xt,s − F′t,sθt)

}

× exp

{−1

2

T∑t=1

(θt −Gtθt−1)′Wt

−1(θt −Gtθt−1)

∏{i,t:Yit>c}

Y λ−1it × p(θ0,β, φ, λ).

(2.14)

De forma especıfica para os parametros deste modelo, amostras para θ1:T sao obtidas

atraves do procedimento Forward Filtering Backward Sampling (FFBS, Fruhwirth-

Schnatter, 1994; Carter e Kohn, 1994) e para (β, φ, λ)′, atraves do algoritmo Robusto-

Adaptativo de Metropolis (RAM, Vihola, 2012). Informacoes acerca das distribuicoes a

priori utilizadas e detalhes computacionais tambem serao dados durante a aplicacao no

Capıtulo 3.

No capıtulo a seguir, alguns dos modelos de pos-processamento estatıstico para

calibracao de campos meteorologicos completos exibidos nas Secoes 2.2 e 2.3 serao

testados e comparados conforme o desempenho na calibracao feita nas previsoes

numericas da velocidade do vento a 10 metros em Minas Gerais providas pelo modelo

Eta.

30

Capıtulo 3

Aplicacao a Previsao da Velocidade

do Vento em Minas Gerais

Os resultados apresentados neste capıtulo avaliam a capacidade de calibracao dos

modelos de pos-processamento apresentados no Capıtulo 2.

A Secao 3.1 caracteriza o banco de dados disponıvel. Na Secao 3.2, definicoes iniciais

sao contextualizadas para aplicacao dos modelos propostos. A Secao 3.3 cataloga os

modelos propostos para a aplicacao. Na Secao 3.4, sao exibidos os resultados obtidos

na pratica em distintas aplicacoes. Por fim, a Secao 3.5 resume os resultados e exibe as

conclusoes.

3.1 Descricao do Conjunto de Dados

O banco de dados utilizado e composto pelo ensemble de previsoes numericas horarias

iniciadas as 12 UTC do modelo de Mesoescala Eta para a velocidade do vento instantanea

a 10 metros de altura no Estado de Minas Gerais e seu entorno de 01 de novembro de

2015, 12 UTC a 30 de novembro de 2016, 11 UTC, totalizando mais de 10 mil ensembles,

1 para cada hora de previsao. A quantidade de membros do ensemble pode variar devido

a nao inicializacao do modelo Eta e no horizonte de previsao requisitado. O horizonte

maximo de previsao deste modelo e 255 horas, i.e., o modelo Eta preve de 0 a 255 horas

a frente. Assim, se o interesse e calibrar as previsoes no horario de iniciacao do modelo

31

Tabela 3.1: Configuracao dos membros do ensemble para previsoes 24 horas a frente as

12 UTC.

Previsao

Origem 02/12/2015 03/12/2015 ... 10/12/2015 11/12/2015 ...

01/12/2015 +24h +48h ... +216h +240h ...

02/12/2015 +24h ... +192h +216h ...

03/12/2015 ... +168h +192h ...

04/12/2015 ... +144h +168h ...

05/12/2015 ... +120h +144h ...

06/12/2015 ... +96h +120h ...

07/12/2015 ... +72h +96h ...

08/12/2015 ... +48h +72h ...

09/12/2015 +24h +48h ...

10/12/2015 +24h ...

Eta (12 UTC) 24 horas a frente, o ensemble sera composto pelas previsoes feitas 240,

216, ... , 48 e 24 horas anteriores, totalizando 10 membros. A Tabela 3.1 esquematiza o

enquadramento dos membros para a construcao de um ensemble do tipo defasado, como

na Figura 1.9(a).

Para evitar a eventual indisponibilidade de algum membro, optou-se utilizar a media

dos que estiverem disponıveis no momento sob determinado horizonte de calibracao.

Este procedimento nao acarreta grande perda de informacao, em vista que, ha alta

correlacao linear entre os membros, implicando em uma boa estabilidade do modelo

Eta, como exibida pela Figura 3.1. Note que desta forma, tambem evita-se problemas

de multicolinearidade. Mais detalhes sobre tal adversidade, consulte Montgomery e Peck

(1982). Segundo Grimit e Mass (2007), a media dos membros pode captar uma eventual

anomalia meteorologica pontual (e.g. frente fria) e assim, seu uso tambem e indicado por

aspectos teoricos.

Medicoes da variavel meteorologica em estudo nas 59 estacoes de monitoramento em

Minas Gerais e seu entorno, assim como dados georreferenciados destas (e.g. latitude,

longitude e altura do relevo) tambem integram o banco de dados utilizado. O historico de

32

Figura 3.1: Diagrama de dispersao relacionando distintos membros do ensemble de

previsoes numericas da velocidade do vento a 10 m em 01 de abril de 2016, 12 UTC.

registros de previsoes numericas e variaveis meteorologicas esta disponıvel para o mesmo

perıodo de tempo. A precisao numerica dos dados e de uma casa decimal, com menor

valor registrado nao-nulo 0,1. Essa informacao sera importante para a definicao das

constantes de censura c e c∗ em (2.7). Outras definicoes requeridas como entrada para

os modelos apresentados na Secao 2.3 como o vetor de descontos δ, as matrizes F′t,s e

Gt e o fator de desconto requerido na evolucao estocastica Beta-Gama (veja Secao E.6

do Apendice E) exclusivo do modelo GOP dinamico (Secao 2.3.1) serao apresentados na

secao a seguir.

3.2 Selecao de Covariaveis e Definicoes dos Modelos

Iniciando a aplicacao, decidiu-se analisar quais covariaveis seriam introduzidas na

analise final. As covariaveis dividem-se em 3 blocos, sao eles:

33

– Ensemble (ENS): Refere-se a uma covariavel explicativa unidimensional com a

media dos membros do ensemble para determinada localizacao. E o mınimo

requerido como entrada de modelos de pos-processamento estatıstico.

– Autorregresivo (AR): Refere-se a uma covariavel explicativa unidimensional com

valores observados no passado recente, respeitando a defasagem imposta pelo

horizonte de previsao (e.g. Para previsoes 24 horas a frente, o conjunto

autorregressivo recebe as medicoes feitas 24 horas anteriormente) para determinada

localizacao.

– Auxiliares (AUX): Refere-se a uma covariavel explicativa tridimensional com a

latitude, longitude e altitude do relevo dos locais das estacoes de monitoramento

meteorologico. Estas covariaveis nao se alteram ao longo do tempo.

Determinou-se que, em uma analise inicial de desempenho e significancia dos

parametros relacionados a cada covariavel, a combinacao do bloco de covariaveis utilizada

no modelo de calibracao espaco-temporal GOP dinamico (Secao 2.3.1) que retornasse os

melhores resultados em suas previsoes, segundo os criterios de comparacao, em uma

aplicacao piloto, seria a utilizada de forma geral. Considerou-se na aplicacao piloto

o tempo em dias e o horizonte de previsao de 1 a 4 dias a frente, simbolizado por

horas como 24 a 96 horas a frente. As previsoes foram feitas para os dias 01 a 04 de

abril de 2016, 12 UTC, escolhidos arbitrariamente, com um perıodo de treinamento de

90 observacoes. Os criterios de comparacao foram selecionados de maneira que seja

praticavel a comparacao entre as previsoes numericas provindas do modelo Eta que

fornece apenas estimativas pontuais com as calibradas provenientes do ajuste dos modelos

estatısticos. Assim, os criterios escolhidos foram raiz quadrada do Erro Quadratico

Medio (rEQM), Erro Absoluto Medio (EAM) e Indice de Concordancia de Willmott

(ICW, Willmott, 1981). Quanto menores forem os valores da rEQM e do EAM, melhores

serao as previsoes. O ICW e uma medida padronizada variando entre 0 (ausencia de

concordancia) e 1 (correspondencia perfeita). Estes criterios sao os mais usuais em meio

a literatura disponıvel sobre calibracao de variaveis meteorologicas. Mais detalhes acerca

destes criterios podem ser encontrados no Apendice B.

34

A transformacao proposta em (2.7) auxilia na acomodacao de variaveis meteorologicas

com distribuicao assimetrica e com domınio positivo (R+) em modelos estatısticos que

dispoem intrinsecamente de Processos Gaussianos como os modelos de calibracao espacial,

apresentados na Secao 2.2, e espaco-temporal, apresentados na Secao 2.3. Estes ultimos

tem esta transformacao agregada em si, a qual dependem de constantes. Assim, conforme

a precisao numerica dos dados, comentada na Secao 3.1, atribuiu-se que c∗ = 0 e c = 0, 1

e entao, a transformacao em (2.7) e, exclusivamente para esta aplicacao com o particular

banco de dados, dada por:

Yt(s)|λ =

BC−1 (Xt(s);λ) , se BC−1 (Xt(s);λ) ≥ c,

c∗, se BC−1 (Xt(s);λ) < c.

O vetor de descontos δ utilizado e composto por 3 componentes divididas por δT1,

representando o desconto para os coeficientes de tendencia relativos ao intercepto do

modelo, media do ensemble e medicoes retroativas, δT2, para os coeficientes de tendencia

relativos a localizacao geografica (altitude, latitude e longitude) e δS, para a componente

sazonal. Assim, o vetor de descontos δ e dado por:

δ = (δT1, δT2, δS)′,

sendo atribuıdo δT1 = δT2 = 0, 99 e δS = 0, 95.

A matriz Ft,s depende da escolha dos blocos de covariaveis que serao utilizados.

Conforme os criterios definidos, foi visto que o modelo com somente as previsoes

numericas (bloco ENS) nao consegue descrever bem o fenomeno e assim, fornecer boas

previsoes. A adicao de informacoes locais, tanto da variavel de estudo de maneira

retroativa (bloco AR), quanto de aspectos regionais (bloco AUX), fornecem uma menor

propensao a erros. Dentre os resultados obtidos nesta aplicacao, exibidos na Tabela 3.2,

pode-se perceber uma relacao de complemento entre os blocos. Em particular para as

previsoes do horizonte +96h, note que a insercao do bloco AR fez com que o valor da

rEQM elevasse de 1,316 para 1,371. Adicionado o bloco AUX, regressa a 1,315. Ocorre

algo similar para o EAM neste mesmo horizonte. Assim, perceba que o uso dos 3 blocos

(ENS, AR e AUX) auxiliou na diminuicao dos criterios rEQM e EAM quando o uso de

2 blocos (ENS e AR) acarretou prejuızos no desempenho das previsoes. Para os demais

35

Tabela 3.2: Relacao dos criterios de comparacao de modelos para diferentes blocos de

covariaveis e horizontes obtidos nas previsoes realizadas na aplicacao piloto.

Covariaveis

Criterios Horizonte Eta ENS ENS+AR ENS+AR+AUX

rEQM

+24h 1,457 1,382 1,185 1,142

+48h 1,880 0,975 0,735 0,732

+72h 1,579 1,053 0,959 0,919

+96h 1,515 1,316 1,371 1,315

EAM

+24h 1,223 1,055 0,832 0,812

+48h 1,614 0,828 0,603 0,585

+72h 1,262 0,849 0,718 0,678

+96h 1,262 0,982 1,012 0,955

ICW

+24h 0,497 0,293 0,626 0,662

+48h 0,451 0,389 0,700 0,738

+72h 0,463 0,178 0,532 0,601

+96h 0,433 0,382 0,510 0,549

horizontes, a relacao e proporcionalmente inversa, i.e., quanto maior a quantidade de

covariaveis utilizadas, menor e o erro das previsoes calibradas em todos os criterios de

comparacao. Alem disso, utilizar somente o bloco ENS acarretou em grandes prejuızos

no ICW, obtendo resultados piores dos que os obtidos pelas previsoes numericas as quais,

estao expostas a erros sistematicos, em todos os horizontes, chegando em valores ate 2,5

vezes menores. Por consequencia, todas as covariaveis disponıveis serao utilizadas em

todas as aplicacoes.

Na pratica, a matriz F′t,s tera componentes de sua i-esima linha dados por(1, f(si), Yt−h(si), altura(si), latitude(si), longitude(si),1 {aplic} , 0

), i = 1, ..., 59, com

f(si) simbolizando a media dos membros do ensemble para a i-esima localizacao,

Yt−h(si), o registro da variavel meteorologica h unidades de tempo atras e 1 {aplic},

uma funcao indicadora que recebe o valor 1 quando a unidade de tempo e hora e 0,

caso contrario. Esta funcao indica que quando se trabalha com os modelos espaco-

36

temporais em aplicacoes que consideram a unidade de tempo como horas, pode-se

adicionar covariaveis explicativas para definir a sazonalidade. Esta, e adaptada na matriz

de evolucao do vetor de estados composta por Gt = BD(G1, G2×1 {aplic}) com G1 sendo

uma matriz diagonal de ordem 6 e G2, harmonicos, definido pela matriz:

G2 =

cos(2π/24) sen(2π/24)

−sen(2π/24) cos(2π/24)

.

Os harmonicos foram definidos com um perıodo de 24 horas representando o forcamento

solar corroborados pela Figura 1.4.

Optou-se fixar o fator de desconto requerido para a evolucao estocastica Beta-Gama

do modelo GOP dinamico (Secao 2.3.1), definido na Secao E.6 do Apendice E, δ∗ = 1, de

forma que o parametro de variancia seja constante ao longo do tempo, i.e., σ2t = σ2,∀t.

Essa decisao foi tomada em vista que, o parametro σ2t fixado no tempo, pertencente

ao modelo em questao, equivale ao parametro β0 do modelo EMOS espaco-temporal

(Secao 2.3.2). Assim, a diferenca, com relacao aos parametros, entre estes modelos

ficara por conta da relacao dispersao-proficiencia, comentada na Secao 2.1.2, representada

pelo parametro β1 > 0. De forma direta, este parametro infla a variancia quando ha

discordancia entre os membros do ensemble. Na pratica, quando β1 se aproxima de zero,

EMOS espaco-temporal e proximo ao GOP dinamico com variancia fixa.

As distribuicoes a priori atribuıdas aos parametros dos modelos, bem como a definicao

dos modelos que serao utilizados nas aplicacoes serao elucidados na secao a seguir.

3.3 Modelos Propostos

Para a calibracao da velocidade do vento a 10 metros de altura no Estado de

Minas Gerais, comparou-se o desempenho de 3 distintos modelos de pos-processamento

propostos. Em suma, sao eles:

1. Modelo EMOS espacial

Este modelo possui componente espacial, transformacao Box-Cox na variavel

resposta e censura a esquerda.

37

Apesar de homonimo, este nao e o proposto por Feldmann et al. (2015) devido

a restricao de acomodar apenas variaveis meteorologicas assumindo distribuicao

simetrica (e.g. temperatura e pressao atmosferica). Assim, o modelo EMOS

espacial proposto e uma extensao do existente, estruturado como a combinacao

da transformacao definida em (2.7) e o modelo da literatura definido na Secao

2.2.2. Este modelo e um caso particular do modelo EMOS espaco-temporal e ocorre

quando o vetor de estados e fixado ao longo do tempo, i.e., θt = θ, ∀t.

Para os parametros deste modelo, supos-se, inicialmente, independencia entre

seus parametros, i.e., p(θ,β, φ, λ) = p(θ)p(β)p(φ)p(λ) com θ ∼ N(08, I8), β ∼

NT(0,∞)(02, 10I2), φ ∼ G(

2, max(d)6

)e λ ∼ N(1, 10) onde I8 representa uma

matriz identidade de dimensao 8 e max(d), a distancia maxima observada entre

as localizacoes. Como, no contexto da calibracao, θ representa os coeficiente de

uma combinacao linear de covariaveis com a mesma escala (excluındo o bloco

AUX), proximo a uma media ponderada, espera-se que∑8

i=1 θi seja proximo a

1. Entao, a distribuicao a priori atribuıda a θ, assim como para β e λ, e

considerada nao informativa. O vetor de parametros β representa os coeficientes

(estritamente positivos) da combinacao linear da variancia amostral dos membros

do ensemble. Sendo assim, adicionou-se tal restricao na distribuicao a priori

comumente atribuıda para parametros com esta finalidade. Os hiper-parametros

para a distribuicao a priori atribuıda a φ foram selecionados de acordo com a

premissa de que a correlacao espacial e quase nula na metade da distancia maxima

entre as localizacoes observadas (Banerjee et al., 2014) e a λ, de forma que o valor

esperado seja 1, representando o efeito nulo da tranformacao Box-Cox.

2. Modelo EMOS espaco-temporal

Este modelo e o MLD Normal Multivariado com o vetor de erros observacionais

εt restrito as suposicoes indicadas em (2.13) apresentado na Secao 2.3.2. De

forma geral, o EMOS espaco-temporal possui componente espacial, temporal,

transformacao Box-Cox na variavel resposta e censura a esquerda.

38

As definicoes de entrada utilizadas, como o vetor de descontos δ, as matrizes F′t,s e

Gt, foram as mesmas utilizadas na aplicacao piloto, definidas na Secao 3.2.

Para os parametros deste modelo, supos-se, inicialmente, independencia entre seus

parametros, i.e., p(θ0,β, φ, λ) = p(θ0)p(β)p(φ)p(λ) com θ0 ∼ N(08, I8). As

distribuicoes a priori atribuıdas ao vetor parametrico (β, φ, λ)’ sao similares ao

modelo anterior. De maneira analoga ao parametro θ do modelo EMOS espacial,

a distribuicao a priori atribuıda a θ0 e tambem considerada nao informativa.

3. Modelo GOP dinamico

Este modelo e o MLD com covariancias estocasticas e aprendizado por descontos a

partir de uma evolucao estocastica Beta-Gama com o vetor de erros observacionais

εt restrito as suposicoes indicadas em (2.10) apresentado na Secao 2.3.1. De forma

geral, o GOP dinamico possui componente espacial, temporal, transformacao Box-

Cox na variavel resposta e censura a esquerda. Foi o modelo utilizado inicialmente

na aplicacao piloto. Sob certas condicoes, e tambem um caso particular do EMOS

espaco-temporal.

Para os parametros deste modelo, supos-se, inicialmente, independencia entre seus

parametros, i.e., p(θ0, σ2, φ, λ) = p(θ0)p(σ

2)p(φ)p(λ) com θ0 ∼ T1(0, I8) e ϕ =

1/σ2 ∼ G(1; 0, 1). As distribuicoes a priori atribuıdas ao vetor parametrico (φ, λ)’

sao similares aos modelos anteriores. Os hiper-parametros da distribuicao a priori

atribuıda a ϕ = 1/σ2 foram determinados de forma que haja semelhanca com os

atribuıdos ao vetor de parametros β dos modelos EMOS espacial e espaco-temporal,

o qual possui finalidade parecida com a de σ2. As distribuicoes a priori designadas

a θ0 e ϕ = 1/σ2 podem ser consideradas nao informativas conforme elucidado

previamente.

Modelos de pos-processamento estatıstico que nao possuem componente espacial,

descritos na Secao 2.1, nao foram empregados no presente trabalho pois, nao consideram

a calibracao de campos meteorologicos, corrigindo independentemente cada localizacao,

sem a possibilidade de uma interpolacao espacial corrigida e assim, nao sendo uteis para

a calibracao da velocidade do vento a 10 m no Estado de Minas Gerais. Alem disso, os

39

modelos de pos-processamento existentes na literatura que detem da componente espacial

assumem que a variavel meteorologica tem distribuicao simetrica, o que nao e o caso do

presente estudo, sendo assim, tambem nao foram aplicados em sua forma canonica.

Para medir o desempenho da calibracao feita pelos modelos propostos e compara-los

com as previsoes numericas determinısticas, empregou-se os mesmos criterios utilizados

na aplicacao piloto, descritos na Secao 3.2. A avaliacao das previsoes probabilısticas

dos modelos de pos-processamento propostos e feita tambem atraves do Interval Score

(IS, Gneiting e Raftery, 2007) o qual, leva em consideracao a amplitude e cobertura

dos intervalos de predicao, de forma parcimoniosa. Quando nao ocorre a cobertura, o

modelo e penalizado. Caso, todos os valores verdadeiros estejam contidos no intervalo

de predicao, esta medida se resume a amplitude do intervalo. Quanto menores os valores

para IS, mais eficientes sao as previsoes probabilısticas. Para mais detalhes sobre este

criterio, consulte o Apendice B.

Todos os modelos utilizados no presente trabalho foram implementados em linguagem

de programacao R1 no software estatıstico homonimo e visando a minimizacao do

tempo computacional, algumas funcoes do algoritmo MCMC foram implementadas em

linguagem C++2 utilizando a biblioteca Armadillo (Sanderson e Curtin, 2016) por meio

do pacote Rcpp (Eddelbuettel et al., 2011).

3.4 Resultados

Devido a atividade operacional que os modelos de pos-processamento exercem e a

grande quantidade de dados disponıveis, nao houve como utilizar todos de forma contınua.

Por consequencia, seguindo a logica das estacoes do ano, foram feitas 12 previsoes, 1

para cada mes, partindo de dezembro de 2015 a novembro de 2016. O horizonte de cada

aplicacao sera explicado a frente.

Projetou-se duas situacoes de aplicacoes para a calibracao da velocidade do vento a

10 metros. Sao elas:

1https://www.r-project.org/2https://isocpp.org/

40

(i) Previsao em um horario especıfico (e.g. no horario de funcionamento do modelo

Eta, 12 UTC). Assim, a unidade de tempo t sao dias.

(ii) Previsao continuamente de hora em hora. Assim, a unidade de tempo t sao horas.

Tais aplicacoes foram nomeadas por (i) “diaria” e (ii) “horaria”. Os resultados obtidos

serao apresentados, respectivamente, nas Secoes 3.4.1 e 3.4.2.

Para a obtencao de amostras da distribuicao a posteriori dos parametros dos modelos

por meio do algoritmo MCMC, monitorou-se a trajetoria de duas cadeias partindo

de valores iniciais distintos. Para minimizar problemas provindos da autocorrelacao

existente entre os valores gerados que compoem a cadeia, apos um determinado perıodo

de aquecimento (burn-in), valores sao incluıdos na amostra da distribuicao a posteriori

com certo espacamento (thinning). Esses valores variam entre os modelos e aplicacoes.

A Tabela 3.3 contem estas informacoes acerca das cadeias MCMC para todos os modelos

empregados em diferentes aplicacoes. Devido ao carater operacional do tipo de correcao

a qual, os modelos propostos foram desenvolvidos, o custo computacional e tambem

um criterio de comparacao. Como a inferencia foi feita com o auxılio de metodos

computacionais intensivos, a quantidade de parametros e de iteracoes necessarias do

algoritmo influenciam diretamente no tempo de processamento. A Tabela 3.4 reporta o

tempo medio consumido por cada modelo para diferentes tipos de aplicacoes a partir de

um desktop com configuracoes domesticas medianas.3

Com o auxılio do algoritmo Robusto Adaptativo de Metropolis (Vihola, 2012), o

tuning e feito de maneira sequencial e adaptativa, de forma que, fixa-se a taxa de aceitacao

de interesse (23,4%), resultando em taxas observadas entre 22 a 25%. Algumas destas

cadeias MCMC podem ser encontradas no Apendice F.

A atualizacao dos parametros de estado dos modelos com dinamica espaco-temporal

e feita de acordo como descrito na Secao E.2 do Apendice E. Apos a estimacao do vetor

parametrico Θ particular de cada modelo via MCMC, assume-se a existencia de amostras

Θ(i)

, i = 1, ..., Q da distribuicao a posteriori p(Θ|Y1,s, ...,YT,s) com Q representando o

3Processador: Intel(R) Core(TM) i5-4590 CPU @ 3.30GHZ; Memoria RAM: 8 GB

41

Tabela 3.3: Informacoes acerca das cadeias MCMC para os modelos propostos em

diferentes aplicacoes.

Cadeias MCMC

Modelo Aplicacao Burn-in Thinning Iteracoes Amostra

GOP dinamicoDiaria 15000 30 75000 2500

Horaria 3000 30 63000 2100

EMOS espacialDiaria 3000 30 63000 2100

Horaria 6000 30 66000 2200

EMOS espaco-temporalDiaria 15000 30 75000 2500

Horaria 50000 50 150000 3000

Tabela 3.4: Tempo medio consumido (em minutos) para aplicacao dos modelos propostos.

Aplicacoes

Modelos Diaria Horaria

GOP dinamico 34,78 72,33

EMOS espacial 34,43 103,36

EMOS espaco-temporal 42,74 169,83

42

tamanho da amostra gerada. A distribuicao preditiva p(Y1,s, ...,YT,s) e aproximada por

meio de Integracao de Monte Carlo (Robert, 2004) da seguinte maneira:

p(Y1,s, ...,YT,s) ≈Q∑i=1

p(Y1,s, ...,YT,s|Θ(i)

). (3.1)

E por fim, a distribuicao de previsao h unidade de tempo a frente p(YT+h,s|Y1,s, ...,YT,s)

dos modelos com dinamica espaco-temporal e obtida como descrito na Secao E.3 do

Apendice E. Assim, obtem-se, de cada modelo, previsoes pontuais e intervalares para a

velocidade do vento a 10 m.

3.4.1 Aplicacao: Diaria

Nesta aplicacao, considera-se o tempo em dias e o horizonte de previsao de 1 a 4 dias

a frente, simbolizado por horas como 24 a 96 horas a frente. As previsoes sao feitas para

o dia 18 a 21 de cada mes, 12 UTC. O perıodo de treinamento possui 90 dias.

Em uma visao geral do desempenho das previsoes do modelo Eta e dos modelos

propostos ao longo das estacoes do ano apresentada na Figura 3.2, por meio dos criterios

rEQM, EAM e ICW, observa-se que as previsoes numericas provenientes do modelo

Eta foram mais erraticas, no perıodo disponıvel desta aplicacao (dia 18 a 21 de cada

mes, 12 UTC), durante os meses do verao e da primavera. Isso pode se dar ao fato

de que estas estacoes do ano apresentaram extremos da velocidade do vento a 10 m,

respectivamente, como menores e maiores medias observadas. A rEQM para estas

previsoes varia, aproximadamente, no intervalo (1; 3, 5), o EAM, em (0, 9; 3) e o ICW,

em (0, 4; 0, 6).

Com objetivo de comparar o desempenho dos modelos de pos-processamento

propostos com o modelo numerico Eta, obteve-se a previsao pontual a partir da media da

distribuicao preditiva, definida em (3.1), em vista que, esta estatıstica retornou melhores

valores para os criterios utilizados. A Figura 3.3 ilustra o desempenho das previsoes dos

modelos propostos por meio dos criterios rEQM, EAM e ICW em uma melhor escala para

visualizacao, excluindo os valores dos criterios para as previsoes numericas do modelo Eta.

A rEQM para estas previsoes varia, aproximadamente, no intervalo (0, 9; 2, 5), o EAM,

em (0, 7; 2) e o ICW, em (0, 4; 0, 8). Em geral, todos os modelos propostos obtiveram

43

(a) rEQM (b) EAM (c) ICW

Figura 3.2: Criterios de comparacao de modelos na aplicacao diaria ao longo das estacoes

do ano.

(a) rEQM (b) EAM (c) ICW

Figura 3.3: Criterios de comparacao de modelos na aplicacao diaria ao longo das estacoes

do ano para os modelos propostos.

criterios de comparacao melhores que o modelo Eta, implicando que, de fato, o pos-

processamento foi relevante na qualidade das previsoes. Os resultados destacam-se mais

no verao e na primavera, respectivamente, estacoes do ano que registraram medias

mınimas e maximas da velocidade do vento a 10 m. No entanto, em determinados

momentos nos meses de abril, maio (outono) e julho (inverno), o pos-processamento

produziu resultados ligeiramente piores. E difıcil elucidar com precisao o porque destes

casos pontuais. Uma possibilidade e a ocorrencia de uma anomalia em muitos locais

de observacao, implicando em registros incomuns. Alem disto, perceba a mudanca de

nıvel da rEQM e do EAM iniciada na sucessao do inverno para a primavera durante o

mes de agosto. Possivelmente, indica uma mudanca de regime climatico a qual, pode ser

44

pretexto para o uso de covariaveis dummies para as estacoes do ano ou a introducao de

harmonicos com perıodo que represente as estacoes do ano exclusivamente nos modelos

com componente temporal. Ambos devem ser aplicados conjuntamente com um perıodo

de treinamento mais longo (� 90 dias4). Em contrapartida, perıodos de treinamentos

muito longos acarretam altos custos computacionais para estes modelos.

Sobre o desempenho das previsoes pontuais calibradas provenientes do ajuste

dos modelos propostos, pode-se afirmar que houve um empate. Nao ha diferencas

significativas no desempenho destas previsoes pontuais nesta aplicacao. Todavia, os

modelos estatısticos fornecem previsoes intervalares, no contexto da inferencia Bayesiana,

nomeados por intervalos de credibilidade (IC). Sao obtidos a partir da distribuicao

preditiva, demonstrada em (3.1). Assim, a Figura 3.4 apresenta o IS, criterio que engloba

a amplitude dos ICs95% e penaliza valores observados que nao estao contidos nestes,

elucidado na Secao 3.3, ao longo das estacoes do ano. Como nos criterios anteriores, ha

pouca divergencia. Contudo, pode-se enfatizar 2 picos: um ocorrido em abril (outono)

pelas previsoes provenientes do modelo EMOS espacial e o outro, em agosto (inverno) a

partir do ajuste do modelo GOP dinamico. As previsoes fornecidas pelo ajuste do modelo

EMOS espaco-temporal mostraram-se superficialmente mais parcimoniosas, equilibrando

o comprimento medio do IC95% com a cobertura dos valores observados. No entanto,

isto nao o caracteriza como melhor modelo.

Figura 3.4: Interval Score na aplicacao diaria ao longo das estacoes do ano.

4Duracao media das estacoes do ano.

45

Na tentativa de compreender melhor o processo estatıstico subentendido no

procedimento da calibracao das previsoes numericas da velocidade do vento a 10 m,

a Figura 3.5 ilustra um resumo da distribuicao a posteriori para o vetor de parametros

estaticos Θ = (β0, β1, φ, λ)′ ao longo das estacoes do ano. Os parametros em questao

pertencem ao modelo EMOS espaco-temporal o qual, foi selecionado pelo fato de conter

mais parametros, independente dos resultados exibidos ate entao. Observou-se que os

parametros que compoem o vetor parametrico estatico de outros modelos e sao comuns

a Θ = (β0, β1, φ, λ)′, resultaram em valores semelhantes. De fato, estes parametros

nao se alteram significativamente ao longo do tempo. Nota-se leves movimentos na

media a posteriori dos 4 parametros ao longo das estacoes. A variancia do processo,

representada pelo parametro β0, tem um leve decrescimo durante os meses do outono e

se eleva durante a sucessao do inverno para a primavera. A relacao dispersao-proficiencia

(Secao 2.1.2), representada pelo parametro β1, esta distribuıda muito proxima a zero,

indicando uma possıvel nao significancia. Para a taxa de decaimento exponencial da

correlacao espacial, representada pelo parametro φ, mantem-se praticamente constante

em 2. Este parametro caracteriza o inverso do alcance espacial. Assim, quanto menor seu

valor, mais significativa sera a correlacao espacial. E por fim, o parametro de potencia da

transformacao Box-Cox, representado pelo parametro λ, evolui em torno de 0,5, indicando

uma transformacao raiz quadrada a qual, e bastante usual em variaveis com distribuicao

com assimetria positiva.

Com o objetivo de investigar minuciosamente o comportamento local das previsoes

numericas e calibradas a partir do ajuste dos modelos propostos, selecionou-se os meses de

janeiro (verao) e outubro (primavera), devido a boa performance dos modelos propostos,

para a exibicao das series observadas e previsoes numericas, calibradas pontuais e

intervalares. De 18 a 21 de janeiro de 2016, 12 UTC, registraram-se velocidades do

vento a 10 m de ate 8 m/s. No entanto, conforme exibido na Figura 3.6, perceba

que velocidades acima de 5 m/s sao pontuais. Em geral, grande parte das velocidades

registradas acomodam-se ate 5 m/s nesta aplicacao. Note que o diagrama de dispersao

dos modelos propostos sao praticamente identicos e demonstram a boa habilidade dos

modelos para calibrar as previsoes numericas. O melhor ajuste se da pelo modelo que

46

(a) β0 (b) β1

(c) φ (d) λ

Figura 3.5: Media a posteriori e intervalos de credibilidade de 95% para o vetor

parametrico estatico do modelo EMOS espaco-temporal na aplicacao diaria ao longo

das estacoes do ano.

apresenta um diagrama de dispersao que retorna uma relacao mais proxima de linear entre

valores observados e previstos. Casos isolados de velocidade acima de 6 m/s podem nao

ser previstos devido a um possıvel comportamento atıpico (e.g. passagem de um frente

fria). Pelo diagrama de dispersao, constata-se que as previsoes numericas do modelo Eta

apresentam uma grande sobrestimacao da realidade.

O comportamento local das previsoes em questao e exibido na Figura 3.7.

Arbitrariamente, selecionou-se as estacoes de monitoramento A533 – Ganhaes, A535

– Florestal, A557 – Coronel Pacheco e A561 – Sao Sebastiao do Paraıso. Note que

a velocidade do vento a 10 m as 12 UTC evoluiu suavemente ao longo dos dias nos

locais citados. Diferentemente das previsoes calibradas pontuais, as previsoes numericas

evoluem no tempo, em certos momentos, de forma brusca. Esta distincao indica uma

maior relevancia de outras covariaveis, como a do bloco AR. De forma informativa, com

diferencas sutis, a menor amplitude do IC95% para as previsoes da velocidade do vento a

47

(a) Eta (b) EMOS E (c) EMOS ET (d) GOP D

Figura 3.6: Diagrama de dispersao com valores previstos versus observados na aplicacao

diaria para 18 a 21 de janeiro de 2016, 12 UTC.

10 m e dada pelo modelo GOP dinamico e a maior, pelo modelo EMOS espaco-temporal.

Esta informacao ja fora contemplada de maneira eficiente no criterio IS, exibido na Figura

3.4.

(a) A533 – EMOS E (b) A535 – EMOS E (c) A557 – EMOS E (d) A561 – EMOS E

(e) A533 – EMOS ET (f) A535 – EMOS ET (g) A557 – EMOS ET (h) A561 – EMOS ET

(i) A533 – GOP D (j) A535 – GOP D (k) A557 – GOP D (l) A561 – GOP D

Figura 3.7: Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura em

janeiro de 2016, 12 UTC.

48

De 18 a 21 de outubro de 2016, 12 UTC, registraram-se velocidades do vento a 10

m de ate 6 m/s. Repare que a estacao do ano corrente e a primavera, a qual retorna

maiores medias de velocidade do vento. No entanto, nestes dias de previsao nao registrou-

se velocidades acima de 6 m/s. Em contraponto, o cenario apresentado na Figura 3.6

durante o verao o qual, apresenta menores medias de velocidade do vento em geral,

observou-se velocidade ate 8 m/s. Apesar de haver a influencia das estacoes do ano,

a velocidade do vento a 10 m mostra-se volatil. De forma semelhante ao apresentado

anteriormente, as previsoes numericas tambem sobrestimam a velocidade do vento neste

mes. Em vista da nao ocorrencia de velocidades que fogem do padrao, os modelos

apresentaram resultados satisfatorios neste mes.

(a) Eta (b) EMOS E (c) EMOS ET (d) GOP D

Figura 3.8: Diagrama de dispersao com valores previstos versus observados na aplicacao

diaria para 18 a 21 de outubro de 2016, 12 UTC.

O comportamento local das previsoes em questao e exibido na Figura 3.9 nas

mesmas estacoes de monitoramento selecionadas previamente nesta aplicacao. De forma

semelhante, a velocidade do vento a 10 m as 12 UTC evoluiu suavemente ao longo dos dias

nos locais citados. Note que, para este mes, as previsoes numericas evoluıram de maneira

mais suave com seus erros dados, aproximadamente, por um incremento constante para

cada localizacao.

Nesta aplicacao, os modelos demonstraram razoavel habilidade para a calibracao das

previsoes numericas, como demonstrado pelos criterios exibidos na Figura 3.2. Houve

certa dificuldade na previsao de velocidades mais altas (acima de 6 m/s). No entanto,

este pode ser um caso atıpico. A componente sazonal dos modelos de calibracao espaco-

49

(a) A533 – EMOS E (b) A535 – EMOS E (c) A557 – EMOS E (d) A561 – EMOS E

(e) A533 – EMOS ET (f) A535 – EMOS ET (g) A557 – EMOS ET (h) A561 – EMOS ET

(i) A533 – GOP D (j) A535 – GOP D (k) A557 – GOP D (l) A561 – GOP D

Figura 3.9: Previsao 1 a 4 dias a frente para a velocidade do vento a 10 m de altura em

outubro de 2016, 12 UTC.

temporais nao fora aplicada devido a incompatibilidade com o tipo de aplicacao. A

adicao desta componente pode beneficiar os modelos espaco-temporais propostos. A

secao a seguir desenvolve uma aplicacao a qual, a implementacao da componente sazonal

sera admitida.

3.4.2 Aplicacao: Horaria

Nesta aplicacao, considera-se o tempo em horas. As previsoes sao feitas para o dia

20, 13 UTC ao dia 21, 12 UTC de cada mes, representando um horizonte de 1 a 24 horas

a frente. O perıodo de treinamento possui 240 horas.

O desempenho global das previsoes do modelo Eta e dos modelos propostos ao longo

das estacoes do ano, apresentado na Figura 3.10, por meio dos criterios rEQM, EAM e

ICW, demonstra que as previsoes numericas provenientes do modelo Eta aparentam certa

50

periodicidade em seus erros, corroborando com a premissa de que estas previsoes possuem

erros sistematicos caracterısticos. A rEQM para estas previsoes varia, aproximadamente,

no intervalo (1, 2; 3, 8), o EAM, em (0, 8; 3, 4) e o ICW, em (0, 2; 0, 7).

(a) rEQM (b) EAM (c) ICW

Figura 3.10: Criterios de comparacao de modelos na aplicacao horaria ao longo das

estacoes do ano.

Com objetivo de comparar o desempenho dos modelos de pos-processamento

propostos com o modelo numerico Eta, obteve-se a previsao pontual a partir da mediana

da distribuicao preditiva, definida em (3.1), em vista que, esta estatıstica retornou

melhores valores para os criterios utilizados. A Figura 3.11 ilustra o desempenho das

previsoes dos modelos propostos por meio dos criterios rEQM, EAM e ICW em uma

melhor escala para visualizacao, excluindo os valores dos criterios para as previsoes

numericas do modelo Eta. A rEQM para estas previsoes varia, aproximadamente, no

intervalo (0, 5; 2), o EAM, em (0, 4; 1, 7) e o ICW, em (0, 4; 0, 9). Em geral, todos

os modelos propostos obtiveram criterios de comparacao melhores que o modelo Eta,

implicando que, de fato, o pos-processamento aprimorou as previsoes. Atente ao fato de

que, todos os modelos propostos conseguem suavizar a notoria periodicidade dos erros.

Os resultados sao moderadamente prejudicados durante a primavera, estacao a qual, os

erros (rEQM e EAM) maximos observados sao maiores. Apenas em um momento no

mes de maio (outono), o pos-processamento realizado pelos modelos espacos-temporais

produziu resultados vagamente piores. Ja o modelo EMOS espacial resultou em um erro

relativamente maior, destoando de forma excessiva dos modelos mais robustos. Como

e um caso particular, possivelmente, uma anormalidade meteorologica ocorreu. Assim

51

como na aplicacao da Secao 3.4.1, observou-se uma mudanca de regime durante a sucessao

do inverno para a primavera.

(a) rEQM (b) EAM (c) ICW

Figura 3.11: Criterios de comparacao de modelos na aplicacao horaria ao longo das

estacoes do ano para os modelos propostos.

Sobre o desempenho das previsoes pontuais calibradas provenientes do ajuste dos

modelos propostos, percebe-se que os modelos espaco-temporais apresentam resultados

de rEQM, EAM e ICW suavemente melhores. Ja para as previsoes intervalares, a Figura

3.12 apresenta o IS ao longo das estacoes do ano. Note-que neste criterio, potenciais

disparidades foram realcadas. O modelo proposto EMOS espacial possui uma longa

sequencia de picos, enquanto os modelos propostos espaco-temporais permanecem mais

estaveis. Sendo assim, salienta-se que as previsoes fornecidas pelos ajustes dos modelos

espaco-temporais foram mais parcimoniosas.

De forma analoga a que fora apresentado na Figura 3.5, um resumo da distribuicao

a posteriori do vetor de parametros estaticos do modelo EMOS espaco-temporal

Θ = (β0, β1, φ, λ)′ ao longo das estacoes do ano e apresentado na Figura 3.13.

Comparando com o obtido na aplicacao da Secao 3.4.1, apesar da transicao estar

desajeitada, o parametro β0, representando a variancia do processo, permanece tendo

um leve decrescimo durante os meses do outono e se eleva durante a sucessao do

inverno para a primavera. O parametro λ, representando a potencia da transformacao

BC, evolui tambem em torno de 0,5, indicando, igualmente, uma transformacao raiz

quadrada. O parametro β1, representando a relacao dispersao-proficiencia (Secao

2.1.2), esta distribuıdo muito proximo a zero, sendo, igualmente nesta aplicacao, pouco

52

Figura 3.12: Interval Score na aplicacao horaria ao longo das estacoes do ano.

representativo. O parametro φ e o unico que destoa completamente da aplicacao feita

anteriormente. Atente ao fato de que com a introducao dos campos meteorologicos

de forma horaria, muitos instantes com velocidades do vento reduzidas por todo o

territorio (e.g. durante a madrugada) podem ser adicionados ao perıodo de treinamento,

principalmente durante as estacoes do ano de ventos mais fracos como o outono e parte do

inverno. Assim, a velocidade do vento e aproximadamente uniforme por todo o territorio,

implicando na baixa representatividade da correlacao espacial. Em contrapartida, repare

que o cenario muda durante a primavera, estacao do ano a qual, observou-se maiores

medias de velocidade do vento a 10 m.

Com o proposito de apurar o comportamento local das previsoes numericas e

calibradas a partir do ajuste dos modelos propostos, selecionou-se os meses de julho

e agosto (inverno) conforme o bom desempenho demonstrado nestes meses. Apesar de

pertenceram a mesma estacao do ano, o erro (rEQM e EAM) de agosto se assimila mais ao

padrao da estacao seguinte, aparentando ser um perıodo de mudanca de regime climatico.

De 20 de julho, 13 UTC a 21 de julho de 2016, 12 UTC, registraram-se velocidades do

vento a 10 m de ate 8 m/s, como apresentado na Figura 3.14. Na presente aplicacao,

velocidades mais altas (> 5 m/s) aparecem com mais frequencia. Porem, grande parte

das velocidades registradas ainda acomodam-se ate 5 m/s. Repare que o diagrama de

dispersao dos modelos propostos retornam uma relacao bem proxima de linear entre

valores observados e previstos. Inclusive, para velocidades acima de 5 m/s. Contudo,

53

(a) β0 (b) β1

(c) φ (d) λ

Figura 3.13: Mediana a posteriori e intervalos de credibilidade de 95% para o vetor

parametrico estatico do modelo EMOS espaco-temporal na aplicacao horaria ao longo

das estacoes do ano.

o diagrama de dispersao do modelo EMOS espacial evidencia uma sobrestimacao da

velocidade do vento a 10 m. Em contraste, o diagrama de dispersao das previsoes do

modelo Eta demonstra baixa representatividade.

(a) Eta (b) EMOS E (c) EMOS ET (d) GOP D

Figura 3.14: Diagrama de dispersao com valores previstos versus observados na aplicacao

horaria de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC.

54

O comportamento local das previsoes em questao sao exibidos na Figura 3.15.

Arbitrariamente, selecionou-se as estacoes de monitoramento A512 – Ituiutaba, A549

– Aguas Vermelhas, A555 – Ibirite (Rola Moca) e F501 – Belo Horizonte (Cercadinho).

Atente ao fato de que as estacoes A555 e F501 distanciam-se 8 km e sao as estacoes com

maior proximidade. Assim, estao localizadas dentro da mesma celula da grade discreta

do modelo Eta e portanto, possuem igual previsao (numerica). Entretanto, perceba a

diferenca no nıvel das previsoes calibradas. Isto corrobora com o fato de que aspectos

locais em microescala, i.e., caracterısticas do local da estacao e seu entorno em um curto

raio, influenciam diretamente na velocidade do vento a 10 m. Semelhante ao que ocorre

na aplicacao da Secao 3.4.1, ha uma grande distincao entre as trajetorias das previsoes

numericas e calibradas, prenunciando uma maior relevancia de outras covariaveis. A

maior amplitude do IC95% para as previsoes da velocidade do vento a 10 m e dada

pelo modelo EMOS espacial. Esta larga amplitude pode ter sido consequencia do uso

de um longo perıodo de treinamento o qual, pode introduzir distorcoes na estimacao dos

parametros devido a sazonalidade provinda do efeito do forcamento solar na velocidade

do vento a 10 m. Em contrapartida, os modelos espaco-temporais proposto se beneficiam

desta particularidade, absorvendo este efeito, sem custo extra.

De 20 de agosto, 13 UTC a 21 de agosto de 2016, 12 UTC, registraram-se velocidades

do vento a 10 m de ate 9 m/s, como apresentado na Figura 3.16. Velocidades acima de 6

m/s nao foram previstas. Note que as previsoes numericas apresentaram sobrestimacao

excessiva. Como ocorrido no cenario anterior, o diagrama de dispersao do modelo EMOS

espacial evidencia uma sobrestimacao da velocidade do vento a 10 m.

O comportamento local das previsoes em questao sao exibidos na Figura 3.17 nas

mesmas estacoes de monitoramento selecionadas previamente nesta aplicacao. Repare

como os intervalos de predicao de todos os modelos sao bem mais extensos dos que foram

ajustados no mes anterior. Enfase nos intervalos provenientes do ajuste do modelo EMOS

espacial os quais, mostram-se pouco informativos devido a sua vasta amplitude. Note o

ocorrido durante a madrugada do dia 21 de outubro de 2016 na estacao de monitoramento

A512. A velocidade do vento a 10 m permaneceu 8 horas seguidas sendo registrada

abaixo de 1 m/s e repentinamente, a velocidade se eleva em ate 6 m/s. Perceba que a

55

(a) A512 – EMOS E (b) A549 – EMOS E (c) A555 – EMOS E (d) F501 – EMOS E

(e) A512 – EMOS ET (f) A549 – EMOS ET (g) A555 – EMOS ET (h) F501 – EMOS ET

(i) A512 – GOP D (j) A549 – GOP D (k) A555 – GOP D (l) F501 – GOP D

Figura 3.15: Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura

de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC.

(a) Eta (b) EMOS E (c) EMOS ET (d) GOP D

Figura 3.16: Diagrama de dispersao com valores previstos versus observados na aplicacao

horaria de 20 de agosto de 2016, 13 UTC a 21 de agosto de 2016, 12 UTC.

previsao do modelo numerico Eta consegue, embora tardiamente, captar esta mudanca

abrupta. Infortunadamente, devido ao historico de erros, tais previsoes tem pouco peso

56

nos modelos de calibracao propostos e nao faz com que a previsao calibrada realize este

movimento inesperado.

(a) A512 – EMOS E (b) A549 – EMOS E (c) A555 – EMOS E (d) F501 – EMOS E

(e) A512 – EMOS ET (f) A549 – EMOS ET (g) A555 – EMOS ET (h) F501 – EMOS ET

(i) A512 – GOP D (j) A549 – GOP D (k) A555 – GOP D (l) F501 – GOP D

Figura 3.17: Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura

de 20 de agosto de 2016, 13 UTC a 21 de agosto de 2016, 12 UTC.

O modelo GOP dinamico e um dos modelos espaco-temporais propostos. Os

resultados obtidos por este modelo foram muito proximos aos obtidos pelo outro modelo

espaco-temporal proposto, EMOS espaco-temporal, o qual, apresentou os melhores

criterios na presente aplicacao. A principal vantagem do modelo GOP dinamico e

possuir menos parametros que necessitam de metodos computacionais intensivos para

serem estimados, requerendo menos iteracoes do algoritmo MCMC durante o processo

de inferencia para alcancar a convergencia, como apresentado na Tabela 3.3. A Tabela

3.4 demonstra que, dependendo do tipo de aplicacao, o modelo GOP dinamico pode

chegar a ser mais de 2 vezes mais rapido quando comparado ao EMOS espaco-temporal.

57

Por consequencia, foi o escolhido para demonstrar a calibracao da velocidade do vento a

10 m para todo o Estado de Minas Gerais.

3.4.3 Aplicacao: Interpolacao Espacial

A interpolacao espacial (Krigagem, Cressie, 1993) e feita a partir da distribuicao

preditiva do Processo Gaussiano latente Xt,s que fora adaptado aos modelos propostos

atraves da estruturacao dada em (2.8). Esta estruturacao permite lidar com variaveis

com distribuicao assimetrica com domınio positivo conjuntamente com a utilidade da

interpolacao espacial de forma simples e direta, no contexto da inferencia Bayesiana.

Seguindo o que foi apresentado em (3.1), para a predicao da velocidade do vento a 10

m em um novo conjunto de localizacoes Yt,s′ = (y(s′1), ..., y(s′n′))′, faz-se necessario a

distribuicao preditiva dada por:

p(Xt,s′ |Xt,s) =

∫p(Xt,s′|Xt,s, Θ)p(Θ|Xt,s′)dΘ,

sendo aproximada, utilizando Integracao de Monte Carlo, da seguinte maneira:

p(Xt,s′|Xt,s) ≈Q∑i=1

p(Xt,s′|Xt,s, Θ(i)

),

de forma que, sob um PG, tem-se:Xt,s′

Xt,s

|Θ ∼ N

µsµs′

,

Σs Σs,s′

Σ′s,s′ Σs′

.

Conforme as propriedades da distribuicao Normal, chega-se a:

Xt,s′|Xt,s, Θ ∼ N(µs′ + Σ′s,s′Σ−1s (Xt,s − µs),Σs′ − Σ′s,s′Σ

−1s Σs,s′).

Por fim, a velocidade do vento a 10 m em um novo conjunto de localizacoes Yt,s′ =

(y(s′1), ..., y(s′n′))′ e obtida atraves da relacao em (2.7) e a distribuicao de previsao h

unidade de tempo a frente p(YT+h,s|Y1,s, ...,YT,s) do modelo espaco-temporal selecionado

e obtida como descrito na Secao E.3 do Apendice E. Assim, obtem-se, previsoes pontuais

e intervalares para a velocidade do vento a 10 m para todo o Estado de Minas Gerais.

58

Uma limitacao especıfica da presente aplicacao e o uso do bloco AR. Para a

interpolacao espacial, isto se torna um fator ainda mais adverso pois, nao ha medicoes

disponıveis para o novo conjunto de localizacoes s′1, ..., s′n′ . Assim, apesar da possıvel

inclusao de erros, a inputacao destes dados atraves de uma interpolacao bilinear, como

feito com as previsoes numericas regularmente espacadas (consulte a Figura 1.2), e a

opcao mais eficiente do ponto de vista operacional. Espera-se que as previsoes numericas

calibradas serao mais representativas em regioes localizadas proximas as estacoes de

monitoramento meteorologico.

Em busca de garantias de que os resultados obtidos a partir da interpolacao espacial

sao coesos, aplicou-se uma validacao cruzada. Assim, retirou-se 4 estacoes do banco de

dados utilizado. Foram elas: A505 – Araxa, A517 – Muriae, A550 – Itaobim e A560

– Pompeu. Tomou-se a cautela de selecionar estacoes de monitoramento que nao sao,

relativamente, isoladas. Portanto, utilizou-se o modelo GOP dinamico para calibrar a

previsao numerica da velocidade do vento a 10 m para todo o Estado de Minas Gerais

para julho de 2016 utilizando 55 das 59 estacoes de monitoramento. A Figura 3.18 exibe

as previsoes numericas brutas, pontuais e intervalares calibradas para as estacoes de

monitoramento removidas da amostra.

(a) A505 – GOP D (b) A517 – GOP D (c) A550 – GOP D (d) A560 – GOP D

Figura 3.18: Previsao ate 24 horas a frente para a velocidade do vento a 10 m de altura

de 20 de julho de 2016, 13 UTC a 21 de julho de 2016, 12 UTC obtidos a partir da

interpolacao espacial. Estacoes de monitoramento A505, A517, A550 e A560 fora da

amostra.

Note que o ajuste feito na interpolacao espacial tem semelhanca em ordem de que

as previsoes calibradas tem trajeto completamente distinto das previsoes numericas

brutas, implicando, novamente, que a previsao numerica tem peso pequeno dentre as

59

covariaveis. Visualmente, as previsoes intervalares permanecem parcimoniosas. Nao sao

demasiadamente amplas, resultando pouca incerteza em tomadas de decisao, ao mesmo

tempo que, estritamente para estas previsoes nestas estacoes, obtiveram uma proporcao

de mais de 80% de cobertura.

Os mapas com as previsoes calibradas pelo modelo GOP dinamico juntamente com

as previsoes do modelo numerico Eta para 6, 12, 18 e 24 horas a frente no Estado de

Minas Gerais sao apresentados na Figura 3.19. Superficialmente, pode-se comentar sobre

alguns padroes regionais observados. Previu-se velocidades levemente superiores ao longo

do tempo na [1] porcao leste da mesorregiao do Triangulo Mineiro e Alto Paranaıba, [2] no

municıpio de Belo Horizonte e em uma [3] area de terreno acidentado que vai do centro ao

extremo norte do Estado. Em contraponto, observou-se previsoes de velocidade levemente

inferiores na [4] regiao mais ao sul do Estado e na [5] regiao que fica as margens do Rio

Paraıba do Sul em torno de Alem Paraıba. Estas regioes estao sinalizadas na Figura 3.20.

Os mapas produzidos pelo ajuste dos modelos de calibracao podem auxiliar em muitas

aplicacoes distintas, como as citadas em 1.2.2.

3.5 Conclusoes

Para calibrar as previsoes da velocidade do vento a 10 m providas pelo modelo

numerico Eta, propos-se 3 modelos de pos-processamentos estatıstico: EMOS espacial,

EMOS espaco-temporal e GOP dinamico.

Inicialmente, decidiu-se que seria necessario o uso de todas as covariaveis disponıveis,

em vista que, apenas os membros do ensemble nao explicavam razoavelmente o fenomeno.

O restante das covariaveis disponıveis sao compostas pelos valores observados passados

(bloco AR) e pela latitude, longitude e altura do relevo dos locais das estacoes de

monitoramento meteorologico (bloco AUX). Em geral, modelos de calibracao corrigem

variaveis meteorologicas em um horizonte de previsao distante. No entanto, utilizar

valores observados passados restringiu demasiadamente o horizonte maximo de previsao

e assim, as aplicacoes foram restritas a horizontes curtos.

60

20/07/2016, 18 UTC – PN 20/07/2016, 18 UTC – PP 20/07/2016, 18 UTC – ME

21/07/2016, 00 UTC – PN 21/07/2016, 00 UTC – PP 21/07/2016, 00 UTC – ME

21/07/2016, 06 UTC – PN 21/07/2016, 06 UTC – PP 21/07/2016, 06 UTC – ME

21/07/2016, 12 UTC – PN 21/07/2016, 12 UTC – PP 21/07/2016, 12 UTC – ME

Figura 3.19: Previsoes 6, 12, 18 e 24 horas a frente para a velocidade do vento a 10 m

de altura para o Estado de Minas Gerais. PN: Previsao numerica proveniente do modelo

Eta. PP: Previsao pontual calibrada proveniente do ajuste do modelo GOP dinamico.

ME: Margem de erro, definida como metade do comprimento do intervalo de credibilidade

95% da previsao probabilıstica.

61

Figura 3.20: Mapa contendo a localizacao das regioes enumeradas.

Projetou-se dois distintos modos de aplicacao para avaliar a capacidade de refino

que os modelos propostos possuem. Um deles, considerou a calibracao em um horario

especıfico (12 UTC) e foi nomeado por aplicacao “diaria” e o outro, concentrou-se em

calibrar sequencialmente ao longos das horas, nomeado por aplicacao “horaria”.

Na aplicacao “diaria”, os modelos propostos conseguiram refinar as previsoes

numericas de modo que os criterios de erro (rEQM e EAM), reduzissem. Os resultados

mais significativos com relacao ao EAM, por exemplo, ocorreram nos meses de janeiro

(verao), reduzindo de 2,2 para 0,75 (reducao de 66%), e outubro (primavera), de 2,6

para 1,2 (reducao de 53%) a partir do ajuste do modelo GOP dinamico. As previsoes

pontuais e intervalares foram muito semelhantes entre os modelos propostos. Nenhum

dos modelos se sobressaiu. Foi visto que, em geral, os modelos propostos conseguem

diminuir medidas de erro. Contudo, de forma especıfica, tiveram dificuldades em prever

velocidade do vento ligeiramente mais altas (> 5 m/s). Isto pode ser justificado devido a

haver poucos registros nesta faixa de velocidade. Assim, ate 5 m/s, os modelos propostos

tiveram desempenho razoavel.

Na aplicacao “horaria”, observou-se que o rEQM e o EAM das previsoes do modelo

numerico Eta possuem certa periodicidade. Mesmo assim, os modelos propostos

obtiveram resultados significativamente melhores do que o modelo Eta e conseguiram

suavizar este efeito periodico. Pode-se citar como resultados relevantes a diminuicao do

EAM em janeiro (verao), de 3,4 para 0,75 (reducao de 78%), e em agosto (inverno) de 3,4

62

para 0,8 (reducao de 76%) a partir do ajuste do modelo GOP dinamico. Comparando

o desempenho das previsoes probabilısticas entre os modelos propostos a partir do IS,

os modelos espaco-temporais tem vantagem. Isto pode se dar ao fato de que o modelo

espacial nao e habil para lidar com os efeitos sazonais que este tipo de variavel contem

implıcito, mencionados na Secao 1.2.5 e ilustrados na Figura 1.4. Outro ponto importante

e o fato de que o aumento do comprimento do perıodo de treinamento nao prejudica

a estimacao dos parametros. Esta e uma discussao recorrente na literatura de pos-

processamento estatıstico (consulte Raftery et al. (2005); Gneiting et al. (2005) e Gneiting

(2014)). Alem disto, estes modelos conseguem lidar com efeitos sazonais de maneira

intuitiva, sem custos adicionais. Nesta aplicacao, nenhum dos modelos propostos teve

dificuldade para prever velocidades mais altas (> 5 m/s).

Por fim, comparou-se o custo computacional de aplicacao dos modelos. O

modelo EMOS espaco-temporal, apesar de bons criterios, e demasiadamente custoso

computacionalmente para este tipo de aplicacao. Isto ocorre devido a grande quantidade

de parametros que necessitam de metodos computacionais intensivos para serem

estimados, requerendo uma maior quantidade de iteracoes do algoritmo MCMC, como

apresentado na Tabela 3.3. Alem disto, como apontado pelas Figuras 3.5 e 3.13, a

distribuicao a posteriori de β1, parametro que representa a relacao dispersao-proficiencia

(Secao 2.1.2) e e exclusivo da classe de modelos EMOS em geral, esta distribuıda muito

proxima a zero, implicando em uma nao significancia. Uma possıvel justifica a essa

irrelevancia pode ser dar dada pelo fato de que os membros do ensemble de previsoes

numericas do modelo Eta mostram-se estaveis, oscilando pouco, como apresentado

na Figura 3.1, e consequentemente, retornam uma variancia amostral reduzida. Em

contraponto, o modelo GOP dinamico chega a ser 2 vezes mais computacionalmente

eficiente. Estruturado sob um MLD com covariancias estocasticas e aprendizado por

descontos a partir de uma evolucao estocastica Beta-Gama, este modelo proposto

conseguiu combinar qualidade de previsoes, conforme os criterios rEQM, EAM, ICW e

IS, com um tempo computacional viavel para o tipo de aplicacao operacional o qual, fora

idealizado. Alem disso, a possibilidade da variacao do parametro de variancia ao longo do

tempo σ2t e uma faceta exclusiva deste modelo, embora nao testada na presente aplicacao

63

por questoes de comparabilidade entre modelos, elucidadas na Secao 3.2, pode auxiliar

em um melhor desempenho sem acarretar prejuızos no tempo de processamento devido

a sua estimacao ser feita de forma sequencial. Assim, conclui-se que dentre os modelos

propostos, o modelo GOP dinamico e o mais aconselhavel para o pos-processamento

estatıstico operacional das previsoes do modelo numerico Eta para a velocidade do vento

a 10 m.

64

Capıtulo 4

Consideracoes Finais e Trabalhos

Futuros

O presente estudo teve a finalidade de calibrar previsoes numericas fornecidas pelo

modelo de mesoescala Eta para a velocidade do vento a 10 metros de altura em Minas

Gerais. Devido a escala em que o modelo Eta trabalha, suas previsoes podem apresentar

erros sistematicos quando deseja-se prever em locais especıficos, como apontado pela

Figura 1.3. Assim, propos-se modelos estatısticos que facam o pos-processamento para

campos meteorologicos completos. Como inovacao, adicionou-se a dinamica temporal

aos modelos de pos-processamento, em vista que, muitos fenomenos meteorologicos

evoluem ao longo do tempo com certa sazonalidade devido ao forcamento solar e/ou

estacoes do ano. Alem disso, utilizou-se a tecnica de aumento de dados (Tanner e Wong,

1987), para definir Processos Gaussianos latentes capazes de acomodar a “censura”

da variavel meteorologica de estudo. Desta forma, contornou-se a limitacao do uso

exclusivo de variaveis meteorologicas com distribuicao simetrica e com domınio em R nos

modelos de calibracao espacial, comentados na Secao 2.2. A insercao deste procedimento,

determinado por (2.7) e (2.8), na literatura do pos-processamento estatıstico trara o

advento de novas aplicacoes deste tipo (e.g. calibracao espacial da velocidade do vento e

precipitacao).

Os modelos de pos-processamento propostos, nomeados por, GOP dinamico (Secao

2.3.1) e EMOS espaco-temporal (Secao 2.3.2) foram estruturados atraves dos Modelos

65

Lineares Dinamicos Bayesianos (MLD, West e Harrison, 1997). Ambos tem como

base o modelo MOS (Secao 2.1.1; Glahn e Lowry, 1972) o qual, foi primordial para

o desenvolvimento das sucessoras versoes. Outros metodos de pos-processamento usuais

nao foram utilizados no presente trabalho devido a questoes tecnicas e praticas especıficas

como, por exemplo, o modelo MOC (Mao et al., 1999), o qual supoe que os erros

sistematicos sao Normalmente distribuıdos, quando, na pratica, nao sao, principalmente

em variaveis com distribuicao assimetrica, como discute Lange (2005), e, ocasionalmente,

este modelo pode resultar valores negativos para a previsao da velocidade do vento,

sendo necessario a anexacao de um truncamento determinıstico nas previsoes. O

modelo Bayesian Model Average (BMA, Raftery et al., 2005), detalhado no Apendice A,

juntamente com sua extensao temporal Dynamic Model Average (DMA, Raftery et al.,

2010) nao foram utilizados porem, sao de interesse para investigacoes futuras. Embora o

DMA nao tenha sido aplicado no contexto do pos-processamento estatıstico de previsoes

numericas de variaveis meteorologicas, e um modelo de mesma natureza dos que foram

propostos neste trabalho. No entanto, encaixar as devidas adaptacoes para variaveis

assimetricas seria computacionalmente custoso para a estimacao dos parametros desta

classe de modelos. Alem disso, o BMA e seus derivados sao indicados para quando

se possui um superensemble, i.e., um ensemble composto por ensembles de distintos

modelos numericos, em vista que, os membros de um mesmo ensemble podem ser

altamente correlacionados, diferindo pouco entre si, como ocorreu na aplicacao especıfica

deste trabalho, elucidado na Figura 3.1. Ainda sobre os modelos propostos, foram

desenvolvidos com o princıpio de genericidade, aplicavel em diferentes tipos de variaveis

numericas contınuas positivas ou com domınio definido em R. As excecoes sao fenomenos

meteorologicos que sao medidos em graus (e.g. direcao do vento) e que estao definidos

em um intervalo fechado (e.g. umidade relativa do ar), requerendo transformacoes

especıficas. Ademais, contemplam covariaveis auxiliares e permitem a calibracao para

locais especıficos ou para todo o campo meteorologico de estudo.

Com respeito aos resultados obtidos, os modelos espaco-temporais propostos

apresentaram vantagem na aplicacao que dispunha de um efeito sazonal definido, com

os resultados exibidos na Secao 3.4.2, em comparacao com o modelo espacial proposto.

66

Quando este efeito nao esta presente, como na aplicacao apresentada na Secao 3.4.1,

nao ha diferencas significativas de resultados entre os modelos mais robustos com o

que possui somente a componente espacial. Indicando que, de fato, os modelos espaco-

temporais beneficiaram-se da sazonalidade intrınseca da variavel de estudo. Os modelos

propostos mostraram-se habeis na aplicacao que considera o tempo em horas com relacao

ao fornecimento de previsoes de velocidades mais altas (> 5 m/s) em vista que, ocorrem

com pouca frequencia.

Um grande limitador de desempenho dos modelos de pos-processamento propostos

foi a ausencia de informacoes locais mais detalhadas (e.g. relevo, orografia e rugosidade),

fazendo com que fosse necessario o uso de uma componente autorregressiva, limitando

largamente o horizonte de previsao. Em geral, os modelos de calibracao trabalham

em previsoes de longo prazo diferentemente de como fora empregado neste trabalho

devido as restricoes de desempenho demonstradas na Tabela 3.2. A velocidade do vento

a 10 metros de altura do solo mostrou-se demasiadamente instavel, sendo fortemente

influenciada por aspectos de microescala (e.g. proximidade com corpos d’agua e com

areas urbanas; Warner, 2010) os quais, se levados em consideracao, presumivelmente,

beneficiarao a qualidade da calibracao. Em vista que o Estado de Minas Gerais possui

um relevo bastante acidentado (Amarante et al., 2010) em uma area de 586.852,35 km2

(Minas Gerais, 2018), restringir a regiao de aplicacao para locais com caracterısticas

topograficas semelhantes pode auxiliar em uma estimacao mais fidedigna dos efeitos

espaciais.

Por fim, pretende-se estender a aplicacao dos modelos de pos-processamento propostos

no presente trabalho para outras variaveis meteorologicas, independente da simetria da

distribuicao (e.g. precipitacao, temperatura de superfıcie (2 m), pressao atmosferica e

velocidade do vento em outras altitudes), e compara-los com os existentes na literatura

em contextos admitidos por estes.

67

Referencias Bibliograficas

Amarante, O. d., Silva, F., e Andrade, P. (2010). “Atlas Eolico: Minas Gerais.” Belo

Horizonte: CEMIG .

Banerjee, S., Carlin, B. P., e Gelfand, A. E. (2014). Hierarchical modeling and analysis

for spatial data. Crc Press.

Bao, L., Gneiting, T., Grimit, E. P., Guttorp, P., e Raftery, A. E. (2010). “Bias correction

and Bayesian model averaging for ensemble forecasts of surface wind direction.”

Monthly Weather Review , 138, 5, 1811–1821.

Bardossy, A. e Plate, E. J. (1992). “Space-time model for daily rainfall using atmospheric

circulation patterns.” Water Resources Research, 28, 5, 1247–1259.

Barry, R. G. e Chorley, R. J. (2009). Atmosfera, tempo e clima. Bookman Editora.

Berrocal, V. J., Raftery, A. E., e Gneiting, T. (2007). “Combining spatial statistical and

ensemble information in probabilistic weather forecasts.” Monthly Weather Review ,

135, 4, 1386–1402.

Berrocal, V. J., Raftery, A. E., Gneiting, T., et al. (2008). “Probabilistic quantitative

precipitation field forecasting using a two-stage spatial model.” The Annals of Applied

Statistics , 2, 4, 1170–1193.

Bidlot, J.-R., Holmes, D. J., Wittmann, P. A., Lalbeharry, R., e Chen, H. S. (2002).

“Intercomparison of the performance of operational ocean wave forecasting systems

with buoy data.” Weather and Forecasting , 17, 2, 287–310.

68

Black, T. L. (1994). “The new NMC mesoscale Eta model: Description and forecast

examples.” Weather and forecasting , 9, 2, 265–278.

Box, G. E. e Cox, D. R. (1964). “An analysis of transformations.” Journal of the Royal

Statistical Society. Series B (Methodological), 211–252.

Carter, C. K. e Kohn, R. (1994). “On Gibbs sampling for state space models.”

Biometrika, 81, 3, 541–553.

Charney, J. G., Fjortoft, R., e Neumann, J. v. (1950). “Numerical integration of the

barotropic vorticity equation.” Tellus , 2, 4, 237–254.

Chou, S., Souza, C. d., Gomes, J. L., Evangelista, E., Osorio, C., e Cataldi, M. (2007).

“Refinamento estatıstico das previsoes horarias de temperatura a 2 m do modelo Eta

em estacoes do Nordeste do Brasil.” Revista Brasileira de Meteorologia, 22, 3, 287–296.

Cressie, N. (1993). Statistics for spatial data. New York: Wiley.

Dempster, A. P., Laird, N. M., e Rubin, D. B. (1977). “Maximum likelihood from

incomplete data via the EM algorithm.” Journal of the royal statistical society. Series

B (methodological), 1–38.

Eddelbuettel, D., Francois, R., Allaire, J., Ushey, K., Kou, Q., Russel, N., Chambers, J.,

e Bates, D. (2011). “Rcpp: Seamless R and C++ integration.” Journal of Statistical

Software, 40, 8, 1–18.

Epstein, E. S. (1969). “Stochastic dynamic prediction.” Tellus , 21, 6, 739–759.

Feldmann, K., Scheuerer, M., e Thorarinsdottir, T. L. (2015). “Spatial postprocessing

of ensemble forecasts for temperature using nonhomogeneous Gaussian regression.”

Monthly Weather Review , 143, 3, 955–971.

Fruhwirth-Schnatter, S. (1994). “Data augmentation and dynamic linear models.”

Journal of time series analysis , 15, 2, 183–202.

Gamerman, D. (1997). Markov Chain Monte Carlo: Stochastic Simulation for Bayesian

Inference. London: Chapman & Hall.

69

Gel, Y., Raftery, A. E., e Gneiting, T. (2004). “Calibrated probabilistic mesoscale weather

field forecasting: The geostatistical output perturbation method.” Journal of the

American Statistical Association, 99, 467, 575–583.

Gelfand, A. E., Zhu, L., e Carlin, B. P. (2001). “On the change of support problem for

spatio-temporal data.” Biostatistics , 2, 1, 31–45.

Glahn, H. R. e Lowry, D. A. (1972). “The use of model output statistics (MOS) in

objective weather forecasting.” Journal of applied meteorology , 11, 8, 1203–1211.

Glasbey, C. e Nevison, I. (1997). “Rainfall modelling using a latent Gaussian variable.”

Lecture Notes in Statistics , 122, 5, 233–242.

Gneiting, T. (2014). Calibration of medium-range weather forecasts . European Centre

for Medium-Range Weather Forecasts.

Gneiting, T. e Raftery, A. E. (2007). “Strictly proper scoring rules, prediction, and

estimation.” Journal of the American Statistical Association, 102, 477, 359–378.

Gneiting, T., Raftery, A. E., Westveld III, A. H., e Goldman, T. (2005). “Calibrated

probabilistic forecasting using ensemble model output statistics and minimum CRPS

estimation.” Monthly Weather Review , 133, 5, 1098–1118.

Grimit, E. P. e Mass, C. F. (2007). “Measuring the ensemble spread–error relationship

with a probabilistic approach: Stochastic ensemble results.” Monthly weather review ,

135, 1, 203–221.

Hutchinson, M. (1995). “Stochastic space-time weather models from ground-based data.”

Agricultural and Forest Meteorology , 73, 3-4, 237–264.

INPE/CPTEC (2018). “Instituto Nacional de Pesquisas Espaciais — Centro de Previsao

de Tempo e Estudos Climaticos — Eta Model — Regional.” http://etamodel.cptec.

inpe.br/. Acessado em 15/05/2018.

Kalman, R. E. (1960). “A new approach to linear filtering and prediction problems.”

Journal of basic Engineering , 82, 1, 35–45.

70

Kalnay, E. (2003). Atmospheric modeling, data assimilation and predictability .

Cambridge University Press.

Klein, W. H., Lewis, B. M., e Enger, I. (1959). “Objective prediction of five-day mean

temperatures during winter.” Journal of Meteorology , 16, 6, 672–682.

Krishnamurti, T. (1995). “Numerical weather prediction.” Annual review of fluid

mechanics , 27, 1, 195–225.

Kwa, C. (2001). “The rise and fall of weather modification: changes in American attitudes

toward technology, nature, and society.” Changing the Atmosphere: expert knowledge

and environmental governance, 135–65.

Landberg, L., Myllerup, L., Rathmann, O., Petersen, E. L., Jørgensen, B. H., Badger, J.,

e Mortensen, N. G. (2003). “Wind resource estimation—an overview.” Wind Energy ,

6, 3, 261–271.

Lange, M. (2005). “On the uncertainty of wind power predictions—Analysis of the

forecast accuracy and statistical distribution of errors.” Journal of solar energy

engineering , 127, 2, 177–184.

Leutbecher, M. e Palmer, T. N. (2008). “Ensemble forecasting.” Journal of

Computational Physics , 227, 7, 3515–3539.

Liu, F., West, M., et al. (2009). “A dynamic modelling strategy for Bayesian computer

model emulation.” Bayesian Analysis , 4, 2, 393–411.

Liu, Y., Warner, T. T., Bowers, J. F., Carson, L. P., Chen, F., Clough, C. A., Davis,

C. A., Egeland, C. H., Halvorson, S. F., Huck Jr, T. W., et al. (2008). “The operational

mesogamma-scale analysis and forecast system of the US Army Test and Evaluation

Command. Part I: Overview of the modeling system, the forecast products, and how

the products are used.” Journal of Applied Meteorology and Climatology , 47, 4, 1077–

1092.

71

Mao, Q., McNider, R. T., Mueller, S. F., e Juang, H.-M. H. (1999). “An optimal model

output calibration algorithm suitable for objective temperature forecasting.” Weather

and forecasting , 14, 2, 190–202.

Matheson, J. E. e Winkler, R. L. (1976). “Scoring rules for continuous probability

distributions.” Management science, 22, 10, 1087–1096.

Mera, R. J., Niyogi, D., Buol, G. S., Wilkerson, G. G., e Semazzi, F. H. (2006). “Potential

individual versus simultaneous climate change effects on soybean (C 3) and maize (C

4) crops: an agrotechnology model based study.” Global and Planetary Change, 54, 1,

163–182.

Mesinger, F., Janjic, Z. I., Nickovic, S., Gavrilov, D., e Deaven, D. G. (1988). “The

step-mountain coordinate: model description and performance for cases of Alpine

lee cyclogenesis and for a case of an Appalachian redevelopment.” Monthly Weather

Review , 116, 7, 1493–1518.

Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H., e Teller, E. (1953).

“Equation of state calculations by fast computing machines.” The journal of chemical

physics , 21, 6, 1087–1092.

Minas Gerais, G. (2018). http://mg.gov.br/conheca-minas/geografia/. Acessado

em 15/05/2018.

Montgomery, D. C. e Peck, E. A. (1982). Introduction to linear regression analysis . Wiley.

Nelder, J. A. e Baker, R. J. (1972). Generalized linear models . Wiley Online Library.

Petris, G., Petrone, S., e Campagnoli, P. (2009). Dynamic Linear Models with R.

Springer.

Piani, C., Haerter, J., e Coppola, E. (2010). “Statistical bias correction for daily

precipitation in regional climate models over Europe.” Theoretical and Applied

Climatology , 99, 1-2, 187–192.

72

Prado, R. e West, M. (2010). Time series: modeling, computation, and inference. CRC

Press.

Raftery, A. E., Gneiting, T., Balabdaoui, F., e Polakowski, M. (2005). “Using Bayesian

model averaging to calibrate forecast ensembles.” Monthly Weather Review , 133, 5,

1155–1174.

Raftery, A. E., Karny, M., e Ettler, P. (2010). “Online prediction under model uncertainty

via dynamic model averaging: Application to a cold rolling mill.” Technometrics , 52,

1, 52–66.

Raftery, A. E., Madigan, D., e Hoeting, J. A. (1997). “Bayesian model averaging for

linear regression models.” Journal of the American Statistical Association, 92, 437,

179–191.

Richardson, L. (1922). Weather Prediction by Numerical Process . Cambridge University.

Robert, C. P. (2004). Monte carlo methods . Wiley Online Library.

Sanderson, C. e Curtin, R. (2016). “Armadillo: a template-based C++ library for linear

algebra.” Journal of Open Source Software.

Sanso, B. e Guenni, L. (1999). “Venezuelan rainfall data analysed by using a Bayesian

space–time model.” Journal of the Royal Statistical Society: Series C (Applied

Statistics), 48, 3, 345–362.

Schuhen, N., Thorarinsdottir, T. L., e Gneiting, T. (2012). “Ensemble model output

statistics for wind vectors.” Monthly weather review , 140, 10, 3204–3219.

Sharman, R., Tebaldi, C., Wiener, G., e Wolff, J. (2006). “An integrated approach to

mid-and upper-level turbulence forecasting.” Weather and forecasting , 21, 3, 268–287.

Sloughter, J. M., Gneiting, T., e Raftery, A. E. (2010). “Probabilistic wind speed

forecasting using ensembles and Bayesian model averaging.” Journal of the american

statistical association, 105, 489, 25–35.

73

Sloughter, J. M. L., Raftery, A. E., Gneiting, T., e Fraley, C. (2007). “Probabilistic

quantitative precipitation forecasting using Bayesian model averaging.” Monthly

Weather Review , 135, 9, 3209–3220.

Stidd, C. (1973). “Estimating the precipitation climate.” Water Resources Research, 9,

5, 1235–1241.

Tanner, M. A. e Wong, W. H. (1987). “The calculation of posterior distributions by data

augmentation.” Journal of the American statistical Association, 82, 398, 528–540.

Thomson, M. C., Palmer, T., Morse, A. P., Cresswell, M., e Connor, S. J. (2000).

“Forecasting disease risk with seasonal climate predictions.” The Lancet , 355, 9214,

1559–1560.

Thorarinsdottir, T. L. e Gneiting, T. (2010). “Probabilistic forecasts of wind speed:

ensemble model output statistics by using heteroscedastic censored regression.” Journal

of the Royal Statistical Society: Series A (Statistics in Society), 173, 2, 371–388.

Thorarinsdottir, T. L. e Johnson, M. S. (2012). “Probabilistic wind gust forecasting using

nonhomogeneous Gaussian regression.” Monthly Weather Review , 140, 3, 889–897.

Triantafyllopoulos, K. (2002). “On observational variance learning for multivariate

Bayesian time series and related models.” Ph.D. thesis, University of Warwick.

Vihola, M. (2012). “Robust adaptive Metropolis algorithm with coerced acceptance rate.”

Statistics and Computing , 22, 5, 997–1008.

Warner, T. T. (2010). Numerical weather and climate prediction. Cambridge University

Press.

West, M. e Harrison, P. (1997). Bayesian forecasting and dynamic models . 2nd ed.

Springer Verlag, New York.

Whitaker, J. S. e Loughe, A. F. (1998). “The relationship between ensemble spread and

ensemble mean skill.” Monthly weather review , 126, 12, 3292–3302.

74

Wilks, D. S. (2006). Statistical Methods in the Atmospheric Sciences: An Introduction.

Elsevier.

Willmott, C. J. (1981). “On the validation of models.” Physical geography , 2, 2, 184–194.

Wilson, L. J. e Vallee, M. (2002). “The Canadian updateable model output statistics

(UMOS) system: Design and development tests.” Weather and forecasting , 17, 2,

206–222.

75

Apendice A

Outros Modelos de

Pos-Processamento Estatıstico

A.1 Bayesian Model Average

O metodo Bayesian Model Average (BMA, Raftery et al., 1997) e uma abordagem

Bayesiana para combinar modelos estatısticos concorrentes e possui uma ampla aplicacao

nas ciencias sociais e da saude. Sua vantagem em relacao a outras tecnicas, como a analise

de regressao convencional, e a ponderacao de multiplos modelos, nao considerando um

unico modelo como o melhor. SuponhaM = {M1, ...,Mm} um conjunto discreto e finito

de modelos disponıveis, entao, a distribuicao a posteriori da variavel de interesse Y dado

o conjunto de dados D e:

p(Y |D) =m∑k=1

p(Y |Mk, D)P (Mk|D). (A.1)

Em suma, o BMA e a distribuicao de mistura resultante da media das distribuicoes

a posteriori de Y dado cada modelo Mk ponderada pela probabilidade a posteriori dos

modelos.

O metodo BMA foi aplicado como procedimento de pos-processamento estatıstico

inicialmente por Raftery et al. (2005). Neste contexto, cada membro do ensemble Fk

e individualmente associado a uma distribuicao de probabilidade g (i.e, aplicacao do

metodo MOS (secao 2.1.1) individualmente para cada membro do ensemble Fk) sendo

76

compreendido como um modelo unico Mk e a probabilidade a posteriori dos modelos

p(Mk|D), vista como peso ωk, e interpretada como a probabilidade a posteriori do

membro Fk, apos calibracao, ser o que melhor preve o fenomeno meteorologico de interesse

Y . A distribuicao preditiva do metodo BMA e dada pela distribuicao de mistura:

p(Y |F1, ..., Fm) =m∑k=1

ωkgk(Y |Fk), (A.2)

com os pesos ωk sendo nao negativos e∑m

k=1 ωk = 1. Para a estimacao dos parametros

desconhecidos do metodo BMA calibrando a temperatura de superfıcie e a pressao

ao nıvel do mar, Raftery et al. (2005) supoem normalidade na distribuicao do erro

aleatorio e utilizam a estimativa de maxima verossimilhanca a partir do algoritmo

iterativo EM (Dempster et al., 1977). Mais aplicacoes deste metodo para outros tipos de

variaveis climaticas (e.g. precipitacao, velocidade e direcao do vento) supondo distintas

distribuicoes de probabilidade para o erro aleatorio, podem ser encontradas em Sloughter

et al. (2007), Sloughter et al. (2010) e Bao et al. (2010), respectivamente.

A.2 Bayesian Model Average Espacial

O metodo Bayesian Model Average Espacial (BMA espacial, Berrocal et al., 2007)

combina os metodos BMA (secao A.1) e GOP (secao 2.2.1), aproveitando os benefıcios

de ambos os metodos. Este metodo se assemelha a tecnica original, tendo sua funcao

preditiva como uma media ponderada das densidades de previsao individuais com pesos

que refletem a habilidade dos membros da previsao. A distribuicao preditiva do metodo

BMA espacial e dada pela distribuicao de mistura:

p(Ys|Fs1 , ...,Fsm) =m∑k=1

ωkgk(Ys|Fsk). (A.3)

Analogamente a sua versao univariada, os pesos ωk sao nao negativos e∑m

k=1 ωk =

1. Para a estimacao dos parametros do BMA espacial calibrando a temperatura de

superfıcie, Berrocal et al. (2007) consideraram primeiro ajustar o modelo BMA original.

Dado as estimativas para os parametros do BMA, o modelo GOP e ajustado para cada

membro do ensemble Fsk , k = 1, ...,m, separadamente. Combinando as estimativas de

77

ambos os procedimentos, os parametros do BMA Espacial sao obtidos. O metodo descrito

em Berrocal et al. (2007) foi projetado para variaveis meteorologicas com distribuicao

simetrica e com domınio em R. Em Berrocal et al. (2008), um procedimento de pos-

processamento espacial foi desenvolvido para precipitacao, onde os autores adaptaram a

versao univariada do BMA para precipitacao proposto por Sloughter et al. (2007).

78

Apendice B

Criterios de Comparacao de Modelos

B.1 Raiz Quadrada do Erro Quadratico Medio

A raiz quadrada do Erro Quadratico Medio (rEQM) e definida por:

rEQM(y1, ..., yn) =

√√√√ 1

n

n∑i=1

(yi − yi)2,

com yi representando o i-esimo valor observado e yi, o valor previsto para yi.

B.2 Erro Absoluto Medio

O Erro Absoluto Medio e definido por:

EAM(y1, ..., yn) =1

n

n∑i=1

|yi − yi|,

com yi representando o i-esimo valor observado e yi, o valor previsto para yi.

B.3 Indice de Concordancia de Willmott

O Indice de Concordancia de Willmott (Willmott, 1981) e uma medida padronizada

do grau de erro de predicao. Variando entre 0 (ausencia de concordancia) e 1

(correspondencia perfeita), e dado por:

ICW(y1, ..., yn) = 1−∑n

i=1 (yi − yi)2∑ni=1 (|yi − y|+ |yi − y|)2

,

79

com yi representando o i-esimo valor observado, yi, o valor previsto para yi e y =

1n

∑ni=1 yi.

B.4 Interval Score

O Interval Score (Gneiting e Raftery, 2007) e uma regra de pontuacao intuitiva para

previsoes intervalares considerando o intervalo de predicao central com nıvel (1−α)×100%

o qual, tem extremidades definidas pelos quantis preditivos nos nıveis α2

e 1 − α2. O

previsor e recompensado por intervalos estreitos e penalizado quando nao ha a cobertura

da previsao. O IS medio e dado por:

IS(y1, ..., yn) =1

n

n∑i=1

(ui − li) +2

α(li − xi)1 {xi < li}+

2

α(xi − ui)1 {xi > ui}

com yi representando o i-esimo valor observado e li e ui, respectivamente, os limites

inferior, obtido pelo quantil α2, e superior, obtido pelo quantil 1− α

2, de previsao para yi.

80

Apendice C

Distribuicoes Condicionais

Completas

C.1 Vetor parametrico β

A distribuicao condicional completa de β, vetor de parametros relacionado com a

relacao dispersao-proficiencia no modelo EMOS espaco-temporal, e dada por:

p(β|θ1:T , φ, λY1:T ) ∝T∏t=1

|Σ∗t (β)|−1/2

× exp

{−1

2

T∑t=1

(Xt − F′tθt)′Σ∗t (β)−1(Xt − F′tθt)

}.

(C.1)

Assim, p(β|θ1:T , φ, λ,Y1:T ) nao possui forma analıtica conhecida. A distribuicao

condicional completa de β no modelo EMOS espacial e obtida de forma analoga.

C.2 Parametro φ

A distribuicao condicional completa de φ, parametro que representa a taxa de

decaimento exponencial no modelo EMOS espaco-temporal, e dada por:

81

p(φ|θ1:T ,β, λ,Y1:T ) ∝T∏t=1

|Σ∗t (φ)|−1/2

× exp

{−1

2

T∑t=1

(Xt − F′tθt)′Σ∗t (φ)−1(Xt − F′tθt)

}.

(C.2)

Assim, p(φ|θ1:T ,β, λ,Y1:T ) nao possui forma analıtica conhecida. A distribuicao

condicional completa de φ nos modelos EMOS espacial e GOP dinamico e obtida de

forma analoga.

C.3 Parametro λ

A distribuicao condicional completa de λ, parametro da transformacao potencia no

modelo EMOS espaco-temporal, e dada por:

p(λ|θ1:T ,β, φ,Y1:T ) ∝ exp

{−1

2

T∑t=1

(Xt(λ)− F′tθt)′Σ∗t−1(Xt(λ)− F′tθt)

}×∏Yit>c

Y λ−1it .

(C.3)

Assim, p(λ|θ1:T ,β, φ,Y1:T ) nao possui forma analıtica conhecida. A distribuicao

condicional completa de λ nos modelos EMOS espacial e GOP dinamico e obtida de

forma analoga.

C.4 Processo Espacial latente Zt(s)

Para o modelo Normal Truncado (Stidd, 1973; Hutchinson, 1995), supoe-se que Xt(s)

e um Processo Gaussiano latente que coordena um outro Processo Espacial assimetrico a

partir de uma transformacao conhecida f . Simplificando a construcao em (2.8), tem-se:

Xt(s) =

f(Yt(s)), se f(Yt(s)) ≥ c,

Zt(s), se f(Yt(s)) < c.

Note que o Processo Espacial Zt(s) e acrescentado para lidar com a censura

do Processo de estudo quando f(Yt(s)) < c com f(Yt(s)) e Zt(s) ocorrendo

82

de forma complementar. Defina como Xt,s = (xt(s1), ..., xt(sn))′, f(Yt,s) =

(f(yt(s1))), ..., f(yt(sn))))′ e Zt,s = (zt(s1), ..., zt(sn))′. Assim, o PG Xt,s e particionado

da seguinte maneira:

Xt,s =

f(Yt,s)

Zt,s

|Θ ∼ N

µf(Yt)µZt

,

Σf(Yt) Σf(Yt),Zt

Σ′f(Yt),ZtΣZt

.

Conforme as propriedades da distribuicao Normal e Normal Truncada e a restricao

imposta pela censura supondo distribuicao Normal Truncada para Yt(s), chega-se a

distribuicao condicional completa de Zt,s dada por:

Zt,s|f(Yt,s), Θ ∼ NT(−∞,BC(c;λ))(µZ∗t ,ΣZ∗t),

com µZ∗t = µZt+ Σ′f(Yt),Zt

Σ−1f(Yt)(f(Yt,s)− µf(Yt)) e ΣZ∗t= Σ′f(Yt),Zt

Σ−1f(Yt)Σf(Yt),Zt .

C.5 Processo Espacial latente Ut(s)

A prosseguir com o desenvolvimento anterior, Ut(s) e introduzido para contornar

possıveis dados faltantes. Assim como no caso anterior, ocorre de forma complementar

aos outros Processos latentes. Baseando-se na estrutura completa apresentada em (2.8),

Ut(s) nao possui restricao com relacao a domınio. Seja Y∗t,s = (f(Yt,s),Zt,s)′ e Ut,s =

(ut(s1), ..., ut(sn))′. O PG Xt,s e particionado da seguinte maneira:

Xt,s =

Y∗t,s

Ut,s

|Θ ∼ N

µY ∗tµUt

,

ΣY ∗tΣY ∗t ,Ut

Σ′Y ∗t ,UtΣUt

.

Conforme as propriedades da distribuicao Normal, chega-se a distribuicao condicional

completa de Ut,s dada por:

Ut,s|Y∗t,s, Θ ∼ N(µU∗t ,ΣU∗t),

com µU∗t = µUt+ Σ′Y ∗t ,Ut

Σ−1Y ∗t (Y∗t,s − µY ∗t ) e ΣU∗t= Σ′Y ∗t ,Ut

Σ−1Yt ΣYt,Ut .

83

Apendice D

Algoritmo Robusto-Adaptativo de

Metropolis

O algoritmo Robusto-Adaptativo de Metropolis foi proposto por Vihola (2012) e e

uma extensao do algoritmo de Metropolis (Metropolis et al., 1953). De forma analoga

ao precursor, este metodo e utilizado quando amostras das distribuicoes condicionais

completas sao difıceis de serem geradas. Possui a vantagem de obter a convergencia

de forma mais eficiente quando ha grande quantidade de parametros sendo amostrados

dessa forma. Alem de gerar valores dos parametros de interesse θ = (θ1, ...θp)′, lida

simultaneamente com a probabilidade de aceitacao media α, ou taxa de aceitacao,

pre-fixando uma meta α∗ ∈ (0, 1) e definindo a distribuicao proposta q(.), de modo

independente, requerendo apenas que esta seja esfericamente simetrica e centrada em 0p.

Determine{ζ(k)}k≥1 como uma sequencia que decai para zero. O esquema de amostragem

e dado por:

1. Inicialize θ(0) = (θ(0)1 , ..., θ

(0)p )′, S(0) = s0Ip e k = 1;

2. Obtenha um novo valor para θ(k) a partir de θ(k−1) da seguinte forma:

(a) Gere um valor para θ(k) a partir de:

θ(k) = θ(k−1) + S(k−1)V (k), V (k) ∼ q(.);

84

(b) Aceite o valor proposto em (a) com probabilidade de aceitacao α:

α(k) = min

{1,p(θ(k)|θ(k−1), y)q(θ(k−1)|θ(k))p(θ(k−1)|θ(k), y)q(θ(k)|θ(k−1))

};

(c) Calcule a matriz triangular inferior S(k) com os elementos da diagonal principal

positivos de forma que satisfaca:

S(k)S ′(k)

= S(k−1)

(Ip + ζ(k)(α(k) − α∗)V

(k)V ′(k)

‖V (k)‖2

)S ′

(k−1)

3. Atribua k = k+ 1 e volte para 2, repetindo o procedimento ate que a convergencia

seja alcancada.

Nomeia-se de passeio aleatorio quando amostra-se de θ(k) a partir de θ(k−1) sendo a

taxa de aceitacao otima para este de ≈ 23, 4%. Assim, α∗ = 0, 234. De forma interligada,

ha a indicacao de que s0 = 2.4√p

para que o algoritmo atinja a convergencia de forma mais

agil.

85

Apendice E

Modelos Dinamicos

Os Modelos Lineares Dinamicos (MLD) sao um caso particular dos Modelos de Espaco

de Estado (MEE).

E.1 Modelo Linear Dinamico

Considerando uma serie temporal n-dimensional Yt, t = 1, 2, ..., o MLD e definido

por:

Equacao de Observacao: Yt = F′tθt + εt, εt ∼ N(0n,Vt), (E.1a)

Equacao de Evolucao: θt = Gtθt−1 + ωt, ωt ∼ N(0p,Wt), (E.1b)

Informacao Inicial: θ0|D0 ∼ N(m0,C0). (E.1c)

Assume-se que as sequencias de erros observacionais εt e de evolucao ωt sao

independentes ao longo do tempo, entre si e da informacao inicial θ0|D0. Para t = 1, 2, ...:

– θt e um vetor p-dimensional denominado vetor de estados;

– F′t e uma matriz n × p conhecida denominada matriz de design com variaveis

independentes;

– Gt e uma matriz p× p conhecida denominada matriz de evolucao dos estados;

86

– Vt e a matriz de covariancia associada ao erro observacional εt;

– Wt e a matriz de covariancia associada ao erro de evolucao ωt.

A equacao de observacao em (E.1a) relaciona o vetor de observacoes Yt ao parametro

de estado θt onde assume-se independencia entre si condicional a θt, dependendo somente

deste. A equacao de evolucao em (E.1b) e responsavel pela evolucao dos parametros de

estado atraves do tempo.

Denota-se por Dt = {Yt,Dt−1} o conjunto de informacoes disponıveis ate o instante

de tempo t em que D0 denota o conjunto de informacoes no instante inicial t = 0.

O modelo descrito em (E.1) e completamente especificado pela quadrupla

{F,G,V,W}t e pela distribuicao a priori Normal assumida para os parametros de estado

em (E.1c), onde m0 e C0 sao, respectivamente, a media e a matriz de covariancia dadas

para θ0 refletindo a incerteza do processo no instante inicial.

O erro εt e uma pertubacao aleatoria no processo de medida das observacoes Yt. Em

contraste, o erro de evolucao ωt influencia no desenvolvimento do sistema ao longo do

tempo. A suposicao de que estes erros sao independentes dentre e entre si, reforca a

distincao destas fontes de variacao estocastica.

E.2 Filtro de Kalman

Para a inferencia sobre a estrutura dos dados e previsao de observacoes futuras da

serie, emprega-se o filtro de Kalman (Kalman, 1960) que e um procedimento recursivo que

baseia-se nas informacoes disponıveis. Especificamente, no contexto do MLD, o processo

do Filtro de Kalman e resumido por:

– Distribuicao a posteriori no tempo t− 1:

θt−1|Dt−1 ∼ N(mt−1,Ct−1);

– Distribuicao a priori no tempo t:

θt|Dt−1 ∼ N(at,Rt),

onde at = Gtmt−1 e Rt = GtCt−1G′t + Wt;

87

– Previsao um passo a frente:

Yt|Dt−1 ∼ N(ft,Qt),

onde ft = F′tat e Qt = F′tRtFt + Vt;

– Distribuicao a posteriori no tempo t:

θt|Dt ∼ N(mt,Ct),

onde mt = at + Atet e Ct = Rt −AtQtA′t com At = RtFtQ

−1t e et = yt − ft.

A demonstracao e feita por inducao utilizando propriedades da distribuicao Normal

e pode ser encontrada na ıntegra em West e Harrison (1997).

E.3 Distribuicoes de Previsao

Para se fazer inferencia sobre Yt+k, para k ≥ 1, condicionado ao conhecimento

corrente Dt, sao necessarias as distribuicoes de θt+k|Dt e Yt+k|Dt. Estas, sao dadas

por:

– Distribuicao de estado k passos a frente:

θt+k|Dt ∼ N(at(k),Rt(k))

sendo definido recursivamente por:

at(k) = Gt+kat(k − 1) e Rt(k) = Gt+kRt(k − 1)G′t+k + Wt+k

com valores iniciais at(0) = mt e Rt(0) = Ct;

– Distribuicao de previsao k passos a frente:

Yt+k|Dt ∼ N(ft(k),Qt(k)),

onde ft = F′t+kat(k) e Qt(k) = F′t+kRt(k)Ft+k + Vt+k.

A demonstracao pode ser encontrada em West e Harrison (1997) e Petris et al. (2009).

88

E.4 Fatores de Desconto

A especificacao da magnitude de Wt e importante pois, controla a extensao da

variacao estocastica na evolucao do modelo e assim, determinam a estabilidade ao longo

do tempo. Na equacao de evolucao em (E.1b), Wt leva a um aumento da incerteza

ou a uma perda de informacao sobre o vetor de estado antecessor. Considerando um

MLD, a especificacao de Wt pode ser feita indiretamente atraves do uso de descontos.

Considerando o filtro para o MLD (secao E.2) onde Rt = V ar(θt|Dt−1) = Pt + Wt

e Pt = GtCt−1G′t. Sendo assim, Wt = Rt − Pt e Pt seria a covariancia caso nao

houvesse incerteza sobre a evolucao dos estados, i.e., Wt = 0p. Definindo δ de forma que

Rt = Pt/δ, pode-se interpretar δ como a percentagem de informacao que se atualiza de

t− 1 para t e entao:

Wt =1− δδ

Pt,

com δ ∈ (0, 1] denominado fator de desconto. Se δ = 1 entao, Wt = 0p e nao ha perda

de informacao na evolucao do estado θt−1 para θt, de forma que Cov(θt|Dt−1) = Pt. Ha

a possibilidade de utilizar multiplos fatores de desconto por meio da matriz de desconto

p× p definida por:

∆ = diag(δ−1/21 , ..., δ−1/2p ).

Assim, Rt = ∆GtCt−1G′t∆.

Na pratica, o valor do fator de desconto e frequentemente fixado, variando entre 0,8

e 0,99.

E.5 Esquema de Amostragem para MLD

Para lidar com Modelos Dinamicos em que a distribuicao a posteriori nao esteja

disponıvel analiticamente, e usual que se utilize metodos MCMC (secao D) decompondo

o esquema em 2 blocos:

(i) Amostragem dos estados condicionados aos parametros estaticos;

(ii) Amostragem dos parametros estaticos condicionados ao vetor de estados.

89

Em particular, nos MLD, o vetor de estados pode ser amostrado utilizando-se um

tipo de amostrador de Gibbs chamado Forward Filtering Backward Sampling (FFBS).

Proposto por Fruhwirth-Schnatter (1994) e Carter e Kohn (1994), o esquema FFBS

tem por objetivo amostrar, de forma eficiente, o vetor de estados de um MLD como

o apresentado em (E.1). O algoritmo consiste em amostrar o vetor de estados

conjuntamente utilizando as distribuicoes filtradas e suavizadas destes parametros. A

amostragem pode ser decomposta em 2 passos da seguinte maneira:

1. Forward Filtering:

Este passo consiste na inferencia dos parametros utilizando o filtro de Kalman

(Kalman, 1960) a partir das definicoes apresentadas na secao E.2.

2. Backward Sampling:

Este passo baseia-se na analise retrospectiva, a partir da decomposicao da

distribuicao a posteriori conjunta dos parametros de estado da seguinte forma:

p(θ0, ...,θT |DT ) = p(θT |DT )T∏t=0

p(θt|θt+1,Dt).

Pelo Teorema de Bayes, obtem-se para t = T − 1, ..., 0:

p(θt|θt+1,DT ) ∝ (θt+1|θt,DT )p(θt|DT ).

Especificamente no contexto do MLD, tem-se:

θt|DT ∼ N(ht,Ht),

onde ht = mt + CtG′t+1R

−1t+1(θt+1 − at+1) e Ht = Ct − CtG

′t+1R

−1t+1Gt+1Ct com

valores iniciais hT = mT e HT = CT .

E.6 MLD com Covariancias Estocasticas e

Aprendizado por Descontos

Na pratica, dificilmente se conhece a covariancia observacional Vt ao longo do tempo.

O MLD com covariancias estocasticas e aprendizado por descontos contorna esta situacao

90

utilizando um passeio aleatorio por meio de uma evolucao estocastica Beta-Gama para

a sequencia de precisao observacional V−1t . Neste contexto, suponha um MLD com a

restricao Vt = σ2t In e ϕt = 1/σ2

t sendo definido por:

Equacao de Observacao: Yt = F′tθt + εt, εt ∼ N(0n, σ2t In), (E.2a)

Equacao de Evolucao: θt = Gtθt−1 + ωt, ωt ∼ Tnt−1(0p,Wt), (E.2b)

Equacao de Precisao: ϕt = γtϕt−1/δ∗, γt ∼ Beta(κt, κt), (E.2c)

Informacao Inicial: θ0|D0 ∼ Tn0(m0,C0),

ϕ0|D0 ∼ G(n0/2, d0/2). (E.2d)

com κt = δ∗nt−1/2 e κt = (1 − δ∗)nt−1/2. O parametro δ∗ ∈ [0, 1] atua como um fator

de desconto, i.e., quanto maior seu valor, menor o choque aleatorio para a covariancia

observacional. Quando δ∗ = 1, a covariancia se torna constante, i.e., Vt = V, ∀t.

As hipoteses usuais de independencia definidas na secao E.1 permanecem, no entanto,

condicionais a Vt. Especificado o modelo, determina-se as equacoes de atualizacao por:

– Distribuicao a posteriori no tempo t− 1:

θt−1|Dt−1 ∼ Tnt−1(mt−1,Ct−1) e ϕt−1|Dt−1 ∼ G(nt−1/2, dt−1/2);

– Distribuicao a priori no tempo t:

θt|Dt−1 ∼ Tnt−1(at,Rt) e ϕt|Dt−1 ∼ G(δ∗nt−1/2, δ∗dt−1/2),

onde at = Gtmt−1 e Rt = GtCt−1G′t + Wt;

– Previsao um passo a frente:

Yt|Dt−1 ∼ Tδ∗nt−1(ft,Qt),

onde ft = F′tat e Qt = F′tRtFt + St−1In com St−1 = dt−1/nt−1;

– Distribuicao a posteriori no tempo t:

θt|Dt ∼ N(mt,Ct) e ϕt|Dt ∼ G(nt/2, dt/2),

onde mt = at+Atet e Ct = (St/St−1)Rt−AtQtA′t com At = RtFtQ

−1t , et = yt−ft,

nt = δ∗nt−1 + 1, dt = δ∗dt−1 + St−1e′tQtet e St = dt/nt.

91

O algoritmo FFBS pode ser aplicado de forma analoga a demonstrada na secao E.5.

O passo Backward Sampling para os parametros ϕt com t = T − 1, ..., 0 e dado por:

ϕt|DT ∼ G(n∗t/2, d∗t/2),

onde n∗t = (1− δ∗)nt + δ∗nt+1 e d∗t = n∗tS∗t com S∗t = ((1− δ∗)/St + δ∗/S∗t+1)

−1 e valores

iniciais n∗T = nT e d∗T = dT .

Para demonstracoes e mais informacoes acerca desta configuracao de MLD, consulte

West e Harrison (1997) e Prado e West (2010). Aplicacoes podem ser encontradas em

Liu et al. (2009). Para a estimacao sequencial da covariancia observacional Vt ao longo

do tempo sem a restricao apresentada em (E.2), veja Triantafyllopoulos (2002).

92

Apendice F

Resultados Adicionais

De forma arbitraria, escolheu-se ilustrar os resultados na ıntegra, com respeito aos

parametros, para o ajuste feito no mes de outubro de ambas aplicacoes.

(a) β0 (b) β1

(c) φ (d) λ

Figura F.1: Cadeias MCMC para os parametro estaticos do modelo EMOS espacial na

aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha tracejada vertical

representa o perıodo de aquecimento.

93

(a) β0 (b) β1

(c) φ (d) λ

Figura F.2: Cadeias MCMC para os parametro estaticos do modelo EMOS espaco-

temporal na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha tracejada

vertical representa o perıodo de aquecimento.

(a) φ (b) λ

Figura F.3: Cadeias MCMC para os parametro estaticos do modelo GOP dinamico na

aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha tracejada vertical

representa o perıodo de aquecimento.

94

(a) β0 (b) β1 (c) φ (d) λ

(e) θ0 (f) θ1 (g) θ2

(h) θ3 (i) θ4 (j) θ5

Figura F.4: Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espacial na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha

tracejada representa a distribuicao a priori. Area sombreada representa o intervalo de

credibilidade de 95%.

(a) β0 (b) β1 (c) φ (d) λ

Figura F.5: Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espaco-temporal na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC.

Linha tracejada representa a distribuicao a priori. Area sombreada representa o intervalo

de credibilidade de 95%.

95

(a) θ0 (b) θ1 (c) θ2

(d) θ3 (e) θ4 (f) θ5

Figura F.6: Trajetoria a posteriori estimada para os parametros dinamicos do modelo

EMOS espaco-temporal na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC.

Linha contınua representa a media a posteriori. Area sombreada representa o intervalo

de credibilidade de 95%.

(a) σ2 (b) φ (c) λ

Figura F.7: Distribuicao a posteriori estimada para os parametros estaticos do modelo

GOP dinamico na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha

tracejada representa a distribuicao a priori. Area sombreada representa o intervalo de

credibilidade de 95%.

96

(a) θ0 (b) θ1 (c) θ2

(d) θ3 (e) θ4 (f) θ5

Figura F.8: Trajetoria a posteriori estimada para os parametros dinamicos do modelo

GOP dinamico na aplicacao diaria para 18 a 21 de outubro de 2016, 12 UTC. Linha

contınua representa a media a posteriori. Area sombreada representa o intervalo de

credibilidade de 95%.

97

(a) β0 (b) β1

(c) φ (d) λ

Figura F.9: Cadeias MCMC para os parametro estaticos do modelo EMOS espacial na

aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de outubro, 12 UTC.

Linha tracejada vertical representa o perıodo de aquecimento.

98

(a) β0 (b) β1

(c) φ (d) λ

Figura F.10: Cadeias MCMC para os parametro estaticos do modelo EMOS espaco-

temporal na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de outubro,

12 UTC. Linha tracejada vertical representa o perıodo de aquecimento.

(a) φ (b) λ

Figura F.11: Cadeias MCMC para os parametro estaticos do modelo GOP dinamico na

aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de outubro, 12 UTC.

Linha tracejada vertical representa o perıodo de aquecimento.

99

(a) β0 (b) β1 (c) φ (d) λ

(e) θ0 (f) θ1 (g) θ2

(h) θ3 (i) θ4 (j) θ5

Figura F.12: Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espacial na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de

outubro, 12 UTC. Linha tracejada representa a distribuicao a priori. Area sombreada

representa o intervalo de credibilidade de 95%.

(a) β0 (b) β1 (c) φ (d) λ

Figura F.13: Distribuicao a posteriori estimada para os parametros estaticos do modelo

EMOS espaco-temporal na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21

de outubro, 12 UTC. Linha tracejada representa a distribuicao a priori. Area sombreada

representa o intervalo de credibilidade de 95%.

100

(a) θ0 (b) θ1 (c) θ2

(d) θ3 (e) θ4 (f) θ5

(g) θ6

Figura F.14: Trajetoria a posteriori estimada para os parametros dinamicos do modelo

EMOS espaco-temporal na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a

21 de outubro, 12 UTC. Linha contınua representa a media a posteriori. Area sombreada

representa o intervalo de credibilidade de 95%.

(a) σ2 (b) φ (c) λ

Figura F.15: Distribuicao a posteriori estimada para os parametros estaticos do modelo

GOP dinamico na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de

outubro, 12 UTC. Linha tracejada representa a distribuicao a priori. Area sombreada

representa o intervalo de credibilidade de 95%.

101

(a) θ0 (b) θ1 (c) θ2

(d) θ3 (e) θ4 (f) θ5

(g) θ6

Figura F.16: Trajetoria a posteriori estimada para os parametros dinamicos do modelo

GOP dinamico na aplicacao horaria para 20 de de outubro de 2016, 13 UTC a 21 de

outubro, 12 UTC. Linha contınua representa a media a posteriori. Area sombreada

representa o intervalo de credibilidade de 95%.

102

Apendice G

Simulacao dos Modelos Propostos

G.1 Scripts

Scripts disponıveis em https://github.com/gomesleduardo/Calibration_

EtaModel.

G.2 Graficos de Simulacoes

(a) φ (b) λ

Figura G.1: Tracos das cadeias MCMC dos parametros estaticos (simulados) do modelo

GOP dinamico. Linha vermelha representa o valor verdadeiro.

103

(a) φ (b) λ

Figura G.2: Distribuicao a posteriori estimada para os parametros estaticos (simulados)

do modelo GOP dinamico. Linha vermelha representa o valor verdadeiro. Linha tracejada

representa a distribuicao a priori e linha contınua, a distribuicao a posteriori. Area

sombreada representa o intervalo de credibilidade de 95%.

(a) θ0 (b) θ1

(c) θ2 (d) θ3

Figura G.3: Trajetoria a posteriori estimada para os parametros dinamicos (simulados)

do modelo GOP dinamico. Linha vermelha representa o valor verdadeiro. Linha tracejada

representa a media a posteriori. Area sombreada representa o intervalo de credibilidade

de 95%.

104

(a) β0 (b) β1

(c) φ (d) λ

Figura G.4: Tracos das cadeias MCMC dos parametros estaticos (simulados) do modelo

EMOS espaco-temporal. Linha vermelha representa o valor verdadeiro.

105

(a) β0 (b) β1

(c) φ (d) λ

Figura G.5: Distribuicao a posteriori estimada para os parametros estaticos (simulados)

do modelo EMOS espaco-temporal. Linha vermelha representa o valor verdadeiro. Linha

tracejada representa a distribuicao a priori e linha contınua, a distribuicao a posteriori.

Area sombreada representa o intervalo de credibilidade de 95%.

106

(a) θ0 (b) θ1

(c) θ2 (d) θ3

Figura G.6: Trajetoria a posteriori estimada para os parametros dinamicos (simulados)

do modelo EMOS espaco-temporal. Linha vermelha representa o valor verdadeiro. Linha

tracejada representa a trajetoria estimada. Area sombreada representa o intervalo de

credibilidade de 95%.

107