final tcc de rafaela 000 parte 1...universidade federal do rio grande do norte - ufrn sistema de...

54
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA BACHARELADO EM METEOROLOGIA RAFAELA DOS SANTOS GOMES MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA AMOSTRADOR DE GIBBS NATAL 2017

Upload: others

Post on 01-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE CIÊNCIAS EXATAS E DA TERRA

BACHARELADO EM METEOROLOGIA

RAFAELA DOS SANTOS GOMES

MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA

AMOSTRADOR DE GIBBS

NATAL

2017

Page 2: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Rafaela dos Santos Gomes

MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA

AMOSTRADOR DE GIBBS

NATAL

2017

Monografia apresentada à Coordenação do Curso de Meteorologia da Universidade Federal do Rio Grande do Norte, como requisito parcial à obtenção do Título de Bacharel em Meteorologia. Orientador: Prof. Dr. Paulo Sergio Lúcio

Page 3: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Universidade Federal do Rio Grande do Norte - UFRN

Sistema de Bibliotecas - SISBI

Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial Prof. Ronaldo Xavier de Arruda - CCET

Gomes, Rafaela dos Santos.

Modelo estocástico de série sintética de precipitação via Amostrador de Gibbs / Rafaela dos Santos Gomes. - 2017.

54f.: il.

Monografia (Bacharelado em Meteorologia) - Universidade

Federal do Rio Grande do Norte. Centro de Ciências Exatas e da

Terra. Departamento de Ciências Atmosféricas e Climáticas. Natal, RN, 2017.

Orientador: Paulo Sérgio Lucio.

1. Meteorologia - Monografia. 2. Precipitação - Monografia. 3.

Séries sintéticas - Monografia. 4. Simulação - Monografia. 5.

Amostrador de Gibbs - Monografia. I. Lucio, Paulo Sérgio. II.

Título.

RN/UF/CCET CDU 551.5

Page 4: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Rafaela dos Santos Gomes

MODELO ESTOCÁSTICO DE SÉRIE SINTÉTICA DE PRECIPITAÇÃO VIA

AMOSTRADOR DE GIBBS

Trabalho de conclusão de curso de graduação apresentado ao Departamento

de Ciências Atmosféricas e Climáticas da Universidade Federal do Rio Grande

do Norte como requisito para a obtenção do título de Bacharel(a) em

Meteorologia.

Aprovado em:_____de_____de_____.

BANCA EXAMINADORA

_________________________________________________

Paulo Sergio Lucio (DCAC/UFRN)

(Orientador)

_________________________________________________

Cláudio Moisés Santos e Silva (DCAC/UFRN)

_________________________________________________

Marconio Silva dos Santos (DMAT/UFRN)

Page 5: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Is this the real life?

Is this just fantasy?

Bohemian Rhapsody-Queen

Page 6: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Agradecimentos

À Deus.

À minha família.

Aos meus amigos.

À Marlúcia Elias de Farias, grande amiga e grande conselheira.

Aos integrantes da Gerência de Meteorologia da EMPARN.

Aos meus orientadores de Iniciação Científica, Bergson e Paulo.

À todos que compõem o Departamento de Ciências Atmosféricas e Climáticas.

Page 7: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

LISTA DE TABELAS

Tabela 1. Erros da precipitação simulada para o mês de janeiro. .................. 26

Tabela 2. Erros da precipitação simulada para o mês de março. ................... 31

Tabela 3. Estatística descritivas para as séries observadas e simuladas. ...... 31

Page 8: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

LISTA DE FIGURAS

Figura 1. Série temporal da precipitação pluvial diária do mês de janeiro e março

observada para a cidade de Natal-RN no período 1992-2017. .......................... 4

Figura 2. Simulação da precipitação gerada por: A) modelos estocástico Holt-

Winters. B) modelo numérico dinâmico hidrostático Reg-CM.4.6. ..................... 6

Figura 3. Exemplo de uma simulação utilizando o amostrador de Gibbs com

......... 9

Figura 4. Função densidade de probabilidade da distribuição Binomial Negativa.

......................................................................................................................... 11

Figura 5. Exemplo de Função densidade de probabilidade da distribuição Beta

com assimetria e simetria. ................................................................................ 13

Figura 6. Área de estudo englobando a localização do pluviômetro dentro da

cidade de Natal-RN .......................................................................................... 14

Figura 7. Histograma da série de precipitação diária para todos os dias de

janeiro e de março. ........................................................................................... 17

Figura 8. Histograma dos dados gerados pela distribuição binomial com n = 806

e p = para o mês de janeiro. ...................................................................... 18

Figura 9. Histograma dos dados gerados pela distribuição binomial com

e para o mês de março. ............................................................. 19

Figura 10. Histograma dos dados gerados pela distribuição de Poisson para

para o mês de janeiro ........................................................................ 20

Figura 11

0,39 para o mês de março................................................................................ 20

Figura 12. A) Histograma dos dados gerados pela distribuição Beta para o mês

de janeiro e B) Função de densidade de probabilidade de uma distribuição Beta.

......................................................................................................................... 21

Figura 13. Histograma dos dados gerados pela distribuição Beta para o mês de

março. .............................................................................................................. 21

Figura 14. Gráfico de séries de tempo sintética, de autocorrelação amostral para

as distribuições Beta, Binomial e Poisson para o mês de janeiro. ................... 23

Page 9: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 15. Série temporal sintética combinada da amostra gerada pelo

Amostrador de Gibbs para 161 meses de janeiro. ........................................... 24

Figura 16. Histograma da série temporal sintética combinada da amostra

Gerada pelo Amostrador de Gibbs para 161 meses de janeiro. O histograma e a

densidade foi obtido a partir da soma dos amostras geradas com distribuição

Beta e Possion. ................................................................................................ 25

Figura 17. Gráfico da série de tempo sintética com a distribuição Binomial

gerada pelo Amostrador de Gibbs. ................................................................... 25

Figura 18. Diagrama de dispersão entre a precipitação simulada e a observada

para o mês de janeiro. ...................................................................................... 26

Figura 19. Gráfico de séries de tempo sintética, de autocorrelação amostral para

as distribuições Beta, Binomial e Poisson para o mês de março. .................... 27

Figura 20. Série temporal sintética combinada da amostra gerada pelo

Amostrador de Gibbs para 161 meses de março. ............................................ 28

Figura 21. Histograma da série temporal sintética combinada da amostra

Gerada pelo Amostrador de Gibbs para 161 meses de março. O histograma e a

densidade foi obtido a partir da soma dos amostras geradas com distribuição

Beta e Possion. ................................................................................................ 29

Figura 22. Gráfico da série de tempo sintética para a distribuição Binomial

gerada pelo Amostrador de Gibbs. ................................................................... 30

Figura 23. Diagrama de dispersão entre a precipitação simulada e a observada

para o mês de março. ...................................................................................... 30

Page 10: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

RESUMO

O avanço da computação e da estatística tem permitido o surgimento de novos

métodos de previsão de tempo e clima com uso em diversas áreas, bem como

a combinação de algum deles, sempre buscando a melhor estimativa,

minimizando os erros. Esse avanço deve-se principalmente ao número cada vez

maior de informações disponíveis. Porém, ainda existe limitações quanto ao uso

de ferramentas para a previsão ou simulação da variável precipitação

pluviométrica. Ultimamente, vários métodos para simular a precipitação tem sido

desenvolvidos com base em diferentes metodologias. A precipitação pluvial é

uma variável dicífil de ser prevista devido o seu comportamento variante no

espaço e no tempo. Diante disso, propõe-se desenvolver um modelo de

simulação de séries sintéticas de precipitação, via Amostrador de Gibbs

considerando as distribuições Beta, Binomial e Poisson, de forma que as séries

geradas apresentem as mesmas características das séries históricas.

Comparou-se o desempenho do modelo simulando o mês de janeiro e o mês de

março. Na aplicação prática feita neste trabalho pode-se constatar a eficiência

do Algoritmo de Gibbs. As estimativas simuladas para precipitação diária foram

muito próximas dos valores observados, os menores erros, bem como a a maior

correlação foram encontrados na simulação para o mês de março.

Page 11: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

ABSTRACT

The advancement of computing and statistics with the use of weather and climate

forecasting methods with use in several areas, as well as a combination of them,

always seeking a better estimate, minimizing errors. This advancement develops

more and more and more of the available information. However, there are still

limitations to the use of tools for a rainfall forecast or simulation. Lately, several

methods to simulate a precipitation have been developed based on different

methodologies. A rainfall and a variable of information on the supply of its variant

behavior in space and time. Therefore, it is proposed to develop a simulation

model of synthetic precipitation series, using Gibbs Sampler considering Beta,

Binomial and Poisson distributions, in the same way as generated series present

as own property of the historical series. The performance of the model was mod-

eled simulating the month of January and the month of March. In the practice

practiced in the work one can verify the efficiency of the Gibbs Algorithm. The

simulated estimates for the daily precipitation were very close to the observed

values, the smaller errors, as well as a greater fortified correlation in the simula-

tion for the month of March.

.

Page 12: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

SUMÁRIO

1 INTRODUÇÃO ............................................................................................ 1

1.2 Objetivo Geral ........................................................................................... 3

1.3 Objetivos Específicos ................................................................................ 3

1.4 FUNDAMENTAÇÃO TEÓRICA ................................................................. 3

1.4.1 Séries Temporais ................................................................................ 3

1.4.2 Simulações ......................................................................................... 5

1.4.3 Simulação de dados meteorológicos sintéticos .................................. 7

1.1.4 Inferência Bayesiana .......................................................................... 7

1.4.5 Amostrador de Gibbs .......................................................................... 9

1.4.6 Distribuições de Probabilidades utilizadas ........................................ 10

2 MATERIAL E MÉTODOS .......................................................................... 14

3 RESULTADOS .......................................................................................... 17

4 DISCUSSÕES ........................................................................................... 33

5 CONCLUSÕES ......................................................................................... 34

6 REFERÊNCIAS ......................................................................................... 36

7 ANEXOS .................................................................................................... 39

Page 13: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

1. INTRODUÇÃO

O avanço da computação e da estatística tem permitido o surgimento de

novos métodos de previsão com uso em diversas áreas, bem como a

combinação de algum deles, sempre buscando a melhor estimativa,

minimizando os erros. Esse avanço deve-se principalmente ao número cada vez

maior de informações disponíveis. Porém, ainda existem limitações quanto ao

uso de ferramentas para a previsão ou simulação da variável precipitação

pluviométrica.

O conhecimento das precipitações prováveis é de extremo interesse para

o dimensionamento de vertedouros de barragens, de canais, galerias pluviais,

bueiros e barragens de abastecimento de água (VILLELA e MATTOS, 1975) e

para o planejamento agrícola e dimensionamento de sistema de irrigação

complementar (BERNARDO, 1995). A precipitação provável é a precipitação

pluviométrica que apresenta probabilidade específica de ocorrência, baseada

em uma longa série de dados (FRIZZONE, 1979).

A cidade de Natal, apesar de ter um balanço hídrico mais regular devido

à maior e melhor distribuição de chuvas e sua composição geológica que permite

o armazenamento subterrâneo da água, também está vulnerável à escassez

hídrica (ANDRADE NETO, 2017). Isso fica evidente ao se observar o longo

período de baixas precipitações nos últimos anos que afetou o sistema de

abastecimento do município e levou à adoção de um sistema de rodízio na Zona

Norte da cidade, devido ao rebaixamento do nível da Lagoa de Extremoz,

principal manancial da região (CAERN, 2017).

O regime hídrico da cidade de Natal depende da ocorrência de diversos

fenômenos de escala global, sinótica e de mesoescala que variam sozonalmente

no espaço e no tempo, no qual se destaca o deslocamento para sul da Zona de

Convergência Intertropical - ZCIT, sistema destacado por Ferreira (1996) como

o principal sistema gerador de precipitação na região norte do nordeste brasileiro

(NNEB).

Page 14: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Dentro do conjunto das variáveis meteorológicas, a precipitação tem sido

a mais difícil de ser prevista com precisão através dos diversos modelos

numéricos e estatísticos existentes. Espinosa (2011) relata que um dos

principais motivos da baixa previsibilidade da precipitação é devido ao seu

comportamento episódico, ou seja, altamente variável no espaço e no tempo,

além da sua descontinuidade espacial e temporal.

Sendo a precipitação uma variável aleatória, ou seja, seu valor numérico não

pode ser predito com certeza, antes que o evento ocorra (BENJAMIN &

CORNELL, 1970), a modelagem do seu valor pode ser feita estocasticamente.

Segundo WHEATER et al. (2000), nesse tipo de modelagem, o comportamento

determinístico detalhado é substituído por suposições estocásticas simples,

onde um pequeno número de parâmetros com interpretação física do processo

modelado é utilizado para a representação deste.

A escolha de modelar séries temporais de chuva de maneira estocástica,

deve-se à complexidade e forte dependência das condições iniciais que

desencadeiam o processo de precipitação (CALENDA e NAPOLITANO, 1999).

A forma estocástica tradicional de modelar a precipitação utiliza cadeias

de Markov para simular a ocorrência da precipitação. De acordo com

HUTCHINSON (1990) a quantidade de chuva precipitada é simulada, nesse

caso, através de uma distribuição de probabilidade.

A inferência foi feita adotando-se a abordagem Bayesiana e, como a

distribuição a posteriori não é analiticamente tratável, usou-se o Método de

Monte Carlo via Cadeias de Markov (Markov Chain Monte Carlo, MCMC), em

especial, o Algoritimo do Amostrador de Gibbs.

Page 15: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

1.2 Objetivo Geral

O principal objetivo desse trabalho é desenvolver um modelo de

simulação de séries sintéticas de precipitação, via Amostrador de Gibbs

considerando as distribuições Beta, Binomial e Poisson, de forma que as séries

geradas apresentem as mesmas características das séries históricas.

1.3 Objetivos Específicos

Verificar o desempenho do modelo para um mês seco e um mês chuvoso.

Desenvolver uma ferramenta acessível para gerar séries sintéticas de

precipitação diária de forma mais genérica, baseando-se nas condições

pluviométricas observadas.

Contribuir para o desenvolvimento e para o aperfeiçoamento de

metodologias que auxiliem na previsão climática, na gestão dos recursos

hídricos e na agricultura de forma geral.

1.4 FUNDAMENTAÇÃO TEÓRICA

1.4.1 Séries Temporais

Oliveira (2003), desenvolvedor do modelo CLIMABR, definiu série

temporal como qualquer conjunto de observações ordenadas no tempo ou

também como um conjunto de observações geradas sequencialmente no tempo,

podendo ser discretas, contínuas ou ambas, dependendo do conjunto de

observações. A precipitação é uma variável contínua, pois pode assumir

qualquer valor de um determinado intervalo.

Para uma definição formal de série temporal necessita-se primeiramente

conceituar um processo estocástico. Um processo estocástico é qualquer

fenômeno estatístico que evolui no tempo de acordo com leis probabilísticas.

Page 16: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Pode-se entendê-lo como um modelo que descreve a estrutura probabilística de

uma sequência de observações (BOX, JENKINS e REINSEL, 1994).

Dessa forma, assume-se que cada valor de uma série

é extraído aleatoriamente de uma distribuição de probabilidade. Assim, se fosse

possível especificar a função de distribuição de probabilidade de uma

determinada série temporal, seria possível determinar também a probabilidade

de um resultado futuro da série.

Figura 1. Série temporal da precipitação pluvial diária do mês de janeiro e março

observada para a cidade de Natal-RN no período 1992-2017.

Fonte: Elaborado pela autora.

A Figura 1 apresenta a série temporal de precipitação pluvial mensal para

a cidade de Natal, para os anos de 1988 a 2016, onde observa-se claramente

um comportamento sazonal definido como período chuvoso e seco. A maioria

dos métodos de previsão estatística é baseada na utilização de dados históricos

a partir de uma série de temporal. Se os dados passados são indicativos do que

se esperar no futuro, pode-se postular um modelo matemático que é

representativo do processo. O modelo pode então ser usado para gerar

previsões. Em situações reais, geralmente não se tem conhecimento da forma

exata do modelo que gera a série temporal. Assim, faz-se necessário escolher

Page 17: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

um modelo aproximado ou um modelo que combine as previsões, por meio de

somas, médias ou médias ponderadas.

1.4.2 Simulações

representação do funcionamento de um processo, fenômeno ou sistema

relativamente complexo, por meio de um outro, gerado para fins científicos de

observação, análise e predição, ou para treinamento,

O significado e a utilização da simulação vão além de semelhanças

visuais ou sensoriais, representando ainda, ideias ou conceitos análogos. Dessa

forma, um estudo simulado pode fornecer novos conhecimentos sobre o objeto

que inspira o estudo. Esta é a aplicação científica da simulação. A simulação

contribui significativamente tanto para a teoria como para a prática (BARTON,

1973). De uma forma geral, entende-se que o ato de simular significa elaborar,

empregar e explorar modelos para reprodução, representação ou imitação de

fenômeno, situação ou processo concreto.

Simas (2003) dividiu os modelos de simulações em dois tipos:

1.4.2.1 Simulação determinística:

O sistema não depende de nenhuma variável probabilística (aleatória).

A única forma de obter diferentes saídas da simulação é por intermédio

da modificação das variáveis de entrada.

1.4.2.2 Simulação estocástica:

O sistema depende de variáveis probabilísticas (aleatórias). É possível

obter diferentes saídas da simulação a partir de um mesmo conjunto de

variáveis de entrada. Nesse tipo de simulação é possível avaliar o

Page 18: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

comportamento do modelo e das variáveis aleatórias (investigação da

distribuição amostral).

As simulações estocásticas são largamente utilizadas em tomadas de

decisões.

A Figura 2 representa a simulação da precipitação pluvial a partir de dois

métodos distintos: o primeiro é considerado pela classificação de SIMAS (2003)

como simulação estocástica e o segundo pode ser considerado como simulação

determinística.

A base científica para as previsões numéricas de clima deriva

principalmente da previsibilidade das condições de contorno, sobretudo da

temperatura da superfície do mar (TSM) e da grande influência desta na

determinação das condições atmosféricas futuras (PALMER e ANDERSON,

1994; SHUKLA, 1998, 2000b). Contudo, a maior limitação das simulações ou

previsões decorre da natureza caótica da atmosfera e independe do modelo ou

das variáveis de entrada (SAMPAIO e DIAS, 2014).

De modo geral, algumas simulações estocásticas utilizam realizações das

distribuições de probabilidades das variáveis de entrada, processam essas

informações dentro do modelo específico, e obtém como saída os valores da

distribuições de probabilidade da variável resultante, o que ocorre, por exemplo,

com os métodos de Monte Carlo via Cadeia de Markov.

Figura 2. Simulação da precipitação gerada por: A) modelos estocástico Holt-

Winters. B) modelo numérico dinâmico hidrostático Reg-CM.4.6.

A) B)

Fonte: Elaborado pela autora.

Page 19: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

1.4.3 Simulação de dados meteorológicos sintéticos

Os simuladores climáticos são modelos que representam a ocorrência de

variáveis climáticas e têm por objetivo a simulação de um conjunto de valores

numéricos, denominado série sintética, com as mesmas características

estatísticas da série histórica (BAENA, 2004).

Um exemplo de simulador climático é o modelo CLIGEN-CLImate

GENeratior, que foi desenvolvido por NICKS el al. (1995) e usa estatística de

dados climáticos históricos observados para estação com o objetivo de gerar

uma série temporal de dados diários de precipitação, temperatura do ar, radiação

solar, temperatura do ponto do orvalho, além de direção e velocidade do vento.

Virgens Filho (1997) idealizou o modelo GEPAC Gerador Estocástico de

Parâmetros Climáticos, para geração de dados diários de precipitação, radiação

solar global, temperatura do ar e umidade relativa do ar. Para tal feito, o autor

utilizou as distribuições de probabilidade Gama, Normal e Exponencial Negativa.

Oliveira (2003) desenvolveu o CLIMABR - Gerador de Série Sintética de

Precipitação, que permite a obtenção de informações sobre precipitação

estruturada de tal forma para que se obtenha, para cada dia chuvoso, o total

precipitado, a duração do evento, além dos parâmetros necessários para a

representação de perfil de precipitação instantânea.

1.1.4 Inferência Bayesiana

Primeiramente, para entender alguns conceitos a seguir, é importante

deixar claro a definição de dois termos:

Distribuição de Probabilidade a priori

Page 20: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

A utilização de informação a priori em inferência Bayesiana requer a

especificação de uma distribuição a priori para a quantidade de interesse . Esta

distribuição deve representar (probabilisticamente) o conhecimento que se tem

sobre antes da realização do experimento.

Distribuição de Probabilidade a posteriori

A probabilidade a posteriori de um evento aleatório ou uma proposição

incerta é a probabilidade condicional que é atribuída quando a evidência

relevante é levada em conta. Ela pode ser calculada com o teorema de Bayes,

multiplicando-se a distribuição da probabilidade a priori pela função de

verossimilhança e depois dividindo-a pela constante de normalização.

A diferença fundamental entre a inferência estatística e a Bayesiana é que

a última utiliza as chamadas distribuições de probabilidade a priori. Em suma,

tais distribuições buscam implementar informações subjetivas sobre o processo

em questão, através de funções de probabilidades. A inferência Bayesiana utiliza

as distribuições a priori, e pondera tais informações com os dados observados

amostralmente na busca dos valores mais adequados dos parâmetros. A

Estatística Bayesiana, porém, permite a atualização dessa distribuição com base

em informações fornecidas pela amostra.

Silveira (2008) destaca que, atualmente, há duas correntes de inferência

estatística: a frequentista e a Bayesiana. A principal diferença entre elas é que

na inferência Bayesiana, informações prévias sobre a variável de interesse

podem ser incorporadas às análises. As informações a priori, para serem

devidamente incorporadas na análise, devem ser traduzidas em uma distribuição

de probabilidade. Tal distribuição do parâmetro populacional é chamada de

distribuição a priori. Caso seja interessante considerar informações subjetivas,

estas devem ser devidamente traduzidas em funções de distribuição de

probabilidade, para que possam ser incorporadas na análise. A distribuição de

densidade a priori, portanto, denota o grau de conhecimento acumulado sobre o

processo, antes da observação dos dados amostrais.

Page 21: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Em inferência Bayesiana, a distribuição a posteriori dos parâmetros,

frequentemente é desconhecida, portanto uma alternativa é um método que

simule esta distribuição. Os métodos de Monte Carlo baseados na simulação de

variáveis aleatórias de uma Cadeia de Markov, são, atualmente, a maneira usual

de fazer uma análise Bayesiana dos dados, chamados de Métodos de Monte

Carlo via Cadeias de Markov (MCMC).

Em casos que os modelos apresentam uma distribuição a priori não-

conjugada, deve-se utilizar outros métodos para o cálculo das distribuições a

posteriori. Entre os algoritmos MCMC mais aplicados estão o Amostrador de

Gibbs e Metropolis-Hastings. As descrições de ambos podem ser encontradas,

mais detalhadamente, em MIGON e GAMERMAN (1999).

1.4.5 Amostrador de Gibbs

O método de amostragem Gibbs, foi proposto por Geman e Geman em

1984, no âmbito do problema de reconstrução de imagens, e tornado popular

entre os Estatísticos, após a publicação do trabalho seminal de Gelfand e Smith

(1990). Seu objetivo é chegar à distribuição conjunta a posteriori.

O algoritmo de simulação proposto define uma cadeia de Markov que, sob

condições muito gerais, tem como distribuição limite a distribuição conjunta que

se pretende simular. Assim, simulando-se os estados da cadeia por um longo

período de tempo de modo a garantir que o equilíbrio seja atingido, pode-se

construir uma amostra da distribuição multivariada à custa dos estados da cadeia

assim gerada (TURKMAN, 2000).

A Figura 3 apresenta um exemplo de uma amostra gerada pelo

Amostrador de Gibbs com a distribuição Beta com parâmetros

1, respectivamente e a sua função de autocorrelação correspondente.

Figura 3. Exemplo de uma simulção utilizando o amostrador de Gibbs com

distribuição Beta para gerar amostras com 50000 iterações, =3 e =1.

Page 22: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Fonte: Elaborado pela autora.

A ideia básica do Amostrador de Gibbs é tornar um problema multivariado

numa sequência de problemas univariados, entre os quais itera-se para produzir

uma cadeia de Markov. O Amostrador pode ser visualizado como uma

implementação prática do fato de que o conhecimento das distribuições

condicionais é suficientes para determinação da distribuição conjunta se ela

existir.

1.4.6 Distribuições de Probabilidades utilizadas

1.4.6.1 Distribuição Binomial

Uma variável aleatória com distribuição Binomial representa o número de

sucessos obtidos em experimentos com probabilidade p de sucesso. Em que

pode ser o número de ocorrências de chuva em um mês e a probabilidade

de ocorrência desse evento em um determinado mês para qualquer ano. O

número total de sucessos é uma variável aleatória com distribuição binomial

com parâmetros e e é denotada por .

Então a probabilidade de X=x, pode ser obtida a partir da seguinte equação:

Eq. (1)

A média de um variável aleatória binomial é e a variância é

Page 23: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Uma Função de densidade de probabilidade (FDP) é uma função que

descreve a probabilidade relativa de uma variável aleatória, ou seja, ajuda a

identificar regiões de probabilidades superiores e inferiores para os valores de

uma variável aleatória. A Figura 4 mostra um exemplo de FDP da distribuição

Binomial Negativa, que é definida pela Sequência de ensaios Bernoulli

independentes (generaliza a geométrica) com 100 ensaios.

Figura 4. Função densidade de probabilidade da distribuição Binomial Negativa.

Fonte: Elaborado pela autora.

1.4.6.2 Distribuição de Poisson

Uma outra distribuição comum é a distribuição Poisson, e é

frequentemente usada para modelar o número de ocorrências de um evento por

um certo período de tempo ou por um certo volume ou por uma certa área.

A distribuição Poisson tem apenas um parâmetro , que é interpretado como

uma taxa média de ocorrência do evento, e a probabilidade de ocorrerem

exatamente x eventos é dada por:

Page 24: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Eq. (2)

1.4.6.3 Distribuição Beta

A distribuição Beta é uma distribuição de probabilidade contínua, com dois

parâmetros positivos e , cuja função de densidade para valores é

Eq. (3)

No modelo, os parâmetros e definem a forma da distribuição. Se

, a distribuição é simétrica; se , a assimetria é negativa e, no caso de

, sua assimetria é positiva.

Nesse exemplo da Figura 5, o ponto mais importante é se os parâmetros

são maiores ou menores a 1. A função fica em formato de U quando e são

frações positivas e simétricas. Se a = b = 1, obtemos a distribuição uniforme em

[0,1].

Page 25: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 5. Exemplo de Função densidade de probabilidade da distribuição Beta

com assimetria e simetria.

Fonte: CRAWLEY (2013).

Page 26: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

2 MATERIAIS E MÉTODOS

Os dados em análise referem-se às séries históricas de precipitação

acumulada diária da cidades de Natal, capital do estado do Rio Grande do Norte.

Os dados foram captados por pluviômetro e disponibilizados no site da Empresa

de Pesquisa Agropecuária do Rio Grande do Norte-EMPARN. O pluviômetro

encontra-se localizado dentro da estação climatológica do Instituto Nacional de

Meteorologia-INMET, sob as seguintes coordenadas geográficas, latitude

5,916667ºS e longitude 35,2°W, conforme está apresentado na Figura 6.

Figura 6. Área de estudo englobando a localização do pluviômetro dentro da

cidade de Natal-RN

Fonte: Elaborado pela autora.

A série de dados utilizada nesse trabalho abrange ao todo 25 anos de

dados históricos (1992-2017). Para dar continuidade a metodologia, os dados

foram separados por meses, agrupando apenas os dias. Os meses escolhidos

Page 27: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

foram os meses de janeiro e março, ambos meses de 31 dias, sendo janeiro o

escolhido para representar o mês seco e março para o mês chuvoso. Em posse

dos dados, foi definida os parâmetros das distribuições para ser inseridas no

Algoritmo de Gibbs.

A distribuição Poisson possui apenas um parâmetro , que é interpretado

como uma taxa média de ocorrência do evento. Logo, aplicou-se a distribuição

Poisson em dias que ocorreram eventos extremos, para exemplificação do

modelo, considerou-se qualquer valor de precipitação abaixo de 5 mm.

A distribuição Beta é uma distribuição de probabilidades contínua, com

. A distribuição beta pode ser usada na análise bayesiana

para descrever conhecimentos iniciais sobre a probabilidade de sucesso. Por

exemplo, a probabilidade de ter ocorrido uma precipitação em um certo mês.

Em seguida, as probabilidades e os parâmetros da distribuição foram

inseridas no Algoritmo de Gibbs, descrito a seguir:

Para descrever o algoritmo suponha que a distribuição de interesse é em

que Cada uma das componentes pode ser um escalar ou

um vetor.

1. Inicialize o contador de iterações da cadeia e especifique valores

iniciais ;

2. Obtenha os novos valores de através de

gerações sucessivas de valores;

. . .

3. Atualize o contador para e volte ao passo 2 até a convergência ser

alcançada.

Page 28: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Após a convergência, os valores resultantes formam uma amostra de

. Este algoritmo é extremamente útil quando a forma das distribuições

condicionais completas são conhecidas.

Todos as rotinas foram implementados usando funções pré-existentes do

software estatístico R, na versão 3.3.2 e no Rstudio, podendo ser encontrados

no Anexo. Para organizar os dados, utilizou-se o software Excel 2013, editor de

planilhas do Office. E por fim, para a confecção do mapa da área de estudo,

utilizou-se o Software de geoprocessamento Quantum GIS 2.16.3.

De posse dos dados da série sintética de precipitação, foi feita uma

análise estatística de erros utilizando para avaliar o nível de concordância

existente as referidas metodologias. A referida análise estatística constou do

cálculo do Erro Médio de Bias (MBE) e do Erro Relativo do Quadrado Médio

(RMSE) (WIilks, 2006).

A partir dos cálculos dos erros será possível inferir a qualidade do modelo

para gerar amostras de precipitação sintéticas.

Page 29: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

3 RESULTADOS

A figura abaixo mostra o histograma da precipitação diária durante os

meses de janeiro e março, para a cidade de Natal/RN. Um histograma é a

representação gráfica de uma distribuição de frequência. Para ambos meses, o

valor que ocorre com mais frequência é o zero, porém, para o mês de janeiro o

valor zero ocorreu aproximadamente 500 vezes, enquanto que para o mês de

março, o zero ocorreu em aproximadamente 350 vezes. O que caracteriza o mês

de março como chuvoso, nesse caso, é a ocorrência em maior frequência dos

valores de precipitação acima de 30 mm por dia.

Figura 7. Histograma da série de precipitação diária para todos os dias de

janeiro e de março.

Fonte: Elaborado pela autora.

Page 30: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Tendo em vista que os valores abaixo de 20 mm ocorrem com mais

frequência definiu-se esse valor como limiar para a realização das séries

sintéticas. Em seguida, definiu-se os parâmetros das distribuições Binomial,

Poisson e Beta.

Os parâmetros foram escolhidos com base nos critérios de aplicação de

cada probabilidade, em que:

Para gerar valores da distribuição Binomial durante o mês de janeiro,

considerou-se a não ocorrência de chuva ou . A média de dias que

não choveu nos últimos 25 anos é de 21 dias por mês. Logo, para cada mês de

janeiro na cidade de Natal a probabilidade de não ocorrência de chuva é em

torno de .

Figura 8. Histograma dos dados gerados pela distribuição binomial com n = 806

e p = para o mês de janeiro.

Fonte: Elaborado pela autora.

Para gerar valores da distribuição Binomial durante o mês de março,

considerou-se a não ocorrência de chuva ou . A média de dias que

não choveu nos últimos 25 anos é de 17 dias por mês. Logo, para cada mês de

janeiro na cidade de Natal a probabilidade de não ocorrência de chuva é em

torno de .

Page 31: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 9. Histograma dos dados gerados pela distribuição binomial com

e para o mês de março.

Fonte: Elaborado pela autora.

Aplicou-se a distribuição de Poisson para dias que ocorreram eventos

extremos, raros. Aqui vamos considerar, para exemplificação, considerou-se

valores de precipitação abaixo de 5 mm. O parâmetro foi definido de modo

que para o mês de janeiro seja igual a e para o mês de março seja igual

a

Geralmente, os valores extremos, raros de precipitação testado nesse

modelo deveriam ser com base nos maiores valores observados, porém, caso

fosse utilizados os maiores valores observados, a série sintética poderia capitiar

esse comportamento e aumentar todos os valores gerados, causando um

discrepância em relação a série histórica. Então, procurou-se modelar os valores

que ocorrem com mais frequências.

Page 32: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 10. Histograma dos dados gerados pela distribuição de Poisson para

para o mês de janeiro

Fonte: Elaborado pela autora.

Figura 11. Histograma dos dados gerados pela

0,39 para o mês de março.

Fonte: Elaborado pela autora.

Para a distribuição Beta, considerou-se que durante os meses de janeiros

a precipitação que ocorre com maior frequência está toda concentrada abaixo

de 10 mm, temos que a probabilidade de ocorrência desses valores é alta. Os

parâmetros na média e variância da série

de precipitação diária do mês de janeiro e do mês março. A probabilidade de ter

ocorrido a precipitação abaixo de 10mm em um mês de janeiro é apresentada

Page 33: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

pela Figura 12A. A Figura 13 mostra o histograma dos dados de precipitação

para o mês de março gerados pela distribuição Beta.

Fonte: A) Elaborado pela autora. B) CRAWLEY (2013).

Figura 13. Histograma dos dados gerados pela distribuição Beta para o mês de

março.

Fonte: Elaborado pela autora.

para o mês de janeiro foram

respectivamente e , o

definem a forma da distribuição, se , a distribuição é simétrica. A Figura

Figura 12. A) Histograma dos dados gerados pela distribuição Beta para o mês

de janeiro e B) Função de densidade de probabilidade de uma distribuição Beta.

Page 34: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

12B mostra um exemplo de uma distribuição Beta simétrica obtida

CRAWLEY (2013), para uma função f(x) em que seus parâmetros

. Para o mês de março os parâmetros foram

os seguintes: e .

Em seguida, implementou-se o algoritmo de Gibbs no software R para

simular as precipitações diárias de 161 janeiros, ou seja, 5000 iterações ,

considerando as distribuições e condições citadas anteriormente. Em um

computador com processador Intel Core i5 o código copilado demorou cerca de

30 segundos para gerar as amostras. Aumentando-se para 50000 interações, a

copilação do código demoraria 1 minuto, e assim sucessivamente.

Aplicando-se o esquema iterativo do algoritmo de Gibbs para as

distribuições, Beta, Binomial e Poisson, gerou-se uma sequência de

e as funções de autocorrelação (ACF).

Page 35: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

3.1 SIMULAÇÃO PARA O MÊS DE JANEIRO

De acordo com a Figura 14 observa-se que as amostras geradas não

estão muito correlacionadas, pois os valores da série de tempo sintética não

permanecem no mesmo ponto, ou seja, não apresenta estacionariedade.

Gerados os valores dessas distribuições foi possível obter as estatísticas de

interesse para a precipitação sintética gerada com as distribuições, Beta,

Binomial e Poisson.

Figura 14. Gráfico de séries de tempo sintética, de autocorrelação amostral para

as distribuições Beta, Binomial e Poisson para o mês de janeiro.

Fonte: Elaborado pela autora.

A Figura 15 mostra a série temporal sintética da amostra gerada pelo

amostrador de Gibbs para 5000 iterações (m), combinando as distribuições Beta

e Poisson. Nota-se, que as amostras geradas não ultrapassam 25 mm, pois esse

modelo não busca simular os extremos e sim os valores que ocorrem com maior

frequência.

Page 36: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 15. Série temporal sintética combinada da amostra gerada pelo

Amostrador de Gibbs para 161 meses de janeiro.

Fonte: Elaborado pela autora.

O histograma da Figura 16 da série temporal sintética combinada da

amostra gerada pelo Amostrador de Gibbs para as 5000 interações (

apresenta uma forma distinta, em que é possível notar tanto as características

da distribuição Beta quantos as características da distribuição de Poisson. As

maiores frequências estão centradas no acumulado diário de chuva abaixo de

10 mm.

Page 37: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 16. Histograma da série temporal sintética combinada da amostra

Gerada pelo Amostrador de Gibbs para 161 meses de janeiro. O histograma e a

densidade foi obtido a partir da soma dos amostras geradas com distribuição

Beta e Possion.

Fonte: Elaborado pela autora.

A Figura 17 mostra a série temporal sintética para a distribuição Binomial

e a função de autocorrelação (ACF) das amostras geradas pelo Amostrador de

Gibbs. Os valores da série variam de 0 a 1, de forma que esse valores

representam a ocorrência de chuva para a série sintética gerada pelo

Amostrador de Gibbs. Assim, para o dia considerado chuvoso é adotado o

modelo com as distribuições Beta e Poisson para a quantidade precipitada.

Figura 17. Gráfico da série de tempo sintética com a distribuição Binomial

gerada pelo Amostrador de Gibbs.

Fonte: Elaborado pela autora.

Page 38: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

De acordo com a Figura 18, a dispersão entre a precipitação simulada e

a observada é alta, ou seja, não estão associados entre si, mesmo apresentando

uma tendência positiva entre as estimativas.

Figura 18. Diagrama de dispersão entre a precipitação simulada e a observada

para o mês de janeiro.

Fonte: Elaborado pela autora.

Para testar a eficiência do modelo foi calculado o Erro Relativo do

Quadrado Médio (RMSE), o Erro Médio de Bias (MBE), índice de concordância

de Willmott (d) e o Coeficiente de Correlação de Pearson (R). Pela Tabela 1

temos que os valores de precipitação simulados pelo modelo superestimaram o

observado em quase 9 mm e que não apresentam uma boa correlação, pois o

coeficiente de correlação é baixo, cerca de 0,20.

Tabela 1. Erros da precipitação simulada para o mês de janeiro.

RMSE (mm) M B E ( mm) d R (Pearson)

8,79 -0,68 0,85 0,20

Fonte: Elaborado pela autora.

Page 39: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

3.2 SIMULAÇÃO PARA O MÊS DE MARÇO

De acordo com a Figura 19 observa-se que as amostras geradas com a

distribuição Poisson e Binomial e não estão muito correlacionadas, pois os

valores da série de tempo sintética não permanecem no mesmo ponto, ou seja,

não apresenta estacionariedade. Porém, as amostras geradas com a distribuição

beta apresentam uma boa correlação.

Figura 19. Gráfico de séries de tempo sintética, de autocorrelação amostral para

as distribuições Beta, Binomial e Poisson para o mês de março.

Fonte: Elaborado pela autora.

A Figura 20 mostra a série temporal sintética da amostra gerada pelo

amostrador de Gibbs para 5000 iterações (m), combinando as distribuições Beta

e Poisson. Nota-se, que as amostras geradas não ultrapassam 50 mm, pois esse

modelo não busca simular os extremos e sim os valores que ocorrem com maior

frequência.

Page 40: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 20. Série temporal sintética combinada da amostra gerada pelo

Amostrador de Gibbs para 161 meses de março.

Fonte: Elaborado pela autora.

O histograma da Figura 20 da série temporal sintética combinada da

amostra gerada pelo Amostrador de Gibbs para as 5000 interações (

apresenta uma forma distinta, em que é possível notar tanto as características

da distribuição Beta quantos as características da distribuição de Poisson. As

maiores frequências estão centradas no acumulado diário de chuva abaixo de

10 mm.

Page 41: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 21. Histograma da série temporal sintética combinada da amostra

Gerada pelo Amostrador de Gibbs para 161 meses de março. O histograma e a

densidade foi obtido a partir da soma dos amostras geradas com distribuição

Beta e Possion.

Fonte: Elaborado pela autora.

A Figura 22 mostra a série temporal sintética para a distribuição Binomial

e a função de autocorrelação (ACF) das amostras geradas pelo Amostrador de

Gibbs. Os valores da série variam de 0 a 1, de forma que esse valores

representam a ocorrência de chuhva para a série sintética gerada pelo

Amostrador de Gibbs. Assim, para o dia considerado chuvoso é adotado o

modelo com as distribuições Beta e Poisson para a quantidade precipitada.

Page 42: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Figura 22. Gráfico da série de tempo sintética para a distribuição Binomial

gerada pelo Amostrador de Gibbs.

Fonte: Elaborado pela autora.

De acorodo com a Figura 23, a dispersão entre a precipitação simulada e

a observada é alta próximo ao eixo 0, ou seja, não estão associados entre si. As

estimativas apresentam uma tendência linear positiva.

Figura 23. Diagrama de dispersão entre a precipitação simulada e a observada

para o mês de março.

Fonte: Elaborado pela autora.

Page 43: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Para testar a eficiência do modelo foi calculado o Erro Relativo do

Quadrado Médio (RMSE), o Erro Médio de Bias (MBE), índice de concordância

de Willmott (d) e o Coeficiente de Correlação de Pearson (R). Pela Tabela 2

temos que os valores de precipitação simulados pelo modelo superestimaram o

observado em quase 3 mm e que apresentam uma boa correlação, pois o

coeficiente de correlação é de 0,60.

Tabela 2. Erros da precipitação simulada para o mês de março.

RMSE (mm) M B E ( mm) d R (Pearson)

3,41 -0,75 0,78 0,60

Fonte: Elaborado pela autora.

Em seguida foi feita uma estatística descritiva do comportamento da

precipitação durantes os dias de janeiro e de março, bem como os valores

estimados para os respectivos meses afim de comparar o comportamento de

ambas séries. Os valores da estatística descritivas encontra-se na Tabela 3.

Tabela 3. Estatística descritivas para as séries observadas e simuladas.

JAN MAR

Simulada Observada Simulada Observada

Média (mm) 1,93 2,62 3,42 6,80

Erro padrão (mm) 0,14 0,34 0,37 0,55

Mediana (mm) 0 0 0 0,3

Moda (mm) 0 0 0 0

Desvio padrão (mm) 4,04 9,79 10,75 15,63

Variância (mm) 16,38 95,90 115,60 244,37

Curtose (mm) 33,87 62,25 39,79 13,98

Assimetria (mm) 4,48 7,07 5,59 3,51

Alcance (mm) 50,36 115,6 49,08 111,4

Minimo (mm) 0 0 0 0

Máximo (mm) 50,3 115,6 50,0 111,4

Page 44: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Somatório (mm) 1563 2112 2755 5479

Count 806 806 806 806

Nível de confiança (95%) 0,27 0,67 0,744 1,08

Fonte: Elaborado pela autora.

As séries simuladas devem gerar com boa representatividade uma série

sintética, os valores mínimos foram iguais em todas as séries observadas e

simuladas e a média do simulado foi o dobro do observado para os dois meses.

Page 45: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

4 DISCUSSÕES

Uma série sintética é o resultado da associação de séries de dados reais

com número aleatório produzidos por algoritmos computacionais, a fim de gerar

sequências de números aleatórios que se assemelham aos dados climáticos

reais (WILKS, 1999).

Há poucos relatos na literatura nacional da utilização do algoritmo do

Amostrador de Gibbs para simular série sintética de precipitação. Basicamente,

a maioria dos geradores de série sintética de precipitação utilizam modelos

estocásticos clássicos como ARIMA, Holt-Winters e Box-Jenkins, modelos

computacionais como as Redes Neurais Artificiais, além de distribuições de

probabilidades, como o modelo desenvolvido por Baena (2004).

Santos (2010) utilizou um modelo estocástico para a geração de série

climática via Redes Neurais Artificiais (RNAs), um método computacional que

processa modelos matemáticos a fim de reconhecer padrões de dados

adquirindo conhecimento através da experiência. A partir disso é possível que a

série sintética apresente características mais significativas e representativas. O

autor mostrou que o modelo apresentou um bom desempenho, mas que havia

necessidades de buscar novas arquiteturas em busca de melhorar os resultados.

A dificuldade em simular extremos também foi encontrado por Santos

(2010), em que o autor descreve que os pontos de picos/extremos foram os

maiores problemas da rede.

Contudo, o modelo de simulação de precipitação via Amostrador de Gibbs

apresentou-se como adequado para a série de precipitação diária acumulada da

cidade de Natal, já que as diferenças encontradas não foram tão significativas,

uma vez que o observado e a série sintéticas tendem para a mesma conclusão.

Page 46: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

5 CONCLUSÕES

O Algoritmo de Gibbs apresenta-se como uma técnica de simulação

conceitualmente simples, mas de grande poder e aplicabilidade a diversas áreas

do conhecimento. Na aplicação prática feita neste trabalho pode-se constatar a

eficiência do Algoritmo de Gibbs. As estimativas simuladas para precipitação

diária foram muito próximas dos valores observados.

As séries sintéticas são fundamentais para o conhecimento das

características da precipitação em locais onde a precipitação observada

apresenta falhas, essas características são a intensidade, o total precipitado e a

duração, além da sua distribuição temporal e espacial, que favorece o

planejamento e a gestão dos recursos hídricos.

O Amostrador de Gibbs é restrito a problemas onde as distribuições a

posteriori condicionais são disponíveis, ou seja, a geração de variáveis aleatórias

destas distribuições é possível. Esta restrição pode ser removida se utilizar o

algoritmo de Metropolis-Hastings para a geração as distribuições condicionais

que tem formas intratáveis. O Amostrador de Gibbs é um método essencialmente

simples de se implementar, mesmo com limitados recursos computacionais.

O modelo de forma geral, apresentou um comportamento bastante

semelhante com o observado, com as mesmas características estatísticas da

série histórica, as médias foram próximas, os extremos foram bem

representados na série sintética.

Os erros ficaram centrados em torno de zero, isso é um grande indicativo

de que as diferenças encontradas na série como subestimação e

superestimação de valores foram pequenas. E essa superestimação já era

esperada, pois a média da precipitação diária sintética era o dobro da média da

precipitação diária observada.

As série sintéticas foram geradas com um software livre e de código

aberto, disponível para download no seu repositório, com baixo desempenho

computacional, dessa forma será possível qualquer usuário utilizar esse modelo

para gerar séries sintética de precipitação diária de forma mais genérica,

baseando-se nas condições pluviométricas observadas.

Page 47: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

Concluo esse trabalho citando um trecho de Ehlers (2007) que trata da

propagação de erros em simulações:

Apesar da sua grande utilidade, os métodos de simulação devem

ser aplicados com cautela. Devido à facilidade com que os recursos

computacionais podem ser utilizados hoje em dia, corremos o risco

de apresentar uma solução para o problema errado ou uma solução

ruim para o problema certo. Assim, os métodos computacionalmente

intensivos não devem ser vistos como substitutos do pensamento

critico sobre o problema por parte do pesquisador.

Page 48: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

6 REFERÊNCIAS

ANDRADE NETO, JULIO V. DE. Determinação de séries sintéticas de

precipitação no Rio Grande do Norte: considerando os cenários de

mudanças climáticas. XXVIII CICT Congresso de Iniciação Científica da UFRN.

Natal, Rio Grande do Norte, 2017.

BENJAMIN, J.R.; CORNELL, C.A. Probability, statistics, and decision theory

for civil engineers. New York: McGraw-Hill, 1970. 685p.

BOX, G. E. P.; JENKINS, G. M. & REINSEL, G. C. Time Series Analysis: Fore-

casting and Control. New Jersey, Prentice Hall, 1994.

CAERN. Zona Norte terá rodízio no abastecimento a partir desta quarta-feira

(08). 2017. Disponível em:

<http://www.caern.rn.gov.br/Conteudo.asp?TRAN=ITEM&TARG=140006&ACT;

=&PAGE;=&PARM;=&LBL=MAT%C9RIA>. Acesso em: 21 nov. 2017.

CALENDA, G.; NAPOLITANO, F. Parameter estimation of Neyman-Scott pro-

cesses for temporal point rainfall simulation. Journal of Hydrology, Rome,

v.225, n.1-2, p.45-66, 1999.

EHLERS, R. S. Introdução à Inferência Bayesiana. Curitiba: Universidade

Federal do Paraná, Departamento de Estatística. 2007.

ESPINOSA, A. M.. : Previsão quantitativa por conjunto da precipitação do

verão 2007/2008 na bacia de Rio Grande.2011. 172 f. Tese (Doutorado) -

Curso de Pós-graduação em Meteorologia, Instituto de Astronomia Geofísica e

Ciências Atmosféricas, Universidade de São Paulo, São Paulo, 2011.

FERREIRA, N. S., 1996. Zona de Convergência Intertropical. Climanálise

Especial. Edição Comemorativa de 10 anos. FUNCEME. 136 139.

Page 49: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

FRIZZONE, J. A. Análise de cinco modelos para o cálculo da distribuição

de frequência de precipitações na região de Viçosa, MG. 1979. 100 f.

Dissertação (Mestrado em Irrigação e Drenagem) Universidade Federal de

Viçosa, Viçosa, 1979.

GAMERMAN, D. Simulação Estocástica Via Cadeias de Markov. ABE -

Associação Brasileira de Estatística. 1996.

HUTCHINSON, M.F. A point rainfall model based on a three - state continuous

Markov occurrence process. Journal of Hydrology, Rome, v.114, n. 1-2, p.125-

148, 1990.

OLIVEIRA, V. P. S. Modelo para geração de séries sintéticas de

precipitação. 2003. 156 f. Tese (Doutorado) - Curso de Pós-Graduação em

Recursos Hídricos e Ambientais, Universidade Federal de Viçosa, Viçosa, 2003.

MIGON, H. S. e GAMERMAN, D. Statistical Inference - an integrated approach.

Arnold. 1999.

PALMER, T. N.; ANDERSON, D. L. T. The Prospects for Seasonal Forecasting

a Review Paper. Q. J. R. Meteorol. Soc., 117, pp. 91-106, 1994.

SIMAS, H. S.. Aspectos metodológicos em análise de séries temporais

epidemiológicas do efeito da poluição atmosférica na saúde pública: Uma

revisão bibliográfica e um estudo comparativo via simulação. 2003. 103 f.

Dissertação (Mestrado) - Curso de Pós-graduação em Saúde Coletiva, . Instituto

de Medicina Social, Universidade Estadual do Rio de Janeiro, Rio de Janeiro,

2003. Disponível em: <http://site.ims.uerj.br/pesquisa/ares-

rio/download/hugo_ims2003_tese.pdf>. Acesso em: 10 set. 2017.

SANTOS, Carlos A. S; LUCIO, Paulo Sério. STOCK-WEATHER: Um modelo

estocástico para geração de séries climatológicas via Redes Neurais Artificiais:

O caso dos Modelos Univariados. In: CONGRESSO BRASILEIRO DE METE-

OROLOGIA, 16., 2010, Belém. Anais... . Belém: Sbmet, 2010.

Page 50: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

in Science, 282, 1998, pp. 728-31.

Soc., 126, 2000b, pp. 2.265-91.

VILLELA, S.M.; Mattos, A. Hidrologia aplicada. São Paulo: McGraw-Hill do Brasil,

1975. 245p.

TURKMAN, M. A. A. (2000). How and why does the Gibbs sampler work? Re-

vista de Estatística, 3, 7-30.

WHEATER, H.s; ISHAM, V.s.; COX, D.r. L. Spatial temporal rainfall fields: mod-

elling and statistical aspects. Hydrology And Earth System Sciences, Lindau,

v. 4, p.581-601, 2000.

WILKS, D. S.. Simutaneous stochastic simulation of daily precipitation, tempera-

ture and solar radiation at multiple sites in complex terrain. Agricultural And

Forest Meteorology, Amsterdam, v. 96, n. 1-3, p.85-101, 1999.

Page 51: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

7 ANEXOS

Códigos em R

Bin=read.table("precip.csv", head=T, sep=";")

Bin

attach(Bin)

fbin=rbinom(Precip, 808, 0.6774194)

summary(fbin)

hist(fbin, density=30, main = "", axes = T, xlab = "dias sem chuva", ylab =

Pois=read.table("precip.csv", head=T, sep=";")

attach(Pois)

head(Pois)

lambda =0.3293785

fpois=rpois(Precip, lambda)

fpois

hist(fpois,density=30)

#estimando alfa e beta com a média e a variância

Page 52: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

estBetaParams <- function(mu, var) {

alpha <- ((1 - mu) / var - 1 / mu) * mu ^ 2

beta <- alpha * (1 / mu - 1)

return(params = list(alpha = alpha, beta = beta))

}

media= 0.4293785

vari= 0.2020252

uhum=estBetaParams(media, vari)

uhum

fbeta=rbeta(Precip, shape1= 0.09136418, shape2= 0.09136418, ncp = 0)

hist(fbeta,density=30)

u=read.table("precip.csv", head=T, sep=" ")

attach(u)

u

m = 5000

lambda = 0.5293785

a=0.09136418

b=0.1214182

#rpois(n, lambda)

dpois=rpois(Precip, lambda)

#rbinom(n, size, prob)

Page 53: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

r=rbinom(Precip, 808, 0.6774194)

N=length(m)

X=length(m)

Y=length(m)

N[1]=1.6

Y[1]= 0.6774194

X[1]=1

for (i in 2:m)

{

Y[i]=rbeta(Precip,X[i-1]+a,N[i-1]-X[i-1]+b)

N[i]=rpois(Precip,(1-Y[i])*lambda)+X[i-1]

X[i]=rbinom(Precip,N[i],Y[i])

}

par(mfrow=c(3,2))

par(mai=c(0.77,0.77,0.0,0.07))

ts.plot(Y*10, ylab=expression(Y*10))

par(mai=c(0.77,0.77,0.45,0.07))

acf(Y*10, main=expression(Y*10), lag=30)

par(mai=c(0.77,0.77,0.0,0.07))

ts.plot(N, ylab=expression(N))

par(mai=c(0.77,0.77,0.45,0.07))

acf(N, main=expression(N))

par(mai=c(0.77,0.77,0.0,0.07))

Page 54: final TCC de Rafaela 000 parte 1...Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial

ts.plot(X, ylab=expression(X))

par(mai=c(0.77,0.77,0.45,0.07))

acf(X, main=expression(X))

par(mfrow=c(2,3))

hist(X, )

hist(Y*10)

hist(N)

summary(X)

summary(Y*10)

summary(N)

N

Y

X

T=N+Y

T

ts.plot(T, type="l",ylab="Precipitação (mm)",xlab="Tempo (dias)", main="Série

Sintética da Precipitação para 161 meses de janeiro")

acf(T, main="Modelo Combinado")

hist(T,freq=TRUE,main="Modelo Combinado",density=30, ylab="Frequência",

xlab="")