modelação estatística de caudais e de volumes de cheia em ... · i modelação estatística de...

120
Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada Filipa Leite Rosa Dissertação para obtenção do Grau de Mestre em Engenharia Civil Júri Presidente: Professor António Jorge Silva Guerreiro Monteiro Orientador: Professora Maria Manuela Portela Correia dos Santos Ramos da Silva Co-orientador: Engenheiro João Filipe Fragoso dos Santos Vogal: Professora Maria Madalena Vitório Moreira Vasconcelos Outubro 2011

Upload: ngophuc

Post on 01-Dec-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

I

Modelação estatística de caudais e de volumes de cheia em Portugal

Continental: análises convencional e bivariada

Filipa Leite Rosa

Dissertação para obtenção do Grau de Mestre em

Engenharia Civil

Júri

Presidente: Professor António Jorge Silva Guerreiro Monteiro Orientador: Professora Maria Manuela Portela Correia dos Santos Ramos da Silva Co-orientador: Engenheiro João Filipe Fragoso dos Santos Vogal: Professora Maria Madalena Vitório Moreira Vasconcelos

Outubro 2011

Page 2: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

II

Page 3: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

III

Agradecimentos

À Engª. Cláudia Brandão e à sua equipa, do Instituto Nacional da Água, pelo seu apoio a este

trabalho, especificamente, no acesso aos dados e no procedimento da recolha dos mesmos.

Quero agradecer à minha orientadora, a Prof. Maria Manuela Portela, pela importante

orientação científica e permanente disponibilidade, mas também por ter sido sempre uma das

maiores fontes de motivação e incentivo, ao mostrar desde o início um forte entusiasmo no

trabalho a desenvolver.

Ao Eng. João Santos, co-orientador deste trabalho, pela orientação científica e palavras de

incentivo.

Ao Prof. João Hipólito pela ajuda prestada no esclarecimento de algumas dúvidas surgidas.

Ao Artur Silva pela ajuda e partilha de conhecimentos e à minha irmã Inês pela paciência na

leitura de alguns excertos deste trabalho. Agradeço-lhes também o apoio, a disponibilidade e a

amizade. Por estes mesmos motivos não posso deixar de prestar um agradecimento especial

ao Pedro Morgado e à Susana Silva, cuja amizade e compreensão contribuíram para a

conclusão deste trabalho.

Ao Rodrigo Vargas, por tudo mas, principalmente, pelo seu companheirismo e confiança em

mim. Sem a sua presença o desenvolver deste trabalho teria sido, seguramente, muito mais

difícil.

Por fim, gostaria de agradecer aos meus pais, a quem dedico este trabalho. Mais do que a

ajuda financeira, quero agradecer-lhes o apoio, a confiança e compreensão. Sei que a

conclusão desta importante etapa lhes trará orgulho, o qual não deverá ser atribuído apenas à

minha pessoa mas a eles próprios também, uma vez que sem eles este documento não

existiria. Por esse facto, muito obrigada também.

Page 4: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

IV

Page 5: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

V

Resumo

São numerosas as intervenções da Engenharia Civil que requerem a determinação de caudais

de ponta de cheia com dadas probabilidades de ocorrência. Um dos procedimentos mais

utilizados nessa determinação envolve a análise estatística da distribuição de frequências

aplicada a caudais instantâneos máximos anuais. Contudo, é frequente que as amostras de tais

caudais apresentam dimensão reduzida, não possibilitando a inferência estatística. Uma

abordagem que permite obviar tal circunstância utiliza amostras de caudais acima de dados

limiares, com dimensão superior à daquelas outras uma vez que incorporam mais do que uma

realização por ano.

Por outro lado, muitos dos acontecimentos hidrológicos não podem ser caracterizados

plenamente tendo por base apenas uma das variáveis neles envolvidas já que, por regra,

combinam em si o efeito de mais variáveis. É este o caso dos eventos de cheia nos quais, para

além do caudal de ponta, o volume associado a cada cheia constitui uma variável também

importante à qual se pode associar ainda a duração da cheia. Deste modo, o estudo da

distribuição conjunta das variáveis em presença poderá fornecer uma melhor compreensão

das características probabilísticas desses eventos.

Assim, o trabalho de investigação que se apresenta teve como primeiro objectivo a

constituição de modelos de distribuição de frequências a partir de amostras de caudais

instantâneos máximos anuais e de amostras de caudais acima de dados limiares, bem como

das amostras dos volumes correspondentes àqueles caudais. A partir dos resultados assim

alcançados prosseguiu-se com um segundo objectivo, envolvendo a comparação entre

estimativas de caudais e de volumes baseadas em séries de máximos anuais e em séries de

valores acima de limiares. O terceiro objectivo focou-se na obtenção de modelos estatísticos

destinados a caracterizar a distribuição de probabilidade conjunta das variáveis caudal-volume

de cheia, para o que se utilizou uma distribuição estatística bivariada, bem como a teoria das

cópulas.

Palavras-chave: amostras de valores máximos anuais; amostras de valores acima de dados

limiares, análise de frequências de caudais e volumes de cheia; cópulas.

Page 6: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

VI

Page 7: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

VII

Abstract

The hydrologic design often requires the estimation of peak flood discharges for different

return periods. One of the statistical procedures mostly used for that purpose is the frequency

distribution analysis applied to annual maximum instantaneous discharges. However, the

length of the available samples of such discharges is often too small to validate the statistical

inference. An alternative approach that allows overcoming such circumstance uses samples of

discharges above given thresholds which normally have a longer length as they incorporate

more than one event per year.

At the same time, the majority of the hydrological events cannot be fully characterized based

on only one of the variables involved as, in general, they depend on a diverse set of variables.

This is the case of flood events in which, in addition to the peak discharges, the volumes

associated with such discharges or even the duration of the floods may also be important.

Thus, the study of the joint probability distribution of the variables involved in these events

may provide a better understanding of their probabilistic features.

In the previous context, the primary objective of the research carried out was the

development of models of frequency distribution based on samples of annual maximum

instantaneous discharge and on samples of flow above given thresholds, as well as on the

samples of the corresponding volumes. Consequently, the necessary conditions for the second

objective were achieved, which envisaged the comparison between discharges and volumes

provided, on the one hand, by the samples of annual maximum, and on the other hand, by the

samples above thresholds. The third main objective involved the development of statistical

models to characterize the joint probability distribution of flood discharge-flood volume,

namely applying a joint distribution and the copulas’ theory.

Keywords: samples of annual maximum values; samples of values above given thresholds;

frequency analysis of flood discharges and of flood volumes; copulas.

Page 8: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

VIII

Page 9: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

IX

Índice de texto

1. Introdução ........................................................................................................................ 1

1.1. Âmbito e enquadramento teórico .............................................................................. 1

1.2. Objectivos ................................................................................................................. 5

1.3. Organização ............................................................................................................... 6

2. Síntese de conhecimentos ................................................................................................. 9

2.1. Introdução ................................................................................................................. 9

2.2. Séries de máximos anuais e séries de valores acima de um limiar ............................ 10

2.3. Modelos de distribuição de frequências ................................................................... 12

2.3.1. Considerações prévias ...................................................................................... 12

2.3.2. Distribuição Normal ......................................................................................... 13

2.3.3. Distribuição log-Normal ................................................................................... 14

2.3.4. Distribuição de Pearson tipo III ......................................................................... 15

2.3.5. Distribuição log-Pearson tipo III........................................................................ 16

2.3.6. Distribuição de Gumbel .................................................................................... 16

2.3.7. Distribuição de Goodrich .................................................................................. 17

2.4. Análise de frequências pelo método do factor de probabilidade .............................. 18

2.4.1. Conceito geral .................................................................................................. 18

2.4.2. Distribuição Normal ......................................................................................... 19

2.4.3. Distribuição de Gumbel .................................................................................... 20

2.4.4. Distribuição de Pearson tipo III ......................................................................... 20

2.4.5. Distribuição de Goodrich .................................................................................. 20

2.5. Ajustamento de leis teóricas .................................................................................... 21

2.5.1. Considerações prévias ...................................................................................... 21

2.5.2. Ajustamento visual .......................................................................................... 22

2.5.3. Testes de aderência: Qui-Quadrado e Kolmogorov-Smirnov ............................. 23

2.5.4. Outras medidas de avaliação do ajustamento .................................................. 27

2.6. Teoria das cópulas ................................................................................................... 28

2.6.1. Análise multivariada......................................................................................... 28

2.6.2. Funções cópula ................................................................................................ 31

2.6.3. Coeficiente de Kendall ..................................................................................... 33

2.6.4. Selecção da função cópula ............................................................................... 34

Page 10: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

X

3. Dados de base ................................................................................................................. 37

3.1. Dados disponíveis .................................................................................................... 37

3.2. Recolha e tratamento de dados ............................................................................... 38

4. Apresentação e análise de resultados .............................................................................. 49

4.2. Aplicação dos modelos de distribuição de frequências ............................................. 49

4.2.1. Considerações prévias ...................................................................................... 49

4.2.2. Estação hidrométrica de Albernoa ................................................................... 50

4.2.3. Estação hidrométrica de Couto de Andreiros ................................................... 53

4.2.4. Estação hidrométrica de Monforte ................................................................... 55

4.2.5. Estação hidrométrica de Torrão do Alentejo .................................................... 58

4.2.6. Resumo de resultados ...................................................................................... 61

4.3. Comparação entre os resultados baseados em séries de valores acima de um limiar e

séries de valores máximos anuais ........................................................................................ 62

4.4. Relações entre estimativas de caudal de cheia e de volume associado ..................... 67

4.5. Resultados da aplicação da teoria das cópulas e da lei bivariada de Gumbel ............ 68

4.5.1. Considerações prévias ...................................................................................... 68

4.5.2. Aplicação e selecção das funções cópula e da lei bivariada de Gumbel ............. 70

4.5.3. Probabilidade conjunta – apresentação de superfícies ..................................... 74

5. Conclusões ...................................................................................................................... 79

Referências bibliográficas ....................................................................................................... 85

Anexos .................................................................................................................................... 89

Page 11: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XI

Índice de figuras

Figura 2.1 – Figura ilustrativa do processo de selecção de cheias independentes. ................... 11

Figura 3.1 – Figura ilustrativa do processo de selecção de cheias independentes. ................... 41

Figura 4.1 - Estação hidrométrica de Albernoa. Ajustamento visual de leis estatísticas às

amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ............................ 50

Figura 4.2 – Estação hidrométrica de Couto de Andreiros. Ajustamento visual de leis

estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ...... 53

Figura 4.3 – Estação hidrométrica de Monforte. Ajustamento visual de leis estatísticas às

amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ............................ 56

Figura 4.4 – Estação hidrométrica de Torrão do Alentejo. Ajustamento visual de leis estatísticas

às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ........................ 59

Figura 4.5 – Estação hidrométrica de Albernoa: relação entre estimativas de caudal (à

esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta

representativos da regressão linear e respectivos coeficientes de determinação, R2. .............. 64

Figura 4.6 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal

(à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta

representativos da regressão linear e respectivos coeficientes de determinação, R2. .............. 64

Figura 4.7 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal

(à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta

representativos da regressão linear e respectivos coeficientes de determinação, R2. .............. 64

Figura 4.8 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.

Relação entre estimativas de caudal específico de cheia (à esquerda) e de volume específico de

cheia (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos das

regressões lineares e respectivos coeficientes de determinação, R2. ....................................... 67

Page 12: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XII

Figura 4.9 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.

Relação entre estimativas de valores específicos do caudal de cheia e de volume de cheia com

o mesmo período de retorno fornecidas pelo método I (à esquerda) e pelo método II (à

direita). Segmentos de recta representativos das regressões lineares e respectivos coeficientes

de determinação, R2................................................................................................................ 68

Figura 4.10 – Estação hidrométrica de Albernoa. Caudais de cheia acima de limiar e

correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel

e d) bivariada de Gumbel. ....................................................................................................... 71

Figura 4.11 – Estação hidrométrica de Couto de Andreiros. Caudais de cheia acima de limiar e

correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel

e d) bivariada de Gumbel. ....................................................................................................... 72

Figura 4.12 – Estação hidrométrica de Torrão do Alentejo. Caudais de cheia acima de limiar e

correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel

e d) bivariada de Gumbel. ....................................................................................................... 72

Figura 4.13 – Superfícies da distribuição de probabilidade conjunta de caudal e volume nas

estações hidrométricas de: a) Albernoa; b) Couto de Andreiros e c) Torrão do Alentejo. ......... 75

Figura 4.14 – Curvas de igual probabilidade conjunta. a) Estação hidrométrica de Albernoa –

cópula de Frank; b) Estação hidrométrica de Couto de Andreiros – cópula de Clayton; c)

Estação hidrométrica de Torrão do Alentejo – cópula de Clayton. ........................................... 76

Figura 4.15 – Curvas de probabilidade conjunta de caudal acima de limiar e volume com

probabilidade de não-excedência de 0,25, 0,50 e 0,75 para as variáveis de: a) Estação

hidrométrica de Albernoa – cópula de Frank; b) Estação hidrométrica de Couto de Andreiros –

cópulas de Clayton; c) Estação hidrométrica de Torrão do Alentejo – cópula de Clayton. ........ 77

Page 13: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XIII

Índice de quadros

Quadro 2.1 - Valores da função de probabilidades acumuladas da distribuição de de χ2, para

diferentes graus de liberdade.................................................................................................. 25

Quadro 2.2 - Partições do domínio da distribuição cumulativa de frequências, utilizadas na

aplicação do teste do Qui-Quadrado (adaptado de HENRIQUES, 1990). .................................. 25

Quadro 2.3 - Valores críticos da estatística do teste DN,α de aderência de Kolmogorov-Smirnov.

............................................................................................................................................... 27

Quadro 3.1 – Quadro resumo das características das estações hidrométricas. ........................ 38

Quadro 3.2 – Cálculo do caudal modular e do caudal correspondente ao limiar de cheia. ....... 39

Quadro 3.3 – Escoamentos anuais em cada estação hidrométrica considerada. ...................... 40

Quadro 3.4 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica

de Albernoa. ........................................................................................................................... 45

Quadro 3.5 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica

de Couto de Andreiros. ........................................................................................................... 46

Quadro 3.6 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica

de Monforte. .......................................................................................................................... 47

Quadro 3.7 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica

de Torrão do Alentejo. ............................................................................................................ 48

Quadro 4.1 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste do qui-

quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%. ............. 51

Quadro 4.2 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste de

Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de

95%. ....................................................................................................................................... 51

Quadro 4.3 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro

às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados

por meio de células com preenchimento de cor cinzenta). ...................................................... 52

Page 14: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XIV

Quadro 4.4 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste do

qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%........ 54

Quadro 4.5 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste de

Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de

95%. ....................................................................................................................................... 54

Quadro 4.6 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro

às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados

por meio de células com preenchimento de cor cinzenta). ...................................................... 55

Quadro 4.7 – Estação hidrométrica de Monforte. Resultados da aplicação do teste do qui-

quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%. ............. 57

Quadro 4.8 – Estação hidrométrica de Monforte. Resultados da aplicação do teste de

Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de

95%. ....................................................................................................................................... 57

Quadro 4.9 – Estação hidrométrica de Monforte. Resultados da aplicação das medidas de erro

às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados

por meio de células com preenchimento de cor cinzenta). ...................................................... 58

Quadro 4.10 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste

do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%. .. 59

Quadro 4.11 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste

de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de

95%. ....................................................................................................................................... 60

Quadro 4.12 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação das

medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados

estão assinalados por meio de células com preenchimento de cor cinzenta). .......................... 60

Quadro 4.13 – Identificação das leis estatísticas seleccionadas para caracterizar cada variável

aleatória. Valores dos parâmetros estatísticos de cada distribuição. ....................................... 62

Quadro 4.14 – Estação hidrométrica de Albernoa. Comparação entre estimativas de caudal e

de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de

valores acima de limiares (método II). Coeficientes de determinação, R2. ............................... 65

Page 15: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XV

Quadro 4.15 – Estação hidrométrica de Couto de Andreiros. Comparação entre estimativas de

caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em

séries de valores acima de limiares (método II). Coeficientes de determinação, R2. ................. 65

Quadro 4.16 – Estação hidrométrica de Torrão do Alentejo. Comparação entre estimativas de

caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em

séries de valores acima de limiares (método II). Coeficientes de determinação, R2. ................. 65

Quadro 4.17 - Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.

Coeficientes de correlação de Pearson entre caudais instantâneos máximos anuais e

correspondentes volumes de cheia e entre caudais acima de limiares e correspondentes

volumes de cheia. ................................................................................................................... 69

Quadro 4.18 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.

Valores do coeficiente de correlação de Pearson, ; do parâmetro m da lei bivariada de

Gumbel; do coeficiente de Kendall, ; e dos parâmetros θ das funções cópula Clayton, θClayton,

Frank, θFrank, e Gumbel-Hougaard, θGumbel................................................................................. 70

Quadro 4.19 – Resultados obtidos da aplicação do teste de Kolmogorov-Smirnov às amostras

de caudais acima de limiares e dos correspondentes volumes de cheia. Nível de confiança de

95%. (nota: os menores valores da estatística do teste estão assinalados por meio de células

com preenchimento de cor cinzenta). ..................................................................................... 73

Quadro 4.20 – Desvio quadrático médio entre os valores das probabilidades conjuntas teóricas

e empíricas das amostras de caudais acima de limiares e dos correspondentes volumes de

cheia (nota: os menores valores de desvio quadrático médio estão assinalados por meio de

células com preenchimento de cor cinzenta)........................................................................... 73

Quadro 4.21 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.

Funções cópula adoptadas para caracterizar a probabilidade conjunta do caudal acima de

limiar e do correspondente volume. Parâmetros das funções, θ.............................................. 74

Page 16: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XVI

Page 17: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XVII

Simbologia e abreviaturas

Alfabeto romano

Símbolo Definição

A - parâmetro da equação (2.30) determinado através da equação (2.32)

Aj - amplitude do intervalo j

B - parâmetro da equação (2.30) determinado através da equação (2.31)

C - função de dependência ou cópula

CV - coeficiente de variação

D1 - função de Debye de primeira ordem

Ej - valor esperado do número de elementos no intervalo j

F - probabilidade de não-excedência

F’ - probabilidade de não-excedência de um elemento de série de valores

acima de limiar

FX - função distribuição de probabilidade da variável X

fX - função densidade de probabilidade da variável X

FX,Y - função de distribuição de probabilidade conjunta das variáveis aleatórias X e Y

H0 - hipótese nula do teste de Qui-Quadrado χ2 e de Kolmogorov-Smirnov

i - número de ordem de um elemento da amostra

K - factor de frequência

k - parâmetro da equação 2.29

KT - factor de frequência associado ao período de retorno T

m - número de parâmetros estimados a partir da amostra

m - parâmetro da função bivariada de Gumbel

M - número de partições do domínio da função de distribuição de

probabilidade F(X) no teste de Qui-Quadrado χ2

N - dimensão da amostra

NP - número de ordem sequencial de cada par de elementos da amostra

Oj - número de elementos da amostra contidos no intervalo j

Q - caudal de ponta de cheia

Q acima limiar - amostras de caudais de ponta de cheia acima de um dado limiar

Q ima - amostras de caudais instantâneos máximos anuais

T - período de retorno

Page 18: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XVIII

V - volume de cheia

V acima limiar - amostras dos volumes de cheia associados aos caudais de ponta de cheia

acima de um dado limiar

V ma - amostras dos volumes de cheia associados aos caudais instantâneos

máximos anuais

X - variável aleatória

x - elemento genérico da variável aleatória X

xi - elemento de ordem i da amostra da variável X

x - média da amostra da variável X

ix̂ - estimativa teórica do valor de ordem i da variável X

Y - variável aleatória

y - elemento genérico da variável aleatória Y

yi - elemento de ordem i da amostra da variável Y

y - média da amostra da variável Y

z - variável Normal reduzida

Alfabeto grego

Símbolo Definição

α - parâmetro de posição

α - nível de significância

β - parâmetro de escala

Γ - função Gama

δ - constante de Euler-Mascheroni

θ - parâmetro de forma

θC - parâmetro da cópula de Clayton

θF - parâmetro da cópula de Frank

θG - parâmetro da cópula de Gumbel-Hougaard

λ - número médio de acontecimentos independentes por ano

μ - média da distribuição

μX - média da amostra da variável X

μY - média da amostra da variável Y

ρ - coeficiente de Pearson

σ - desvio-padrão da distribuição

Page 19: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XIX

σX - desvio-padrão da amostra da variável X

σY - desvio-padrão da amostra da variável Y

τ - coeficiente de Kendall

ϕ - função geradora da cópula

χ2 - estatística do teste de Qui-Quadrado

- coeficiente de assimetria da distribuição

Abreviaturas

EH - Estação Hidrométrica

INAG - Instituto Nacional da Água

SNIRH - Sistema Nacional de Informação de Recursos Hídricos

Page 20: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

XX

Page 21: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

1

1. Introdução

1.1. Âmbito e enquadramento teórico

Em Portugal Continental as cheias constituem um problema recorrente, devido às especificidades do

clima e da fisiografia do País, associadas às características da ocupação do território, amplamente

mobilizadora dos leitos de cheia. Para fazer face a esse problema podem ser adoptadas medidas

estruturais, tais como a utilização da capacidade de armazenamento em albufeiras para amortecer

os hidrogramas de cheia, a construção de estruturas hidráulicas para a protecção de zonas

residenciais ou de vias de comunicação ou a construção de diques marginais e de outras obras de

regularização (NUNES CORREIA, 1983). No desenvolvimento de projectos desta natureza, sejam

estruturas para aproveitamento e controlo dos recursos hídricos, sejam medidas de protecção contra

fenómenos hidrológicos potencialmente destrutivos, é crucial a análise e a caracterização das

variáveis neles envolvidas. Por exemplo, para dimensionar o volume de armazenamento numa

albufeira requerido pelo amortecimento de cheias pode ser importante estudar os caudais diários ou

relativos a períodos superiores a um dia, enquanto para dimensionar o descarregador de superfície

da albufeira, não havendo amortecimento, importa analisar os máximos caudais instantâneos, num e

noutro caso, obviamente para um dado critério de projecto, por regra, expresso em termos de

período de retorno. Para quantificar os prejuízos decorrentes da interrupção de uma via de

comunicação por submersão pode ser necessário caracterizar os intervalos de tempo durante os

quais se espera que o caudal permaneça superior ao conducente àquela submersão. Noutros casos,

pode interessar a caracterização da forma do hidrograma de cheia, do volume de cheia, das áreas

inundadas ou de outras características ditadas pelos objectivos do estudo e pela disponibilidade dos

dados (NUNES CORREIA, 1983).

O objectivo mais comum da aplicação de métodos estatísticos no estudo das cheias é o de avaliar o

caudal numa dada secção de um rio com dada probabilidade de ser excedido num ano ou, de modo

equivalente, associado a determinado período de retorno (QUINTELA, 1996). Um dos processos

estatísticos mais utilizados para o efeito é o da análise da distribuição de frequências.

Vários autores aplicaram esse tipo de análise. Especificamente para Portugal, NUNES CORREIA, 1983,

desenvolveu modelos estatísticos para estimar caudais médios diários máximos anuais com base em

amostras recolhidas em estações hidrométricas, propositadamente, dispersas pelo território

nacional, de forma a tornar possível uma caracterização da adequabilidade das técnicas propostas a

todo o País. Para além dos modelos mais convencionais baseados em séries de máximos anuais, para

os quais testou a distribuição Gumbel, log-Gumbel, log-Normal, Pearson tipo III, log-Pearson tipo III e

Page 22: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

2

Generalizada de Extremos, construiu ainda um modelo baseado em séries de duração parcial, para o

que foram testadas as leis de Poisson e a Exponencial na caracterização do número médio de

excedências anuais. Desse trabalho, o autor concluiu que, em geral, a distribuição de Pearson tipo III

constitui o melhor modelo de distribuição de frequências a aplicar às séries de caudais médios

diários máximos anuais, seguida, por ordem de preferência, pelas distribuições de Gumbel e

log-Pearson III.

De forma equivalente, HENRIQUES, 1981 e 1990, realizou estudos de comparação entre diferentes

modelos estatísticos, com o objectivo de seleccionar o mais adequado à análise de distribuição de

frequências de caudais instantâneos máximos anuais, também em Portugal. No conjunto dos dois

trabalhos do autor em menção, foram testadas as seguintes distribuições: Pearson tipo III,

log-Pearson tipo III, Fisher-Tippett Generalizada, Fisher-Tippett tipo I, log-Normal de três parâmetros,

log-Normal de dois parâmetros, Extremos tipo I e Generalizada de Extremos. Desses trabalhos, o

autor concluiu que existe uma clara superioridade dos modelos baseados em distribuições de três

parâmetros relativamente aos modelos baseados em distribuições de dois parâmetros. As

distribuições que apresentaram melhores comportamentos foram a Generalizada de Extremos, a de

Pearson tipo III, a log-Normal de três parâmetros e a Fisher-Tippett Generalizada.

SILVA DIAS, 2003, atendendo aos resultados obtidos pelos dois autores antes referidos, aplicou

directamente as distribuições de Pearson tipo III e Generalizada de Extremos a séries de caudais

médios diários máximos anuais e de caudais instantâneos máximos anuais num grande número de

estações hidrométricas de Portugal Continental com o objectivo de desenvolver modelos regionais

para estimar caudais de ponta de cheia. A conclusão da análise que efectuou vai de encontro aos

estudos daqueles dois autores, ou seja, globalmente, ambas as leis se revelaram adequadas à

modelação da distribuição de frequências da maior parte das séries de caudais.

Contudo, relativamente a obras hidráulicas, sobretudo, visando o controlo e amortecimento de

cheias, não é suficiente possuir informação apenas referente ao caudal de ponta de cheia: com

efeito, pode importar associar a esse caudal um volume de cheia com dada probabilidade de

excedência e, eventualmente, a própria duração dessa cheia. Deste modo, é necessária uma análise

multivariada das variáveis determinantes dos hidrogramas de cheia, nomeadamente, através de

funções de distribuição conjunta.

Nos últimos anos, foram introduzidas algumas abordagens multivariadas por diversos investigadores.

No início, o modelo mais utilizado foi o da distribuição de probabilidade conjunta Gaussiana ou

Normal. É um modelo de fácil aplicação mas que tem a óbvia desvantagem de implicar que as

distribuições marginais das variáveis em presença tenham de ser normais. Esta condição pode ser

Page 23: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

3

alcançada através da transformação dos dados de base de modo a torná-los compatíveis com o

pressuposto de normalidade. No entanto, essas transformações nem sempre garantem que se

alcance aquele pressuposto sendo que podem resultar em distorções significativas das propriedades

da amostra, designadamente, quando se procede à inversão da transformação de modo a retomar

ao campo da variável original (GRIMALDI e SERINALDI, 2005). Em consequência, outras distribuições

bivariadas com distribuições marginais não-normais foram objecto de estudo. As publicações de

KARMAKAR e SIMONOVIC, 2009, e ZHANG e SINGH, 2006, contêm breves sínteses dos trabalhos

desenvolvidos sobre o tema, destacando-se, de tais trabalhos, os seguintes: (a) KRSTANOVIC e

SINGH, 1987, que adoptaram as distribuições multivariada gaussiana e exponencial para descrever a

distribuição conjunta de caudais de ponta e volumes de cheia, no pressuposto de tais variáveis

apresentarem a mesma distribuição de probabilidade marginal; (b) YUE et al., 1999, que utilizaram a

distribuição bivariada de Gumbel para descrever acontecimentos de cheia combinando as variáveis

caudal de ponta-volume e volume-duração da cheia, no pressuposto de aplicabilidade da lei de

Gumbel a qualquer uma daquelas três variáveis; (c) SINGH e SINGH, 1991, que deduziram uma

função densidade de probabilidade bivariada utilizando a lei exponencial para as distribuições

marginais das variáveis intensidade e altura de precipitação.

No entanto, a generalidade dos anteriores modelos evidenciou algumas limitações, destacando-se as

seguintes: (i) todas as distribuições marginais univariadas têm que pertencer a uma mesma família,

apesar de as variáveis analisadas poderem sugerir diferentes distribuições marginais; (ii) as variáveis

têm de apresentar uma distribuição conjunta conhecida; (iii) as variáveis têm de ser independentes;

(iv) a formulação matemática torna-se complicada quando se aumenta o número de variáveis; e

(v) não é possível distinguir o comportamento marginal e conjunto das variáveis analisadas (ZHANG e

SINGH, 2006, e GRIMALDI e SERINALDI, 2005).

Deste modo, muito recentemente, foram realizados vários estudos com o intuito de identificar novos

modelos ou formas de os construir que superem os anteriores inconvenientes. Os trabalhos mais

promissores são os que envolvem a teoria das cópulas. As cópulas são funções amplamente

estudadas e aplicadas noutros âmbitos, sobretudo no financeiro, mas em Hidrologia, as aplicações

deste tipo de funções são muito recentes e relativamente esparsas e reduzidas. Em Portugal, à data

de realização deste trabalho, não se conhecem estudos na área da Hidrologia que utilizem a teoria

das cópulas.

De um modo muito directo, a grande vantagem na utilização das funções cópula é a de não possuir

nenhuma das cinco limitações antes apontadas para os modelos mais tradicionais. Aquele tipo de

funções permite fornecer uma expressão analítica para qualquer distribuição de probabilidade

Page 24: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

4

conjunta de duas ou mais variáveis, baseada exclusivamente em conceitos de dependência entre as

mesmas, e, portanto, completamente independente das distribuições de probabilidade marginais de

cada uma dessas variáveis. Dependendo do tipo de cópula seleccionado, a formulação matemática é

consideravelmente mais simples, sobretudo quando se pretende modelar um evento hidrológico

com base em mais de duas variáveis.

Como mencionado, julga-se que os autores que aplicaram a teoria das cópulas na área da Hidrologia

são em número muito reduzido. Ainda assim, com a síntese que se segue, pretende apresentar-se

um breve resumo (organizado por ordem cronológica) de alguns dos trabalhos desenvolvidos sobre

essa matéria e que foram, entre outros, a base principal, no que respeita à teoria das cópulas, da

metodologia aplicada na dissertação de mestrado que se apresenta:

- FAVRE, et al., 2003, aplicaram as cópulas de Frank, Clayton e Farlie-Gumbel-Morgenstern para

descrever a dependência entre o caudal de ponta e o volume de cheia, utilizando como

distribuições marginais a leis Gama e de Gumbel;

- DE MICHELE e SALVADORI, 2004, apresentaram uma síntese teórica sobre os conceitos e

propriedades envolvidos na teoria das cópulas. Examinaram também a relação entre o período de

retorno univariado e bivariado, utilizando cópulas arquimedianas, apresentaram expressões

analíticas para a determinação de isolinhas de período de retorno e abordaram o tema dos

períodos de retorno condicionais. Aplicaram ainda esses conceitos a quatro casos de estudo,

utilizando como variáveis hidrológicas o volume de cheia, o caudal de ponta, a intensidade de

precipitação e a duração de precipitação;

- GRIMALDI e SERINALDI, 2005, analisaram também as variáveis caudal de ponta, volume de cheia e

duração da cheia, através das distribuições de probabilidade marginal de Frechet, Gama e

log-Normal, respectivamente. Obtiveram um modelo multivariado da distribuição conjunta das

três variáveis, utilizando cópulas arquimedianas, e apresentaram uma análise comparativa com o

modelo multivariado de Gumbel;

- DE MICHELE, et al, 2005, com o intuito de verificar a adequação do dimensionamento de

descarregadores de cheias em barragens, delinearam um modelo bivariado, utilizando a cópula

de Gumbel, para descrever a dependência entre as variáveis caudal de ponta e volume de cheia. A

distribuição Generalizada de Extremos foi adoptada para ambas as distribuições marginais de

probabilidade. O modelo construído forneceu estimativas para os valores das variáveis referidas

e, assim, permitiu criar hidrogramas sintéticos, que foram utilizados para simular o

funcionamento dos descarregadores.

Page 25: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

5

- ZHANG e SINGH, 2006, aplicaram as cópulas arquimedianas de Frank, Gumbel-Hougaard e Cook-

Johnson, na modelação bivariada das distribuições de probabilidade conjunta e condicional das

variáveis intensidade, altura e duração de precipitação, descritas pelas distribuições de

probabilidade marginal de Weibull, Gama e Exponencial. Os autores realizaram ainda uma análise

comparativa entre resultados fornecidos pelos modelos baseados em cópulas e pela distribuição

Normal bivariada;

- KARMAKAR e SIMONOVIC, 2009, aplicaram as cópulas de Ali-Mikhail-Haq, Cook-Johnson (ou

Clayton) e Gumbel-Hougaard na modelação da distribuição de probabilidade conjunta e de

probabilidade condicional das variáveis caudal de ponta, volume de cheia e duração, mas sempre

no caso bivariado.

De uma forma geral, as conclusões apresentadas pelos anteriores autores não diferem muito entre

si. Seguidamente resumem-se, de entre essas conclusões, as que se afiguraram mais pertinentes:

(i) é possível descrever analiticamente a distribuição de probabilidade conjunta de variáveis

hidrológicas com recurso a funções cópula; (ii) as comparações efectuadas entre modelos bivariados

baseados em cópulas e a distribuição bivariada Normal mostram que os primeiros possuem um

melhor ajustamento aos dados observados; (iii) diferentes escolhas nas distribuições de

probabilidade marginais implicam resultados significativamente diferentes nas estimativas fornecidas

pelos modelos, baseados na teoria das cópulas, de distribuição de probabilidade conjunta e

condicional, o que reforça a importância de uma correcta descrição isolada de cada uma das

variáveis intervenientes no estudo conjunto; (iv) é possível, em determinados casos, deduzir

expressões analíticas para isolinhas de período de retorno; (v) a utilização das funções cópulas

implica uma maior simplicidade nos cálculos, especialmente, quando se modelam mais do que duas

variáveis.

1.2. Objectivos

Em termos globais, o estudo que apresenta insere-se no âmbito da análise de cheias em Portugal

Continental. Assim, numa primeira parte, procedeu-se à aplicação da análise de distribuição de

frequências à caracterização de cheias, embora estritamente recorrendo a moldes tradicionais

(análise univariada). Para o efeito e tendo por base diferentes casos de estudos, consubstanciados

por quatro estações hidrométricas com registos adequados ao propósito em vista

(fundamentalmente estações hidrométricas dispondo de hidrogramas de cheia), foram analisados

quatro tipos de variáveis hidrológicas, a saber, caudais instantâneos máximos anuais (Q ima),

Page 26: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

6

volumes de cheia associados a esses caudais (V ma), caudais acima de determinados limiares

(Q acima limiar) e volumes de cheia correspondentes a esses caudais (V acima limiar). O objectivo

principal foi o de identificar as distribuições de probabilidade que melhor se ajustam aos registos

considerados e que, dessa forma, se consideram melhor representar as variáveis em questão.

Seleccionados os modelos, será, então, possível fornecer estimativas de caudais e de volumes de

cheia, com determinados períodos de retorno.

Ainda no âmbito da análise univariada, destaca-se o esforço efectuado no sentido de estender a

análise a diferentes amostras de caudais e de volumes de cheia. Com tal esforço pretendeu-se

assegurar o segundo objectivo que visou a comparação e a avaliação da qualidade das estimativas

obtidas através dos modelos baseados em amostra de valores, por um lado, máximos anuais e, por

outro lado, acima de dados limiares. Desta forma, não se analisou simplesmente o ajustamento de

diferentes leis teóricas a dados amostrais, mas também se avaliou o efeito do tipo desses dados na

construção dos modelos estatísticos e nos resultados obtidos.

Na segunda parte do trabalho procedeu-se à aplicação da análise bivariada a pares de valores

(máximos anuais e acima de limiares) caudal/volume de cheia. Face à menor experiência que se

concluiu existir em Portugal, o objectivo fundamental desta segunda parte foi o de verificar a

aplicação ao caso português de técnicas recentemente desenvolvidas, designadamente da teoria das

cópulas, para a modelação de distribuições de probabilidade conjunta de variáveis hidrológicas

associadas a cheias.

1.3. Organização

Para além do presente capítulo introdutório, o trabalho foi organizado em mais quatro capítulos.

Assim, o capítulo 2 contém uma síntese de conhecimentos abrangendo modelos de distribuição de

frequências, metodologias de ajustamento das leis teóricas e conceitos e fórmulas inerentes à

aplicação da teoria das cópulas.

No capítulo 3 identificam-se os dados hidrométricos que sustentaram a análise, nomeadamente,

registos de altura hidrométrica e/ou de caudais instantâneos nas seguintes quatro estações

hidrométricas, localizadas em Portugal Continental: Albernoa, Couto de Andreiros, Monforte e

Torrão do Alentejo. Descreve-se também a metodologia aplicada no tratamento desses dados, de

forma a obter as amostras necessárias ao estudo em vista, designadamente, amostra de caudais

instantâneos máximos anuais e acima de dados limiares e amostras dos volumes de cheia associados

a esses caudais.

Page 27: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

7

No capítulo 4 apresentam-se os resultados decorrentes das análises univariada (distribuição de

frequências) e bivariada (teoria das cópulas). Comparam-se ainda os resultados fornecidos pelo

estudo de amostras de máximos anuais com os associados a amostras acima de limiares. O capítulo

inclui a apresentação das conclusões sugeridas pelos resultados alcançados.

A finalizar, sistematizam-se, no capítulo 5, as conclusões gerais da análise efectuada e sugerem-se

alguns temas que se afiguraram com maior interesse relativamente a aplicações subsequentes à

Hidrologia da teoria das cópulas.

Page 28: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

8

Page 29: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

9

2. Síntese de conhecimentos

2.1. Introdução

A estimação de caudais de ponta de cheia associados a determinados períodos de retorno é, como já

se afirmou, um requisito frequente em projectos de diversa espécie, nomeadamente, inseridos no

âmbito da Engenharia Hidráulica. Um dos processos aplicado com vista a essa estimação utiliza a

análise da distribuição de frequências de caudais de cheia através de procedimentos estatísticos.

A análise da distribuição de frequências de caudais de cheia visa determinar a probabilidade de um

dado valor do caudal de cheia numa secção de um curso de água ser excedido durante um intervalo

de tempo especificado e, inversamente, determinar a estimativa do caudal de cheia associada a um

dado risco, isto é, o valor do caudal de cheia que é excedido com uma dada probabilidade durante

um certo intervalo de tempo. Normalmente o intervalo de tempo é o ano. O inverso da

probabilidade de o caudal de cheia ser excedido durante um ano é designado, em Hidrologia, por

período de retorno e é expresso em anos. Ao período de retorno está, normalmente, associado o

conceito de risco de ocorrência de cheias (HENRIQUES, 1990).

O anterior tipo de análise pressupõe a existência de uma amostra de registos de caudais

instantâneos máximos anuais, por exemplo, recolhida numa estação hidrométrica à qual é ajustado

um modelo estatístico que permite caracterizar, em termos de distribuição de frequências e de

quantis, os caudais de cheia expectáveis nessa secção da rede hidrográfica.

No entanto, muitos dos acontecimentos hidrológicos não podem ser caracterizados plenamente

tendo apenas por base uma das variáveis neles envolvidas já que, por regra, dependem de um

diverso conjunto de variáveis. É este o caso dos eventos de cheia nos quais, para além do caudal de

ponta, o volume associado a cada cheia constitui uma variável também importante, nomeadamente,

quando está em causa um problema de amortecimento de ondas de cheia em albufeiras. Assim, se

um acontecimento hidrológico é multivariado, ou seja, descrito por um conjunto de variáveis

aleatórias correlacionadas, a análise de frequências de apenas uma dessas variáveis fornecerá uma

avaliação incompleta da probabilidade de ocorrência. Uma melhor compreensão das características

probabilísticas desses eventos exige o estudo da distribuição conjunta das variáveis neles

intervenientes.

Os eventos multivariados e o exercício da sua modelação foram objecto de vários estudos por parte

de inúmeros investigadores ao longo dos últimos anos, sendo que se incluiu no capítulo 1 uma breve

síntese desses estudos. Nesse capítulo, evidenciou-se que, em geral, as soluções apresentadas se

Page 30: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

10

baseiam em dois pressupostos: as variáveis aleatórias que constituem determinado acontecimento

seguem a mesma lei de probabilidades e a distribuição conjunta dessas variáveis é conhecida, sendo

que as distribuições mais utilizadas em Hidrologia são a Normal, a de Gumbel e a Exponencial

(ZHANG e SINGH, 2006). No entanto, facilmente se compreende que a assumpção de tais

pressupostos pode, com elevada probabilidade, constituir um erro na modelação dos eventos

hidrológicos em causa, uma vez que as variáveis hidrológicas não seguem, em geral, a mesma

distribuição de probabilidade e a distribuição conjunta não é conhecida. Para colmatar tal deficiência

na caracterização de eventos multivariados, nos últimos anos, têm sido desenvolvidos estudos que

permitem construir modelos sem recurso a pressupostos do tipo enunciado e que têm por base a

teoria das cópulas.

As cópulas, nas utilizações em causa, podem ser entendidas como funções que permitem estabelecer

a distribuição conjunta de probabilidades associada a um evento hidrológico, caracterizado por mais

de uma variável. A sua construção baseia-se apenas em parâmetros que traduzem a dependência

entre as anteriores variáveis hidrológicas sendo independentes das distribuições marginais das

variáveis.

O presente capítulo compreende uma síntese de conhecimentos no âmbito da análise da distribuição

de frequências de caudais e de volumes de cheia (pontos 2.3 e 2.4) e da análise multivariada e da

teoria das cópulas (ponto 2.6), bem como uma importante referência aos conceitos e diferenças

existentes entre séries de máximos anuais e séries de valores acima de um limiar (ponto 2.2). No

ponto 2.5 são ainda apresentados os diferentes métodos aplicados de avaliação da qualidade do

ajustamento das distribuições estatísticas às amostras a analisar.

2.2. Séries de máximos anuais e séries de valores acima de um limiar

Os procedimentos de análise estatística e da teoria das cópulas, descritos de seguida, foram

aplicados a séries de máximos anuais, concretamente, de caudais instantâneos máximos anuais, mas

também a séries de caudais acima de um limiar. A principal crítica à utilização de séries de máximos

anuais em detrimento do uso de séries de caudal acima de limiar está relacionada com o facto de,

nas primeiras, se considerar somente o maior evento de cada ano hidrológico, não se tendo em

conta o segundo, o terceiro, etc., maiores eventos que, contudo, podem ser superiores aos máximos

eventos de outros anos. Segundo HENRIQUES (1990, p.17), a incerteza da estimação efectuada com

base em modelos de séries de caudais instantâneos acima de um limiar é menor para pequenos

períodos de retorno, principalmente no caso de amostras de reduzida dimensão. Contudo, um dos

Page 31: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

11

aspectos negativos dos modelos baseados em séries de valores acima de um limiar é a fixação desse

limite, que constitui, em regra, um factor arbitrário (HENRIQUES, 1990, p. 328).

No caso específico das aplicações efectuadas, a construção das séries de caudal acima de um dado

limiar em cada uma das estações hidrométricas analisadas requereu a digitalização de limnigramas aí

registados, a partir dos quais se seleccionaram todas as cheias com caudais de ponta superiores a 5

vezes o módulo, desde que prefigurassem cheias independentes. O limiar do quíntuplo do módulo foi

seleccionado por alguns autores considerarem tal limiar como indicativo da ocorrência de uma cheia

(QUINTELA, 1996, p. 10.1). Tendo por base as anteriores cheias, admitiu-se que um dado hidrograma

de cheia, apresentando um ou mais picos relativos, separado do próximo hidrograma por um período

de recessão suficientemente longo, de modo a garantir a anulação do escoamento directo,

constituiria um acontecimento de cheia independente. A cada um desses acontecimentos foi

atribuído o maior caudal de ponta do hidrograma que o constitui, bem como um dado volume de

cheia, conforme se retomará oportunamente. A figura que se segue exemplifica o processo de

selecção, onde são identificados três acontecimentos independentes.

Figura 2.1 – Figura ilustrativa do processo de selecção de cheias independentes.

Para cada uma das cheias seleccionadas, especificou-se ainda o correspondente volume, sendo que

as amostras de volume assim constituídas foram também objecto de tratamento estatístico, quer por

aplicação dos procedimentos tradicionais da análise estatística, quer por recurso à teoria das

cópulas.

0

20

40

60

80

100

120

140

0 50 100 150 200 250 300 350 400

Cau

dal

(m

3/s

)

Tempo (h)

Série de caudais instantâneos Limiar = quíntuplo do módulo Cheia independente

1 2 3

1

Page 32: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

12

No tratamento estatístico de séries acima de dados limiares é necessário proceder à correcção do

período de retorno para atender ao facto de se ter mais de um acontecimento por ano. Para tanto,

se λ designar o número médio de acontecimentos independentes por ano, o período de retorno, T,

expresso em anos, é dado aproximadamente por:

1

1 'T

F

(2.1)

em que F´ é a probabilidade de não-excedência associada a uma dada cheia avaliada a partir da série

acima de um limiar (NAGHETTINI e PINTO, 2007, p. 340).

2.3. Modelos de distribuição de frequências

2.3.1. Considerações prévias

A aplicação de um modelo de distribuição de frequências a uma amostra de uma variável aleatória,

como seja a amostra de caudais máximos anuais constitui um processo faseado que se pode

desenvolver de acordo com as seguintes etapas (HENRIQUES, 1990; STEDINGER E TAKARA, 1994, in

DIAS, 2003, p. 16):

i) enumeração das distribuições aplicáveis à determinação dos quantis;

ii) obtenção dos parâmetros de cada distribuição;

iii) verificação da qualidade do ajustamento de cada distribuição postulada à amostra.

Os modelos de distribuição de frequências de caudais de cheia devem ser compatíveis com as

condições físicas que determinam o fenómeno e reproduzir as características genéricas das funções

de distribuição empírica das amostras daqueles caudais. Para que os requisitos anteriores sejam

respeitados, as funções de distribuição cumulativa de frequências, ou simplesmente funções de

distribuição, dos caudais máximos anuais devem satisfazer algumas das seguintes condições (DIAS,

2003, p. 16):

a) continuidade;

b) limite inferior não negativo;

c) assimetria positiva;

d) unicidade da moda.

As condições a) e b) estão relacionadas com as condições físicas da ocorrência de caudais de ponta

de cheia. O modelo de distribuição de frequências deverá ser contínuo, uma vez que os caudais de

Page 33: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

13

ponta de cheia podem assumir qualquer valor não negativo num determinado intervalo real.

Geralmente, a condição do limite inferior da distribuição não negativo não é adoptada de forma

explícita, considerando-se admissíveis os modelos de distribuição de frequências em que a

probabilidade de ocorrência de valores negativos seja desprezável. As condições c) e d) dizem

respeito à forma genérica das funções de distribuição empírica das séries de caudais máximos anuais.

Por último, importa referir que as distribuições seleccionadas deverão ter um número reduzido de

parâmetros, por se dispor de amostras de reduzida dimensão que tornam impossível uma estimação

eficiente havendo um grande número de parâmetros. Por este motivo e segundo CORREIA, 1983,

p. 150, deve ser preferida a utilização de distribuições de probabilidade com apenas dois ou três

parâmetros.

Tendo em conta os aspectos referidos, são brevemente apresentadas, de seguida, as distribuições

aplicáveis à determinação de quantis, para o que, no essencial, se recorreu aos trabalhos publicados

por NAGHETTINI e PINTO, 2007, HENRIQUES, 1990 e CORREIA, 1983.

2.3.2. Distribuição Normal

A distribuição Normal, também conhecida como de Gauss, é utilizada para descrever variáveis

aleatórias com comportamento simétrico em torno de um valor central – função densidade de

probabilidade simétrica em relação à média. Esta distribuição está na origem de toda a formulação

teórica envolvida na construção de intervalos de confiança e em testes estatísticos de hipóteses,

bem como da teoria de regressão e correlação. Por tal razão foi incluída no presente capítulo, não

obstante não ser adequada a sua aplicação à análise de fenómenos extremos em hidrologia cujas

séries exibem, por regra, assimetria significativamente diferente de zero.

A distribuição Normal é um modelo de dois parâmetros, cujas funções densidade, fX(x) e de

distribuição, FX(x), são expressas, respectivamente, por:

2

2

1 1 

22X

xf x exp para x

(2.2)

2

2

1 1

22

x

X

xF x exp dx

(2.3)

com

Page 34: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

14

α – parâmetro de posição

β – parâmetro de escala

Os parâmetros da distribuição são estimados em função dos respectivos momentos centrados,

obtendo-se as mesmas expressões pelo método dos momentos e pelo método da máxima

verosimilhança, ou seja:

e

O coeficiente de assimetria γ é nulo, uma vez que a distribuição é simétrica. Por este motivo, a

distribuição Normal não se ajusta bem às séries hidrológicas, com ênfase para as referentes a

acontecimentos extremos, que têm normalmente exibem assimetria não desprezável, como

anteriormente mencionado.

A função distribuição de probabilidade da distribuição Normal não tem solução analítica. Esse

inconveniente pode ser superado a partir da transformação linear Z = /σX da variável Normal

X, de parâmetros µ e σ. As funções densidade, fZ(z), e distribuição, FZ(z), de probabilidade de Z são

dadas, respectivamente, por:

21

 22

Z

zf z exp para z

(2.4)

21

Φ  22

z

Z

zF z z exp dz para z

(2.5)

A função distribuição de probabilidade da distribuirão normal padrão Φ(z) pode ser obtida mediante

integração numérica, cujos resultados são também apresentados na forma tabular, sendo que

actualmente se dispõe ainda de funções do Excel para resolver, tanto FZ(z), como a correspondente

função inversa.

2.3.3. Distribuição log-Normal

Diz-se que uma variável se ajusta a uma distribuição log-Normal de dois parâmetros ou lei de Galton

quando é possível ajustar uma distribuição Normal à transformada logarítmica dessa variável. Se X se

Page 35: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

15

ajusta à lei de Galton isso significa que lnY X se ajusta a uma distribuição Normal. O facto de o

domínio da variável X ser sempre positivo ( ) e de a lei de Galton apresentar assimetria

positiva permite considerar tal lei como adequada a séries de valores extremos de variáveis

hidrológicas, como sejam precipitações intensas e caudais instantâneos máximos anuais.

A função de distribuição de probabilidade da lei de Galton é dada por:

2

0

ln1 1  0

22

xy

X

yy

xF x exp dx para x

x

(2.6)

Os parâmetros μ e σ, calculados pelo método dos momentos, são dados por:

2

ln2

y

y x

(2.7)

1

2 2

2ln 1 x

y

x

(2.8)

Por meio dos seus dois parâmetros, a lei de Galton assegura o ajustamento a uma variável com

dados valores da média e da variância e com assimetria positiva, mas, obviamente, não garante a

preservação da assimetria da amostra. O coeficiente de assimetria da distribuição é obtido em

função do coeficiente de variação da variável X, CV , por NAGHETTINI e PINTO, 2007, p. 142:

3 3 VVC C (2.9)

2.3.4. Distribuição de Pearson tipo III

Uma variável aleatória X possui uma distribuição de Pearson tipo III se a variável (X – γ) é distribuída

conforme uma Gama com parâmetro de escala β e parâmetro de forma θ. De facto, se o parâmetro

de posição, α, da distribuição Pearson do tipo III, for nulo, essa distribuição reduz-se a uma Gama.

Por essa razão, a distribuição de Pearson tipo III também recebe o nome de Gama de três

parâmetros.

As funções densidade probabilidade, fx(x), e distribuição, Fx(x), da distribuição de Pearson tipo III são

dadas, respectivamente, por:

0 X

Page 36: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

16

1

1( ) exp

( )X

x xf x

(2.10)

1

1( ) exp

( )X

x xF x dx

(2.11)

em que , e são os parâmetros de posição, de escala e de forma, como antes explicitado, e é a

função gama. A estimação dos parâmetros pelo método dos momentos processa-se igualando a

média, µ, a variância, σ2, ou, de modo equivalente, o desvio-padrão, σ, e o coeficiente de assimetria,

, da distribuição aos correspondentes valores da amostra, do que resultam as seguintes equações:

(2.12)

2

4

(2.13)

(2.14)

2.3.5. Distribuição log-Pearson tipo III

Uma variável x ajusta-se a uma distribuição log-Pearson tipo III se a sua transformada logarítmica se

ajusta a uma distribuição de Pearson tipo III. Assim, basta recorrer à transformada logarítmica dos

valores da amostra:

y ln x

e proceder ao ajustamento da distribuição de Pearson tipo III à série y dos logaritmos.

2.3.6. Distribuição de Gumbel

A distribuição de Gumbel é também designada por Fisher-Tippet tipo I, dupla exponencial e de

valores extremos do tipo I.

As funções densidade de probabilidades, fX(x), e distribuição de probabilidade, FX(x), são expressas,

respectivamente, por:

Page 37: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

17

1

( ) exp expX

x xf x

(2.15)

( ) exp exp , , 0X

xF x para x

(2.16)

Trata-se, portanto, de uma distribuição com apenas dois parâmetros: o parâmetro de posição, α, e o

parâmetro de escala, β. Utilizando o método dos momentos, os parâmetros podem ser estimados

pelas seguintes expressões, que igualam a média e o desvio-padrão da distribuição às

correspondentes estatísticas amostrais:

6

(2.17)

(2.18)

em que é a constante de Euler-Mascheroni ( 0,5772):

O ajustamento assegura a preservação da média e a variância de uma dada amostra, mas não a

preservação da assimetria que, aliás, no caso da distribuição de Gumbel é fixa e igual a 1,1396 .

Assim, se o coeficiente de assimetria de uma amostra for muito diferente do anterior valor é de

esperar que a amostra exiba um fraco ajustamento à distribuição de Gumbel.

2.3.7. Distribuição de Goodrich

A distribuição de Goodrich é derivada da distribuição de Weibull por introdução dum terceiro

parâmetro, α, que corresponde ao limite inferior do domínio de aplicação. Resulta, assim, para a

função de distribuição de probabilidade:

1( ) 1 exp ( ) ,XF x x x (2.19)

No pressuposto, mais uma vez, de aplicação do método dos momentos, a determinação dos

parâmetros α, β e θ da distribuição processa-se igualando as médias, os desvios-padrão e os

coeficiente de assimetria da amostra e da distribuição, do que resultam as seguintes equações em

que as variáveis têm os significados anteriormente explicitados:

Page 38: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

18

3

3 22

(3 1) 3 (2 1) ( 1) 2 ( 1)

(2 1) ( 1)

(2.20)

12 2

2

(2 1) ( 1)

(2.21)

1

( 1)

(2.22)

A resolução da primeira equação permite determinar o parâmetro β para o que basta considerar que

a assimetria da distribuição, , iguala a da amostra. Nas aplicações efectuadas, tal resolução foi

efectuada numericamente com recurso às funções Solver e Gama do Excel. A obtenção dos outros

dois parâmetros, α e θ, processa-se de forma directa, uma vez que se disponha da solução da função

Gama.

2.4. Análise de frequências pelo método do factor de probabilidade

2.4.1. Conceito geral

O método do factor de probabilidade, que decorre directamente do método dos momentos

(HENRIQUES, 1990, p. 319), permite estimar o valor de uma variável aleatória com determinado

período de retorno, a partir da média e do desvio-padrão da correspondente amostra, a que, por sua

vez, foram igualados a média e o desvio-padrão da distribuição, µ, e σ, respectivamente.

No âmbito da presente dissertação de mestrado, tal método foi amplamente aplicado para

representar as funções de distribuição de probabilidade de leis teóricas, nomeadamente na

apreciação visual no ajustamento dessas leis e na definição dos limites dos intervalos a considerar na

aplicação de testes de apreciação do ajustamento, objecto da secção 3.5.

A equação que define a aplicação do factor de probabilidade é dada por, CHOW, 1964:

T X XTx K (2.23)

onde xT representa a estimativa do valor da variável X para o período de retorno T e KT, o

correspondente factor de probabilidade que depende da distribuição de probabilidades considerada

e do período de retorno.

Page 39: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

19

No caso do ajustamento de leis estatísticas se processar no campo da transformada logarítmica da

variável, ou seja, se lny x , como acontece com as distribuições log-Normal e log-Pearson tipo

III, pode aplicar-se um procedimento equivalente definido por:

T Y YTKy (2.24)

Para estimar xT, tendo-se previamente obtido a estimativa yT, basta inverter a função logaritmo, ou

seja:

expT Tx y (2.25)

Para uma dada lei estatística, o cálculo de KT, para um dado período de retorno T, processa-se ou a

partir de uma tabela, quando disponível, ou através de equações matemáticas, algumas exactas

(como no caso da lei de Gumbel) outras decorrentes de aproximações numéricas (como no caso das

leis normal e de Pearson III). Tais equações são seguidamente apresentadas para as diversas

distribuições de probabilidades referidas no capítulo anterior, para o que, no essencial, se recorreu

aos trabalhos publicados por NAGHETTINI e PINTO, 2007, HENRIQUES, 1990 e CORREIA, 1983.

2.4.2. Distribuição Normal

O factor de probabilidade da distribuição Normal não é mais do que a normal reduzida, z. Não

obstante no âmbito do estudo efectuado se ter recorrido às funções do Excel, tanto para calcular o

valor de z correspondente a uma dada probabilidade de não-excedência, como para resolver o

problema inverso, apresentam-se, seguidamente equações para o efeito aplicáveis, as quais são

válidas para períodos de retorno superiores a 2 anos.

2

2 3

2,515517 0,802853 0,010328

1 432788 0,189269 0,001308

z zK z

z z z

(2.26)

1

2 2lnz T (2.27)

Para períodos de retorno inferiores a 2 anos (ou seja, para probabilidades de não-excedência

inferiores a 0,5), o cálculo de z processa-se atendendo à simetria da lei Normal.

Page 40: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

20

2.4.3. Distribuição de Gumbel

A equação que fornece o factor de probabilidade da lei de Gumbel é a seguindamente apresentada

na qual é a constante de Euler-Mascheroni ( 0,5772):

6

ln ln1

TK

T

(2.28)

2.4.4. Distribuição de Pearson tipo III

O factor de probabilidade da distribuição de Pearson tipo III pode ser obtido por meio de tabelas

apropriadas ou aproximado pela transformação de Wilson-Hilferty, dada por:

2 3 2 2 3 4 51 11 6 1

3 3K z z k z z k z k zk k (2.29)

com

z = variável Normal reduzida =KN

6k

2.4.5. Distribuição de Goodrich

No caso da lei de Goodrich o factor de frequência é dado por:

1

ln 1K A BT

(2.30)

com

1

2 2Γ 2 1 Γ ( 1)B (2.31)

1 Γ( 1)A B (2.32)

Em alternativa, os valores da variável aleatória podem ser estimados aplicando a seguinte

formulação:

Page 41: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

21

1 1

lnxT

(2.33)

Neste caso, α, β e θ são os parâmetros já definidos na secção 2.3.7.

2.5. Ajustamento de leis teóricas

2.5.1. Considerações prévias

Seleccionados os modelos para as distribuições de frequências dos caudais, definidas as respectivas

funções de distribuição cumulativas, FX(x), e estimados os parâmetros dos modelos a partir das

amostras, a fase seguinte do estudo relaciona-se com a averiguação da qualidade do ajustamento

das distribuições postuladas àquelas amostras.

Esta avaliação é importante uma vez que as estimativas de caudal obtidas através dos modelos

aplicados podem diferir dos valores verdadeiros. Estas diferenças podem dever-se (WMO, 1989, in

DIAS, 2003):

i) à incapacidade do modelo escolhido para reproduzir a relação caudal – probabilidade de

não-excedência, Q – T/F, da população;

ii) à identificação incorrecta do modelo de distribuição de frequências mais adequado para

descrever a população;

iii) ao viés introduzido no procedimento de determinação dos parâmetros da distribuição;

iv) ao erro de amostragem resultante do facto de a estimação dos parâmetros ser realizada a

partir de uma amostra finita;

v) ao facto de a amostra disponível não constituir uma amostra verdadeiramente aleatória.

No processo de aplicação de um modelo de distribuição de frequências a uma série de caudais não é

possível evitar as fontes de erro resultantes de ii), iii) e iv). No entanto, o método de ajustamento

deve minimizar estes erros e ser tão eficiente quanto possível.

Nas secções seguintes, são descritas as medidas aplicadas para avaliar o ajustamento dos modelos

estatísticos postulados às amostras a que foram aplicados.

Page 42: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

22

2.5.2. Ajustamento visual

Uma vez definidas as distribuições aplicáveis à determinação de quantis, a primeira etapa na

verificação da qualidade do ajustamento de cada distribuição a uma dada amostra é a apreciação

visual. Embora seja um procedimento subjectivo, o exame visual do ajustamento entre as

distribuições de probabilidades e os dados observados pode ser útil para aceitar ou rejeitar, ainda

que empiricamente, a hipótese de aderência de um certo modelo de distribuição de probabilidades.

O exame visual consiste na disposição em gráfico dos valores amostrais e das estimativas dos quantis

pelas diferentes leis estatísticas, associadas às respectivas probabilidades de não-excedência.

No que diz respeito à representação dos valores da amostra, é necessário determinar as

probabilidades empíricas de não-excedência, atribuindo a cada elemento da amostra uma estimativa

empírica da fracção do número de elementos dessa amostra com valor igual ou superior ao do

elemento considerado – probabilidade empírica de não-excedência ou posição de “plotagem” numa

tradução à letra do termo inglês plotting position. Para o efeito, estabelece-se uma correspondência

entre aquele elemento e o número de ordem sequencial, i, que resulta da ordenação por valores

crescentes dos elementos da amostra (1 i N , sendo N a dimensão da amostra). O número de

ordem, i, atribuído a cada elemento indica, portanto, o número de elementos da amostra com valor

inferior ou igual ao valor do elemento considerado. Na inexistência de repetição de valores, como é

frequente acontecer quando se trata de variáveis hidrológicas, a ordenação conduz à numeração

sequencial e contínua dos elementos amostrais.

As fórmulas de cálculo das probabilidades empíricas de não-excedência utilizam os anteriores

números de ordem e são frequentemente casos particulares da seguinte fórmula (PORTELA e

DELGADO, 2009a, 2009b):

1 2

i

iF x

N

(2.34)

em que i é o número de ordem do elemento xi, F(xi) representa a probabilidade empírica de não-

excedência associada a esse elemento, conforme anteriormente explicitado, N é a dimensão da

amostra e θ é uma constante compreendida entre 0 e 1 e que determina a qualidade do ajustamento

entre probabilidades empíricas de acordo com as diferentes leis postuladas. CUNNANE, 1978,

recomenda os valores mais adequados de θ para diferentes distribuições de probabilidade teóricas,

indicando também o melhor valor de θ a adoptar quando se tem como objectivo utilizar uma única

fórmula para a determinação da probabilidade empírica de não-excedência, independentemente da

Page 43: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

23

lei estatística a ajustar – 2 5 . De acordo com esta última indicação, na investigação que se

apresenta a fórmula utilizada para obter probabilidade empírica de não-excedência foi a seguinte:

2 / 5

1/ 5i

iF x

N

(2.35)

De modo a automatizar o procedimento de representação gráfica em papel de probabilidade da lei

Normal inerente ao exame visual do ajustamento entre amostras e distribuições de probabilidade, os

sucessivos valores das funções distribuição de probabilidades, quer fornecidos pelas leis teóricas,

quer correspondentes a probabilidades empíricas, foram expressos em termos dos valores da

variável Normal reduzida, z, que lhes correspondem. Assim, os eixos das ordenadas dos gráficos que

suportaram o ajustamento visual representam valores amostrais ou estimativas obtidas pelas

distribuições de probabilidade postuladas e os eixos das abcissas, valores da normal reduzida, z.

2.5.3. Testes de aderência: Qui-Quadrado e Kolmogorov-Smirnov

2.5.3.1. Conceito geral

Os testes de hipóteses são procedimentos usuais da análise estatística, úteis na tomada de decisões

no que respeita à forma ou ao valor de um determinado parâmetro de uma distribuição de

probabilidades, da qual se conhece apenas uma amostra de observações. Tais testes envolvem a

formulação de uma hipótese, na forma de uma declaração conjectural sobre o comportamento

probabilístico da população. Não rejeitar ou rejeitar uma tal hipótese irá depender do “confronto”

entre a “conjectura” e a “realidade física”, esta última concretizada pelas observações que compõem

a amostra. A rejeição da hipótese implica a necessidade de eventual revisão da conjectura inicial, em

resultado de seu desacordo relativamente à realidade imposta pelos valores amostrais. Por outro

lado, a não rejeição da hipótese significa que, com base naqueles valores, não há elementos

suficientes para descartar a plausibilidade da premissa inicial sobre o comportamento da variável

aleatória, pelo que, “não rejeitar” não significa “aceitar” a hipótese. Quando a hipótese, a ser

testada, diz respeito à forma do modelo distributivo da população de onde a amostra foi extraída, os

testes são denominados de aderência (NAGHETTINI e PINTO, 2007).

No contexto da aplicação de testes de aderência, a hipótese inicial, H0, pode ser expressa

concretamente do seguinte modo: dada uma amostra de uma variável aleatória, esta provém de

uma população com distribuição de frequências especificada pelo modelo seleccionado, com

parâmetros estimados a partir da amostra.

Page 44: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

24

Os testes de aderência mais frequentemente aplicados são o teste do Qui-Quadrado, χ2, e os testes

baseados na função de distribuição empírica, dos quais o mais divulgado é o teste de Kolmogorov-

Smirnov (DIAS, 2003, p. 37). Nas secções seguintes, apresenta-se a descrição de ambos os testes,

para o que se consultou os trabalhos publicados por DIAS, 2003, HENRIQUES, 1990 e NAGHETTINI e

PINTO, 2007.

2.5.3.2. Teste do qui-quadrado

O teste do qui-quadrado consiste na divisão do domínio da função de distribuição de probabilidade

em M intervalos e na comparação do número de elementos da amostra contidos em cada intervalo,

Oj, com a esperança matemática, indicada pelo modelo, do número de elementos correspondentes a

esse intervalo, Ej.

A estatística de teste é definida por χ2:

2

2

1

( )Mj j

j j

O E

E

(2.36)

em que Oj é o número de elementos da amostra contidos no intervalo j e Ej o valor esperado do

número de elementos no mesmo intervalo j. Tal esperança é dada por j jE NA , em que Aj é a

amplitude do intervalo j, avaliada em conformidade com o modelo postulado e N é a dimensão da

amostra.

Dada a hipótese H0, a estatística de teste tem assintopticamente a distribuição χ2 com M-1 graus de

liberdade, se o modelo for especificado independentemente da amostra. No caso em questão, em

que as distribuições avaliadas dependem de m parâmetros estimados a partir da amostra, perdem-se

m graus de liberdade, ou seja, a estatística de teste segue uma distribuição χ2 com M-m-1 graus de

liberdade, dada a hipótese H0.

Atendendo à equação (2.36), conclui-se que um valor elevado da estatística de teste revela grandes

diferenças entre as frequências observadas e esperadas, sendo um indicador da pouca aderência da

distribuição especificada, sob H0, à amostra. O teste estatístico pode, então, formular-se do seguinte

modo: rejeitar H0 com um nível de confiança (1-α) se 2 2

1 , em que 2

1 é o quantil (1-α) da

distribuição χ2, tratando-se, portanto, de um teste unilateral. No presente trabalho, adoptou-se um

nível de significância de α=0,05. No quadro 2.1 apresentam-se os valores da função de

probabilidades acumuladas da distribuição de χ2, para diferentes graus de liberdade.

Page 45: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

25

Os valores da estatística χ2 dependem do número de intervalos, M, sendo que, contudo, não existem

regras para seleccionar tal número, nem a sua amplitude. Segundo MANN e WALD, 1942, citados por

HENRIQUES, 1990, é recomendável que a partição do domínio da função seja de modo a se obter M

intervalos de igual amplitude. Na mesma publicação, HENRIQUES, 1990, propõe ainda que o número

de intervalos M seja função da dimensão da amostra. Deste modo, no presente trabalho, utilizaram-

se as partições da função de distribuição cumulativa, FX(x), que se indicam no quadro 2.2, adaptado

de HENRIQUES, 1990.

Quadro 2.1 - Valores da função de probabilidades acumuladas da distribuição de de χ2, para diferentes graus de liberdade.

Quadro 2.2 - Partições do domínio da distribuição cumulativa de frequências, utilizadas na aplicação do teste do Qui-Quadrado (adaptado de HENRIQUES, 1990).

0,995 0,975 0,900 0,500 0,100 0,050 0,025 0,010 0,005 0,001

1 0,000 0,001 0,016 0,455 2,706 3,841 5,024 6,635 7,879 10,827

2 0,010 0,051 0,211 1,386 4,605 5,991 7,378 9,210 10,597 13,815

3 0,072 0,216 0,584 2,366 6,251 7,815 9,348 11,345 12,838 16,266

4 0,207 0,484 1,064 3,357 7,779 9,488 11,143 13,277 14,860 18,466

5 0,412 0,831 1,610 4,351 9,236 11,070 12,832 15,086 16,750 20,515

6 0,676 1,237 2,204 5,348 10,645 12,592 14,449 16,812 18,548 22,457

7 0,989 1,690 2,833 6,346 12,017 14,067 16,013 18,475 20,278 24,321

8 1,344 2,180 3,490 7,344 13,362 15,507 17,535 20,090 21,955 26,124

9 1,735 2,700 4,168 8,343 14,684 16,919 19,023 21,666 23,589 27,877

10 2,156 3,247 4,865 9,342 15,987 18,307 20,483 23,209 25,188 29,588

11 2,603 3,816 5,578 10,341 17,275 19,675 21,920 24,725 26,757 31,264

12 3,074 4,404 6,304 11,340 18,549 21,026 23,337 26,217 28,300 32,909

13 3,565 5,009 7,041 12,340 19,812 22,362 24,736 27,688 29,819 34,527

14 4,075 5,629 7,790 13,339 21,064 23,685 26,119 29,141 31,319 36,124

15 4,601 6,262 8,547 14,339 22,307 24,996 27,488 30,578 32,801 37,698

16 5,142 6,908 9,312 15,338 23,542 26,296 28,845 32,000 34,267 39,252

17 5,697 7,564 10,085 16,338 24,769 27,587 30,191 33,409 35,718 40,791

18 6,265 8,231 10,865 17,338 25,989 28,869 31,526 34,805 37,156 42,312

19 6,844 8,907 11,651 18,338 27,204 30,144 32,852 36,191 38,582 43,819

20 7,434 9,591 12,443 19,337 28,412 31,410 34,170 37,566 39,997 45,314

21 8,034 10,283 13,240 20,337 29,615 32,671 35,479 38,932 41,401 46,796

22 8,643 10,982 14,041 21,337 30,813 33,924 36,781 40,289 42,796 48,268

23 9,260 11,689 14,848 22,337 32,007 35,172 38,076 41,638 44,181 49,728

24 9,886 12,401 15,659 23,337 33,196 36,415 39,364 42,980 45,558 51,179

25 10,520 13,120 16,473 24,337 34,382 37,652 40,646 44,314 46,928 52,619

26 11,160 13,844 17,292 25,336 35,563 38,885 41,923 45,642 48,290 54,051

27 11,808 14,573 18,114 26,336 36,741 40,113 43,195 46,963 49,645 55,475

28 12,461 15,308 18,939 27,336 37,916 41,337 44,461 48,278 50,994 56,892

29 13,121 16,047 19,768 28,336 39,087 42,557 45,722 49,588 52,335 58,301

30 13,787 16,791 20,599 29,336 40,256 43,773 46,979 50,892 53,672 59,702

Graus de liberdadeNível de significância = 1 - nível de confiança

Page 46: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

26

2.5.3.3. Teste de Kolmogorov-Smirnov

O teste de aderência de Kolmogorov-Smirnov consiste em determinar a estatística DN dada pela

diferença máxima entre as funções de probabilidades acumuladas empírica e teórica. A estatística do

teste é definida por:

| ( ) ( ) |N N xD máx F x F x (2.37)

em que FN(x) é a probabilidade empírica de não-excedência atribuída a cada elemento da amostra,

determinada pela equação (2.35), e FX(x) é a respectiva estimativa teórica, calculada em função do

modelo de distribuição de probabilidades que se pretende testar. No estudo que se apresenta, tais

estimativas foram obtidas para cada modelo de distribuição e para cada elemento xi de uma dada

amostra, pela resolução da equação (2.23), referente ao factor de probabilidade, Ki, em ordem a

esse factor tendo por base a média e o desvio-padrão dessa amostra. Por sua vez, o factor de

probabilidade é função do período de retorno, Ti, que, uma vez determinado, permite obter a

probabilidade de não-excedência teórica do elemento em causa da amostra, através da relação

1 1i iF T .

O procedimento descrito foi aplicado directamente no caso da distribuição de Gumbel. No entanto,

para a distribuição Normal e log-Normal, Fi foi determinado através da função do software Excel a

partir do respectivo factor de probabilidade Ki, uma vez que, para estas distribuições, Ki=z. Para a

distribuição de Goodrich, não foi utilizada a equação do factor de probabilidade mas sim a equação

alternativa (2.33). No caso da distribuição de Pearson III e log-Pearson III, a obtenção do período de

retorno através da equação relativa ao factor de probabilidade não é de fácil execução, razão pela

qual se adoptou um procedimento numérico que fornece primeiramente o valor da variável reduzida

z, sendo este posteriormente transformado numa probabilidade de não-excedência através da

função para o efeito disponível no software Excel.

A formulação do teste de Kolmogorov-Smirnov é análoga à do teste do qui-quadrado: a hipótese H0 é

rejeitada com nível de confiança (1-α) se ,1N ND D (teste unilateral), em que DN,1-α é o valor

crítico, máximo aceitável para esse nível de confiança.

O valor crítico de DN depende ainda da dimensão da amostra, N, sendo que para amostras com

dimensão superior a 40, o valor crítico da estatística é dado por 1,3581 N , para um nível de

significância de 0,05 (NAGHETTINI e PINTO, 2007, p. 276). Para amostras de dimensão inferior a 40,

os valores críticos de DN são retirados do quadro 2.3 que se segue.

Page 47: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

27

Quadro 2.3 - Valores críticos da estatística do teste DN,α de aderência de Kolmogorov-Smirnov.

2.5.4. Outras medidas de avaliação do ajustamento

Para além dos testes enunciados anteriormente, foram aplicadas, fundamentalmente a título

indicativo, algumas medidas de erro, cujos resultados tiveram como única utilidade a de optar entre

distribuições teóricas, mas somente quando os testes de hipóteses e o ajustamento visual

sugerissem a adequação dessas distribuições. Foram determinados o erro padrão de previsão, SEP

(percent standard error of prediction), o coeficiente de eficiência, Ej, e a variação relativa média, ARV

(average relative variance). Segundo PULIDO-CALVO e PORTELA, 2007, esses três estimadores

permitem avaliar, de algum modo, a capacidade do modelo para caracterizar a variação total dos

dados. Tais autores referem também que é aconselhável quantificar o erro de previsão nas mesmas

unidades que as variáveis através de medidas de erro absoluto, como a raiz quadrada do erro

quadrático médio, RMSE (square root of the mean square error), e o erro absoluto médio, MAE

(mean absolute error), dados por:

2

1

ˆN

t t

i

x x

RMSEN

(2.38)

1

ˆ| |N

t t

i

x x

MAEN

(2.39)

Page 48: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

28

onde xt é o valor observado de número de ordem t, tx̂ é a respectiva estimativa teórica e N é a

dimensão da amostra.

O erro padrão de previsão, expresso em percentagem, é definido por:

100

SEP RMSEx

(2.40)

onde x é a média amostral. A principal vantagem de SEP é a sua adimensionalidade, que permite

comparar, em percentagem, as previsões obtidas com base em diferentes modelos.

O coeficiente de eficiência, Ej, e a variação relativa média, ARV, representam a relação entre a

variação das estimativas dadas pelo modelo e a variação da amostra em torno da média amostral,

sendo definidos por:

1

1

ˆ| |

1,0

| |

Nj

t t

ij N

j

t

i

x x

E

x x

(2.41)

2

12

2

1

ˆ| |

1,0

| |

N

t t

i

N

t

i

x x

ARV E

x x

(2.42)

A sensibilidade para outliers, devido ao quadrado das diferenças, é maior no coeficiente de eficiência

e no erro absoluto médio. Um valor nulo para E2 indica que a média observada é uma medida de

previsão tão boa como o modelo aplicado, enquanto que valores negativos indicam que a média

fornece uma melhor previsão que o modelo. Para um bom ajustamento do modelo, o valor de Ej

deve estar perto da unidade e os valores de SEP e de ARV perto de zero.

2.6. Teoria das cópulas

2.6.1. Análise multivariada

2.6.1.1. Conceito geral

Para a análise de frequência de uma única variável as relações e procedimentos de análise que

concretizam os diferentes conceitos estatísticos, tais como probabilidades de não-excedência,

períodos de retorno, estimação de valores, entre outros, estão bem estabelecidos. No entanto,

muitos dos eventos hidrológicos podem ser descritos por mais de uma variável. É este o caso das

Page 49: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

29

cheias fluviais naturais para cuja caracterização pode ser relevante combinar caudais de ponta e

volumes de cheia. Se um evento hidrológico é multivariado, ou seja, descrito por um conjunto de

variáveis aleatórias correlacionadas, a análise de frequência de uma variável pode não fornecer uma

avaliação completa da probabilidade de ocorrência. Uma melhor compreensão das características

probabilísticas desses eventos pode exigir o estudo da sua distribuição em conjunto.

Na literatura da especialidade são apresentados vários estudos com o objectivo de modelar eventos

hidrológicos multivariados, sendo que alguns desses estudos foram referidos no capítulo

introdutório. Na maior parte desses casos, tal modelação tem por base um dos três pressupostos

seguintes (ZHANG e SINGH, 2006):

i) as variáveis envolvidas têm a mesma distribuição de probabilidade marginal;

ii) as variáveis têm uma distribuição conjunta normal ou outra conhecida;

iii) as variáveis são independentes.

No entanto, e como já foi referido, as variáveis hidrológicas podem ser dependentes, não lhes

corresponde, normalmente, a mesma distribuição de probabilidade marginal e a sua distribuição

conjunta não é conhecida. A vantagem do método das cópulas é precisamente o de não obrigar à

adopção de nenhum dos pressupostos enunciados por ZHANG e SINGH, 2006.

Nas secções seguintes são apresentados o conceito de cópula e algumas funções dessa teoria.

Incluiu-se, ainda, a apresentação da função bivariada de Gumbel que também foi aplicada com o

intuito de comparar os resultados decorrentes da mesma com os fornecidos pela aplicação de

cópulas.

2.6.1.2. Função bivariada de Gumbel

A função bivariada de Gumbel permite determinar a probabilidade conjunta de duas variáveis

aleatórias, partindo do pressuposto de que ambas seguem uma distribuição de probabilidade

marginal de Gumbel. A equação que define a função é dada por (YUE e RASMUSSEN, 2002):

1

, ( , ) exp ln ( ) ln ( )m m m

X Y X YF x y F x F y

(2.43)

onde FX(x) e FY(y) são as funções de distribuição de probabilidade das variáveis aleatórias X e Y e m

(m>1) é o parâmetro que descreve a relação entre essas variáveis, podendo pode ser determinado

por:

Page 50: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

30

1

0 11

m

(2.44)

em que ρ é o coeficiente de correlação de Pearson das duas variáveis aleatórias, determinado pela

seguinte equação:

2 2

( )( )

( ) ( )

x x y y

x x y y

(2.45)

Na qual x e y representam valores das variáveis aleatórias X e Y e x e y são as respectivas médias.

2.6.1.3. Conceito de cópula

Sejam X e Y duas variáveis aleatórias com função de distribuição conjunta dada por FX,Y(x,y) sendo as

respectivas funções de distribuição marginal dadas por Fx(x) e FY(y). Segundo o teorema de Sklar

(ZHANG e SINGH, 2006), para qualquer par de variáveis aleatórias existe uma função de dependência

C(u,v) tal que:

, ( , ) ,X Y X YF x y C F x F y (2.46)

em que XU F x e ( )YV F y , de modo que:

, ( , ) ( , )U VF u v C u v (2.47)

Torna-se, assim, possível definir a distribuição conjunta de variáveis aleatórias através das

distribuições marginais de cada uma dessas variáveis – que caracterizam completamente o

comportamento das variáveis quando consideradas isoladamente – e através de uma função de

dependência C – que contém toda a informação de como as variáveis dependem uma das outras.

Deste modo, o problema da determinação da distribuição conjunta reduz-se à determinação

daquelas duas componentes: as funções de distribuição marginal e a função de dependência C,

denominada cópula.

As funções de distribuição marginal foram já largamente abordadas nos capítulos 2.3 e 2.4, pelo que

esta secção incidirá unicamente no estudo da função de dependência, a cópula. Vários são os

investigadores que têm contribuído e proposto diferentes famílias de funções cópula. A família das

cópulas arquimedianas tem sido utilizada na análise de fenómenos hidrológicos, uma vez que são

várias as funções incluídas nessa família e a sua construção é relativamente acessível, (ZHANG e

SINGH, 2006). No presente estudo, foram utilizadas três cópulas arquimedianas.

Page 51: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

31

As cópulas da família arquimediana podem ser expressas através da seguinte equação geral (ZHANG

e SINGH, 2006):

1( , )C u v u v (2.48)

em que é a função geradora da cópula.

A função geradora varia de cópula para cópula e depende do parâmetro θ. Este parâmetro é

fundamental para a construção da função C, uma vez que traduz a dependência entre as variáveis

em estudo. Deste modo, a determinação do parâmetro θ envolve sempre a avaliação da

dependência entre as variáveis, nomeadamente através do coeficiente de Kendall, τ , cujo conceito é

apresentado em 2.6.3.

As funções geradoras das cópulas seleccionadas são apresentadas no capítulo seguinte para o que,

no essencial, se atendeu aos trabalhos de MELGHIORI, 2003, e ZHANG e SINGH, 2006.

2.6.2. Funções cópula

2.6.2.1. Cópula Clayton

A função geradora, , da cópula de Clayton é dada por:

( ) 1Cx x

(2.49)

em que θC é o respectivo parâmetro da cópula e x é a variável da função geradora, pelo que tomará o

valor de u e o valor de v (cujo significado foi já apresentado) quando a função for substituída na

equação (2.48), permitindo assim obter a cópula de Clayton:

1

( , ) 1C C C

CC u v u v

(2.50)

O parâmetro θC obtém-se a partir do coeficiente de Kendall, τ, através da equação:

2

C

C

(2.51)

2.6.2.2. Cópula Frank

A função geradora para a cópula de Frank tem a seguinte forma:

Page 52: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

32

exp 1( ) ln

exp

F

F

xx

(2.52)

em que θF é o respectivo parâmetro da cópula e x tem o significado já referido na apresentação da

cópula de Clayton.

A substituição da função geradora na equação geral das cópulas arquimedianas (2.48) permite obter

a função da cópula de Frank:

exp 1 exp 11( , ) ln 1

exp 1

F F

F

F F

u vC u v

(2.53)

O parâmetro θF obtém-se pela resolução da equação:

1

41 1F

F

D

(2.54)

A anterior equação inclui a função D1 que corresponde à função de Debye, Dk, de primeira ordem. A

resolução desta função não é analiticamente possível, pelo que o valor do parâmetro θF foi obtido

através da utilização do software comercial ModelRisk.

2.6.2.3. Cópula Gumbel-Hougaard

A cópula de Gumbel-Hougaard obtém-se a partir da seguinte função geradora:

( ) ln Gx x

(2.55)

Analogamente ao já explicado para as duas cópulas anteriormente apresentadas, θG é o respectivo

parâmetro da cópula e x é a variável da função geradora, que deverá tomar o valor de u e v na

equação geral das cópulas arquimedianas (2.48). Dessa equação e da função geradora, obtém-se a

cópula de Gumbel-Hougaard:

1

( , ) exp ln lnG G G

GC u v u v

(2.56)

A análise da equação anterior permite concluir que, a menos de um pormenor, a cópula de Gumbel-

Hougaard não é mais do que a função bivariada de Gumbel. Com efeito, as equações (2.43), relativa

à função Gumbel na forma bivariada, e (2.56), referente à cópula, apenas diferem na simbologia e no

procedimento de cálculo dos parâmetros nelas intervenientes. Deste modo, a apreciação dos

Page 53: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

33

resultados obtidos por um e por outro modelo vai permitir inferir sobre a “qualidade” do

procedimento de avaliação da dependência entre variáveis e concluir qual desses modelos, o que

envolve o parâmetro da cópula ou o que envolve o parâmetro m da distribuição bivariada, exprime

melhor essa dependência.

O parâmetro da copula, θG, depende também do coeficiente de Kendall, τ, objecto do capítulo que se

segue, e obtém-se da seguinte equação:

11 G (2.57)

2.6.3. Coeficiente de Kendall

Em estatística, o coeficiente de Kendall é descrito como uma medida de concordância entre duas

variáveis, isto é, estando-se perante duas variáveis que apresentam uma relação não linear mas

monótona (se uma aumenta a outra tem sempre tendência a aumentar ou a diminuir), o coeficiente

em menção fornece uma avaliação quantitativa desse nível de concordância/discordância. O

coeficiente deve o nome a Maurice Kendall, que o desenvolveu em 1938.

O cálculo do coeficiente de Kendall tem por base o conceito de concordância. Diz-se que existe

concordância entre observações quando os valores de determinada observação (x,y) são ambos

maiores ou menores do que os valores de outra observação, ou seja, se as tendências que existem

entre cada duas observações são iguais para x e y. O coeficiente de Kendall obtém-se da ponderação

das concordâncias e discordâncias (quando as tendências entre pares não são iguais para ambos os

valores), do seguinte modo:

º º

º

n concordâncias n discordâncias

n pares possíveis

(2.58)

O número de pares possíveis consiste simplesmente no número de comparações passíveis de serem

realizadas entre observações, ou seja, na combinação de dois elementos de um grupo de N

elementos, sendo N a dimensão da amostra. Analisando a equação (2.58), é fácil compreender que

se todos os pares forem concordantes se obtém τ = 1 e se todos forem discordantes, τ = - 1. Um valor

nulo de coeficiente de Kendall, τ = 0, indica a independência entre as variáveis em avaliação.

No presente trabalho, para determinar o coeficiente de Kendall das amostras, utilizou-se a seguinte

equação (KARMAKAR e SIMONOVIC, 2009):

1

2 sinalN

i j i j

i j

x x y y

(2.59)

Page 54: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

34

na qual N é a dimensão da amostra e sinal = 1 se i jx x e

i jy y e sinal = - 1, caso contrário, para

i, j = 1, 2, …, N. x e y são os valores das variáveis X e Y, respectivamente.

2.6.4. Selecção da função cópula

À semelhança do procedimento da análise estatística convencional, também após a aplicação das

cópulas às amostras de caudal e de volume de cheia em cada estação hidrométrica é necessário

averiguar o ajustamento assim alcançado de modo a identificar a função cópula que melhor

caracteriza a relação entre aquelas duas variáveis, em termos de probabilidade conjunta. Tal como

naquele outro caso, a apreciação desse ajustamento passa por comparar, através de gráficos, a

“posição” dos pontos que constituem cada função teórica aplicada às amostras das duas variáveis em

consideração com a “posição” dos pontos obtidos para essas mesmas amostras por uma função de

probabilidade empírica ou posição de “plotagem”, avaliando as diferenças entre tais “posições”.

O conceito de probabilidade empírica ou posição de “plotagem” foi abordado no capítulo 2.5.2., no

âmbito do estudo do ajustamento de leis estatísticas a amostras de única variável. No caso de

amostras de duas variáveis, a função que fornece a probabilidade empírica de não-excedência é

obrigatoriamente bivariada, sendo que, no seu cálculo, se utilizou a seguinte equação (YUE, 1999):

0,44

( , )0,12

NPF u v

N

(2.60)

na qual N representa a dimensão da amostra constituída pelos pares de valores das variáveis

aleatórias entre as quais se espera existir uma dependência, ou seja, nas aplicações efectuadas,

caudal e volume de cheia, e NP representa o número de ordem sequencial de cada par de elementos

da amostra, isto é, o número de elementos da amostra com valor inferior ou igual ao valor do

elemento considerado.

A concepção da anterior equação é semelhante à da equação (2.34) referente ao cálculo da

probabilidade empírica de não-excedência tendo por base amostras relativas a uma única variável. A

diferença significativa entre as duas equações em menção reside na especificação dos números de

ordem sequencial dos elementos da amostra: com efeito, no caso de probabilidades conjuntas,

sendo as amostras constituídas por pares de valores, não é possível ordená-los simultaneamente de

forma crescente. Neste caso, o número de ordem sequencial NP atribuído ao elemento (xi, yi) é dado

pelo número de pares (xj, yj) que verificam j ix x e j iy y , para , 1,...,i j N .

Page 55: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

35

A selecção da função considerada como tendo melhor ajustamento passa então por avaliar a

diferença entre os valores obtidos para as probabilidades conjuntas de cada elemento da amostra,

calculadas através dos dois métodos, o empírico e o que envolve a aplicação das funções teóricas.

Para quantificar e analisar essas diferenças, utilizaram-se os conceitos e modelos apresentados em

2.5. Contudo e como decorrerá da apresentação de resultados, verificou-se que as curvas

representativas das quatro funções teóricas (cópulas de Clayton, Frank, Gumbel- Hougaard e

bivariada de Gumbel) apresentavam ajustamentos aos pontos amostrais praticamente

indiferenciáveis, não possibilitando a selecção visual de uma dessas funções. Houve, assim, que

apoiar a selecção visual noutras ferramentas, para o que se recorreu ao teste de Kolmogorov-

Smirnov, complementado, embora a título indicativo e de entre as medidas de ajustamento objecto

do capítulo 2.5.4., pela apreciação dos resultados relativos ao desvio quadrático médio.

Page 56: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

36

Page 57: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

37

3. Dados de base

3.1. Dados disponíveis

Como já se referiu em capítulos antecedentes, o trabalho que se apresenta é constituído por duas

partes com propósitos diferentes. A primeira consiste na aplicação dos modelos de distribuição de

frequências a séries de caudais e de volumes de cheia máximos anuais e acima de dados limiares

tendo em vista comparar as estimativas de cada uma daquelas variáveis obtidas a partir daqueles

dois tipos de séries, bem como avaliar relações entre estimativas de caudais e dos respectivos

volumes de cheia. A segunda parte focou-se exclusivamente no estudo da relação entre caudais e

volumes através da análise da probabilidade conjunta dessas duas variáveis, fundamentalmente com

recurso à teoria das cópulas.

Para cumprir os anteriores objectivos, foi necessário dispor de amostras com dimensões adequadas à

aplicação de procedimentos de análise estatística, de caudais instantâneos máximos anuais e acima

de dados limiares, bem como de amostra dos volumes de cheia associados a esses caudais. Para o

presente trabalho, as amostras referidas foram obtidas a partir de registos de alturas hidrométricas

ou de caudais instantâneos. Para o efeito e de entre as estações hidrométricas que constam do

Sistema Nacional de Informação de Recursos Hídricos, SNIRH (da responsabilidade do Instituto da

Água, INAG) foram seleccionadas quatro, em regime natural e sem outro critério de selecção especial

para além do referente à necessidade de assegurar séries tão longas quanto possível e com

qualidade reconhecida. Para essas estações o INAG forneceu tabelas contendo os registos das alturas

hidrométricas (recolhidas hora a hora), bem como as equações relativas às curvas de vazão. Foram

ainda consultados os registos de caudais instantâneos máximos anuais que constam do SNIRH.

As estações hidrométricas seleccionadas foram as de Albernoa (26J/01H), Couto de Andreiros

(18L/01H), Monforte (19M/01H) e Torrão do Alentejo 24H/03H), tendo-se obtido registos

hidrométricos entre os anos hidrológicos de 1961/1962 e de 1999/2000. No quadro 3.1 estão

resumidas as características gerais das anteriores estações.

Importa referir que nem todos os anos hidrológicos compreendidos no anterior período de aquisição

de dados foram considerados para efeitos de constituição das amostras de cada estação. Com efeito,

foram eliminados os anos que apresentavam falhas de registo que, de algum modo, não permitiam

garantir que os registos disponíveis conduzissem à identificação dos máximos caudais instantâneos

nesses anos.

Page 58: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

38

Quadro 3.1 – Quadro resumo das características das estações hidrométricas.

3.2. Recolha e tratamento de dados

Os registos facultados constaram, no essencial, de alturas hidrométricas que foram transformadas

em caudais mediante aplicação das correspondentes curvas de vazão, também fornecidas pelo INAG,

como antes mencionado. A informação assim recolhida para cada estação hidrométrica foi

organizada em tabelas contendo as amostras de caudais máximos anuais e de caudais acima de

dados limiares, bem como as amostras dos correspondentes volumes dos hidrogramas.

Em linhas gerais, a recolha e tratamento dos dados de base – que constitui uma tarefa bastante

demorada e consumptiva, em termos de tempo – compreendeu como etapas principais a

digitalização dos registos, o preenchimento das falhas nos registos, a selecção (definição dos limiares

de cheia) e a “delimitação” temporal dos acontecimentos de cheia considerados independentes e a

estimativa dos volumes de cheia associados a esses acontecimentos. Para uma melhor compreensão,

pormenoriza-se, em seguida, a metodologia aplicada em cada estação hidrométrica na recolha e

tratamento dos dados. Anota-se que, de modo a abranger as maiores cheias de cada ano hidrológico,

incluindo sempre e necessariamente a cheia com mais elevado caudal instantâneo, tal metodologia

incidiu sobre os dois a três meses de maior pluviosidade:

i) Leitura e digitalização, a partir de mapas obtidos por preenchimento manual (mapas de

aquisição de informação) e facultados pelo INAG, das alturas hidrométricas registadas

hora a hora e dos correspondentes caudais, quando também registados. Tal informação

encontra-se sistematizada no Anexo 1.

ii) Quando necessário, tratamento da informação recolhida, fundamentalmente mediante o

preenchimento de falhas de registo por interpolação entre alturas hidrométricas. Com

Código Nome Tipo de estaçãoBacia

hidrográfica

Área da bacia

hidrográfica (km2)

Rio Freguesia Concelho Distrito

26J/01H Albernoa

Limnimétrica

com

descarregador

Guadiana 169,85Rio Cobres ou

Ribeira de TergesAlbernoa Beja Beja

18L/01HCouto de

AndreirosLimnimétrica Tejo 244,54

Ribeira da Raia ou

de Seda

Crato e

Márti resCrato Porta legre

19M/01H Monforte

Limnimétrica

com

descarregador

Tejo 141,47Ribeira Grande ou

de AvizMonforte Monforte Porta legre

24H/03HTorrão do

Alentejo

Limnimétrica

com

descarregador

Sado 468,35Ribeira do

XarramaTorrão

Alcácer do

SalSetúbal

Page 59: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

39

efeito, muito frequentemente, os mapas de aquisição de informação não contêm

registos de altura hidrométrica de hora a hora, mas antes espaçados de maiores

intervalos de tempo, por tal altura se manter sensivelmente constante ao longo de cada

um desses intervalos ou por ter variado de forma regular ao longo do mesmo.

iii) Por aplicação das curvas de vazão fornecidas pelo SNIRH – e que constam também do

Anexo 1 –, determinação dos caudais correspondentes às sucessivas alturas

hidrométricas intervaladas de uma hora. Houve que dispensar a apresentação, tanto das

anteriores alturas, como dos caudais que lhe correspondem pois a quantidade muito

considerável de informação em causa não é compaginável com uma organização em

formato de papel.

Nesta fase, dispõe-se, então, para cada estação hidrométrica e para cada ano hidrológico

considerado, de valores intervalados de uma hora de caudal instantâneo nos dois a três

meses de maior pluviosidade.

iv) Reconhecimento das situações de cheias de entre as quais serão seleccionadas aquelas

sobre as quais recairá a análise. Para o efeito, adoptou-se como limiar indicativo de

ocorrência de uma cheia o quíntuplo do caudal modular, (Quintela, 1996, p. 10.1). Assim,

para cada ano hidrológico e para cada estação, foram seleccionados os hidrogramas de

cheia com caudais superiores àquele limiar. No quadro 3.2, especificam-se para cada

estação hidrométrica o correspondente volume do escoamento anual médio, o caudal

modular que dele decorre, Q modular, e o limiar de caudal conducente à identificação de

uma cheia - 5 Q modular. Os escoamentos anuais médios foram obtidos a partir dos

escoamentos anuais apresentados no SNIRH e sistematizados no quadro 3.3.

Quadro 3.2 – Cálculo do caudal modular e do caudal correspondente ao limiar de cheia.

Estação hidrométrica Volume anual médio (m3) Q modular (m3/s) 5 Q modular (m3/s)

Albernoa 14815774 0,47 2,349

Couto de Andreiros 58219909 1,846 9,231

Monforte 29810975 0,945 4,726

Torrão do Alentejo 57769459 1,832 9,159

Page 60: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

40

Quadro 3.3 – Escoamentos anuais em cada estação hidrométrica considerada.

Ano Albernoa Couto de Andreiros Monforte Torrão do Alentejo

1955 - - 68136 -

1956 - - 25034 -

1957 - - 14981 -

1958 - - 44064 -

1959 - - 53040 -

1960 - - 33864 -

1961 - - 30337 83772

1962 - - 54005 189181

1963 - 147991 63305 134183

1964 - 41787 8086 24738

1965 - 206364 82567 151441

1966 - 90711 22057 24800

1967 - 49749 10641 48898

1968 - 138228 52289 164105

1969 - 113986 44143 117247

1970 5002 48211 17311 24713

1971 11608 46480 16457 50031

1972 6981 43122 10995 31296

1973 2391 - 6212 12816

1974 7646 32930 14941 16534

1975 5101 3349 1042 1863

1976 44126 106996 49076 125979

1977 26475 138836 46784 119051

1978 64357 125088 86648 145484

1979 9290 32800 14644 27631

1980 259 1552 390 4924

1981 16450 29018 17848 46733

1982 - 3379 581 1557

1983 24280 65440 41587 52672

1984 21090 91574 55166 108350

1985 8802 - 23456 47126

1986 8500 33872 23217 32241

1987 28519 76241 31480 78567

1988 11626 5644 2776 5717

1989 68222 70851 - 123806

1990 14498 44608 - -

1991 238 4706 - 1519

1992 5242 4312 -

1993 7481 - - 42520

1994 49 - - -

1995 - - - -

1996 28866 - - 69816

1997 - - - -

1998 - - - 3536

1999 - - - -

2000 - - - -

2001 5245 2794 - 22118

2002 7701 - 21061 -

2003 9011 22819 24553 23073

2004 5 - 1379 3474

2005 8303 22899 20717 30428

2006 - 61092 42347 86778

2007 1925 13828 - 10471

2008 - - 15222 21589

Média (dam3) 14816 58220 29811 57769

Escoamento anual (dam3)

Page 61: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

41

v) Diferenciação de cheias independentes. Para garantir a independência dos

acontecimentos, considerou-se que um hidrograma de cheia poderá conter mais do que

um caudal de pico, ficando limitado por valores mínimos de caudal (um no ramo

ascendente do hidrograma e outro no ramo descendente), separado do próximo

hidrograma por um período de recessão suficientemente longo, de modo a garantir a

anulação do escoamento directo. Para os hidrogramas de cheias definidos como indicado

resultaram, assim, durações da ordem dos dias. Para o caudal de ponta de cada

hidrograma adoptou-se o maior caudal instantâneo registado no decurso do mesmo.

Para uma melhor compreensão do processo de diferenciação, a figura que se segue

exemplifica o processo de selecção, onde são identificados quatro acontecimentos

independentes (a figura é idêntica à apresentada no ponto 2.2., onde este tema é

também abordado).

Figura 3.1 – Figura ilustrativa do processo de selecção de cheias independentes.

vi) Identificação, para cada hidrograma, do escoamento de base. Para o efeito, adoptou-se

um modelo muito simples, dado pela união, por meio de um segmento de recta, dos

menores caudais entre dois acontecimentos independentes. O volume associado ao

escoamento de base foi deduzido ao volume total da cheia, com obtenção, para cada

acontecimento, do correspondente volume do escoamento directo.

0

20

40

60

80

100

120

140

0 50 100 150 200 250 300 350 400

Cau

dal

(m

3/s

)

Tempo (h)

Série de caudais instantâneos Limiar = quíntuplo do módulo Cheia independente

1 2 3

1

Page 62: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

42

vii) Determinação do volume do escoamento directo associado a cada cheia mediante

integração numérica do respectivo hidrograma, por aplicação de regra dos trapézios:

1

1

3600, com i 1,2,3,...,2

ni iQ Q

V n (3.1)

em que Qi é o caudal instantâneo na hora i (já deduzido do caudal correspondente ao

escoamento de base) e n é o número total de horas de registo de determinado

acontecimento independente.

Da aplicação do procedimento descrito, obteve-se para cada estação hidrométrica um conjunto de

acontecimentos de cheia, consubstanciados por hidrogramas de cheia independentes entre si e

definidos por uma sequência de caudais superiores ao limiar de cinco vezes o caudal modular na

secção da estação. A cada hidrograma foi atribuído um caudal de ponta (igual ao mais elevado caudal

instantâneo no decurso dessa cheia) e um volume do escoamento directo.

Dado o elevado número de acontecimentos de cheia em causa – 199 distribuídos por 68, 42, 50 e 39

nas estações hidrométricas de Albernoa, Couto de Andreiros, Monforte e Torrão do Alentejo,

respectivamente – julgou-se adequado restringir a sua inclusão no presente documento, tanto mais

que uma apresentação exaustiva não conteria conteúdo informativo adicional relevante. Deste

modo, a título de exemplo baseado em cada uma daquelas estações, apresentam-se no Anexo 2 os

diagramas cronológicos de caudal que permitiram a selecção dos acontecimentos de cheia em dois

anos hidrológicos, sendo que a designação atribuída a cada acontecimento respeita a simbologia

oportunamente se referirá a propósito dos quadros 3.4 a 3.7.

A partir da informação recolhida como indicado, foram constituídas, para cada estação hidrométrica,

os seguintes quatro tipos de amostras, sobre as quais recaiu o estudo: i) amostras de caudais de

ponta de cheia acima do limiar adoptado para essa estação; ii) amostra dos volumes do escoamento

directo correspondentes aos anteriores caudais; iii) amostra de caudais instantâneos máximos anuais

constituída mediante a consideração, em cada ano hidrológico, de um único hidrograma de cheia, o

que apresentou mais elevado caudal de ponta que, assim, constitui o máximo caudal instantâneo

nesse ano; e iv) amostra dos volumes do escoamento directo correspondentes aos anteriores

caudais. Para simplificar a apresentação do estudo, os volumes de cheia correspondentes ao

escoamento directo serão, por regra, referidos por volumes de cheia.

As anteriores amostras, bem como as correspondentes estatísticas amostrais mais relevantes

(médias, desvios-padrão e coeficientes de assimetria avaliados por aplicação do método dos

Page 63: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

43

momentos) são apresentadas nos quadros 3.4, 3.5, 3.6 e 3.7. Para identificar as diferentes amostras

adoptou-se a seguinte simbologia:

Amostras de caudais instantâneos máximos anuais – Q ima;

Amostras dos volumes de cheia associados aos caudais instantâneos máximos anuais – V ma;

Amostras de caudais de ponta de cheia acima de um dado limiar – Q acima limiar;

Amostras dos volumes de cheia associados aos caudais de ponta de cheia acima de um dado

limiar – V acima limiar.

Em cada quadro e no que respeita às amostras acima de limiares, indicou-se o número de ordem de

cada evento de cheia e o ano hidrológico da sua ocorrência, para o que esse ano foi identificado pelo

ano civil em que se inicia. Relativamente às amostras de máximos anuais, especificou-se apenas o

ano hidrológico, também de acordo com a anterior simbologia.

Page 64: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

44

Page 65: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

45

Quadro 3.4 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Albernoa.

Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma

Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)

1/1969 26,414 2976,328 35/1985 55,538 6250,216 1969 141,114 28543,365

2/1969 59,004 2636,742 36/1985 20,468 1214,459 1970 11,065 1431,554

3/1969 141,114 28543,365 37/1985 11,705 463,787 1971 38,979 2509,916

4/1969 21,794 1356,184 38/1986 6,670 545,201 1972 39,611 4693,621

5/1969 27,814 1719,886 39/1986 5,126 571,446 1973 3,123 913,324

6/1970 7,897 1029,164 40/1986 6,207 331,734 1974 63,767 3073,293

7/1970 11,065 1431,554 41/1986 50,645 2927,337 1975 23,925 1679,161

8/1971 38,979 2509,916 42/1987 98,674 5799,166 1976 217,376 8438,035

9/1971 4,018 521,068 43/1987 64,661 11495,632 1977 122,937 5985,871

10/1971 14,201 985,845 44/1988 44,230 1916,474 1983 131,117 6309,070

11/1972 39,611 4693,621 45/1988 141,342 3282,329 1984 88,994 6919,620

12/1973 3,123 913,324 46/1988 7,621 400,209 1985 55,538 6250,216

13/1974 26,649 2126,369 47/1989 254,682 14078,184 1986 50,645 2927,337

14/1974 4,321 314,089 48/1989 91,546 4783,357 1987 98,674 5799,166

15/1974 63,767 3073,293 49/1989 85,828 2600,717 1988 141,342 3282,329

16/1975 23,925 1679,161 50/1989 45,559 2910,594 1989 254,682 14078,184

17/1976 8,929 1520,116 51/1989 12,383 885,442 1990 97,161 3812,512

18/1976 21,725 1157,616 52/1989 105,817 6736,744 1992 36,698 3217,300

19/1976 30,811 2105,659 53/1989 73,553 3467,896 1993 25,722 2245,847

20/1976 27,139 1888,520 54/1990 10,385 784,541 1996 172,601 5928,490

21/1976 217,376 8438,035 55/1990 97,161 3812,512

22/1977 10,531 1366,403 56/1992 36,698 3217,300

23/1977 122,937 5985,871 57/1993 3,359 446,123

24/1977 33,949 2417,428 58/1993 4,060 472,019

25/1977 4,511 290,738 59/1993 25,722 2245,847

26/1983 14,811 226,044 60/1996 23,720 1372,712

27/1983 6,660 165,327 61/1996 104,045 5228,232

28/1983 88,272 2194,705 62/1997 61,243 2240,722

28/1983 9,378 347,698 63/1996 131,690 6197,943

30/1983 131,117 6309,070 64/1996 172,601 5928,490

31/1983 57,446 4048,396 65/1996 82,185 2645,998

32/1984 6,260 489,081 66/1996 84,297 2731,526

33/1984 4,630 209,486 67/1996 76,498 3304,695

34/1984 88,994 6919,620 68/1996 109,206 7785,796

Média 53,004 3259,781 Média 90,754 5901,911

Desvio padrão 53,648 4140,671 Desvio padrão 69,582 6119,762

Coef. de assimetria

(adimensional)1,544 3,892

Coef. de assimetria

(adimensional)0,873 2,985

N 68 N 20

λ 3,400

Ano hidrológico

Page 66: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

46

Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma

Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)

1/1963 127,200 33193,080 22/1974 122,713 6738,120 1963 196,550 13941,864

2/1963 196,550 13941,864 23/1974 41,850 2309,490 1964 46,279 5710,320

3/1964 46,279 5710,320 24/1974 94,100 12429,180 1965 321,000 40506,300

4/1965 40,172 8991,990 25/1975 3,400 1380,240 1966 174,200 7747,560

5/1965 175,800 31971,660 26/1983 35,608 1568,781 1967 53,950 10446,840

6/1965 321,000 40506,300 27/1983 198,260 12957,956 1968 144,700 30864,780

7/1966 103,750 9434,160 28/1984 9,192 588,752 1969 141,738 40007,970

8/1966 174,200 7747,560 29/1984 231,379 17485,315 1970 41,059 4374,720

9/1967 53,950 10446,840 30/1984 120,140 4068,726 1971 69,347 20492,550

10/1967 6,925 561,600 31/1986 64,297 2373,945 1972 49,459 14879,520

11/1968 61,054 9215,460 32/1986 27,604 2402,803 1974 122,713 6738,120

12/1968 22,600 2380,560 33/1986 76,991 4744,673 1975 3,400 1380,240

13/1968 11,863 796,320 34/1987 10,162 766,193 1983 198,260 12957,956

14/1968 144,700 30864,780 35/1987 51,701 5983,662 1984 231,379 17485,315

15/1969 9,311 739,140 36/1987 84,609 14306,229 1986 64,297 2373,945

16/1969 141,738 40007,970 37/1988 18,931 2225,007 1987 84,609 14306,229

17/1969 81,800 7710,429 38/1989 33,376 4296,802 1988 18,931 2225,007

18/1970 32,400 9396,270 39/1989 137,841 9788,254 1989 137,841 9788,254

19/1970 41,059 4374,720 40/1989 65,189 4967,431

20/1971 69,347 20492,550 41/1989 23,927 2007,355

21/1972 49,459 14879,520 42/1989 88,168 5845,991

Média 82,157 10061,857 Média 116,651 14234,861

Desvio padrão 70,434 10694,666 Desvio padrão 84,251 11968,866

Coef. de assimetria

(adimensional)1,358 1,663

Coef. de assimetria

(adimensional)0,812 1,242

N 42 N 18

λ 2,333

Ano hidrológico

Quadro 3.5 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Couto de Andreiros.

Page 67: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

47

Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma

Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)

1/1963 63,009 3059,322 26/1978 65,851 1142,386 1963 154,091 5969,914

2/1963 154,091 5969,914 27/1981 12,385 315,251 1965 233,915 5207,164

3/1963 65,151 4128,164 28/1981 269,726 8579,677 1968 169,526 18868,240

4/1963 10,930 263,160 29/1981 5,775 166,368 1969 151,440 12908,798

5/1965 233,915 5207,164 30/1981 29,741 3533,521 1972 87,032 2678,611

6/1965 70,854 1823,966 31/1981 20,745 1311,997 1973 35,259 2413,433

7/1965 39,424 982,989 32/1981 42,814 3353,068 1974 146,872 2888,780

8/1965 85,037 3881,426 33/1983 61,012 2317,243 1978 272,688 5406,915

9/1965 27,084 636,342 34/1983 272,598 15006,344 1981 269,726 8579,677

10/1968 169,526 18868,240 35/1984 16,345 528,562 1983 272,598 15006,344

11/1969 147,426 6453,311 36/1984 10,212 421,126 1984 195,578 12245,087

12/1969 151,440 12908,798 37/1984 195,578 12245,087 1985 115,542 17555,765

13/1969 145,457 7594,727 38/1984 80,150 2604,741 1986 146,122 6982,795

14/1969 12,197 543,967 39/1985 15,211 418,409 1987 87,390 10538,857

15/1969 110,831 2154,667 40/1985 115,542 17555,765 1988 29,516 1590,859

16/1972 87,032 2678,611 41/1985 17,303 729,755

17/1973 16,764 695,622 42/1986 146,122 6982,795

18/1973 35,259 2413,433 43/1987 6,095 114,074

19/1973 12,209 980,620 44/1987 19,693 1217,825

20/1974 146,872 2888,780 45/1987 60,529 5411,183

21/1974 46,080 2266,465 47/1987 8,119 258,340

22/1978 76,333 1155,415 47/1987 87,390 10538,857

23/1978 272,688 5406,915 48/1987 8,090 341,375

24/1978 82,147 2239,583 49/1987 12,385 718,015

25/1978 62,601 701,668 50/1988 29,516 1590,859

Média 78,666 3866,118 Média 157,820 8589,416

Desvio padrão 74,823 4614,847 Desvio padrão 80,088 5660,745

Coef. de assimetria

(adimensional)1,246 1,818 Coef. de assimetria 0,030 0,520

N 50 N 15

λ 3,333

Ano hidrológico

Quadro 3.6 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Monforte.

Page 68: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

48

Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma

Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)

1/1961 168,191 43442,797 21/1981 9,054 200,168 1961 168,191 43442,797

2/1961 62,296 8308,435 22/1981 132,147 15815,315 1964 134,932 12093,466

3/1964 134,932 12093,466 23/1983 163,297 19397,803 1966 79,923 4438,264

4/1964 50,311 7227,329 24/1984 92,756 6549,564 1967 272,407 16419,798

5/1966 79,923 4438,264 25/1984 179,845 29790,841 1968 197,399 38596,928

6/1967 31,458 1583,757 26/1984 72,804 3694,859 1971 166,116 26154,511

7/1967 141,539 11048,049 27/1985 161,144 34027,279 1972 90,999 15288,858

8/1967 17,019 1707,585 28/1986 129,766 11381,513 1974 55,578 5049,349

9/1967 272,407 16419,798 29/1987 78,885 9422,639 1981 132,147 15815,315

10/1968 73,135 6015,123 30/1987 201,549 16456,283 1983 163,297 19397,803

11/1968 180,365 22653,122 31/1989 48,752 9755,399 1984 179,845 29790,841

12/1968 82,875 5974,927 32/1989 128,197 15471,273 1985 161,144 34027,279

13/1968 8,021 283,431 33/1989 325,028 14720,380 1986 129,766 11381,513

14/1968 8,564 436,999 34/1989 41,088 4724,952 1987 201,549 16456,283

15/1968 197,399 38596,928 35/1989 114,937 9363,680 1989 325,028 14720,380

16/1968 12,857 396,598 36/1989 48,364 2694,742 1990 177,398 23014,054

17/1971 166,116 26154,511 37/1990 37,433 4180,970 1999 23,328 2686,085

18/1972 90,999 15288,858 38/1990 177,398 23014,054

19/1974 55,578 5049,349 39/1999 23,328 2686,085

20/1974 22,746 1822,894

Média 103,141 11853,590 Média 156,414 19339,619

Desvio padrão 75,854 10947,132 Desvio padrão 73,597 11787,590

Coef. de assimetria

(adimensional)0,852 1,270

Coef. de assimetria

(adimensional)0,424 0,598

N 39 N 17

λ 2,294

Ano hidrológico

Quadro 3.7 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Torrão do Alentejo.

Page 69: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

49

4. Apresentação e análise de resultados

4.2. Aplicação dos modelos de distribuição de frequências

4.2.1. Considerações prévias

No capítulo 2 apresentaram-se os modelos de distribuição de frequências das leis Normal, de

Gumbel, log-Normal, Pearson tipo III, log-Pearson tipo III e de Goodrich, que se admitiu poderem ser

aplicados às séries de caudal e de volume de cheia adoptadas como casos de estudo, caracterizadas

no capítulo 3. A adaptabilidade das anteriores distribuições as essas séries foi verificada por

aplicação de diferentes procedimentos, compreendendo testes de hipótese e medidas de erro, que,

em conjunto com a observação visual do ajustamento das distribuições teóricas aos valores

amostrais, são o fundamento para a selecção da lei que se admite melhor representar cada uma das

variáveis aleatórias em questão. Como especificado no capítulo 2, as medidas de erro apenas foram

utilizadas para optar entre distribuições teóricas e somente quando os testes de hipóteses e o

ajustamento visual sugerissem a adequação dessas distribuições.

A aplicação dos modelos de distribuição de frequências requer a determinação prévia dos

parâmetros que permitem a estimação de valores da variável aleatória a partir da equação fornecida

pelo método do factor de frequência, de acordo com o procedimento de cálculo objecto do capítulo

2.4.

Assim, nos próximos capítulos, apresentam-se, para cada uma das séries de caudal ou de volume de

cheia referentes a uma dada estação hidrométrica, de entre as quatro estações com registos

analisados – Albernoa, Couto de Andreiros, Monforte e Torrão do Alentejo - os resultados obtidos, os

quais, para o efeito, foram organizados nos elementos que seguidamente se especificam:

uma figura contendo quatro gráficos referentes ao ajustamento de leis às amostras de

caudais de cheia acima de dados limiares e instantâneos máximos anuais, bem como às

amostras dos volumes de cheia correspondentes aos anteriores caudais;

um quadro com os resultados da aplicação do teste do qui-quadrado, onde se incluem

também os valores das respectivas estatística de teste e dos quantis2

1 ;

um quadro com os resultados da aplicação do teste de Kolmogorov-Smirnov, analogamente,

compreendendo os valores respectivas das estatística de teste e dos valores críticos DN,1-α;

um quadro com os valores obtidos para as medidas de erro aplicadas.

A partir dos anteriores resultados procede-se por fim à selecção da lei que se admite apresentar

melhor ajustamento a cada uma das séries em estudo.

Page 70: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

50

4.2.2. Estação hidrométrica de Albernoa

Os resultados do ajustamento das leis estatísticas objecto do capítulo 2.3. às amostras de caudais

acima de limiar (Q acima limiar) e de caudais instantâneos máximos anuais (Q ima) e dos

correspondentes volumes de cheia (V acima limiar e V ma) na estação hidrométrica de Albernoa, no

período analisado de 20 anos, entre 1969/70 e 1996/97, são apresentados na figura 4.1 e nos

quadros 4.1, 4.2 e 4.3 referentes ao ajustamento visual e à aplicação dos testes de qui-quadrado e de

Kolmogorov-Smirnov e das medidas de erro, respectivamente.

Figura 4.1 - Estação hidrométrica de Albernoa. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.

0

50

100

150

200

250

300

350

-4.0 -2.0 0.0 2.0 4.0

z

Q a

cim

a lim

iar

(m3/s

)

a1)

0

5000

10000

15000

20000

25000

30000

35000

-4.0 -2.0 0.0 2.0 4.0

z

V a

cim

a lim

iar

(10

00

m3 )

b1)

0

50

100

150

200

250

300

350

-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0

z

Q im

a (

m3/s

)

a2)

0

5000

10000

15000

20000

25000

30000

35000

-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0

z

V m

a (

100

0 m

3)

b2)

-100,0

4900,0

9900,0

14900,0

19900,0

24900,0

29900,0

34900,0

-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0

V (m

3)

z

F = 1/(N+1)

Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich

Page 71: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

51

Quadro 4.1 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Quadro 4.2 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson

tipo III

Estatística de teste (χ2) 17,588 22,000 18,765 14,059 29,059 21,118

v.a. Χ2, α=0,05, M-m-1 g. l. 14,067 14,067 14,067 12,592 14,067 12,590

Resultado do teste 0 0 0 0 0 0

Estatística de teste (χ2) 24,059 39,647 10,235 5,529 59,353 73,471

v.a. Χ2, α=0,05, M-m-1 g. l. 14,067 14,067 14,067 12,592 14,067 12,592

Resultado do teste 0 0 1 1 0 0

Estatística de teste (χ2) 3,447 1,016 3,434 1,631 5,866 1,631

v.a. Χ2, α=0,05, M-m-1 g. l. 7,815 7,815 7,815 5,991 7,815 5,991

Resultado do teste 1 1 1 1 1 1

Estatística de teste (χ2) 7,635 10,586 1,003 6,452 16,044 5,844

v.a. Χ2, α=0,05, M-m-1 g. l. 7,815 7,815 7,815 5,991 7,815 5,991

Resultado do teste 1 0 1 0 0 1

Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson tipo

III

Estatística de teste (DN) 0,130 0,148 0,092 0,324 0,167 0,324

DN,1-α, α=0,05 0,165 0,165 0,165 0,165 0,165 0,165

Resultado do teste 1 1 1 0 0 0

Estatística de teste (DN) 0,102 0,222 0,080 0,069 0,219 0,281

DN,1-α, α=0,05 0,165 0,165 0,165 0,165 0,165 0,165

Resultado do teste 1 0 1 1 0 0

Estatística de teste (DN) 0,068 0,090 0,111 0,050 0,126 0,246

DN,1-α, α=0,05 0,294 0,294 0,294 0,294 0,294 0,294

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,125 0,186 0,092 0,095 0,256 0,122

DN,1-α, α=0,05 0,294 0,294 0,294 0,294 0,294 0,294

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Page 72: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

52

Quadro 4.3 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento de cor

cinzenta).

Para a série de Q acima limiar, constata-se que, para o nível de confiança de 95%, todas as leis

estatísticas aplicadas são rejeitadas pelo teste do qui-quadrado. No entanto, a observação da figura

4.1 permite verificar que a lei de Goodrich denota ajustamento à mencionada amostra, sendo que tal

lei, não só não é rejeitada pelo teste de Kolmogorov-Smirnov (para o anterior nível de confiança),

como também lhe correspondem os melhores valores das medidas de erro. Consequentemente,

optou-se por prosseguir o estudo no pressuposto de aplicação da lei de Goodrich à série de

Q acima limiar em Albernoa.

Relativamente às séries de V acima limiar e Q ima, verifica-se que a distribuição de log-Pearson tipo

III denota um bom ajustamento visual sendo que, no caso de Q ima, lhe correspondem os melhores

valores das medidas de erro e não é rejeitada por nenhum dos dois testes de hipóteses. Para a série

de V acima limiar, os testes também não rejeitam o ajustamento de tal lei e, com excepção de MAE

(a que, contudo, corresponde o segundo valor mais baixo) obtêm-se os melhores valores das

medidas de erro. Deste modo, a lei de log-Pearson tipo III foi adoptada para ambas as séries de

V acima limiar e de Q ima.

No que respeita à amostra de V ma, o andamento irregular dos pontos da amostra, visível no

correspondente gráfico da figura 4.1, não permite optar inequivocamente por uma lei. Deste modo,

atendeu-se exclusivamente aos resultados dos quadros 4.1 e 4.2 tendo-se seleccionado, de entre as

Goodrich Gumbel log-Normallog-Pearson

tipo IIINormal

Pearson tipo

III

RMSE 6,220 11,252 36,622 23,335 22,118 6,997

%SEP 11,734 21,229 69,093 44,025 41,729 13,200

ARV 0,014 0,045 0,473 0,192 0,173 0,017

E2 0,986 0,955 0,527 0,808 0,827 0,983

MAE 4,772 8,158 13,758 10,103 15,864 5,469

RMSE 1033,097 1944,197 766,587 914,986 2686,990 1085,531

%SEP 31,692 59,642 23,517 28,069 82,429 33,301

ARV 0,063 0,224 0,035 0,050 0,427 0,070

E2 0,937 0,776 0,965 0,950 0,573 0,930

MAE 509,911 1206,879 403,657 374,971 1763,795 664,931

RMSE 7,465 8,514 15,022 6,977 16,169 8,565

%SEP 2,931 3,343 5,898 2,739 6,349 3,363

ARV 0,020 0,027 0,083 0,018 0,072 0,027

E2 0,980 0,973 0,917 0,982 0,928 0,973

MAE 6,462 7,507 11,765 5,444 12,064 7,353

RMSE 1117,230 2169,825 796,940 799,463 3004,130 1091,056

%SEP 3,914 7,602 2,792 2,801 10,525 3,822

ARV 0,170 0,642 0,087 0,087 0,402 0,162

E2 0,830 0,358 0,913 0,913 0,598 0,838

MAE 802,134 1724,037 505,338 516,808 2505,306 817,968

V ma

Q acima limiar

V acima limiar

Q ima

Page 73: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

53

distribuições não rejeitadas por ambos os testes de hipóteses, a que apresenta melhores resultados

ao nível das medidas de erro, ou seja, a lei log-Normal.

4.2.3. Estação hidrométrica de Couto de Andreiros

Seguem-se a figura 4.2 e os quadros 4.4 a 4.6 referentes à identificação das leis estatísticas com

melhor ajustamento às amostras de caudais acima de limiar e instantâneos máximos anuais e dos

correspondentes volumes na estação hidrométrica de Couto de Andreiros, no período de 18 anos,

entre 1964/65 e 1989/90.

Figura 4.2 – Estação hidrométrica de Couto de Andreiros. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.

0

50

100

150

200

250

300

350

-4,0 -2,0 0,0 2,0 4,0

Q a

cim

a lim

iar

(m3/s

)

z

a1)

0

5000

10000

15000

20000

25000

30000

35000

40000

45000

-4,0 -2,0 0,0 2,0 4,0

V a

cim

a lim

iar

(10

00

m3)

z

b1)

0

50

100

150

200

250

300

350

-4,0 -2,0 0,0 2,0 4,0

Q im

a (m

3/s

)

z

a2)

0

5000

10000

15000

20000

25000

30000

35000

40000

45000

-4,0 -2,0 0,0 2,0 4,0

V m

a (1

00

0 m

3)

z

b2)

-100,0

4900,0

9900,0

14900,0

19900,0

24900,0

29900,0

34900,0

-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0

V (

m3

)

z

F = 1/(N+1)

Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich

Page 74: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

54

Quadro 4.4 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Quadro 4.5 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson

tipo III

Estatística de teste (χ2) 1,727 5,588 4,301 2,156 18,029 2,585

v.a. Χ2, α=0,05, M-m-1 g. l. 12,592 12,592 12,592 11,070 12,592 11,070

Resultado do teste 1 1 1 1 0 1

Estatística de teste (χ2) 9,449 12,843 1,298 2,156 19,707 11,179

v.a. Χ2, α=0,05, M-m-1 g. l. 12,592 12,592 12,592 11,070 12,592 11,070

Resultado do teste 1 0 1 1 0 0

Estatística de teste (χ2) 1,444 0,889 4,778 3,111 2,556 3,667

v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841

Resultado do teste 1 1 1 1 1 1

Estatística de teste (χ2) 0,889 2,556 2,000 0,889 2,556 0,889

v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson tipo

III

Estatística de teste (DN) 0,048 0,081 0,069 0,047 0,131 0,060

DN,1-α, α=0,05 0,210 0,210 0,210 0,210 0,210 0,210

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,138 0,159 0,069 0,073 0,188 0,138

DN,1-α, α=0,05 0,210 0,210 0,210 0,210 0,210 0,210

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,086 0,102 0,124 0,071 0,130 0,100

DN,1-α, α=0,05 0,309 0,309 0,309 0,309 0,309 0,309

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,085 0,100 0,087 0,062 0,171 0,090

DN,1-α, α=0,05 0,309 0,309 0,309 0,309 0,309 0,309

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Page 75: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

55

Quadro 4.6 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento de cor

cinzenta).

Por observação da figura 4.2 verifica-se que, para as séries de Q acima limiar, de V acima limiar e de

V ma, as leis com melhor ajustamento são as log-Pearson tipo III e log-Normal, especialmente no que

respeita aos pontos amostrais localizados nas caudas das curvas das distribuições teóricas. A lei log-

Pearson tipo III não é rejeitada em nenhum dos testes de hipóteses (quadros 4.4 e 4.5) e apresenta

os melhores resultados no que respeita às medidas de erro (quadro 4.6), pelo que foi a adoptada

para as três variáveis aleatórias em menção.

Embora o gráfico relativo a Q ima não seja esclarecedor quanto à lei com melhor ajustamento,

permite excluir algumas das distribuições postuladas, evidenciando ainda que os pontos amostrais se

distribuem de forma mais ou menos equilibrada em torno das leis Pearson tipo III, de Gumbel e de

Goodrich. Visto os testes de hipóteses não rejeitarem nenhuma destas distribuições, optou-se pela

lei de Gumbel, uma vez que, de entre as três, é a que fornece os melhores resultados para as

medidas de erro.

4.2.4. Estação hidrométrica de Monforte

Na figura 4.3 e quadros 4.7 a 4.9 apresentam-se os resultados referentes à identificação das leis

estatísticas com melhor ajustamento às amostras de caudais acima de limiar e instantâneos máximos

Goodrich Gumbel log-Normallog-Pearson

tipo IIINormal

Pearson tipo

III

RMSE 6,782 11,014 39,533 8,250 24,557 7,716

%SEP 8,255 13,406 48,119 10,042 29,890 9,392

ARV 0,009 0,025 0,323 0,014 0,125 0,012

E2 0,991 0,975 0,677 0,986 0,875 0,988

MAE 4,740 8,038 16,070 4,512 17,858 5,640

RMSE 2579,278 3173,882 5536,298 3327,647 5014,485 2413,079

%SEP 25,634 31,544 55,023 33,072 49,837 23,982

ARV 0,060 0,090 0,275 0,099 0,225 0,052

E2 0,940 0,910 0,725 0,901 0,775 0,948

MAE 1985,025 2488,209 1767,312 1205,339 4185,593 1708,673

RMSE 12,184 12,116 70,902 13,491 20,633 12,357

%SEP 10,445 10,387 60,782 11,565 17,688 10,593

ARV 0,022 0,022 0,750 0,027 0,064 0,023

E2 0,978 0,978 0,250 0,973 0,936 0,977

MAE 10,554 10,245 34,995 10,117 15,261 10,948

RMSE 2495,954 2895,813 4423,866 2697,022 4364,517 2678,702

%SEP 17,534 20,343 31,078 18,947 30,661 18,818

ARV 0,046 0,062 0,145 0,054 0,141 0,053

E2 0,954 0,938 0,855 0,946 0,859 0,947

MAE 1562,057 1883,307 2254,672 1710,378 3584,051 1690,560

V ma

Q acima limiar

V acima limiar

Q ima

Page 76: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

56

anuais e dos correspondentes volumes na estação hidrométrica de Monforte, no período de 15 anos,

compreendido entre 1963/64 e 1988/89.

Figura 4.3 – Estação hidrométrica de Monforte. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

-4,0 -2,0 0,0 2,0 4,0V

aci

ma

limia

r (1

00

0 m

3)

z

b1)

0

50

100

150

200

250

300

350

-4,0 -2,0 0,0 2,0 4,0

Q im

a (m

3/s

)

z

a2)

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

-4,0 -2,0 0,0 2,0 4,0

V m

a (1

00

0 m

3)

z

b2)

0

50

100

150

200

250

300

350

-4,0 -2,0 0,0 2,0 4,0

Q a

cim

a lim

iar

(m3/s

)

z

a1)

-100,0

4900,0

9900,0

14900,0

19900,0

24900,0

29900,0

34900,0

-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0

V (

m3

)

z

F = 1/(N+1)

Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich

Page 77: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

57

Quadro 4.7 – Estação hidrométrica de Monforte. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Quadro 4.8 – Estação hidrométrica de Monforte. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson

tipo III

Estatística de teste (χ2) 16,400 22,000 9,200 6,800 28,400 17,200

v.a. Χ2, α=0,05, M-m-1 g. l. 14,067 14,067 14,067 12,592 14,067 12,592

Resultado do teste 0 0 1 1 0 0

Estatística de teste (χ2) 23,600 46,000 2,800 3,600 70,800 23,600

v.a. Χ2, α=0,05, M-m-1 g. l. 0,210 0,210 0,210 0,210 0,210 0,210

Resultado do teste 1 1 1 1 1 1

Estatística de teste (χ2) 4,667 2,667 2,000 2,000 4,667 4,667

v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841

Resultado do teste 1 1 1 1 1 0

Estatística de teste (χ2) 0,667 1,333 1,333 1,333 2,000 0,667

v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson tipo

III

Estatística de teste (DN) 0,131 0,129 0,121 0,108 0,163 0,128

DN,1-α, α=0,05 0,192 0,192 0,192 0,192 0,192 0,192

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,177 0,191 0,067 0,066 0,199 0,174

DN,1-α, α=0,05 0,192 0,192 0,192 0,192 0,192 0,192

Resultado do teste 1 1 1 1 0 1

Estatística de teste (DN) 0,088 0,140 0,187 0,110 0,090 0,089

DN,1-α, α=0,05 0,338 0,338 0,338 0,338 0,338 0,338

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,077 0,107 0,097 0,096 0,112 0,088

DN,1-α, α=0,05 0,338 0,338 0,338 0,338 0,338 0,338

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Page 78: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

58

Quadro 4.9 – Estação hidrométrica de Monforte. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento de cor

cinzenta).

A figura 4.3, relativa ao ajustamento visual, evidencia que, em resultado da disposição dos pontos

amostrais, não é possível identificar leis mais aptas a descrever as variáveis aleatórias em apreciação.

Uma vez que os testes de hipóteses (quadros 4.7 e 4.8) apenas indicam a rejeição ou não de

hipóteses, também não permitem identificar a distribuição estatística com melhor ajustamento. Por

fim, os resultados das medidas de erro (quadro 4.9) apenas fornecem informação, de algum modo,

complementar não podendo, em circunstância alguma, sustentar a opção por leis estatísticas em

face de dadas amostras. Deste modo, optou-se por excluir do estudo subsequente as séries de

caudais e de volumes de cheia na estação hidrométrica de Monforte.

4.2.5. Estação hidrométrica de Torrão do Alentejo

A figura 4.4 e os quadros 4.10 a 4.12 contêm os resultados do ajustamento das leis estatísticas

seleccionadas às amostras de caudais acima de limiar e instantâneos máximos anuais e dos

correspondentes volumes na estação hidrométrica de Torrão do Alentejo, no período de 17 anos,

entre 1961/62 e 1999/2000.

Goodrich Gumbel log-Normallog-Pearson

tipo IIINormal

Pearson tipo

III

RMSE 13,821 17,652 46,905 34,135 29,368 15,407

%SEP 17,570 22,439 59,625 43,392 37,332 19,586

ARV 0,035 0,057 0,401 0,212 0,157 0,043

E2 0,965 0,943 0,599 0,788 0,843 0,957

MAE 10,400 13,640 16,259 12,729 22,971 11,709

RMSE 819,403 1403,369 2389,293 1791,944 2307,696 870,703

%SEP 21,194 36,299 61,801 46,350 59,690 22,521

ARV 0,032 0,094 0,274 0,154 0,255 0,036

E2 0,968 0,906 0,726 0,846 0,745 0,964

MAE 643,626 1169,012 661,096 538,115 1906,532 683,671

RMSE 16,145 23,392 48,024 18,402 16,675 16,706

%SEP 10,230 14,822 30,430 11,660 10,566 10,585

ARV 0,044 0,091 0,385 0,057 0,046 0,047

E2 0,956 0,909 0,615 0,943 0,954 0,953

MAE 13,715 17,859 27,954 13,906 13,902 13,840

RMSE 935,971 1099,099 2147,853 1438,583 1316,080 1043,293

%SEP 10,897 12,796 25,006 16,748 15,322 12,146

ARV 0,029 0,040 0,154 0,069 0,058 0,036

E2 0,971 0,960 0,846 0,931 0,942 0,964

MAE 825,831 937,835 1191,503 893,611 1086,720 925,927

V ma

Q acima limiar

V acima limiar

Q ima

Page 79: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

59

Figura 4.4 – Estação hidrométrica de Torrão do Alentejo. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.

Quadro 4.10 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

0

50

100

150

200

250

300

350

-4,0 -2,0 0,0 2,0 4,0

Q a

cim

a lim

iar

(m3/s

)

z

a1)

0

5000

10000

15000

20000

25000

30000

35000

40000

45000

-4,0 -2,0 0,0 2,0 4,0

V a

cim

a lim

iar

(10

00

m3)

z

b1)

0

50

100

150

200

250

300

350

-4,0 -2,0 0,0 2,0 4,0

Q im

a (m

3/s

)

z

a2)

0

5000

10000

15000

20000

25000

30000

35000

40000

45000

-4,0 -2,0 0,0 2,0 4,0

V m

a (1

00

0 m

3)

z

b2)

-100,0

4900,0

9900,0

14900,0

19900,0

24900,0

29900,0

34900,0

-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0

V (

m3

)

z

F = 1/(N+1)

Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson

tipo III

Estatística de teste (χ2) 3,051 4,692 11,667 7,154 7,974 3,051

v.a. Χ2, α=0,05, M-m-1 g. l. 11,070 11,070 11,070 9,488 11,070 9,488

Resultado do teste 1 1 0 1 1 1

Estatística de teste (χ2) 2,231 3,051 3,872 1,821 17,821 2,641

v.a. Χ2, α=0,05, M-m-1 g. l. 11,070 11,070 11,070 9,488 11,070 9,488

Resultado do teste 1 1 1 1 0 1

Estatística de teste (χ2) 3,294 8,000 8,588 1,529 0,941 2,118

v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841

Resultado do teste 1 0 0 1 1 1

Estatística de teste (χ2) 1,529 1,529 1,529 3,294 1,529 0,941

v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Page 80: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

60

Quadro 4.11 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.

Quadro 4.12 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento

de cor cinzenta).

As leis Pearson tipo III, de Goodrich e de Gumbel apresentam um bom ajustamento visual à série Q

acima limiar e nenhuma delas é rejeitada pelos testes de hipóteses. Recorrendo aos resultados das

medidas de erro, optou-se por associar a esta série a lei de Goodrich.

Goodrich Gumbel Log-NormalLog-Pearson

tipo IIINormal

Pearson tipo

III

Estatística de teste (DN) 0,072 0,090 0,120 0,093 0,105 0,074

DN,1-α, α=0,05 0,213 0,213 0,213 0,213 0,213 0,213

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,083 0,096 0,104 0,051 0,128 0,087

DN,1-α, α=0,05 0,213 0,213 0,213 0,213 0,213 0,213

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,122 0,154 0,204 0,148 0,119 0,114

DN,1-α, α=0,05 0,318 0,318 0,318 0,318 0,318 0,318

Resultado do teste 1 1 1 1 1 1

Estatística de teste (DN) 0,111 0,094 0,150 0,091 0,155 0,118

DN,1-α, α=0,05 0,318 0,318 0,318 0,318 0,318 0,318

Resultado do teste 1 1 1 1 1 1

Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada

Q acima limiar

V acima limiar

Q ima

V ma

Goodrich Gumbel log-Normallog-Pearson

tipo IIINormal

Pearson tipo

III

RMSE 10,526 11,602 19,959 11,466 56,125 17,467

%SEP 10,206 11,249 19,351 11,117 54,416 16,935

ARV 0,020 0,024 0,071 0,023 0,562 0,054

E2 0,980 0,976 0,929 0,977 0,438 0,946

MAE 8,203 9,942 13,795 9,520 27,501 11,302

RMSE 1220,670 1841,430 3838,948 1439,477 13793,746 1497,288

%SEP 10,298 15,535 32,386 12,144 116,368 12,632

ARV 0,013 0,029 0,126 0,018 1,629 0,019

E2 0,987 0,971 0,874 0,982 -0,629 0,981

MAE 890,895 1397,735 3024,336 1062,926 4877,592 848,581

RMSE 16,189 16,379 16,088 15,175 34,588 20,061

%SEP 10,350 10,472 10,286 9,702 22,113 12,826

ARV 0,051 0,053 0,051 0,045 0,235 0,079

E2 0,949 0,947 0,949 0,955 0,765 0,921

MAE 13,614 14,167 12,340 12,938 26,748 15,677

RMSE 1719,876 1865,007 2503,003 1802,754 5016,586 1690,263

%SEP 8,893 9,643 12,942 9,322 25,939 8,740

ARV 0,023 0,027 0,048 0,025 0,192 0,022

E2 0,977 0,973 0,952 0,975 0,808 0,978

MAE 1439,404 1567,201 2071,447 1510,169 2767,889 1390,569

V ma

Q acima limiar

V acima limiar

Q ima

Page 81: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

61

A avaliação visual nas séries de volume, V acima limiar e V ma, permite concluir com clareza que a lei

de log-Pearson tipo III é a que melhor se ajusta a ambas as séries. A distribuição não é rejeitada nos

testes de hipóteses e apresenta bons resultados no que se refere às medidas de erro.

Para a série Q ima, a lei seleccionada foi a de Pearson tipo III. O ajustamento visual não permitiu

identificar com clareza qual a melhor distribuição, de modo que a decisão fundamentou-se na análise

conjunta dos resultados dos testes de hipóteses e das medidas de erro (melhores valores para a lei

de Pearson tipo III).

4.2.6. Resumo de resultados

Nos capítulos anteriores apresentaram-se os resultados do ajustamento das diferentes leis

estatísticas postuladas às amostras de caudais e volumes de cheia nas quatro estações hidrométricas

seleccionadas como casos de estudo. Foi, assim, possível identificar a distribuição estatística que

melhor se ajusta aos pontos de cada amostra, ou seja, a lei que se admite melhor representar a

variável aleatória a que respeita essa amostra. Uma vez identificada essa lei e calculados os

respectivos parâmetros, pode prosseguir-se com a estimação de valores da variável aleatória para

diferentes probabilidades de não-excedência.

Em conformidade com os resultados antecedentes, sistematizaram-se, no quadro 4.13, as leis

estatísticas seleccionadas bem como os valores dos parâmetros que as definem, calculados por

aplicação dos modelos e equações apresentados no capítulo 2. De tal sistematização, como, aliás, da

restante análise, excluiu-se a estação hidrométrica de Monforte, como antes justificado. De modo a

simplificar as utilizações subsequentes dos modelos estatísticos sistematizados no anterior quadro,

incluíram-se no mesmo as médias e os desvios-padrão das diferentes amostras. Os números das

equações que, para as leis seleccionadas, definem o factor de probabilidade e que permitem a

estimação de valores das variáveis aleatórias de acordo com a equação geral (2.23) são também

especificados no quadro.

Page 82: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

62

Quadro 4.13 – Identificação das leis estatísticas seleccionadas para caracterizar cada variável aleatória. Valores dos parâmetros estatísticos de cada distribuição.

4.3. Comparação entre os resultados baseados em séries de valores

acima de um limiar e séries de valores máximos anuais

No presente trabalho, foram utilizadas duas abordagens distintas para constituir as amostras de

caudais e de volumes de cheia e, consequentemente, para estabelecer os modelos de estimação

desses caudais e volumes: abordagem baseada em séries de valores máximos anuais de ora em

diante, também identificada por método I, e baseada em séries de valores acima de dados limiares

ou método II. Nos capítulos anteriores, identificou-se, para cada método e para cada variável, o

modelo estatístico aplicável, bem como os valores dos parâmetros que lhes correspondem,

estimados a partir da respectiva amostra.

No caso do método II, o modelo estatístico é ajustado à série de valores da amostra que excedem

determinado limite ou limiar. Se existirem M desses valores em N anos de registo, então o número

médio de acontecimentos por ano é M N . Este resultado permite determinar o período de

retorno em anos de um qualquer valor através da equação (2.1). No método I, o modelo de

frequências é ajustado à série constituída pelo máximo valor em cada ano. Uma vez que tal série é de

Q acima limiar V acima limiar Q ima V ma

Distribuição Goodrich log-Pearson tipo III log-Pearson tipo III log-Normal

α -10,499 -3,814 2,304 8,359

β 0,007 0,110 0,635 0,792

θ 0,842 103,514 2,853 -

λ 3,400 3,400 - -

Média 53,004 (m3/s ) 3259,781 (1000 m3) 90,754 (m3/s ) 5901,911 (1000 m3)

Desvio-padrão 53,648 (m3/s ) 4140,671 (1000 m3) 69,582 (m3/s ) 6119,762 (1000 m3)

Factor de probabilidade eq. (3.30) eq. (3.29) eq. (3.29) eq. (3.26)

Distribuição log-Pearson tipo III log-Pearson tipo III Gumbel log-Pearson tipo III

α 0,815 0,795 78,733 5,025

β 0,346 0,176 65,691 0,225

θ 9,156 44,464 - 18,527

λ 2,333 2,333 - -

Média 82,157 (m3/s ) 10061,857 (1000 m

3) 116,651 (m

3/s ) 14234,861 (1000 m

3)

Desvio-padrão 70,434 (m3/s ) 10694,666 (1000 m3) 84,251 (m3/s ) 11968,866 (1000 m3)

Factor de probabilidade eq. (3.29) eq. (3.29) eq. (3.28) eq. (3.29)

Distribuição Goodrich log-Pearson tipo III Pearson tipo III log-Pearson tipo III

α -23,138 6,192 -190,612 7,940

β 0,000 0,700 15,608 0,348

θ 0,583 3,707 22,233 4,897

λ 2,294 2,294 - -

Média 103,121 (m3/s ) 11853,590 (1000 m3) 156,414 (m3/s ) 19339,619 (1000 m3)

Desvio-padrão 75,854 (m3/s ) 10947,132 (1000 m

3) 73,597 (m

3/s ) 11787.59 (1000 m

3)

Factor de probabilidade eq. (3.30) eq. (3.29) eq. (3.29) eq. (3.29)

Albernoa

Couto de

Andreiros

Torrão do

Alentejo

Page 83: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

63

duração anual, não há necessidade de proceder a qualquer tipo de correcção no cálculo do período

de retorno.

Tendo-se seleccionado os modelos estatísticos que permitem caracterizar as diferentes variáveis

analisadas, um exercício pertinente consiste em comparar as estimativas de caudal ou de volume de

cheia fornecidas pelos modelos baseados nas séries de valores, por um lado, acima de dados limiares

e, por outro lado, máximos anuais. De facto, se os dois métodos de constituição de amostras forem

válidos, é de esperar que, para o mesmo período de retorno e para uma mesma grandeza – caudal

ou volume de cheia – , forneçam estimativas semelhantes e que, portanto, a relação entre essas

estimativas seja muito aproximadamente linear.

Numa primeira fase, optou-se por comparar as estimativas em causa para um intervalo de valores de

período de retorno com grande amplitude – designadamente para 2, 4, 10, 20, 25, 50, 100 e 1000

anos – de modo a avaliar a adequação da relação linear em toda a gama de valores expectáveis de

projecto de T. Tal comparação foi efectuada para as variáveis de caudal e de volume de cheia em

cada estação hidrométrica, com a excepção já justificada da estação de Monforte. As figuras 4.5 a 4.7

ilustram graficamente as relações assim obtidas. Em tais figuras o eixo das abcissas refere-se às

estimativas fornecidas pelo método I e os das ordenadas, às decorrentes do método II, umas e outras

para os períodos de retorno antes especificados. Os quadros 4.14 a 4.16, além de conterem os pares

de valores utilizados na elaboração daquelas figuras, tornam expedita a comparação das sucessivas

estimativas.

Cada uma das figuras 4.5 a 4.7 contém ainda o segmento de recta que representa a regressão linear

entre as estimativas em comparação nessa figura, bem como o correspondente valor do coeficiente

de determinação, R2, que não é mais que o quadrado do coeficiente de correlação de Pearson, ρ, e

que permite avaliar quantitativamente a qualidade da relação linear. O valor de R2 varia entre 0 e 1

sendo que se R2 é igual à unidade então 100% da variância da variável a que se refere o eixo das

ordenadas é explicada pela variância da variável a que se refere o eixo das abcissas. Deste modo,

quanto maior o valor de R2, melhor a relação linear entre as variáveis. O coeficiente de correlação de

Pearson é determinado através da aplicação da equação (2.45). Os valores dos coeficientes de

determinação foram também incluídos nos quadros 4.14 a 4.16.

– Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes de

determinação, R2.

Page 84: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

64

Figura 4.5 – Estação hidrométrica de Albernoa: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes de

determinação, R2.

Figura 4.6 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes

de determinação, R2.

Figura 4.7 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes

de determinação, R2.

R² = 0,9995

0

10000

20000

30000

40000

50000

60000

0 10000 20000 30000 40000 50000 60000

Volume estimado a partir do método II (1000 m3)

Volume estimado a partir do método I (1000 m3)

R² = 0,933

0

50

100

150

200

250

300

350

400

450

0 50 100 150 200 250 300 350 400 450

Caudal estimado a partir do método II (m3/s)

Caudal estimado a partir do método I (m3/s)

R² = 0,9949

0

20000

40000

60000

80000

100000

0 20000 40000 60000 80000 100000

Volume estimado a partir do método II (1000 m3)

Volume estimado a partir do método I (1000 m3)

R² = 0,9995

0

50

100

150

200

250

300

350

400

450

500

550

600

0 50 100 150 200 250 300 350 400 450 500 550 600

Caudal estimado a partir do método II (m3/s)

Caudal estimado a partir do método I (m3/s)

R² = 0,9979

0

50

100

150

200

250

300

350

400

450

0 50 100 150 200 250 300 350 400 450

Caudal estimado a partir do método II (m3/s)

Caudal estimado a partir do método I (m3/s)

R² = 0,9985

0

10000

20000

30000

40000

50000

60000

70000

80000

0 10000 20000 30000 40000 50000 60000 70000 80000

Volume estimado a partir do método II (1000 m3)

Volume estimado a partir do método I (1000 m3)

Page 85: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

65

Quadro 4.14 – Estação hidrométrica de Albernoa. Comparação entre estimativas de caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de valores acima de limiares (método II).

Coeficientes de determinação, R2.

Quadro 4.15 – Estação hidrométrica de Couto de Andreiros. Comparação entre estimativas de caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de valores acima de limiares (método II).

Coeficientes de determinação, R2.

Quadro 4.16 – Estação hidrométrica de Torrão do Alentejo. Comparação entre estimativas de caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de valores acima de limiares (método II).

Coeficientes de determinação, R2.

Método I Método II Método I Método II

(log-Pearson tipo III) (Goodrich) (log-Normal) (log-Pearson tipo III)

2 75,161 105,935 4267,125 5969,343

4 134,259 140,470 7277,687 8996,746

10 197,312 183,974 11767,191 13926,627

20 235,366 215,677 15687,692 18418,012

25 246,078 225,701 17058,439 20012,408

50 275,141 256,353 21682,937 25450,674

100 298,617 286,354 26904,497 31660,954

1000 347,189 382,341 49250,722 58458,982

R2 0,9330 0,9995

Caudal de cheia (m3/s) Volume de cheia (1000 m3)T (anos)

Método I Método II Método I Método II

(Gumbel) (log-Pearson tipo III) (log-Pearson tipo III) (log-Pearson tipo III)

2 102,811 126,001 9780,044 14653,011

4 160,578 180,907 18777,343 23559,831

10 226,562 254,052 33775,903 38013,603

20 273,848 309,120 47995,216 51051,730

25 288,848 326,712 53167,811 55645,073

50 335,055 380,743 71275,227 71169,541

100 380,921 433,601 92775,491 88631,436

1000 532,476 597,921 194210,799 161074,308

R2 0,9995 0,9949

T (anos)Caudal de cheia (m3/s) Volume de cheia (1000 m3)

Método I Método II Método I Método II

(Pearson tipo III) (Goodrich) (log-Pearson tipo III) (log-Pearson tipo III)

2 151,238 157,878 17273,661 19384,863

4 202,776 202,120 26986,224 28551,076

10 253,376 252,473 37246,966 39734,287

20 285,639 286,542 43722,485 47279,387

25 295,323 296,949 45617,090 49529,364

50 323,778 327,843 50990,809 55961,741

100 350,303 356,903 55680,652 61575,616

1000 429,456 443,819 67417,655 75067,856

R2

T (anos)Caudal de cheia (m3/s) Volume de cheia (1000 m3)

0,9979 0,9985

Page 86: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

66

A observação dos quadros 4.14 a 4.16 e das figuras 4.5 a 4.7 permite extrair duas conclusões. A

primeira é a de que, uma vez que os resultados obtidos pelas duas abordagens são muito

semelhantes, não parecem existir diferenças significativas entre os dois métodos. De facto, tanto

para caudais, como para volumes de cheia, os coeficientes de determinação entre estimativas

obtidas pelos dois métodos são sempre superiores ou iguais a 0,93.

A segunda conclusão relaciona-se com o facto de o método II (séries acima de limiares) fornecer, em

geral, estimativas de caudal e de volume de cheia superiores às que se obtêm através do método I.

Isto é verdade para todas as variáveis, excepto para o volume de cheia em Couto de Andreiros. Tais

diferenças não são, contudo, significativas, podendo afirmar-se que, de acordo com a primeira

conclusão, as duas abordagens fornecem resultados em tudo equivalentes. Em face desta

constatação, admite-se que a utilização de séries de máximos anuais possa apresentar vantagens.

Com efeito, no que respeita ao método II baseado nas séries de valores acima de limiar, à crítica

oportunamente indicada – relacionada com a introdução de um factor de algum modo arbitrário na

definição desse limiar –, adiciona-se a dificuldade em constituir as amostras requeridas por tal

método, face à informação por norma disponível, designadamente através do Sistema Nacional de

Informação de Recursos Hídricos, SNIRH, disponibilizado pelo Instituto da Água.

Em contrapartida, no ajustamento de modelos estatísticos no âmbito do método II existe uma maior

confiança na decisão, uma vez que o ajustamento visual das distribuições teóricas às amostras é

significativamente mais fácil que no método I (ver figuras 4.1, 4.2 e 4.4). Tal facto poderá estar

relacionado com a própria forma como os métodos são construídos, pois no método II, por definição,

as amostras têm sempre uma dimensão superior às utilizadas no método I.

A anterior observação está de acordo com o trabalho de CUNNANE, 1973, que conclui que os

métodos baseados em informação acima de limiares podem ser mais eficientes que os métodos que

utilizam máximos anuais, se a dimensão das séries naqueles primeiros métodos for, no mínimo, 1,65

vezes superior às dimensões das correspondentes séries de máximos anuais, para 10T . Recorda-

se que as dimensões das séries de valores acima de limiar, utilizadas no trabalho que se apresenta,

são duas a três vezes superiores às dimensões das respectivas séries de valores máximos anuais

(parâmetro λ no quadro 4.13).

De forma a consolidar as anteriores conclusões, optou-se por comparar o conjunto de resultados

obtidos nas três estações hidrométricas, para o que as diferentes estimativas de caudal e de volume

de cheia, sistematizadas nos quadros 4.14, 4.15 e 4.16, foram expressas em termos de valores

específicos, por divisão pelas áreas das bacias hidrográficas a que respeitam (quadro 3.1). Os

resultados obtidos são apresentados na figura 4.8.

Page 87: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

67

Figura 4.8 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Relação entre estimativas de caudal específico de cheia (à esquerda) e de volume específico de cheia (à direita) obtidas pelos métodos I e II.

Segmentos de recta representativos das regressões lineares e respectivos coeficientes de determinação, R2.

Mais uma vez, é possível estabelecer equações de regressão linear com coeficientes de determinação

superiores a 0,96, tanto para caudal, como para volume de cheia. Confirma-se, portanto, que, no

caso das três estações hidrométricas com registos analisados, os dois processos de constituição das

amostras fornecem estimativas de uma mesma variável – caudal ou volume – muito próximas. Por

fim, observa-se que a dispersão dos pontos representativos dos pares de valores de caudal ou de

volume em torno da respectiva recta de regressão é mais acentuada para os períodos de retorno

mais elevados. Este facto poderá ser o reflexo da imprecisão da inferência estatística que decorre da

dimensão reduzida das amostras.

4.4. Relações entre estimativas de caudal de cheia e de volume

associado

O trabalho que se apresenta teve como segundo objectivo principal o de procurar uma possível

relação entre estimativas de caudal de cheia, Q, e de volume associado a esse caudal, V, ( )V f Q .

Para tal, procedeu-se a uma comparação equivalente à efectuada no capítulo 4.3. tendo por base as

estimativas, antes utilizadas, de caudal específico de cheia e do correspondente volume específico no

conjunto das três estações com as quais se prosseguiu o estudo. Para o efeito, fez-se corresponder à

estimativa do caudal específico de cheia com dado período de retorno a estimativa do volume

específico de cheia com o mesmo período de retorno. Os períodos de retorno considerados

coincidem com os antes adoptados a propósito das figuras 4.7 e 4.8 e dos quadros 4.14 a 4.16 (2, 4,

10, 20, 25, 50, 100 e 1000 anos), sendo que se representaram de modo separado os resultados

R² = 0,9619

0,0

0,5

1,0

1,5

2,0

2,5

0,0 0,5 1,0 1,5 2,0 2,5

Caudal específico estimado a partir do método II (m3/s/km2)

Caudal específico estimado a partir do método I (m3/s/km2)

R² = 0,9783

0

100

200

300

400

500

600

700

800

0 100 200 300 400 500 600 700 800

Volume específico estimado a partir do método II (1000 m3/km2)

Volume específico estimado a partir do método I (1000 m3/km2)

Page 88: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

68

baseados em valores máximos anuais (método I) e em valores acima de limiar (método II), conforme

se apresenta na figura 4.9 que inclui ainda a representação das rectas de regressão linear e os

valores dos correspondentes coeficientes de determinação.

Figura 4.9 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Relação entre estimativas de valores específicos do caudal de cheia e de volume de cheia com o mesmo período de retorno fornecidas pelo método I

(à esquerda) e pelo método II (à direita). Segmentos de recta representativos das regressões lineares e respectivos coeficientes de determinação, R2.

A figura 4.9 evidencia que, não obstante os coeficientes de determinação não serem tão baixos

quanto isso, não tem sentido falar em relações lineares – nem de outro tipo conforme decorre da

disposição dos pontos naquela figura – entre estimativas de valores específicos de caudais de cheia e

de volumes de cheia com o mesmo período de retorno.

Esta conclusão constituiu um dos fundamentos para o trabalho que se segue, que consiste na

aplicação da teoria das cópulas com o intuito de extrair dependências de índole estatística entre

estimativas de caudais de ponta de cheia e de volumes.

4.5. Resultados da aplicação da teoria das cópulas e da lei bivariada

de Gumbel

4.5.1. Considerações prévias

Na consequência dos resultados apresentados nos capítulos antecedentes, os dados disponíveis para

a realização da análise multivariada objecto do presente capítulo são os correspondentes a apenas

três das quatro estações hidrométricas inicialmente consideradas: Albernoa, Couto de Andreiros e

Torrão do Alentejo. Recorda-se que aquando da análise estatística convencional das amostras de

R² = 0,744

0

100

200

300

400

500

600

700

800

0 1 2 3

Volume específico estimado a partir do método II (1000 m3/km2)

Caudal específico estimado a partir do método II (m3/s/km2)

R² = 0,5223

0

100

200

300

400

500

600

700

800

0 1 2 3

Volume específico estimado a partir do método I (1000 m3/km2)

Caudal específico estimado a partir do método I (m3/s/km2)

Page 89: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

69

caudais instantâneos máximos anuais e acima de limiar e dos correspondentes volumes de cheia na

estação hidrométrica de Monforte, não foi possível seleccionar nenhuma das leis estatísticas

aplicadas para caracterizar as variáveis aleatórias, uma vez que o desenvolvimento das curvas

teóricas, quando representadas em gráfico, não revelou uma proximidade que se considerasse

adequada ao desenvolvimento dos pontos amostrais das variáveis.

A análise multivariada incide sobre amostras constituídas por mais do que uma variável sendo que

nas aplicações efectuadas se consideraram, em cada estação hidrométrica, as seguintes amostras:

Amostras de caudais instantâneos máximos anuais e dos volumes associados a esses caudais.

Amostras de caudais acima de dado limiar e dos volumes associados a esses caudais.

Previamente à aplicação dos modelos multivariados e até para averiguar em que medida tais

modelos se poderiam justificar, analisou-se a correlação entre as duas variáveis que constituem cada

uma das anteriores amostras, com obtenção dos coeficientes de correlação de Pearson apresentados

no quadro 4.17.

Quadro 4.17 - Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Coeficientes de correlação de Pearson entre caudais instantâneos máximos anuais e correspondentes volumes de cheia e entre caudais acima de

limiares e correspondentes volumes de cheia.

Atendendo a que, no conjunto das três estações hidrométricas, apenas as amostras de caudais de

cheia acima de dados limiares e dos correspondentes volumes apresentam coeficientes de

correlação com algum significado, optou-se por prosseguir com a aplicação da análise multivariada

apenas a essas amostras.

Deste modo, no presente capítulo, procede-se à apresentação e à análise dos resultados da aplicação

da teoria das cópulas e da lei bivariada de Gumbel às mencionadas amostras.

Caudais máximos anuais e

correspondentes volumes

Caudais acima de limiar e

corerspondentes volumes

Albernoa 0,563 0,694

Couto de Andreiros 0,624 0,720

Torrão do Alentejo 0,418 0,722

Page 90: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

70

4.5.2. Aplicação e selecção das funções cópula e da lei bivariada de Gumbel

A aplicação das funções cópula apresentadas no capítulo 2 implica o cálculo do parâmetro θ de cada

cópula, que se pode definir como sendo um estimador da dependência entre as duas variáveis em

presença (caudais e volumes associados a esses caudais) e que requer a determinação do coeficiente

de Kendall, τ. De forma análoga, o parâmetro m é o estimador de dependência utilizado na aplicação

da lei bivariada de Gumbel, cujo cálculo depende do coeficiente de correlação de Pearson, ρ.

Dada a importância dos anteriores parâmetros, no quadro que se segue são apresentados os valores

obtidos para os mesmos tendo por base cada amostra caudal/volume de cheia. Por uma questão de

sistematização, incluíram-se ainda os valores antes apresentados do coeficiente de correlação de

Pearson.

Quadro 4.18 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Valores do coeficiente de

correlação de Pearson, ; do parâmetro m da lei bivariada de Gumbel; do coeficiente de Kendall, ; e dos parâmetros θ das funções cópula Clayton, θClayton, Frank, θFrank, e Gumbel-Hougaard, θGumbel.

Em relação aos valores do quadro anterior é possível tecer uma observação que se julga pertinente:

já se afirmou que a construção dos modelos bivariados depende fundamentalmente do coeficiente

de correlação de Pearson, ρ, e do coeficiente de Kendall, τ, para a lei de Gumbel e para as funções

cópula, respectivamente. O facto de estes coeficientes não apresentarem a mesma tendência – por

exemplo, os menores valores de ρ e de τ não correspondem à mesma amostra – , significa que os

coeficientes avaliam de forma diferente a dependência entre as variáveis em presença e que,

portanto, a construção dos modelos assenta em bases de diferente natureza.

Obtidos os parâmetros que permitem construir as funções bivariadas – de Gumbel e as três cópulas

referidas –, determinaram-se as probabilidades conjuntas para as amostras referentes a cada uma

das estações hidrométricas. Tais probabilidades são confrontadas com as probabilidades conjuntas

Albernoa Couto de Andreiros Torrão do Alentejo

ρ 0,694 0,720 0,722

m 1,809 1,889 1,896

τ 0,741 0,642 0,744

θClayton 5,722 3,591 5,800

θFrank 13,574 9,182 13,732

θGumbel 3,861 2,795 3,900

Page 91: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

71

empíricas atribuídas aos sucessivos elementos das amostras, para o que se utilizou a função empírica

de probabilidades conjuntas (2.60). Essa confrontação passa pela disposição num mesmo gráfico dos

pontos representativos das probabilidades amostrais (empíricos) e das probabilidades conjuntas

teóricas, F(Q,V). Na construção dos gráficos adoptou-se a organização utilizada por YUE e

RASMUSSEN, 2002, pelo que os pontos foram ordenados por valores crescentes das probabilidades

teóricas relativas a cada cópula ou à lei bivariada de Gumbel. O eixo das abcissas é simplesmente o

número de ordem de cada elemento da amostra assim ordenada. Desta forma, de seguida são

apresentadas três figuras – figuras 4.10 a 4.12, uma por cada estação hidrométrica – referentes à

amostra de caudais acima de limiar/correspondentes volumes de cheia, (Q,V), sendo que cada figura

contém quatro gráficos relativos aos três tipos de cópulas utilizados e à lei bivariada de Gumbel. A

disposição dos pontos da amostra nesses gráficos é, obviamente, sempre a mesma.

Figura 4.10 – Estação hidrométrica de Albernoa. Caudais de cheia acima de limiar e correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel e d) bivariada de Gumbel.

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 20 40 60 80

F(Q

,V)

Número de ordem

a)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 20 40 60 80

F(Q

,V)

Número de ordem

b)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 20 40 60 80

F(Q

,V)

Número de ordem

c)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 20 40 60 80

F(Q

,V)

Número de ordem

d)

0,0000

0,2000

0,4000

0,6000

0,8000

1,0000

1,2000

0 10 20 30 40 50 60 70 80

Pro

bab

ilid

ade

co

nju

nta

de

não

exc

ed

ên

cia

Número de ordem dos pares de caudal e volume

Empírica Clayton Frank Gumbel Bivariada Gumbel

Page 92: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

72

Figura 4.11 – Estação hidrométrica de Couto de Andreiros. Caudais de cheia acima de limiar e correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel e d) bivariada de Gumbel.

Figura 4.12 – Estação hidrométrica de Torrão do Alentejo. Caudais de cheia acima de limiar e correspondentes volumes.

Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel e d) bivariada de Gumbel.

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40 50

F(Q

,V)

Número de ordem

a)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40 50

F(Q

,V)

Número de ordem

b)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40 50

F(Q

,V)

Número de ordem

c)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40 50

F(Q

,V)

Número de ordem

d)

0,0000

0,2000

0,4000

0,6000

0,8000

1,0000

1,2000

0 10 20 30 40 50 60 70 80

Pro

bab

ilid

ade

co

nju

nta

de

não

exc

ed

ên

cia

Número de ordem dos pares de caudal e volume

Empírica Clayton Frank Gumbel Bivariada Gumbel

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40

F(Q

,V)

Número de ordem

a)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40

F(Q

,V)

Número de ordem

b)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40

F(Q

,V)

Número de ordem

c)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0 10 20 30 40

F(Q

,V)

Número de ordem

d)

0,0000

0,2000

0,4000

0,6000

0,8000

1,0000

1,2000

0 10 20 30 40 50 60 70 80

Pro

bab

ilid

ade

co

nju

nta

de

não

exc

ed

ên

cia

Número de ordem dos pares de caudal e volume

Empírica Clayton Frank Gumbel Bivariada Gumbel

Page 93: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

73

Por observação das figuras 4.11 a 4.12 verifica-se, aliás, como foi já mencionado no capítulo 2.6.4.,

que as curvas representativas das quatro funções teóricas apresentam ajustamentos aos pontos

amostrais praticamente indiferenciáveis, não possibilitando a selecção visual de uma dessas funções.

Deste modo, com o intuito de identificar a função com melhor ajustamento, foi aplicado o teste de

Kolmogorov-Smirnov e, a título indicativo, avaliados os desvios quadráticos médios entre valores

teóricos e empíricos. Os resultados assim obtidos são apresentados nos quadros 4.19 e 4.20,

respectivamente. Em tais quadros, os resultados que se admitiu serem indicativos de melhor

ajustamento são realçados por meio de células com preenchimento de cor cinzenta.

Quadro 4.19 – Resultados obtidos da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais acima de limiares e dos correspondentes volumes de cheia. Nível de confiança de 95%. (nota: os menores valores da estatística do

teste estão assinalados por meio de células com preenchimento de cor cinzenta).

Quadro 4.20 – Desvio quadrático médio entre os valores das probabilidades conjuntas teóricas e empíricas das amostras de caudais acima de limiares e dos correspondentes volumes de cheia (nota: os menores valores de desvio quadrático

médio estão assinalados por meio de células com preenchimento de cor cinzenta).

Por observação do quadro 4.19, verifica-se que nenhuma hipótese é rejeitada, o que significa que

não é possível excluir nenhuma das funções com base nos resultados do teste de Kolmogorov-

Smirnov. Em face de tal circunstância considerou-se que as funções a adoptar para representar as

distribuições de probabilidade conjunta seriam as que apresentassem os menores valores da

estatística do teste. Assim, seleccionaram-se as cópulas de Frank, na estação hidrométrica de

Albernoa, e a de Clayton, nas estações hidrométricas de Couto de Andreiros e Torrão do Alentejo.

Cópula Clayton Cópula Gumbel Cópula FrankBivariada de

Gumbel

Estatística de teste (DN) 0,165 0,165 0,165 0,165

DN,1-α, α=0,05 0,130 0,119 0,116 0,117

Resultado do teste 1 1 1 1

Estatística de teste (DN) 0,210 0,210 0,210 0,210

DN,1-α, α=0,05 0,056 0,082 0,077 0,063

Resultado do teste 1 1 1 1

Estatística de teste (DN) 0,213 0,213 0,213 0,213

DN,1-α, α=0,05 0,045 0,056 0,062 0,083

Resultado do teste 1 1 1 1

Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada

Albernoa

Couto de

Andreiros

Torrão do

Alentejo

Cópula Clayton Cópula Gumbel Cópula FrankBivariada de

Gumbel

0,037 0,035 0,038 0,062

0,025 0,034 0,033 0,030

0,019 0,025 0,029 0,048RMSE Torrão do Alentejo

RMSE Couto de Andreiros

RMSE Albernoa

Page 94: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

74

No caso destas duas últimas estações hidrométricas, à cópula de Clayton correspondem também os

menores valores do desvio quadrático médio. Em Albernoa o menor desvio quadrático médio ocorre

para a cópula de Gumbel. Não obstante tal facto, manteve-se a opção pela cópula de Frank. Com

efeito, tal desvio mede simplesmente a média do quadrado das diferenças entre os valores de

probabilidade conjunta empíricos e teóricos, pelo que pode dar-se o caso de a função com melhor

ajustamento gráfico apresentar um erro superior a outra função aparentemente não tão adequada,

em resultado da existência de pontos esporádicos, em número reduzido, mas com afastamento

significativo em relação à curva teórica.

Por fim, considera-se importante sublinhar que a análise multivariada nunca resultou na selecção da

lei bivariada de Gumbel para descrever a distribuição de probabilidade conjunta das variáveis em

avaliação. No entanto, apenas no caso da estação hidrométrica de Torrão do Alentejo a tal lei

correspondem os mais elevados resultados no teste de ajustamento. Dado que apenas se analisaram

três casos de estudo, considera-se não ser válido afirmar que a teoria das cópulas possa fornecer um

modelo mais adequado do que a lei bivariada de Gumbel. Neste contexto, impõe-se ainda a seguinte

observação: a aplicação da lei de Gumbel na forma bivariada implica a assumpção de que as

distribuições de probabilidade marginal das variáveis em presença seguem também essa lei, o que

pode ser incorrecto, como, aliás, se concluiu nas aplicações efectuadas, em que a análise estatística

aplicada às amostras consideradas isoladamente nunca resultou na selecção da lei de Gumbel.

4.5.3. Probabilidade conjunta – apresentação de superfícies

O objectivo a que o presente estudo se propunha foi, neste ponto, atingido. Para as três estações

hidrométricas consideradas, e através da teoria das cópulas, foi possível construir um modelo

descritivo da probabilidade conjunta das variáveis caudal acima de limiar, Q, e dos volumes

associados a esses caudais, V. No seguinte quadro, sistematizam-se as funções seleccionadas e

indicam-se os respectivos parâmetros necessários à especificação das equações daquelas funções.

Quadro 4.21 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Funções cópula adoptadas para caracterizar a probabilidade conjunta do caudal acima de limiar e do correspondente volume. Parâmetros das

funções, θ.

Cópula seleccionada Parâmetro θ

Albernoa Frank 13,574

Couto de Andreiros Clayton 3,591

Torrão do Alentejo Clayton 5,800

Page 95: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

75

Na figura 4.13, apresentam-se as superfícies relativas a cada uma das funções cópula obtidas. Os

eixos horizontais correspondem às probabilidades marginais de não-excedência para caudal e para

volume e os eixos verticais, às probabilidades conjuntas dessas duas variáveis. Para obter as

anteriores curvas geraram-se aleatoriamente probabilidades marginais de não-excedência e

calcularam-se as correspondentes probabilidades conjuntas teóricas.

Figura 4.13 – Superfícies da distribuição de probabilidade conjunta de caudal e volume nas estações hidrométricas de: a) Albernoa; b) Couto de Andreiros e c) Torrão do Alentejo.

0,10,2

0,30,4

0,50,6

0,70,8

0,91,0

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,00,9

0,80,7

0,60,5

0,40,3

0,20,1

0,0

F(V)

F(Q

,V)

F(Q)

c)

0,10,2

0,30,4

0,50,6

0,70,8

0,91,0

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,00,9

0,80,7

0,60,5

0,40,3

0,20,1

0,0

F(V)

F(Q

,V)

F(Q)

a)

0,10,2

0,30,4

0,50,6

0,70,8

0,91,0

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,00,9

0,80,7

0,60,5

0,40,3

0,20,1

0,0

F(V)

F(Q

,V)

F(Q)

b)

0,10,2

0,30,4

0,50,6

0,70,8

0,91,0

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,00,9

0,80,7

0,60,5

0,40,3

0,20,1

0,0 F(V)

F(Q

,V)

F(Q)

0,0-0,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1,0

Page 96: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

76

Apesar dos gráficos anteriores representarem fielmente as curvas a que respeitam, a sua utilidade é

algo reduzida. Assim, optou-se por construir três gráficos referentes a curvas de igual probabilidade

conjunta (isolinhas de probabilidade). Em tais gráficos, os eixos correspondem às probabilidades de

não-excedência das variáveis caudal acima de limiar, F(Q), e de volume associado, F(V), sendo que

cada curva respeita a uma dada probabilidade conjunta, F(Q,V). A figura 4.14, que se apresenta de

seguida, contém os três gráficos referidos.

Figura 4.14 – Curvas de igual probabilidade conjunta. a) Estação hidrométrica de Albernoa – cópula de Frank; b) Estação hidrométrica de Couto de Andreiros – cópula de Clayton; c) Estação hidrométrica de Torrão do Alentejo – cópula de

Clayton.

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(V

)

F(Q)

a)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(V

)

F(Q)

b)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(V

)

F(Q)

c)

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 0,5 1

F(V

)

F(Q)

F(Q,V)=0,1

F(Q,V)=0,2

F(Q,V)=0,3

F(Q,V)=0,4

F(Q,V)=0,5

F(Q,V)=0,6

F(Q,V)=0,7

F(Q,V)=0,8

F(Q,V)=0,9

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 0,5 1

F(V

)

F(Q)

F(Q,V)=0,1

F(Q,V)=0,2

F(Q,V)=0,3

F(Q,V)=0,4

F(Q,V)=0,5

F(Q,V)=0,6

F(Q,V)=0,7

F(Q,V)=0,8

F(Q,V)=0,9

Page 97: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

77

As figuras 4.13 e 4.14 constituem os resultados finais da análise multivariada efectuada. Contudo,

considerou-se conveniente procurar outras formas de ilustrar as curvas obtidas de modo a facilitar a

sua compreensão, bem como fornecer perspectivas relativamente a aplicações futuras da teoria das

cópulas. Assim, procedeu-se à construção de mais três gráficos, um para cada estação hidrométrica,

mas no pressuposto de que a probabilidade de não-excedência associada à variável volume é pré-

fixada, para o que se consideraram as probabilidades 0,25, 0,50 e 0,75. Fazendo variar a

probabilidade de não-excedência associada ao caudal obtiveram-se as curvas que fornecem a

probabilidade conjunta para aquelas probabilidades de não-excedência do volume. Resultaram,

assim, as curvas apresentadas nos gráficos da figura 4.15.

Figura 4.15 – Curvas de probabilidade conjunta de caudal acima de limiar e volume com probabilidade de não-excedência de 0,25, 0,50 e 0,75 para as variáveis de: a) Estação hidrométrica de Albernoa – cópula de Frank; b) Estação hidrométrica

de Couto de Andreiros – cópulas de Clayton; c) Estação hidrométrica de Torrão do Alentejo – cópula de Clayton.

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(Q

,V)

F(Q)

a)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(Q

,V)

F(Q)

b)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(Q

,V)

F(Q)

c)

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

F(Q

,V)

F(Q)

a)F(Q,V<0,25)

F(Q,V<0,50)

F(Q,V<0,75)

Page 98: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

78

Em cada gráfico da anterior figura, o eixo das abcissas corresponde à probabilidade de

não-excedência do caudal acima de limiar e o eixo das ordenadas, à probabilidade conjunta das duas

variáveis, uma vez fixada a probabilidade de não-excedência do volume.

O andamento de cada uma das curvas das da figura 4.15 traduz o comportamento esperado para as

duas variáveis em presença: à medida que a probabilidade de não-excendência da variável caudal

acima de limiar tende para a unidade, as curvas tendem para o valor da probabilidade de não-

excedência inerente à variável volume (cortes verticais nas superfícies da figura 4.13 para as

probabilidades de não-excedência estipuladas de 0,25, 0,50 e 0,75). De facto, probabilidades de não-

excedência da variável caudal perto da unidade correspondem a valores muito elevados de caudal,

pelo que poderão associar-se a praticamente qualquer valor da variável volume. Nesse caso extremo,

e para cada curva, a probabilidade conjunta é “independente” da probabilidade de não-excedência

da variável caudal e tenderá para o máximo possível – o valor estipulado para a probabilidade de

não-excedência da variável volume, no caso das figuras em apreciação, 0,25, 0,50 ou 0,75.

Page 99: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

79

5. Conclusões

A investigação efectuada e que se apresenta teve por objectivo fundamental o estudo de modelos

estatísticos com vista à estimação de caudais e de volumes de cheia associados a dadas

probabilidades de não-excedência, ou seja, a dados períodos de retorno. Para tal, recorreu-se a duas

abordagens estatísticas distintas: a primeira envolvendo uma análise estatística convencional assente

em modelos de distribuição de frequências de variáveis consideradas isoladamente e a segunda

recorrendo uma análise estatística multivariada que permite construir modelos de distribuição de

probabilidade conjunta de diferentes variáveis, que, no caso das aplicações efectuadas, foram

consubstanciadas por caudais de cheia e pelos correspondentes volumes.

O estudo utilizou amostras de registos em quatro estações hidrométricas de Portugal Continental:

Albernoa, Couto de Andreiros, Monforte e Torrão do Alentejo. Para cada estação, tais amostras

envolveram caudais instantâneos máximos anuais e volumes de cheia atribuídos a esses caudais. No

entanto, considerou-se pertinente fazer incidir o estudo sobre outro tipo de amostras que, de

alguma forma, contivessem mais informação do que a patente em amostras de máximos anuais visto

que, para uma dada variável, estas últimas amostras são constituídas por uma única realização por

ano. Assim e em cada estação hidrométrica, analisaram-se amostras de caudais acima de dado limiar

e dos volumes associados a esses caudais as quais, necessariamente a par com os caudais

instantâneos máximos anuais e correspondentes volumes, contêm outros eventos superiores àquele

limiar, desde que estatisticamente independentes entre si. As amostras de valores acima de limiares

permitem considerar vários eventos por ano a que, eventualmente, poderão corresponder valores

superiores aos máximos valores noutros anos, o que constitui uma vantagem em relação às amostras

de máximos anuais.

Constituídas as amostras procedeu-se, numa primeira parte, à aplicação dos modelos de distribuição

de frequências das leis Normal, de Gumbel, log-Normal, Pearson tipo III, log-Pearson tipo III e de

Goodrich às séries de caudal e de volume de cheia adoptadas como casos de estudo, caracterizadas

no capítulo 3. A selecção do modelo de distribuição de frequências a aplicar a cada uma das variáveis

aleatórias recorreu a diferentes métodos de avaliação da adaptabilidade de distribuições estatísticas,

nomeadamente ao ajustamento visual das distribuições teóricas aos valores amostrais e à aplicação

dos testes de hipótese do qui-quadrado e de Kolmogorov-Smirnov. Foram também utilizadas

algumas medidas de erro para optar entre distribuições teóricas, mas somente quando os testes de

hipóteses e o ajustamento visual sugerissem a adequação dessas distribuições.

Page 100: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

80

A abordagem aplicada resultou na construção de um modelo estatístico para caracterizar cada uma

das variáveis analisadas, sendo que os parâmetros desse modelo foram estimados a partir da

correspondente amostra pelo método dos momentos. Importa anotar que o estabelecimento de

modelos estatísticos só foi possível para as amostras de três das quatro estações hidrométricas

consideradas, uma vez que da avaliação da adaptabilidade das distribuições teóricas às amostras de

caudal e de volume de cheia na estação hidrométrica de Monforte se concluiu não ser possível

adoptar nenhuma das distribuições postuladas. Tal facto relacionar-se-á, muito provavelmente, com

a reduzida dimensão do respectivo período de registos.

No que se refere ao estudo das amostras relativas às estações hidrométricas de Albernoa, Couto de

Andreiros e Torrão do Alentejo, verificou-se que a leis mais frequentemente seleccionada foi a de

log-Pearson tipo III. Tal resultado vai de encontro ao reportado em trabalhos anteriores, cujas

conclusões foram, aliás, sistematizadas logo no capítulo introdutório do presente documento.

Nomeadamente, HENRIQUES, 1990, refere precisamente que a lei mencionada apresenta boa

adaptabilidade à generalidade das séries de caudais instantâneos máximos anuais. Para além disso,

com o objectivo de seleccionar o modelo mais adequado à análise da distribuição de frequências de

caudais instantâneos máximos anuais, HENRIQUES, 1981, realiza uma análise comparativa entre

diferentes modelos, concluindo que existe uma clara superioridade dos modelos baseados em

distribuições de três parâmetros (como a lei de log-Pearson tipo III), relativamente aos modelos

baseados em distribuições de dois parâmetros.

Neste ponto do estudo e para cada uma das três estações hidrométricas com que se prossegui a

análise, identificaram-se, assim, os quatro modelos estatísticos que se concluiu melhor

representarem as amostras analisadas, a saber, de caudais máximos anuais e de caudais acima de

limiar, bem como as amostras dos volumes atribuídos àqueles caudais.

O facto de se terem considerado amostras com diferentes géneses permitiu uma análise comparativa

adicional. Com efeito, a inferência estatística associada a caudais de ponta de cheia, concretamente

baseada em amostras de máximos anuais, está largamente documentada e é amplamente aceite,

quer na prática profissional, quer em termos de investigação. Para que o recurso a amostras de

valores acima de limiares se possa constituir uma abordagem alternativa (com as vantagens daí

decorrentes, designadamente, quando os períodos de registos são curtos) deve conduzir a quantis

próximos dos que resultariam da análise baseada em máximos anuais.

A comparação efectuada entre estimativas associadas a amostras de máximos anuais e a amostras

de valores acima de limiares conduziu às seguintes conclusões: a) as estimativas decorrentes de

umas e de outras amostras são muito próximas, correspondendo-lhes coeficientes de determinação

Page 101: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

81

sempre superiores ou iguais a 0,93; e b) com uma única excepção, referente ao volume de cheia em

Couto de Andreiros, o recurso a amostras de valores acima de limiares forneceu estimativas de

caudal e de volume de cheia superiores às que se obtiveram a partir das amostras de máximos

anuais. Tais diferenças não são, contudo, significativas, podendo afirmar-se que as duas abordagens

fornecem resultados em tudo equivalentes o que se admite validar o recurso a amostras de valores

acima de limiar, designadamente quando estão em causa curtos períodos de registos.

Independentemente da anterior conclusão, tecem-se seguidamente alguns comentários sobre

vantagens e/ou desvantagens relativas dos dois tipos amostras em presença: a) em comparação às

amostras de máximos anuais, as de valores acima de limares contêm informação mais ampla dado

que aquelas primeiras amostras só consideram o maior evento de cada ano hidrológico, não tendo

em conta os seguintes maiores eventos que, contudo, podem ser superiores aos máximos eventos de

outros anos; b) a necessidade de fixar um limite para formar uma amostra de valores acima de limiar

constitui, em regra, um factor arbitrário (HENRIQUES, 1990, P. 328), carecendo de investigação

adicional; c) a constituição das amostras de valores acima de limiares é claramente mais difícil e

trabalhosa uma vez que a informação para o efeito requerida não está, por regra, acessível;

exemplificam a anterior circunstância as amostras de caudais, sendo que a recolha de caudais

instantâneos máximos anuais é imediata através do Sistema Nacional de Informação de Recursos

Hídricos, SNIRH, disponibilizado pelo Instituto da Água, ao passo que a constituição das amostras de

caudais acima de limiares requer a obtenção de informação em formato de papel (hidrogramas) e a

sua digitalização; d) por definição, as amostras de valores acima de limiares têm sempre dimensão

superior às de máximos anuais, o que induz uma maior confiança aquando da selecção dos modelos

a aplicar na inferência estatística.

Este último comentário está de acordo com as conclusões do trabalho de CUNNANE, 1973, que

refere que os métodos baseados em informação acima de limiares podem ser mais eficientes que os

métodos que utilizam máximos anuais, se a dimensão das amostras naqueles primeiros métodos for,

no mínimo, 1,65 vezes superior às dimensões das correspondentes amostras de máximos anuais,

para 10T . Recorda-se que as dimensões das amostras de valores acima de limiar, utilizadas no

trabalho que se apresenta, são duas a três vezes superiores às dimensões das respectivas amostras

de valores máximos anuais (parâmetro λ no quadro 5.13).

Na tentativa de estabelecer relações entre quantis de caudais, Q, e de volumes de cheia, V,

pesquisaram-se relações lineares entre estimativas daquelas duas variáveis relativas a um mesmo

período de retorno. Os baixos coeficientes de determinação que assim se obtiveram indicaram,

Page 102: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

82

contudo, a não adequação daquele tipo de dependência, o que reforçou o interesse numa análise

multivariada.

Assim, pesquisaram-se outras formas de obter uma relação do tipo V=f(Q), nomeadamente, através

do estudo da probabilidade conjunta daquelas duas variáveis. De um modo geral, as distribuições de

probabilidade conjunta mais utilizadas em Hidrologia são a Normal, a Exponencial e a Gumbel, sendo

que, no presente trabalho, atendendo unicamente que se está em presença de valores extremos, se

optou por recorrer à última distribuição. A utilização de uma dada distribuição implica a assumpção

de que cada uma das distribuições de probabilidade marginal segue essa lei individualmente, para

além de, obviamente, se assumir que a distribuição conjunta tem essa mesma forma. Em alternativa,

averiguaram-se outros métodos para estabelecer a distribuição de probabilidade conjunta que não

assentassem naquele pressuposto obrigatório o qual, como se compreende, pode constituir um erro,

pois a distribuição conjunta ou as distribuições marginais de probabilidade podem não seguir uma

mesma lei. Para tal recorreu-se à teoria das cópulas, mais precisamente às funções cópula da família

arquimediana. Estas funções devem a sua forma a um único parâmetro de avaliação da dependência

entre as variáveis envolvidas, o coeficiente de Kendall, e são independentes das distribuições de

probabilidade marginal, o que constitui uma vantagem em relação à utilização de distribuições de

probabilidade conjunta.

Previamente à aplicação dos modelos multivariados e até para averiguar em que medida tais

modelos se justificariam, procedeu-se à análise da correlação entre caudais instantâneos máximos

anuais (ou acima de limiar) e volumes associados a esses caudais, para o que foram obtidos os

coeficientes de correlação de Pearson. Concluiu-se, assim, que apenas as amostras de valores acima

de limiar exibiam correlações suficientemente elevadas que justificassem a aplicação da análise

multivariada.

Deste modo e para além da lei bivariada de Gumbel, aplicaram-se três funções cópula – Clayton,

Frank e Gumbel-Hougaard – às amostras de caudais acima de limiar e dos correspondentes volumes

nas três estações hidrométricas que sustentaram a generalidade do estudo. A construção dos

anteriores modelos implicou a determinação, para cada uma das amostras, do coeficiente de

Kendall, τ, no caso das funções cópula, e do coeficiente de Pearson, ρ, no caso da lei de Gumbel. Os

valores obtidos para tais coeficientes demonstraram que, de facto, o método da teoria das cópulas

tem por base uma avaliação da dependência entre variáveis distinta da que está subjacente à lei

bivariada de Gumbel, pois, por exemplo, os menores valores de ρ e de τ não estão associados a uma

mesma amostra.

Page 103: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

83

Após a construção dos diferentes modelos multivariados, procedeu-se à avaliação do seu

ajustamento aos valores da probabilidade conjunta empírica de cada elemento amostral. O

procedimento de ajustamento foi análogo ao efectuado na análise estatística individual das variáveis,

tendo compreendido, para além da apreciação visual, a aplicação do teste de hipótese de

Kolmogorv-Smirnov e adicionalmente, embora a título essencialmente indicativo, o cálculo do desvio

quadrático médio. Dado que não foi possível seleccionar visualmente o modelo com melhor

ajustamento adoptou-se como critério de selecção o menor valor da estatística do teste de

Kolmogorov-Smirnov. Resultou, assim, a selecção da função cópula de Frank para a descrição das

variáveis caudal/volume na estação hidrométrica de Albernoa e da função cópula de Clayton para a

descrição daquelas variáveis nas restantes duas estações de Couto de Andreiros e de Torrão do

Alentejo. Estes resultados foram consistentes com os valores obtidos para os desvios quadráticos

médios, com excepção do caso da estação hidrométrica de Albernoa em que o menor valor daquele

desvio ocorreu para a função cópula de Gumbel.

Por fim, considera-se importante sublinhar que a análise multivariada nunca resultou na selecção da

lei bivariada de Gumbel para descrever a distribuição de probabilidade conjunta das duas variáveis

em presença mas, como apenas se analisaram três casos de estudo, considera-se não ser válido

afirmar que a teoria das cópulas possa fornecer um modelo mais adequado do que a lei bivariada de

Gumbel. No entanto, como já se referiu várias vezes, a aplicação da lei de Gumbel na forma bivariada

implica a assumpção de que as distribuições de probabilidade marginal das variáveis em presença

seguem também essa lei, o que pode ser incorrecto, como, aliás, se concluiu nas aplicações

efectuadas, em que a análise estatística aplicada às amostras consideradas isoladamente nunca

resultou na selecção daquela lei.

O objectivo a que o presente estudo se propunha foi, portanto, atingido. Para as três estações

hidrométricas que, fundamentalmente, sustentaram a análise, foi possível construir, através da

teoria das cópulas, um modelo descritivo da probabilidade conjunta das variáveis caudal acima de

limiar e dos volumes associados a esses caudais. Assim, o presente trabalho fornece um método

alternativo para o estudo da probabilidade conjunta de não-excedência de um acontecimento

constituído por um caudal e por um volume de cheia associados a dados períodos de retorno.

As aplicações práticas deste tipo de análise poderão ter a forma apresentada no capítulo 5.5.3.,

onde, a título de exemplo, se obtiveram gráficos que fornecem probabilidades de não-excedência do

caudal de cheia, para uma dado valor máximo da probabilidade de não-excedência do volume de

cheia, para o que basta seleccionar a probabilidade de não-excedência do acontecimento conjunto.

Page 104: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

84

Por outro lado, a obtenção do valor da probabilidade de não-excedência do acontecimento conjunto

é essencial para o estudo de períodos de retorno conjuntos, um conceito que tem sido objecto de

análise por alguns investigadores ao longo dos últimos anos. Como se compreende, a determinado

período de retorno conjunto, ou seja, bivariado, não corresponde apenas um único par

caudal/volume. Desse modo, torna-se interessante a obtenção de expressões analíticas e de gráficos

das isolinhas de probabilidade de não-excedência conjunta, tal como apresentado no capítulo 5.5.3.

Como sugestão para trabalhos futuros, considera-se pertinente o desenvolvimento do conceito de

período de retorno conjunto com base numa análise multivariada equivalente ao objecto da

presente investigação de mestrado. A obtenção de isolinhas de período de retorno pode ser de

extrema utilidade para simular diferentes cenários de avaliação do risco associado a cheias,

envolvendo intervenções que compreendem desde o dimensionamento de descarregadores de

cheias em barragens até à delimitação de leitos de cheia.

A determinação da distribuição de probabilidade condicional entre variáveis hidrológicas tem sido

desenvolvida também por diversos autores, nomeadamente, por aqueles cujos trabalhos estiveram

na base científica da investigação que se apresenta. Deste modo, o estudo da análise condicional, no

caso português, constituirá também uma abordagem interessante, no domínio da Hidrologia.

Por último, sugere-se, ainda, o desenvolvimento de estudos no âmbito da análise multivariada das

variáveis caudal de ponta, volume de cheia e duração da cheia, uma vez que esta última variável

pode ser, a par com as demais, também crucial para equacionar as ocorrências de cheia,

determinando, por exemplo, os tempos de submersão em que dadas vias de comunicação deixarão

de estar operacionais ou condicionando a programação de obras em leitos de cheias, como sejam a

execução das fundações de viadutos.

Page 105: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

85

Referências bibliográficas

BACCHI B, BECCIU G, KOTTEGODA NT., 1994. Bivariate exponential model applied to intensities and

durations of extreme rainfall. J Hydrol, 155 (1–2):225–36.

CASELLA G, BERGER RL. Statistical inference. Pacific Grove, CA: Wadsworth & Brooks; 1990.

CHOW VT, MAIDMENT DR, MAYS LW., 1988. Applied hydrology. New York: McGraw-Hill.

CHOW, V.T., 1964, Section 8-I. Statistical and Probability Analysis of Hydrologic Data. Part I –

Frequency Analysis. In: Handbook of Applied Hydrology. McGraw-Hill, USA.

COLES S., 2001. An introduction to statistical modeling of extreme values. London, UK: Springer-

Verlag.

CORREIA, F. N., 1983. Métodos de Análise e Determinação de Caudais de Cheia. Tese apresentada a

concurso para Investigador Auxiliar. Laboratório Nacional de Engenharia Civil, Lisboa.

CUNNANE, C., 1973. A Particular Comparison of Annual Maxima and Partial Duration Series Methods

of Flood Frequency Prediction. Journal of Hydrology, 18, pp. 257-222.

CUNNANE, C., 1978. Unbiased Plotting Positions – a Review. Journal of Hydrology, 37, pp. 205-222.

DE MICHELE, C., SALVADORI, G., CANOSSI, M., PETACCIA, A., ROSSO, R., 2005. Bivariate statistical

approach to check adequacy of dam spillway. Journal of Hydrologic Engineering ASCE 10 (1),

50–57.

DEMARTA, S. e McNEIL, A.J., 2004. The t Copula and Related Copulas. International Statistical

Review, 73(1), pp. 111-129.

DIAS, A. T. G. S., 2003. Caudais Instantâneos Máximos Anuais em Portugal Continental, Proposta de

Regionalização. Dissertação para a obtenção do Grau de Mestre em Hidráulica e Recursos

Hídricos. Instituto Superior Técnico, Lisboa.

ESCALANTE-SANDOVAL, C., 2007. Application of bivariate extreme value distribution to flood

frequency analysis: a case study of Northwestern Mexico. Natural Hazards Journal, Vol. 42,

No. 1., pp. 37-46.

FAVRE A-C, EL ADLOUNI S, PERREAULT L, THIE´MONGE N, BOBE´E B., 2004. Multivariate hydrological

frequency analysis using copulas. Water Resour Res, 40.

GENEST C., FAVRE A.C., 2007. Everything you always wanted to know about copula modeling but

were afraid to ask. J Hydrol Eng ASCE, 12 (4), 347–368.

GOEL NK, SETH SM, CHANDRA S., 1998. Multivariate modeling of flood flows. J Hydraulic Eng,

124(2):146–55.

Page 106: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

86

GRIMALDI, S. e SERINALDI, F., 2005. Asymmetric copula in multivariate flood frequency analysis.

Advances in Water Resources, 29, pp. 1155–1167.

HENRIQUES, A. G., 1990. Modelos de Distribuição de Frequências de Caudais de Cheia. Dissertação de

Doutoramento em Engenharia Civil no Instituto Superior Técnico, Lisboa.

HERR, H.D., KRZYSZTOFOWICZ, R., 2005. Generic probability distribution of rainfall in space: The

bivariate model. Journal of Hydrology 306, 237–264.

JOE H., 1997. Multivariate models and dependence concepts. New York: Chapman and Hall, 399pp.

KARMAKAR, S. e SIMONOVIC, S.P., 2009. Bivariate Food Frequency Analysis. Part 2: a Copula-based

Approach with Mixed Marginal Distributions. Journal of Flood Risk Management, 2, pp. 32–

44.

LUPTON, R., 1993. Statistics in Theory and Practice. Princeton University Press.

MELGHIORI, M. R., 2003. Which Archimedean Copula is the Right One? YieldCurve.com e-Journal.

MORETTIN, P. A., TOLOI, C. M. C., CHIANN, C. e MIRANDA, J. C. S., 2010. Wavelet-Smoothed Empirical

Copula Estimator. Revista Brasileira de Finanças, Vol. 8, No. 3, pp. 263-281.

NAGHETTINI, M. e PINTO, E. J. A., 2007. Hidrologia Estatística. Serviço Geológico do Brasil.

NELSEN, RB., 2006. An Introduction to Copulas. Springer, New York.

PORTELA, M.M e DELGADO, J.M., 2009a. A new plotting position concept to evaluate peak flood

discharges based on short samples. Fifth International Conference on Sustainable Water

Resources Management, WRM09 (Malta), pp. 185-195, Wessex Institute, WITPress, ISBN 978

1 84564 198-6, Southampton.

PORTELA, M.M. e DELGADO, J.M, 2009b. Estimação de caudais de ponta de cheia a partir de

amostras com reduzida dimensão. Recursos Hídricos, Vol. 30(1), pp. 43-53, Associação

Portuguesa dos Recursos Hídricos (APRH), ISSN 0870-1741, Lisboa.

PULIDO-CALVO, I. e PORTELA, M. M., 2007. Application of neural approaches to one-step daily flow

forecasting in large Portuguese watersheds. Journal of Hydrology, 332, pp. 1-15.

QUINTELA, A.C., 1996. Hidrologia e Recursos Hídricos. Secção de Folhas. Instituto Superior Técnico.

SALVADORI G, DE MICHELE C., 2004. Frequency analysis via copulas: theoretical aspects and

applications to hydrological events. Water Resources Research, 40:W12511.

SALVADORI G., DE MICHELE C., 2007. On the use of copulas in hydrology: theory and practice. J

Hydrol Eng ASCE, 12, (4), 369–380.

YUE S., OUARDA TBMJ, BOBE’E B, LEGENDRE P, BRUNEAU P., 1999. The Gumbel mixed model for

flood frequency analysis. J Hydrol, 226(1–2):88–100.

YUE S., OUARDA TBMJ, BOBE’E B, LEGENDRE P, BRUNEAU P., 2002. Approach for describing statistical

properties of flood hydrograph. J Hydrol Eng, 7(2): 147–53.

Page 107: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

87

YUE, S. e RASMUSSEN, P., 2002. Bivariate Frequency Analysis: Discussion of Some Useful Concepts in

Hydrological Application. Hydrological Processes, 16, pp. 2881–2898.

YUE, S., 2000. Joint probability distribution of annual maximum storm peaks and amounts as

represented by daily rainfalls. Hydrological Sciences Journal, Vol. 45, Issue 2, pp. 315-326.

ZHANG, L. e SINGH, V.P., 2006. Bivariate Rainfall Frequency Distributions using Archimedean Copulas.

Journal of Hydrology, 332, pp. 93-109.

Page 108: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

88

Page 109: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

89

Anexos

Anexo 1: Alturas hidrométricas e caudais instantâneos nas estações hidrométricas de Albernoa,

Couto de Andreiros, Monforte e Torrão do Alentejo.

Anexo 2: Diagramas cronológicos de caudal exemplificativos do procedimento de selecção dos

acontecimentos de cheia.

Page 110: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

90

Page 111: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

91

Anexo 1: Alturas hidrométricas e caudais instantâneos nas estações hidrométricas de Albernoa,

Couto de Andreiros, Monforte e Torrão do Alentejo.

Page 112: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

92

Page 113: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

93

Os ficheiros que se apresentam e que constituem o presente anexo contêm a totalidade da

informação recolhida para a elaboração do estudo. A recolha processou-se no Instituto da Água

mediante consulta de informação sistematizada em formato de papel, a qual foi digitalizada.

Cada ficheiro respeita a uma estação hidrométrica, de entre as quatro analisadas, e está organizado

em sucessivas folhas, sendo que a primeira contém a legenda e as restantes os registos nos

sucessivos anos hidrológicos. Tais registos referem a alturas hidrométricas e aos correspondentes

caudais, quando apresentados em formato de papel.

Para cada ano, calculou-se o máximo caudal para o que se aplicou a inerente curva de vazão.

Os ecrãs do Sistema Nacional de Informação de Recursos Hídricos, SNIRH, que contêm a

apresentação das curvas de vazão são reproduzidos na última folha de cada ficheiro.

Page 114: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

94

Page 115: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

95

Anexo 2: Diagramas cronológicos de caudal exemplificativos do procedimento de selecção dos

acontecimentos de cheia.

Page 116: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

96

Page 117: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

97

Anexo 2.1 – Diagramas cronológicos de caudal na estação hidrométrica de Albernoa nos anos hidrológicos de: a)

1983/1984 e b) 1987/1988.

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

a)

26/1983

27/1983

28/1983

29/1983

30/1983

31/1983

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

b)

42/1987

43/1987

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

b)

Série de caudais instantâneos Escoamento de base

42/1987

43/1987

26/1983 Acontecimento independente26/1983 Acontecimento independente

Page 118: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

98

Anexo 2.2 – Diagramas cronológicos de caudal na estação hidrométrica de Couto de Andreiros nos anos hidrológicos de:

a) 1983/1984 e b) 1984/1985.

0

50

100

150

200

250

300

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

26/1983

27/1983

0

50

100

150

200

250

300

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

28/1984

30/1984

29/1984

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

b)

Série de caudais instantâneos Escoamento de base

42/1987

43/1987

26/1983 Acontecimento independente26/1983 Acontecimento independente

Page 119: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

99

Anexo 2.3 – Diagramas cronológicos de caudal na estação hidrométrica de Monforte nos anos hidrológicos de: a)

1985/1986 e b) 1987/1988.

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

b)

Série de caudais instantâneos Escoamento de base

42/1987

43/1987

26/1983 Acontecimento independente26/1983 Acontecimento independente

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800 900 1000

Cau

dal

(m

3/s

)

Tempo (h)

39/1985

40/1985

41/1985

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800 900 1000

Cau

dal

(m

3/s

)

Tempo (h)

43/1987 44/1987

45/1987

46/1987

47/1987

49/198748/1987

39/1985

Page 120: Modelação estatística de caudais e de volumes de cheia em ... · I Modelação estatística de caudais e de volumes de cheia em Portugal Continental: análises convencional e bivariada

100

Anexo 2.4 – Diagramas cronológicos de caudal na estação hidrométrica de Torrão do Alentejo nos anos hidrológicos de:

a) 1971/1972 e b) 1983/1984.

0

20

40

60

80

100

120

140

160

180

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

17/1971

0

20

40

60

80

100

120

140

160

180

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

23/1983

0

20

40

60

80

100

120

140

0 100 200 300 400 500 600 700 800

Cau

dal

(m

3/s

)

Tempo (h)

b)

Série de caudais instantâneos Escoamento de base

42/1987

43/1987

26/1983 Acontecimento independente26/1983 Acontecimento independente17/1971