modelação estatística de caudais e de volumes de cheia em ... · i modelação estatística de...
TRANSCRIPT
I
Modelação estatística de caudais e de volumes de cheia em Portugal
Continental: análises convencional e bivariada
Filipa Leite Rosa
Dissertação para obtenção do Grau de Mestre em
Engenharia Civil
Júri
Presidente: Professor António Jorge Silva Guerreiro Monteiro Orientador: Professora Maria Manuela Portela Correia dos Santos Ramos da Silva Co-orientador: Engenheiro João Filipe Fragoso dos Santos Vogal: Professora Maria Madalena Vitório Moreira Vasconcelos
Outubro 2011
II
III
Agradecimentos
À Engª. Cláudia Brandão e à sua equipa, do Instituto Nacional da Água, pelo seu apoio a este
trabalho, especificamente, no acesso aos dados e no procedimento da recolha dos mesmos.
Quero agradecer à minha orientadora, a Prof. Maria Manuela Portela, pela importante
orientação científica e permanente disponibilidade, mas também por ter sido sempre uma das
maiores fontes de motivação e incentivo, ao mostrar desde o início um forte entusiasmo no
trabalho a desenvolver.
Ao Eng. João Santos, co-orientador deste trabalho, pela orientação científica e palavras de
incentivo.
Ao Prof. João Hipólito pela ajuda prestada no esclarecimento de algumas dúvidas surgidas.
Ao Artur Silva pela ajuda e partilha de conhecimentos e à minha irmã Inês pela paciência na
leitura de alguns excertos deste trabalho. Agradeço-lhes também o apoio, a disponibilidade e a
amizade. Por estes mesmos motivos não posso deixar de prestar um agradecimento especial
ao Pedro Morgado e à Susana Silva, cuja amizade e compreensão contribuíram para a
conclusão deste trabalho.
Ao Rodrigo Vargas, por tudo mas, principalmente, pelo seu companheirismo e confiança em
mim. Sem a sua presença o desenvolver deste trabalho teria sido, seguramente, muito mais
difícil.
Por fim, gostaria de agradecer aos meus pais, a quem dedico este trabalho. Mais do que a
ajuda financeira, quero agradecer-lhes o apoio, a confiança e compreensão. Sei que a
conclusão desta importante etapa lhes trará orgulho, o qual não deverá ser atribuído apenas à
minha pessoa mas a eles próprios também, uma vez que sem eles este documento não
existiria. Por esse facto, muito obrigada também.
IV
V
Resumo
São numerosas as intervenções da Engenharia Civil que requerem a determinação de caudais
de ponta de cheia com dadas probabilidades de ocorrência. Um dos procedimentos mais
utilizados nessa determinação envolve a análise estatística da distribuição de frequências
aplicada a caudais instantâneos máximos anuais. Contudo, é frequente que as amostras de tais
caudais apresentam dimensão reduzida, não possibilitando a inferência estatística. Uma
abordagem que permite obviar tal circunstância utiliza amostras de caudais acima de dados
limiares, com dimensão superior à daquelas outras uma vez que incorporam mais do que uma
realização por ano.
Por outro lado, muitos dos acontecimentos hidrológicos não podem ser caracterizados
plenamente tendo por base apenas uma das variáveis neles envolvidas já que, por regra,
combinam em si o efeito de mais variáveis. É este o caso dos eventos de cheia nos quais, para
além do caudal de ponta, o volume associado a cada cheia constitui uma variável também
importante à qual se pode associar ainda a duração da cheia. Deste modo, o estudo da
distribuição conjunta das variáveis em presença poderá fornecer uma melhor compreensão
das características probabilísticas desses eventos.
Assim, o trabalho de investigação que se apresenta teve como primeiro objectivo a
constituição de modelos de distribuição de frequências a partir de amostras de caudais
instantâneos máximos anuais e de amostras de caudais acima de dados limiares, bem como
das amostras dos volumes correspondentes àqueles caudais. A partir dos resultados assim
alcançados prosseguiu-se com um segundo objectivo, envolvendo a comparação entre
estimativas de caudais e de volumes baseadas em séries de máximos anuais e em séries de
valores acima de limiares. O terceiro objectivo focou-se na obtenção de modelos estatísticos
destinados a caracterizar a distribuição de probabilidade conjunta das variáveis caudal-volume
de cheia, para o que se utilizou uma distribuição estatística bivariada, bem como a teoria das
cópulas.
Palavras-chave: amostras de valores máximos anuais; amostras de valores acima de dados
limiares, análise de frequências de caudais e volumes de cheia; cópulas.
VI
VII
Abstract
The hydrologic design often requires the estimation of peak flood discharges for different
return periods. One of the statistical procedures mostly used for that purpose is the frequency
distribution analysis applied to annual maximum instantaneous discharges. However, the
length of the available samples of such discharges is often too small to validate the statistical
inference. An alternative approach that allows overcoming such circumstance uses samples of
discharges above given thresholds which normally have a longer length as they incorporate
more than one event per year.
At the same time, the majority of the hydrological events cannot be fully characterized based
on only one of the variables involved as, in general, they depend on a diverse set of variables.
This is the case of flood events in which, in addition to the peak discharges, the volumes
associated with such discharges or even the duration of the floods may also be important.
Thus, the study of the joint probability distribution of the variables involved in these events
may provide a better understanding of their probabilistic features.
In the previous context, the primary objective of the research carried out was the
development of models of frequency distribution based on samples of annual maximum
instantaneous discharge and on samples of flow above given thresholds, as well as on the
samples of the corresponding volumes. Consequently, the necessary conditions for the second
objective were achieved, which envisaged the comparison between discharges and volumes
provided, on the one hand, by the samples of annual maximum, and on the other hand, by the
samples above thresholds. The third main objective involved the development of statistical
models to characterize the joint probability distribution of flood discharge-flood volume,
namely applying a joint distribution and the copulas’ theory.
Keywords: samples of annual maximum values; samples of values above given thresholds;
frequency analysis of flood discharges and of flood volumes; copulas.
VIII
IX
Índice de texto
1. Introdução ........................................................................................................................ 1
1.1. Âmbito e enquadramento teórico .............................................................................. 1
1.2. Objectivos ................................................................................................................. 5
1.3. Organização ............................................................................................................... 6
2. Síntese de conhecimentos ................................................................................................. 9
2.1. Introdução ................................................................................................................. 9
2.2. Séries de máximos anuais e séries de valores acima de um limiar ............................ 10
2.3. Modelos de distribuição de frequências ................................................................... 12
2.3.1. Considerações prévias ...................................................................................... 12
2.3.2. Distribuição Normal ......................................................................................... 13
2.3.3. Distribuição log-Normal ................................................................................... 14
2.3.4. Distribuição de Pearson tipo III ......................................................................... 15
2.3.5. Distribuição log-Pearson tipo III........................................................................ 16
2.3.6. Distribuição de Gumbel .................................................................................... 16
2.3.7. Distribuição de Goodrich .................................................................................. 17
2.4. Análise de frequências pelo método do factor de probabilidade .............................. 18
2.4.1. Conceito geral .................................................................................................. 18
2.4.2. Distribuição Normal ......................................................................................... 19
2.4.3. Distribuição de Gumbel .................................................................................... 20
2.4.4. Distribuição de Pearson tipo III ......................................................................... 20
2.4.5. Distribuição de Goodrich .................................................................................. 20
2.5. Ajustamento de leis teóricas .................................................................................... 21
2.5.1. Considerações prévias ...................................................................................... 21
2.5.2. Ajustamento visual .......................................................................................... 22
2.5.3. Testes de aderência: Qui-Quadrado e Kolmogorov-Smirnov ............................. 23
2.5.4. Outras medidas de avaliação do ajustamento .................................................. 27
2.6. Teoria das cópulas ................................................................................................... 28
2.6.1. Análise multivariada......................................................................................... 28
2.6.2. Funções cópula ................................................................................................ 31
2.6.3. Coeficiente de Kendall ..................................................................................... 33
2.6.4. Selecção da função cópula ............................................................................... 34
X
3. Dados de base ................................................................................................................. 37
3.1. Dados disponíveis .................................................................................................... 37
3.2. Recolha e tratamento de dados ............................................................................... 38
4. Apresentação e análise de resultados .............................................................................. 49
4.2. Aplicação dos modelos de distribuição de frequências ............................................. 49
4.2.1. Considerações prévias ...................................................................................... 49
4.2.2. Estação hidrométrica de Albernoa ................................................................... 50
4.2.3. Estação hidrométrica de Couto de Andreiros ................................................... 53
4.2.4. Estação hidrométrica de Monforte ................................................................... 55
4.2.5. Estação hidrométrica de Torrão do Alentejo .................................................... 58
4.2.6. Resumo de resultados ...................................................................................... 61
4.3. Comparação entre os resultados baseados em séries de valores acima de um limiar e
séries de valores máximos anuais ........................................................................................ 62
4.4. Relações entre estimativas de caudal de cheia e de volume associado ..................... 67
4.5. Resultados da aplicação da teoria das cópulas e da lei bivariada de Gumbel ............ 68
4.5.1. Considerações prévias ...................................................................................... 68
4.5.2. Aplicação e selecção das funções cópula e da lei bivariada de Gumbel ............. 70
4.5.3. Probabilidade conjunta – apresentação de superfícies ..................................... 74
5. Conclusões ...................................................................................................................... 79
Referências bibliográficas ....................................................................................................... 85
Anexos .................................................................................................................................... 89
XI
Índice de figuras
Figura 2.1 – Figura ilustrativa do processo de selecção de cheias independentes. ................... 11
Figura 3.1 – Figura ilustrativa do processo de selecção de cheias independentes. ................... 41
Figura 4.1 - Estação hidrométrica de Albernoa. Ajustamento visual de leis estatísticas às
amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ............................ 50
Figura 4.2 – Estação hidrométrica de Couto de Andreiros. Ajustamento visual de leis
estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ...... 53
Figura 4.3 – Estação hidrométrica de Monforte. Ajustamento visual de leis estatísticas às
amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ............................ 56
Figura 4.4 – Estação hidrométrica de Torrão do Alentejo. Ajustamento visual de leis estatísticas
às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma. ........................ 59
Figura 4.5 – Estação hidrométrica de Albernoa: relação entre estimativas de caudal (à
esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta
representativos da regressão linear e respectivos coeficientes de determinação, R2. .............. 64
Figura 4.6 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal
(à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta
representativos da regressão linear e respectivos coeficientes de determinação, R2. .............. 64
Figura 4.7 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal
(à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta
representativos da regressão linear e respectivos coeficientes de determinação, R2. .............. 64
Figura 4.8 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.
Relação entre estimativas de caudal específico de cheia (à esquerda) e de volume específico de
cheia (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos das
regressões lineares e respectivos coeficientes de determinação, R2. ....................................... 67
XII
Figura 4.9 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.
Relação entre estimativas de valores específicos do caudal de cheia e de volume de cheia com
o mesmo período de retorno fornecidas pelo método I (à esquerda) e pelo método II (à
direita). Segmentos de recta representativos das regressões lineares e respectivos coeficientes
de determinação, R2................................................................................................................ 68
Figura 4.10 – Estação hidrométrica de Albernoa. Caudais de cheia acima de limiar e
correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel
e d) bivariada de Gumbel. ....................................................................................................... 71
Figura 4.11 – Estação hidrométrica de Couto de Andreiros. Caudais de cheia acima de limiar e
correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel
e d) bivariada de Gumbel. ....................................................................................................... 72
Figura 4.12 – Estação hidrométrica de Torrão do Alentejo. Caudais de cheia acima de limiar e
correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel
e d) bivariada de Gumbel. ....................................................................................................... 72
Figura 4.13 – Superfícies da distribuição de probabilidade conjunta de caudal e volume nas
estações hidrométricas de: a) Albernoa; b) Couto de Andreiros e c) Torrão do Alentejo. ......... 75
Figura 4.14 – Curvas de igual probabilidade conjunta. a) Estação hidrométrica de Albernoa –
cópula de Frank; b) Estação hidrométrica de Couto de Andreiros – cópula de Clayton; c)
Estação hidrométrica de Torrão do Alentejo – cópula de Clayton. ........................................... 76
Figura 4.15 – Curvas de probabilidade conjunta de caudal acima de limiar e volume com
probabilidade de não-excedência de 0,25, 0,50 e 0,75 para as variáveis de: a) Estação
hidrométrica de Albernoa – cópula de Frank; b) Estação hidrométrica de Couto de Andreiros –
cópulas de Clayton; c) Estação hidrométrica de Torrão do Alentejo – cópula de Clayton. ........ 77
XIII
Índice de quadros
Quadro 2.1 - Valores da função de probabilidades acumuladas da distribuição de de χ2, para
diferentes graus de liberdade.................................................................................................. 25
Quadro 2.2 - Partições do domínio da distribuição cumulativa de frequências, utilizadas na
aplicação do teste do Qui-Quadrado (adaptado de HENRIQUES, 1990). .................................. 25
Quadro 2.3 - Valores críticos da estatística do teste DN,α de aderência de Kolmogorov-Smirnov.
............................................................................................................................................... 27
Quadro 3.1 – Quadro resumo das características das estações hidrométricas. ........................ 38
Quadro 3.2 – Cálculo do caudal modular e do caudal correspondente ao limiar de cheia. ....... 39
Quadro 3.3 – Escoamentos anuais em cada estação hidrométrica considerada. ...................... 40
Quadro 3.4 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica
de Albernoa. ........................................................................................................................... 45
Quadro 3.5 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica
de Couto de Andreiros. ........................................................................................................... 46
Quadro 3.6 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica
de Monforte. .......................................................................................................................... 47
Quadro 3.7 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica
de Torrão do Alentejo. ............................................................................................................ 48
Quadro 4.1 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste do qui-
quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%. ............. 51
Quadro 4.2 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste de
Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de
95%. ....................................................................................................................................... 51
Quadro 4.3 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro
às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados
por meio de células com preenchimento de cor cinzenta). ...................................................... 52
XIV
Quadro 4.4 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste do
qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%........ 54
Quadro 4.5 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste de
Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de
95%. ....................................................................................................................................... 54
Quadro 4.6 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro
às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados
por meio de células com preenchimento de cor cinzenta). ...................................................... 55
Quadro 4.7 – Estação hidrométrica de Monforte. Resultados da aplicação do teste do qui-
quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%. ............. 57
Quadro 4.8 – Estação hidrométrica de Monforte. Resultados da aplicação do teste de
Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de
95%. ....................................................................................................................................... 57
Quadro 4.9 – Estação hidrométrica de Monforte. Resultados da aplicação das medidas de erro
às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados
por meio de células com preenchimento de cor cinzenta). ...................................................... 58
Quadro 4.10 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste
do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%. .. 59
Quadro 4.11 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste
de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de
95%. ....................................................................................................................................... 60
Quadro 4.12 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação das
medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados
estão assinalados por meio de células com preenchimento de cor cinzenta). .......................... 60
Quadro 4.13 – Identificação das leis estatísticas seleccionadas para caracterizar cada variável
aleatória. Valores dos parâmetros estatísticos de cada distribuição. ....................................... 62
Quadro 4.14 – Estação hidrométrica de Albernoa. Comparação entre estimativas de caudal e
de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de
valores acima de limiares (método II). Coeficientes de determinação, R2. ............................... 65
XV
Quadro 4.15 – Estação hidrométrica de Couto de Andreiros. Comparação entre estimativas de
caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em
séries de valores acima de limiares (método II). Coeficientes de determinação, R2. ................. 65
Quadro 4.16 – Estação hidrométrica de Torrão do Alentejo. Comparação entre estimativas de
caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em
séries de valores acima de limiares (método II). Coeficientes de determinação, R2. ................. 65
Quadro 4.17 - Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.
Coeficientes de correlação de Pearson entre caudais instantâneos máximos anuais e
correspondentes volumes de cheia e entre caudais acima de limiares e correspondentes
volumes de cheia. ................................................................................................................... 69
Quadro 4.18 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.
Valores do coeficiente de correlação de Pearson, ; do parâmetro m da lei bivariada de
Gumbel; do coeficiente de Kendall, ; e dos parâmetros θ das funções cópula Clayton, θClayton,
Frank, θFrank, e Gumbel-Hougaard, θGumbel................................................................................. 70
Quadro 4.19 – Resultados obtidos da aplicação do teste de Kolmogorov-Smirnov às amostras
de caudais acima de limiares e dos correspondentes volumes de cheia. Nível de confiança de
95%. (nota: os menores valores da estatística do teste estão assinalados por meio de células
com preenchimento de cor cinzenta). ..................................................................................... 73
Quadro 4.20 – Desvio quadrático médio entre os valores das probabilidades conjuntas teóricas
e empíricas das amostras de caudais acima de limiares e dos correspondentes volumes de
cheia (nota: os menores valores de desvio quadrático médio estão assinalados por meio de
células com preenchimento de cor cinzenta)........................................................................... 73
Quadro 4.21 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo.
Funções cópula adoptadas para caracterizar a probabilidade conjunta do caudal acima de
limiar e do correspondente volume. Parâmetros das funções, θ.............................................. 74
XVI
XVII
Simbologia e abreviaturas
Alfabeto romano
Símbolo Definição
A - parâmetro da equação (2.30) determinado através da equação (2.32)
Aj - amplitude do intervalo j
B - parâmetro da equação (2.30) determinado através da equação (2.31)
C - função de dependência ou cópula
CV - coeficiente de variação
D1 - função de Debye de primeira ordem
Ej - valor esperado do número de elementos no intervalo j
F - probabilidade de não-excedência
F’ - probabilidade de não-excedência de um elemento de série de valores
acima de limiar
FX - função distribuição de probabilidade da variável X
fX - função densidade de probabilidade da variável X
FX,Y - função de distribuição de probabilidade conjunta das variáveis aleatórias X e Y
H0 - hipótese nula do teste de Qui-Quadrado χ2 e de Kolmogorov-Smirnov
i - número de ordem de um elemento da amostra
K - factor de frequência
k - parâmetro da equação 2.29
KT - factor de frequência associado ao período de retorno T
m - número de parâmetros estimados a partir da amostra
m - parâmetro da função bivariada de Gumbel
M - número de partições do domínio da função de distribuição de
probabilidade F(X) no teste de Qui-Quadrado χ2
N - dimensão da amostra
NP - número de ordem sequencial de cada par de elementos da amostra
Oj - número de elementos da amostra contidos no intervalo j
Q - caudal de ponta de cheia
Q acima limiar - amostras de caudais de ponta de cheia acima de um dado limiar
Q ima - amostras de caudais instantâneos máximos anuais
T - período de retorno
XVIII
V - volume de cheia
V acima limiar - amostras dos volumes de cheia associados aos caudais de ponta de cheia
acima de um dado limiar
V ma - amostras dos volumes de cheia associados aos caudais instantâneos
máximos anuais
X - variável aleatória
x - elemento genérico da variável aleatória X
xi - elemento de ordem i da amostra da variável X
x - média da amostra da variável X
ix̂ - estimativa teórica do valor de ordem i da variável X
Y - variável aleatória
y - elemento genérico da variável aleatória Y
yi - elemento de ordem i da amostra da variável Y
y - média da amostra da variável Y
z - variável Normal reduzida
Alfabeto grego
Símbolo Definição
α - parâmetro de posição
α - nível de significância
β - parâmetro de escala
Γ - função Gama
δ - constante de Euler-Mascheroni
θ - parâmetro de forma
θC - parâmetro da cópula de Clayton
θF - parâmetro da cópula de Frank
θG - parâmetro da cópula de Gumbel-Hougaard
λ - número médio de acontecimentos independentes por ano
μ - média da distribuição
μX - média da amostra da variável X
μY - média da amostra da variável Y
ρ - coeficiente de Pearson
σ - desvio-padrão da distribuição
XIX
σX - desvio-padrão da amostra da variável X
σY - desvio-padrão da amostra da variável Y
τ - coeficiente de Kendall
ϕ - função geradora da cópula
χ2 - estatística do teste de Qui-Quadrado
- coeficiente de assimetria da distribuição
Abreviaturas
EH - Estação Hidrométrica
INAG - Instituto Nacional da Água
SNIRH - Sistema Nacional de Informação de Recursos Hídricos
XX
1
1. Introdução
1.1. Âmbito e enquadramento teórico
Em Portugal Continental as cheias constituem um problema recorrente, devido às especificidades do
clima e da fisiografia do País, associadas às características da ocupação do território, amplamente
mobilizadora dos leitos de cheia. Para fazer face a esse problema podem ser adoptadas medidas
estruturais, tais como a utilização da capacidade de armazenamento em albufeiras para amortecer
os hidrogramas de cheia, a construção de estruturas hidráulicas para a protecção de zonas
residenciais ou de vias de comunicação ou a construção de diques marginais e de outras obras de
regularização (NUNES CORREIA, 1983). No desenvolvimento de projectos desta natureza, sejam
estruturas para aproveitamento e controlo dos recursos hídricos, sejam medidas de protecção contra
fenómenos hidrológicos potencialmente destrutivos, é crucial a análise e a caracterização das
variáveis neles envolvidas. Por exemplo, para dimensionar o volume de armazenamento numa
albufeira requerido pelo amortecimento de cheias pode ser importante estudar os caudais diários ou
relativos a períodos superiores a um dia, enquanto para dimensionar o descarregador de superfície
da albufeira, não havendo amortecimento, importa analisar os máximos caudais instantâneos, num e
noutro caso, obviamente para um dado critério de projecto, por regra, expresso em termos de
período de retorno. Para quantificar os prejuízos decorrentes da interrupção de uma via de
comunicação por submersão pode ser necessário caracterizar os intervalos de tempo durante os
quais se espera que o caudal permaneça superior ao conducente àquela submersão. Noutros casos,
pode interessar a caracterização da forma do hidrograma de cheia, do volume de cheia, das áreas
inundadas ou de outras características ditadas pelos objectivos do estudo e pela disponibilidade dos
dados (NUNES CORREIA, 1983).
O objectivo mais comum da aplicação de métodos estatísticos no estudo das cheias é o de avaliar o
caudal numa dada secção de um rio com dada probabilidade de ser excedido num ano ou, de modo
equivalente, associado a determinado período de retorno (QUINTELA, 1996). Um dos processos
estatísticos mais utilizados para o efeito é o da análise da distribuição de frequências.
Vários autores aplicaram esse tipo de análise. Especificamente para Portugal, NUNES CORREIA, 1983,
desenvolveu modelos estatísticos para estimar caudais médios diários máximos anuais com base em
amostras recolhidas em estações hidrométricas, propositadamente, dispersas pelo território
nacional, de forma a tornar possível uma caracterização da adequabilidade das técnicas propostas a
todo o País. Para além dos modelos mais convencionais baseados em séries de máximos anuais, para
os quais testou a distribuição Gumbel, log-Gumbel, log-Normal, Pearson tipo III, log-Pearson tipo III e
2
Generalizada de Extremos, construiu ainda um modelo baseado em séries de duração parcial, para o
que foram testadas as leis de Poisson e a Exponencial na caracterização do número médio de
excedências anuais. Desse trabalho, o autor concluiu que, em geral, a distribuição de Pearson tipo III
constitui o melhor modelo de distribuição de frequências a aplicar às séries de caudais médios
diários máximos anuais, seguida, por ordem de preferência, pelas distribuições de Gumbel e
log-Pearson III.
De forma equivalente, HENRIQUES, 1981 e 1990, realizou estudos de comparação entre diferentes
modelos estatísticos, com o objectivo de seleccionar o mais adequado à análise de distribuição de
frequências de caudais instantâneos máximos anuais, também em Portugal. No conjunto dos dois
trabalhos do autor em menção, foram testadas as seguintes distribuições: Pearson tipo III,
log-Pearson tipo III, Fisher-Tippett Generalizada, Fisher-Tippett tipo I, log-Normal de três parâmetros,
log-Normal de dois parâmetros, Extremos tipo I e Generalizada de Extremos. Desses trabalhos, o
autor concluiu que existe uma clara superioridade dos modelos baseados em distribuições de três
parâmetros relativamente aos modelos baseados em distribuições de dois parâmetros. As
distribuições que apresentaram melhores comportamentos foram a Generalizada de Extremos, a de
Pearson tipo III, a log-Normal de três parâmetros e a Fisher-Tippett Generalizada.
SILVA DIAS, 2003, atendendo aos resultados obtidos pelos dois autores antes referidos, aplicou
directamente as distribuições de Pearson tipo III e Generalizada de Extremos a séries de caudais
médios diários máximos anuais e de caudais instantâneos máximos anuais num grande número de
estações hidrométricas de Portugal Continental com o objectivo de desenvolver modelos regionais
para estimar caudais de ponta de cheia. A conclusão da análise que efectuou vai de encontro aos
estudos daqueles dois autores, ou seja, globalmente, ambas as leis se revelaram adequadas à
modelação da distribuição de frequências da maior parte das séries de caudais.
Contudo, relativamente a obras hidráulicas, sobretudo, visando o controlo e amortecimento de
cheias, não é suficiente possuir informação apenas referente ao caudal de ponta de cheia: com
efeito, pode importar associar a esse caudal um volume de cheia com dada probabilidade de
excedência e, eventualmente, a própria duração dessa cheia. Deste modo, é necessária uma análise
multivariada das variáveis determinantes dos hidrogramas de cheia, nomeadamente, através de
funções de distribuição conjunta.
Nos últimos anos, foram introduzidas algumas abordagens multivariadas por diversos investigadores.
No início, o modelo mais utilizado foi o da distribuição de probabilidade conjunta Gaussiana ou
Normal. É um modelo de fácil aplicação mas que tem a óbvia desvantagem de implicar que as
distribuições marginais das variáveis em presença tenham de ser normais. Esta condição pode ser
3
alcançada através da transformação dos dados de base de modo a torná-los compatíveis com o
pressuposto de normalidade. No entanto, essas transformações nem sempre garantem que se
alcance aquele pressuposto sendo que podem resultar em distorções significativas das propriedades
da amostra, designadamente, quando se procede à inversão da transformação de modo a retomar
ao campo da variável original (GRIMALDI e SERINALDI, 2005). Em consequência, outras distribuições
bivariadas com distribuições marginais não-normais foram objecto de estudo. As publicações de
KARMAKAR e SIMONOVIC, 2009, e ZHANG e SINGH, 2006, contêm breves sínteses dos trabalhos
desenvolvidos sobre o tema, destacando-se, de tais trabalhos, os seguintes: (a) KRSTANOVIC e
SINGH, 1987, que adoptaram as distribuições multivariada gaussiana e exponencial para descrever a
distribuição conjunta de caudais de ponta e volumes de cheia, no pressuposto de tais variáveis
apresentarem a mesma distribuição de probabilidade marginal; (b) YUE et al., 1999, que utilizaram a
distribuição bivariada de Gumbel para descrever acontecimentos de cheia combinando as variáveis
caudal de ponta-volume e volume-duração da cheia, no pressuposto de aplicabilidade da lei de
Gumbel a qualquer uma daquelas três variáveis; (c) SINGH e SINGH, 1991, que deduziram uma
função densidade de probabilidade bivariada utilizando a lei exponencial para as distribuições
marginais das variáveis intensidade e altura de precipitação.
No entanto, a generalidade dos anteriores modelos evidenciou algumas limitações, destacando-se as
seguintes: (i) todas as distribuições marginais univariadas têm que pertencer a uma mesma família,
apesar de as variáveis analisadas poderem sugerir diferentes distribuições marginais; (ii) as variáveis
têm de apresentar uma distribuição conjunta conhecida; (iii) as variáveis têm de ser independentes;
(iv) a formulação matemática torna-se complicada quando se aumenta o número de variáveis; e
(v) não é possível distinguir o comportamento marginal e conjunto das variáveis analisadas (ZHANG e
SINGH, 2006, e GRIMALDI e SERINALDI, 2005).
Deste modo, muito recentemente, foram realizados vários estudos com o intuito de identificar novos
modelos ou formas de os construir que superem os anteriores inconvenientes. Os trabalhos mais
promissores são os que envolvem a teoria das cópulas. As cópulas são funções amplamente
estudadas e aplicadas noutros âmbitos, sobretudo no financeiro, mas em Hidrologia, as aplicações
deste tipo de funções são muito recentes e relativamente esparsas e reduzidas. Em Portugal, à data
de realização deste trabalho, não se conhecem estudos na área da Hidrologia que utilizem a teoria
das cópulas.
De um modo muito directo, a grande vantagem na utilização das funções cópula é a de não possuir
nenhuma das cinco limitações antes apontadas para os modelos mais tradicionais. Aquele tipo de
funções permite fornecer uma expressão analítica para qualquer distribuição de probabilidade
4
conjunta de duas ou mais variáveis, baseada exclusivamente em conceitos de dependência entre as
mesmas, e, portanto, completamente independente das distribuições de probabilidade marginais de
cada uma dessas variáveis. Dependendo do tipo de cópula seleccionado, a formulação matemática é
consideravelmente mais simples, sobretudo quando se pretende modelar um evento hidrológico
com base em mais de duas variáveis.
Como mencionado, julga-se que os autores que aplicaram a teoria das cópulas na área da Hidrologia
são em número muito reduzido. Ainda assim, com a síntese que se segue, pretende apresentar-se
um breve resumo (organizado por ordem cronológica) de alguns dos trabalhos desenvolvidos sobre
essa matéria e que foram, entre outros, a base principal, no que respeita à teoria das cópulas, da
metodologia aplicada na dissertação de mestrado que se apresenta:
- FAVRE, et al., 2003, aplicaram as cópulas de Frank, Clayton e Farlie-Gumbel-Morgenstern para
descrever a dependência entre o caudal de ponta e o volume de cheia, utilizando como
distribuições marginais a leis Gama e de Gumbel;
- DE MICHELE e SALVADORI, 2004, apresentaram uma síntese teórica sobre os conceitos e
propriedades envolvidos na teoria das cópulas. Examinaram também a relação entre o período de
retorno univariado e bivariado, utilizando cópulas arquimedianas, apresentaram expressões
analíticas para a determinação de isolinhas de período de retorno e abordaram o tema dos
períodos de retorno condicionais. Aplicaram ainda esses conceitos a quatro casos de estudo,
utilizando como variáveis hidrológicas o volume de cheia, o caudal de ponta, a intensidade de
precipitação e a duração de precipitação;
- GRIMALDI e SERINALDI, 2005, analisaram também as variáveis caudal de ponta, volume de cheia e
duração da cheia, através das distribuições de probabilidade marginal de Frechet, Gama e
log-Normal, respectivamente. Obtiveram um modelo multivariado da distribuição conjunta das
três variáveis, utilizando cópulas arquimedianas, e apresentaram uma análise comparativa com o
modelo multivariado de Gumbel;
- DE MICHELE, et al, 2005, com o intuito de verificar a adequação do dimensionamento de
descarregadores de cheias em barragens, delinearam um modelo bivariado, utilizando a cópula
de Gumbel, para descrever a dependência entre as variáveis caudal de ponta e volume de cheia. A
distribuição Generalizada de Extremos foi adoptada para ambas as distribuições marginais de
probabilidade. O modelo construído forneceu estimativas para os valores das variáveis referidas
e, assim, permitiu criar hidrogramas sintéticos, que foram utilizados para simular o
funcionamento dos descarregadores.
5
- ZHANG e SINGH, 2006, aplicaram as cópulas arquimedianas de Frank, Gumbel-Hougaard e Cook-
Johnson, na modelação bivariada das distribuições de probabilidade conjunta e condicional das
variáveis intensidade, altura e duração de precipitação, descritas pelas distribuições de
probabilidade marginal de Weibull, Gama e Exponencial. Os autores realizaram ainda uma análise
comparativa entre resultados fornecidos pelos modelos baseados em cópulas e pela distribuição
Normal bivariada;
- KARMAKAR e SIMONOVIC, 2009, aplicaram as cópulas de Ali-Mikhail-Haq, Cook-Johnson (ou
Clayton) e Gumbel-Hougaard na modelação da distribuição de probabilidade conjunta e de
probabilidade condicional das variáveis caudal de ponta, volume de cheia e duração, mas sempre
no caso bivariado.
De uma forma geral, as conclusões apresentadas pelos anteriores autores não diferem muito entre
si. Seguidamente resumem-se, de entre essas conclusões, as que se afiguraram mais pertinentes:
(i) é possível descrever analiticamente a distribuição de probabilidade conjunta de variáveis
hidrológicas com recurso a funções cópula; (ii) as comparações efectuadas entre modelos bivariados
baseados em cópulas e a distribuição bivariada Normal mostram que os primeiros possuem um
melhor ajustamento aos dados observados; (iii) diferentes escolhas nas distribuições de
probabilidade marginais implicam resultados significativamente diferentes nas estimativas fornecidas
pelos modelos, baseados na teoria das cópulas, de distribuição de probabilidade conjunta e
condicional, o que reforça a importância de uma correcta descrição isolada de cada uma das
variáveis intervenientes no estudo conjunto; (iv) é possível, em determinados casos, deduzir
expressões analíticas para isolinhas de período de retorno; (v) a utilização das funções cópulas
implica uma maior simplicidade nos cálculos, especialmente, quando se modelam mais do que duas
variáveis.
1.2. Objectivos
Em termos globais, o estudo que apresenta insere-se no âmbito da análise de cheias em Portugal
Continental. Assim, numa primeira parte, procedeu-se à aplicação da análise de distribuição de
frequências à caracterização de cheias, embora estritamente recorrendo a moldes tradicionais
(análise univariada). Para o efeito e tendo por base diferentes casos de estudos, consubstanciados
por quatro estações hidrométricas com registos adequados ao propósito em vista
(fundamentalmente estações hidrométricas dispondo de hidrogramas de cheia), foram analisados
quatro tipos de variáveis hidrológicas, a saber, caudais instantâneos máximos anuais (Q ima),
6
volumes de cheia associados a esses caudais (V ma), caudais acima de determinados limiares
(Q acima limiar) e volumes de cheia correspondentes a esses caudais (V acima limiar). O objectivo
principal foi o de identificar as distribuições de probabilidade que melhor se ajustam aos registos
considerados e que, dessa forma, se consideram melhor representar as variáveis em questão.
Seleccionados os modelos, será, então, possível fornecer estimativas de caudais e de volumes de
cheia, com determinados períodos de retorno.
Ainda no âmbito da análise univariada, destaca-se o esforço efectuado no sentido de estender a
análise a diferentes amostras de caudais e de volumes de cheia. Com tal esforço pretendeu-se
assegurar o segundo objectivo que visou a comparação e a avaliação da qualidade das estimativas
obtidas através dos modelos baseados em amostra de valores, por um lado, máximos anuais e, por
outro lado, acima de dados limiares. Desta forma, não se analisou simplesmente o ajustamento de
diferentes leis teóricas a dados amostrais, mas também se avaliou o efeito do tipo desses dados na
construção dos modelos estatísticos e nos resultados obtidos.
Na segunda parte do trabalho procedeu-se à aplicação da análise bivariada a pares de valores
(máximos anuais e acima de limiares) caudal/volume de cheia. Face à menor experiência que se
concluiu existir em Portugal, o objectivo fundamental desta segunda parte foi o de verificar a
aplicação ao caso português de técnicas recentemente desenvolvidas, designadamente da teoria das
cópulas, para a modelação de distribuições de probabilidade conjunta de variáveis hidrológicas
associadas a cheias.
1.3. Organização
Para além do presente capítulo introdutório, o trabalho foi organizado em mais quatro capítulos.
Assim, o capítulo 2 contém uma síntese de conhecimentos abrangendo modelos de distribuição de
frequências, metodologias de ajustamento das leis teóricas e conceitos e fórmulas inerentes à
aplicação da teoria das cópulas.
No capítulo 3 identificam-se os dados hidrométricos que sustentaram a análise, nomeadamente,
registos de altura hidrométrica e/ou de caudais instantâneos nas seguintes quatro estações
hidrométricas, localizadas em Portugal Continental: Albernoa, Couto de Andreiros, Monforte e
Torrão do Alentejo. Descreve-se também a metodologia aplicada no tratamento desses dados, de
forma a obter as amostras necessárias ao estudo em vista, designadamente, amostra de caudais
instantâneos máximos anuais e acima de dados limiares e amostras dos volumes de cheia associados
a esses caudais.
7
No capítulo 4 apresentam-se os resultados decorrentes das análises univariada (distribuição de
frequências) e bivariada (teoria das cópulas). Comparam-se ainda os resultados fornecidos pelo
estudo de amostras de máximos anuais com os associados a amostras acima de limiares. O capítulo
inclui a apresentação das conclusões sugeridas pelos resultados alcançados.
A finalizar, sistematizam-se, no capítulo 5, as conclusões gerais da análise efectuada e sugerem-se
alguns temas que se afiguraram com maior interesse relativamente a aplicações subsequentes à
Hidrologia da teoria das cópulas.
8
9
2. Síntese de conhecimentos
2.1. Introdução
A estimação de caudais de ponta de cheia associados a determinados períodos de retorno é, como já
se afirmou, um requisito frequente em projectos de diversa espécie, nomeadamente, inseridos no
âmbito da Engenharia Hidráulica. Um dos processos aplicado com vista a essa estimação utiliza a
análise da distribuição de frequências de caudais de cheia através de procedimentos estatísticos.
A análise da distribuição de frequências de caudais de cheia visa determinar a probabilidade de um
dado valor do caudal de cheia numa secção de um curso de água ser excedido durante um intervalo
de tempo especificado e, inversamente, determinar a estimativa do caudal de cheia associada a um
dado risco, isto é, o valor do caudal de cheia que é excedido com uma dada probabilidade durante
um certo intervalo de tempo. Normalmente o intervalo de tempo é o ano. O inverso da
probabilidade de o caudal de cheia ser excedido durante um ano é designado, em Hidrologia, por
período de retorno e é expresso em anos. Ao período de retorno está, normalmente, associado o
conceito de risco de ocorrência de cheias (HENRIQUES, 1990).
O anterior tipo de análise pressupõe a existência de uma amostra de registos de caudais
instantâneos máximos anuais, por exemplo, recolhida numa estação hidrométrica à qual é ajustado
um modelo estatístico que permite caracterizar, em termos de distribuição de frequências e de
quantis, os caudais de cheia expectáveis nessa secção da rede hidrográfica.
No entanto, muitos dos acontecimentos hidrológicos não podem ser caracterizados plenamente
tendo apenas por base uma das variáveis neles envolvidas já que, por regra, dependem de um
diverso conjunto de variáveis. É este o caso dos eventos de cheia nos quais, para além do caudal de
ponta, o volume associado a cada cheia constitui uma variável também importante, nomeadamente,
quando está em causa um problema de amortecimento de ondas de cheia em albufeiras. Assim, se
um acontecimento hidrológico é multivariado, ou seja, descrito por um conjunto de variáveis
aleatórias correlacionadas, a análise de frequências de apenas uma dessas variáveis fornecerá uma
avaliação incompleta da probabilidade de ocorrência. Uma melhor compreensão das características
probabilísticas desses eventos exige o estudo da distribuição conjunta das variáveis neles
intervenientes.
Os eventos multivariados e o exercício da sua modelação foram objecto de vários estudos por parte
de inúmeros investigadores ao longo dos últimos anos, sendo que se incluiu no capítulo 1 uma breve
síntese desses estudos. Nesse capítulo, evidenciou-se que, em geral, as soluções apresentadas se
10
baseiam em dois pressupostos: as variáveis aleatórias que constituem determinado acontecimento
seguem a mesma lei de probabilidades e a distribuição conjunta dessas variáveis é conhecida, sendo
que as distribuições mais utilizadas em Hidrologia são a Normal, a de Gumbel e a Exponencial
(ZHANG e SINGH, 2006). No entanto, facilmente se compreende que a assumpção de tais
pressupostos pode, com elevada probabilidade, constituir um erro na modelação dos eventos
hidrológicos em causa, uma vez que as variáveis hidrológicas não seguem, em geral, a mesma
distribuição de probabilidade e a distribuição conjunta não é conhecida. Para colmatar tal deficiência
na caracterização de eventos multivariados, nos últimos anos, têm sido desenvolvidos estudos que
permitem construir modelos sem recurso a pressupostos do tipo enunciado e que têm por base a
teoria das cópulas.
As cópulas, nas utilizações em causa, podem ser entendidas como funções que permitem estabelecer
a distribuição conjunta de probabilidades associada a um evento hidrológico, caracterizado por mais
de uma variável. A sua construção baseia-se apenas em parâmetros que traduzem a dependência
entre as anteriores variáveis hidrológicas sendo independentes das distribuições marginais das
variáveis.
O presente capítulo compreende uma síntese de conhecimentos no âmbito da análise da distribuição
de frequências de caudais e de volumes de cheia (pontos 2.3 e 2.4) e da análise multivariada e da
teoria das cópulas (ponto 2.6), bem como uma importante referência aos conceitos e diferenças
existentes entre séries de máximos anuais e séries de valores acima de um limiar (ponto 2.2). No
ponto 2.5 são ainda apresentados os diferentes métodos aplicados de avaliação da qualidade do
ajustamento das distribuições estatísticas às amostras a analisar.
2.2. Séries de máximos anuais e séries de valores acima de um limiar
Os procedimentos de análise estatística e da teoria das cópulas, descritos de seguida, foram
aplicados a séries de máximos anuais, concretamente, de caudais instantâneos máximos anuais, mas
também a séries de caudais acima de um limiar. A principal crítica à utilização de séries de máximos
anuais em detrimento do uso de séries de caudal acima de limiar está relacionada com o facto de,
nas primeiras, se considerar somente o maior evento de cada ano hidrológico, não se tendo em
conta o segundo, o terceiro, etc., maiores eventos que, contudo, podem ser superiores aos máximos
eventos de outros anos. Segundo HENRIQUES (1990, p.17), a incerteza da estimação efectuada com
base em modelos de séries de caudais instantâneos acima de um limiar é menor para pequenos
períodos de retorno, principalmente no caso de amostras de reduzida dimensão. Contudo, um dos
11
aspectos negativos dos modelos baseados em séries de valores acima de um limiar é a fixação desse
limite, que constitui, em regra, um factor arbitrário (HENRIQUES, 1990, p. 328).
No caso específico das aplicações efectuadas, a construção das séries de caudal acima de um dado
limiar em cada uma das estações hidrométricas analisadas requereu a digitalização de limnigramas aí
registados, a partir dos quais se seleccionaram todas as cheias com caudais de ponta superiores a 5
vezes o módulo, desde que prefigurassem cheias independentes. O limiar do quíntuplo do módulo foi
seleccionado por alguns autores considerarem tal limiar como indicativo da ocorrência de uma cheia
(QUINTELA, 1996, p. 10.1). Tendo por base as anteriores cheias, admitiu-se que um dado hidrograma
de cheia, apresentando um ou mais picos relativos, separado do próximo hidrograma por um período
de recessão suficientemente longo, de modo a garantir a anulação do escoamento directo,
constituiria um acontecimento de cheia independente. A cada um desses acontecimentos foi
atribuído o maior caudal de ponta do hidrograma que o constitui, bem como um dado volume de
cheia, conforme se retomará oportunamente. A figura que se segue exemplifica o processo de
selecção, onde são identificados três acontecimentos independentes.
Figura 2.1 – Figura ilustrativa do processo de selecção de cheias independentes.
Para cada uma das cheias seleccionadas, especificou-se ainda o correspondente volume, sendo que
as amostras de volume assim constituídas foram também objecto de tratamento estatístico, quer por
aplicação dos procedimentos tradicionais da análise estatística, quer por recurso à teoria das
cópulas.
0
20
40
60
80
100
120
140
0 50 100 150 200 250 300 350 400
Cau
dal
(m
3/s
)
Tempo (h)
Série de caudais instantâneos Limiar = quíntuplo do módulo Cheia independente
1 2 3
1
12
No tratamento estatístico de séries acima de dados limiares é necessário proceder à correcção do
período de retorno para atender ao facto de se ter mais de um acontecimento por ano. Para tanto,
se λ designar o número médio de acontecimentos independentes por ano, o período de retorno, T,
expresso em anos, é dado aproximadamente por:
1
1 'T
F
(2.1)
em que F´ é a probabilidade de não-excedência associada a uma dada cheia avaliada a partir da série
acima de um limiar (NAGHETTINI e PINTO, 2007, p. 340).
2.3. Modelos de distribuição de frequências
2.3.1. Considerações prévias
A aplicação de um modelo de distribuição de frequências a uma amostra de uma variável aleatória,
como seja a amostra de caudais máximos anuais constitui um processo faseado que se pode
desenvolver de acordo com as seguintes etapas (HENRIQUES, 1990; STEDINGER E TAKARA, 1994, in
DIAS, 2003, p. 16):
i) enumeração das distribuições aplicáveis à determinação dos quantis;
ii) obtenção dos parâmetros de cada distribuição;
iii) verificação da qualidade do ajustamento de cada distribuição postulada à amostra.
Os modelos de distribuição de frequências de caudais de cheia devem ser compatíveis com as
condições físicas que determinam o fenómeno e reproduzir as características genéricas das funções
de distribuição empírica das amostras daqueles caudais. Para que os requisitos anteriores sejam
respeitados, as funções de distribuição cumulativa de frequências, ou simplesmente funções de
distribuição, dos caudais máximos anuais devem satisfazer algumas das seguintes condições (DIAS,
2003, p. 16):
a) continuidade;
b) limite inferior não negativo;
c) assimetria positiva;
d) unicidade da moda.
As condições a) e b) estão relacionadas com as condições físicas da ocorrência de caudais de ponta
de cheia. O modelo de distribuição de frequências deverá ser contínuo, uma vez que os caudais de
13
ponta de cheia podem assumir qualquer valor não negativo num determinado intervalo real.
Geralmente, a condição do limite inferior da distribuição não negativo não é adoptada de forma
explícita, considerando-se admissíveis os modelos de distribuição de frequências em que a
probabilidade de ocorrência de valores negativos seja desprezável. As condições c) e d) dizem
respeito à forma genérica das funções de distribuição empírica das séries de caudais máximos anuais.
Por último, importa referir que as distribuições seleccionadas deverão ter um número reduzido de
parâmetros, por se dispor de amostras de reduzida dimensão que tornam impossível uma estimação
eficiente havendo um grande número de parâmetros. Por este motivo e segundo CORREIA, 1983,
p. 150, deve ser preferida a utilização de distribuições de probabilidade com apenas dois ou três
parâmetros.
Tendo em conta os aspectos referidos, são brevemente apresentadas, de seguida, as distribuições
aplicáveis à determinação de quantis, para o que, no essencial, se recorreu aos trabalhos publicados
por NAGHETTINI e PINTO, 2007, HENRIQUES, 1990 e CORREIA, 1983.
2.3.2. Distribuição Normal
A distribuição Normal, também conhecida como de Gauss, é utilizada para descrever variáveis
aleatórias com comportamento simétrico em torno de um valor central – função densidade de
probabilidade simétrica em relação à média. Esta distribuição está na origem de toda a formulação
teórica envolvida na construção de intervalos de confiança e em testes estatísticos de hipóteses,
bem como da teoria de regressão e correlação. Por tal razão foi incluída no presente capítulo, não
obstante não ser adequada a sua aplicação à análise de fenómenos extremos em hidrologia cujas
séries exibem, por regra, assimetria significativamente diferente de zero.
A distribuição Normal é um modelo de dois parâmetros, cujas funções densidade, fX(x) e de
distribuição, FX(x), são expressas, respectivamente, por:
2
2
1 1
22X
xf x exp para x
(2.2)
2
2
1 1
22
x
X
xF x exp dx
(2.3)
com
14
α – parâmetro de posição
β – parâmetro de escala
Os parâmetros da distribuição são estimados em função dos respectivos momentos centrados,
obtendo-se as mesmas expressões pelo método dos momentos e pelo método da máxima
verosimilhança, ou seja:
e
O coeficiente de assimetria γ é nulo, uma vez que a distribuição é simétrica. Por este motivo, a
distribuição Normal não se ajusta bem às séries hidrológicas, com ênfase para as referentes a
acontecimentos extremos, que têm normalmente exibem assimetria não desprezável, como
anteriormente mencionado.
A função distribuição de probabilidade da distribuição Normal não tem solução analítica. Esse
inconveniente pode ser superado a partir da transformação linear Z = /σX da variável Normal
X, de parâmetros µ e σ. As funções densidade, fZ(z), e distribuição, FZ(z), de probabilidade de Z são
dadas, respectivamente, por:
21
22
Z
zf z exp para z
(2.4)
21
Φ 22
z
Z
zF z z exp dz para z
(2.5)
A função distribuição de probabilidade da distribuirão normal padrão Φ(z) pode ser obtida mediante
integração numérica, cujos resultados são também apresentados na forma tabular, sendo que
actualmente se dispõe ainda de funções do Excel para resolver, tanto FZ(z), como a correspondente
função inversa.
2.3.3. Distribuição log-Normal
Diz-se que uma variável se ajusta a uma distribuição log-Normal de dois parâmetros ou lei de Galton
quando é possível ajustar uma distribuição Normal à transformada logarítmica dessa variável. Se X se
15
ajusta à lei de Galton isso significa que lnY X se ajusta a uma distribuição Normal. O facto de o
domínio da variável X ser sempre positivo ( ) e de a lei de Galton apresentar assimetria
positiva permite considerar tal lei como adequada a séries de valores extremos de variáveis
hidrológicas, como sejam precipitações intensas e caudais instantâneos máximos anuais.
A função de distribuição de probabilidade da lei de Galton é dada por:
2
0
ln1 1 0
22
xy
X
yy
xF x exp dx para x
x
(2.6)
Os parâmetros μ e σ, calculados pelo método dos momentos, são dados por:
2
ln2
y
y x
(2.7)
1
2 2
2ln 1 x
y
x
(2.8)
Por meio dos seus dois parâmetros, a lei de Galton assegura o ajustamento a uma variável com
dados valores da média e da variância e com assimetria positiva, mas, obviamente, não garante a
preservação da assimetria da amostra. O coeficiente de assimetria da distribuição é obtido em
função do coeficiente de variação da variável X, CV , por NAGHETTINI e PINTO, 2007, p. 142:
3 3 VVC C (2.9)
2.3.4. Distribuição de Pearson tipo III
Uma variável aleatória X possui uma distribuição de Pearson tipo III se a variável (X – γ) é distribuída
conforme uma Gama com parâmetro de escala β e parâmetro de forma θ. De facto, se o parâmetro
de posição, α, da distribuição Pearson do tipo III, for nulo, essa distribuição reduz-se a uma Gama.
Por essa razão, a distribuição de Pearson tipo III também recebe o nome de Gama de três
parâmetros.
As funções densidade probabilidade, fx(x), e distribuição, Fx(x), da distribuição de Pearson tipo III são
dadas, respectivamente, por:
0 X
16
1
1( ) exp
( )X
x xf x
(2.10)
1
1( ) exp
( )X
x xF x dx
(2.11)
em que , e são os parâmetros de posição, de escala e de forma, como antes explicitado, e é a
função gama. A estimação dos parâmetros pelo método dos momentos processa-se igualando a
média, µ, a variância, σ2, ou, de modo equivalente, o desvio-padrão, σ, e o coeficiente de assimetria,
, da distribuição aos correspondentes valores da amostra, do que resultam as seguintes equações:
(2.12)
2
4
(2.13)
(2.14)
2.3.5. Distribuição log-Pearson tipo III
Uma variável x ajusta-se a uma distribuição log-Pearson tipo III se a sua transformada logarítmica se
ajusta a uma distribuição de Pearson tipo III. Assim, basta recorrer à transformada logarítmica dos
valores da amostra:
y ln x
e proceder ao ajustamento da distribuição de Pearson tipo III à série y dos logaritmos.
2.3.6. Distribuição de Gumbel
A distribuição de Gumbel é também designada por Fisher-Tippet tipo I, dupla exponencial e de
valores extremos do tipo I.
As funções densidade de probabilidades, fX(x), e distribuição de probabilidade, FX(x), são expressas,
respectivamente, por:
17
1
( ) exp expX
x xf x
(2.15)
( ) exp exp , , 0X
xF x para x
(2.16)
Trata-se, portanto, de uma distribuição com apenas dois parâmetros: o parâmetro de posição, α, e o
parâmetro de escala, β. Utilizando o método dos momentos, os parâmetros podem ser estimados
pelas seguintes expressões, que igualam a média e o desvio-padrão da distribuição às
correspondentes estatísticas amostrais:
6
(2.17)
(2.18)
em que é a constante de Euler-Mascheroni ( 0,5772):
O ajustamento assegura a preservação da média e a variância de uma dada amostra, mas não a
preservação da assimetria que, aliás, no caso da distribuição de Gumbel é fixa e igual a 1,1396 .
Assim, se o coeficiente de assimetria de uma amostra for muito diferente do anterior valor é de
esperar que a amostra exiba um fraco ajustamento à distribuição de Gumbel.
2.3.7. Distribuição de Goodrich
A distribuição de Goodrich é derivada da distribuição de Weibull por introdução dum terceiro
parâmetro, α, que corresponde ao limite inferior do domínio de aplicação. Resulta, assim, para a
função de distribuição de probabilidade:
1( ) 1 exp ( ) ,XF x x x (2.19)
No pressuposto, mais uma vez, de aplicação do método dos momentos, a determinação dos
parâmetros α, β e θ da distribuição processa-se igualando as médias, os desvios-padrão e os
coeficiente de assimetria da amostra e da distribuição, do que resultam as seguintes equações em
que as variáveis têm os significados anteriormente explicitados:
18
3
3 22
(3 1) 3 (2 1) ( 1) 2 ( 1)
(2 1) ( 1)
(2.20)
12 2
2
(2 1) ( 1)
(2.21)
1
( 1)
(2.22)
A resolução da primeira equação permite determinar o parâmetro β para o que basta considerar que
a assimetria da distribuição, , iguala a da amostra. Nas aplicações efectuadas, tal resolução foi
efectuada numericamente com recurso às funções Solver e Gama do Excel. A obtenção dos outros
dois parâmetros, α e θ, processa-se de forma directa, uma vez que se disponha da solução da função
Gama.
2.4. Análise de frequências pelo método do factor de probabilidade
2.4.1. Conceito geral
O método do factor de probabilidade, que decorre directamente do método dos momentos
(HENRIQUES, 1990, p. 319), permite estimar o valor de uma variável aleatória com determinado
período de retorno, a partir da média e do desvio-padrão da correspondente amostra, a que, por sua
vez, foram igualados a média e o desvio-padrão da distribuição, µ, e σ, respectivamente.
No âmbito da presente dissertação de mestrado, tal método foi amplamente aplicado para
representar as funções de distribuição de probabilidade de leis teóricas, nomeadamente na
apreciação visual no ajustamento dessas leis e na definição dos limites dos intervalos a considerar na
aplicação de testes de apreciação do ajustamento, objecto da secção 3.5.
A equação que define a aplicação do factor de probabilidade é dada por, CHOW, 1964:
T X XTx K (2.23)
onde xT representa a estimativa do valor da variável X para o período de retorno T e KT, o
correspondente factor de probabilidade que depende da distribuição de probabilidades considerada
e do período de retorno.
19
No caso do ajustamento de leis estatísticas se processar no campo da transformada logarítmica da
variável, ou seja, se lny x , como acontece com as distribuições log-Normal e log-Pearson tipo
III, pode aplicar-se um procedimento equivalente definido por:
T Y YTKy (2.24)
Para estimar xT, tendo-se previamente obtido a estimativa yT, basta inverter a função logaritmo, ou
seja:
expT Tx y (2.25)
Para uma dada lei estatística, o cálculo de KT, para um dado período de retorno T, processa-se ou a
partir de uma tabela, quando disponível, ou através de equações matemáticas, algumas exactas
(como no caso da lei de Gumbel) outras decorrentes de aproximações numéricas (como no caso das
leis normal e de Pearson III). Tais equações são seguidamente apresentadas para as diversas
distribuições de probabilidades referidas no capítulo anterior, para o que, no essencial, se recorreu
aos trabalhos publicados por NAGHETTINI e PINTO, 2007, HENRIQUES, 1990 e CORREIA, 1983.
2.4.2. Distribuição Normal
O factor de probabilidade da distribuição Normal não é mais do que a normal reduzida, z. Não
obstante no âmbito do estudo efectuado se ter recorrido às funções do Excel, tanto para calcular o
valor de z correspondente a uma dada probabilidade de não-excedência, como para resolver o
problema inverso, apresentam-se, seguidamente equações para o efeito aplicáveis, as quais são
válidas para períodos de retorno superiores a 2 anos.
2
2 3
2,515517 0,802853 0,010328
1 432788 0,189269 0,001308
z zK z
z z z
(2.26)
1
2 2lnz T (2.27)
Para períodos de retorno inferiores a 2 anos (ou seja, para probabilidades de não-excedência
inferiores a 0,5), o cálculo de z processa-se atendendo à simetria da lei Normal.
20
2.4.3. Distribuição de Gumbel
A equação que fornece o factor de probabilidade da lei de Gumbel é a seguindamente apresentada
na qual é a constante de Euler-Mascheroni ( 0,5772):
6
ln ln1
TK
T
(2.28)
2.4.4. Distribuição de Pearson tipo III
O factor de probabilidade da distribuição de Pearson tipo III pode ser obtido por meio de tabelas
apropriadas ou aproximado pela transformação de Wilson-Hilferty, dada por:
2 3 2 2 3 4 51 11 6 1
3 3K z z k z z k z k zk k (2.29)
com
z = variável Normal reduzida =KN
6k
2.4.5. Distribuição de Goodrich
No caso da lei de Goodrich o factor de frequência é dado por:
1
ln 1K A BT
(2.30)
com
1
2 2Γ 2 1 Γ ( 1)B (2.31)
1 Γ( 1)A B (2.32)
Em alternativa, os valores da variável aleatória podem ser estimados aplicando a seguinte
formulação:
21
1 1
lnxT
(2.33)
Neste caso, α, β e θ são os parâmetros já definidos na secção 2.3.7.
2.5. Ajustamento de leis teóricas
2.5.1. Considerações prévias
Seleccionados os modelos para as distribuições de frequências dos caudais, definidas as respectivas
funções de distribuição cumulativas, FX(x), e estimados os parâmetros dos modelos a partir das
amostras, a fase seguinte do estudo relaciona-se com a averiguação da qualidade do ajustamento
das distribuições postuladas àquelas amostras.
Esta avaliação é importante uma vez que as estimativas de caudal obtidas através dos modelos
aplicados podem diferir dos valores verdadeiros. Estas diferenças podem dever-se (WMO, 1989, in
DIAS, 2003):
i) à incapacidade do modelo escolhido para reproduzir a relação caudal – probabilidade de
não-excedência, Q – T/F, da população;
ii) à identificação incorrecta do modelo de distribuição de frequências mais adequado para
descrever a população;
iii) ao viés introduzido no procedimento de determinação dos parâmetros da distribuição;
iv) ao erro de amostragem resultante do facto de a estimação dos parâmetros ser realizada a
partir de uma amostra finita;
v) ao facto de a amostra disponível não constituir uma amostra verdadeiramente aleatória.
No processo de aplicação de um modelo de distribuição de frequências a uma série de caudais não é
possível evitar as fontes de erro resultantes de ii), iii) e iv). No entanto, o método de ajustamento
deve minimizar estes erros e ser tão eficiente quanto possível.
Nas secções seguintes, são descritas as medidas aplicadas para avaliar o ajustamento dos modelos
estatísticos postulados às amostras a que foram aplicados.
22
2.5.2. Ajustamento visual
Uma vez definidas as distribuições aplicáveis à determinação de quantis, a primeira etapa na
verificação da qualidade do ajustamento de cada distribuição a uma dada amostra é a apreciação
visual. Embora seja um procedimento subjectivo, o exame visual do ajustamento entre as
distribuições de probabilidades e os dados observados pode ser útil para aceitar ou rejeitar, ainda
que empiricamente, a hipótese de aderência de um certo modelo de distribuição de probabilidades.
O exame visual consiste na disposição em gráfico dos valores amostrais e das estimativas dos quantis
pelas diferentes leis estatísticas, associadas às respectivas probabilidades de não-excedência.
No que diz respeito à representação dos valores da amostra, é necessário determinar as
probabilidades empíricas de não-excedência, atribuindo a cada elemento da amostra uma estimativa
empírica da fracção do número de elementos dessa amostra com valor igual ou superior ao do
elemento considerado – probabilidade empírica de não-excedência ou posição de “plotagem” numa
tradução à letra do termo inglês plotting position. Para o efeito, estabelece-se uma correspondência
entre aquele elemento e o número de ordem sequencial, i, que resulta da ordenação por valores
crescentes dos elementos da amostra (1 i N , sendo N a dimensão da amostra). O número de
ordem, i, atribuído a cada elemento indica, portanto, o número de elementos da amostra com valor
inferior ou igual ao valor do elemento considerado. Na inexistência de repetição de valores, como é
frequente acontecer quando se trata de variáveis hidrológicas, a ordenação conduz à numeração
sequencial e contínua dos elementos amostrais.
As fórmulas de cálculo das probabilidades empíricas de não-excedência utilizam os anteriores
números de ordem e são frequentemente casos particulares da seguinte fórmula (PORTELA e
DELGADO, 2009a, 2009b):
1 2
i
iF x
N
(2.34)
em que i é o número de ordem do elemento xi, F(xi) representa a probabilidade empírica de não-
excedência associada a esse elemento, conforme anteriormente explicitado, N é a dimensão da
amostra e θ é uma constante compreendida entre 0 e 1 e que determina a qualidade do ajustamento
entre probabilidades empíricas de acordo com as diferentes leis postuladas. CUNNANE, 1978,
recomenda os valores mais adequados de θ para diferentes distribuições de probabilidade teóricas,
indicando também o melhor valor de θ a adoptar quando se tem como objectivo utilizar uma única
fórmula para a determinação da probabilidade empírica de não-excedência, independentemente da
23
lei estatística a ajustar – 2 5 . De acordo com esta última indicação, na investigação que se
apresenta a fórmula utilizada para obter probabilidade empírica de não-excedência foi a seguinte:
2 / 5
1/ 5i
iF x
N
(2.35)
De modo a automatizar o procedimento de representação gráfica em papel de probabilidade da lei
Normal inerente ao exame visual do ajustamento entre amostras e distribuições de probabilidade, os
sucessivos valores das funções distribuição de probabilidades, quer fornecidos pelas leis teóricas,
quer correspondentes a probabilidades empíricas, foram expressos em termos dos valores da
variável Normal reduzida, z, que lhes correspondem. Assim, os eixos das ordenadas dos gráficos que
suportaram o ajustamento visual representam valores amostrais ou estimativas obtidas pelas
distribuições de probabilidade postuladas e os eixos das abcissas, valores da normal reduzida, z.
2.5.3. Testes de aderência: Qui-Quadrado e Kolmogorov-Smirnov
2.5.3.1. Conceito geral
Os testes de hipóteses são procedimentos usuais da análise estatística, úteis na tomada de decisões
no que respeita à forma ou ao valor de um determinado parâmetro de uma distribuição de
probabilidades, da qual se conhece apenas uma amostra de observações. Tais testes envolvem a
formulação de uma hipótese, na forma de uma declaração conjectural sobre o comportamento
probabilístico da população. Não rejeitar ou rejeitar uma tal hipótese irá depender do “confronto”
entre a “conjectura” e a “realidade física”, esta última concretizada pelas observações que compõem
a amostra. A rejeição da hipótese implica a necessidade de eventual revisão da conjectura inicial, em
resultado de seu desacordo relativamente à realidade imposta pelos valores amostrais. Por outro
lado, a não rejeição da hipótese significa que, com base naqueles valores, não há elementos
suficientes para descartar a plausibilidade da premissa inicial sobre o comportamento da variável
aleatória, pelo que, “não rejeitar” não significa “aceitar” a hipótese. Quando a hipótese, a ser
testada, diz respeito à forma do modelo distributivo da população de onde a amostra foi extraída, os
testes são denominados de aderência (NAGHETTINI e PINTO, 2007).
No contexto da aplicação de testes de aderência, a hipótese inicial, H0, pode ser expressa
concretamente do seguinte modo: dada uma amostra de uma variável aleatória, esta provém de
uma população com distribuição de frequências especificada pelo modelo seleccionado, com
parâmetros estimados a partir da amostra.
24
Os testes de aderência mais frequentemente aplicados são o teste do Qui-Quadrado, χ2, e os testes
baseados na função de distribuição empírica, dos quais o mais divulgado é o teste de Kolmogorov-
Smirnov (DIAS, 2003, p. 37). Nas secções seguintes, apresenta-se a descrição de ambos os testes,
para o que se consultou os trabalhos publicados por DIAS, 2003, HENRIQUES, 1990 e NAGHETTINI e
PINTO, 2007.
2.5.3.2. Teste do qui-quadrado
O teste do qui-quadrado consiste na divisão do domínio da função de distribuição de probabilidade
em M intervalos e na comparação do número de elementos da amostra contidos em cada intervalo,
Oj, com a esperança matemática, indicada pelo modelo, do número de elementos correspondentes a
esse intervalo, Ej.
A estatística de teste é definida por χ2:
2
2
1
( )Mj j
j j
O E
E
(2.36)
em que Oj é o número de elementos da amostra contidos no intervalo j e Ej o valor esperado do
número de elementos no mesmo intervalo j. Tal esperança é dada por j jE NA , em que Aj é a
amplitude do intervalo j, avaliada em conformidade com o modelo postulado e N é a dimensão da
amostra.
Dada a hipótese H0, a estatística de teste tem assintopticamente a distribuição χ2 com M-1 graus de
liberdade, se o modelo for especificado independentemente da amostra. No caso em questão, em
que as distribuições avaliadas dependem de m parâmetros estimados a partir da amostra, perdem-se
m graus de liberdade, ou seja, a estatística de teste segue uma distribuição χ2 com M-m-1 graus de
liberdade, dada a hipótese H0.
Atendendo à equação (2.36), conclui-se que um valor elevado da estatística de teste revela grandes
diferenças entre as frequências observadas e esperadas, sendo um indicador da pouca aderência da
distribuição especificada, sob H0, à amostra. O teste estatístico pode, então, formular-se do seguinte
modo: rejeitar H0 com um nível de confiança (1-α) se 2 2
1 , em que 2
1 é o quantil (1-α) da
distribuição χ2, tratando-se, portanto, de um teste unilateral. No presente trabalho, adoptou-se um
nível de significância de α=0,05. No quadro 2.1 apresentam-se os valores da função de
probabilidades acumuladas da distribuição de χ2, para diferentes graus de liberdade.
25
Os valores da estatística χ2 dependem do número de intervalos, M, sendo que, contudo, não existem
regras para seleccionar tal número, nem a sua amplitude. Segundo MANN e WALD, 1942, citados por
HENRIQUES, 1990, é recomendável que a partição do domínio da função seja de modo a se obter M
intervalos de igual amplitude. Na mesma publicação, HENRIQUES, 1990, propõe ainda que o número
de intervalos M seja função da dimensão da amostra. Deste modo, no presente trabalho, utilizaram-
se as partições da função de distribuição cumulativa, FX(x), que se indicam no quadro 2.2, adaptado
de HENRIQUES, 1990.
Quadro 2.1 - Valores da função de probabilidades acumuladas da distribuição de de χ2, para diferentes graus de liberdade.
Quadro 2.2 - Partições do domínio da distribuição cumulativa de frequências, utilizadas na aplicação do teste do Qui-Quadrado (adaptado de HENRIQUES, 1990).
0,995 0,975 0,900 0,500 0,100 0,050 0,025 0,010 0,005 0,001
1 0,000 0,001 0,016 0,455 2,706 3,841 5,024 6,635 7,879 10,827
2 0,010 0,051 0,211 1,386 4,605 5,991 7,378 9,210 10,597 13,815
3 0,072 0,216 0,584 2,366 6,251 7,815 9,348 11,345 12,838 16,266
4 0,207 0,484 1,064 3,357 7,779 9,488 11,143 13,277 14,860 18,466
5 0,412 0,831 1,610 4,351 9,236 11,070 12,832 15,086 16,750 20,515
6 0,676 1,237 2,204 5,348 10,645 12,592 14,449 16,812 18,548 22,457
7 0,989 1,690 2,833 6,346 12,017 14,067 16,013 18,475 20,278 24,321
8 1,344 2,180 3,490 7,344 13,362 15,507 17,535 20,090 21,955 26,124
9 1,735 2,700 4,168 8,343 14,684 16,919 19,023 21,666 23,589 27,877
10 2,156 3,247 4,865 9,342 15,987 18,307 20,483 23,209 25,188 29,588
11 2,603 3,816 5,578 10,341 17,275 19,675 21,920 24,725 26,757 31,264
12 3,074 4,404 6,304 11,340 18,549 21,026 23,337 26,217 28,300 32,909
13 3,565 5,009 7,041 12,340 19,812 22,362 24,736 27,688 29,819 34,527
14 4,075 5,629 7,790 13,339 21,064 23,685 26,119 29,141 31,319 36,124
15 4,601 6,262 8,547 14,339 22,307 24,996 27,488 30,578 32,801 37,698
16 5,142 6,908 9,312 15,338 23,542 26,296 28,845 32,000 34,267 39,252
17 5,697 7,564 10,085 16,338 24,769 27,587 30,191 33,409 35,718 40,791
18 6,265 8,231 10,865 17,338 25,989 28,869 31,526 34,805 37,156 42,312
19 6,844 8,907 11,651 18,338 27,204 30,144 32,852 36,191 38,582 43,819
20 7,434 9,591 12,443 19,337 28,412 31,410 34,170 37,566 39,997 45,314
21 8,034 10,283 13,240 20,337 29,615 32,671 35,479 38,932 41,401 46,796
22 8,643 10,982 14,041 21,337 30,813 33,924 36,781 40,289 42,796 48,268
23 9,260 11,689 14,848 22,337 32,007 35,172 38,076 41,638 44,181 49,728
24 9,886 12,401 15,659 23,337 33,196 36,415 39,364 42,980 45,558 51,179
25 10,520 13,120 16,473 24,337 34,382 37,652 40,646 44,314 46,928 52,619
26 11,160 13,844 17,292 25,336 35,563 38,885 41,923 45,642 48,290 54,051
27 11,808 14,573 18,114 26,336 36,741 40,113 43,195 46,963 49,645 55,475
28 12,461 15,308 18,939 27,336 37,916 41,337 44,461 48,278 50,994 56,892
29 13,121 16,047 19,768 28,336 39,087 42,557 45,722 49,588 52,335 58,301
30 13,787 16,791 20,599 29,336 40,256 43,773 46,979 50,892 53,672 59,702
Graus de liberdadeNível de significância = 1 - nível de confiança
26
2.5.3.3. Teste de Kolmogorov-Smirnov
O teste de aderência de Kolmogorov-Smirnov consiste em determinar a estatística DN dada pela
diferença máxima entre as funções de probabilidades acumuladas empírica e teórica. A estatística do
teste é definida por:
| ( ) ( ) |N N xD máx F x F x (2.37)
em que FN(x) é a probabilidade empírica de não-excedência atribuída a cada elemento da amostra,
determinada pela equação (2.35), e FX(x) é a respectiva estimativa teórica, calculada em função do
modelo de distribuição de probabilidades que se pretende testar. No estudo que se apresenta, tais
estimativas foram obtidas para cada modelo de distribuição e para cada elemento xi de uma dada
amostra, pela resolução da equação (2.23), referente ao factor de probabilidade, Ki, em ordem a
esse factor tendo por base a média e o desvio-padrão dessa amostra. Por sua vez, o factor de
probabilidade é função do período de retorno, Ti, que, uma vez determinado, permite obter a
probabilidade de não-excedência teórica do elemento em causa da amostra, através da relação
1 1i iF T .
O procedimento descrito foi aplicado directamente no caso da distribuição de Gumbel. No entanto,
para a distribuição Normal e log-Normal, Fi foi determinado através da função do software Excel a
partir do respectivo factor de probabilidade Ki, uma vez que, para estas distribuições, Ki=z. Para a
distribuição de Goodrich, não foi utilizada a equação do factor de probabilidade mas sim a equação
alternativa (2.33). No caso da distribuição de Pearson III e log-Pearson III, a obtenção do período de
retorno através da equação relativa ao factor de probabilidade não é de fácil execução, razão pela
qual se adoptou um procedimento numérico que fornece primeiramente o valor da variável reduzida
z, sendo este posteriormente transformado numa probabilidade de não-excedência através da
função para o efeito disponível no software Excel.
A formulação do teste de Kolmogorov-Smirnov é análoga à do teste do qui-quadrado: a hipótese H0 é
rejeitada com nível de confiança (1-α) se ,1N ND D (teste unilateral), em que DN,1-α é o valor
crítico, máximo aceitável para esse nível de confiança.
O valor crítico de DN depende ainda da dimensão da amostra, N, sendo que para amostras com
dimensão superior a 40, o valor crítico da estatística é dado por 1,3581 N , para um nível de
significância de 0,05 (NAGHETTINI e PINTO, 2007, p. 276). Para amostras de dimensão inferior a 40,
os valores críticos de DN são retirados do quadro 2.3 que se segue.
27
Quadro 2.3 - Valores críticos da estatística do teste DN,α de aderência de Kolmogorov-Smirnov.
2.5.4. Outras medidas de avaliação do ajustamento
Para além dos testes enunciados anteriormente, foram aplicadas, fundamentalmente a título
indicativo, algumas medidas de erro, cujos resultados tiveram como única utilidade a de optar entre
distribuições teóricas, mas somente quando os testes de hipóteses e o ajustamento visual
sugerissem a adequação dessas distribuições. Foram determinados o erro padrão de previsão, SEP
(percent standard error of prediction), o coeficiente de eficiência, Ej, e a variação relativa média, ARV
(average relative variance). Segundo PULIDO-CALVO e PORTELA, 2007, esses três estimadores
permitem avaliar, de algum modo, a capacidade do modelo para caracterizar a variação total dos
dados. Tais autores referem também que é aconselhável quantificar o erro de previsão nas mesmas
unidades que as variáveis através de medidas de erro absoluto, como a raiz quadrada do erro
quadrático médio, RMSE (square root of the mean square error), e o erro absoluto médio, MAE
(mean absolute error), dados por:
2
1
ˆN
t t
i
x x
RMSEN
(2.38)
1
ˆ| |N
t t
i
x x
MAEN
(2.39)
28
onde xt é o valor observado de número de ordem t, tx̂ é a respectiva estimativa teórica e N é a
dimensão da amostra.
O erro padrão de previsão, expresso em percentagem, é definido por:
100
SEP RMSEx
(2.40)
onde x é a média amostral. A principal vantagem de SEP é a sua adimensionalidade, que permite
comparar, em percentagem, as previsões obtidas com base em diferentes modelos.
O coeficiente de eficiência, Ej, e a variação relativa média, ARV, representam a relação entre a
variação das estimativas dadas pelo modelo e a variação da amostra em torno da média amostral,
sendo definidos por:
1
1
ˆ| |
1,0
| |
Nj
t t
ij N
j
t
i
x x
E
x x
(2.41)
2
12
2
1
ˆ| |
1,0
| |
N
t t
i
N
t
i
x x
ARV E
x x
(2.42)
A sensibilidade para outliers, devido ao quadrado das diferenças, é maior no coeficiente de eficiência
e no erro absoluto médio. Um valor nulo para E2 indica que a média observada é uma medida de
previsão tão boa como o modelo aplicado, enquanto que valores negativos indicam que a média
fornece uma melhor previsão que o modelo. Para um bom ajustamento do modelo, o valor de Ej
deve estar perto da unidade e os valores de SEP e de ARV perto de zero.
2.6. Teoria das cópulas
2.6.1. Análise multivariada
2.6.1.1. Conceito geral
Para a análise de frequência de uma única variável as relações e procedimentos de análise que
concretizam os diferentes conceitos estatísticos, tais como probabilidades de não-excedência,
períodos de retorno, estimação de valores, entre outros, estão bem estabelecidos. No entanto,
muitos dos eventos hidrológicos podem ser descritos por mais de uma variável. É este o caso das
29
cheias fluviais naturais para cuja caracterização pode ser relevante combinar caudais de ponta e
volumes de cheia. Se um evento hidrológico é multivariado, ou seja, descrito por um conjunto de
variáveis aleatórias correlacionadas, a análise de frequência de uma variável pode não fornecer uma
avaliação completa da probabilidade de ocorrência. Uma melhor compreensão das características
probabilísticas desses eventos pode exigir o estudo da sua distribuição em conjunto.
Na literatura da especialidade são apresentados vários estudos com o objectivo de modelar eventos
hidrológicos multivariados, sendo que alguns desses estudos foram referidos no capítulo
introdutório. Na maior parte desses casos, tal modelação tem por base um dos três pressupostos
seguintes (ZHANG e SINGH, 2006):
i) as variáveis envolvidas têm a mesma distribuição de probabilidade marginal;
ii) as variáveis têm uma distribuição conjunta normal ou outra conhecida;
iii) as variáveis são independentes.
No entanto, e como já foi referido, as variáveis hidrológicas podem ser dependentes, não lhes
corresponde, normalmente, a mesma distribuição de probabilidade marginal e a sua distribuição
conjunta não é conhecida. A vantagem do método das cópulas é precisamente o de não obrigar à
adopção de nenhum dos pressupostos enunciados por ZHANG e SINGH, 2006.
Nas secções seguintes são apresentados o conceito de cópula e algumas funções dessa teoria.
Incluiu-se, ainda, a apresentação da função bivariada de Gumbel que também foi aplicada com o
intuito de comparar os resultados decorrentes da mesma com os fornecidos pela aplicação de
cópulas.
2.6.1.2. Função bivariada de Gumbel
A função bivariada de Gumbel permite determinar a probabilidade conjunta de duas variáveis
aleatórias, partindo do pressuposto de que ambas seguem uma distribuição de probabilidade
marginal de Gumbel. A equação que define a função é dada por (YUE e RASMUSSEN, 2002):
1
, ( , ) exp ln ( ) ln ( )m m m
X Y X YF x y F x F y
(2.43)
onde FX(x) e FY(y) são as funções de distribuição de probabilidade das variáveis aleatórias X e Y e m
(m>1) é o parâmetro que descreve a relação entre essas variáveis, podendo pode ser determinado
por:
30
1
0 11
m
(2.44)
em que ρ é o coeficiente de correlação de Pearson das duas variáveis aleatórias, determinado pela
seguinte equação:
2 2
( )( )
( ) ( )
x x y y
x x y y
(2.45)
Na qual x e y representam valores das variáveis aleatórias X e Y e x e y são as respectivas médias.
2.6.1.3. Conceito de cópula
Sejam X e Y duas variáveis aleatórias com função de distribuição conjunta dada por FX,Y(x,y) sendo as
respectivas funções de distribuição marginal dadas por Fx(x) e FY(y). Segundo o teorema de Sklar
(ZHANG e SINGH, 2006), para qualquer par de variáveis aleatórias existe uma função de dependência
C(u,v) tal que:
, ( , ) ,X Y X YF x y C F x F y (2.46)
em que XU F x e ( )YV F y , de modo que:
, ( , ) ( , )U VF u v C u v (2.47)
Torna-se, assim, possível definir a distribuição conjunta de variáveis aleatórias através das
distribuições marginais de cada uma dessas variáveis – que caracterizam completamente o
comportamento das variáveis quando consideradas isoladamente – e através de uma função de
dependência C – que contém toda a informação de como as variáveis dependem uma das outras.
Deste modo, o problema da determinação da distribuição conjunta reduz-se à determinação
daquelas duas componentes: as funções de distribuição marginal e a função de dependência C,
denominada cópula.
As funções de distribuição marginal foram já largamente abordadas nos capítulos 2.3 e 2.4, pelo que
esta secção incidirá unicamente no estudo da função de dependência, a cópula. Vários são os
investigadores que têm contribuído e proposto diferentes famílias de funções cópula. A família das
cópulas arquimedianas tem sido utilizada na análise de fenómenos hidrológicos, uma vez que são
várias as funções incluídas nessa família e a sua construção é relativamente acessível, (ZHANG e
SINGH, 2006). No presente estudo, foram utilizadas três cópulas arquimedianas.
31
As cópulas da família arquimediana podem ser expressas através da seguinte equação geral (ZHANG
e SINGH, 2006):
1( , )C u v u v (2.48)
em que é a função geradora da cópula.
A função geradora varia de cópula para cópula e depende do parâmetro θ. Este parâmetro é
fundamental para a construção da função C, uma vez que traduz a dependência entre as variáveis
em estudo. Deste modo, a determinação do parâmetro θ envolve sempre a avaliação da
dependência entre as variáveis, nomeadamente através do coeficiente de Kendall, τ , cujo conceito é
apresentado em 2.6.3.
As funções geradoras das cópulas seleccionadas são apresentadas no capítulo seguinte para o que,
no essencial, se atendeu aos trabalhos de MELGHIORI, 2003, e ZHANG e SINGH, 2006.
2.6.2. Funções cópula
2.6.2.1. Cópula Clayton
A função geradora, , da cópula de Clayton é dada por:
( ) 1Cx x
(2.49)
em que θC é o respectivo parâmetro da cópula e x é a variável da função geradora, pelo que tomará o
valor de u e o valor de v (cujo significado foi já apresentado) quando a função for substituída na
equação (2.48), permitindo assim obter a cópula de Clayton:
1
( , ) 1C C C
CC u v u v
(2.50)
O parâmetro θC obtém-se a partir do coeficiente de Kendall, τ, através da equação:
2
C
C
(2.51)
2.6.2.2. Cópula Frank
A função geradora para a cópula de Frank tem a seguinte forma:
32
exp 1( ) ln
exp
F
F
xx
(2.52)
em que θF é o respectivo parâmetro da cópula e x tem o significado já referido na apresentação da
cópula de Clayton.
A substituição da função geradora na equação geral das cópulas arquimedianas (2.48) permite obter
a função da cópula de Frank:
exp 1 exp 11( , ) ln 1
exp 1
F F
F
F F
u vC u v
(2.53)
O parâmetro θF obtém-se pela resolução da equação:
1
41 1F
F
D
(2.54)
A anterior equação inclui a função D1 que corresponde à função de Debye, Dk, de primeira ordem. A
resolução desta função não é analiticamente possível, pelo que o valor do parâmetro θF foi obtido
através da utilização do software comercial ModelRisk.
2.6.2.3. Cópula Gumbel-Hougaard
A cópula de Gumbel-Hougaard obtém-se a partir da seguinte função geradora:
( ) ln Gx x
(2.55)
Analogamente ao já explicado para as duas cópulas anteriormente apresentadas, θG é o respectivo
parâmetro da cópula e x é a variável da função geradora, que deverá tomar o valor de u e v na
equação geral das cópulas arquimedianas (2.48). Dessa equação e da função geradora, obtém-se a
cópula de Gumbel-Hougaard:
1
( , ) exp ln lnG G G
GC u v u v
(2.56)
A análise da equação anterior permite concluir que, a menos de um pormenor, a cópula de Gumbel-
Hougaard não é mais do que a função bivariada de Gumbel. Com efeito, as equações (2.43), relativa
à função Gumbel na forma bivariada, e (2.56), referente à cópula, apenas diferem na simbologia e no
procedimento de cálculo dos parâmetros nelas intervenientes. Deste modo, a apreciação dos
33
resultados obtidos por um e por outro modelo vai permitir inferir sobre a “qualidade” do
procedimento de avaliação da dependência entre variáveis e concluir qual desses modelos, o que
envolve o parâmetro da cópula ou o que envolve o parâmetro m da distribuição bivariada, exprime
melhor essa dependência.
O parâmetro da copula, θG, depende também do coeficiente de Kendall, τ, objecto do capítulo que se
segue, e obtém-se da seguinte equação:
11 G (2.57)
2.6.3. Coeficiente de Kendall
Em estatística, o coeficiente de Kendall é descrito como uma medida de concordância entre duas
variáveis, isto é, estando-se perante duas variáveis que apresentam uma relação não linear mas
monótona (se uma aumenta a outra tem sempre tendência a aumentar ou a diminuir), o coeficiente
em menção fornece uma avaliação quantitativa desse nível de concordância/discordância. O
coeficiente deve o nome a Maurice Kendall, que o desenvolveu em 1938.
O cálculo do coeficiente de Kendall tem por base o conceito de concordância. Diz-se que existe
concordância entre observações quando os valores de determinada observação (x,y) são ambos
maiores ou menores do que os valores de outra observação, ou seja, se as tendências que existem
entre cada duas observações são iguais para x e y. O coeficiente de Kendall obtém-se da ponderação
das concordâncias e discordâncias (quando as tendências entre pares não são iguais para ambos os
valores), do seguinte modo:
º º
º
n concordâncias n discordâncias
n pares possíveis
(2.58)
O número de pares possíveis consiste simplesmente no número de comparações passíveis de serem
realizadas entre observações, ou seja, na combinação de dois elementos de um grupo de N
elementos, sendo N a dimensão da amostra. Analisando a equação (2.58), é fácil compreender que
se todos os pares forem concordantes se obtém τ = 1 e se todos forem discordantes, τ = - 1. Um valor
nulo de coeficiente de Kendall, τ = 0, indica a independência entre as variáveis em avaliação.
No presente trabalho, para determinar o coeficiente de Kendall das amostras, utilizou-se a seguinte
equação (KARMAKAR e SIMONOVIC, 2009):
1
2 sinalN
i j i j
i j
x x y y
(2.59)
34
na qual N é a dimensão da amostra e sinal = 1 se i jx x e
i jy y e sinal = - 1, caso contrário, para
i, j = 1, 2, …, N. x e y são os valores das variáveis X e Y, respectivamente.
2.6.4. Selecção da função cópula
À semelhança do procedimento da análise estatística convencional, também após a aplicação das
cópulas às amostras de caudal e de volume de cheia em cada estação hidrométrica é necessário
averiguar o ajustamento assim alcançado de modo a identificar a função cópula que melhor
caracteriza a relação entre aquelas duas variáveis, em termos de probabilidade conjunta. Tal como
naquele outro caso, a apreciação desse ajustamento passa por comparar, através de gráficos, a
“posição” dos pontos que constituem cada função teórica aplicada às amostras das duas variáveis em
consideração com a “posição” dos pontos obtidos para essas mesmas amostras por uma função de
probabilidade empírica ou posição de “plotagem”, avaliando as diferenças entre tais “posições”.
O conceito de probabilidade empírica ou posição de “plotagem” foi abordado no capítulo 2.5.2., no
âmbito do estudo do ajustamento de leis estatísticas a amostras de única variável. No caso de
amostras de duas variáveis, a função que fornece a probabilidade empírica de não-excedência é
obrigatoriamente bivariada, sendo que, no seu cálculo, se utilizou a seguinte equação (YUE, 1999):
0,44
( , )0,12
NPF u v
N
(2.60)
na qual N representa a dimensão da amostra constituída pelos pares de valores das variáveis
aleatórias entre as quais se espera existir uma dependência, ou seja, nas aplicações efectuadas,
caudal e volume de cheia, e NP representa o número de ordem sequencial de cada par de elementos
da amostra, isto é, o número de elementos da amostra com valor inferior ou igual ao valor do
elemento considerado.
A concepção da anterior equação é semelhante à da equação (2.34) referente ao cálculo da
probabilidade empírica de não-excedência tendo por base amostras relativas a uma única variável. A
diferença significativa entre as duas equações em menção reside na especificação dos números de
ordem sequencial dos elementos da amostra: com efeito, no caso de probabilidades conjuntas,
sendo as amostras constituídas por pares de valores, não é possível ordená-los simultaneamente de
forma crescente. Neste caso, o número de ordem sequencial NP atribuído ao elemento (xi, yi) é dado
pelo número de pares (xj, yj) que verificam j ix x e j iy y , para , 1,...,i j N .
35
A selecção da função considerada como tendo melhor ajustamento passa então por avaliar a
diferença entre os valores obtidos para as probabilidades conjuntas de cada elemento da amostra,
calculadas através dos dois métodos, o empírico e o que envolve a aplicação das funções teóricas.
Para quantificar e analisar essas diferenças, utilizaram-se os conceitos e modelos apresentados em
2.5. Contudo e como decorrerá da apresentação de resultados, verificou-se que as curvas
representativas das quatro funções teóricas (cópulas de Clayton, Frank, Gumbel- Hougaard e
bivariada de Gumbel) apresentavam ajustamentos aos pontos amostrais praticamente
indiferenciáveis, não possibilitando a selecção visual de uma dessas funções. Houve, assim, que
apoiar a selecção visual noutras ferramentas, para o que se recorreu ao teste de Kolmogorov-
Smirnov, complementado, embora a título indicativo e de entre as medidas de ajustamento objecto
do capítulo 2.5.4., pela apreciação dos resultados relativos ao desvio quadrático médio.
36
37
3. Dados de base
3.1. Dados disponíveis
Como já se referiu em capítulos antecedentes, o trabalho que se apresenta é constituído por duas
partes com propósitos diferentes. A primeira consiste na aplicação dos modelos de distribuição de
frequências a séries de caudais e de volumes de cheia máximos anuais e acima de dados limiares
tendo em vista comparar as estimativas de cada uma daquelas variáveis obtidas a partir daqueles
dois tipos de séries, bem como avaliar relações entre estimativas de caudais e dos respectivos
volumes de cheia. A segunda parte focou-se exclusivamente no estudo da relação entre caudais e
volumes através da análise da probabilidade conjunta dessas duas variáveis, fundamentalmente com
recurso à teoria das cópulas.
Para cumprir os anteriores objectivos, foi necessário dispor de amostras com dimensões adequadas à
aplicação de procedimentos de análise estatística, de caudais instantâneos máximos anuais e acima
de dados limiares, bem como de amostra dos volumes de cheia associados a esses caudais. Para o
presente trabalho, as amostras referidas foram obtidas a partir de registos de alturas hidrométricas
ou de caudais instantâneos. Para o efeito e de entre as estações hidrométricas que constam do
Sistema Nacional de Informação de Recursos Hídricos, SNIRH (da responsabilidade do Instituto da
Água, INAG) foram seleccionadas quatro, em regime natural e sem outro critério de selecção especial
para além do referente à necessidade de assegurar séries tão longas quanto possível e com
qualidade reconhecida. Para essas estações o INAG forneceu tabelas contendo os registos das alturas
hidrométricas (recolhidas hora a hora), bem como as equações relativas às curvas de vazão. Foram
ainda consultados os registos de caudais instantâneos máximos anuais que constam do SNIRH.
As estações hidrométricas seleccionadas foram as de Albernoa (26J/01H), Couto de Andreiros
(18L/01H), Monforte (19M/01H) e Torrão do Alentejo 24H/03H), tendo-se obtido registos
hidrométricos entre os anos hidrológicos de 1961/1962 e de 1999/2000. No quadro 3.1 estão
resumidas as características gerais das anteriores estações.
Importa referir que nem todos os anos hidrológicos compreendidos no anterior período de aquisição
de dados foram considerados para efeitos de constituição das amostras de cada estação. Com efeito,
foram eliminados os anos que apresentavam falhas de registo que, de algum modo, não permitiam
garantir que os registos disponíveis conduzissem à identificação dos máximos caudais instantâneos
nesses anos.
38
Quadro 3.1 – Quadro resumo das características das estações hidrométricas.
3.2. Recolha e tratamento de dados
Os registos facultados constaram, no essencial, de alturas hidrométricas que foram transformadas
em caudais mediante aplicação das correspondentes curvas de vazão, também fornecidas pelo INAG,
como antes mencionado. A informação assim recolhida para cada estação hidrométrica foi
organizada em tabelas contendo as amostras de caudais máximos anuais e de caudais acima de
dados limiares, bem como as amostras dos correspondentes volumes dos hidrogramas.
Em linhas gerais, a recolha e tratamento dos dados de base – que constitui uma tarefa bastante
demorada e consumptiva, em termos de tempo – compreendeu como etapas principais a
digitalização dos registos, o preenchimento das falhas nos registos, a selecção (definição dos limiares
de cheia) e a “delimitação” temporal dos acontecimentos de cheia considerados independentes e a
estimativa dos volumes de cheia associados a esses acontecimentos. Para uma melhor compreensão,
pormenoriza-se, em seguida, a metodologia aplicada em cada estação hidrométrica na recolha e
tratamento dos dados. Anota-se que, de modo a abranger as maiores cheias de cada ano hidrológico,
incluindo sempre e necessariamente a cheia com mais elevado caudal instantâneo, tal metodologia
incidiu sobre os dois a três meses de maior pluviosidade:
i) Leitura e digitalização, a partir de mapas obtidos por preenchimento manual (mapas de
aquisição de informação) e facultados pelo INAG, das alturas hidrométricas registadas
hora a hora e dos correspondentes caudais, quando também registados. Tal informação
encontra-se sistematizada no Anexo 1.
ii) Quando necessário, tratamento da informação recolhida, fundamentalmente mediante o
preenchimento de falhas de registo por interpolação entre alturas hidrométricas. Com
Código Nome Tipo de estaçãoBacia
hidrográfica
Área da bacia
hidrográfica (km2)
Rio Freguesia Concelho Distrito
26J/01H Albernoa
Limnimétrica
com
descarregador
Guadiana 169,85Rio Cobres ou
Ribeira de TergesAlbernoa Beja Beja
18L/01HCouto de
AndreirosLimnimétrica Tejo 244,54
Ribeira da Raia ou
de Seda
Crato e
Márti resCrato Porta legre
19M/01H Monforte
Limnimétrica
com
descarregador
Tejo 141,47Ribeira Grande ou
de AvizMonforte Monforte Porta legre
24H/03HTorrão do
Alentejo
Limnimétrica
com
descarregador
Sado 468,35Ribeira do
XarramaTorrão
Alcácer do
SalSetúbal
39
efeito, muito frequentemente, os mapas de aquisição de informação não contêm
registos de altura hidrométrica de hora a hora, mas antes espaçados de maiores
intervalos de tempo, por tal altura se manter sensivelmente constante ao longo de cada
um desses intervalos ou por ter variado de forma regular ao longo do mesmo.
iii) Por aplicação das curvas de vazão fornecidas pelo SNIRH – e que constam também do
Anexo 1 –, determinação dos caudais correspondentes às sucessivas alturas
hidrométricas intervaladas de uma hora. Houve que dispensar a apresentação, tanto das
anteriores alturas, como dos caudais que lhe correspondem pois a quantidade muito
considerável de informação em causa não é compaginável com uma organização em
formato de papel.
Nesta fase, dispõe-se, então, para cada estação hidrométrica e para cada ano hidrológico
considerado, de valores intervalados de uma hora de caudal instantâneo nos dois a três
meses de maior pluviosidade.
iv) Reconhecimento das situações de cheias de entre as quais serão seleccionadas aquelas
sobre as quais recairá a análise. Para o efeito, adoptou-se como limiar indicativo de
ocorrência de uma cheia o quíntuplo do caudal modular, (Quintela, 1996, p. 10.1). Assim,
para cada ano hidrológico e para cada estação, foram seleccionados os hidrogramas de
cheia com caudais superiores àquele limiar. No quadro 3.2, especificam-se para cada
estação hidrométrica o correspondente volume do escoamento anual médio, o caudal
modular que dele decorre, Q modular, e o limiar de caudal conducente à identificação de
uma cheia - 5 Q modular. Os escoamentos anuais médios foram obtidos a partir dos
escoamentos anuais apresentados no SNIRH e sistematizados no quadro 3.3.
Quadro 3.2 – Cálculo do caudal modular e do caudal correspondente ao limiar de cheia.
Estação hidrométrica Volume anual médio (m3) Q modular (m3/s) 5 Q modular (m3/s)
Albernoa 14815774 0,47 2,349
Couto de Andreiros 58219909 1,846 9,231
Monforte 29810975 0,945 4,726
Torrão do Alentejo 57769459 1,832 9,159
40
Quadro 3.3 – Escoamentos anuais em cada estação hidrométrica considerada.
Ano Albernoa Couto de Andreiros Monforte Torrão do Alentejo
1955 - - 68136 -
1956 - - 25034 -
1957 - - 14981 -
1958 - - 44064 -
1959 - - 53040 -
1960 - - 33864 -
1961 - - 30337 83772
1962 - - 54005 189181
1963 - 147991 63305 134183
1964 - 41787 8086 24738
1965 - 206364 82567 151441
1966 - 90711 22057 24800
1967 - 49749 10641 48898
1968 - 138228 52289 164105
1969 - 113986 44143 117247
1970 5002 48211 17311 24713
1971 11608 46480 16457 50031
1972 6981 43122 10995 31296
1973 2391 - 6212 12816
1974 7646 32930 14941 16534
1975 5101 3349 1042 1863
1976 44126 106996 49076 125979
1977 26475 138836 46784 119051
1978 64357 125088 86648 145484
1979 9290 32800 14644 27631
1980 259 1552 390 4924
1981 16450 29018 17848 46733
1982 - 3379 581 1557
1983 24280 65440 41587 52672
1984 21090 91574 55166 108350
1985 8802 - 23456 47126
1986 8500 33872 23217 32241
1987 28519 76241 31480 78567
1988 11626 5644 2776 5717
1989 68222 70851 - 123806
1990 14498 44608 - -
1991 238 4706 - 1519
1992 5242 4312 -
1993 7481 - - 42520
1994 49 - - -
1995 - - - -
1996 28866 - - 69816
1997 - - - -
1998 - - - 3536
1999 - - - -
2000 - - - -
2001 5245 2794 - 22118
2002 7701 - 21061 -
2003 9011 22819 24553 23073
2004 5 - 1379 3474
2005 8303 22899 20717 30428
2006 - 61092 42347 86778
2007 1925 13828 - 10471
2008 - - 15222 21589
Média (dam3) 14816 58220 29811 57769
Escoamento anual (dam3)
41
v) Diferenciação de cheias independentes. Para garantir a independência dos
acontecimentos, considerou-se que um hidrograma de cheia poderá conter mais do que
um caudal de pico, ficando limitado por valores mínimos de caudal (um no ramo
ascendente do hidrograma e outro no ramo descendente), separado do próximo
hidrograma por um período de recessão suficientemente longo, de modo a garantir a
anulação do escoamento directo. Para os hidrogramas de cheias definidos como indicado
resultaram, assim, durações da ordem dos dias. Para o caudal de ponta de cada
hidrograma adoptou-se o maior caudal instantâneo registado no decurso do mesmo.
Para uma melhor compreensão do processo de diferenciação, a figura que se segue
exemplifica o processo de selecção, onde são identificados quatro acontecimentos
independentes (a figura é idêntica à apresentada no ponto 2.2., onde este tema é
também abordado).
Figura 3.1 – Figura ilustrativa do processo de selecção de cheias independentes.
vi) Identificação, para cada hidrograma, do escoamento de base. Para o efeito, adoptou-se
um modelo muito simples, dado pela união, por meio de um segmento de recta, dos
menores caudais entre dois acontecimentos independentes. O volume associado ao
escoamento de base foi deduzido ao volume total da cheia, com obtenção, para cada
acontecimento, do correspondente volume do escoamento directo.
0
20
40
60
80
100
120
140
0 50 100 150 200 250 300 350 400
Cau
dal
(m
3/s
)
Tempo (h)
Série de caudais instantâneos Limiar = quíntuplo do módulo Cheia independente
1 2 3
1
42
vii) Determinação do volume do escoamento directo associado a cada cheia mediante
integração numérica do respectivo hidrograma, por aplicação de regra dos trapézios:
1
1
3600, com i 1,2,3,...,2
ni iQ Q
V n (3.1)
em que Qi é o caudal instantâneo na hora i (já deduzido do caudal correspondente ao
escoamento de base) e n é o número total de horas de registo de determinado
acontecimento independente.
Da aplicação do procedimento descrito, obteve-se para cada estação hidrométrica um conjunto de
acontecimentos de cheia, consubstanciados por hidrogramas de cheia independentes entre si e
definidos por uma sequência de caudais superiores ao limiar de cinco vezes o caudal modular na
secção da estação. A cada hidrograma foi atribuído um caudal de ponta (igual ao mais elevado caudal
instantâneo no decurso dessa cheia) e um volume do escoamento directo.
Dado o elevado número de acontecimentos de cheia em causa – 199 distribuídos por 68, 42, 50 e 39
nas estações hidrométricas de Albernoa, Couto de Andreiros, Monforte e Torrão do Alentejo,
respectivamente – julgou-se adequado restringir a sua inclusão no presente documento, tanto mais
que uma apresentação exaustiva não conteria conteúdo informativo adicional relevante. Deste
modo, a título de exemplo baseado em cada uma daquelas estações, apresentam-se no Anexo 2 os
diagramas cronológicos de caudal que permitiram a selecção dos acontecimentos de cheia em dois
anos hidrológicos, sendo que a designação atribuída a cada acontecimento respeita a simbologia
oportunamente se referirá a propósito dos quadros 3.4 a 3.7.
A partir da informação recolhida como indicado, foram constituídas, para cada estação hidrométrica,
os seguintes quatro tipos de amostras, sobre as quais recaiu o estudo: i) amostras de caudais de
ponta de cheia acima do limiar adoptado para essa estação; ii) amostra dos volumes do escoamento
directo correspondentes aos anteriores caudais; iii) amostra de caudais instantâneos máximos anuais
constituída mediante a consideração, em cada ano hidrológico, de um único hidrograma de cheia, o
que apresentou mais elevado caudal de ponta que, assim, constitui o máximo caudal instantâneo
nesse ano; e iv) amostra dos volumes do escoamento directo correspondentes aos anteriores
caudais. Para simplificar a apresentação do estudo, os volumes de cheia correspondentes ao
escoamento directo serão, por regra, referidos por volumes de cheia.
As anteriores amostras, bem como as correspondentes estatísticas amostrais mais relevantes
(médias, desvios-padrão e coeficientes de assimetria avaliados por aplicação do método dos
43
momentos) são apresentadas nos quadros 3.4, 3.5, 3.6 e 3.7. Para identificar as diferentes amostras
adoptou-se a seguinte simbologia:
Amostras de caudais instantâneos máximos anuais – Q ima;
Amostras dos volumes de cheia associados aos caudais instantâneos máximos anuais – V ma;
Amostras de caudais de ponta de cheia acima de um dado limiar – Q acima limiar;
Amostras dos volumes de cheia associados aos caudais de ponta de cheia acima de um dado
limiar – V acima limiar.
Em cada quadro e no que respeita às amostras acima de limiares, indicou-se o número de ordem de
cada evento de cheia e o ano hidrológico da sua ocorrência, para o que esse ano foi identificado pelo
ano civil em que se inicia. Relativamente às amostras de máximos anuais, especificou-se apenas o
ano hidrológico, também de acordo com a anterior simbologia.
44
45
Quadro 3.4 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Albernoa.
Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma
Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)
1/1969 26,414 2976,328 35/1985 55,538 6250,216 1969 141,114 28543,365
2/1969 59,004 2636,742 36/1985 20,468 1214,459 1970 11,065 1431,554
3/1969 141,114 28543,365 37/1985 11,705 463,787 1971 38,979 2509,916
4/1969 21,794 1356,184 38/1986 6,670 545,201 1972 39,611 4693,621
5/1969 27,814 1719,886 39/1986 5,126 571,446 1973 3,123 913,324
6/1970 7,897 1029,164 40/1986 6,207 331,734 1974 63,767 3073,293
7/1970 11,065 1431,554 41/1986 50,645 2927,337 1975 23,925 1679,161
8/1971 38,979 2509,916 42/1987 98,674 5799,166 1976 217,376 8438,035
9/1971 4,018 521,068 43/1987 64,661 11495,632 1977 122,937 5985,871
10/1971 14,201 985,845 44/1988 44,230 1916,474 1983 131,117 6309,070
11/1972 39,611 4693,621 45/1988 141,342 3282,329 1984 88,994 6919,620
12/1973 3,123 913,324 46/1988 7,621 400,209 1985 55,538 6250,216
13/1974 26,649 2126,369 47/1989 254,682 14078,184 1986 50,645 2927,337
14/1974 4,321 314,089 48/1989 91,546 4783,357 1987 98,674 5799,166
15/1974 63,767 3073,293 49/1989 85,828 2600,717 1988 141,342 3282,329
16/1975 23,925 1679,161 50/1989 45,559 2910,594 1989 254,682 14078,184
17/1976 8,929 1520,116 51/1989 12,383 885,442 1990 97,161 3812,512
18/1976 21,725 1157,616 52/1989 105,817 6736,744 1992 36,698 3217,300
19/1976 30,811 2105,659 53/1989 73,553 3467,896 1993 25,722 2245,847
20/1976 27,139 1888,520 54/1990 10,385 784,541 1996 172,601 5928,490
21/1976 217,376 8438,035 55/1990 97,161 3812,512
22/1977 10,531 1366,403 56/1992 36,698 3217,300
23/1977 122,937 5985,871 57/1993 3,359 446,123
24/1977 33,949 2417,428 58/1993 4,060 472,019
25/1977 4,511 290,738 59/1993 25,722 2245,847
26/1983 14,811 226,044 60/1996 23,720 1372,712
27/1983 6,660 165,327 61/1996 104,045 5228,232
28/1983 88,272 2194,705 62/1997 61,243 2240,722
28/1983 9,378 347,698 63/1996 131,690 6197,943
30/1983 131,117 6309,070 64/1996 172,601 5928,490
31/1983 57,446 4048,396 65/1996 82,185 2645,998
32/1984 6,260 489,081 66/1996 84,297 2731,526
33/1984 4,630 209,486 67/1996 76,498 3304,695
34/1984 88,994 6919,620 68/1996 109,206 7785,796
Média 53,004 3259,781 Média 90,754 5901,911
Desvio padrão 53,648 4140,671 Desvio padrão 69,582 6119,762
Coef. de assimetria
(adimensional)1,544 3,892
Coef. de assimetria
(adimensional)0,873 2,985
N 68 N 20
λ 3,400
Ano hidrológico
46
Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma
Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)
1/1963 127,200 33193,080 22/1974 122,713 6738,120 1963 196,550 13941,864
2/1963 196,550 13941,864 23/1974 41,850 2309,490 1964 46,279 5710,320
3/1964 46,279 5710,320 24/1974 94,100 12429,180 1965 321,000 40506,300
4/1965 40,172 8991,990 25/1975 3,400 1380,240 1966 174,200 7747,560
5/1965 175,800 31971,660 26/1983 35,608 1568,781 1967 53,950 10446,840
6/1965 321,000 40506,300 27/1983 198,260 12957,956 1968 144,700 30864,780
7/1966 103,750 9434,160 28/1984 9,192 588,752 1969 141,738 40007,970
8/1966 174,200 7747,560 29/1984 231,379 17485,315 1970 41,059 4374,720
9/1967 53,950 10446,840 30/1984 120,140 4068,726 1971 69,347 20492,550
10/1967 6,925 561,600 31/1986 64,297 2373,945 1972 49,459 14879,520
11/1968 61,054 9215,460 32/1986 27,604 2402,803 1974 122,713 6738,120
12/1968 22,600 2380,560 33/1986 76,991 4744,673 1975 3,400 1380,240
13/1968 11,863 796,320 34/1987 10,162 766,193 1983 198,260 12957,956
14/1968 144,700 30864,780 35/1987 51,701 5983,662 1984 231,379 17485,315
15/1969 9,311 739,140 36/1987 84,609 14306,229 1986 64,297 2373,945
16/1969 141,738 40007,970 37/1988 18,931 2225,007 1987 84,609 14306,229
17/1969 81,800 7710,429 38/1989 33,376 4296,802 1988 18,931 2225,007
18/1970 32,400 9396,270 39/1989 137,841 9788,254 1989 137,841 9788,254
19/1970 41,059 4374,720 40/1989 65,189 4967,431
20/1971 69,347 20492,550 41/1989 23,927 2007,355
21/1972 49,459 14879,520 42/1989 88,168 5845,991
Média 82,157 10061,857 Média 116,651 14234,861
Desvio padrão 70,434 10694,666 Desvio padrão 84,251 11968,866
Coef. de assimetria
(adimensional)1,358 1,663
Coef. de assimetria
(adimensional)0,812 1,242
N 42 N 18
λ 2,333
Ano hidrológico
Quadro 3.5 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Couto de Andreiros.
47
Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma
Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)
1/1963 63,009 3059,322 26/1978 65,851 1142,386 1963 154,091 5969,914
2/1963 154,091 5969,914 27/1981 12,385 315,251 1965 233,915 5207,164
3/1963 65,151 4128,164 28/1981 269,726 8579,677 1968 169,526 18868,240
4/1963 10,930 263,160 29/1981 5,775 166,368 1969 151,440 12908,798
5/1965 233,915 5207,164 30/1981 29,741 3533,521 1972 87,032 2678,611
6/1965 70,854 1823,966 31/1981 20,745 1311,997 1973 35,259 2413,433
7/1965 39,424 982,989 32/1981 42,814 3353,068 1974 146,872 2888,780
8/1965 85,037 3881,426 33/1983 61,012 2317,243 1978 272,688 5406,915
9/1965 27,084 636,342 34/1983 272,598 15006,344 1981 269,726 8579,677
10/1968 169,526 18868,240 35/1984 16,345 528,562 1983 272,598 15006,344
11/1969 147,426 6453,311 36/1984 10,212 421,126 1984 195,578 12245,087
12/1969 151,440 12908,798 37/1984 195,578 12245,087 1985 115,542 17555,765
13/1969 145,457 7594,727 38/1984 80,150 2604,741 1986 146,122 6982,795
14/1969 12,197 543,967 39/1985 15,211 418,409 1987 87,390 10538,857
15/1969 110,831 2154,667 40/1985 115,542 17555,765 1988 29,516 1590,859
16/1972 87,032 2678,611 41/1985 17,303 729,755
17/1973 16,764 695,622 42/1986 146,122 6982,795
18/1973 35,259 2413,433 43/1987 6,095 114,074
19/1973 12,209 980,620 44/1987 19,693 1217,825
20/1974 146,872 2888,780 45/1987 60,529 5411,183
21/1974 46,080 2266,465 47/1987 8,119 258,340
22/1978 76,333 1155,415 47/1987 87,390 10538,857
23/1978 272,688 5406,915 48/1987 8,090 341,375
24/1978 82,147 2239,583 49/1987 12,385 718,015
25/1978 62,601 701,668 50/1988 29,516 1590,859
Média 78,666 3866,118 Média 157,820 8589,416
Desvio padrão 74,823 4614,847 Desvio padrão 80,088 5660,745
Coef. de assimetria
(adimensional)1,246 1,818 Coef. de assimetria 0,030 0,520
N 50 N 15
λ 3,333
Ano hidrológico
Quadro 3.6 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Monforte.
48
Nº/ Q acima limiar V acima limiar Nº/ Q acima limiar V acima limiar Qima Vma
Ano hidrológico (m3/s) (x1000 m3) Ano hidrológico (m3/s) (x1000 m3) (m3/s) (x1000 m3)
1/1961 168,191 43442,797 21/1981 9,054 200,168 1961 168,191 43442,797
2/1961 62,296 8308,435 22/1981 132,147 15815,315 1964 134,932 12093,466
3/1964 134,932 12093,466 23/1983 163,297 19397,803 1966 79,923 4438,264
4/1964 50,311 7227,329 24/1984 92,756 6549,564 1967 272,407 16419,798
5/1966 79,923 4438,264 25/1984 179,845 29790,841 1968 197,399 38596,928
6/1967 31,458 1583,757 26/1984 72,804 3694,859 1971 166,116 26154,511
7/1967 141,539 11048,049 27/1985 161,144 34027,279 1972 90,999 15288,858
8/1967 17,019 1707,585 28/1986 129,766 11381,513 1974 55,578 5049,349
9/1967 272,407 16419,798 29/1987 78,885 9422,639 1981 132,147 15815,315
10/1968 73,135 6015,123 30/1987 201,549 16456,283 1983 163,297 19397,803
11/1968 180,365 22653,122 31/1989 48,752 9755,399 1984 179,845 29790,841
12/1968 82,875 5974,927 32/1989 128,197 15471,273 1985 161,144 34027,279
13/1968 8,021 283,431 33/1989 325,028 14720,380 1986 129,766 11381,513
14/1968 8,564 436,999 34/1989 41,088 4724,952 1987 201,549 16456,283
15/1968 197,399 38596,928 35/1989 114,937 9363,680 1989 325,028 14720,380
16/1968 12,857 396,598 36/1989 48,364 2694,742 1990 177,398 23014,054
17/1971 166,116 26154,511 37/1990 37,433 4180,970 1999 23,328 2686,085
18/1972 90,999 15288,858 38/1990 177,398 23014,054
19/1974 55,578 5049,349 39/1999 23,328 2686,085
20/1974 22,746 1822,894
Média 103,141 11853,590 Média 156,414 19339,619
Desvio padrão 75,854 10947,132 Desvio padrão 73,597 11787,590
Coef. de assimetria
(adimensional)0,852 1,270
Coef. de assimetria
(adimensional)0,424 0,598
N 39 N 17
λ 2,294
Ano hidrológico
Quadro 3.7 – Amostras Q ima, V ma, Q acima limiar e V acima limiar da estação hidrométrica de Torrão do Alentejo.
49
4. Apresentação e análise de resultados
4.2. Aplicação dos modelos de distribuição de frequências
4.2.1. Considerações prévias
No capítulo 2 apresentaram-se os modelos de distribuição de frequências das leis Normal, de
Gumbel, log-Normal, Pearson tipo III, log-Pearson tipo III e de Goodrich, que se admitiu poderem ser
aplicados às séries de caudal e de volume de cheia adoptadas como casos de estudo, caracterizadas
no capítulo 3. A adaptabilidade das anteriores distribuições as essas séries foi verificada por
aplicação de diferentes procedimentos, compreendendo testes de hipótese e medidas de erro, que,
em conjunto com a observação visual do ajustamento das distribuições teóricas aos valores
amostrais, são o fundamento para a selecção da lei que se admite melhor representar cada uma das
variáveis aleatórias em questão. Como especificado no capítulo 2, as medidas de erro apenas foram
utilizadas para optar entre distribuições teóricas e somente quando os testes de hipóteses e o
ajustamento visual sugerissem a adequação dessas distribuições.
A aplicação dos modelos de distribuição de frequências requer a determinação prévia dos
parâmetros que permitem a estimação de valores da variável aleatória a partir da equação fornecida
pelo método do factor de frequência, de acordo com o procedimento de cálculo objecto do capítulo
2.4.
Assim, nos próximos capítulos, apresentam-se, para cada uma das séries de caudal ou de volume de
cheia referentes a uma dada estação hidrométrica, de entre as quatro estações com registos
analisados – Albernoa, Couto de Andreiros, Monforte e Torrão do Alentejo - os resultados obtidos, os
quais, para o efeito, foram organizados nos elementos que seguidamente se especificam:
uma figura contendo quatro gráficos referentes ao ajustamento de leis às amostras de
caudais de cheia acima de dados limiares e instantâneos máximos anuais, bem como às
amostras dos volumes de cheia correspondentes aos anteriores caudais;
um quadro com os resultados da aplicação do teste do qui-quadrado, onde se incluem
também os valores das respectivas estatística de teste e dos quantis2
1 ;
um quadro com os resultados da aplicação do teste de Kolmogorov-Smirnov, analogamente,
compreendendo os valores respectivas das estatística de teste e dos valores críticos DN,1-α;
um quadro com os valores obtidos para as medidas de erro aplicadas.
A partir dos anteriores resultados procede-se por fim à selecção da lei que se admite apresentar
melhor ajustamento a cada uma das séries em estudo.
50
4.2.2. Estação hidrométrica de Albernoa
Os resultados do ajustamento das leis estatísticas objecto do capítulo 2.3. às amostras de caudais
acima de limiar (Q acima limiar) e de caudais instantâneos máximos anuais (Q ima) e dos
correspondentes volumes de cheia (V acima limiar e V ma) na estação hidrométrica de Albernoa, no
período analisado de 20 anos, entre 1969/70 e 1996/97, são apresentados na figura 4.1 e nos
quadros 4.1, 4.2 e 4.3 referentes ao ajustamento visual e à aplicação dos testes de qui-quadrado e de
Kolmogorov-Smirnov e das medidas de erro, respectivamente.
Figura 4.1 - Estação hidrométrica de Albernoa. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.
0
50
100
150
200
250
300
350
-4.0 -2.0 0.0 2.0 4.0
z
Q a
cim
a lim
iar
(m3/s
)
a1)
0
5000
10000
15000
20000
25000
30000
35000
-4.0 -2.0 0.0 2.0 4.0
z
V a
cim
a lim
iar
(10
00
m3 )
b1)
0
50
100
150
200
250
300
350
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0
z
Q im
a (
m3/s
)
a2)
0
5000
10000
15000
20000
25000
30000
35000
-3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0
z
V m
a (
100
0 m
3)
b2)
-100,0
4900,0
9900,0
14900,0
19900,0
24900,0
29900,0
34900,0
-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0
V (m
3)
z
F = 1/(N+1)
Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich
51
Quadro 4.1 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Quadro 4.2 – Estação hidrométrica de Albernoa. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson
tipo III
Estatística de teste (χ2) 17,588 22,000 18,765 14,059 29,059 21,118
v.a. Χ2, α=0,05, M-m-1 g. l. 14,067 14,067 14,067 12,592 14,067 12,590
Resultado do teste 0 0 0 0 0 0
Estatística de teste (χ2) 24,059 39,647 10,235 5,529 59,353 73,471
v.a. Χ2, α=0,05, M-m-1 g. l. 14,067 14,067 14,067 12,592 14,067 12,592
Resultado do teste 0 0 1 1 0 0
Estatística de teste (χ2) 3,447 1,016 3,434 1,631 5,866 1,631
v.a. Χ2, α=0,05, M-m-1 g. l. 7,815 7,815 7,815 5,991 7,815 5,991
Resultado do teste 1 1 1 1 1 1
Estatística de teste (χ2) 7,635 10,586 1,003 6,452 16,044 5,844
v.a. Χ2, α=0,05, M-m-1 g. l. 7,815 7,815 7,815 5,991 7,815 5,991
Resultado do teste 1 0 1 0 0 1
Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson tipo
III
Estatística de teste (DN) 0,130 0,148 0,092 0,324 0,167 0,324
DN,1-α, α=0,05 0,165 0,165 0,165 0,165 0,165 0,165
Resultado do teste 1 1 1 0 0 0
Estatística de teste (DN) 0,102 0,222 0,080 0,069 0,219 0,281
DN,1-α, α=0,05 0,165 0,165 0,165 0,165 0,165 0,165
Resultado do teste 1 0 1 1 0 0
Estatística de teste (DN) 0,068 0,090 0,111 0,050 0,126 0,246
DN,1-α, α=0,05 0,294 0,294 0,294 0,294 0,294 0,294
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,125 0,186 0,092 0,095 0,256 0,122
DN,1-α, α=0,05 0,294 0,294 0,294 0,294 0,294 0,294
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
52
Quadro 4.3 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento de cor
cinzenta).
Para a série de Q acima limiar, constata-se que, para o nível de confiança de 95%, todas as leis
estatísticas aplicadas são rejeitadas pelo teste do qui-quadrado. No entanto, a observação da figura
4.1 permite verificar que a lei de Goodrich denota ajustamento à mencionada amostra, sendo que tal
lei, não só não é rejeitada pelo teste de Kolmogorov-Smirnov (para o anterior nível de confiança),
como também lhe correspondem os melhores valores das medidas de erro. Consequentemente,
optou-se por prosseguir o estudo no pressuposto de aplicação da lei de Goodrich à série de
Q acima limiar em Albernoa.
Relativamente às séries de V acima limiar e Q ima, verifica-se que a distribuição de log-Pearson tipo
III denota um bom ajustamento visual sendo que, no caso de Q ima, lhe correspondem os melhores
valores das medidas de erro e não é rejeitada por nenhum dos dois testes de hipóteses. Para a série
de V acima limiar, os testes também não rejeitam o ajustamento de tal lei e, com excepção de MAE
(a que, contudo, corresponde o segundo valor mais baixo) obtêm-se os melhores valores das
medidas de erro. Deste modo, a lei de log-Pearson tipo III foi adoptada para ambas as séries de
V acima limiar e de Q ima.
No que respeita à amostra de V ma, o andamento irregular dos pontos da amostra, visível no
correspondente gráfico da figura 4.1, não permite optar inequivocamente por uma lei. Deste modo,
atendeu-se exclusivamente aos resultados dos quadros 4.1 e 4.2 tendo-se seleccionado, de entre as
Goodrich Gumbel log-Normallog-Pearson
tipo IIINormal
Pearson tipo
III
RMSE 6,220 11,252 36,622 23,335 22,118 6,997
%SEP 11,734 21,229 69,093 44,025 41,729 13,200
ARV 0,014 0,045 0,473 0,192 0,173 0,017
E2 0,986 0,955 0,527 0,808 0,827 0,983
MAE 4,772 8,158 13,758 10,103 15,864 5,469
RMSE 1033,097 1944,197 766,587 914,986 2686,990 1085,531
%SEP 31,692 59,642 23,517 28,069 82,429 33,301
ARV 0,063 0,224 0,035 0,050 0,427 0,070
E2 0,937 0,776 0,965 0,950 0,573 0,930
MAE 509,911 1206,879 403,657 374,971 1763,795 664,931
RMSE 7,465 8,514 15,022 6,977 16,169 8,565
%SEP 2,931 3,343 5,898 2,739 6,349 3,363
ARV 0,020 0,027 0,083 0,018 0,072 0,027
E2 0,980 0,973 0,917 0,982 0,928 0,973
MAE 6,462 7,507 11,765 5,444 12,064 7,353
RMSE 1117,230 2169,825 796,940 799,463 3004,130 1091,056
%SEP 3,914 7,602 2,792 2,801 10,525 3,822
ARV 0,170 0,642 0,087 0,087 0,402 0,162
E2 0,830 0,358 0,913 0,913 0,598 0,838
MAE 802,134 1724,037 505,338 516,808 2505,306 817,968
V ma
Q acima limiar
V acima limiar
Q ima
53
distribuições não rejeitadas por ambos os testes de hipóteses, a que apresenta melhores resultados
ao nível das medidas de erro, ou seja, a lei log-Normal.
4.2.3. Estação hidrométrica de Couto de Andreiros
Seguem-se a figura 4.2 e os quadros 4.4 a 4.6 referentes à identificação das leis estatísticas com
melhor ajustamento às amostras de caudais acima de limiar e instantâneos máximos anuais e dos
correspondentes volumes na estação hidrométrica de Couto de Andreiros, no período de 18 anos,
entre 1964/65 e 1989/90.
Figura 4.2 – Estação hidrométrica de Couto de Andreiros. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.
0
50
100
150
200
250
300
350
-4,0 -2,0 0,0 2,0 4,0
Q a
cim
a lim
iar
(m3/s
)
z
a1)
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
-4,0 -2,0 0,0 2,0 4,0
V a
cim
a lim
iar
(10
00
m3)
z
b1)
0
50
100
150
200
250
300
350
-4,0 -2,0 0,0 2,0 4,0
Q im
a (m
3/s
)
z
a2)
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
-4,0 -2,0 0,0 2,0 4,0
V m
a (1
00
0 m
3)
z
b2)
-100,0
4900,0
9900,0
14900,0
19900,0
24900,0
29900,0
34900,0
-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0
V (
m3
)
z
F = 1/(N+1)
Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich
54
Quadro 4.4 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Quadro 4.5 – Estação hidrométrica de Couto de Andreiros. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson
tipo III
Estatística de teste (χ2) 1,727 5,588 4,301 2,156 18,029 2,585
v.a. Χ2, α=0,05, M-m-1 g. l. 12,592 12,592 12,592 11,070 12,592 11,070
Resultado do teste 1 1 1 1 0 1
Estatística de teste (χ2) 9,449 12,843 1,298 2,156 19,707 11,179
v.a. Χ2, α=0,05, M-m-1 g. l. 12,592 12,592 12,592 11,070 12,592 11,070
Resultado do teste 1 0 1 1 0 0
Estatística de teste (χ2) 1,444 0,889 4,778 3,111 2,556 3,667
v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841
Resultado do teste 1 1 1 1 1 1
Estatística de teste (χ2) 0,889 2,556 2,000 0,889 2,556 0,889
v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson tipo
III
Estatística de teste (DN) 0,048 0,081 0,069 0,047 0,131 0,060
DN,1-α, α=0,05 0,210 0,210 0,210 0,210 0,210 0,210
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,138 0,159 0,069 0,073 0,188 0,138
DN,1-α, α=0,05 0,210 0,210 0,210 0,210 0,210 0,210
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,086 0,102 0,124 0,071 0,130 0,100
DN,1-α, α=0,05 0,309 0,309 0,309 0,309 0,309 0,309
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,085 0,100 0,087 0,062 0,171 0,090
DN,1-α, α=0,05 0,309 0,309 0,309 0,309 0,309 0,309
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
55
Quadro 4.6 – Estação hidrométrica de Albernoa. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento de cor
cinzenta).
Por observação da figura 4.2 verifica-se que, para as séries de Q acima limiar, de V acima limiar e de
V ma, as leis com melhor ajustamento são as log-Pearson tipo III e log-Normal, especialmente no que
respeita aos pontos amostrais localizados nas caudas das curvas das distribuições teóricas. A lei log-
Pearson tipo III não é rejeitada em nenhum dos testes de hipóteses (quadros 4.4 e 4.5) e apresenta
os melhores resultados no que respeita às medidas de erro (quadro 4.6), pelo que foi a adoptada
para as três variáveis aleatórias em menção.
Embora o gráfico relativo a Q ima não seja esclarecedor quanto à lei com melhor ajustamento,
permite excluir algumas das distribuições postuladas, evidenciando ainda que os pontos amostrais se
distribuem de forma mais ou menos equilibrada em torno das leis Pearson tipo III, de Gumbel e de
Goodrich. Visto os testes de hipóteses não rejeitarem nenhuma destas distribuições, optou-se pela
lei de Gumbel, uma vez que, de entre as três, é a que fornece os melhores resultados para as
medidas de erro.
4.2.4. Estação hidrométrica de Monforte
Na figura 4.3 e quadros 4.7 a 4.9 apresentam-se os resultados referentes à identificação das leis
estatísticas com melhor ajustamento às amostras de caudais acima de limiar e instantâneos máximos
Goodrich Gumbel log-Normallog-Pearson
tipo IIINormal
Pearson tipo
III
RMSE 6,782 11,014 39,533 8,250 24,557 7,716
%SEP 8,255 13,406 48,119 10,042 29,890 9,392
ARV 0,009 0,025 0,323 0,014 0,125 0,012
E2 0,991 0,975 0,677 0,986 0,875 0,988
MAE 4,740 8,038 16,070 4,512 17,858 5,640
RMSE 2579,278 3173,882 5536,298 3327,647 5014,485 2413,079
%SEP 25,634 31,544 55,023 33,072 49,837 23,982
ARV 0,060 0,090 0,275 0,099 0,225 0,052
E2 0,940 0,910 0,725 0,901 0,775 0,948
MAE 1985,025 2488,209 1767,312 1205,339 4185,593 1708,673
RMSE 12,184 12,116 70,902 13,491 20,633 12,357
%SEP 10,445 10,387 60,782 11,565 17,688 10,593
ARV 0,022 0,022 0,750 0,027 0,064 0,023
E2 0,978 0,978 0,250 0,973 0,936 0,977
MAE 10,554 10,245 34,995 10,117 15,261 10,948
RMSE 2495,954 2895,813 4423,866 2697,022 4364,517 2678,702
%SEP 17,534 20,343 31,078 18,947 30,661 18,818
ARV 0,046 0,062 0,145 0,054 0,141 0,053
E2 0,954 0,938 0,855 0,946 0,859 0,947
MAE 1562,057 1883,307 2254,672 1710,378 3584,051 1690,560
V ma
Q acima limiar
V acima limiar
Q ima
56
anuais e dos correspondentes volumes na estação hidrométrica de Monforte, no período de 15 anos,
compreendido entre 1963/64 e 1988/89.
Figura 4.3 – Estação hidrométrica de Monforte. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
-4,0 -2,0 0,0 2,0 4,0V
aci
ma
limia
r (1
00
0 m
3)
z
b1)
0
50
100
150
200
250
300
350
-4,0 -2,0 0,0 2,0 4,0
Q im
a (m
3/s
)
z
a2)
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
-4,0 -2,0 0,0 2,0 4,0
V m
a (1
00
0 m
3)
z
b2)
0
50
100
150
200
250
300
350
-4,0 -2,0 0,0 2,0 4,0
Q a
cim
a lim
iar
(m3/s
)
z
a1)
-100,0
4900,0
9900,0
14900,0
19900,0
24900,0
29900,0
34900,0
-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0
V (
m3
)
z
F = 1/(N+1)
Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich
57
Quadro 4.7 – Estação hidrométrica de Monforte. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Quadro 4.8 – Estação hidrométrica de Monforte. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson
tipo III
Estatística de teste (χ2) 16,400 22,000 9,200 6,800 28,400 17,200
v.a. Χ2, α=0,05, M-m-1 g. l. 14,067 14,067 14,067 12,592 14,067 12,592
Resultado do teste 0 0 1 1 0 0
Estatística de teste (χ2) 23,600 46,000 2,800 3,600 70,800 23,600
v.a. Χ2, α=0,05, M-m-1 g. l. 0,210 0,210 0,210 0,210 0,210 0,210
Resultado do teste 1 1 1 1 1 1
Estatística de teste (χ2) 4,667 2,667 2,000 2,000 4,667 4,667
v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841
Resultado do teste 1 1 1 1 1 0
Estatística de teste (χ2) 0,667 1,333 1,333 1,333 2,000 0,667
v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson tipo
III
Estatística de teste (DN) 0,131 0,129 0,121 0,108 0,163 0,128
DN,1-α, α=0,05 0,192 0,192 0,192 0,192 0,192 0,192
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,177 0,191 0,067 0,066 0,199 0,174
DN,1-α, α=0,05 0,192 0,192 0,192 0,192 0,192 0,192
Resultado do teste 1 1 1 1 0 1
Estatística de teste (DN) 0,088 0,140 0,187 0,110 0,090 0,089
DN,1-α, α=0,05 0,338 0,338 0,338 0,338 0,338 0,338
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,077 0,107 0,097 0,096 0,112 0,088
DN,1-α, α=0,05 0,338 0,338 0,338 0,338 0,338 0,338
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
58
Quadro 4.9 – Estação hidrométrica de Monforte. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento de cor
cinzenta).
A figura 4.3, relativa ao ajustamento visual, evidencia que, em resultado da disposição dos pontos
amostrais, não é possível identificar leis mais aptas a descrever as variáveis aleatórias em apreciação.
Uma vez que os testes de hipóteses (quadros 4.7 e 4.8) apenas indicam a rejeição ou não de
hipóteses, também não permitem identificar a distribuição estatística com melhor ajustamento. Por
fim, os resultados das medidas de erro (quadro 4.9) apenas fornecem informação, de algum modo,
complementar não podendo, em circunstância alguma, sustentar a opção por leis estatísticas em
face de dadas amostras. Deste modo, optou-se por excluir do estudo subsequente as séries de
caudais e de volumes de cheia na estação hidrométrica de Monforte.
4.2.5. Estação hidrométrica de Torrão do Alentejo
A figura 4.4 e os quadros 4.10 a 4.12 contêm os resultados do ajustamento das leis estatísticas
seleccionadas às amostras de caudais acima de limiar e instantâneos máximos anuais e dos
correspondentes volumes na estação hidrométrica de Torrão do Alentejo, no período de 17 anos,
entre 1961/62 e 1999/2000.
Goodrich Gumbel log-Normallog-Pearson
tipo IIINormal
Pearson tipo
III
RMSE 13,821 17,652 46,905 34,135 29,368 15,407
%SEP 17,570 22,439 59,625 43,392 37,332 19,586
ARV 0,035 0,057 0,401 0,212 0,157 0,043
E2 0,965 0,943 0,599 0,788 0,843 0,957
MAE 10,400 13,640 16,259 12,729 22,971 11,709
RMSE 819,403 1403,369 2389,293 1791,944 2307,696 870,703
%SEP 21,194 36,299 61,801 46,350 59,690 22,521
ARV 0,032 0,094 0,274 0,154 0,255 0,036
E2 0,968 0,906 0,726 0,846 0,745 0,964
MAE 643,626 1169,012 661,096 538,115 1906,532 683,671
RMSE 16,145 23,392 48,024 18,402 16,675 16,706
%SEP 10,230 14,822 30,430 11,660 10,566 10,585
ARV 0,044 0,091 0,385 0,057 0,046 0,047
E2 0,956 0,909 0,615 0,943 0,954 0,953
MAE 13,715 17,859 27,954 13,906 13,902 13,840
RMSE 935,971 1099,099 2147,853 1438,583 1316,080 1043,293
%SEP 10,897 12,796 25,006 16,748 15,322 12,146
ARV 0,029 0,040 0,154 0,069 0,058 0,036
E2 0,971 0,960 0,846 0,931 0,942 0,964
MAE 825,831 937,835 1191,503 893,611 1086,720 925,927
V ma
Q acima limiar
V acima limiar
Q ima
59
Figura 4.4 – Estação hidrométrica de Torrão do Alentejo. Ajustamento visual de leis estatísticas às amostras de: a1) Q acima limiar; b1) V acima limiar, a2) Q ima; e b2) V ma.
Quadro 4.10 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste do qui-quadrado às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
0
50
100
150
200
250
300
350
-4,0 -2,0 0,0 2,0 4,0
Q a
cim
a lim
iar
(m3/s
)
z
a1)
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
-4,0 -2,0 0,0 2,0 4,0
V a
cim
a lim
iar
(10
00
m3)
z
b1)
0
50
100
150
200
250
300
350
-4,0 -2,0 0,0 2,0 4,0
Q im
a (m
3/s
)
z
a2)
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
-4,0 -2,0 0,0 2,0 4,0
V m
a (1
00
0 m
3)
z
b2)
-100,0
4900,0
9900,0
14900,0
19900,0
24900,0
29900,0
34900,0
-3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0
V (
m3
)
z
F = 1/(N+1)
Amostra Normal Gumbel log-Normal Pearson tipo III log-Pearson tipo III Goodrich
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson
tipo III
Estatística de teste (χ2) 3,051 4,692 11,667 7,154 7,974 3,051
v.a. Χ2, α=0,05, M-m-1 g. l. 11,070 11,070 11,070 9,488 11,070 9,488
Resultado do teste 1 1 0 1 1 1
Estatística de teste (χ2) 2,231 3,051 3,872 1,821 17,821 2,641
v.a. Χ2, α=0,05, M-m-1 g. l. 11,070 11,070 11,070 9,488 11,070 9,488
Resultado do teste 1 1 1 1 0 1
Estatística de teste (χ2) 3,294 8,000 8,588 1,529 0,941 2,118
v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841
Resultado do teste 1 0 0 1 1 1
Estatística de teste (χ2) 1,529 1,529 1,529 3,294 1,529 0,941
v.a. Χ2, α=0,05, M-m-1 g. l. 5,991 5,991 5,991 3,841 5,991 3,841
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
60
Quadro 4.11 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais e de volumes de cheia. Nível de confiança de 95%.
Quadro 4.12 – Estação hidrométrica de Torrão do Alentejo. Resultados da aplicação das medidas de erro às amostras de caudais e de volumes de cheia (nota: os melhores resultados estão assinalados por meio de células com preenchimento
de cor cinzenta).
As leis Pearson tipo III, de Goodrich e de Gumbel apresentam um bom ajustamento visual à série Q
acima limiar e nenhuma delas é rejeitada pelos testes de hipóteses. Recorrendo aos resultados das
medidas de erro, optou-se por associar a esta série a lei de Goodrich.
Goodrich Gumbel Log-NormalLog-Pearson
tipo IIINormal
Pearson tipo
III
Estatística de teste (DN) 0,072 0,090 0,120 0,093 0,105 0,074
DN,1-α, α=0,05 0,213 0,213 0,213 0,213 0,213 0,213
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,083 0,096 0,104 0,051 0,128 0,087
DN,1-α, α=0,05 0,213 0,213 0,213 0,213 0,213 0,213
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,122 0,154 0,204 0,148 0,119 0,114
DN,1-α, α=0,05 0,318 0,318 0,318 0,318 0,318 0,318
Resultado do teste 1 1 1 1 1 1
Estatística de teste (DN) 0,111 0,094 0,150 0,091 0,155 0,118
DN,1-α, α=0,05 0,318 0,318 0,318 0,318 0,318 0,318
Resultado do teste 1 1 1 1 1 1
Nota: 1 – hipótese não rejeitada ; 0 – hipótese rejeitada
Q acima limiar
V acima limiar
Q ima
V ma
Goodrich Gumbel log-Normallog-Pearson
tipo IIINormal
Pearson tipo
III
RMSE 10,526 11,602 19,959 11,466 56,125 17,467
%SEP 10,206 11,249 19,351 11,117 54,416 16,935
ARV 0,020 0,024 0,071 0,023 0,562 0,054
E2 0,980 0,976 0,929 0,977 0,438 0,946
MAE 8,203 9,942 13,795 9,520 27,501 11,302
RMSE 1220,670 1841,430 3838,948 1439,477 13793,746 1497,288
%SEP 10,298 15,535 32,386 12,144 116,368 12,632
ARV 0,013 0,029 0,126 0,018 1,629 0,019
E2 0,987 0,971 0,874 0,982 -0,629 0,981
MAE 890,895 1397,735 3024,336 1062,926 4877,592 848,581
RMSE 16,189 16,379 16,088 15,175 34,588 20,061
%SEP 10,350 10,472 10,286 9,702 22,113 12,826
ARV 0,051 0,053 0,051 0,045 0,235 0,079
E2 0,949 0,947 0,949 0,955 0,765 0,921
MAE 13,614 14,167 12,340 12,938 26,748 15,677
RMSE 1719,876 1865,007 2503,003 1802,754 5016,586 1690,263
%SEP 8,893 9,643 12,942 9,322 25,939 8,740
ARV 0,023 0,027 0,048 0,025 0,192 0,022
E2 0,977 0,973 0,952 0,975 0,808 0,978
MAE 1439,404 1567,201 2071,447 1510,169 2767,889 1390,569
V ma
Q acima limiar
V acima limiar
Q ima
61
A avaliação visual nas séries de volume, V acima limiar e V ma, permite concluir com clareza que a lei
de log-Pearson tipo III é a que melhor se ajusta a ambas as séries. A distribuição não é rejeitada nos
testes de hipóteses e apresenta bons resultados no que se refere às medidas de erro.
Para a série Q ima, a lei seleccionada foi a de Pearson tipo III. O ajustamento visual não permitiu
identificar com clareza qual a melhor distribuição, de modo que a decisão fundamentou-se na análise
conjunta dos resultados dos testes de hipóteses e das medidas de erro (melhores valores para a lei
de Pearson tipo III).
4.2.6. Resumo de resultados
Nos capítulos anteriores apresentaram-se os resultados do ajustamento das diferentes leis
estatísticas postuladas às amostras de caudais e volumes de cheia nas quatro estações hidrométricas
seleccionadas como casos de estudo. Foi, assim, possível identificar a distribuição estatística que
melhor se ajusta aos pontos de cada amostra, ou seja, a lei que se admite melhor representar a
variável aleatória a que respeita essa amostra. Uma vez identificada essa lei e calculados os
respectivos parâmetros, pode prosseguir-se com a estimação de valores da variável aleatória para
diferentes probabilidades de não-excedência.
Em conformidade com os resultados antecedentes, sistematizaram-se, no quadro 4.13, as leis
estatísticas seleccionadas bem como os valores dos parâmetros que as definem, calculados por
aplicação dos modelos e equações apresentados no capítulo 2. De tal sistematização, como, aliás, da
restante análise, excluiu-se a estação hidrométrica de Monforte, como antes justificado. De modo a
simplificar as utilizações subsequentes dos modelos estatísticos sistematizados no anterior quadro,
incluíram-se no mesmo as médias e os desvios-padrão das diferentes amostras. Os números das
equações que, para as leis seleccionadas, definem o factor de probabilidade e que permitem a
estimação de valores das variáveis aleatórias de acordo com a equação geral (2.23) são também
especificados no quadro.
62
Quadro 4.13 – Identificação das leis estatísticas seleccionadas para caracterizar cada variável aleatória. Valores dos parâmetros estatísticos de cada distribuição.
4.3. Comparação entre os resultados baseados em séries de valores
acima de um limiar e séries de valores máximos anuais
No presente trabalho, foram utilizadas duas abordagens distintas para constituir as amostras de
caudais e de volumes de cheia e, consequentemente, para estabelecer os modelos de estimação
desses caudais e volumes: abordagem baseada em séries de valores máximos anuais de ora em
diante, também identificada por método I, e baseada em séries de valores acima de dados limiares
ou método II. Nos capítulos anteriores, identificou-se, para cada método e para cada variável, o
modelo estatístico aplicável, bem como os valores dos parâmetros que lhes correspondem,
estimados a partir da respectiva amostra.
No caso do método II, o modelo estatístico é ajustado à série de valores da amostra que excedem
determinado limite ou limiar. Se existirem M desses valores em N anos de registo, então o número
médio de acontecimentos por ano é M N . Este resultado permite determinar o período de
retorno em anos de um qualquer valor através da equação (2.1). No método I, o modelo de
frequências é ajustado à série constituída pelo máximo valor em cada ano. Uma vez que tal série é de
Q acima limiar V acima limiar Q ima V ma
Distribuição Goodrich log-Pearson tipo III log-Pearson tipo III log-Normal
α -10,499 -3,814 2,304 8,359
β 0,007 0,110 0,635 0,792
θ 0,842 103,514 2,853 -
λ 3,400 3,400 - -
Média 53,004 (m3/s ) 3259,781 (1000 m3) 90,754 (m3/s ) 5901,911 (1000 m3)
Desvio-padrão 53,648 (m3/s ) 4140,671 (1000 m3) 69,582 (m3/s ) 6119,762 (1000 m3)
Factor de probabilidade eq. (3.30) eq. (3.29) eq. (3.29) eq. (3.26)
Distribuição log-Pearson tipo III log-Pearson tipo III Gumbel log-Pearson tipo III
α 0,815 0,795 78,733 5,025
β 0,346 0,176 65,691 0,225
θ 9,156 44,464 - 18,527
λ 2,333 2,333 - -
Média 82,157 (m3/s ) 10061,857 (1000 m
3) 116,651 (m
3/s ) 14234,861 (1000 m
3)
Desvio-padrão 70,434 (m3/s ) 10694,666 (1000 m3) 84,251 (m3/s ) 11968,866 (1000 m3)
Factor de probabilidade eq. (3.29) eq. (3.29) eq. (3.28) eq. (3.29)
Distribuição Goodrich log-Pearson tipo III Pearson tipo III log-Pearson tipo III
α -23,138 6,192 -190,612 7,940
β 0,000 0,700 15,608 0,348
θ 0,583 3,707 22,233 4,897
λ 2,294 2,294 - -
Média 103,121 (m3/s ) 11853,590 (1000 m3) 156,414 (m3/s ) 19339,619 (1000 m3)
Desvio-padrão 75,854 (m3/s ) 10947,132 (1000 m
3) 73,597 (m
3/s ) 11787.59 (1000 m
3)
Factor de probabilidade eq. (3.30) eq. (3.29) eq. (3.29) eq. (3.29)
Albernoa
Couto de
Andreiros
Torrão do
Alentejo
63
duração anual, não há necessidade de proceder a qualquer tipo de correcção no cálculo do período
de retorno.
Tendo-se seleccionado os modelos estatísticos que permitem caracterizar as diferentes variáveis
analisadas, um exercício pertinente consiste em comparar as estimativas de caudal ou de volume de
cheia fornecidas pelos modelos baseados nas séries de valores, por um lado, acima de dados limiares
e, por outro lado, máximos anuais. De facto, se os dois métodos de constituição de amostras forem
válidos, é de esperar que, para o mesmo período de retorno e para uma mesma grandeza – caudal
ou volume de cheia – , forneçam estimativas semelhantes e que, portanto, a relação entre essas
estimativas seja muito aproximadamente linear.
Numa primeira fase, optou-se por comparar as estimativas em causa para um intervalo de valores de
período de retorno com grande amplitude – designadamente para 2, 4, 10, 20, 25, 50, 100 e 1000
anos – de modo a avaliar a adequação da relação linear em toda a gama de valores expectáveis de
projecto de T. Tal comparação foi efectuada para as variáveis de caudal e de volume de cheia em
cada estação hidrométrica, com a excepção já justificada da estação de Monforte. As figuras 4.5 a 4.7
ilustram graficamente as relações assim obtidas. Em tais figuras o eixo das abcissas refere-se às
estimativas fornecidas pelo método I e os das ordenadas, às decorrentes do método II, umas e outras
para os períodos de retorno antes especificados. Os quadros 4.14 a 4.16, além de conterem os pares
de valores utilizados na elaboração daquelas figuras, tornam expedita a comparação das sucessivas
estimativas.
Cada uma das figuras 4.5 a 4.7 contém ainda o segmento de recta que representa a regressão linear
entre as estimativas em comparação nessa figura, bem como o correspondente valor do coeficiente
de determinação, R2, que não é mais que o quadrado do coeficiente de correlação de Pearson, ρ, e
que permite avaliar quantitativamente a qualidade da relação linear. O valor de R2 varia entre 0 e 1
sendo que se R2 é igual à unidade então 100% da variância da variável a que se refere o eixo das
ordenadas é explicada pela variância da variável a que se refere o eixo das abcissas. Deste modo,
quanto maior o valor de R2, melhor a relação linear entre as variáveis. O coeficiente de correlação de
Pearson é determinado através da aplicação da equação (2.45). Os valores dos coeficientes de
determinação foram também incluídos nos quadros 4.14 a 4.16.
– Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes de
determinação, R2.
64
Figura 4.5 – Estação hidrométrica de Albernoa: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes de
determinação, R2.
Figura 4.6 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes
de determinação, R2.
Figura 4.7 – Estação hidrométrica de Couto de Andreiros: relação entre estimativas de caudal (à esquerda) e de volume (à direita) obtidas pelos métodos I e II. Segmentos de recta representativos da regressão linear e respectivos coeficientes
de determinação, R2.
R² = 0,9995
0
10000
20000
30000
40000
50000
60000
0 10000 20000 30000 40000 50000 60000
Volume estimado a partir do método II (1000 m3)
Volume estimado a partir do método I (1000 m3)
R² = 0,933
0
50
100
150
200
250
300
350
400
450
0 50 100 150 200 250 300 350 400 450
Caudal estimado a partir do método II (m3/s)
Caudal estimado a partir do método I (m3/s)
R² = 0,9949
0
20000
40000
60000
80000
100000
0 20000 40000 60000 80000 100000
Volume estimado a partir do método II (1000 m3)
Volume estimado a partir do método I (1000 m3)
R² = 0,9995
0
50
100
150
200
250
300
350
400
450
500
550
600
0 50 100 150 200 250 300 350 400 450 500 550 600
Caudal estimado a partir do método II (m3/s)
Caudal estimado a partir do método I (m3/s)
R² = 0,9979
0
50
100
150
200
250
300
350
400
450
0 50 100 150 200 250 300 350 400 450
Caudal estimado a partir do método II (m3/s)
Caudal estimado a partir do método I (m3/s)
R² = 0,9985
0
10000
20000
30000
40000
50000
60000
70000
80000
0 10000 20000 30000 40000 50000 60000 70000 80000
Volume estimado a partir do método II (1000 m3)
Volume estimado a partir do método I (1000 m3)
65
Quadro 4.14 – Estação hidrométrica de Albernoa. Comparação entre estimativas de caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de valores acima de limiares (método II).
Coeficientes de determinação, R2.
Quadro 4.15 – Estação hidrométrica de Couto de Andreiros. Comparação entre estimativas de caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de valores acima de limiares (método II).
Coeficientes de determinação, R2.
Quadro 4.16 – Estação hidrométrica de Torrão do Alentejo. Comparação entre estimativas de caudal e de volume de cheia baseadas em séries de valores máximos anuais (método I) e em séries de valores acima de limiares (método II).
Coeficientes de determinação, R2.
Método I Método II Método I Método II
(log-Pearson tipo III) (Goodrich) (log-Normal) (log-Pearson tipo III)
2 75,161 105,935 4267,125 5969,343
4 134,259 140,470 7277,687 8996,746
10 197,312 183,974 11767,191 13926,627
20 235,366 215,677 15687,692 18418,012
25 246,078 225,701 17058,439 20012,408
50 275,141 256,353 21682,937 25450,674
100 298,617 286,354 26904,497 31660,954
1000 347,189 382,341 49250,722 58458,982
R2 0,9330 0,9995
Caudal de cheia (m3/s) Volume de cheia (1000 m3)T (anos)
Método I Método II Método I Método II
(Gumbel) (log-Pearson tipo III) (log-Pearson tipo III) (log-Pearson tipo III)
2 102,811 126,001 9780,044 14653,011
4 160,578 180,907 18777,343 23559,831
10 226,562 254,052 33775,903 38013,603
20 273,848 309,120 47995,216 51051,730
25 288,848 326,712 53167,811 55645,073
50 335,055 380,743 71275,227 71169,541
100 380,921 433,601 92775,491 88631,436
1000 532,476 597,921 194210,799 161074,308
R2 0,9995 0,9949
T (anos)Caudal de cheia (m3/s) Volume de cheia (1000 m3)
Método I Método II Método I Método II
(Pearson tipo III) (Goodrich) (log-Pearson tipo III) (log-Pearson tipo III)
2 151,238 157,878 17273,661 19384,863
4 202,776 202,120 26986,224 28551,076
10 253,376 252,473 37246,966 39734,287
20 285,639 286,542 43722,485 47279,387
25 295,323 296,949 45617,090 49529,364
50 323,778 327,843 50990,809 55961,741
100 350,303 356,903 55680,652 61575,616
1000 429,456 443,819 67417,655 75067,856
R2
T (anos)Caudal de cheia (m3/s) Volume de cheia (1000 m3)
0,9979 0,9985
66
A observação dos quadros 4.14 a 4.16 e das figuras 4.5 a 4.7 permite extrair duas conclusões. A
primeira é a de que, uma vez que os resultados obtidos pelas duas abordagens são muito
semelhantes, não parecem existir diferenças significativas entre os dois métodos. De facto, tanto
para caudais, como para volumes de cheia, os coeficientes de determinação entre estimativas
obtidas pelos dois métodos são sempre superiores ou iguais a 0,93.
A segunda conclusão relaciona-se com o facto de o método II (séries acima de limiares) fornecer, em
geral, estimativas de caudal e de volume de cheia superiores às que se obtêm através do método I.
Isto é verdade para todas as variáveis, excepto para o volume de cheia em Couto de Andreiros. Tais
diferenças não são, contudo, significativas, podendo afirmar-se que, de acordo com a primeira
conclusão, as duas abordagens fornecem resultados em tudo equivalentes. Em face desta
constatação, admite-se que a utilização de séries de máximos anuais possa apresentar vantagens.
Com efeito, no que respeita ao método II baseado nas séries de valores acima de limiar, à crítica
oportunamente indicada – relacionada com a introdução de um factor de algum modo arbitrário na
definição desse limiar –, adiciona-se a dificuldade em constituir as amostras requeridas por tal
método, face à informação por norma disponível, designadamente através do Sistema Nacional de
Informação de Recursos Hídricos, SNIRH, disponibilizado pelo Instituto da Água.
Em contrapartida, no ajustamento de modelos estatísticos no âmbito do método II existe uma maior
confiança na decisão, uma vez que o ajustamento visual das distribuições teóricas às amostras é
significativamente mais fácil que no método I (ver figuras 4.1, 4.2 e 4.4). Tal facto poderá estar
relacionado com a própria forma como os métodos são construídos, pois no método II, por definição,
as amostras têm sempre uma dimensão superior às utilizadas no método I.
A anterior observação está de acordo com o trabalho de CUNNANE, 1973, que conclui que os
métodos baseados em informação acima de limiares podem ser mais eficientes que os métodos que
utilizam máximos anuais, se a dimensão das séries naqueles primeiros métodos for, no mínimo, 1,65
vezes superior às dimensões das correspondentes séries de máximos anuais, para 10T . Recorda-
se que as dimensões das séries de valores acima de limiar, utilizadas no trabalho que se apresenta,
são duas a três vezes superiores às dimensões das respectivas séries de valores máximos anuais
(parâmetro λ no quadro 4.13).
De forma a consolidar as anteriores conclusões, optou-se por comparar o conjunto de resultados
obtidos nas três estações hidrométricas, para o que as diferentes estimativas de caudal e de volume
de cheia, sistematizadas nos quadros 4.14, 4.15 e 4.16, foram expressas em termos de valores
específicos, por divisão pelas áreas das bacias hidrográficas a que respeitam (quadro 3.1). Os
resultados obtidos são apresentados na figura 4.8.
67
Figura 4.8 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Relação entre estimativas de caudal específico de cheia (à esquerda) e de volume específico de cheia (à direita) obtidas pelos métodos I e II.
Segmentos de recta representativos das regressões lineares e respectivos coeficientes de determinação, R2.
Mais uma vez, é possível estabelecer equações de regressão linear com coeficientes de determinação
superiores a 0,96, tanto para caudal, como para volume de cheia. Confirma-se, portanto, que, no
caso das três estações hidrométricas com registos analisados, os dois processos de constituição das
amostras fornecem estimativas de uma mesma variável – caudal ou volume – muito próximas. Por
fim, observa-se que a dispersão dos pontos representativos dos pares de valores de caudal ou de
volume em torno da respectiva recta de regressão é mais acentuada para os períodos de retorno
mais elevados. Este facto poderá ser o reflexo da imprecisão da inferência estatística que decorre da
dimensão reduzida das amostras.
4.4. Relações entre estimativas de caudal de cheia e de volume
associado
O trabalho que se apresenta teve como segundo objectivo principal o de procurar uma possível
relação entre estimativas de caudal de cheia, Q, e de volume associado a esse caudal, V, ( )V f Q .
Para tal, procedeu-se a uma comparação equivalente à efectuada no capítulo 4.3. tendo por base as
estimativas, antes utilizadas, de caudal específico de cheia e do correspondente volume específico no
conjunto das três estações com as quais se prosseguiu o estudo. Para o efeito, fez-se corresponder à
estimativa do caudal específico de cheia com dado período de retorno a estimativa do volume
específico de cheia com o mesmo período de retorno. Os períodos de retorno considerados
coincidem com os antes adoptados a propósito das figuras 4.7 e 4.8 e dos quadros 4.14 a 4.16 (2, 4,
10, 20, 25, 50, 100 e 1000 anos), sendo que se representaram de modo separado os resultados
R² = 0,9619
0,0
0,5
1,0
1,5
2,0
2,5
0,0 0,5 1,0 1,5 2,0 2,5
Caudal específico estimado a partir do método II (m3/s/km2)
Caudal específico estimado a partir do método I (m3/s/km2)
R² = 0,9783
0
100
200
300
400
500
600
700
800
0 100 200 300 400 500 600 700 800
Volume específico estimado a partir do método II (1000 m3/km2)
Volume específico estimado a partir do método I (1000 m3/km2)
68
baseados em valores máximos anuais (método I) e em valores acima de limiar (método II), conforme
se apresenta na figura 4.9 que inclui ainda a representação das rectas de regressão linear e os
valores dos correspondentes coeficientes de determinação.
Figura 4.9 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Relação entre estimativas de valores específicos do caudal de cheia e de volume de cheia com o mesmo período de retorno fornecidas pelo método I
(à esquerda) e pelo método II (à direita). Segmentos de recta representativos das regressões lineares e respectivos coeficientes de determinação, R2.
A figura 4.9 evidencia que, não obstante os coeficientes de determinação não serem tão baixos
quanto isso, não tem sentido falar em relações lineares – nem de outro tipo conforme decorre da
disposição dos pontos naquela figura – entre estimativas de valores específicos de caudais de cheia e
de volumes de cheia com o mesmo período de retorno.
Esta conclusão constituiu um dos fundamentos para o trabalho que se segue, que consiste na
aplicação da teoria das cópulas com o intuito de extrair dependências de índole estatística entre
estimativas de caudais de ponta de cheia e de volumes.
4.5. Resultados da aplicação da teoria das cópulas e da lei bivariada
de Gumbel
4.5.1. Considerações prévias
Na consequência dos resultados apresentados nos capítulos antecedentes, os dados disponíveis para
a realização da análise multivariada objecto do presente capítulo são os correspondentes a apenas
três das quatro estações hidrométricas inicialmente consideradas: Albernoa, Couto de Andreiros e
Torrão do Alentejo. Recorda-se que aquando da análise estatística convencional das amostras de
R² = 0,744
0
100
200
300
400
500
600
700
800
0 1 2 3
Volume específico estimado a partir do método II (1000 m3/km2)
Caudal específico estimado a partir do método II (m3/s/km2)
R² = 0,5223
0
100
200
300
400
500
600
700
800
0 1 2 3
Volume específico estimado a partir do método I (1000 m3/km2)
Caudal específico estimado a partir do método I (m3/s/km2)
69
caudais instantâneos máximos anuais e acima de limiar e dos correspondentes volumes de cheia na
estação hidrométrica de Monforte, não foi possível seleccionar nenhuma das leis estatísticas
aplicadas para caracterizar as variáveis aleatórias, uma vez que o desenvolvimento das curvas
teóricas, quando representadas em gráfico, não revelou uma proximidade que se considerasse
adequada ao desenvolvimento dos pontos amostrais das variáveis.
A análise multivariada incide sobre amostras constituídas por mais do que uma variável sendo que
nas aplicações efectuadas se consideraram, em cada estação hidrométrica, as seguintes amostras:
Amostras de caudais instantâneos máximos anuais e dos volumes associados a esses caudais.
Amostras de caudais acima de dado limiar e dos volumes associados a esses caudais.
Previamente à aplicação dos modelos multivariados e até para averiguar em que medida tais
modelos se poderiam justificar, analisou-se a correlação entre as duas variáveis que constituem cada
uma das anteriores amostras, com obtenção dos coeficientes de correlação de Pearson apresentados
no quadro 4.17.
Quadro 4.17 - Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Coeficientes de correlação de Pearson entre caudais instantâneos máximos anuais e correspondentes volumes de cheia e entre caudais acima de
limiares e correspondentes volumes de cheia.
Atendendo a que, no conjunto das três estações hidrométricas, apenas as amostras de caudais de
cheia acima de dados limiares e dos correspondentes volumes apresentam coeficientes de
correlação com algum significado, optou-se por prosseguir com a aplicação da análise multivariada
apenas a essas amostras.
Deste modo, no presente capítulo, procede-se à apresentação e à análise dos resultados da aplicação
da teoria das cópulas e da lei bivariada de Gumbel às mencionadas amostras.
Caudais máximos anuais e
correspondentes volumes
Caudais acima de limiar e
corerspondentes volumes
Albernoa 0,563 0,694
Couto de Andreiros 0,624 0,720
Torrão do Alentejo 0,418 0,722
70
4.5.2. Aplicação e selecção das funções cópula e da lei bivariada de Gumbel
A aplicação das funções cópula apresentadas no capítulo 2 implica o cálculo do parâmetro θ de cada
cópula, que se pode definir como sendo um estimador da dependência entre as duas variáveis em
presença (caudais e volumes associados a esses caudais) e que requer a determinação do coeficiente
de Kendall, τ. De forma análoga, o parâmetro m é o estimador de dependência utilizado na aplicação
da lei bivariada de Gumbel, cujo cálculo depende do coeficiente de correlação de Pearson, ρ.
Dada a importância dos anteriores parâmetros, no quadro que se segue são apresentados os valores
obtidos para os mesmos tendo por base cada amostra caudal/volume de cheia. Por uma questão de
sistematização, incluíram-se ainda os valores antes apresentados do coeficiente de correlação de
Pearson.
Quadro 4.18 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Valores do coeficiente de
correlação de Pearson, ; do parâmetro m da lei bivariada de Gumbel; do coeficiente de Kendall, ; e dos parâmetros θ das funções cópula Clayton, θClayton, Frank, θFrank, e Gumbel-Hougaard, θGumbel.
Em relação aos valores do quadro anterior é possível tecer uma observação que se julga pertinente:
já se afirmou que a construção dos modelos bivariados depende fundamentalmente do coeficiente
de correlação de Pearson, ρ, e do coeficiente de Kendall, τ, para a lei de Gumbel e para as funções
cópula, respectivamente. O facto de estes coeficientes não apresentarem a mesma tendência – por
exemplo, os menores valores de ρ e de τ não correspondem à mesma amostra – , significa que os
coeficientes avaliam de forma diferente a dependência entre as variáveis em presença e que,
portanto, a construção dos modelos assenta em bases de diferente natureza.
Obtidos os parâmetros que permitem construir as funções bivariadas – de Gumbel e as três cópulas
referidas –, determinaram-se as probabilidades conjuntas para as amostras referentes a cada uma
das estações hidrométricas. Tais probabilidades são confrontadas com as probabilidades conjuntas
Albernoa Couto de Andreiros Torrão do Alentejo
ρ 0,694 0,720 0,722
m 1,809 1,889 1,896
τ 0,741 0,642 0,744
θClayton 5,722 3,591 5,800
θFrank 13,574 9,182 13,732
θGumbel 3,861 2,795 3,900
71
empíricas atribuídas aos sucessivos elementos das amostras, para o que se utilizou a função empírica
de probabilidades conjuntas (2.60). Essa confrontação passa pela disposição num mesmo gráfico dos
pontos representativos das probabilidades amostrais (empíricos) e das probabilidades conjuntas
teóricas, F(Q,V). Na construção dos gráficos adoptou-se a organização utilizada por YUE e
RASMUSSEN, 2002, pelo que os pontos foram ordenados por valores crescentes das probabilidades
teóricas relativas a cada cópula ou à lei bivariada de Gumbel. O eixo das abcissas é simplesmente o
número de ordem de cada elemento da amostra assim ordenada. Desta forma, de seguida são
apresentadas três figuras – figuras 4.10 a 4.12, uma por cada estação hidrométrica – referentes à
amostra de caudais acima de limiar/correspondentes volumes de cheia, (Q,V), sendo que cada figura
contém quatro gráficos relativos aos três tipos de cópulas utilizados e à lei bivariada de Gumbel. A
disposição dos pontos da amostra nesses gráficos é, obviamente, sempre a mesma.
Figura 4.10 – Estação hidrométrica de Albernoa. Caudais de cheia acima de limiar e correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel e d) bivariada de Gumbel.
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 20 40 60 80
F(Q
,V)
Número de ordem
a)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 20 40 60 80
F(Q
,V)
Número de ordem
b)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 20 40 60 80
F(Q
,V)
Número de ordem
c)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 20 40 60 80
F(Q
,V)
Número de ordem
d)
0,0000
0,2000
0,4000
0,6000
0,8000
1,0000
1,2000
0 10 20 30 40 50 60 70 80
Pro
bab
ilid
ade
co
nju
nta
de
não
exc
ed
ên
cia
Número de ordem dos pares de caudal e volume
Empírica Clayton Frank Gumbel Bivariada Gumbel
72
Figura 4.11 – Estação hidrométrica de Couto de Andreiros. Caudais de cheia acima de limiar e correspondentes volumes. Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel e d) bivariada de Gumbel.
Figura 4.12 – Estação hidrométrica de Torrão do Alentejo. Caudais de cheia acima de limiar e correspondentes volumes.
Ajustamento gráfico das funções de: a) Clayton, b) Frank, c) Gumbel e d) bivariada de Gumbel.
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40 50
F(Q
,V)
Número de ordem
a)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40 50
F(Q
,V)
Número de ordem
b)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40 50
F(Q
,V)
Número de ordem
c)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40 50
F(Q
,V)
Número de ordem
d)
0,0000
0,2000
0,4000
0,6000
0,8000
1,0000
1,2000
0 10 20 30 40 50 60 70 80
Pro
bab
ilid
ade
co
nju
nta
de
não
exc
ed
ên
cia
Número de ordem dos pares de caudal e volume
Empírica Clayton Frank Gumbel Bivariada Gumbel
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40
F(Q
,V)
Número de ordem
a)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40
F(Q
,V)
Número de ordem
b)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40
F(Q
,V)
Número de ordem
c)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0 10 20 30 40
F(Q
,V)
Número de ordem
d)
0,0000
0,2000
0,4000
0,6000
0,8000
1,0000
1,2000
0 10 20 30 40 50 60 70 80
Pro
bab
ilid
ade
co
nju
nta
de
não
exc
ed
ên
cia
Número de ordem dos pares de caudal e volume
Empírica Clayton Frank Gumbel Bivariada Gumbel
73
Por observação das figuras 4.11 a 4.12 verifica-se, aliás, como foi já mencionado no capítulo 2.6.4.,
que as curvas representativas das quatro funções teóricas apresentam ajustamentos aos pontos
amostrais praticamente indiferenciáveis, não possibilitando a selecção visual de uma dessas funções.
Deste modo, com o intuito de identificar a função com melhor ajustamento, foi aplicado o teste de
Kolmogorov-Smirnov e, a título indicativo, avaliados os desvios quadráticos médios entre valores
teóricos e empíricos. Os resultados assim obtidos são apresentados nos quadros 4.19 e 4.20,
respectivamente. Em tais quadros, os resultados que se admitiu serem indicativos de melhor
ajustamento são realçados por meio de células com preenchimento de cor cinzenta.
Quadro 4.19 – Resultados obtidos da aplicação do teste de Kolmogorov-Smirnov às amostras de caudais acima de limiares e dos correspondentes volumes de cheia. Nível de confiança de 95%. (nota: os menores valores da estatística do
teste estão assinalados por meio de células com preenchimento de cor cinzenta).
Quadro 4.20 – Desvio quadrático médio entre os valores das probabilidades conjuntas teóricas e empíricas das amostras de caudais acima de limiares e dos correspondentes volumes de cheia (nota: os menores valores de desvio quadrático
médio estão assinalados por meio de células com preenchimento de cor cinzenta).
Por observação do quadro 4.19, verifica-se que nenhuma hipótese é rejeitada, o que significa que
não é possível excluir nenhuma das funções com base nos resultados do teste de Kolmogorov-
Smirnov. Em face de tal circunstância considerou-se que as funções a adoptar para representar as
distribuições de probabilidade conjunta seriam as que apresentassem os menores valores da
estatística do teste. Assim, seleccionaram-se as cópulas de Frank, na estação hidrométrica de
Albernoa, e a de Clayton, nas estações hidrométricas de Couto de Andreiros e Torrão do Alentejo.
Cópula Clayton Cópula Gumbel Cópula FrankBivariada de
Gumbel
Estatística de teste (DN) 0,165 0,165 0,165 0,165
DN,1-α, α=0,05 0,130 0,119 0,116 0,117
Resultado do teste 1 1 1 1
Estatística de teste (DN) 0,210 0,210 0,210 0,210
DN,1-α, α=0,05 0,056 0,082 0,077 0,063
Resultado do teste 1 1 1 1
Estatística de teste (DN) 0,213 0,213 0,213 0,213
DN,1-α, α=0,05 0,045 0,056 0,062 0,083
Resultado do teste 1 1 1 1
Nota: 1 – hipótese não rejeitada; 0 – hipótese rejeitada
Albernoa
Couto de
Andreiros
Torrão do
Alentejo
Cópula Clayton Cópula Gumbel Cópula FrankBivariada de
Gumbel
0,037 0,035 0,038 0,062
0,025 0,034 0,033 0,030
0,019 0,025 0,029 0,048RMSE Torrão do Alentejo
RMSE Couto de Andreiros
RMSE Albernoa
74
No caso destas duas últimas estações hidrométricas, à cópula de Clayton correspondem também os
menores valores do desvio quadrático médio. Em Albernoa o menor desvio quadrático médio ocorre
para a cópula de Gumbel. Não obstante tal facto, manteve-se a opção pela cópula de Frank. Com
efeito, tal desvio mede simplesmente a média do quadrado das diferenças entre os valores de
probabilidade conjunta empíricos e teóricos, pelo que pode dar-se o caso de a função com melhor
ajustamento gráfico apresentar um erro superior a outra função aparentemente não tão adequada,
em resultado da existência de pontos esporádicos, em número reduzido, mas com afastamento
significativo em relação à curva teórica.
Por fim, considera-se importante sublinhar que a análise multivariada nunca resultou na selecção da
lei bivariada de Gumbel para descrever a distribuição de probabilidade conjunta das variáveis em
avaliação. No entanto, apenas no caso da estação hidrométrica de Torrão do Alentejo a tal lei
correspondem os mais elevados resultados no teste de ajustamento. Dado que apenas se analisaram
três casos de estudo, considera-se não ser válido afirmar que a teoria das cópulas possa fornecer um
modelo mais adequado do que a lei bivariada de Gumbel. Neste contexto, impõe-se ainda a seguinte
observação: a aplicação da lei de Gumbel na forma bivariada implica a assumpção de que as
distribuições de probabilidade marginal das variáveis em presença seguem também essa lei, o que
pode ser incorrecto, como, aliás, se concluiu nas aplicações efectuadas, em que a análise estatística
aplicada às amostras consideradas isoladamente nunca resultou na selecção da lei de Gumbel.
4.5.3. Probabilidade conjunta – apresentação de superfícies
O objectivo a que o presente estudo se propunha foi, neste ponto, atingido. Para as três estações
hidrométricas consideradas, e através da teoria das cópulas, foi possível construir um modelo
descritivo da probabilidade conjunta das variáveis caudal acima de limiar, Q, e dos volumes
associados a esses caudais, V. No seguinte quadro, sistematizam-se as funções seleccionadas e
indicam-se os respectivos parâmetros necessários à especificação das equações daquelas funções.
Quadro 4.21 – Estações hidrométricas de Albernoa, Couto de Andreiros e Torrão do Alentejo. Funções cópula adoptadas para caracterizar a probabilidade conjunta do caudal acima de limiar e do correspondente volume. Parâmetros das
funções, θ.
Cópula seleccionada Parâmetro θ
Albernoa Frank 13,574
Couto de Andreiros Clayton 3,591
Torrão do Alentejo Clayton 5,800
75
Na figura 4.13, apresentam-se as superfícies relativas a cada uma das funções cópula obtidas. Os
eixos horizontais correspondem às probabilidades marginais de não-excedência para caudal e para
volume e os eixos verticais, às probabilidades conjuntas dessas duas variáveis. Para obter as
anteriores curvas geraram-se aleatoriamente probabilidades marginais de não-excedência e
calcularam-se as correspondentes probabilidades conjuntas teóricas.
Figura 4.13 – Superfícies da distribuição de probabilidade conjunta de caudal e volume nas estações hidrométricas de: a) Albernoa; b) Couto de Andreiros e c) Torrão do Alentejo.
0,10,2
0,30,4
0,50,6
0,70,8
0,91,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,00,9
0,80,7
0,60,5
0,40,3
0,20,1
0,0
F(V)
F(Q
,V)
F(Q)
c)
0,10,2
0,30,4
0,50,6
0,70,8
0,91,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,00,9
0,80,7
0,60,5
0,40,3
0,20,1
0,0
F(V)
F(Q
,V)
F(Q)
a)
0,10,2
0,30,4
0,50,6
0,70,8
0,91,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,00,9
0,80,7
0,60,5
0,40,3
0,20,1
0,0
F(V)
F(Q
,V)
F(Q)
b)
0,10,2
0,30,4
0,50,6
0,70,8
0,91,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,00,9
0,80,7
0,60,5
0,40,3
0,20,1
0,0 F(V)
F(Q
,V)
F(Q)
0,0-0,1 0,1-0,2 0,2-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1,0
76
Apesar dos gráficos anteriores representarem fielmente as curvas a que respeitam, a sua utilidade é
algo reduzida. Assim, optou-se por construir três gráficos referentes a curvas de igual probabilidade
conjunta (isolinhas de probabilidade). Em tais gráficos, os eixos correspondem às probabilidades de
não-excedência das variáveis caudal acima de limiar, F(Q), e de volume associado, F(V), sendo que
cada curva respeita a uma dada probabilidade conjunta, F(Q,V). A figura 4.14, que se apresenta de
seguida, contém os três gráficos referidos.
Figura 4.14 – Curvas de igual probabilidade conjunta. a) Estação hidrométrica de Albernoa – cópula de Frank; b) Estação hidrométrica de Couto de Andreiros – cópula de Clayton; c) Estação hidrométrica de Torrão do Alentejo – cópula de
Clayton.
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(V
)
F(Q)
a)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(V
)
F(Q)
b)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(V
)
F(Q)
c)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,5 1
F(V
)
F(Q)
F(Q,V)=0,1
F(Q,V)=0,2
F(Q,V)=0,3
F(Q,V)=0,4
F(Q,V)=0,5
F(Q,V)=0,6
F(Q,V)=0,7
F(Q,V)=0,8
F(Q,V)=0,9
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 0,5 1
F(V
)
F(Q)
F(Q,V)=0,1
F(Q,V)=0,2
F(Q,V)=0,3
F(Q,V)=0,4
F(Q,V)=0,5
F(Q,V)=0,6
F(Q,V)=0,7
F(Q,V)=0,8
F(Q,V)=0,9
77
As figuras 4.13 e 4.14 constituem os resultados finais da análise multivariada efectuada. Contudo,
considerou-se conveniente procurar outras formas de ilustrar as curvas obtidas de modo a facilitar a
sua compreensão, bem como fornecer perspectivas relativamente a aplicações futuras da teoria das
cópulas. Assim, procedeu-se à construção de mais três gráficos, um para cada estação hidrométrica,
mas no pressuposto de que a probabilidade de não-excedência associada à variável volume é pré-
fixada, para o que se consideraram as probabilidades 0,25, 0,50 e 0,75. Fazendo variar a
probabilidade de não-excedência associada ao caudal obtiveram-se as curvas que fornecem a
probabilidade conjunta para aquelas probabilidades de não-excedência do volume. Resultaram,
assim, as curvas apresentadas nos gráficos da figura 4.15.
Figura 4.15 – Curvas de probabilidade conjunta de caudal acima de limiar e volume com probabilidade de não-excedência de 0,25, 0,50 e 0,75 para as variáveis de: a) Estação hidrométrica de Albernoa – cópula de Frank; b) Estação hidrométrica
de Couto de Andreiros – cópulas de Clayton; c) Estação hidrométrica de Torrão do Alentejo – cópula de Clayton.
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(Q
,V)
F(Q)
a)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(Q
,V)
F(Q)
b)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(Q
,V)
F(Q)
c)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
F(Q
,V)
F(Q)
a)F(Q,V<0,25)
F(Q,V<0,50)
F(Q,V<0,75)
78
Em cada gráfico da anterior figura, o eixo das abcissas corresponde à probabilidade de
não-excedência do caudal acima de limiar e o eixo das ordenadas, à probabilidade conjunta das duas
variáveis, uma vez fixada a probabilidade de não-excedência do volume.
O andamento de cada uma das curvas das da figura 4.15 traduz o comportamento esperado para as
duas variáveis em presença: à medida que a probabilidade de não-excendência da variável caudal
acima de limiar tende para a unidade, as curvas tendem para o valor da probabilidade de não-
excedência inerente à variável volume (cortes verticais nas superfícies da figura 4.13 para as
probabilidades de não-excedência estipuladas de 0,25, 0,50 e 0,75). De facto, probabilidades de não-
excedência da variável caudal perto da unidade correspondem a valores muito elevados de caudal,
pelo que poderão associar-se a praticamente qualquer valor da variável volume. Nesse caso extremo,
e para cada curva, a probabilidade conjunta é “independente” da probabilidade de não-excedência
da variável caudal e tenderá para o máximo possível – o valor estipulado para a probabilidade de
não-excedência da variável volume, no caso das figuras em apreciação, 0,25, 0,50 ou 0,75.
79
5. Conclusões
A investigação efectuada e que se apresenta teve por objectivo fundamental o estudo de modelos
estatísticos com vista à estimação de caudais e de volumes de cheia associados a dadas
probabilidades de não-excedência, ou seja, a dados períodos de retorno. Para tal, recorreu-se a duas
abordagens estatísticas distintas: a primeira envolvendo uma análise estatística convencional assente
em modelos de distribuição de frequências de variáveis consideradas isoladamente e a segunda
recorrendo uma análise estatística multivariada que permite construir modelos de distribuição de
probabilidade conjunta de diferentes variáveis, que, no caso das aplicações efectuadas, foram
consubstanciadas por caudais de cheia e pelos correspondentes volumes.
O estudo utilizou amostras de registos em quatro estações hidrométricas de Portugal Continental:
Albernoa, Couto de Andreiros, Monforte e Torrão do Alentejo. Para cada estação, tais amostras
envolveram caudais instantâneos máximos anuais e volumes de cheia atribuídos a esses caudais. No
entanto, considerou-se pertinente fazer incidir o estudo sobre outro tipo de amostras que, de
alguma forma, contivessem mais informação do que a patente em amostras de máximos anuais visto
que, para uma dada variável, estas últimas amostras são constituídas por uma única realização por
ano. Assim e em cada estação hidrométrica, analisaram-se amostras de caudais acima de dado limiar
e dos volumes associados a esses caudais as quais, necessariamente a par com os caudais
instantâneos máximos anuais e correspondentes volumes, contêm outros eventos superiores àquele
limiar, desde que estatisticamente independentes entre si. As amostras de valores acima de limiares
permitem considerar vários eventos por ano a que, eventualmente, poderão corresponder valores
superiores aos máximos valores noutros anos, o que constitui uma vantagem em relação às amostras
de máximos anuais.
Constituídas as amostras procedeu-se, numa primeira parte, à aplicação dos modelos de distribuição
de frequências das leis Normal, de Gumbel, log-Normal, Pearson tipo III, log-Pearson tipo III e de
Goodrich às séries de caudal e de volume de cheia adoptadas como casos de estudo, caracterizadas
no capítulo 3. A selecção do modelo de distribuição de frequências a aplicar a cada uma das variáveis
aleatórias recorreu a diferentes métodos de avaliação da adaptabilidade de distribuições estatísticas,
nomeadamente ao ajustamento visual das distribuições teóricas aos valores amostrais e à aplicação
dos testes de hipótese do qui-quadrado e de Kolmogorov-Smirnov. Foram também utilizadas
algumas medidas de erro para optar entre distribuições teóricas, mas somente quando os testes de
hipóteses e o ajustamento visual sugerissem a adequação dessas distribuições.
80
A abordagem aplicada resultou na construção de um modelo estatístico para caracterizar cada uma
das variáveis analisadas, sendo que os parâmetros desse modelo foram estimados a partir da
correspondente amostra pelo método dos momentos. Importa anotar que o estabelecimento de
modelos estatísticos só foi possível para as amostras de três das quatro estações hidrométricas
consideradas, uma vez que da avaliação da adaptabilidade das distribuições teóricas às amostras de
caudal e de volume de cheia na estação hidrométrica de Monforte se concluiu não ser possível
adoptar nenhuma das distribuições postuladas. Tal facto relacionar-se-á, muito provavelmente, com
a reduzida dimensão do respectivo período de registos.
No que se refere ao estudo das amostras relativas às estações hidrométricas de Albernoa, Couto de
Andreiros e Torrão do Alentejo, verificou-se que a leis mais frequentemente seleccionada foi a de
log-Pearson tipo III. Tal resultado vai de encontro ao reportado em trabalhos anteriores, cujas
conclusões foram, aliás, sistematizadas logo no capítulo introdutório do presente documento.
Nomeadamente, HENRIQUES, 1990, refere precisamente que a lei mencionada apresenta boa
adaptabilidade à generalidade das séries de caudais instantâneos máximos anuais. Para além disso,
com o objectivo de seleccionar o modelo mais adequado à análise da distribuição de frequências de
caudais instantâneos máximos anuais, HENRIQUES, 1981, realiza uma análise comparativa entre
diferentes modelos, concluindo que existe uma clara superioridade dos modelos baseados em
distribuições de três parâmetros (como a lei de log-Pearson tipo III), relativamente aos modelos
baseados em distribuições de dois parâmetros.
Neste ponto do estudo e para cada uma das três estações hidrométricas com que se prossegui a
análise, identificaram-se, assim, os quatro modelos estatísticos que se concluiu melhor
representarem as amostras analisadas, a saber, de caudais máximos anuais e de caudais acima de
limiar, bem como as amostras dos volumes atribuídos àqueles caudais.
O facto de se terem considerado amostras com diferentes géneses permitiu uma análise comparativa
adicional. Com efeito, a inferência estatística associada a caudais de ponta de cheia, concretamente
baseada em amostras de máximos anuais, está largamente documentada e é amplamente aceite,
quer na prática profissional, quer em termos de investigação. Para que o recurso a amostras de
valores acima de limiares se possa constituir uma abordagem alternativa (com as vantagens daí
decorrentes, designadamente, quando os períodos de registos são curtos) deve conduzir a quantis
próximos dos que resultariam da análise baseada em máximos anuais.
A comparação efectuada entre estimativas associadas a amostras de máximos anuais e a amostras
de valores acima de limiares conduziu às seguintes conclusões: a) as estimativas decorrentes de
umas e de outras amostras são muito próximas, correspondendo-lhes coeficientes de determinação
81
sempre superiores ou iguais a 0,93; e b) com uma única excepção, referente ao volume de cheia em
Couto de Andreiros, o recurso a amostras de valores acima de limiares forneceu estimativas de
caudal e de volume de cheia superiores às que se obtiveram a partir das amostras de máximos
anuais. Tais diferenças não são, contudo, significativas, podendo afirmar-se que as duas abordagens
fornecem resultados em tudo equivalentes o que se admite validar o recurso a amostras de valores
acima de limiar, designadamente quando estão em causa curtos períodos de registos.
Independentemente da anterior conclusão, tecem-se seguidamente alguns comentários sobre
vantagens e/ou desvantagens relativas dos dois tipos amostras em presença: a) em comparação às
amostras de máximos anuais, as de valores acima de limares contêm informação mais ampla dado
que aquelas primeiras amostras só consideram o maior evento de cada ano hidrológico, não tendo
em conta os seguintes maiores eventos que, contudo, podem ser superiores aos máximos eventos de
outros anos; b) a necessidade de fixar um limite para formar uma amostra de valores acima de limiar
constitui, em regra, um factor arbitrário (HENRIQUES, 1990, P. 328), carecendo de investigação
adicional; c) a constituição das amostras de valores acima de limiares é claramente mais difícil e
trabalhosa uma vez que a informação para o efeito requerida não está, por regra, acessível;
exemplificam a anterior circunstância as amostras de caudais, sendo que a recolha de caudais
instantâneos máximos anuais é imediata através do Sistema Nacional de Informação de Recursos
Hídricos, SNIRH, disponibilizado pelo Instituto da Água, ao passo que a constituição das amostras de
caudais acima de limiares requer a obtenção de informação em formato de papel (hidrogramas) e a
sua digitalização; d) por definição, as amostras de valores acima de limiares têm sempre dimensão
superior às de máximos anuais, o que induz uma maior confiança aquando da selecção dos modelos
a aplicar na inferência estatística.
Este último comentário está de acordo com as conclusões do trabalho de CUNNANE, 1973, que
refere que os métodos baseados em informação acima de limiares podem ser mais eficientes que os
métodos que utilizam máximos anuais, se a dimensão das amostras naqueles primeiros métodos for,
no mínimo, 1,65 vezes superior às dimensões das correspondentes amostras de máximos anuais,
para 10T . Recorda-se que as dimensões das amostras de valores acima de limiar, utilizadas no
trabalho que se apresenta, são duas a três vezes superiores às dimensões das respectivas amostras
de valores máximos anuais (parâmetro λ no quadro 5.13).
Na tentativa de estabelecer relações entre quantis de caudais, Q, e de volumes de cheia, V,
pesquisaram-se relações lineares entre estimativas daquelas duas variáveis relativas a um mesmo
período de retorno. Os baixos coeficientes de determinação que assim se obtiveram indicaram,
82
contudo, a não adequação daquele tipo de dependência, o que reforçou o interesse numa análise
multivariada.
Assim, pesquisaram-se outras formas de obter uma relação do tipo V=f(Q), nomeadamente, através
do estudo da probabilidade conjunta daquelas duas variáveis. De um modo geral, as distribuições de
probabilidade conjunta mais utilizadas em Hidrologia são a Normal, a Exponencial e a Gumbel, sendo
que, no presente trabalho, atendendo unicamente que se está em presença de valores extremos, se
optou por recorrer à última distribuição. A utilização de uma dada distribuição implica a assumpção
de que cada uma das distribuições de probabilidade marginal segue essa lei individualmente, para
além de, obviamente, se assumir que a distribuição conjunta tem essa mesma forma. Em alternativa,
averiguaram-se outros métodos para estabelecer a distribuição de probabilidade conjunta que não
assentassem naquele pressuposto obrigatório o qual, como se compreende, pode constituir um erro,
pois a distribuição conjunta ou as distribuições marginais de probabilidade podem não seguir uma
mesma lei. Para tal recorreu-se à teoria das cópulas, mais precisamente às funções cópula da família
arquimediana. Estas funções devem a sua forma a um único parâmetro de avaliação da dependência
entre as variáveis envolvidas, o coeficiente de Kendall, e são independentes das distribuições de
probabilidade marginal, o que constitui uma vantagem em relação à utilização de distribuições de
probabilidade conjunta.
Previamente à aplicação dos modelos multivariados e até para averiguar em que medida tais
modelos se justificariam, procedeu-se à análise da correlação entre caudais instantâneos máximos
anuais (ou acima de limiar) e volumes associados a esses caudais, para o que foram obtidos os
coeficientes de correlação de Pearson. Concluiu-se, assim, que apenas as amostras de valores acima
de limiar exibiam correlações suficientemente elevadas que justificassem a aplicação da análise
multivariada.
Deste modo e para além da lei bivariada de Gumbel, aplicaram-se três funções cópula – Clayton,
Frank e Gumbel-Hougaard – às amostras de caudais acima de limiar e dos correspondentes volumes
nas três estações hidrométricas que sustentaram a generalidade do estudo. A construção dos
anteriores modelos implicou a determinação, para cada uma das amostras, do coeficiente de
Kendall, τ, no caso das funções cópula, e do coeficiente de Pearson, ρ, no caso da lei de Gumbel. Os
valores obtidos para tais coeficientes demonstraram que, de facto, o método da teoria das cópulas
tem por base uma avaliação da dependência entre variáveis distinta da que está subjacente à lei
bivariada de Gumbel, pois, por exemplo, os menores valores de ρ e de τ não estão associados a uma
mesma amostra.
83
Após a construção dos diferentes modelos multivariados, procedeu-se à avaliação do seu
ajustamento aos valores da probabilidade conjunta empírica de cada elemento amostral. O
procedimento de ajustamento foi análogo ao efectuado na análise estatística individual das variáveis,
tendo compreendido, para além da apreciação visual, a aplicação do teste de hipótese de
Kolmogorv-Smirnov e adicionalmente, embora a título essencialmente indicativo, o cálculo do desvio
quadrático médio. Dado que não foi possível seleccionar visualmente o modelo com melhor
ajustamento adoptou-se como critério de selecção o menor valor da estatística do teste de
Kolmogorov-Smirnov. Resultou, assim, a selecção da função cópula de Frank para a descrição das
variáveis caudal/volume na estação hidrométrica de Albernoa e da função cópula de Clayton para a
descrição daquelas variáveis nas restantes duas estações de Couto de Andreiros e de Torrão do
Alentejo. Estes resultados foram consistentes com os valores obtidos para os desvios quadráticos
médios, com excepção do caso da estação hidrométrica de Albernoa em que o menor valor daquele
desvio ocorreu para a função cópula de Gumbel.
Por fim, considera-se importante sublinhar que a análise multivariada nunca resultou na selecção da
lei bivariada de Gumbel para descrever a distribuição de probabilidade conjunta das duas variáveis
em presença mas, como apenas se analisaram três casos de estudo, considera-se não ser válido
afirmar que a teoria das cópulas possa fornecer um modelo mais adequado do que a lei bivariada de
Gumbel. No entanto, como já se referiu várias vezes, a aplicação da lei de Gumbel na forma bivariada
implica a assumpção de que as distribuições de probabilidade marginal das variáveis em presença
seguem também essa lei, o que pode ser incorrecto, como, aliás, se concluiu nas aplicações
efectuadas, em que a análise estatística aplicada às amostras consideradas isoladamente nunca
resultou na selecção daquela lei.
O objectivo a que o presente estudo se propunha foi, portanto, atingido. Para as três estações
hidrométricas que, fundamentalmente, sustentaram a análise, foi possível construir, através da
teoria das cópulas, um modelo descritivo da probabilidade conjunta das variáveis caudal acima de
limiar e dos volumes associados a esses caudais. Assim, o presente trabalho fornece um método
alternativo para o estudo da probabilidade conjunta de não-excedência de um acontecimento
constituído por um caudal e por um volume de cheia associados a dados períodos de retorno.
As aplicações práticas deste tipo de análise poderão ter a forma apresentada no capítulo 5.5.3.,
onde, a título de exemplo, se obtiveram gráficos que fornecem probabilidades de não-excedência do
caudal de cheia, para uma dado valor máximo da probabilidade de não-excedência do volume de
cheia, para o que basta seleccionar a probabilidade de não-excedência do acontecimento conjunto.
84
Por outro lado, a obtenção do valor da probabilidade de não-excedência do acontecimento conjunto
é essencial para o estudo de períodos de retorno conjuntos, um conceito que tem sido objecto de
análise por alguns investigadores ao longo dos últimos anos. Como se compreende, a determinado
período de retorno conjunto, ou seja, bivariado, não corresponde apenas um único par
caudal/volume. Desse modo, torna-se interessante a obtenção de expressões analíticas e de gráficos
das isolinhas de probabilidade de não-excedência conjunta, tal como apresentado no capítulo 5.5.3.
Como sugestão para trabalhos futuros, considera-se pertinente o desenvolvimento do conceito de
período de retorno conjunto com base numa análise multivariada equivalente ao objecto da
presente investigação de mestrado. A obtenção de isolinhas de período de retorno pode ser de
extrema utilidade para simular diferentes cenários de avaliação do risco associado a cheias,
envolvendo intervenções que compreendem desde o dimensionamento de descarregadores de
cheias em barragens até à delimitação de leitos de cheia.
A determinação da distribuição de probabilidade condicional entre variáveis hidrológicas tem sido
desenvolvida também por diversos autores, nomeadamente, por aqueles cujos trabalhos estiveram
na base científica da investigação que se apresenta. Deste modo, o estudo da análise condicional, no
caso português, constituirá também uma abordagem interessante, no domínio da Hidrologia.
Por último, sugere-se, ainda, o desenvolvimento de estudos no âmbito da análise multivariada das
variáveis caudal de ponta, volume de cheia e duração da cheia, uma vez que esta última variável
pode ser, a par com as demais, também crucial para equacionar as ocorrências de cheia,
determinando, por exemplo, os tempos de submersão em que dadas vias de comunicação deixarão
de estar operacionais ou condicionando a programação de obras em leitos de cheias, como sejam a
execução das fundações de viadutos.
85
Referências bibliográficas
BACCHI B, BECCIU G, KOTTEGODA NT., 1994. Bivariate exponential model applied to intensities and
durations of extreme rainfall. J Hydrol, 155 (1–2):225–36.
CASELLA G, BERGER RL. Statistical inference. Pacific Grove, CA: Wadsworth & Brooks; 1990.
CHOW VT, MAIDMENT DR, MAYS LW., 1988. Applied hydrology. New York: McGraw-Hill.
CHOW, V.T., 1964, Section 8-I. Statistical and Probability Analysis of Hydrologic Data. Part I –
Frequency Analysis. In: Handbook of Applied Hydrology. McGraw-Hill, USA.
COLES S., 2001. An introduction to statistical modeling of extreme values. London, UK: Springer-
Verlag.
CORREIA, F. N., 1983. Métodos de Análise e Determinação de Caudais de Cheia. Tese apresentada a
concurso para Investigador Auxiliar. Laboratório Nacional de Engenharia Civil, Lisboa.
CUNNANE, C., 1973. A Particular Comparison of Annual Maxima and Partial Duration Series Methods
of Flood Frequency Prediction. Journal of Hydrology, 18, pp. 257-222.
CUNNANE, C., 1978. Unbiased Plotting Positions – a Review. Journal of Hydrology, 37, pp. 205-222.
DE MICHELE, C., SALVADORI, G., CANOSSI, M., PETACCIA, A., ROSSO, R., 2005. Bivariate statistical
approach to check adequacy of dam spillway. Journal of Hydrologic Engineering ASCE 10 (1),
50–57.
DEMARTA, S. e McNEIL, A.J., 2004. The t Copula and Related Copulas. International Statistical
Review, 73(1), pp. 111-129.
DIAS, A. T. G. S., 2003. Caudais Instantâneos Máximos Anuais em Portugal Continental, Proposta de
Regionalização. Dissertação para a obtenção do Grau de Mestre em Hidráulica e Recursos
Hídricos. Instituto Superior Técnico, Lisboa.
ESCALANTE-SANDOVAL, C., 2007. Application of bivariate extreme value distribution to flood
frequency analysis: a case study of Northwestern Mexico. Natural Hazards Journal, Vol. 42,
No. 1., pp. 37-46.
FAVRE A-C, EL ADLOUNI S, PERREAULT L, THIE´MONGE N, BOBE´E B., 2004. Multivariate hydrological
frequency analysis using copulas. Water Resour Res, 40.
GENEST C., FAVRE A.C., 2007. Everything you always wanted to know about copula modeling but
were afraid to ask. J Hydrol Eng ASCE, 12 (4), 347–368.
GOEL NK, SETH SM, CHANDRA S., 1998. Multivariate modeling of flood flows. J Hydraulic Eng,
124(2):146–55.
86
GRIMALDI, S. e SERINALDI, F., 2005. Asymmetric copula in multivariate flood frequency analysis.
Advances in Water Resources, 29, pp. 1155–1167.
HENRIQUES, A. G., 1990. Modelos de Distribuição de Frequências de Caudais de Cheia. Dissertação de
Doutoramento em Engenharia Civil no Instituto Superior Técnico, Lisboa.
HERR, H.D., KRZYSZTOFOWICZ, R., 2005. Generic probability distribution of rainfall in space: The
bivariate model. Journal of Hydrology 306, 237–264.
JOE H., 1997. Multivariate models and dependence concepts. New York: Chapman and Hall, 399pp.
KARMAKAR, S. e SIMONOVIC, S.P., 2009. Bivariate Food Frequency Analysis. Part 2: a Copula-based
Approach with Mixed Marginal Distributions. Journal of Flood Risk Management, 2, pp. 32–
44.
LUPTON, R., 1993. Statistics in Theory and Practice. Princeton University Press.
MELGHIORI, M. R., 2003. Which Archimedean Copula is the Right One? YieldCurve.com e-Journal.
MORETTIN, P. A., TOLOI, C. M. C., CHIANN, C. e MIRANDA, J. C. S., 2010. Wavelet-Smoothed Empirical
Copula Estimator. Revista Brasileira de Finanças, Vol. 8, No. 3, pp. 263-281.
NAGHETTINI, M. e PINTO, E. J. A., 2007. Hidrologia Estatística. Serviço Geológico do Brasil.
NELSEN, RB., 2006. An Introduction to Copulas. Springer, New York.
PORTELA, M.M e DELGADO, J.M., 2009a. A new plotting position concept to evaluate peak flood
discharges based on short samples. Fifth International Conference on Sustainable Water
Resources Management, WRM09 (Malta), pp. 185-195, Wessex Institute, WITPress, ISBN 978
1 84564 198-6, Southampton.
PORTELA, M.M. e DELGADO, J.M, 2009b. Estimação de caudais de ponta de cheia a partir de
amostras com reduzida dimensão. Recursos Hídricos, Vol. 30(1), pp. 43-53, Associação
Portuguesa dos Recursos Hídricos (APRH), ISSN 0870-1741, Lisboa.
PULIDO-CALVO, I. e PORTELA, M. M., 2007. Application of neural approaches to one-step daily flow
forecasting in large Portuguese watersheds. Journal of Hydrology, 332, pp. 1-15.
QUINTELA, A.C., 1996. Hidrologia e Recursos Hídricos. Secção de Folhas. Instituto Superior Técnico.
SALVADORI G, DE MICHELE C., 2004. Frequency analysis via copulas: theoretical aspects and
applications to hydrological events. Water Resources Research, 40:W12511.
SALVADORI G., DE MICHELE C., 2007. On the use of copulas in hydrology: theory and practice. J
Hydrol Eng ASCE, 12, (4), 369–380.
YUE S., OUARDA TBMJ, BOBE’E B, LEGENDRE P, BRUNEAU P., 1999. The Gumbel mixed model for
flood frequency analysis. J Hydrol, 226(1–2):88–100.
YUE S., OUARDA TBMJ, BOBE’E B, LEGENDRE P, BRUNEAU P., 2002. Approach for describing statistical
properties of flood hydrograph. J Hydrol Eng, 7(2): 147–53.
87
YUE, S. e RASMUSSEN, P., 2002. Bivariate Frequency Analysis: Discussion of Some Useful Concepts in
Hydrological Application. Hydrological Processes, 16, pp. 2881–2898.
YUE, S., 2000. Joint probability distribution of annual maximum storm peaks and amounts as
represented by daily rainfalls. Hydrological Sciences Journal, Vol. 45, Issue 2, pp. 315-326.
ZHANG, L. e SINGH, V.P., 2006. Bivariate Rainfall Frequency Distributions using Archimedean Copulas.
Journal of Hydrology, 332, pp. 93-109.
88
89
Anexos
Anexo 1: Alturas hidrométricas e caudais instantâneos nas estações hidrométricas de Albernoa,
Couto de Andreiros, Monforte e Torrão do Alentejo.
Anexo 2: Diagramas cronológicos de caudal exemplificativos do procedimento de selecção dos
acontecimentos de cheia.
90
91
Anexo 1: Alturas hidrométricas e caudais instantâneos nas estações hidrométricas de Albernoa,
Couto de Andreiros, Monforte e Torrão do Alentejo.
92
93
Os ficheiros que se apresentam e que constituem o presente anexo contêm a totalidade da
informação recolhida para a elaboração do estudo. A recolha processou-se no Instituto da Água
mediante consulta de informação sistematizada em formato de papel, a qual foi digitalizada.
Cada ficheiro respeita a uma estação hidrométrica, de entre as quatro analisadas, e está organizado
em sucessivas folhas, sendo que a primeira contém a legenda e as restantes os registos nos
sucessivos anos hidrológicos. Tais registos referem a alturas hidrométricas e aos correspondentes
caudais, quando apresentados em formato de papel.
Para cada ano, calculou-se o máximo caudal para o que se aplicou a inerente curva de vazão.
Os ecrãs do Sistema Nacional de Informação de Recursos Hídricos, SNIRH, que contêm a
apresentação das curvas de vazão são reproduzidos na última folha de cada ficheiro.
94
95
Anexo 2: Diagramas cronológicos de caudal exemplificativos do procedimento de selecção dos
acontecimentos de cheia.
96
97
Anexo 2.1 – Diagramas cronológicos de caudal na estação hidrométrica de Albernoa nos anos hidrológicos de: a)
1983/1984 e b) 1987/1988.
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
a)
26/1983
27/1983
28/1983
29/1983
30/1983
31/1983
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
b)
42/1987
43/1987
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
b)
Série de caudais instantâneos Escoamento de base
42/1987
43/1987
26/1983 Acontecimento independente26/1983 Acontecimento independente
98
Anexo 2.2 – Diagramas cronológicos de caudal na estação hidrométrica de Couto de Andreiros nos anos hidrológicos de:
a) 1983/1984 e b) 1984/1985.
0
50
100
150
200
250
300
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
26/1983
27/1983
0
50
100
150
200
250
300
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
28/1984
30/1984
29/1984
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
b)
Série de caudais instantâneos Escoamento de base
42/1987
43/1987
26/1983 Acontecimento independente26/1983 Acontecimento independente
99
Anexo 2.3 – Diagramas cronológicos de caudal na estação hidrométrica de Monforte nos anos hidrológicos de: a)
1985/1986 e b) 1987/1988.
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
b)
Série de caudais instantâneos Escoamento de base
42/1987
43/1987
26/1983 Acontecimento independente26/1983 Acontecimento independente
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800 900 1000
Cau
dal
(m
3/s
)
Tempo (h)
39/1985
40/1985
41/1985
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800 900 1000
Cau
dal
(m
3/s
)
Tempo (h)
43/1987 44/1987
45/1987
46/1987
47/1987
49/198748/1987
39/1985
100
Anexo 2.4 – Diagramas cronológicos de caudal na estação hidrométrica de Torrão do Alentejo nos anos hidrológicos de:
a) 1971/1972 e b) 1983/1984.
0
20
40
60
80
100
120
140
160
180
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
17/1971
0
20
40
60
80
100
120
140
160
180
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
23/1983
0
20
40
60
80
100
120
140
0 100 200 300 400 500 600 700 800
Cau
dal
(m
3/s
)
Tempo (h)
b)
Série de caudais instantâneos Escoamento de base
42/1987
43/1987
26/1983 Acontecimento independente26/1983 Acontecimento independente17/1971