modelo estatístico para o monitoramento de movimentos relativos

18
COMITÊ BRASILEIRO DE BARRAGENS XXX - SEMINÁRIO NACIONAL DE GRANDES BARRAGENS FOZ DO IGUAÇU PR, 12 A 14 DE MAIO DE 2015 XXVI Seminário Nacional de Grandes Barragens 1 MODELO ESTATÍSTICO PARA O MONITORAMENTO DE MOVIMENTOS RELATIVOS NA BARRAGEM DA UHE ITAIPU Suellen Ribeiro Pardo GARCIA Docente, Me. Universidade Tecnológica Federal do Paraná. Anselmo CHAVES Neto Docente, Dr. Universidade Federal do Paraná. Cláudio NEUMANN Junior Engenheiro Civil Itaipu Binacional. Sílvia Frazão MATOS Engenheira Civil, Me. Itaipu Binacional. RESUMO Os deslocamentos horizontais e verticais representam comportamentos estruturais importantes no controle da segurança de uma barragem, portanto monitorar estas variáveis é uma ação permanente de engenheiros e técnicos. Modelos estatísticos HST (Hidrostatic Season Time) são geralmente utilizados para monitorar estes deslocamentos, considerando funções que descrevem o efeito da pressão hidrostática na barragem, o efeito das variações de temperatura ambiente e os eventuais efeitos irreversíveis devido a deformações permanentes. Neste trabalho apresenta-se uma metodologia para a construção de modelos estatísticos HST para avaliar os deslocamentos horizontais da barragem principal de Itaipu utilizando Regressão por Mínimos Quadrados Parciais. A vantagem deste modelo multivariado é a redução considerável do número de variáveis monitoradas. ABSTRACT The horizontal and vertical displacements represent important structural behaviors control in the safety of a dam, so monitor these variables is a permanent action of engineers and technicians. HST statistical models (Hidrostatic Season Time) are generally used to monitor these movements, using functions to describe the effect of hydrostatic pressure on the dam, the effect of ambient temperature variations, and eventual effects due to irreversible permanent deformation. In this work a methodology is developed to build HST statistical models for horizontal displacements of the main block of Itaipu dam using the Partial Least Squared Regression. The advantage of this multivariate model is the significant reduction of the number of monitored variables.

Upload: duongkhuong

Post on 08-Jan-2017

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: modelo estatístico para o monitoramento de movimentos relativos

COMITÊ BRASILEIRO DE BARRAGENS XXX - SEMINÁRIO NACIONAL DE GRANDES BARRAGENS FOZ DO IGUAÇU – PR, 12 A 14 DE MAIO DE 2015

XXVI Seminário Nacional de Grandes Barragens 1

MODELO ESTATÍSTICO PARA O MONITORAMENTO DE MOVIMENTOS

RELATIVOS NA BARRAGEM DA UHE ITAIPU

Suellen Ribeiro Pardo GARCIA

Docente, Me. – Universidade Tecnológica Federal do Paraná.

Anselmo CHAVES Neto

Docente, Dr. – Universidade Federal do Paraná.

Cláudio NEUMANN Junior

Engenheiro Civil – Itaipu Binacional.

Sílvia Frazão MATOS

Engenheira Civil, Me. – Itaipu Binacional.

RESUMO

Os deslocamentos horizontais e verticais representam comportamentos estruturais importantes no controle da segurança de uma barragem, portanto monitorar estas variáveis é uma ação permanente de engenheiros e técnicos. Modelos estatísticos HST (Hidrostatic Season Time) são geralmente utilizados para monitorar estes deslocamentos, considerando funções que descrevem o efeito da pressão hidrostática na barragem, o efeito das variações de temperatura ambiente e os eventuais efeitos irreversíveis devido a deformações permanentes. Neste trabalho apresenta-se uma metodologia para a construção de modelos estatísticos HST para avaliar os deslocamentos horizontais da barragem principal de Itaipu utilizando Regressão por Mínimos Quadrados Parciais. A vantagem deste modelo multivariado é a redução considerável do número de variáveis monitoradas.

ABSTRACT

The horizontal and vertical displacements represent important structural behaviors control in the safety of a dam, so monitor these variables is a permanent action of engineers and technicians. HST statistical models (Hidrostatic Season Time) are generally used to monitor these movements, using functions to describe the effect of hydrostatic pressure on the dam, the effect of ambient temperature variations, and eventual effects due to irreversible permanent deformation. In this work a methodology is developed to build HST statistical models for horizontal displacements of the main block of Itaipu dam using the Partial Least Squared Regression. The advantage of this multivariate model is the significant reduction of the number of monitored variables.

Page 2: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 2

1. INTRODUÇÃO

O monitoramento da estrutura de uma barragem é realizado por meio de inspeções visuais e instrumentação. A instrumentação instalada gera uma enorme massa de dados, que se analisada devidamente, fornece informações sobre o comportamento da estrutura mediante efeitos externos, como por exemplo, variações do nível do reservatório e da temperatura ambiente. O objetivo da análise dos dados da instrumentação é propiciar informação que pode ser usada em uma interpretação física das deformações e, na previsão, seja do comportamento futuro da própria estrutura ou para estudo do comportamento de uma estrutura semelhante [1]. Modelos estatísticos são propostos na literatura, para tal objetivo. Estes são muitas vezes baseados em correlações existentes entre fatores tais como: o nível de água do reservatório, temperatura ambiente, desgaste devido ao tempo e a resposta da barragem a estas ações como tensões, deformações e deslocamentos [2]. Os modelos estatísticos para deslocamentos de barragens de concreto são baseados na estimativa de parâmetros e em hipóteses simplificadoras sobre o comportamento dos materiais, como a de que os efeitos do comportamento estrutural para condições normais de funcionamento podem ser representados em duas expressões. A primeira trata-se de um efeito de natureza elástica, ou seja, um efeito reversível e instantâneo, resultante das variações do nível do reservatório e temperatura ambiente. E a segunda, representa efeito de natureza inelástica, ou seja, irreversível, dependente do tempo. Outra simplificação encontrada é que os efeitos da variação do nível do reservatório, temperatura ambiente e os efeitos devido ao tempo são avaliados separadamente [3]. O modelo estatístico geral para deslocamentos de barragens de concreto tem como variável dependente a resposta de instrumentos como, por exemplo, os pêndulos diretos e as variáveis independentes como os valores numéricos das funções que descrevem os efeitos reversíveis e irreversíveis. Um grande desafio encontrado ao propor tais modelos para dados de monitoramento de barragens é que as variáveis independentes, ou seja, as funções que representam os efeitos reversíveis e irreversíveis da estrutura, podem gerar dados multicolineares, de modo que não seja possível utilizar algumas técnicas estatísticas clássicas. A multicolinearidade cria uma variância compartilhada entre as variáveis, diminuindo assim a capacidade de prever a variável dependente, bem como examinar a importância relativa de cada variável independente [4]. Um método que não tem como hipótese que as variáveis sejam não correlacionadas e ainda, não requer que os resíduos sigam uma distribuição normal, como ocorre na regressão por mínimos quadrados ordinários (Ordinary Least Squares - OLS), é o método de regressão por mínimos quadrados parciais (Partial Least Squares regression - PLSR) que utiliza os chamados componentes PLS obtidos, a fim de

Page 3: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 3

maximizar a covariância entre as variáveis independentes e as variáveis dependentes [5].

Neste contexto, desenvolver um modelo estatístico de regressão por PLS é a

proposta deste artigo, onde as leituras dos pêndulos diretos instalados no trecho F

da Barragem Principal de ITAIPU (deslocamentos) compõem a matriz de variáveis

dependentes e as variáveis independentes (preditoras) são os valores numéricos

das funções que descrevem os efeitos reversíveis e irreversíveis que ocorrem

devido a variações do nível do reservatório e temperatura ambiente, e alterações da

estrutura devido ao tempo. O aspecto relevante deste modelo é sua característica

multivariada, ou seja, será proposto um modelo para vários pêndulos (direto), o que

pode auxiliar no monitoramento.

2. MODELO DE REGRESSÃO MULTIVARIADA Em análise de dados, muitas vezes interessa descrever possíveis relações entre variáveis independentes que explicam uma ou mais variáveis dependentes. Supondo esta relação linear, o modelo de regressão multivariado é dado por

Y X (1)

onde Y é matriz nxp das p variáveis de resposta, X é a matriz ( (m 1))nx que

contém as m variáveis preditoras, a primeira coluna é composta por “uns” e as

seguintes 1( ,..., ) , 1,...,T

j j njx x x j m e a matriz nxp dos resíduos. Para cada

variável dependente o vetor de coeficientes de regressão com intercepto constitui a matriz de ordem ( 1)m xp .

Dada a forma geral do modelo na Equação 1, o objetivo é estimar os parâmetros do modelo (coeficientes de regressão) de tal forma que o desempenho da previsão seja máximo. O desempenho do modelo ajustado é analisado com a aplicação de algum método de validação, de preferência utilizando os dados que ainda não foram utilizados no ajuste do modelo. Isto proporciona resultados mais confiáveis. A estimação dos parâmetros não pode ser feita por OLS quando existe correlação entre as variáveis preditoras (independentes), o que geralmente ocorre no caso de dados de monitoramento de barragens. Por este motivo, ajustar um modelo de regressão PLS é a metodologia adotada neste artigo.

3. VALIDAÇÃO CRUZADA Quando possível, é interessante dividir os dados em um conjunto para treinamento (calibragem) e um conjunto para teste (validação). O conjunto de treinamento é então utilizado para a seleção do modelo e com o conjunto para teste, estima-se o desempenho da previsão para novos dados (validação do modelo). O erro obtido a partir deste procedimento é uma medida mais realista, visto que foi validado por observações que não estavam na construção do modelo [5]. Dentre os testes do erro, destacam-se, o erro padrão de previsão (standard error of prediction - SEP), o erro médio quadrático de previsão (mean squared error of prediction - MSEP) e a raiz quadrada do MSEP (square root of the MSEP - RMSEP).

Page 4: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 4

Outra maneira de otimizar o desempenho de um modelo é utilizar estratégias de reamostragem como validação cruzada. É possível determinar o número de componentes PLS pelo procedimento a seguir. Divide-se o conjunto total de dados em k subconjuntos mutuamente exclusivos de mesmo tamanho e, a partir disto, um subconjunto é utilizado para teste e os k-1 restantes são utilizados para estimação dos parâmetros. Ao final das k iterações calcula-se a acurácia sobre os erros encontrados, através da equação

ˆ,

1 1

1 1ˆ( )

i i

v v

f y y i i

i i

Ac y yv v

(2)

onde é o número de dados de validação e ˆ,i iy y é o resíduo dado pela diferença

entre o valor real da saída i e o valor predito. O método leave-one-out de validação cruzada (LOO-CV) é um caso específico do descrito acima, conhecido como k-fold, onde k será igual ao número total de dados n. Nesta abordagem são realizados n cálculos de erro, um para cada dado. O modelo ótimo é o de menor erro de predição possível. Neste artigo, inicialmente utiliza-se o procedimento (LOO-CV) onde os erros serão encontrados por RMSEP e posteriormente, compara-se com o resultado do RMSEP calculado com o conjunto de teste, pois como dispõem-se de um número de observações satisfatório, os dois procedimentos são viáveis. No caso de uma amostra pequena, considera-se apenas o procedimento (LOO-CV).

4. REGRESSÃO POR MÍNIMOS QUADRADOS PARCIAIS (PARTIAL LEAST SQUARES REGRESSION – PLS REGRESSION)

Regressão por mínimos quadrados parciais é um método de regressão linear multivariada. O método consiste em encontrar componentes de X que também são relevantes para Y. Especificamente, a regressão PLS procura um conjunto de componentes (chamados vetores latentes) em um processo de decomposição simultânea de X e Y, com a restrição de que estes componentes explicam, tanto quanto possível, a covariância entre X e Y [6]. A regressão PLS incorpora a regressão por componentes principais (Partial Components Regression – PCR), que maximiza a variância de X, e também a regressão OLS, que maximiza a correlação de X e Y. Isto ocorre porque utiliza a covariância entre as variáveis, construindo um modelo da relação estrutural entre as variáveis dependentes e independentes. Semelhante a PCR, a regressão PLS é capaz de processar dados colineares utilizando um número relativamente pequeno de componentes PLS. O número ideal de componentes pode ser encontrado por validação cruzada [5]. Segue um breve resumo sobre a teoria de regressão PLS. Seja o modelo de regressão linear multivariada com a matriz X ( )nxm de preditores e a matriz Y ( )nxp

de variáveis dependentes, ambas centradas na média. A seguinte aproximação é construída:

Page 5: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 5

T

T

X TP

Y UQ

(3)

onde T e U (ambas de dimensão a ) são as respectivas matrizes de escores que

consistem em combinações lineares das variáveis em X e Y . A matriz ( )P mxa e

( )Q pxa são as matrizes de pesos de X e Y, respectivamente. Diferentemente da

PCR, na regressão PLS, em geral, os pesos não são ortogonais, e sim os escores. O número de componentes PLS min( , )a n m é escolhido por meio de validação

cruzada. Além disso, os escores de X e Y estão relacionados pela relação chamada “relação interna” U TD H (4)

um modelo de regressão linear que maximiza a covariância entre eles. Os

coeficientes de regressão são armazenados em uma matriz diagonal 1( ,..., )aD d d e

os resíduos na matriz H .

O estimador OLS para D fornece a estimativa ˆ ˆU TD e assim ˆ ˆ TY TDQ . Como

ˆ ˆY XB , temos que ˆ ˆ T

PLSB PDQ (5)

A relação interna pode destruir a singularidade da decomposição das matrizes de dados X e Y. Normalizar os vetores de escores t e u pode evitar este problema.

Para isto, é necessário introduzir vetores de peso (ortogonais) w e c tal que t Xw e u Yc , logo

1t Xw e

1u Yc

assim, a função objetivo da regressão PLS segue

maxCov( , )Xw Yc (7)

ou max(t u)TT T TXw Yc w X Yc (8)

sujeito a restrição da Equação 6. Da Equação 8, temos que os primeiros vetores

peso 1w e 1c são os vetores singulares direito e esquerdo da decomposição em valor

singular (singular value decomposition – SVD) de TX Y correspondentes ao maior valor singular.

5. HST

Page 6: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 6

A resposta de um instrumento que mede o deslocamento, por exemplo, pode ser modelada da seguinte forma:

( ) ( ) ( ) ( )i i i i iD t F t G H H T (9)

onde ( )F t é a função que descreve o efeito irreversível, ( )G H é a função do nível

do reservatório (carga hidrostática), ( )H T é a função da temperatura, e é o erro.

Na literatura, são encontradas várias funções propostas para modelar as diferentes componentes de resposta, principalmente quando se trata de modelar ( )F t e ( )H t .

Algumas destas versões serão comentadas aqui. No período operacional normal de uma barragem de concreto, o efeito térmico é diretamente relacionado às variações de temperatura e a inércia térmica cria um atraso na resposta entre a variação de temperatura e as leituras dos instrumentos. Existem duas abordagens para descrever este efeito térmico: o modelo HST (hydrostatic, seasonal, time) e modelos que consideram a temperatura do concreto. O modelo HST foi proposto inicialmente em 1958 por Ferry, Will e Beaujoint [7],

algumas versões são encontradas na literatura para melhor ajuste do modelo ao

estudo de caso, como em [2], [8], [9] e [10].

No modelo HST, o efeito do nível do reservatório é modelado por um polinômio de

quarto grau, o efeito da temperatura por uma soma de funções trigonométricas e os

efeitos irreversíveis por uma função polinomial do tempo [2], da seguinte forma:

( ) ( ) ( ) ( )D t H z S T t (10)

2 3 4

1 2 3 4 5( )H z a a z a z a z a z (11)

2

6 7 8 9( ) ( ) cos( ) ( )cos( ) ( )S a sen a a sen a sen (12)

2 3

1 2 3( )T t c t c t c t (13)

onde ( )D t é a variável resposta (por exemplo, deslocamentos), ( )H z , ( )S , ( )T t

são respectivamente função do nível do reservatório, função da temperatura e

efeitos irreversíveis. As variáveis z e são definidas como ,mín

máx mín

nível nívelh

nível nível

2

365

j com (j = 1:365) e t é o número de dias desde que se iniciou a análise.

Em [8] o modelo supõe a função do efeito irreversível como uma linha de tendência,

0 1( )T t c c t . Já em [9], 1 2( ) ( )T t c c ln . Outras expressões para o efeito

irreversível podem ser encontradas em [3], 1 2( ) tT t c t c e e [10],

1 2( ) ( 1)T t c c ln , onde é o número de dias desde que começou a análise e

cada dia passado representa um acréscimo de 0,01.

Page 7: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 7

Nota-se que o modelo HST é construído por meio de funções não lineares, mas

como os valores das variáveis de entrada são conhecidos pelo pesquisador (tempo

e nível do reservatório) o modelo se torna linear ao passo estas variáveis são

substituídas. O modelo HST não utiliza medições de temperatura, pois presume que

os efeitos sazonais (térmicos) podem ser modelados por uma resposta com

periodicidade anual.

Como o modelo HST é um modelo de regressão múltipla (uma variável dependente

e várias variáveis preditoras), será utilizada apenas a modelagem para as variáveis

independentes, ou seja, as funções do lado direito da Equação 10, já que o lado

esquerdo na abordagem deste estudo trata-se de uma matriz onde cada coluna

representa a leitura de um pêndulo direto.

6. METODOLOGIA

6.1 BARRAGEM

A barragem de Itaipu localiza-se no Rio Paraná onde Brasil e Paraguai têm a

fronteira. É composta por barragens de terra, enrocamento e concreto.

A Barragem Principal (trecho F) é composta de blocos de concreto que possuem tomadas d’água por onde passa a água que movimenta as turbinas para a geração de energia. O trecho F, destacado na Figura 1, possui 18 blocos duplos que vão do F1/2 ao F35/36. O bloco F19/20 foi o escolhido para a análise, pois é um dos blocos de concreto do tipo gravidade aliviada mais altos com tomada água [11].

Page 8: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 8

Figura 1: Vista aérea da Usina Hidrelétrica de Itaipu em destaque o Trecho F. Fonte:

[12].

É necessário conhecer os deslocamentos da estrutura, quando variam as condições exteriores como carga, temperatura, entre outros, pois dos deslocamentos se obtém as tensões e a partir destas, as deformações sofridas pela estrutura [13]. Os deslocamentos são um dos parâmetros mais significativos e são esperados durante e após a construção. Estes movimentos ocorrem no enchimento do reservatório e posteriormente, devido a oscilação do nível do reservatório entre as estações. A estrutura da barragem também responde a variações de temperatura ambiente que provocam dilatações volumétricas do concreto. Pequenos movimentos da estrutura são de pouco interesse, mas o aumento da magnitude do movimento ou mudança na direção do movimento deve ser avaliado imediatamente quanto ao seu impacto potencialmente negativo sobre a estrutura [2]. Os deslocamentos horizontais são usualmente observados por pêndulos diretos, fixos à crista da barragem indo até o contato concreto-rocha, assim ao nível da crista as componentes x e y podem ser calculadas. Estes deslocamentos são relativos, pois são deslocamentos horizontais de vários pontos da estrutura em relação a outros pontos de referência. Ao nível da fundação as componentes x e y podem ser calculadas a partir de pêndulos invertidos, mas este instrumento não será considerado para análise de dados deste artigo. A unidade de medida para os deslocamentos é dada em milímetros. As leituras dos deslocamentos horizontais são realizadas pelos coordinômetros óticos ou telecordinômentros, segundo as direções montante-jusante e margem direita-esquerda [14].

Page 9: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 9

6.2 AJUSTE DO MODELO DE REGRESSÃO PLS Os dados utilizados para a modelagem são de leituras manuais em pêndulos diretos realizadas entre abril de 1992 e dezembro de 2013 na Barragem de ITAIPU. Os pêndulos diretos selecionados para análise localizam-se na barragem principal, trecho F. Das 10962 leituras (observações) dos pêndulos diretos na direção x e y, apenas 8 estavam ausentes. As 10962 observações correspondem a 261 observações para cada um dos 21 sensores do pêndulo direto na direção x e o mesmo para a direção y). A direção x consiste no deslocamento do sentido do fluxo (montante/jusante) e a direção y consiste no deslocamento perpendicular ao fluxo (margem esquerda/margem direita). Como a porcentagem de observações ausentes é quase nula, optou-se por substituí-las pela média da observação anterior e posterior, sem prejudicar os resultados da análise.

Considera-se neste estudo apenas os deslocamentos na direção x. Assim, as variáveis dependentes e independentes do modelo de regressão PLS são dadas na Tabela 1. O código CO.F**X, significa coordinômetro para CO, bloco número * do trecho F para F* e X especificando a direção do deslocamento horizontal. As variáveis dependentes, são obtidas substituindo as medidas do nível do reservatório e do instante t nas funções do modelo HST (Equações de 11 a 13). Os valores numéricos são indicados por hst.* onde * é a expressão da função.

Variáveis independentes

CO.F1X CO.F10X CO.F11X CO.F12X CO.F13X CO.F14X CO.F17X

CO.F18X CO.F19X CO.F2X CO.F20X CO.F21X CO.F22X CO.F25X

CO.F26X CO.F27X CO.F28X CO.F3X CO.F4X CO.F5X CO.F9X

Variáveis Dependentes

hst.z hst.z2 hst.z3 hst.z4 hst.s hst.c hst.sc

hst.s2 hst.t hst.t2 hst.t3 hst.s2 hst.t hst.t2 Tabela 1: Variáveis do modelo de regressão PLS.

Primeiramente, as 261 observações foram divididas em dois conjuntos, um para

ajuste do modelo (treinamento) composto da observação no tempo inicial até a 249ª

observação e outro para validação do modelo (teste) composto pela observação

250ª observação até a 261ª observação. Para a modelagem foi utilizado o software

livre R [16].

Para o primeiro ajuste, considera-se até 10 componentes PLS para investigar a variância explicada por cada componente e os valores de validação cruzada leave-one-out (LOO-CV). Apresenta-se abaixo as primeiras saídas do software R. É possível notar que os valores de CV e adjCV (estimativa com viés corrigido) para CO.F1X, CO.F10X e CO.F11X indicam uma escolha de 7 componentes. Isso ocorre para 16 das 21 estimativas de CV e adjCV, portanto, escolhe-se o número 7 componentes.

Page 10: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 10

A escolha de 7 componentes para um modelo ótimo, se reafirma na análise da quantidade de variância explicada pelas 7 primeiras componentes é de 99,06% (na Tabela 2). Cada coluna contem a porcentagem de variância explicada de cada variável resposta.

Page 11: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 11

Tabela 2: Porcentagem de variância explicada pelas componentes e por cada variável dependente.

Uma vez que o número de componentes foi escolhido, pode-se inspecionar diferentes aspectos do ajuste traçando previsões, escores, pesos, etc. O gráfico padrão é o de previsão [15]. As Figuras 2 e 3 mostram os gráficos de valores medidos versus valores preditos (previsões) com 7 componentes. Se a disposição dos pontos for próxima à reta identidade não existe indicação de curvatura ou anomalias. Para algumas variáveis como em CO.F1X, CO.F10X, CO.F17X, CO.F18X, CO.F2X, CO.F3X e CO.F9X o ajuste com 7 componentes não foi satisfatório tanto quanto para as outras 14 variáveis. Isto pode ser identificado pela coluna 8 da Tabela 2, pois a porcentagem de variância, explicada considerando 7 componentes, correspondentes a estas variáveis, são valores inferiores aos das outras variáveis.

TRAINING: % variance explained

1 comps 2 comps 3 comps 4 comps 5 comps 6 comps 7 comps 8 comps 9 comps 10 comps

X 30,32 48,45 71,01 80,14 82,3 90,02 99,06 99,97 99,98 100

CO.F1X 41,06 48,87 51,33 62,18 62,94 62,96 65,12 65,2 65,29 65,29

CO.F10X 64,03 81,97 84,27 84,62 84,86 85,02 85,78 85,78 86,13 86,14

CO.F11X 69,87 87,65 88,33 88,47 89,91 90,12 90,23 90,24 90,24 90,25

CO.F12X 72,57 89,66 90 90,2 93,31 93,75 93,79 93,8 93,85 93,85

CO.F13X 73,46 90,33 90,36 90,82 93,83 94,24 94,25 94,25 94,3 94,3

CO.F14X 74,44 90,88 90,9 92,41 92,65 92,67 92,81 92,82 93,2 93,2

CO.F17X 50,91 59,14 59,25 59,28 66,42 67,51 69,98 70 72,34 72,37

CO.F18X 59,28 79,29 84,19 84,21 84,45 84,52 85,02 85,02 85,98 85,98

CO.F19X 64,33 85,04 87,17 87,17 91,22 91,82 91,86 91,88 91,89 91,92

CO.F2X 57,35 79,17 81,28 84,11 84,38 84,38 84,69 84,78 84,78 84,79

CO.F20X 67,88 86,82 87,73 87,77 92,21 92,91 92,91 92,92 93,02 93,03

CO.F21X 67,58 85,6 86,28 86,5 92,22 93,25 93,25 93,26 93,37 93,37

CO.F22X 71,74 89,13 89,29 90,08 91,94 92,28 92,37 92,37 92,87 92,87

CO.F25X 61,1 82,69 87,97 89,67 90,5 90,55 91,27 91,28 91,3 91,3

CO.F26X 48,35 77,19 92,04 93,62 94,31 94,48 94,52 94,52 94,58 94,58

CO.F27X 51,35 79,91 92,66 93,75 94,65 94,81 94,81 94,82 94,88 94,88

CO.F28X 51,27 81,09 93,02 93,55 94,58 94,75 94,76 94,76 94,94 94,94

CO.F3X 57,97 80,82 84,59 87,52 87,67 87,77 87,86 87,87 88,22 88,22

CO.F4X 65,38 88,32 89,99 91,72 92,44 92,56 92,56 92,59 92,6 92,6

CO.F5X 71,01 90,36 90,5 92,46 92,93 93,07 93,07 93,08 93,11 93,11

CO.F9X 65 68,13 77,55 78,38 80,75 80,75 83,28 83,28 83,54 83,6

Page 12: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 12

Figura 2: Gráfico dos valores observados versus valores preditos das variáveis resposta CO.F1X até CO.F21X.

Page 13: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 13

Figura 3: Gráfico dos valores observados versus valores preditos das variáveis

resposta CO.F22X até CO.F9X.

6.3 PREVISÃO DE NOVAS OBSERVAÇÕES

Com o modelo ajustado pode-se prever os valores de resposta de novas observações. Utilizando o conjunto para validação do modelo (teste), as previsões das respostas para as 12 últimas observações não utilizadas no ajuste, supondo 7 componentes, consta na Tabela 2.

Page 14: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 14

n CO.F1X CO.F10X CO.F11X CO.F12X CO.F13X CO.F14X CO.F17X

250 1,854572 1,381102 3,683765 6,220352 9,439422 14,29962 1,762978

251 1,868457 1,483809 3,742637 6,251549 9,408604 14,24897 1,813983

252 1,962501 1,732023 4,017161 6,530642 9,643507 14,394 1,954498

253 2,176347 2,523755 5,087938 7,790854 10,934172 15,92588 2,239079

254 2,118334 2,68639 5,373767 8,109158 11,299874 16,29201 2,266693

255 2,135274 3,033979 5,974369 8,840773 12,141491 17,40011 2,323043

256 2,236821 3,278066 6,384689 9,328333 12,733219 18,24187 2,354198

257 2,434499 3,371333 6,474379 9,404306 12,860162 18,46888 2,377843

258 2,631798 3,350667 6,353257 9,240644 12,701023 18,29876 2,396825

259 2,752185 3,37312 6,318136 9,23273 12,686477 18,35771 2,420457

260 2,472157 2,624618 5,251072 7,979157 11,361824 16,75087 2,148971

261 2,123823 1,933639 4,327959 6,92084 10,241018 15,44296 1,884924

n CO.F18X CO.F19X CO.F2X CO.F20X CO.F21X CO.F22X CO.F25X

250 2,274248 3,999456 2,606895 6,424444 8,671744 14,21769 2,714907

251 2,390933 4,026753 2,685854 6,423035 8,659877 14,17065 2,837096

252 2,665904 4,334768 2,90662 6,717435 8,930759 14,36841 3,225646

253 3,509317 5,47753 3,640332 8,027141 10,357337 15,91332 4,164741

254 3,74061 5,894074 3,809663 8,475242 10,76591 16,33779 4,567896

255 4,153683 6,577395 4,211764 9,310288 11,688026 17,44424 5,00569

256 4,417289 7,003495 4,595954 9,84664 12,30864 18,25135 5,206065

257 4,458119 7,041828 4,853903 9,894487 12,38584 18,42363 5,156276

258 4,339437 6,836188 4,91425 9,648645 12,13635 18,18918 4,957698

259 4,262286 6,699647 4,878285 9,528691 12,060304 18,15731 4,77649

260 3,445586 5,571228 4,0398 8,214428 10,582883 16,52256 3,958577

261 2,73355 4,585688 3,233001 7,105155 9,365737 15,19564 3,207339

n CO.F26X CO.F27X CO.F28X CO.F3X CO.F4X CO.F5X CO.F9X

250 3,708813 6,412708 10,4123 4,570778 6,611471 10,27314 2,171417

251 3,882759 6,53348 10,48554 4,641158 6,616732 10,27196 2,194924

252 4,543397 7,234684 11,18124 4,868098 6,873882 10,49445 2,308411

253 6,40685 9,537271 13,45982 5,870451 8,065322 11,71579 2,567076

254 7,445148 10,838285 14,80504 6,075779 8,434765 12,03945 2,531958

255 8,622997 12,41145 16,40921 6,659714 9,210201 12,87945 2,541653

256 9,250672 13,268519 17,33532 7,161994 9,830716 13,58923 2,554494

257 9,145718 13,128839 17,29423 7,412019 10,093845 13,90895 2,612409

258 8,530081 12,334221 16,56825 7,404616 10,038355 13,87495 2,717248

259 7,875543 11,567082 15,77633 7,383257 9,962236 13,83725 2,854967

260 6,127408 9,404146 13,57711 6,263962 8,662735 12,45459 2,638766

261 4,597885 7,548495 11,62771 5,253166 7,475124 11,23344 2,395941 Tabela 2: Valores previstos para as variáveis dependentes utilizando o conjunto teste.

Conhecendo os verdadeiros valores de resposta destas 12 observações, calcula-se o gráfico dos valores observados versus valores preditos para o conjunto de teste (Figuras 4 e 5).

Page 15: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 15

Figura 4: Gráfico dos valores observados versus valores preditos das variáveis resposta CO.F1X até CO.F21X.

Page 16: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 16

Figura 5: Gráfico dos valores observados versus valores preditos das variáveis

resposta CO.F22X até CO.F21X.

7. CONCLUSÃO

O modelo proposto para as respostas de deslocamento da barragem de Itaipu pode ser usado como procedimento auxiliar no monitoramento da barragem. Com o modelo, é possível prever as leituras dos pêndulos diretos conhecendo as variações do nível do reservatório e temperatura ambiente. Essas previsões quando comparadas às leituras reais fornecem informação se houve mudança de comportamento com relação ao comportamento anterior, considerado estável. A regressão por mínimos quadrados parciais extrai do relacionamento entre as 21 variáveis dependentes e 11 variáveis independentes, apenas 7 componentes que explicam aproximadamente 99% da variabilidade dos dados. Isso mostra um bom potencial para o uso da regressão PLS no tratamento de dados de monitoramento de barragem reduzindo o número de variáveis a serem monitoradas.

Page 17: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 17

O modelo é vantajoso no sentido de que na literatura, uma gama de modelos univariados é proposta para dados de monitoramento de barragem, enquanto que ao estimar conjuntamente os parâmetros, no caso de modelos multivariados, obtêm-se um ganho de eficiência dos estimadores e leva-se em conta o relacionamento entre as todas as variáveis. Em trabalho futuro, o intervalo de confiança será estabelecido para as previsões de modo a estabelecer limites de controle para as novas observações de deslocamentos.

8. PALAVRAS-CHAVE

Regressão Multivariada, Mínimos Quadrados Parciais, Deslocamento e Barragem

de Concreto.

9. REFERÊNCIAS BIBLIOGRÁFICAS

[1] DENG, N., WANG, J., e SZOSTAK, A. C. (2008) – “Dam deformation analysis

using the partial least squares method”, 13th FIG International Symposium on

Deformation Measurements and Analysis e 4th IAG Symp. on Geodesy for

Geotechnical and Structural Engineering, Lisbon.

[2] NEDUSHAN, B. A. (2002) – “Multivariate Statistical Analysis of Monitoring

Data for Concrete Dams” (Doctoral dissertation, McGill University), Montreal.

[3] MATA, J., CASTRO, A. T. e COSTA, J. S. (2014) – “Constructing statistical

models for arch dam deformation”. Structural Control and Health Monitoring,

21(3), 423-437.

[4] HAIR, J. F., BlACK, W. C., BABIN, B. J., ANDERSON, R. E., e TATHAM, R.

L. (2009) – “Análise multivariada de dados”, book published by Bookman.

[5] GARCIA, H., e FILZMOSER, P. (2011) – “Multivariate Statistical Analysis

using the R package chemometrics”, Vienna, Austria.

[6] ABDI, H. (2010) – “Partial least squares regression and projection on latent

structure regression (PLS Regression)”, Wiley Interdisciplinary Reviews:

Computational Statistics, 2(1), 97-106.

[7] CHOUINARD, L., LARIVIÈRE, R., CÔTE, P. e ZHAO, W. (2006) – “Analysis

of irreversible displacements in multiple arch concrete dam using principal

component analysis." The Proceedings of the International Conference on

Computing and Decision making in Civil and Building Engineering, Montreal.

[8] DE SORTIS, A. e PAOLIANE, P. (2005) – “Statistical and structural

identification techniques in structural monitoring of concrete dams."

Proceedings of the 73rd annual meeting of international commission on large

dams.

Page 18: modelo estatístico para o monitoramento de movimentos relativos

XXX Seminário Nacional de Grandes Barragens 18

[9] XI, G. Y., YUE, J. P., ZHOU, B. X., e TANG, P. (2011) – “Application of an

artificial immune algorithm on a statistical model of dam displacement”.

Computers & Mathematics with Applications, 62(10), 3980-3986.

[10] LI, F., WANG, Z., e LIU, G. (2013) – “Towards an Error Correction Model for

dam monitoring data analysis based on Cointegration Theory”. Structural

Safety, 43, 12-20.

[11] BINACIONAL, I. (2009) – “Itaipu: usina hidrelétrica–projeto: aspectos de

engenharia”. Foz do Iguaçu: TAB Marketing Editorial.

[12] BUZZI, M. F., DYMINSKI, A. S., e CHAVES NETO, A. (2007) – “Avaliação

das correlações de séries temporais de leituras de instrumentos de

monitoração geotécnico-estrutural e temperatura ambiente na barragem de

ITAIPU – Caso do pêndulo direto”. XXVIII Congress Ibero Latino-Americano

de Métodos Computacionais em Engenharia (CILAMCE), Porto, Portugal.

[13] VASCONCELOS, G. R. L. (1978) – “Plano de Implantação do instrumental

de auscultação de estruturas do concreto – Obra Hidroelétrica de Itaipu”, II

Colóquio sobre Sistemas de Inspeção e Observação de Barragens, Salto

Santiago.

[14] MATOS, S. F. (2002) – “Avaliação de instrumentos para auscultação de

barragem de concreto. Estudo de caso: deformímetros e tensômetros para

concreto na barragem de itaipu” (Dissertação de Mestrado, Universidade

Federal do Paraná, Curitiba.

[15] MEVIK, B. H., e WEHRENS, R. (2007) – “The pls package: principal

component and partial least squares regression in R”. Journal of Statistical

Software, 18(2), 1-24.

[16] R CORE TEAM (2014) – “R: A language and environment for statistical

computing”, R Foundation for Statistical Computing, Vienna, Austria.

Disponível em: http://www.R-project.org/.