anÁlise variogrÁfica a geoestatística é baseada nos ... · assim a fórmula do semi-variograma...

14
1 ANÁLISE VARIOGRÁFICA 1 2 A Geoestatística é baseada nos seguintes conceitos: Funções aleatórias Variável regionalizada Estacionariedade 3 No espaço (2D) ocorrem infinitos valores de uma variável. Por amostragem obtem-se diversos resultados dessa variável. â = = â = = ( ) média =

Upload: tranbao

Post on 16-Oct-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

1

ANÁLISE VARIOGRÁFICA

1 2

A Geoestatística é baseada nos seguintes conceitos: •Funções aleatórias •Variável regionalizada •Estacionariedade

3

No espaço (2D) ocorrem infinitos valores de uma variável. Por amostragem obtem-se diversos resultados dessa variável.

𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒔𝟐 = 𝒙𝒊 − 𝒙

𝒏 − 𝟏 𝟐

𝒄𝒐𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = 𝒄𝒐𝒗 = 𝒙𝒊 − 𝒙 (𝒚𝒊 − 𝒚 )

𝒏 − 𝟏

média =

Page 2: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

2

Variável aleatória e função aleatória

Cada ponto no espaço não apresenta um único valor, mas uma distribuição de probabilidades de ocorrência de valores

No ponto x a propriedade Z(x) é uma variável aleatória com média m, variância s2 e uma função específica de distribuição acumulada.

No espaço existem infinitos pontos xi, i = 1,2, ..., Z(xi), com suas próprias funções de distribuição

O conjunto de variáveis aleatórias constituem uma função aleatória, ou processo aleatório, ou processo estocástico.

5

Christakos, Olea, Serre, Yu, Wang (2005) – Interdisciplinary public health reasoning and epidemiologic modelling: Springer

6

•Uma variável aleatória é entendida como uma única realização de uma função casual e não diversos resultados de uma única variável casual. •Uma realização é o conjunto de valores que surge após a obtenção de um resultado para cada distribuição. •O conjunto de valores reais de Z que inclui a realização da função aleatória é conhecido como variável regionalizada. •No estudo do comportamento das variáveis regionalizadas, entendidas como resultantes de um processo aleatório, a ferramenta básica é a análise da continuidade espacial. •Para descrever a variação existente associada ao processo aleatório, deve-se supor que os valores da variável regionalizada obtidos em lugares próximos tendem a ser autocorrelacionados.

7

Momentos considerados na função aleatória em Geoestatística Linear: média e variância

Momento de primeira ordem: Média = E{Z(x)} = m(x) Momentos de segunda ordem: Variância (Covariância) Correlação Variograma (semivariograma) Todos em função da localização espacial (vetor h) Os pares de valores referem-se à mesma variável, obtidos em locais com distâncias “h(lag)”, ou seja Z(x)/head” e Z(x+h)/tail

8

Page 3: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

3

9

Covariância:

𝑪 𝒉 =𝟏

𝑵 𝒉 𝒛 𝒖𝜶 ∙ 𝒛 𝒖𝜶 + 𝒉 − 𝒎𝟎 ∙ 𝒎+𝒉

𝑵 𝒉 𝜶=𝟏

Correlação: 𝝆 𝒉 =𝑪 𝒉

𝝈𝟎∙𝝈+𝒉

Semivariância: 𝜸 𝒉 =𝟏

𝟐𝑵 𝒉 [𝒛 𝒖𝜶 + 𝒉 − 𝒛 𝒖𝜶 ]𝟐

𝑵 𝒉 𝜶=𝟏

𝒎𝟎 =𝟏

𝑵 𝒉 𝒛 𝒖𝜶 𝒎+𝒉 =

𝟏

𝑵 𝒉 𝒛 𝒖𝜶 + 𝒉

𝑵 𝒉

𝜶=𝟏

𝑵 𝒉

𝜶=𝟏

𝝈𝟎 =𝟏

𝑵 𝒉 [𝒛

𝑵 𝒉 𝜶=𝟏 (𝒖𝜶 − 𝒎𝟎]²

𝝈+𝒉 =𝟏

𝑵 𝒉 [𝒛

𝑵 𝒉 𝜶=𝟏 (𝒖𝜶 + 𝒉 −𝒎+𝒉]²

10

Covariância e Correlação são medidas de similaridade entre valores de Z(x) e Z(x+h). Semivariância é uma medida de dissimilaridade entre valores de Z(x) e Z(x+h)

Variável regionalizada (V.R.)

Apresenta duas características:

Característica “aleatória”: irregularidade e variação imprevisível de um ponto para outro

Característica “estrutural”: ligações existentes entre os pontos no espaço, motivadas pela gênese do fenômeno natural.

É impossível prever com exatidão o teor de um poluente na pluma de contaminação (aspecto aleatório), mas é provável que se encontre um alto teor de um poluente perto de outro alto teor (aspecto estrutural),

11

Como definir e, por conseqüência, prever o comportamento espacial da variável regionalizada?

A natureza estrutural de um conjunto de dados da variável regionalizada é definida a partir da comparação de valores obtidos entre dois pontos, segundo uma determinada direção.

12

Page 4: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

4

O conjunto de variáveis aleatórias Z(xi), i = 1, 2, ...N, correlacionadas entre si constituem uma função aleatória da qual se conhece apenas uma realização z(xi), ou seja o conjunto dos dados experimentais. Com uma só realização é teoricamente impossível determinar quaisquer parâmetros, como média ou variância, da função. A solução consiste em assumir restrições segundo diversos graus de estacionariedade da função aleatória.

13

Uma variável regionalizada obedece a uma estacionariedade de 1ª ordem quando seus atributos são invariantes por translação. Se for admitido que todas as variáveis aleatórias tenham a mesma media, este parâmetro passa a ser independente da localização de xi e pode ser estimado pela média aritmética dos valores das realizações das variáveis aleatórias: E{Z(x1)}= E{Z(x2)}=... E{Z(xi)}= E{Z(x)}= m Essa hipótese estar correta significa supor que a média das amostras seja representativa da área estudada, ou seja, que os valores não homogêneos. A homogeneidade espacial dificilmente ocorre, sendo necessário a verificação da variabilidade presente.

N

i

ixZN

m1

)(1

A hipótese de estacionariedade de 2ª ordem alem de definir que a esperança matemática, E{Z(x)}, existe e não depende do suporte x, define também que a correlação entre duas variáveis aleatórias depende somente da distância espacial, h, que as separa e é independente da sua localização: E{Z(x)} = m Covariância= C(h)=E{Z(x+h)*Z(x)}-m2, onde h representa um vetor de coordenadas. Como a covariância depende do tamanho do vetor h, se h=0, C(h) passará a representar a variância (C(0)). Var{Z(x)}=E{[Z(x)-m]2}=C(0). A função variograma é definida como a variância do incremento [Z(x+h)–Z(x)]:

(h)= E{[Z(x+h)-Z(x)]2}=C(0)-C(h).

A hipótese de estacionariedade de 2ª ordem assume a existência da variância e, portanto, de uma variância a priori finita. Existe fenômenos físicos com uma capacidade infinita de dispersão nos quais não se pode definir a priori nem a covariância nem a variância. Hipótese intrínseca: se a media pode não ser constante, para intervalos pequenos de h, as diferenças esperadas poderiam ser zero: E[Z(x) – Z(x+h)] = 0 Alem disso substitui a covariância pela variância das diferenças como medida de relação espacial, assumindo a existência e estacionariedade do variograma. Para todos os vetores h o incremento [Z(x+h) – Z(x)] tem uma variância finita, a qual não depende do suporte x: Var{Z(x+h) – Z(x)} = E{[Z(x+h) – Z(x)]2=2 (h).

Page 5: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

5

Como (h) = C(0) - C(h) se o vetor h for infinitamente pequeno, a variância é mínima e a covariância máxima. Haverá um valor Δh para o qual ambas podem apresentar valores aproximadamente iguais, porém, à medida que Δh aumenta a covariância diminui enquanto a variância aumenta, porque ocorre progressivamente maior independência entre os pontos a distâncias cada vez maiores. A variância distribui-se assim de 0, quando h=0, até um valor igual à variância das observações para um alto valor de h, se os dados forem estacionários, isto é, não ocorrer a presença de tendência nos valores.

Essas relações são mostradas quando a função (h) é colocada em gráfico contra h para originar o variograma. A distância segundo a qual (h) atinge um patamar, denominado soleira ou sill, igual à variância à priori dos dados, é chamada de alcance (a) ou amplitude (range). A variância não é apenas igual à média das diferenças ao quadrado entre pares de pontos espaçados segundo distâncias h, mas também é igual à variância dessas diferenças.

Estacionariedade de 1ª Ordem:

Lei de distribuição é invariante por translação

µ = E[Z(x)]

Estacionariedade de 2ª. Ordem ou estacionaridade fraca:

Quando x1 e x2 coincidem: s2=E[{Z)-m}2]

Quando x1 e x2 não coincidem, para qualquer par de pontos x1 e x2 separados pelo vetor h=xi-xj:

C(xi,xj)=E[{Z(xi)-m}{Z(xj)-m}]

Constância da média, variância e covariância dependem apenas da separação ‘h’ e não das posições absolutas.

19

Hipótese intrínseca

Admite que os incrementos [Z(x)-Z(x+h)] sejam fracamente estacionários, i.e., independentes de x e dependentes apenas da distância e da orientação entre os pontos.

E[Z(x) – Z(x+h)] = 0 (estacionariedade de 1ª ordem)

No lugar de covariância, variância:

Var[Z(x) – Z(x+h)] = E{[Z(x) – Z(x+h)]}2 = 2(h)

Função variograma 2γ(h): esperança matemática do quadrado da diferença entre os valores de pontos no espaço, separados por uma distância h.

20

Page 6: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

6

Para a obtenção de um variograma é suposto que a variável regionalizada tenha um comportamento fracamente estacionário, onde os valores esperados, assim como sua covariância espacial, sejam os mesmos por uma determinada área.

Assume-se, desse modo, que os valores dentro da área de interesse não apresentem tendência que possam afetar os resultados.

21

(h) = C(0) - C(h)

22

Covariância e Correlação são medidas de similaridade entre valores de Z(x) e Z(x+h). Semivariância é uma medida de dissimilaridade entre valores de Z(x) e Z(x+h).

Variograma teórico

Variograma ou semi-variograma?

Variância das diferenças entre dois valores em pontos separados por h.

Na prática, o interesse é pela metade disso (semi) que fornece a variância por ponto, quando os pontos são considerados aos pares

23 24

Diagrama de dispersão com um ponto com coordenadas (Z(x+h),Z(x)). Esse ponto é projetado na reta bissetriz e resulta na ordenada Z(x+h); em seguida, determina-se a distância entre o ponto original e a reta bissetriz (vetor em vermelho). Esses três pontos formam um triângulo retângulo, cuja hipotenusa é a diferença em módulo entre Z(x+h) e Z(x). Sendo o i-ésimo par de coordenadas (Z(x+h),Z(x)), a distância para a reta bissetriz pode ser calculada: di =|Z(x+h)-Z(x)|.cos45º Elevando a i-ésima distância ao quadrado tem-se: di²= ½[Z(x+h)-Z(x)]²

Considerando n pares de pontos, para uma determinada distância h, pode-se calcular a média das distâncias, chamada por Journel (1989) de momento de inércia: Quanto maior a dispersão, maior o momento de inércia e menor a correlação. Se não houver dispersão, isto é, todos os pares de pontos caírem sobre a reta 45º, o momento de inércia é zero e o coeficiente de correlação é igual a 1 (máxima correlação). Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos em um diagrama de dispersão. Como o variograma também usa a fórmula do semi-variograma, é indiferente denominar variograma ou semi-variograma.

Page 7: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

7

Gráfico para o variograma: valores de , em ordenada, e “h”, na abcissa.

25

Preferência pelo Variograma

• O variograma pode ser utilizado para modelar fenômenos não estacionários e a covariância não, pelo não conhecimento da média. .

• Quando a média é constante, mas não conhecida, não se torna necesaria para o cáculo do variograma, mas sim para o cálculo da covariância.

•Se a função tem variância infinita (não estacionária), a covariância não esta definida em 0, mas o variograma sim e é tambem nulo.

1x2x 3x

4x 5x 6x

h

Dados igualmente espaçados: 1D

27

Dados igualmente espaçados: 2D

44 42 45 37 34 12 34 56

55 33 23 45 56 34 33 45

29 37 48 39 40 45 64 44

66 23 27 45 45 34 33 28

56 41 90 42 38 45 56 66

44 23 23 45 45 44 87 56

1 2 3 4 5 6 7 8

0

1

2

3

4

5

E-W

N-S

NE-SW

NW-SE

28

Page 8: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

8

Dados irregularmente espaçados: 2D

• Pode ocorrer que não existam valores da variável na distância h

• Pode ocorrer que não existam valores na direção θ

29

Correção para regularizar a malha

30

31 32

Page 9: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

9

33

Distância Leste-Oeste Norte-Sul

h Np h Np

0,5 0,028 8 0,028 11 1,0 0,043 18 0,097 15 1,5 0,051 12 0,069 13 2,0 0,047 12 0,147 7 2,5 0,158 6 0,216 9 3,0 0,015 5 0,133 3 3,5 0,104 4 0,178 3

Variograma experimental mínimo de 30 (50?, 100?) pares remoção de valores anômalos maior h, a metade da maior distância existente entre

os pontos. grau de casualidade dos dados, E = Co/C

E<0,15: componente aleatória pequena 0,15 < E < 0,30: componente aleatória significante E > 0,30: componente aleatória muito significativa

extremo do grau de casualidade é o modelo de pepita pura, onde não ocorre covariância entre os valores e a análise semivariográfica não se aplica

iniciar com semivariograma omnidirecional

34

35

Efeito pepita

(h)

0

Mínimo alcance(range) detectavel = d

h d

Distancia entre pontos = d

x x x x

x x x x

x x x x

d

36

Page 10: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

10

Modelagem

37

Processo que envolve várias tentativas e durante o qual a experiência pesa muito

Necessidade de ajustar uma função matemática que descreva continuamente a variabilidade ou correlação espacial nos dados

O variograma experimental não serve para esse fim, porque há necessidade de interpolação e os pontos apresentar-se-ão com uma certa dispersão, principalmente para distâncias grandes, quando o número de pares de amostras diminui.

• O variograma experimental não avalia distâncias e direções intermediárias

• Uma interpolação entre pontos do variograma

experimental não garante a existência e unicidade de

solução para o sistema de krigagem

38

Variograma teórico

Ajuste do variograma experimental a um modelo

variográfico teórico Comparação visual Técnicas de ajuste automático:

Método dos mínimos quadrados Critério AIC (Akaike Information Criterion) Critério Cressie Critério Variowin, etc.

Validação cruzada

39

Validação cruzada Depois de obtido o modelo variográfico, cada valor original é removido do domínio espacial e, usando-se os demais, um novo valor é estimado para esse ponto. Desse modo, um gráfico pode ser construído mostrando a relação entre valores reais e estimados. A validação cruzada, porém, não prova que o modelo escolhido é o mais correto, mas sim que o mesmo não é inteiramente incorreto. A melhor verificação, então, é aquela resultante do confronto entre os valores estimados e a realidade de campo.

40

Page 11: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

11

Modelos de variogramas

As funções matemáticas dos modelos devem permitir que a matriz de covariâncias, neles baseada, possa ser invertida, para fornecer os “pesos” para a interpolação por krigagem.

Desse modo, somente certos modelos podem ser usados.

41

Modelo Esférico

42

Modelo Exponencial

43

Modelo Gaussiano

44

Page 12: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

12

Modelo Potência

45

Modelo Efeito Pepita Puro

Va

rio

gra

ma

Distancia

S

Este modelo representa um

fenômeno completamente

aleatório, no qual não ha

correlação espacial

46

A interpretação do variograma permite obter parâmetros que descrevem o comportamento espacial das variáveis regionalizadas.

Uma feição resultante da análise dos parâmetros do variograma experimental é a zona de influência: qualquer valor de Z(x) estará correlacionado com outros valores Z(x+h) que estiverem dentro de um raio "a" de x. Esta correlação, ou a influência de um valor em outro, decresce conforme Z(x+h) aproxima-se de "a".

O variograma é utilizado para calcular os valores de variância, para uma dada distância, os quais são necessários para a organização do sistema de equações da krigagem.

47

Para a utilização do variograma as seguintes suposições básicas são requeridas:

a) as diferenças entre pares de valores de amostras são determinadas apenas pela orientação espacial relativa dessas amostras;

b) o interesse é enfocado apenas na média e na variância das diferenças, significando que esses dois parâmetros dependem unicamente da orientação (hipótese intrínseca);

c) por conveniência assume-se que os valores da área de interesse não apresentam tendência que possa afetar os resultados e assim a preocupação será apenas com a variância das diferenças entre valores das amostras.

48

Page 13: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

13

Análise variográfica

Os variogramas expressam o comportamento espacial da variável regionalizada e mostram:

a) o tamanho da zona de influência em torno de uma amostra, pois toda amostra cuja distância ao ponto a ser estimado for menor ou igual ao alcance, fornece informações sobre o ponto;

b) a anisotropia, quando os variogramas mostram diferentes comportamentos para diferentes direções de linhas de amostragem e de estudo da variável; geométrica quando o alcance varia de acordo com as diversas direções consideradas, mantendo constante a soleira; zonal quando o alcance permanece constante e a soleira varia conforme for modificada a direção;

49

c) presença de descontinuidade inicial, em que para h 0, (h) já apresenta algum valor (efeito pepita (nugget effect); pode ser atribuído a erros de medição ou ao fato de que os dados não foram coletados a intervalos suficientemente pequenos para mostrar o comportamento espacial subjacente do fenômeno em estudo; d) pela forma : 1) se estabiliza ao longo do patamar, indica um processo estacionário de segunda ordem; 2) se cresce indefinidamente, ou seja, sem estabilizar ao longo do patamar, indica presença de tendência nos dados; 3) se com h 0, (h) apresenta já algum valor e permanece nesse nível, indica efeito pepita puro, ou seja que os valores não apresentam autocorrelação espacial.

50

Anisotropias

Variograma experimental ao ser calculado para distintas

direções apresenta distintos comportamentos

Anisotropia geométrica

Anisotropia zonal

51

Anisotropía Geométrica :

Variogramas com distintas direções apresentam distintos alcances, porém com o mesmo patamar

0

0,5

1

1,5

2

2,5

3

0,0 0,9 2,0 3,0 4,1 5,1 6,2 7,2 8,3 9,3 10,4 11,4

Vari

og

ram

a

Distancia

N-S

E-O

Maior continuidade espacial na direção com maior alcance

Menor continuidade espacial na direção de menor alcance

52

Page 14: ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos ... · Assim a fórmula do semi-variograma não é empírica, mas resultante da interpretação geométrica dos pares de pontos

14

Anisotropía Zonal :

Variogramas em distintas direções apresentam distintos patamares para o mesmo alcance

Presença de diferentes estruturas

0

0,5

1

1,5

2

2,5

3

3,5

0 0,94 1,99 3,04 4,09 5,14 6,19 7,24 8,29 9,34 10,3911,44

Vari

og

ram

a

Distancia

Anisotropía Zonal

53 54

Fatores que podem afetar a confiabilidade no variograma experimental:

• Tamanho da amostra • Intervalo de amostragem e escala espacial • Intervalo do “lag” • Função de distribuição dos valores • Anisotropia • Presença de tendência

55

EXERCÍCIO 02. Análise variográfica No Exercício 01 a matriz de dados era composta por 359 pontos. Posteriormente foi realizado um sorteio reduzindo a matriz para 100 pontos, conforme listagem anexada. Construir variogramas experimentais para as três variáveis geoquímicas com dados tanto do exercício 01 como deste exercício. Comparar os resultados. Modelar os variogramas construidos para 359 pontos. Verificar para cada caso se a soma dos valores de “nugget” + “sill” equivale à variância amostral. Explicar por que.

56

Encontrar os variogramas experimentais apenas para a variável Pb (359 valores) nas seguintes direções: 0º, abertura 90º (omnidirecional) 45º, abertura 90º (omnidirecional) 90º, abertura 90º (omnidirecional) 135º, abertura 90º (omnidirecional) 0º, abertura 20º 45º, abertura 20º 90, abertura 20º 135, abertura 20º Comparar os resultados e explicá-los.