1 mini-curso geoestatÍstica aplicada ao estudo de solos prof. eduardo rodrigues viana de lima...

1

MINI-CURSO

GEOESTATÍSTICA APLICADA

AO ESTUDO DE SOLOS

Prof. Eduardo Rodrigues Viana de LimaDepartamento de Geociências

Universidade Federal da Paraíba

2

A geoestatística distingue-se da estatística clássica pelo fato de

considerar que os valores de uma variável estão de alguma forma

relacionados à sua distribuição espacial, ou seja, observações tomadas

a curtas distâncias devem ser mais semelhantes do que aquelas

tomadas a distâncias maiores, e por levar em consideração o

comportamento espacial das variáveis apresenta grande potencial de

aplicação nas geociências/ciências ambientais.

INTRODUÇÃO

3

A Geoestatística não faz todo o tratamento de dados de forma

integrada: é preciso parar no fim de cada etapa e selecionar,

interpretar; também não cria dados: apenas trata a informação

disponível.

A Geoestatística utiliza os dados duas vezes, primeiramente para

estimar a autocorrelação espacial e depois para estimar a variável em

locais não amostrados . Como todas as técnicas estatísticas, a

Geoestatística baseia-se em um conceito probabilístico. Para uma

aplicação segura da Geoestatística, é necessário um conhecimento

prévio dos conceitos de Estatística, sendo importante que se proceda a

um estudo estatístico elementar dos dados, com a finalidade de testar

se as condições exigidas para aplicar o formalismo próprio da

Geoestatística estão satisfeitas.

4

As técnicas geoestatísticas podem ser usadas para descrever e

modelizar padrões espaciais (variografia), para predizer valores em

locais não amostrados (krigagem), para obter a incerteza associada a

um valor estimado em locais não amostrados (variância de krigagem) e

para otimizar malhas de amostragem.

No caso específico de utilização da Geoestatística com a finalidade de

apoio à otimização de malhas de amostragem, é oportuno salientar que

o erro cometido ao fazer uma avaliação com malhas de amostragem

diminui com o detalhamento da malha, mas esse crescimento não é

linear, conforme mostra a figura 1.

5Figura 1 – Relação entre malha de amostragem e erro de avaliação.

6

Os métodos de estimação linear comumente utilizados fazem mais

sentido quando a distribuição dos resíduos é aproximadamente normal.

Sendo a média dos resíduos igual a zero e minimizando o desvio-padrão

dos erros (feito pelos métodos de estimação linear), as predições obtêm

um bom resultado. Assume-se que os erros de estimação sejam

normalmente distribuídos.

Quando o valor esperado para um erro de estimação é zero, diz-se que o

estimador é não-enviesado.

7

As vantagens reconhecidas da Geoestatística sobre outras técnicas

convencionais de predição são:

-o estudo da variabilidade espacial (a análise de um semivariograma é a

única técnica disponível para medir a variabilidade espacial de uma

variável regionalizada);

- a suavização (a estimação geoestatística suaviza ou faz a regressão de

valores preditos);

-o desagrupamento (ou efeito de anular as concentrações localizadas de

observações);

- a determinação da anisotropia (os comportamentos da variabilidade nas

diferentes direções são considerados);

8

- a precisão (a krigagem fornece valores precisos sobre as áreas ou

pontos a serem avaliados);

- e a incerteza (estimativas obtidas por meio da krigagem associam a

margem de erro que acompanha a estimativa).

Tratando-se de um modelo probabilístico, a geoestatística explora a

aparente aleatoriedade dos dados, para avaliar as medidas de correlação

espacial dos mesmos, considerando uma determinada vizinhança

(Huijbregts, 1975).

9

Assim, a variável que apresenta uma distribuição no espaço com certo

grau de correlação espacial pode ser considerada regionalizada.

Diversas variáveis relativas ao meio físico assumem as características de

regionalizadas. O comportamento que assume essas variáveis está

fundamentado em modelos probabilísticos e em função disso define a

chamada teoria das variáveis regionalizadas (Matheron, 1962) apud

Sturaro (1994), as quais são consideradas como a realização única de

uma determinada função aleatória (Matheron, 1962) apud Sturaro (1994).

A teoria das variáveis regionalizadas tem como objetivo básico avaliar as

características estruturais dessas variáveis e efetuar estimativas.

10

Modelos utilizados na análise geoestatística

Para conhecer as características da variável regionalizada, a mesma deve

ser expressa através de uma função aleatória, seguindo alguma lei de

distribuição de probabilidades e sendo caracterizada pelos parâmetros da

distribuição.

Uma variável regionalizada z(x) pode ser considerada como uma variável

aleatória, no sentido de que os valores das medições feitas podem variar

consideravelmente entre si, e assume um caráter estruturado dentro de

uma determinada área, segundo uma certa lei no espaço, considerando

que os valores das observações não são completamente independentes

da sua localização geográfica. Assim, a variável regionalizada pode ser

considerada como uma realização única de uma variável aleatória Z para

uma localização dentro dessa área. Se a variável regionalizada z(x) for

considerada para todos os locais da referida área, torna-se uma dentre

um conjunto infinito de variáveis aleatórias Z(x) para todos os locais da

área (Souza, 1992).

11

Considerando que a amostragem singular não permite que se conheça a

função densidade de probabilidades de uma variável regionalizada, a

geoestatística linear utiliza-se de momentos da função casual, para fazer

inferências sobre essa função de densidade de probabilidades (Journel e

Huijbregts, 1978 apud Sturaro, 1988). Os momentos são os seguintes:

Estacionaridade de 1ª ordem

E {x(i) - x (i+h)}= m(h)

Onde: m(h) representa a tendência.

x(i)e x(i+h)são dois valores de uma mesma variável regionalizada obtidos

nos pontos i e i+h, separados entre si por uma distância h.

A diferença entre esses dois valores é outra variável casual [x(i) - x(i+h)].

12

Estacionaridade de 2ª ordemE {(x(i) - x(i+h) - m(h)} = 2y(h)

onde: m(h) representa a tendência e y(h) representa a semivariância.

O grau de relação entre pontos numa certa direção pode ser expresso pela covariância, e embora a covariância exista entre todas as distâncias possíveis ao longo de h, pode ser estipulado que somente serão considerados valores entre pontos regularmente espaçados por múltiplos de h.A covariância entre valores encontrados nessas distâncias separadas por h ao longo de h é: K(h)=K(h)=1/nx(i)x(i+h).Onde: K=covariância e n=número de pares de valores comparados.

Isso significa que a covariância é igual à média dos produtos dos valores x(i) encontrados nos pontos i pelos valores x(i+h) encontrados nos pontos i+h, distantes a um intervalo h, e n representa o número de pares de valores comparados.

Se h=0, K(h) passa a representar a variância K(0)=1/n x(i)x(i+0).Desse modo, pode-se computar uma função denominada semivariância, definida como metade da variância das diferenças y(h)=[x(i+h)-x(i)]/2.

13

A função aleatória pode ser estacionária (apresenta o comportamento

espacial da variável invariante sob translação), ou seja, em qualquer

direção assume-se que seja constante o valor médio esperado (Sturaro,

1994), e para tanto assumem-se hipóteses de estacionaridade para o

processo, considerando que a variável deve ser estatisticamente

homogênea e isotrópica, permitindo que se façam inferências estatísticas

(Vieira et alii, 1983).

Uma vez que, na prática, é difícil verificar a ocorrência da hipótese básica,

trabalha-se ainda com as hipóteses de segunda-ordem e a intrínseca

conforme Vieira et alii, (1983) e Pannatier (1996).

14

O vetor h apresentando-se infinitamente pequeno faz com que a

variância e a covariância se tornem muito próximas. Como consequência,

espera-se que ambas sejam aproximadamente iguais para pequenos

valores de h. Para h maiores, a covariância diminuirá enquanto a

variância aumentará, porque ocorrerá progressivamente maior

independência entre os pontos a distâncias cada vez maiores.

A semivariância distribui-se assim de 0, quando h=0, até um valor igual à

variância das observações para um alto valor de h.

Essas relações são mostradas quando a função y(h) é colocada em

gráfico contra h para originar o semivariograma.

15

Ocorrendo estacionaridade de segunda-ordem, a covariância e o

semivariograma são recursos disponíveis também para caracterizar a

autocorrelação entre duas variáveis z(x) e z(x+h), separadas por um

vetor h. Diante da existência de covariância, trabalha-se com uma

variância finita, expressa como . Var z x c( ) ( ) 0

Entretanto, diversos fenômenos naturais apresentam capacidade infinita

de dispersão, não possuindo covariância e portanto com inexistência de

variância finita. Nesses casos, assume-se uma forma mais fraca de

estacionaridade chamada hipótese intrínseca, na qual apenas o

semivariograma serve como instrumento de análise da estacionaridade.

16

Assim sendo, a função aleatória z(x) é tida como sendo intrínseca se:

- a esperança matemática existe e não depende da posição x: E z x( )

E z x m( )

- para todo vetor de separaço h o incremento tem variância finita

que não depende de x:

z x h z x( ) ( )

1

2

1

22

Var z x h z x E z x h z x h( ) ( ) ( ) ( ) ( )

Embora haja possibilidade de avaliar o grau de dependência espacial de

uma variável por meio do coeficiente de correlação e da covariância, o

momento de inércia denominado de semivariograma é amplamente

utilizado, pelo fato do mesmo ter condições de modelar fenômenos

naturais de elevada dispersão espacial.

17

A função semivariograma pode ser considerada como o momento de

inércia em torno da diagonal do diagrama de dispersão espacial,

conforme mostra a figura 2 (Pannatier, 1996):

Figura 2 - Diagrama de dispersão de uma variável V(x).Fonte: Pannatier, 1996.

18

Enquanto o momento de inércia constitui a metade da média das

diferenças quadráticas entre as coordenadas de cada par de pontos, o

semivariograma por sua vez, é calculado para uma mesma variável a

diferentes intervalos de distância e em diferentes direções, com o

intuito de verificar a continuidade espacial da variável.

19

Matematicamente a função semivariograma é expressa da seguinte forma:

( ) ( ) ( )hn

V Vx x hi

n

12

2

1

onde:

( ) ( ) ( )hn

V Vx x hi

n

12

2

1

n é o número de pares da variável considerados em uma determinadadireção;

é a mesma variável em dois pontos diferentes, separados por uma distância pré-estabelecida e constante a uma certa direção;

½ corresponde à metade da média das diferenças quadráticas e que representa a distância perpendicular dos pontos em relação à linha de 45 graus do diagrama de dispersão espacial (Fig. 2);

h é o intervalo de distância pré-estabelecida.

é o semivariograma;

V eVx x h( ) ( )

20

Graficamente a função semivariograma é expressa conforme mostra a

figura 3, e cujas características são apresentadas em seguida:

Figura 3 - Esquema básico de uma função semivariograma.

21

- Amplitude variográfica (a) ou alcance: Distância na qual a máxima

variabilidade é atingida e que corresponde ao aumento da distância entre

as amostras;

- Patamar (c) ou sill: Representa o nível de variabilidade onde o

semivariograma se estabiliza. Corresponde a diferença entre o ponto de

maior correlação ou a origem do semivariograma e o ponto que

teoricamente representa a variância populacional e a variabilidade se

estabiliza;

- Efeito pepita (co): Descontinuidade na origem do semivariograma,

correspondendo à diferença entre as amostras de maior proximidade e

gerada por microrregionalizações, erros de amostragens ou erros de

medidas.

22

Amostras separadas por distâncias menores do que a amplitude

variográfica são espacialmente correlacionadas, por outro lado aquelas

separadas por distâncias maiores não são, considerando que o valor do

semivariograma sendo igual à variância dos dados, a variação é aleatória.

Garcia (1988) considera que uma relação entre os parâmetros “co” e “c”

expressa o grau de aleatoriedade do fenômeno regionalizado, e pode ser

avaliada por “E”, que representa o efeito de pepita relativo. Esta

componente aleatória pode ser classificada da seguinte forma:

E < 0,15 componente aleatória pequena

0,15 < E < 0,30 componente aleatória significativa

E > 0,30 componente aleatória muito significativa

23

Segundo Matheron (1963) apud Sturaro (1988), em geral, o

semivariograma é uma função de incremento com a distância “h”, visto

que, quanto mais afastadas forem as amostras, mais seus valores em

média deverão ser diferentes. Esta característica reflete bem a noção de

zona de influência de uma amostra.

Nesse aspecto é que o semivariograma experimental deve ser

considerado, no máximo, para a metade da distância total de

amostragem no campo, isto quando o número de pares de dados seja

maior do que 30 (Journel & Huijbrgts, 1991).

24

A noção de zona de influência de uma amostra está relacionada com a

existência de regionalizações. Os semivariogramas exercem sua função

no modelamento espacial de diversos fenômenos, quando da detecção

da continuidade espacial ou regionalização de uma variável, e

consequentemente de possíveis ocorrências de anisotropias.

Para avaliar o comportamento da variabilidade espacial de uma variável,

os semivariogramas são elaborados experimentalmente e submetidos à

análise de suas características estruturais. A figura 4 ilustra as

propriedades estruturais do semivariograma (Huijbregts, 1975): suporte,

zona de influência, estruturas superpostas, anisotropia, continuidade

espacial ou comportamento da variável próxima a origem,

corregionalização.

25Figura 4 - Propriedades estruturais do semivariograma. (Huijbregts, 1975)

26

Suporte: As variações de uma variável regionalizada ocorrem em um

certo domínio do espaço ou domínio geométrico. A variável regionalizada

é definida em um determinado suporte geométrico, cujas amostras no

espaço tenham volume, forma e orientação. Se o suporte é alterado, uma

nova variável regionalizada é definida, relacionada ao suporte inicial,

mas com características diferentes e um semivariograma diferente.

Zona de influência: O semivariograma é uma função de incremento da

distância orientada “h”. Quanto mais essa distância entre as amostras

aumenta, menos correlacionadas essas amostras ficam, ou seja, há um

aumento da variância, até que ocorre uma total independência entre as

mesmas. A zona de influência de uma variável regionalizada corresponde

à distância chamada de range (a), a partir da qual a variância torna-se

constante, e cuja medida é a amplitude variográfica.

27

Estruturas superpostas: Fenômenos de transição são caracterizados

nos semivariogramas pelo range e pelo “sill”. Essas características

podem refletir a existência de superposição de regionalização em

diferentes escalas.

Anisotropia: Considerando que a distância expressa no semivariograma

é um vetor, este deve ser calculado para diferentes direções. Assim,

quando o semivariograma apresenta configurações similares para todas a

direções medidas, diz-se que o fenômeno é isotrópico. Quando isso não

ocorre, pode ser que haja anisotropia de duas formas distintas. Num dos

casos, o semivariograma apresenta a mesma forma, mas com amplitudes

diferentes, o que representa anisotropia geométrica. No outro caso o

semivariograma apresenta-se bem diferente para direções diferentes,

representando uma anisotropia zonal.

28

Continuidade espacial ou comportamento da variável próxima a

origem:

O comportamento da curva do semivariograma em pequenas distâncias,

ou seja, próxima a origem, reflete a continuidade da regionalização.

Teoricamente, o semivariograma deveria ser nulo na origem, entretanto,

isto geralmente não ocorre e o que passa a existir é uma descontinuidade

denominada de efeito de pepita devido a problemas referentes a

existência de microrregionalizações ou erro de amostragem.

Independentemente da ocorrência ou não do efeito de pepita, o

comportamento parabólico da curva a partir do seu ponto inicial, reflete

uma boa continuidade espacial, enquanto que a forma linear reflete uma

continuidade moderada.

29

Corregionalização:

Esta característica é obtida no caso de duas variáveis regionalizadas

serem analisadas em um mesmo suporte geométrico e também no

mesmo semivariograma. O semivariograma cruzado exibe a existência de

corregionalização ou correlação regionalizada entre as duas variáveis.

30

Segundo Landim (1993), para a utilidade do semivariograma as seguintes

suposições básicas são requeridas:

a) As diferenças entre pares de valores de amostras são determinadas

apenas pela orientação espacial relativa dessas amostras;

b) O interesse é enfocado apenas na média e na variância das diferenças,

significando que esses dois parâmetros dependem unicamente da

orientação (hipótese intrínseca);

c) Por conveniência assume-se que os valores da área de interesse não

apresentam tendência que possa afetar os resultados e assim a

preocupação será apenas com a variância das diferenças entre valores

das amostras.

31

Cálculo do semivariograma a partir de amostras regularmente

espaçadas

No cálculo de amostras regularmente espaçadas, o procedimento e

efetuado geralmente para as direções de 0º, 45º, 90º, 135º, 180º, 225º,

270º, 315º e 360º, considerando todos os intervalos de distância

possíveis numa determinada direção.

Ou seja, tomando-se como ponto de partida a distância entre amostras

de 10 m, qualquer par de amostras, naquela direção selecionada, que

tenha essa distância, será considerada. O mesmo procedimento é

efetuado para outras distâncias, tais como 20 m, 30 m, 40 m e assim por

diante, até que algum ponto de parada seja alcançado, conforme

exemplifica a figura 5 (Camargo, 1998).

32

Figura 5 – Amostras regularmente espaçadas usadas para cálculo do Semivariograma (Camargo, 1998).

33

Cálculo do semivariograma a partir de amostras irregularmente espaçadas

Considerando o arranjo das amostras, conforme mostra a figura 6, para determinação do semivariograma, é necessário introduzir limites de tolerância para direção e distância (Camargo, 1998).

Figura 6 - Parâmetros para o cálculo do semivariograma a partir de amostras irregularmente espaçadas (Fonte: Deutsch e Journel, 1992 apud Camargo, 1998).

34

Define-se o Lag e uma certa tolerância, que representam o campo de

abrangência das medidas. O Lag e sua tolerância correspondem a um

intervalo de distância no qual serão medidas todos os pares de amostras

existentes.

Define-se também a direção de medida com uma certa tolerância, na qual

será efetuado o conjunto de medidas. À título de exemplo, se o Lag

definido for de 300 m, e a direção de 900 com tolerância de 300, qualquer

par de amostras cuja distância esteja compreendida entre 250 m e 350 m

e 600 e 1200, será considerado no cálculo do semivariograma para aquele

Lag utilizado. O cálculo se repete para diferentes valores de Lag e de

direção.

35

Modelos variográficos

De posse da função que exprime o comportamento da variabilidade

espacial do fenômeno, pode-se conduzir análise que expresse aquele

comportamento através de modelos de duas dimensões, ou seja, através

de mapas.

Para tanto, é necessário que sejam ajustados modelos matemáticos, ou

funções teóricas, à função semivariograma, no intuito de que sejam

determinados os valores nos locais não amostrados e a partir de então

definidas curvas de isovalores ou blocos com valores médios.

Segundo Sturaro (1988), embora possa existir uma grande quantidade de

funções que se ajustem aos semivariogramas experimentais gerados, na

prática, apenas alguns modelos, fundamentados nas teorias das variáveis

regionalizadas, tem se ajustado em casos práticos aplicados.

36

Essas funções teóricas devem atender, segundo Sturaro (1994), à

condição de serem “positiva definida”, ou seja, o sistema estruturado a

partir dessas funções, para efetuar estimativas, deve possuir uma solução

única e estável para o sistema de equações.

Os modelos considerados básicos, simples e isotrópicos (Isaaks e

Srivastava, 1989), podem ser classificados em dois grupos, segundo uma

característica que os diferencia marcantemente: um grupo de

semivariogramas com a presença de patamar e outro que não possui

patamar.

37

Modelos com patamar ou modelos de transição

Neste grupo de modelos a característica marcante diz respeito a um

limite alcançado pelo aumento da função semivariograma, que ocorre à

medida que aumenta a distância entre os pontos amostrais. Alcançado

um determinado patamar (“sill”), que corresponde teoricamente à

variância da população, a função se estabiliza.

As variações dos modelos com patamar estão relacionadas basicamente

com o comportamento espacial das amostras em relação à distância, até

que a função atinja o patamar. Este intervalo de distância é conhecido

como amplitude variográfica ou “range” e define o raio de influência da

variável. Segundo Vieira et alii (1983), a amplitude variográfica é um

importante parâmetro, considerando que as amostras separadas por

distâncias menores que o “range” são correlacionadas com as demais,

enquanto as amostras separadas por distâncias maiores que o range não

são correlacionadas.

38

Figura 6 - Modelos variográficos com patamar.

39

Modelo esférico

O mais facilmente encontrado nas aplicações da geoestatística, apresenta como característica o fato de que a tangente na origem da curva, atinge o patamar a uma distância correspondente a 2/3 da amplitude (a).

40

Modelo exponencial

Outro modelo de transição comumente encontrado, tem como característica o fato de que o “range” é atingido quando o valor do semivariograma alcança apenas assintoticamente, 95% do valor do patamar. De outra forma, a tangente na origem atinge o patamar a uma distância correspondente a 1/5 do “range”.

41

Modelo gaussiano

Este modelo tem bastante semelhança com o exponencial, principalmente no que se refere a forma como atinge o patamar e larga amplitude variográfica. Difere daquele quanto a seu comportamento parabólico na origem.

42

Modelo aleatório

Este modelo, também denominado de efeito pepita puro, é característico de fenômenos de elevada aleatoriedade, considerando que há uma acentuada descontinuidade na origem do semivariograma. (Isaaks e Srivastava, 1989). Ocorre uma diferença significativa de valor entre pontos próximos, representando que pode haver uma provável regionalização inferior à escala de trabalho da malha de amostragem e/ou variações espúrias associadas com a coleta e medição das amostras (Sturaro, 1988). Segundo Landim (1993) este modelo representa o extremo de uma situação de aleatoriedade, onde não ocorre covariância entre os valores e, portanto, a análise variográfica não se aplica.

43

Modelos sem patamar

Constituem os modelos que apresentam um aumento constante da

variabilidade à medida em que a distância é incrementada (Sturaro,

1994), ou seja, apresentam uma variância infinita e não ocorre uma

função de covariância (Landim, 1993). Satisfazem apenas a hipótese

intrínseca e não são considerados modelos de transição.

44

Modelos lineares generalizados

45

Modelo logarítmico

46

Métodos geoestatísticos de estimação

Após a análise variográfica, e verificada a possibilidade de estimação por

técnicas geoestatísticas, pode-se proceder a uma estimação de valores

em locais não amostrados. Constitui-se essa, numa tarefa

importantíssima dos estudos ambientais, principalmente no que diz

respeito a espacialização e representação cartográfica de diversos

fenômenos de interesse.

A krigagem constitui-se em um método de estimação por médias móveis

e tem como característica particular, que o diferencia e o torna superior

aos demais métodos de estimação, o fato de permitir o cálculo do erro

associado às estimativas, chamado de variância de estimação.

47

O método de estimação da krigagem foi inicialmente concebido sob a

hipótese de que a variável regionalizada resultava de um processo

estocástico estacionário de 2ª ordem, denominada de krigagem simples e

krigagem ordinária. Considerando a exigência da estacionaridade, esses

tipos de krigagem não resolviam todos os problemas.

A krigagem ordinária é considerada segundo Sturaro (1988) como o

melhor estimador linear sem viés, em função das seguintes

características:

Linear - As estimativas são feitas através de uma combinação linear dos

dados;

Sem viés - O método objetiva que o erro residual médio seja igual a zero;

Melhor estimador - O método objetiva minimizar a variância dos erros.

48

Considerando a dificuldade em conhecer os valores reais dos pontos

estimados que possibilite avaliar o erro e a variância verdadeiros, a

krigagem ordinária baseia-se em um modelo probabilístico, no qual o erro

residual médio, assim como a variância dos erros podem ser estimados.

No sentido de contornar a limitação da exigência de estacionaridade,

surge um novo tipo de krigagem, denominado de universal. Nessa

situação as variáveis regionalizadas são consideradas, segundo

Yamamoto (1988), não estacionárias, ou seja, representadas pela soma de

uma componente de deriva e outra devido às flutuações locais.

A componente aleatória, igual a diferença entre a variável regionalizada e

a componente de deriva, apresenta-se estacionária e, portanto, factível

para determinação das covariâncias ou semi-variâncias.

49

Segundo Landim (1994) a krigagem pode ser usada para:

a) Previsão do valor pontual de uma variável regionalizada em um

determinado local dentro do campo geométrico; é um procedimento de

interpolação exato que leva em consideração todos os valores

observados, o qual pode ser a base para cartografia automática por

computador quando se dispõe de valores de uma variável regionalizada

dispostos por uma determinada área.

b) Cálculo médio de uma variável regionalizada para um volume maior

que o suporte geométrico, como por exemplo, no cálculo do teor médio de

uma jazida a partir de informações obtidas de testemunhos de sondagens.

c) Estimação do drift, de modo similar à análise de superfícies de

tendência.

50

Krigagem ordinária

A krigagem ordinária é um procedimento de estimação linear para uma

variável regionalizada que satisfaz a hipótese intrínseca e procura

minimizar, sem viés, o erro de estimação, ou seja, objetiva que o erro

residual médio seja igual a zero. Na realidade, a minimização do erro de

estimação constitui um dos principais objetivos no processo de

estimação, uma vez que, possibilita auferir a sua qualidade.

Além disso, a krigagem ordinária ainda tem como característica ser o

melhor estimador, pelo fato de minimizar a variância dos erros.

Considerando que é difícil quantificar o erro e a variância para os pontos

estimados, haja vista o desconhecimento dos valores reais, a krigagem

ordinária faz uso do modelo de função aleatória, de base probabilística,

que permite atribuir pesos às amostras usadas nas estimativas.

51

Krigagem universal

Nem sempre o comportamento espacial de uma variável tem a

característica estacionária, ou seja, que a média seja constante. Isto não

ocorrendo, a variável apresenta uma deriva regional (tendência ou drift),

que consiste no valor médio ou esperado dentro de uma certa vizinhança

e que varia sistematicamente.

A krigagem universal é utilizada se ocorrer um trend nos dados, com a

média não sendo mais constante e o semivariograma ou a covariância dos

dados originais não sendo mais apropriados para modelizar a estrutura de

correlação espacial. O que se necessita é de um semivariograma dos

resíduos e um modelo para descrever a forma do trend.

A krigagem, nesse caso, é executada sobre os resíduos. Em outras

palavras, se a VR for não-estacionária, trabalha-se sobre a estacionaridade

residual.

52

Krigagem por indicação

Este tipo de modelagem computacional se caracteriza por utilizar os

procedimentos não lineares da geoestatística, a krigagem por indicação e

a simulação estocástica por indicação, para modelar a variabilidade dos

atributos espaciais. Estes procedimentos possibilitam a inferência de uma

aproximação discretizada do modelo de distribuição de probabilidade do

atributo que é, então, utilizada para modelagem da incerteza sobre seus

valores. Assim, tem-se uma modelagem espacial não paramétrica que

pode, portanto, ser usada sem restrições ao tipo de distribuição do

atributo.

Os modelos de incerteza são obtidos diretamente da distribuição,

independem de um estimador escolhido e estão relacionados ao

comportamento de variabilidade do atributo.

53

Outra vantagem importante destes procedimentos é a possibilidade de se

modelar dados temáticos, além dos dados de natureza numérica. Assim,

pode-se trabalhar com propagação de incertezas para modelos

computacionais que envolvam atributos numéricos e temáticos.

Os estimadores de krigagem são considerados estimadores lineares por

estimarem um valor, em uma posição espacial não observada, segundo

uma combinação linear dos valores de um subconjunto amostral local.

Além dos problemas com a estimativa de incerteza, estes estimadores

são usados apenas para inferir valores de variáveis de natureza

numérica. A krigagem linear não pode ser usada para inferir valores entre

classes ainda que exista ordenação entre elas.

54

Um estimador de krigagem não linear é um estimador de krigagem

linear

aplicado sobre um conjunto amostral cujos valores do atributo foram

modificados segundo uma transformação não linear, por exemplo, uma

transformação gaussiana, uma transformação lognormal ou outra

(Deutsch e Journel 1998).

O procedimento de krigagem por indicação requer uma transformação

não linear, chamada de codificação por indicação, que transforma cada

valor do conjunto amostral Z(uα) em valores por indicação.

55

O estimador de krigagem por indicação possibilita inferências para dados

numéricos e para dados temáticos e, também, estimativas de incertezas

associadas a estes atributos. Esta técnica tem como principal vantagem

ser não paramétrica, ou seja, nenhum tipo de distribuição para a VA é

considerado a priori. Ela possibilita a estimativa da função de distribuição

da VA que, por sua vez, permite a determinação de incertezas e a

inferência de valores do atributo, em localizações espaciais não

amostradas. Além disso, diferentemente da krigagem linear, este

procedimento consegue modelar atributos com alta variabilidade

espacial, sem a necessidade de se ignorar os dados amostrados cujos

valores estão muito distantes de uma tendência (Journel 1983).

56

Vantagens e desvantagens da krigagem por indicação

Pode-se ressaltar as seguintes vantagens, específicas do procedimento de

krigagem por indicação:

• a krigagem por indicação é não paramétrica. Não considera nenhum

tipo de distribuição de probabilidade a priori para a variável aleatória. Ao

invés disso, ela possibilita a construção de uma aproximação discretizada

da função de disribuição de Z(u). Os valores de probabilidades

discretizados podem ser usados diretamente para se estimar valores

característicos da distribuição, tais como: quantis, valor esperado e

variância. Portanto não se restringe a modelagem de atributos com

distribuições simétricas como, por exemplo, a gaussiana;

57

• a krigagem por indicação fornece uma metodologia única para

espacialização, com estimativa de incertezas, para atributos espaciais de

natureza temática e numérica;

• diferentemente da krigagem linear, que estima a variância do erro de

estimação em função do estimador e da distribuição geométrica das

amostras, a krigagem por indicação possibilita a estimativa de incertezas,

utilizando a função de distribuição acumulada condicionada da VA que

representa o atributo, independentemente do estimador;

• a krigagem por indicação pode ser usada para modelar atributos com

alta variabilidade espacial sem a necessidade de se filtrar amostras cujos

valores estão muito distantes de uma tendência (“outliers”);

58

• a krigagem por indicação permite melhorar a qualidade de estimação

com o uso de amostras indiretas, retiradas de fontes auxiliares, em

conjunto com o conjunto amostral do atributo, amostras diretas.

Além das vantagens expostas, os procedimentos de krigagem por

indicação apresentam algumas desvantagens. Este procedimento requer,

do especialista, um alto grau de interatividade para se definir a

quantidade e os valores de corte a serem utilizados. Também, exige que

seja definido um semivariograma para cada valor de corte considerado.

Além disso, a aproximação da funçaõ de distribuição apresenta alguns

problemas, conhecidos como desvios de relação de ordem, que devem ser

corrigidos automaticamente pelo procedimento.

59

Cokrigagem

A cokrigagem é similar à krigagem e permite estimar uma variável a

partir das informações que se tem sobre ela própria e também a partir

das informações disponíveis sobre outras variáveis que tenham correlação

espacial com ela.

A cokrigagem busca melhorar a estimação de uma variável pela utilização

de informações relativas também a outras variáveis com as quais ela está

correlacionada.

A cokrigagem deve ser utilizada quando a variável estudada for

subconhecida em relação às outras de cujos dados se socorre, ou seja,

quando a sua informação for insuficiente e quando a correlação espacial

entre ela e as demais for forte; e deve ser evitada quando o número de

observações em que tivermos dados da variável estudada e das outras a

ela correlacionados for pequeno.

60

“Jack-knifing”ou Validação cruzada

Os resultados obtidos com a krigagem envolvem um erro de estimação,

que representa a diferença entre o valor medido Z(xi) e o valor estimado

Z*(xi), para um mesmo local xi, que é obtido a partir do modelo

variográfico experimental utilizado.

De posse de ambos valores (medido e estimado) para um mesmo local

pode-se calcular um conjunto de n erros de estimação, E(xi) = [Z*(xi) –

Z(xi)], ou n erros reduzidos, R(xi) = [Z*(xi) – Z(xi)]/E(xi), onde E(xi) é o

desvio padrão da estimação. Há uma preferência pelo uso dos erros

reduzidos porque são adimensionais, e portanto, independentes das

unidades das variáveis sob análise, que podem ser diferentes

61

A técnica de Jack-knifing tem, exatamente, por objetivo, calcular os erros

de estimação e avaliar a qualidade do método de estimação.

Os valores estimados Z*(xi) e a variância de estimação 2E(xi) são

calculados para cada posição xi, onde existe um valor medido Z(xi), a

partir de então os erros podem ser calculados.

A qualidade do método de estimação pode ser avaliada através de duas

condições, no caso específico dos erros reduzidos (Souza, 1992):

- a média dos erros reduzidos (mE) deve ser igual a 0 (zero); e

- a variância dos erros reduzidos (2E) deve ser igual a 1.

62

Numa avaliação quantitativa, a melhor qualidade de estimação seria

alcançada quando o valor da média dos erros se aproximasse de 0 (zero)

e a variância dos erros se aproximasse de 1.

A técnica de Jack-knifing apresenta diversas vantagens, pois pode ser

utilizada para avaliar a qualidade do método de estimação, pode também

ser utilizada para definir o melhor número de vizinhos mais próximos a

um determinado ponto para estimação de um valor e ainda pode ser

utilizada para avaliar se o modelo variográfico experimental utilizado é o

que melhor se ajusta aos dados (Souza, 1992).

63

De modo resumido, a validação cruzada processa-se da seguinte forma:

a)é extraído,do conjunto original de dados, o valor correspondente a um

determinado ponto mostrado (Zi);

b) utilizando os dados remanescentes do conjunto de dados, estima-se o

valor desse ponto cujo valor foi retirado do conjunto, obtendo-se o valor

Z*i,o*, designando que o dado é estimado;

c) obtém-se o erro cometido nessa estimação, que vale (Zi - Z*i), e compara-

se esse valor com (Zi - Z*i)/σi;

d) repetem-se os procedimentos descritos nos itens a,b e c para todas as

observações disponíveis no conjunto de dados e procura-se observar se são

verificadas duas propriedades para o conjunto final obtido: a de que o valor

médio dos valores (Zi - Z*i) seja aproximadamente zero e a de que o valor

médio de [(Zi - Z*i)/σi]2 seja aproximadamente à unidade.

64

Além da disponibilidade de uma técnica como a de Jack-knifing para

avaliar a qualidade de estimação do método de interpolação, os métodos

geoestatísticos apresentam algumas outras vantagens em relação a

outros métodos de estimação, as quais podem ser vistas em seguida

(Camargo, 1998):

Métodos geoestatísticos Métodos convencionais

Os pesos são determinados a partir de um análise de correlação espacial baseada no semivariograma.

Os pesos são determinados meramente em função da distância.

Área de influência na interpolação é indicada pelo alcance.

Raio de busca é arbitrário.

Modela anisotropia, isto é, detecta as direções de maior e menor continuidade espacial do fenômeno.

Anisotropia é ignorada.

Trata redundância (“clusters”), isto é, atribui pesos adequados para agrupamentos de amostras.

Redundância é ignorada. Neste caso, podem ocorrer superestimação ou subestimação de valores.

65

Utilização do Programa SPRING para modelagem

geoestatística de variáveis de solos

Sequência de Procedimentos Geoestatísticos

Serão apresentados os passos necessários para manipulação do módulo de geoestatística do SPRING. A figura abaixo mostra a sequência a ser executada para gerar modelos numéricos a partir da modelagem geoestatística. O Módulo de Procedimentos Geoestatísticos tem como objetivo a análise em duas dimensões, 2D, para dados espacialmente distribuídos, no que diz respeito a interpolação de superfícies geradas a partir de amostras georreferenciadas. Portanto, a entrada de dados neste módulo é através de um Plano de Informação (PI) do modelo numérico com amostras do tipo pontos cotados, sendo que este PI pode ser criado através da importação de outros formatos, editado ou mesmo convertido pela ferramenta de geração de pontos amostrais. A saída da modelagem por geoestatística produz um outro PI, também do modelo numérico, porém com a representação de uma grade retangular, com resolução definida pelo usuário. Posteriormente este PI pode ser convertido para imagens ou outro produto qualquer.

67

Análise Exploratória – Geoestatística

Este módulo tem por finalidade proceder à análise exploratória dos dados através de estatísticas univariadas e bivariadas. As estatísticas univariadas fornecem um meio de organizar e sintetizar um conjunto de valores, que se realiza principalmente através do histograma. Características importantes do histograma são organizadas em três grupos (Costa Neto, 1977): Medidas de localização: média, valor mínimo, quartil inferior, mediana, quartil superior e valor máximo; Medidas de dispersão: variância e desvio padrão; Medidas de forma: coeficiente de assimetria, coeficiente de curtose e coeficiente de variação. As estatísticas bivariadas fornecem meios de descrever o relacionamento entre duas variáveis, isto é, entre dois conjuntos de dados ou de duas distribuições. Esta relação pode ser visualizada através do diagrama de dispersão (ScatterPlot). O grau da relação linear entre as variáveis pode ser medido através do coeficiente de correlação.

68

Geração de Semivariograma - Análise Unidirecional

Na geoestatística, a análise do semivariograma é uma etapa importante, pois o modelo de semivariograma escolhido é a interpretação da estrutura de correlação espacial a ser utilizada nos procedimentos inferenciais da krigagem. A análise completa do semivariograma compreende os seguintes passos:- levantamento do semivariograma experimental; - ajuste a uma família de modelos de semivariogramas; - validação do modelo a ser utilizado nos procedimentos da krigagem.

Análise Unidirecional

A opção Unidirecional engloba dois tipos de estatísticas: Univariada e Bivariada. As estatísticas Univariadas disponíveis são: Semivariograma, Covariância, Correlograma, Semivariograma Relativo Geral, Semivariograma Relativo Emparelhado, Semivariograma de Logaritmos, Semimadograma, Semivariograma Indicador Contínuo e Semivariograma Indicador Categórico. A opção Bivariada corresponde ao Semivariograma Cruzado.

69

A janela "Geração de Semivariograma" apresenta alguns campos

preenchidos como:

- Parâmetros do Lag (No. de Lag, Incremento e Tolerância);

- Parâmetros de Direções (Diri , Toli e Bwi , onde i=1,2,3 e 4) que são

inicializados com valores default.

Porém, em muitos casos, dependendo da geometria de amostragem, faz-

se necessário rever os valores desses parâmetros de forma a melhorar o

semivariograma experimental.

71

CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE AMOSTRAS REGULARMENTE ESPAÇADAS

72

CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE AMOSTRAS IRREGULARMENTE ESPAÇADAS

74

Algumas observações importantes, de ordem prática, com relação ao

semivariograma unidirecional são:

- tolerância angular suficientemente grande;

- direção do vetor “h” não é considerada;

- serve para definir melhor os parâmetros de distância;

- se um semivariograma unidirecional não apresenta uma estrutura

definida, não se deve esperar algo melhor dos semivariogramas

direcionais.

75

Geração de Semivariograma - Análise de Superfície

Se a Amostragem é do tipo Regular, os Parâmetros da Amostragem

Regular: No. Coluna, No. Linha, Res.X e Res.Y são informativos,

ativados e preenchidos, automaticamente, com os respectivos valores

da amostragem regular dos dados. Por outro lado, se a Amostragem é

do tipo Irregular esses campos são desativados.

Seguindo, os campos referentes aos Parâmetros do Mapa de

Superfície: No. LagX, No. LagY, No. Pares, Tol.LagX e Tol.LagY, são

preenchidos com valores "Default" e influenciam diretamente sobre o

resultado final.

Os parâmetros No.LagX e No. LagY definem a dimensão da Superfície

de Semivariograma a ser gerada.

77

- A faixa de variação de valores, válidos, para os parâmetros No.LagX e No.LagY é: 0 < valor < 100. Para No. LagX=50 e No. LagY=50, significa que estaremos definindo uma Superfície de Semivariograma de tamanho 100 colunas por 100 linhas.

- É importante salientar que LagX e LagY estão associados às dimensões métricas da área de estudo. Por exemplo, para uma área de estudo de 7Km de largura (longitude) por 10Km de altura (latitude) se o No. LagX=50 e o No. LagY=50; significa que o primeiro Lag na direção X(+) ou X(-) corresponde a 70 metros (7km / (2*No.LagX)), e o primeiro Lag na direção Y(+) ou Y(-) corresponde a 100 metros (10km / (2* No.LagY)). O segundo Lag na direção X(+) ou X(-) corresponde a 140 metros, e o segundo Lag na direção Y(+) ou Y(-) corresponde a 200 metros, assim por diante, o vigésimo primeiro Lag na direção X(+) ou X(-) corresponde a 1470 metros (70*21), etc.

- parâmetro No. Pares estabelece o número mínimo de pares de amostras desejável por Lag. Em outras palavras, isto significa que uma célula qualquer só será estimada se o número de pares de amostras, que satisfazem as condições de cálculo, for maior ou igual ao parâmetro No. Pares especificado.

78

- Os parâmetros Tol. LagX e Tol. LagY são as tolerâncias estabelecidas nas direções X (Leste) e Y (Norte) respectivamente. A Figura anterior ilustra um exemplo. Note que o módulo do vetor h não possui um valor único, mas sim uma faixa de valores que consequentemente são dependes das tolerâncias especificadas. Isto flexibiliza o cálculo, de cada uma das células que irão compor a superfície de semivariograma.

79

Na tela gráfica anterior, é possível detectar visualmente os eixos de anisotropia. Associado aos eixos de maior e menor continuidade é possível verificar as respectivas direções (Ângulos) e Alcances. Para isto, basta posicionar o cursor sobre a tela gráfica, pressionar o botão esquerdo do "mouse" e arrastá-lo. Os valores de Ângulo e Alcance são impressos no rodapé da interface.

80

Modelagem ou Ajuste de Semivariograma

Descreve-se o módulo de ajuste de semivariograma experimental, através de dois modos: Automático ou Visual.

- O modo automático utiliza o algoritmo de Olea et al. (1996), o qual baseia-se no método dos mínimos quadrados. Este algoritmo fornece também uma medida quantitativa, denominada informação de Akaike (Akaike, 1974), que reporta para qual modelo o ajuste é mais preciso.

- O modo visual é recomendado a especialistas que possuem afinidade e conhecimento do fenômeno em estudo. Neste modo, todos os parâmetros são definidos por inspeção.

Além dos procedimentos de ajuste, Automático ou Visual, este módulo define o modelo teórico de semivariograma a ser utilizado pelos módulos de Validação e krigagem.

O ajuste ou a modelagem do semivariograma experimental se inicia após a Geração de Semivariograma.

81

A tela de "Relatório de Dados" apresenta um conjunto de informações, tais como: o tipo de modelo teórico escolhido, os valores de Efeito Pepita, Contribuição e Alcance que são parâmetros que compõem o modelo.

É expresso também o valor de Akaike, que é um indicador do ajuste realizado; pois quanto menor seu valor melhor o ajuste. Então, os parâmetros Efeito Pepita, Contribuição e Alcance são sempre tomados com relação ao menor valor de Akaike.

82

Validação do Modelo

Como visto anteriormente, a análise do semivariograma compreende o levantamento do semivariograma experimental e posteriormente o ajuste a uma família de modelos teóricos.

Em toda esta seqüência, existe sempre um certo grau de incerteza sobre os parâmetros ajustados aos modelos. Esta incerteza é o erro da estimativa, o qual pode ser obtido através do procedimento chamado validação do modelo.

Resumidamente, o processo de validação envolve a re-estimação dos valores conhecidos através dos parâmetros ajustados ao modelo do semivariograma.

Antes de executar a krigagem, é recomendável verificar os resultados da validação. Problemas óbvios podem ser identificados com os parâmetros de entrada (por exemplo, a especificação do semivariograma) ou com os dados (por exemplo, valores aberrantes, ou "outliers").

83

O módulo de validação desenvolvido no Spring fornece as seguintes saídas:

- Diagrama espacial do erro;

- Histograma do erro;

- Estatísticas do erro;

- Diagrama dos valores Observados x Estimados;

- Resultados Numéricos.

84

Resultados

Por exemplo, pressionando-se a opção Diagrama Espacial do Erro, ocorre a abertura da janela gráfica na Figura.

- Os símbolos tipo cruz na figura acima indicam a localização geográfica das amostragem e a magnitude do erro (para os símbolos pequenos o erro é menor e vice-versa).

85

Krigagem

Esta janela descreve a etapa de krigagem, com a qual se objetiva obter uma grade regular de valores a partir dos dados (pontos) amostrados.

O módulo de Krigagem implementado no SPRING engloba krigagem simples, krigagem ordinária e krigagem com vários modelos de tendência em duas dimensões (2D) ou três dimensões (3D).

Os campos Res.X e Res.Y referem-se às resoluções em X e Y da grade de saída. Estes campos podem ser alterados desde que os novos valores não proporcionem uma grade de saída com número de coluna e ou de linha maior que 1000. Em outras palavras, o módulo de Krigagem gera grades regulares com tamanho máximo de 1000 colunas por 1000 linhas.

86

A Figura resume os parâmetros da grade de saída gerada pelo módulo de krigagem.

87

- GKrV: refere-se à grade de valores estimados obtida da interpolação de krigagem, a partir de um modelo anisotrópico que supostamente representa a verdadeira continuidade espacial do fenômeno em estudo. Da análise geoestatística realizada, supõe-se que o fenômeno apresenta maior continuidade na direção Norte (0º) e menor na direção Leste (90º).

- GKrVe: refere-se à grade da variância de krigagem, associada a GKrV.

- GKrI: refere-se a Grade de valores estimados obtida da interpolação de krigagem a partir de um modelo isotrópico. Neste caso, admite-se que a continuidade espacial do fenômeno é a mesma em qualquer direção.

- GKrIe: refere-se à grade da variância de krigagem, associada a GKrI.

- GKrA : refere-se à grade de valores estimados obtida da interpolação de krigagem, a partir de um modelo anisotrópico que utiliza direções intermediárias (10º e 100º) às direções de máxima e mínima continuidade.

- GKrAe: refere-se à grade da variância de krigagem, associada a GKrA.

Produtos gerados com a krigagem

88

RESULTADOS DA KRIGAGEM

Como ponto de partida, é interessante verificar a continuidade espacial do

fenômeno em estudo (teor de argila). Para realizar tal análise, é

necessário transformar as grades de valores estimados e as

correspondentes grades de erros em imagens.

90

Através das imagens apresentadas na parte superior pode-se constatar

algumas características comuns:

- essas imagens revelam que, nas regiões Norte e Nordeste, o teor de

argila é relativamente baixo;

- na região Central, observa-se mudanças graduais do teor de argila, indo

de valores moderados a altos, e

- nas regiões Sul e Sudoeste aproximadamente moderado.

De maneira análoga, as figuras da parte inferior mostram que o erro da

estimativa aumenta à medida em que se afasta dos pontos de

observações. É possível também identificar, nestas imagens, regiões

onde a amostragem pode ser melhorada.

91

Um outro aspecto a ser observado nas Figuras da parte superior, e talvez

o mais importante, é o efeito da anisotropia:

· Observa-se, na primeira imagem, a qual supostamente representa a

verdadeira continuidade espacial, que as mudanças graduais do teor de

argila são visivelmente diferentes das demais, principalmente na região

central.

· A segunda imagem mostra que a continuidade espacial do teor de argila

se propaga uniformemente em todas as direções. Neste caso a

anisotropia é mascarada e, portanto, o resultado não revela a verdadeira

continuidade espacial da variável em estudo.

· Por outro lado, a terceira imagem apresenta um caso intermediário à da

suposta continuidade espacial verdadeira. Este caso também não revela

a verdadeira variabilidade espacial, apenas mostra que o teor de argila

se propaga mais intensamente na direção 10º e menos intensamente na

direção ortogonal (100º).

92

O solo, em função de suas características físicas e químicas, é elemento

natural que vem sendo intensamente estudado com a técnica

geoestatística, demonstrando resultados que comprovam a sua

heterogeneidade no tocante a diversas de suas propriedades.

Assim sendo, com base nos diversos estudos que vem sendo realizados,

atesta-se a necessidade dessa técnica como forma de avaliar

estatisticamente a variabilidade espacial de diferentes propriedades em

áreas que aparentemente pareçam homogêneas. Essa homogeneidade

está muitas vezes associada às unidades de solo, delimitadas via de

regra pela posição na paisagem.

APLICAÇÕES DA GEOESTATÍSTICA NO ESTUDO DE SOLOS

93

Reichardt et al. (1986) salientam que grande parte de avaliações feitas

nos solos, são feitas considerando-os como homogêneo no plano

horizontal X, Y, mas variando apenas em propriedade, de acordo com a

ocorrência dos horizontes com suas propriedades distintas. Entretanto,

devido a necessidade do aumento das exigências de produtividade,

modelos simples tem sido insuficientes e a necessidade de considerar a

variabilidade nas três direções X, Y, e Z, têm-se mostrado cada vez mais

presente, em todas as áreas da ciência do solo: física, química, fertilidade

e conservação.

Na área de conservação do solo a estimação da erodibilidade dos solos,

obtida de forma indireta é de grande importância. Para isso, leva-se em

consideração propriedades do solo que podem ser aferidas através de

amostras de campo, e assim sendo há a possibilidade de avaliar a sua

variabilidade espacial.

94

Reichardt et al. (1986) comentam que o solo e as distribuições das

diferentes partes das plantas, dentro e fora do solo, são

fundamentalmente heterogêneos. Em função disso, medidas de

parâmetros de solo e planta, muitas vezes apresentam irregularidades

que podem ou não estar distribuídas ao acaso em relação à sua

distribuição espacial no campo. O autor comenta ainda que com as

técnicas geoestatísticas ou espaciais, informações adicionais sobre a

estatística clássica podem ser obtidas, uma vez consideradas as posições

relativas de cada medida. No caso de delineamentos experimentais em

solos, a avaliação da variabilidade espacial pode ser considerada como

positiva, sob um novo enfoque de estudo, que não se prende aos

resultados obtidos com a estatística clássica ou casual, a qual não

considera a posição dos pontos amostrados no espaço.

95

Uso da geoestatística na experimentação de campo em solos

Warnick e Nielsen (1980) avaliaram a variabilidade de solos, bem como os

aspectos relativos à amostragem, autocorrelação e análise espacial.

Gurovitch e Stern (1983) e Sisson e Wierenga (1981) avaliaram a

variabilidade espacial do processo de infiltração de água em solos.

Silva et al. (1989) estudaram a variabilidade espacial da resistência à

penetração, em um latossolo vermelho-escuro, determinada com um

penetrômetro. O trabalho objetivava detectar a profundidade e a

espessura de uma camada com resistência à penetração superior a 17,57

kg/cm2. Utilizando métodos geoestatísticos, os autores avaliaram que

havia uma grande variabilidade da área quanto aos parâmetros

estudados.

96

Vauclin (1982) e Morkoc et al. (1985) estudaram a variabilidade espacial

da temperatura da superfície do solo e a relação com outras

propriedades.

Reichardt et al. (1984) revelam como a variabilidade espacial da

umidade do solo pode ser utilizada para estudar a influência sobre outras

propriedades do solo.

Reichardt et al. (1986) estudaram a variabilidade espacial do pH em água

em um latossolo vermelho-escuro orto, comparando os dados com uma

avaliação feita pela estatística clássica. Chegaram a conclusão de que a

geoestatística pode fornecer subsídios para um melhor esquema de

amostragem.

97

Vieira et al. (1981) utilizaram 1280 medidas de campo relativas a

infiltração, para avaliar a variabilidade espacial do fenômeno, bem como

avaliar o número de amostras necessárias para reproduzir as medidas de

infiltração na área sob estudo. Os resultados obtidos indicaram que 128

amostras seriam suficientes para representar a informação obtida com as

1280 amostras iniciais.

Vieira et al. (1982) avaliaram a variabilidade espacial da retenção de

água, densidade e granulometria em três solos do estado de São Paulo.

Os resultados mostraram que a escala de variação muda bastante de solo

para solo. A análise geoestatística permitiu também estabelecer

espaçamento entre amostras para os solos estudados, para permitir

estimativas a espaços menores sem tendência e com variância mínima.

98

Vieira et al. (1983) procuraram mostrar as diferentes áreas agronômicas

nas quais podem ser utilizadas as técnicas geoestatísticas, objetivando o

estudo da variabilidade espacial.

Uma primeira área agronômica diz respeito ao levantamento de solos,

que foi estudada por Grossman. Este autor trabalhou com as variáveis

profundidade do solo para um valor estimado de 40% de areia e a

percentagem de areia, utilizando uma grade de amostragem irregular.

Para a primeira variável foi possível ajustar um modelo esférico ao

semivariograma, enquanto a segunda variável apresentou variância não

finita. O autor avalia que essas variáveis tem uma forte estrutura esférica

com ranges de aproximadamente 300 pés. O semivariograma cruzado

das duas variáveis tem uma estrutura linear com range de 600 pés e a

correlação entre ambas não foi alta.

99

Outro tipo de estudo foi realizado por Waynick, que trabalhou com

nitrificação do solo e tomou amostras de solo em duas profundidades, em

esquema radial. As variáveis consideradas foram o nitrato residual,

amostras com inexistência de nitrogênio, outras com 0,2 g de sulfato de

amônia e outras ainda com 1g de sangue submetido ao ressecamento.

Apenas as amostras coletadas em subsuperfície com nitrato residual e

sangue, apresentaram semivariogramas com modelo esférico. No geral

os semivariogramas experimentais e os semivariogramas cruzados não

foram bem definidos , talvez devido ao esquema de amostragem.

100

Em outro estudo, Waynick e Sharp analisaram com o conteúdo de

carbono e nitrogênio para duas áreas (Davis e Oakley) que apresentavam

muita semelhança pedológica e estavam desprovidas de vegetação. As

amostras foram coletadas em esquema de grade e apresentaram

semivariogramas muito diferentes, embora com estruturas bem definidas,

exceto para o carbono em Davis. Em Oakley, os semivariogramas

experimentais e os semivariogramas cruzados para carbono e nitrogênio

apresentaram estruturas muito similares. Para a área de Davis o

semivariograma cruzado para nitrogênio e carbono apresentou estrutura

bem definida, embora o semivariograma para carbono tenha apresentado

efeito pepita puro.

101

Vauclin et al. (1983) procuraram avaliar o uso da cokrigagem como

forma de conhecer a variabilidade espacial de uma variável que

apresenta dificuldade de amostragem, considerando sua correlação

espacial com outra variável melhor amostrada. Obtiveram de uma área

de 40 x 70 m, amostras em um esquema de grade com nós distantes

uns dos outros 10 m, no intervalo de profundidade de 20 a 40 cm. As

variáveis amostradas foram areia, silte, argila, conteúdo gravimétrico de

água retido a 1/3 bar (pF25) e o conteúdo avaliável de água (AWC). Os

resultados demonstraram que os semivariogramas de todas as variáveis

apresentaram efeito pepita. Para argila e areia o modelo variográfico

encontrado foi o esférico, enquanto para as demais variáveis foi o linear.

Para determinação dos valores de pF25 e AWC em pontos intermediários

da grade amostral (5 m), foi encontrada correlação com o conteúdo de

areia nos pontos da grade original, e utilizou-se a técnica da cokrigagem

com eficiência, para estimação dos valores de AWC nos pontos não

amostrados.

102

Souza (1992) avaliou a variabilidade espacial de fósforo, potássio,

matéria orgânica, argila, densidade e umidade do solo em diferentes

sistemas de manejo, profundidades e tipos de solo de duas localidades

no Rio Grande do Sul (Eldorado do Sul e Passo Fundo). Utilizou malhas de

amostragem de 1m x 1m em um dos locais e de 10m x 10 m em outro.

Os resultados obtidos demonstraram que houve, na grande maioria dos

casos, correlação espacial para as propriedades do solo nos sistemas de

manejo que foram avaliados. Com base nesses resultados, verificou-se

que não houve alteração significativa no solo em função dos efeitos

continuados da ação antrópica que pudessem suplantar a variabilidade

subjacente e espacialmente estruturada do solo ao natural, levando a

uma distribuição aleatória. Essa hipótese havia sido levantada, porém

não foi confirmada.

103

Martinez e Zinck (1994) estudaram a variabilidade espacial dos efeitos

do desmatamento de floresta úmida e do manejo de pastagens em

ambiente da amazônia colombiana sobre a deterioração das

propriedades físicas do solo e mais especificamente sobre a

compactação do solo em duas profundidades, 0-5 cm e 5-10 cm.

Utilizaram como principais variáveis a resistência a penetração e a

densidade aparente em áreas sob condições físicas semelhantes. No

que diz respeito à resistência a penetração, verificaram que em

ambiente de floresta, na camada superficial de solo o modelo

variográfico adotado foi o linear, sem que houvesse uma boa

estruturação espacial. No caso da camada inferior de solo, o modelo

ajustado foi o esférico, e houve o claro reconhecimento de um padrão

espacial. Sob pastagem os modelos ajustados para ambas as camadas

foram o esférico e o exponencial, respectivamente, com baixa

dependência espacial e elevado efeito pepita.

104

Vieira et al. (1988) procuraram quantificar propriedades físicas do solo

necessárias ao planejamento da microbacia hidrográfica do córrego São

Joaquim, em Pirassununga (SP), e caracterizar sua variabilidade espacial,

com vistas ao estabelecimento de método para uso em outras áreas.

Utilizaram as variáveis argila, silte, areia fina, areia grossa, densidade do

solo a 10 cm, densidade do solo a 20 cm e infiltração inicial e final. Os

autores chegaram a, entre outras conclusões, que a densidade de

amostragem utilizada de 150 m, poderia ser estendida para 200 m; a

geoestatística como ferramenta para caracterizar a variabilidade espacial

dos parâmetros utilizados foi útil no sentido de que foi possível perceber

as relações entre as variáveis; e que o método adotado pode servir de

guia para outros locais.

105

De Maria et al. (1992) estudando a mesma microbacia hidrográfica

mencionada anteriormente, procuraram avaliar como a fertilidade do

solo se distribui na área e que fatores estão a ela relacionados. Para

tanto utilizaram esquema de amostragem semelhante a situação

anterior dos parâmetros físicos, com pontos regularmente espaçados de

150 m. Os parâmetros utilizados foram: fósforo, matéria orgânica,

pHCaCl2, potássio, cálcio, magnésio, H+Al, soma de bases, CTC e

saturação de bases. Os autores chegaram a conclusão de que o método

utilizado permitiu conhecer a variação dos parâmetros de fertilidade do

solo para uma avaliação inicial.

106

Trabalhando com técnicas geoestatísticas em grandes áreas, Yost et al.

(1982) procuraram determinar a estrutura da dependência espacial de

propriedades químicas do solo em grandes distâncias e examinar e

interpretar semivariogramas de propriedades químicas do solo. A área

estudada foi na Ilha do Havaí, onde em 80 áreas amostrais foram feitos

transectos com intervalo amostral da ordem de 1 a 2 km e as amostras

foram coletadas na profundidade de 0-15 cm e 30-45 cm. Os resultados

obtidos demonstraram que maior há maior estruturação espacial a

grandes distâncias dos dados coletados em superfície do que no

subsolo. Isto demonstra que as propriedades químicas do subsolo tem

zonas de influência que devem ser caracterizadas pelos processos de

formação do solo e que na superfície as chuvas tem imposto um

elevado grau de uniformidade, ou seja, um fator resultante dos agentes

externos.

107

Reynolds et al. (1994) estudaram a bacia hidrográfica do rio Grande, sul

de Ontário, Canadá, com o intuito de verificar a variabilidade espacial e

temporal da capacidade dos solos quanto ao potencial de poluição dos

recursos hídricos subsuperficiais, por produtos agroquímicos

(pesticidas). As técnicas geoestatísticas foram utilizadas para extrapolar

os resultados pontuais obtidos de modelos de simulação de transporte

de solutos, para áreas relativamente grandes, em conjunto com o uso

de sistema de informações geográficas, para permitir a combinação dos

mapas de isovalores gerados pela krigagem com outros mapas de

atributos do solo, práticas agrícolas, práticas de manejo da terra, etc.

Utilizando 119 pontos amostrais em uma área maior do que a bacia

hidrográfica estudada, os autores obtiveram semivariogramas que

demonstraram estruturação espacial, com sill e efeito pepita bem

definidos. Conforme os resultados obtidos com os semivariogramas, os

autores comentam que as estimativas da krigagem tendem a ter boa

precisão. Assim sendo, pelos resultados preliminares obtidos, as

perspectivas do trabalho são muito boas.

109

Simulação condicionada

Por meio da estimação, persegue-se uma estimativa que represente o

mais fielmente possível o valor verdadeiro de uma variável em um

determinado ponto, sendo a krigagem um desses estimadores.

Prioriza-se a estimação não-enviesada e a minimização da variância de

estimação.

Procura-se obter a melhor representação dos valores reais e, por meio da

simulação, objetiva-se o conhecimento das dispersões.

Enquanto as técnicas de interpolação apresentam como resultado uma

suavização da realidade, as simulações buscam manter a variabilidade

espacial do fenômeno real.

110

Comparação entre Simulação Condicionada e Krigagem

O estimador de krigagem possibilita a construção de funções de

distribuição de probabilidade, paramétricas ou não, para um atributo em

estudo. A distribuição de probabilidade, definida em cada posição de uma

região estacionária de interesse, é usada para se inferir, em cada posição,

um valor único do atributo e uma incerteza associada ao atributo.

Dessa forma, a krigagem, usada como um estimador, cria um único

campo aleatório cujos valores compõem uma superfície suavizada. A

variabilidade do estimador no espaço é uma versão suavizada da

verdadeira variabilidade e não reflete exatamente as flutuações reais

(Huijbregts 1973). Esta superfície tem variância menor do que o conjunto

amostral, pois o valor estimado para cada variável aleatória é obtido a

partir da hipótese de mínima variância do erro de estimação.

111

Resumidamente, as diferenças atribuídas aos procedimentos de krigagem

e simulação estocástica (Deutsch e Journel 1998 e Englund 1993) são:

1)A krigagem é um interpolador que gera um único campo aleatório

segundo os critérios de mínima variância e não tendenciosidade do

estimador. Portanto, o campo interpolado tem menor grau de

variabilidade do que as amostras e reproduz apenas a média das

amostras. A simulação, por sua vez, cria vários campos aleatórios que

reproduzem características globais e estatísticas, de ordem maior que 1,

das amostras. Por exemplo, o histograma das amostras é reproduzido

pelos valores simulados.

2) A krigagem fornece um conjunto de representações locais onde a

acurácia local prevalece. A simulação fornece representações globais

alternativas, onde prevalece a representação de padrões de continuidade

espacial, que permite estimativas de acurácia global quando várias

localizações são consideradas conjuntamente.

112

3) O procedimento de krigagem é menos custoso computacionalmente do

que a simulação. Para se reproduzir, com um alto grau de acurácia,

momentos estatísticos de ordem maior que 1, são necessárias de 500 a

dezenas de milhares de campos simulados.

Apesar das diferenças, podem-se destacar pelo menos 3 semelhanças

entre os procedimentos de krigagem e de simulação estocástica:

1)São procedimentos geoestatísticos que utilizam um modelo de

variografia, definido sobre o conjunto amostral, para estabelecer o

comportamento de variabilidade do atributo numa região de interesse.

2) São procedimentos que honram o conjunto amostral original, ou seja,

os valores atribuídos às amostras não são modificados.

3) Possibilitam estimativas de estatísticas e incertezas sobre o atributo

em

estudo.

1 mini-curso geoestatÍstica aplicada ao estudo de solos prof. eduardo rodrigues viana de lima...

Documents