1 mini-curso geoestatÍstica aplicada ao estudo de solos prof. eduardo rodrigues viana de lima...
TRANSCRIPT
1
MINI-CURSO
GEOESTATÍSTICA APLICADA
AO ESTUDO DE SOLOS
Prof. Eduardo Rodrigues Viana de LimaDepartamento de Geociências
Universidade Federal da Paraíba
2
A geoestatística distingue-se da estatística clássica pelo fato de
considerar que os valores de uma variável estão de alguma forma
relacionados à sua distribuição espacial, ou seja, observações tomadas
a curtas distâncias devem ser mais semelhantes do que aquelas
tomadas a distâncias maiores, e por levar em consideração o
comportamento espacial das variáveis apresenta grande potencial de
aplicação nas geociências/ciências ambientais.
INTRODUÇÃO
3
A Geoestatística não faz todo o tratamento de dados de forma
integrada: é preciso parar no fim de cada etapa e selecionar,
interpretar; também não cria dados: apenas trata a informação
disponível.
A Geoestatística utiliza os dados duas vezes, primeiramente para
estimar a autocorrelação espacial e depois para estimar a variável em
locais não amostrados . Como todas as técnicas estatísticas, a
Geoestatística baseia-se em um conceito probabilístico. Para uma
aplicação segura da Geoestatística, é necessário um conhecimento
prévio dos conceitos de Estatística, sendo importante que se proceda a
um estudo estatístico elementar dos dados, com a finalidade de testar
se as condições exigidas para aplicar o formalismo próprio da
Geoestatística estão satisfeitas.
4
As técnicas geoestatísticas podem ser usadas para descrever e
modelizar padrões espaciais (variografia), para predizer valores em
locais não amostrados (krigagem), para obter a incerteza associada a
um valor estimado em locais não amostrados (variância de krigagem) e
para otimizar malhas de amostragem.
No caso específico de utilização da Geoestatística com a finalidade de
apoio à otimização de malhas de amostragem, é oportuno salientar que
o erro cometido ao fazer uma avaliação com malhas de amostragem
diminui com o detalhamento da malha, mas esse crescimento não é
linear, conforme mostra a figura 1.
5Figura 1 – Relação entre malha de amostragem e erro de avaliação.
6
Os métodos de estimação linear comumente utilizados fazem mais
sentido quando a distribuição dos resíduos é aproximadamente normal.
Sendo a média dos resíduos igual a zero e minimizando o desvio-padrão
dos erros (feito pelos métodos de estimação linear), as predições obtêm
um bom resultado. Assume-se que os erros de estimação sejam
normalmente distribuídos.
Quando o valor esperado para um erro de estimação é zero, diz-se que o
estimador é não-enviesado.
7
As vantagens reconhecidas da Geoestatística sobre outras técnicas
convencionais de predição são:
-o estudo da variabilidade espacial (a análise de um semivariograma é a
única técnica disponível para medir a variabilidade espacial de uma
variável regionalizada);
- a suavização (a estimação geoestatística suaviza ou faz a regressão de
valores preditos);
-o desagrupamento (ou efeito de anular as concentrações localizadas de
observações);
- a determinação da anisotropia (os comportamentos da variabilidade nas
diferentes direções são considerados);
8
- a precisão (a krigagem fornece valores precisos sobre as áreas ou
pontos a serem avaliados);
- e a incerteza (estimativas obtidas por meio da krigagem associam a
margem de erro que acompanha a estimativa).
Tratando-se de um modelo probabilístico, a geoestatística explora a
aparente aleatoriedade dos dados, para avaliar as medidas de correlação
espacial dos mesmos, considerando uma determinada vizinhança
(Huijbregts, 1975).
9
Assim, a variável que apresenta uma distribuição no espaço com certo
grau de correlação espacial pode ser considerada regionalizada.
Diversas variáveis relativas ao meio físico assumem as características de
regionalizadas. O comportamento que assume essas variáveis está
fundamentado em modelos probabilísticos e em função disso define a
chamada teoria das variáveis regionalizadas (Matheron, 1962) apud
Sturaro (1994), as quais são consideradas como a realização única de
uma determinada função aleatória (Matheron, 1962) apud Sturaro (1994).
A teoria das variáveis regionalizadas tem como objetivo básico avaliar as
características estruturais dessas variáveis e efetuar estimativas.
10
Modelos utilizados na análise geoestatística
Para conhecer as características da variável regionalizada, a mesma deve
ser expressa através de uma função aleatória, seguindo alguma lei de
distribuição de probabilidades e sendo caracterizada pelos parâmetros da
distribuição.
Uma variável regionalizada z(x) pode ser considerada como uma variável
aleatória, no sentido de que os valores das medições feitas podem variar
consideravelmente entre si, e assume um caráter estruturado dentro de
uma determinada área, segundo uma certa lei no espaço, considerando
que os valores das observações não são completamente independentes
da sua localização geográfica. Assim, a variável regionalizada pode ser
considerada como uma realização única de uma variável aleatória Z para
uma localização dentro dessa área. Se a variável regionalizada z(x) for
considerada para todos os locais da referida área, torna-se uma dentre
um conjunto infinito de variáveis aleatórias Z(x) para todos os locais da
área (Souza, 1992).
11
Considerando que a amostragem singular não permite que se conheça a
função densidade de probabilidades de uma variável regionalizada, a
geoestatística linear utiliza-se de momentos da função casual, para fazer
inferências sobre essa função de densidade de probabilidades (Journel e
Huijbregts, 1978 apud Sturaro, 1988). Os momentos são os seguintes:
Estacionaridade de 1ª ordem
E {x(i) - x (i+h)}= m(h)
Onde: m(h) representa a tendência.
x(i)e x(i+h)são dois valores de uma mesma variável regionalizada obtidos
nos pontos i e i+h, separados entre si por uma distância h.
A diferença entre esses dois valores é outra variável casual [x(i) - x(i+h)].
12
Estacionaridade de 2ª ordemE {(x(i) - x(i+h) - m(h)} = 2y(h)
onde: m(h) representa a tendência e y(h) representa a semivariância.
O grau de relação entre pontos numa certa direção pode ser expresso pela covariância, e embora a covariância exista entre todas as distâncias possíveis ao longo de h, pode ser estipulado que somente serão considerados valores entre pontos regularmente espaçados por múltiplos de h.A covariância entre valores encontrados nessas distâncias separadas por h ao longo de h é: K(h)=K(h)=1/nx(i)x(i+h).Onde: K=covariância e n=número de pares de valores comparados.
Isso significa que a covariância é igual à média dos produtos dos valores x(i) encontrados nos pontos i pelos valores x(i+h) encontrados nos pontos i+h, distantes a um intervalo h, e n representa o número de pares de valores comparados.
Se h=0, K(h) passa a representar a variância K(0)=1/n x(i)x(i+0).Desse modo, pode-se computar uma função denominada semivariância, definida como metade da variância das diferenças y(h)=[x(i+h)-x(i)]/2.
13
A função aleatória pode ser estacionária (apresenta o comportamento
espacial da variável invariante sob translação), ou seja, em qualquer
direção assume-se que seja constante o valor médio esperado (Sturaro,
1994), e para tanto assumem-se hipóteses de estacionaridade para o
processo, considerando que a variável deve ser estatisticamente
homogênea e isotrópica, permitindo que se façam inferências estatísticas
(Vieira et alii, 1983).
Uma vez que, na prática, é difícil verificar a ocorrência da hipótese básica,
trabalha-se ainda com as hipóteses de segunda-ordem e a intrínseca
conforme Vieira et alii, (1983) e Pannatier (1996).
14
O vetor h apresentando-se infinitamente pequeno faz com que a
variância e a covariância se tornem muito próximas. Como consequência,
espera-se que ambas sejam aproximadamente iguais para pequenos
valores de h. Para h maiores, a covariância diminuirá enquanto a
variância aumentará, porque ocorrerá progressivamente maior
independência entre os pontos a distâncias cada vez maiores.
A semivariância distribui-se assim de 0, quando h=0, até um valor igual à
variância das observações para um alto valor de h.
Essas relações são mostradas quando a função y(h) é colocada em
gráfico contra h para originar o semivariograma.
15
Ocorrendo estacionaridade de segunda-ordem, a covariância e o
semivariograma são recursos disponíveis também para caracterizar a
autocorrelação entre duas variáveis z(x) e z(x+h), separadas por um
vetor h. Diante da existência de covariância, trabalha-se com uma
variância finita, expressa como . Var z x c( ) ( ) 0
Entretanto, diversos fenômenos naturais apresentam capacidade infinita
de dispersão, não possuindo covariância e portanto com inexistência de
variância finita. Nesses casos, assume-se uma forma mais fraca de
estacionaridade chamada hipótese intrínseca, na qual apenas o
semivariograma serve como instrumento de análise da estacionaridade.
16
Assim sendo, a função aleatória z(x) é tida como sendo intrínseca se:
- a esperança matemática existe e não depende da posição x: E z x( )
E z x m( )
- para todo vetor de separaço h o incremento tem variância finita
que não depende de x:
z x h z x( ) ( )
1
2
1
22
Var z x h z x E z x h z x h( ) ( ) ( ) ( ) ( )
Embora haja possibilidade de avaliar o grau de dependência espacial de
uma variável por meio do coeficiente de correlação e da covariância, o
momento de inércia denominado de semivariograma é amplamente
utilizado, pelo fato do mesmo ter condições de modelar fenômenos
naturais de elevada dispersão espacial.
17
A função semivariograma pode ser considerada como o momento de
inércia em torno da diagonal do diagrama de dispersão espacial,
conforme mostra a figura 2 (Pannatier, 1996):
Figura 2 - Diagrama de dispersão de uma variável V(x).Fonte: Pannatier, 1996.
18
Enquanto o momento de inércia constitui a metade da média das
diferenças quadráticas entre as coordenadas de cada par de pontos, o
semivariograma por sua vez, é calculado para uma mesma variável a
diferentes intervalos de distância e em diferentes direções, com o
intuito de verificar a continuidade espacial da variável.
19
Matematicamente a função semivariograma é expressa da seguinte forma:
( ) ( ) ( )hn
V Vx x hi
n
12
2
1
onde:
( ) ( ) ( )hn
V Vx x hi
n
12
2
1
n é o número de pares da variável considerados em uma determinadadireção;
é a mesma variável em dois pontos diferentes, separados por uma distância pré-estabelecida e constante a uma certa direção;
½ corresponde à metade da média das diferenças quadráticas e que representa a distância perpendicular dos pontos em relação à linha de 45 graus do diagrama de dispersão espacial (Fig. 2);
h é o intervalo de distância pré-estabelecida.
é o semivariograma;
V eVx x h( ) ( )
20
Graficamente a função semivariograma é expressa conforme mostra a
figura 3, e cujas características são apresentadas em seguida:
Figura 3 - Esquema básico de uma função semivariograma.
21
- Amplitude variográfica (a) ou alcance: Distância na qual a máxima
variabilidade é atingida e que corresponde ao aumento da distância entre
as amostras;
- Patamar (c) ou sill: Representa o nível de variabilidade onde o
semivariograma se estabiliza. Corresponde a diferença entre o ponto de
maior correlação ou a origem do semivariograma e o ponto que
teoricamente representa a variância populacional e a variabilidade se
estabiliza;
- Efeito pepita (co): Descontinuidade na origem do semivariograma,
correspondendo à diferença entre as amostras de maior proximidade e
gerada por microrregionalizações, erros de amostragens ou erros de
medidas.
22
Amostras separadas por distâncias menores do que a amplitude
variográfica são espacialmente correlacionadas, por outro lado aquelas
separadas por distâncias maiores não são, considerando que o valor do
semivariograma sendo igual à variância dos dados, a variação é aleatória.
Garcia (1988) considera que uma relação entre os parâmetros “co” e “c”
expressa o grau de aleatoriedade do fenômeno regionalizado, e pode ser
avaliada por “E”, que representa o efeito de pepita relativo. Esta
componente aleatória pode ser classificada da seguinte forma:
E < 0,15 componente aleatória pequena
0,15 < E < 0,30 componente aleatória significativa
E > 0,30 componente aleatória muito significativa
23
Segundo Matheron (1963) apud Sturaro (1988), em geral, o
semivariograma é uma função de incremento com a distância “h”, visto
que, quanto mais afastadas forem as amostras, mais seus valores em
média deverão ser diferentes. Esta característica reflete bem a noção de
zona de influência de uma amostra.
Nesse aspecto é que o semivariograma experimental deve ser
considerado, no máximo, para a metade da distância total de
amostragem no campo, isto quando o número de pares de dados seja
maior do que 30 (Journel & Huijbrgts, 1991).
24
A noção de zona de influência de uma amostra está relacionada com a
existência de regionalizações. Os semivariogramas exercem sua função
no modelamento espacial de diversos fenômenos, quando da detecção
da continuidade espacial ou regionalização de uma variável, e
consequentemente de possíveis ocorrências de anisotropias.
Para avaliar o comportamento da variabilidade espacial de uma variável,
os semivariogramas são elaborados experimentalmente e submetidos à
análise de suas características estruturais. A figura 4 ilustra as
propriedades estruturais do semivariograma (Huijbregts, 1975): suporte,
zona de influência, estruturas superpostas, anisotropia, continuidade
espacial ou comportamento da variável próxima a origem,
corregionalização.
25Figura 4 - Propriedades estruturais do semivariograma. (Huijbregts, 1975)
26
Suporte: As variações de uma variável regionalizada ocorrem em um
certo domínio do espaço ou domínio geométrico. A variável regionalizada
é definida em um determinado suporte geométrico, cujas amostras no
espaço tenham volume, forma e orientação. Se o suporte é alterado, uma
nova variável regionalizada é definida, relacionada ao suporte inicial,
mas com características diferentes e um semivariograma diferente.
Zona de influência: O semivariograma é uma função de incremento da
distância orientada “h”. Quanto mais essa distância entre as amostras
aumenta, menos correlacionadas essas amostras ficam, ou seja, há um
aumento da variância, até que ocorre uma total independência entre as
mesmas. A zona de influência de uma variável regionalizada corresponde
à distância chamada de range (a), a partir da qual a variância torna-se
constante, e cuja medida é a amplitude variográfica.
27
Estruturas superpostas: Fenômenos de transição são caracterizados
nos semivariogramas pelo range e pelo “sill”. Essas características
podem refletir a existência de superposição de regionalização em
diferentes escalas.
Anisotropia: Considerando que a distância expressa no semivariograma
é um vetor, este deve ser calculado para diferentes direções. Assim,
quando o semivariograma apresenta configurações similares para todas a
direções medidas, diz-se que o fenômeno é isotrópico. Quando isso não
ocorre, pode ser que haja anisotropia de duas formas distintas. Num dos
casos, o semivariograma apresenta a mesma forma, mas com amplitudes
diferentes, o que representa anisotropia geométrica. No outro caso o
semivariograma apresenta-se bem diferente para direções diferentes,
representando uma anisotropia zonal.
28
Continuidade espacial ou comportamento da variável próxima a
origem:
O comportamento da curva do semivariograma em pequenas distâncias,
ou seja, próxima a origem, reflete a continuidade da regionalização.
Teoricamente, o semivariograma deveria ser nulo na origem, entretanto,
isto geralmente não ocorre e o que passa a existir é uma descontinuidade
denominada de efeito de pepita devido a problemas referentes a
existência de microrregionalizações ou erro de amostragem.
Independentemente da ocorrência ou não do efeito de pepita, o
comportamento parabólico da curva a partir do seu ponto inicial, reflete
uma boa continuidade espacial, enquanto que a forma linear reflete uma
continuidade moderada.
29
Corregionalização:
Esta característica é obtida no caso de duas variáveis regionalizadas
serem analisadas em um mesmo suporte geométrico e também no
mesmo semivariograma. O semivariograma cruzado exibe a existência de
corregionalização ou correlação regionalizada entre as duas variáveis.
30
Segundo Landim (1993), para a utilidade do semivariograma as seguintes
suposições básicas são requeridas:
a) As diferenças entre pares de valores de amostras são determinadas
apenas pela orientação espacial relativa dessas amostras;
b) O interesse é enfocado apenas na média e na variância das diferenças,
significando que esses dois parâmetros dependem unicamente da
orientação (hipótese intrínseca);
c) Por conveniência assume-se que os valores da área de interesse não
apresentam tendência que possa afetar os resultados e assim a
preocupação será apenas com a variância das diferenças entre valores
das amostras.
31
Cálculo do semivariograma a partir de amostras regularmente
espaçadas
No cálculo de amostras regularmente espaçadas, o procedimento e
efetuado geralmente para as direções de 0º, 45º, 90º, 135º, 180º, 225º,
270º, 315º e 360º, considerando todos os intervalos de distância
possíveis numa determinada direção.
Ou seja, tomando-se como ponto de partida a distância entre amostras
de 10 m, qualquer par de amostras, naquela direção selecionada, que
tenha essa distância, será considerada. O mesmo procedimento é
efetuado para outras distâncias, tais como 20 m, 30 m, 40 m e assim por
diante, até que algum ponto de parada seja alcançado, conforme
exemplifica a figura 5 (Camargo, 1998).
32
Figura 5 – Amostras regularmente espaçadas usadas para cálculo do Semivariograma (Camargo, 1998).
33
Cálculo do semivariograma a partir de amostras irregularmente espaçadas
Considerando o arranjo das amostras, conforme mostra a figura 6, para determinação do semivariograma, é necessário introduzir limites de tolerância para direção e distância (Camargo, 1998).
Figura 6 - Parâmetros para o cálculo do semivariograma a partir de amostras irregularmente espaçadas (Fonte: Deutsch e Journel, 1992 apud Camargo, 1998).
34
Define-se o Lag e uma certa tolerância, que representam o campo de
abrangência das medidas. O Lag e sua tolerância correspondem a um
intervalo de distância no qual serão medidas todos os pares de amostras
existentes.
Define-se também a direção de medida com uma certa tolerância, na qual
será efetuado o conjunto de medidas. À título de exemplo, se o Lag
definido for de 300 m, e a direção de 900 com tolerância de 300, qualquer
par de amostras cuja distância esteja compreendida entre 250 m e 350 m
e 600 e 1200, será considerado no cálculo do semivariograma para aquele
Lag utilizado. O cálculo se repete para diferentes valores de Lag e de
direção.
35
Modelos variográficos
De posse da função que exprime o comportamento da variabilidade
espacial do fenômeno, pode-se conduzir análise que expresse aquele
comportamento através de modelos de duas dimensões, ou seja, através
de mapas.
Para tanto, é necessário que sejam ajustados modelos matemáticos, ou
funções teóricas, à função semivariograma, no intuito de que sejam
determinados os valores nos locais não amostrados e a partir de então
definidas curvas de isovalores ou blocos com valores médios.
Segundo Sturaro (1988), embora possa existir uma grande quantidade de
funções que se ajustem aos semivariogramas experimentais gerados, na
prática, apenas alguns modelos, fundamentados nas teorias das variáveis
regionalizadas, tem se ajustado em casos práticos aplicados.
36
Essas funções teóricas devem atender, segundo Sturaro (1994), à
condição de serem “positiva definida”, ou seja, o sistema estruturado a
partir dessas funções, para efetuar estimativas, deve possuir uma solução
única e estável para o sistema de equações.
Os modelos considerados básicos, simples e isotrópicos (Isaaks e
Srivastava, 1989), podem ser classificados em dois grupos, segundo uma
característica que os diferencia marcantemente: um grupo de
semivariogramas com a presença de patamar e outro que não possui
patamar.
37
Modelos com patamar ou modelos de transição
Neste grupo de modelos a característica marcante diz respeito a um
limite alcançado pelo aumento da função semivariograma, que ocorre à
medida que aumenta a distância entre os pontos amostrais. Alcançado
um determinado patamar (“sill”), que corresponde teoricamente à
variância da população, a função se estabiliza.
As variações dos modelos com patamar estão relacionadas basicamente
com o comportamento espacial das amostras em relação à distância, até
que a função atinja o patamar. Este intervalo de distância é conhecido
como amplitude variográfica ou “range” e define o raio de influência da
variável. Segundo Vieira et alii (1983), a amplitude variográfica é um
importante parâmetro, considerando que as amostras separadas por
distâncias menores que o “range” são correlacionadas com as demais,
enquanto as amostras separadas por distâncias maiores que o range não
são correlacionadas.
38
Figura 6 - Modelos variográficos com patamar.
39
Modelo esférico
O mais facilmente encontrado nas aplicações da geoestatística, apresenta como característica o fato de que a tangente na origem da curva, atinge o patamar a uma distância correspondente a 2/3 da amplitude (a).
40
Modelo exponencial
Outro modelo de transição comumente encontrado, tem como característica o fato de que o “range” é atingido quando o valor do semivariograma alcança apenas assintoticamente, 95% do valor do patamar. De outra forma, a tangente na origem atinge o patamar a uma distância correspondente a 1/5 do “range”.
41
Modelo gaussiano
Este modelo tem bastante semelhança com o exponencial, principalmente no que se refere a forma como atinge o patamar e larga amplitude variográfica. Difere daquele quanto a seu comportamento parabólico na origem.
42
Modelo aleatório
Este modelo, também denominado de efeito pepita puro, é característico de fenômenos de elevada aleatoriedade, considerando que há uma acentuada descontinuidade na origem do semivariograma. (Isaaks e Srivastava, 1989). Ocorre uma diferença significativa de valor entre pontos próximos, representando que pode haver uma provável regionalização inferior à escala de trabalho da malha de amostragem e/ou variações espúrias associadas com a coleta e medição das amostras (Sturaro, 1988). Segundo Landim (1993) este modelo representa o extremo de uma situação de aleatoriedade, onde não ocorre covariância entre os valores e, portanto, a análise variográfica não se aplica.
43
Modelos sem patamar
Constituem os modelos que apresentam um aumento constante da
variabilidade à medida em que a distância é incrementada (Sturaro,
1994), ou seja, apresentam uma variância infinita e não ocorre uma
função de covariância (Landim, 1993). Satisfazem apenas a hipótese
intrínseca e não são considerados modelos de transição.
44
Modelos lineares generalizados
45
Modelo logarítmico
46
Métodos geoestatísticos de estimação
Após a análise variográfica, e verificada a possibilidade de estimação por
técnicas geoestatísticas, pode-se proceder a uma estimação de valores
em locais não amostrados. Constitui-se essa, numa tarefa
importantíssima dos estudos ambientais, principalmente no que diz
respeito a espacialização e representação cartográfica de diversos
fenômenos de interesse.
A krigagem constitui-se em um método de estimação por médias móveis
e tem como característica particular, que o diferencia e o torna superior
aos demais métodos de estimação, o fato de permitir o cálculo do erro
associado às estimativas, chamado de variância de estimação.
47
O método de estimação da krigagem foi inicialmente concebido sob a
hipótese de que a variável regionalizada resultava de um processo
estocástico estacionário de 2ª ordem, denominada de krigagem simples e
krigagem ordinária. Considerando a exigência da estacionaridade, esses
tipos de krigagem não resolviam todos os problemas.
A krigagem ordinária é considerada segundo Sturaro (1988) como o
melhor estimador linear sem viés, em função das seguintes
características:
Linear - As estimativas são feitas através de uma combinação linear dos
dados;
Sem viés - O método objetiva que o erro residual médio seja igual a zero;
Melhor estimador - O método objetiva minimizar a variância dos erros.
48
Considerando a dificuldade em conhecer os valores reais dos pontos
estimados que possibilite avaliar o erro e a variância verdadeiros, a
krigagem ordinária baseia-se em um modelo probabilístico, no qual o erro
residual médio, assim como a variância dos erros podem ser estimados.
No sentido de contornar a limitação da exigência de estacionaridade,
surge um novo tipo de krigagem, denominado de universal. Nessa
situação as variáveis regionalizadas são consideradas, segundo
Yamamoto (1988), não estacionárias, ou seja, representadas pela soma de
uma componente de deriva e outra devido às flutuações locais.
A componente aleatória, igual a diferença entre a variável regionalizada e
a componente de deriva, apresenta-se estacionária e, portanto, factível
para determinação das covariâncias ou semi-variâncias.
49
Segundo Landim (1994) a krigagem pode ser usada para:
a) Previsão do valor pontual de uma variável regionalizada em um
determinado local dentro do campo geométrico; é um procedimento de
interpolação exato que leva em consideração todos os valores
observados, o qual pode ser a base para cartografia automática por
computador quando se dispõe de valores de uma variável regionalizada
dispostos por uma determinada área.
b) Cálculo médio de uma variável regionalizada para um volume maior
que o suporte geométrico, como por exemplo, no cálculo do teor médio de
uma jazida a partir de informações obtidas de testemunhos de sondagens.
c) Estimação do drift, de modo similar à análise de superfícies de
tendência.
50
Krigagem ordinária
A krigagem ordinária é um procedimento de estimação linear para uma
variável regionalizada que satisfaz a hipótese intrínseca e procura
minimizar, sem viés, o erro de estimação, ou seja, objetiva que o erro
residual médio seja igual a zero. Na realidade, a minimização do erro de
estimação constitui um dos principais objetivos no processo de
estimação, uma vez que, possibilita auferir a sua qualidade.
Além disso, a krigagem ordinária ainda tem como característica ser o
melhor estimador, pelo fato de minimizar a variância dos erros.
Considerando que é difícil quantificar o erro e a variância para os pontos
estimados, haja vista o desconhecimento dos valores reais, a krigagem
ordinária faz uso do modelo de função aleatória, de base probabilística,
que permite atribuir pesos às amostras usadas nas estimativas.
51
Krigagem universal
Nem sempre o comportamento espacial de uma variável tem a
característica estacionária, ou seja, que a média seja constante. Isto não
ocorrendo, a variável apresenta uma deriva regional (tendência ou drift),
que consiste no valor médio ou esperado dentro de uma certa vizinhança
e que varia sistematicamente.
A krigagem universal é utilizada se ocorrer um trend nos dados, com a
média não sendo mais constante e o semivariograma ou a covariância dos
dados originais não sendo mais apropriados para modelizar a estrutura de
correlação espacial. O que se necessita é de um semivariograma dos
resíduos e um modelo para descrever a forma do trend.
A krigagem, nesse caso, é executada sobre os resíduos. Em outras
palavras, se a VR for não-estacionária, trabalha-se sobre a estacionaridade
residual.
52
Krigagem por indicação
Este tipo de modelagem computacional se caracteriza por utilizar os
procedimentos não lineares da geoestatística, a krigagem por indicação e
a simulação estocástica por indicação, para modelar a variabilidade dos
atributos espaciais. Estes procedimentos possibilitam a inferência de uma
aproximação discretizada do modelo de distribuição de probabilidade do
atributo que é, então, utilizada para modelagem da incerteza sobre seus
valores. Assim, tem-se uma modelagem espacial não paramétrica que
pode, portanto, ser usada sem restrições ao tipo de distribuição do
atributo.
Os modelos de incerteza são obtidos diretamente da distribuição,
independem de um estimador escolhido e estão relacionados ao
comportamento de variabilidade do atributo.
53
Outra vantagem importante destes procedimentos é a possibilidade de se
modelar dados temáticos, além dos dados de natureza numérica. Assim,
pode-se trabalhar com propagação de incertezas para modelos
computacionais que envolvam atributos numéricos e temáticos.
Os estimadores de krigagem são considerados estimadores lineares por
estimarem um valor, em uma posição espacial não observada, segundo
uma combinação linear dos valores de um subconjunto amostral local.
Além dos problemas com a estimativa de incerteza, estes estimadores
são usados apenas para inferir valores de variáveis de natureza
numérica. A krigagem linear não pode ser usada para inferir valores entre
classes ainda que exista ordenação entre elas.
54
Um estimador de krigagem não linear é um estimador de krigagem
linear
aplicado sobre um conjunto amostral cujos valores do atributo foram
modificados segundo uma transformação não linear, por exemplo, uma
transformação gaussiana, uma transformação lognormal ou outra
(Deutsch e Journel 1998).
O procedimento de krigagem por indicação requer uma transformação
não linear, chamada de codificação por indicação, que transforma cada
valor do conjunto amostral Z(uα) em valores por indicação.
55
O estimador de krigagem por indicação possibilita inferências para dados
numéricos e para dados temáticos e, também, estimativas de incertezas
associadas a estes atributos. Esta técnica tem como principal vantagem
ser não paramétrica, ou seja, nenhum tipo de distribuição para a VA é
considerado a priori. Ela possibilita a estimativa da função de distribuição
da VA que, por sua vez, permite a determinação de incertezas e a
inferência de valores do atributo, em localizações espaciais não
amostradas. Além disso, diferentemente da krigagem linear, este
procedimento consegue modelar atributos com alta variabilidade
espacial, sem a necessidade de se ignorar os dados amostrados cujos
valores estão muito distantes de uma tendência (Journel 1983).
56
Vantagens e desvantagens da krigagem por indicação
Pode-se ressaltar as seguintes vantagens, específicas do procedimento de
krigagem por indicação:
• a krigagem por indicação é não paramétrica. Não considera nenhum
tipo de distribuição de probabilidade a priori para a variável aleatória. Ao
invés disso, ela possibilita a construção de uma aproximação discretizada
da função de disribuição de Z(u). Os valores de probabilidades
discretizados podem ser usados diretamente para se estimar valores
característicos da distribuição, tais como: quantis, valor esperado e
variância. Portanto não se restringe a modelagem de atributos com
distribuições simétricas como, por exemplo, a gaussiana;
57
• a krigagem por indicação fornece uma metodologia única para
espacialização, com estimativa de incertezas, para atributos espaciais de
natureza temática e numérica;
• diferentemente da krigagem linear, que estima a variância do erro de
estimação em função do estimador e da distribuição geométrica das
amostras, a krigagem por indicação possibilita a estimativa de incertezas,
utilizando a função de distribuição acumulada condicionada da VA que
representa o atributo, independentemente do estimador;
• a krigagem por indicação pode ser usada para modelar atributos com
alta variabilidade espacial sem a necessidade de se filtrar amostras cujos
valores estão muito distantes de uma tendência (“outliers”);
58
• a krigagem por indicação permite melhorar a qualidade de estimação
com o uso de amostras indiretas, retiradas de fontes auxiliares, em
conjunto com o conjunto amostral do atributo, amostras diretas.
Além das vantagens expostas, os procedimentos de krigagem por
indicação apresentam algumas desvantagens. Este procedimento requer,
do especialista, um alto grau de interatividade para se definir a
quantidade e os valores de corte a serem utilizados. Também, exige que
seja definido um semivariograma para cada valor de corte considerado.
Além disso, a aproximação da funçaõ de distribuição apresenta alguns
problemas, conhecidos como desvios de relação de ordem, que devem ser
corrigidos automaticamente pelo procedimento.
59
Cokrigagem
A cokrigagem é similar à krigagem e permite estimar uma variável a
partir das informações que se tem sobre ela própria e também a partir
das informações disponíveis sobre outras variáveis que tenham correlação
espacial com ela.
A cokrigagem busca melhorar a estimação de uma variável pela utilização
de informações relativas também a outras variáveis com as quais ela está
correlacionada.
A cokrigagem deve ser utilizada quando a variável estudada for
subconhecida em relação às outras de cujos dados se socorre, ou seja,
quando a sua informação for insuficiente e quando a correlação espacial
entre ela e as demais for forte; e deve ser evitada quando o número de
observações em que tivermos dados da variável estudada e das outras a
ela correlacionados for pequeno.
60
“Jack-knifing”ou Validação cruzada
Os resultados obtidos com a krigagem envolvem um erro de estimação,
que representa a diferença entre o valor medido Z(xi) e o valor estimado
Z*(xi), para um mesmo local xi, que é obtido a partir do modelo
variográfico experimental utilizado.
De posse de ambos valores (medido e estimado) para um mesmo local
pode-se calcular um conjunto de n erros de estimação, E(xi) = [Z*(xi) –
Z(xi)], ou n erros reduzidos, R(xi) = [Z*(xi) – Z(xi)]/E(xi), onde E(xi) é o
desvio padrão da estimação. Há uma preferência pelo uso dos erros
reduzidos porque são adimensionais, e portanto, independentes das
unidades das variáveis sob análise, que podem ser diferentes
61
A técnica de Jack-knifing tem, exatamente, por objetivo, calcular os erros
de estimação e avaliar a qualidade do método de estimação.
Os valores estimados Z*(xi) e a variância de estimação 2E(xi) são
calculados para cada posição xi, onde existe um valor medido Z(xi), a
partir de então os erros podem ser calculados.
A qualidade do método de estimação pode ser avaliada através de duas
condições, no caso específico dos erros reduzidos (Souza, 1992):
- a média dos erros reduzidos (mE) deve ser igual a 0 (zero); e
- a variância dos erros reduzidos (2E) deve ser igual a 1.
62
Numa avaliação quantitativa, a melhor qualidade de estimação seria
alcançada quando o valor da média dos erros se aproximasse de 0 (zero)
e a variância dos erros se aproximasse de 1.
A técnica de Jack-knifing apresenta diversas vantagens, pois pode ser
utilizada para avaliar a qualidade do método de estimação, pode também
ser utilizada para definir o melhor número de vizinhos mais próximos a
um determinado ponto para estimação de um valor e ainda pode ser
utilizada para avaliar se o modelo variográfico experimental utilizado é o
que melhor se ajusta aos dados (Souza, 1992).
63
De modo resumido, a validação cruzada processa-se da seguinte forma:
a)é extraído,do conjunto original de dados, o valor correspondente a um
determinado ponto mostrado (Zi);
b) utilizando os dados remanescentes do conjunto de dados, estima-se o
valor desse ponto cujo valor foi retirado do conjunto, obtendo-se o valor
Z*i,o*, designando que o dado é estimado;
c) obtém-se o erro cometido nessa estimação, que vale (Zi - Z*i), e compara-
se esse valor com (Zi - Z*i)/σi;
d) repetem-se os procedimentos descritos nos itens a,b e c para todas as
observações disponíveis no conjunto de dados e procura-se observar se são
verificadas duas propriedades para o conjunto final obtido: a de que o valor
médio dos valores (Zi - Z*i) seja aproximadamente zero e a de que o valor
médio de [(Zi - Z*i)/σi]2 seja aproximadamente à unidade.
64
Além da disponibilidade de uma técnica como a de Jack-knifing para
avaliar a qualidade de estimação do método de interpolação, os métodos
geoestatísticos apresentam algumas outras vantagens em relação a
outros métodos de estimação, as quais podem ser vistas em seguida
(Camargo, 1998):
Métodos geoestatísticos Métodos convencionais
Os pesos são determinados a partir de um análise de correlação espacial baseada no semivariograma.
Os pesos são determinados meramente em função da distância.
Área de influência na interpolação é indicada pelo alcance.
Raio de busca é arbitrário.
Modela anisotropia, isto é, detecta as direções de maior e menor continuidade espacial do fenômeno.
Anisotropia é ignorada.
Trata redundância (“clusters”), isto é, atribui pesos adequados para agrupamentos de amostras.
Redundância é ignorada. Neste caso, podem ocorrer superestimação ou subestimação de valores.
65
Utilização do Programa SPRING para modelagem
geoestatística de variáveis de solos
Sequência de Procedimentos Geoestatísticos
Serão apresentados os passos necessários para manipulação do módulo de geoestatística do SPRING. A figura abaixo mostra a sequência a ser executada para gerar modelos numéricos a partir da modelagem geoestatística. O Módulo de Procedimentos Geoestatísticos tem como objetivo a análise em duas dimensões, 2D, para dados espacialmente distribuídos, no que diz respeito a interpolação de superfícies geradas a partir de amostras georreferenciadas. Portanto, a entrada de dados neste módulo é através de um Plano de Informação (PI) do modelo numérico com amostras do tipo pontos cotados, sendo que este PI pode ser criado através da importação de outros formatos, editado ou mesmo convertido pela ferramenta de geração de pontos amostrais. A saída da modelagem por geoestatística produz um outro PI, também do modelo numérico, porém com a representação de uma grade retangular, com resolução definida pelo usuário. Posteriormente este PI pode ser convertido para imagens ou outro produto qualquer.
66
67
Análise Exploratória – Geoestatística
Este módulo tem por finalidade proceder à análise exploratória dos dados através de estatísticas univariadas e bivariadas. As estatísticas univariadas fornecem um meio de organizar e sintetizar um conjunto de valores, que se realiza principalmente através do histograma. Características importantes do histograma são organizadas em três grupos (Costa Neto, 1977): Medidas de localização: média, valor mínimo, quartil inferior, mediana, quartil superior e valor máximo; Medidas de dispersão: variância e desvio padrão; Medidas de forma: coeficiente de assimetria, coeficiente de curtose e coeficiente de variação. As estatísticas bivariadas fornecem meios de descrever o relacionamento entre duas variáveis, isto é, entre dois conjuntos de dados ou de duas distribuições. Esta relação pode ser visualizada através do diagrama de dispersão (ScatterPlot). O grau da relação linear entre as variáveis pode ser medido através do coeficiente de correlação.
68
Geração de Semivariograma - Análise Unidirecional
Na geoestatística, a análise do semivariograma é uma etapa importante, pois o modelo de semivariograma escolhido é a interpretação da estrutura de correlação espacial a ser utilizada nos procedimentos inferenciais da krigagem. A análise completa do semivariograma compreende os seguintes passos:- levantamento do semivariograma experimental; - ajuste a uma família de modelos de semivariogramas; - validação do modelo a ser utilizado nos procedimentos da krigagem.
Análise Unidirecional
A opção Unidirecional engloba dois tipos de estatísticas: Univariada e Bivariada. As estatísticas Univariadas disponíveis são: Semivariograma, Covariância, Correlograma, Semivariograma Relativo Geral, Semivariograma Relativo Emparelhado, Semivariograma de Logaritmos, Semimadograma, Semivariograma Indicador Contínuo e Semivariograma Indicador Categórico. A opção Bivariada corresponde ao Semivariograma Cruzado.
69
A janela "Geração de Semivariograma" apresenta alguns campos
preenchidos como:
- Parâmetros do Lag (No. de Lag, Incremento e Tolerância);
- Parâmetros de Direções (Diri , Toli e Bwi , onde i=1,2,3 e 4) que são
inicializados com valores default.
Porém, em muitos casos, dependendo da geometria de amostragem, faz-
se necessário rever os valores desses parâmetros de forma a melhorar o
semivariograma experimental.
70
71
CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE AMOSTRAS REGULARMENTE ESPAÇADAS
72
CÁLCULO DO SEMIVARIOGRAMA A PARTIR DE AMOSTRAS IRREGULARMENTE ESPAÇADAS
73
74
Algumas observações importantes, de ordem prática, com relação ao
semivariograma unidirecional são:
- tolerância angular suficientemente grande;
- direção do vetor “h” não é considerada;
- serve para definir melhor os parâmetros de distância;
- se um semivariograma unidirecional não apresenta uma estrutura
definida, não se deve esperar algo melhor dos semivariogramas
direcionais.
75
Geração de Semivariograma - Análise de Superfície
Se a Amostragem é do tipo Regular, os Parâmetros da Amostragem
Regular: No. Coluna, No. Linha, Res.X e Res.Y são informativos,
ativados e preenchidos, automaticamente, com os respectivos valores
da amostragem regular dos dados. Por outro lado, se a Amostragem é
do tipo Irregular esses campos são desativados.
Seguindo, os campos referentes aos Parâmetros do Mapa de
Superfície: No. LagX, No. LagY, No. Pares, Tol.LagX e Tol.LagY, são
preenchidos com valores "Default" e influenciam diretamente sobre o
resultado final.
Os parâmetros No.LagX e No. LagY definem a dimensão da Superfície
de Semivariograma a ser gerada.
76
77
- A faixa de variação de valores, válidos, para os parâmetros No.LagX e No.LagY é: 0 < valor < 100. Para No. LagX=50 e No. LagY=50, significa que estaremos definindo uma Superfície de Semivariograma de tamanho 100 colunas por 100 linhas.
- É importante salientar que LagX e LagY estão associados às dimensões métricas da área de estudo. Por exemplo, para uma área de estudo de 7Km de largura (longitude) por 10Km de altura (latitude) se o No. LagX=50 e o No. LagY=50; significa que o primeiro Lag na direção X(+) ou X(-) corresponde a 70 metros (7km / (2*No.LagX)), e o primeiro Lag na direção Y(+) ou Y(-) corresponde a 100 metros (10km / (2* No.LagY)). O segundo Lag na direção X(+) ou X(-) corresponde a 140 metros, e o segundo Lag na direção Y(+) ou Y(-) corresponde a 200 metros, assim por diante, o vigésimo primeiro Lag na direção X(+) ou X(-) corresponde a 1470 metros (70*21), etc.
- parâmetro No. Pares estabelece o número mínimo de pares de amostras desejável por Lag. Em outras palavras, isto significa que uma célula qualquer só será estimada se o número de pares de amostras, que satisfazem as condições de cálculo, for maior ou igual ao parâmetro No. Pares especificado.
78
- Os parâmetros Tol. LagX e Tol. LagY são as tolerâncias estabelecidas nas direções X (Leste) e Y (Norte) respectivamente. A Figura anterior ilustra um exemplo. Note que o módulo do vetor h não possui um valor único, mas sim uma faixa de valores que consequentemente são dependes das tolerâncias especificadas. Isto flexibiliza o cálculo, de cada uma das células que irão compor a superfície de semivariograma.
79
Na tela gráfica anterior, é possível detectar visualmente os eixos de anisotropia. Associado aos eixos de maior e menor continuidade é possível verificar as respectivas direções (Ângulos) e Alcances. Para isto, basta posicionar o cursor sobre a tela gráfica, pressionar o botão esquerdo do "mouse" e arrastá-lo. Os valores de Ângulo e Alcance são impressos no rodapé da interface.
80
Modelagem ou Ajuste de Semivariograma
Descreve-se o módulo de ajuste de semivariograma experimental, através de dois modos: Automático ou Visual.
- O modo automático utiliza o algoritmo de Olea et al. (1996), o qual baseia-se no método dos mínimos quadrados. Este algoritmo fornece também uma medida quantitativa, denominada informação de Akaike (Akaike, 1974), que reporta para qual modelo o ajuste é mais preciso.
- O modo visual é recomendado a especialistas que possuem afinidade e conhecimento do fenômeno em estudo. Neste modo, todos os parâmetros são definidos por inspeção.
Além dos procedimentos de ajuste, Automático ou Visual, este módulo define o modelo teórico de semivariograma a ser utilizado pelos módulos de Validação e krigagem.
O ajuste ou a modelagem do semivariograma experimental se inicia após a Geração de Semivariograma.
81
A tela de "Relatório de Dados" apresenta um conjunto de informações, tais como: o tipo de modelo teórico escolhido, os valores de Efeito Pepita, Contribuição e Alcance que são parâmetros que compõem o modelo.
É expresso também o valor de Akaike, que é um indicador do ajuste realizado; pois quanto menor seu valor melhor o ajuste. Então, os parâmetros Efeito Pepita, Contribuição e Alcance são sempre tomados com relação ao menor valor de Akaike.
82
Validação do Modelo
Como visto anteriormente, a análise do semivariograma compreende o levantamento do semivariograma experimental e posteriormente o ajuste a uma família de modelos teóricos.
Em toda esta seqüência, existe sempre um certo grau de incerteza sobre os parâmetros ajustados aos modelos. Esta incerteza é o erro da estimativa, o qual pode ser obtido através do procedimento chamado validação do modelo.
Resumidamente, o processo de validação envolve a re-estimação dos valores conhecidos através dos parâmetros ajustados ao modelo do semivariograma.
Antes de executar a krigagem, é recomendável verificar os resultados da validação. Problemas óbvios podem ser identificados com os parâmetros de entrada (por exemplo, a especificação do semivariograma) ou com os dados (por exemplo, valores aberrantes, ou "outliers").
83
O módulo de validação desenvolvido no Spring fornece as seguintes saídas:
- Diagrama espacial do erro;
- Histograma do erro;
- Estatísticas do erro;
- Diagrama dos valores Observados x Estimados;
- Resultados Numéricos.
84
Resultados
Por exemplo, pressionando-se a opção Diagrama Espacial do Erro, ocorre a abertura da janela gráfica na Figura.
- Os símbolos tipo cruz na figura acima indicam a localização geográfica das amostragem e a magnitude do erro (para os símbolos pequenos o erro é menor e vice-versa).
85
Krigagem
Esta janela descreve a etapa de krigagem, com a qual se objetiva obter uma grade regular de valores a partir dos dados (pontos) amostrados.
O módulo de Krigagem implementado no SPRING engloba krigagem simples, krigagem ordinária e krigagem com vários modelos de tendência em duas dimensões (2D) ou três dimensões (3D).
Os campos Res.X e Res.Y referem-se às resoluções em X e Y da grade de saída. Estes campos podem ser alterados desde que os novos valores não proporcionem uma grade de saída com número de coluna e ou de linha maior que 1000. Em outras palavras, o módulo de Krigagem gera grades regulares com tamanho máximo de 1000 colunas por 1000 linhas.
86
A Figura resume os parâmetros da grade de saída gerada pelo módulo de krigagem.
87
- GKrV: refere-se à grade de valores estimados obtida da interpolação de krigagem, a partir de um modelo anisotrópico que supostamente representa a verdadeira continuidade espacial do fenômeno em estudo. Da análise geoestatística realizada, supõe-se que o fenômeno apresenta maior continuidade na direção Norte (0º) e menor na direção Leste (90º).
- GKrVe: refere-se à grade da variância de krigagem, associada a GKrV.
- GKrI: refere-se a Grade de valores estimados obtida da interpolação de krigagem a partir de um modelo isotrópico. Neste caso, admite-se que a continuidade espacial do fenômeno é a mesma em qualquer direção.
- GKrIe: refere-se à grade da variância de krigagem, associada a GKrI.
- GKrA : refere-se à grade de valores estimados obtida da interpolação de krigagem, a partir de um modelo anisotrópico que utiliza direções intermediárias (10º e 100º) às direções de máxima e mínima continuidade.
- GKrAe: refere-se à grade da variância de krigagem, associada a GKrA.
Produtos gerados com a krigagem
88
RESULTADOS DA KRIGAGEM
Como ponto de partida, é interessante verificar a continuidade espacial do
fenômeno em estudo (teor de argila). Para realizar tal análise, é
necessário transformar as grades de valores estimados e as
correspondentes grades de erros em imagens.
89
90
Através das imagens apresentadas na parte superior pode-se constatar
algumas características comuns:
- essas imagens revelam que, nas regiões Norte e Nordeste, o teor de
argila é relativamente baixo;
- na região Central, observa-se mudanças graduais do teor de argila, indo
de valores moderados a altos, e
- nas regiões Sul e Sudoeste aproximadamente moderado.
De maneira análoga, as figuras da parte inferior mostram que o erro da
estimativa aumenta à medida em que se afasta dos pontos de
observações. É possível também identificar, nestas imagens, regiões
onde a amostragem pode ser melhorada.
91
Um outro aspecto a ser observado nas Figuras da parte superior, e talvez
o mais importante, é o efeito da anisotropia:
· Observa-se, na primeira imagem, a qual supostamente representa a
verdadeira continuidade espacial, que as mudanças graduais do teor de
argila são visivelmente diferentes das demais, principalmente na região
central.
· A segunda imagem mostra que a continuidade espacial do teor de argila
se propaga uniformemente em todas as direções. Neste caso a
anisotropia é mascarada e, portanto, o resultado não revela a verdadeira
continuidade espacial da variável em estudo.
· Por outro lado, a terceira imagem apresenta um caso intermediário à da
suposta continuidade espacial verdadeira. Este caso também não revela
a verdadeira variabilidade espacial, apenas mostra que o teor de argila
se propaga mais intensamente na direção 10º e menos intensamente na
direção ortogonal (100º).
92
O solo, em função de suas características físicas e químicas, é elemento
natural que vem sendo intensamente estudado com a técnica
geoestatística, demonstrando resultados que comprovam a sua
heterogeneidade no tocante a diversas de suas propriedades.
Assim sendo, com base nos diversos estudos que vem sendo realizados,
atesta-se a necessidade dessa técnica como forma de avaliar
estatisticamente a variabilidade espacial de diferentes propriedades em
áreas que aparentemente pareçam homogêneas. Essa homogeneidade
está muitas vezes associada às unidades de solo, delimitadas via de
regra pela posição na paisagem.
APLICAÇÕES DA GEOESTATÍSTICA NO ESTUDO DE SOLOS
93
Reichardt et al. (1986) salientam que grande parte de avaliações feitas
nos solos, são feitas considerando-os como homogêneo no plano
horizontal X, Y, mas variando apenas em propriedade, de acordo com a
ocorrência dos horizontes com suas propriedades distintas. Entretanto,
devido a necessidade do aumento das exigências de produtividade,
modelos simples tem sido insuficientes e a necessidade de considerar a
variabilidade nas três direções X, Y, e Z, têm-se mostrado cada vez mais
presente, em todas as áreas da ciência do solo: física, química, fertilidade
e conservação.
Na área de conservação do solo a estimação da erodibilidade dos solos,
obtida de forma indireta é de grande importância. Para isso, leva-se em
consideração propriedades do solo que podem ser aferidas através de
amostras de campo, e assim sendo há a possibilidade de avaliar a sua
variabilidade espacial.
94
Reichardt et al. (1986) comentam que o solo e as distribuições das
diferentes partes das plantas, dentro e fora do solo, são
fundamentalmente heterogêneos. Em função disso, medidas de
parâmetros de solo e planta, muitas vezes apresentam irregularidades
que podem ou não estar distribuídas ao acaso em relação à sua
distribuição espacial no campo. O autor comenta ainda que com as
técnicas geoestatísticas ou espaciais, informações adicionais sobre a
estatística clássica podem ser obtidas, uma vez consideradas as posições
relativas de cada medida. No caso de delineamentos experimentais em
solos, a avaliação da variabilidade espacial pode ser considerada como
positiva, sob um novo enfoque de estudo, que não se prende aos
resultados obtidos com a estatística clássica ou casual, a qual não
considera a posição dos pontos amostrados no espaço.
95
Uso da geoestatística na experimentação de campo em solos
Warnick e Nielsen (1980) avaliaram a variabilidade de solos, bem como os
aspectos relativos à amostragem, autocorrelação e análise espacial.
Gurovitch e Stern (1983) e Sisson e Wierenga (1981) avaliaram a
variabilidade espacial do processo de infiltração de água em solos.
Silva et al. (1989) estudaram a variabilidade espacial da resistência à
penetração, em um latossolo vermelho-escuro, determinada com um
penetrômetro. O trabalho objetivava detectar a profundidade e a
espessura de uma camada com resistência à penetração superior a 17,57
kg/cm2. Utilizando métodos geoestatísticos, os autores avaliaram que
havia uma grande variabilidade da área quanto aos parâmetros
estudados.
96
Vauclin (1982) e Morkoc et al. (1985) estudaram a variabilidade espacial
da temperatura da superfície do solo e a relação com outras
propriedades.
Reichardt et al. (1984) revelam como a variabilidade espacial da
umidade do solo pode ser utilizada para estudar a influência sobre outras
propriedades do solo.
Reichardt et al. (1986) estudaram a variabilidade espacial do pH em água
em um latossolo vermelho-escuro orto, comparando os dados com uma
avaliação feita pela estatística clássica. Chegaram a conclusão de que a
geoestatística pode fornecer subsídios para um melhor esquema de
amostragem.
97
Vieira et al. (1981) utilizaram 1280 medidas de campo relativas a
infiltração, para avaliar a variabilidade espacial do fenômeno, bem como
avaliar o número de amostras necessárias para reproduzir as medidas de
infiltração na área sob estudo. Os resultados obtidos indicaram que 128
amostras seriam suficientes para representar a informação obtida com as
1280 amostras iniciais.
Vieira et al. (1982) avaliaram a variabilidade espacial da retenção de
água, densidade e granulometria em três solos do estado de São Paulo.
Os resultados mostraram que a escala de variação muda bastante de solo
para solo. A análise geoestatística permitiu também estabelecer
espaçamento entre amostras para os solos estudados, para permitir
estimativas a espaços menores sem tendência e com variância mínima.
98
Vieira et al. (1983) procuraram mostrar as diferentes áreas agronômicas
nas quais podem ser utilizadas as técnicas geoestatísticas, objetivando o
estudo da variabilidade espacial.
Uma primeira área agronômica diz respeito ao levantamento de solos,
que foi estudada por Grossman. Este autor trabalhou com as variáveis
profundidade do solo para um valor estimado de 40% de areia e a
percentagem de areia, utilizando uma grade de amostragem irregular.
Para a primeira variável foi possível ajustar um modelo esférico ao
semivariograma, enquanto a segunda variável apresentou variância não
finita. O autor avalia que essas variáveis tem uma forte estrutura esférica
com ranges de aproximadamente 300 pés. O semivariograma cruzado
das duas variáveis tem uma estrutura linear com range de 600 pés e a
correlação entre ambas não foi alta.
99
Outro tipo de estudo foi realizado por Waynick, que trabalhou com
nitrificação do solo e tomou amostras de solo em duas profundidades, em
esquema radial. As variáveis consideradas foram o nitrato residual,
amostras com inexistência de nitrogênio, outras com 0,2 g de sulfato de
amônia e outras ainda com 1g de sangue submetido ao ressecamento.
Apenas as amostras coletadas em subsuperfície com nitrato residual e
sangue, apresentaram semivariogramas com modelo esférico. No geral
os semivariogramas experimentais e os semivariogramas cruzados não
foram bem definidos , talvez devido ao esquema de amostragem.
100
Em outro estudo, Waynick e Sharp analisaram com o conteúdo de
carbono e nitrogênio para duas áreas (Davis e Oakley) que apresentavam
muita semelhança pedológica e estavam desprovidas de vegetação. As
amostras foram coletadas em esquema de grade e apresentaram
semivariogramas muito diferentes, embora com estruturas bem definidas,
exceto para o carbono em Davis. Em Oakley, os semivariogramas
experimentais e os semivariogramas cruzados para carbono e nitrogênio
apresentaram estruturas muito similares. Para a área de Davis o
semivariograma cruzado para nitrogênio e carbono apresentou estrutura
bem definida, embora o semivariograma para carbono tenha apresentado
efeito pepita puro.
101
Vauclin et al. (1983) procuraram avaliar o uso da cokrigagem como
forma de conhecer a variabilidade espacial de uma variável que
apresenta dificuldade de amostragem, considerando sua correlação
espacial com outra variável melhor amostrada. Obtiveram de uma área
de 40 x 70 m, amostras em um esquema de grade com nós distantes
uns dos outros 10 m, no intervalo de profundidade de 20 a 40 cm. As
variáveis amostradas foram areia, silte, argila, conteúdo gravimétrico de
água retido a 1/3 bar (pF25) e o conteúdo avaliável de água (AWC). Os
resultados demonstraram que os semivariogramas de todas as variáveis
apresentaram efeito pepita. Para argila e areia o modelo variográfico
encontrado foi o esférico, enquanto para as demais variáveis foi o linear.
Para determinação dos valores de pF25 e AWC em pontos intermediários
da grade amostral (5 m), foi encontrada correlação com o conteúdo de
areia nos pontos da grade original, e utilizou-se a técnica da cokrigagem
com eficiência, para estimação dos valores de AWC nos pontos não
amostrados.
102
Souza (1992) avaliou a variabilidade espacial de fósforo, potássio,
matéria orgânica, argila, densidade e umidade do solo em diferentes
sistemas de manejo, profundidades e tipos de solo de duas localidades
no Rio Grande do Sul (Eldorado do Sul e Passo Fundo). Utilizou malhas de
amostragem de 1m x 1m em um dos locais e de 10m x 10 m em outro.
Os resultados obtidos demonstraram que houve, na grande maioria dos
casos, correlação espacial para as propriedades do solo nos sistemas de
manejo que foram avaliados. Com base nesses resultados, verificou-se
que não houve alteração significativa no solo em função dos efeitos
continuados da ação antrópica que pudessem suplantar a variabilidade
subjacente e espacialmente estruturada do solo ao natural, levando a
uma distribuição aleatória. Essa hipótese havia sido levantada, porém
não foi confirmada.
103
Martinez e Zinck (1994) estudaram a variabilidade espacial dos efeitos
do desmatamento de floresta úmida e do manejo de pastagens em
ambiente da amazônia colombiana sobre a deterioração das
propriedades físicas do solo e mais especificamente sobre a
compactação do solo em duas profundidades, 0-5 cm e 5-10 cm.
Utilizaram como principais variáveis a resistência a penetração e a
densidade aparente em áreas sob condições físicas semelhantes. No
que diz respeito à resistência a penetração, verificaram que em
ambiente de floresta, na camada superficial de solo o modelo
variográfico adotado foi o linear, sem que houvesse uma boa
estruturação espacial. No caso da camada inferior de solo, o modelo
ajustado foi o esférico, e houve o claro reconhecimento de um padrão
espacial. Sob pastagem os modelos ajustados para ambas as camadas
foram o esférico e o exponencial, respectivamente, com baixa
dependência espacial e elevado efeito pepita.
104
Vieira et al. (1988) procuraram quantificar propriedades físicas do solo
necessárias ao planejamento da microbacia hidrográfica do córrego São
Joaquim, em Pirassununga (SP), e caracterizar sua variabilidade espacial,
com vistas ao estabelecimento de método para uso em outras áreas.
Utilizaram as variáveis argila, silte, areia fina, areia grossa, densidade do
solo a 10 cm, densidade do solo a 20 cm e infiltração inicial e final. Os
autores chegaram a, entre outras conclusões, que a densidade de
amostragem utilizada de 150 m, poderia ser estendida para 200 m; a
geoestatística como ferramenta para caracterizar a variabilidade espacial
dos parâmetros utilizados foi útil no sentido de que foi possível perceber
as relações entre as variáveis; e que o método adotado pode servir de
guia para outros locais.
105
De Maria et al. (1992) estudando a mesma microbacia hidrográfica
mencionada anteriormente, procuraram avaliar como a fertilidade do
solo se distribui na área e que fatores estão a ela relacionados. Para
tanto utilizaram esquema de amostragem semelhante a situação
anterior dos parâmetros físicos, com pontos regularmente espaçados de
150 m. Os parâmetros utilizados foram: fósforo, matéria orgânica,
pHCaCl2, potássio, cálcio, magnésio, H+Al, soma de bases, CTC e
saturação de bases. Os autores chegaram a conclusão de que o método
utilizado permitiu conhecer a variação dos parâmetros de fertilidade do
solo para uma avaliação inicial.
106
Trabalhando com técnicas geoestatísticas em grandes áreas, Yost et al.
(1982) procuraram determinar a estrutura da dependência espacial de
propriedades químicas do solo em grandes distâncias e examinar e
interpretar semivariogramas de propriedades químicas do solo. A área
estudada foi na Ilha do Havaí, onde em 80 áreas amostrais foram feitos
transectos com intervalo amostral da ordem de 1 a 2 km e as amostras
foram coletadas na profundidade de 0-15 cm e 30-45 cm. Os resultados
obtidos demonstraram que maior há maior estruturação espacial a
grandes distâncias dos dados coletados em superfície do que no
subsolo. Isto demonstra que as propriedades químicas do subsolo tem
zonas de influência que devem ser caracterizadas pelos processos de
formação do solo e que na superfície as chuvas tem imposto um
elevado grau de uniformidade, ou seja, um fator resultante dos agentes
externos.
107
Reynolds et al. (1994) estudaram a bacia hidrográfica do rio Grande, sul
de Ontário, Canadá, com o intuito de verificar a variabilidade espacial e
temporal da capacidade dos solos quanto ao potencial de poluição dos
recursos hídricos subsuperficiais, por produtos agroquímicos
(pesticidas). As técnicas geoestatísticas foram utilizadas para extrapolar
os resultados pontuais obtidos de modelos de simulação de transporte
de solutos, para áreas relativamente grandes, em conjunto com o uso
de sistema de informações geográficas, para permitir a combinação dos
mapas de isovalores gerados pela krigagem com outros mapas de
atributos do solo, práticas agrícolas, práticas de manejo da terra, etc.
Utilizando 119 pontos amostrais em uma área maior do que a bacia
hidrográfica estudada, os autores obtiveram semivariogramas que
demonstraram estruturação espacial, com sill e efeito pepita bem
definidos. Conforme os resultados obtidos com os semivariogramas, os
autores comentam que as estimativas da krigagem tendem a ter boa
precisão. Assim sendo, pelos resultados preliminares obtidos, as
perspectivas do trabalho são muito boas.
108
109
Simulação condicionada
Por meio da estimação, persegue-se uma estimativa que represente o
mais fielmente possível o valor verdadeiro de uma variável em um
determinado ponto, sendo a krigagem um desses estimadores.
Prioriza-se a estimação não-enviesada e a minimização da variância de
estimação.
Procura-se obter a melhor representação dos valores reais e, por meio da
simulação, objetiva-se o conhecimento das dispersões.
Enquanto as técnicas de interpolação apresentam como resultado uma
suavização da realidade, as simulações buscam manter a variabilidade
espacial do fenômeno real.
110
Comparação entre Simulação Condicionada e Krigagem
O estimador de krigagem possibilita a construção de funções de
distribuição de probabilidade, paramétricas ou não, para um atributo em
estudo. A distribuição de probabilidade, definida em cada posição de uma
região estacionária de interesse, é usada para se inferir, em cada posição,
um valor único do atributo e uma incerteza associada ao atributo.
Dessa forma, a krigagem, usada como um estimador, cria um único
campo aleatório cujos valores compõem uma superfície suavizada. A
variabilidade do estimador no espaço é uma versão suavizada da
verdadeira variabilidade e não reflete exatamente as flutuações reais
(Huijbregts 1973). Esta superfície tem variância menor do que o conjunto
amostral, pois o valor estimado para cada variável aleatória é obtido a
partir da hipótese de mínima variância do erro de estimação.
111
Resumidamente, as diferenças atribuídas aos procedimentos de krigagem
e simulação estocástica (Deutsch e Journel 1998 e Englund 1993) são:
1)A krigagem é um interpolador que gera um único campo aleatório
segundo os critérios de mínima variância e não tendenciosidade do
estimador. Portanto, o campo interpolado tem menor grau de
variabilidade do que as amostras e reproduz apenas a média das
amostras. A simulação, por sua vez, cria vários campos aleatórios que
reproduzem características globais e estatísticas, de ordem maior que 1,
das amostras. Por exemplo, o histograma das amostras é reproduzido
pelos valores simulados.
2) A krigagem fornece um conjunto de representações locais onde a
acurácia local prevalece. A simulação fornece representações globais
alternativas, onde prevalece a representação de padrões de continuidade
espacial, que permite estimativas de acurácia global quando várias
localizações são consideradas conjuntamente.
112
3) O procedimento de krigagem é menos custoso computacionalmente do
que a simulação. Para se reproduzir, com um alto grau de acurácia,
momentos estatísticos de ordem maior que 1, são necessárias de 500 a
dezenas de milhares de campos simulados.
Apesar das diferenças, podem-se destacar pelo menos 3 semelhanças
entre os procedimentos de krigagem e de simulação estocástica:
1)São procedimentos geoestatísticos que utilizam um modelo de
variografia, definido sobre o conjunto amostral, para estabelecer o
comportamento de variabilidade do atributo numa região de interesse.
2) São procedimentos que honram o conjunto amostral original, ou seja,
os valores atribuídos às amostras não são modificados.
3) Possibilitam estimativas de estatísticas e incertezas sobre o atributo
em
estudo.