geoestatÍstica aplicada a recursos naturais pcf -560 josÉ marcio de mello [email protected]...
TRANSCRIPT
GEOESTATÍSTICA APLICADA A RECURSOS NATURAIS
PCF -560
JOSÉ MARCIO DE MELLO
LAVRAS #2014 – 2#
1. INTRODUÇÃOA - Geoestatística e suas interfaces na Engenharia Florestal
Técnicas estatísticas são aplicadas em todos os ramos da ciência. (Teste F, teste de média, regressão, análise de agrupamento, Modelagem, etc...)
ESTATÍSTICA “CLÁSSICA” –
MODELAGEM E TESTES DE
COMPARAÇÃO
SOLOS “Anava”
HIDROLOGIA
SENSORIAMENTO REMOTO
ECOLOGIA “Modelagem/análise
multivariada”
BIOMETRIA“Modelagem”
INVENTÁRIO FLORESTAL
MANEJO FLORESTAL
SILVICULTURA“Anava – modelagem”
“ISTO EVIDENCIA A IMPORTÂNCIA DA ESTATÍSTICA NA FORMAÇÃO DOS PROFISSIONAIS”.
Os métodos de análises empregados na estatística clássica, assumem que as observações ocorrem de forma independente.
Os métodos clássicos geram uma medida de posição (µ) e uma medida de dispersão (σ2). Na clássica os métodos discerne somente o tamanho da variabilidade.
Segundo Reichardt (1985) “A estatística clássica e a geoestatística, que é um ramo da estatística espacial, se complementam”.
Neste sentido é que teremos que perceber a interface e possibilidades de novas alternativas que explore a relação espacial entre as observações (distâncias entre os pontos observados).
GEOESTATÍSTICA
VIVEIROS “casa de
vegetação (L1; C3;xi)”
RECUPERAÇÃO DE ÁREAS
DEGRADADAS “Variabilidade de solos”
TECNOLIGIA DA MADEIRA“Continuidade espacial da DB ao longo do fuste”
ECOLOGIA “Estudo da distribuição espacial das espécies”
BIOMETRIA“Estudo de variabailidade
espacial de variáveis”
INVENTÁRIO FLORESTAL “Georeferenciamento”
SENSORIAMENTO REMOTO
MELHORAMENTO “Análise de progêneses”
FOCO DO CURSO: “Apresentar noções gerais de geoestatística, a fim de que possamos ter outras alternativas de análises”.
TRABALHO 01
- Leitura de 4 artigos relacionados de geoestatística com floresta, com solo, com hidrologia e com ecologia (ou áreas afins).
- Para cada artigo fazer uma resenha de 1 página digitada, destacando os pontos importantes da metodologia geoestatística utilizada e os principais resultados. Além da resenha o artigo completo em digital ou impresso.
DATA: PRÓXIMA PRIMEIRA TERÇA FEIRA...
Trabalho de Borgelt et al 1994
VTR (Variable rate technology) – tecnologia de aplicação com taxas variáveis de calcário; [ Mapeamento da área com base no pH]
Distribuição de uma malha irregular de pontos amostrais na área para subdivisão com base no pH (5 sub-áreas);
I II III IV V
Como e qual a quantidade de calcário distribuir na área?
B – MOTIVAÇÃO PARA USO DA GEOESTATÍSTICA
Síntese dos resultados:
- quantidade de calcário aplicado considerando as sub-áreas - mapeamento (43,4 ton/ha);
- quantidade de calcário aplicado a partir da informação média (40 ton/ha);
OBS.: a) quantidade de calcário com base na média foi menor;
b) no entanto 12% da área recebeu excesso de calcário [ aumento de custo];
c) 37% recebeu menos do que o necessário [redução da produção];
CONCLUSÃO: Gastou-se mais do que o necessário e produziu menos. Se tivesse corrigido adequadamente produziria mais.
É um despertar para a agricultura de precisão...
- “USANDO VALOR MÉDIO DE pH”.
761000 762000 763000 764000 765000 766000 767000
7378
000
7379
000
7380
000
7381
000
7382
000
7383
000
7384
000
Longitude
Latit
ude
240 260 280 300
- “MAPA DE KRIGAGEM DOS VALORES DE pH para a área”.
Determinar o Teor de Argila no Solo
1 23
D
D – domínio área a ser avaliada
- Será que uma única amostra caracteriza adequadamente o teor de argila neste domínio?
- Coleta de diversas amostras nas 3 transeções { média/variância};
OBS.: A média , como resposta, pode não ser uma boa medida, principalmente se a variância for alto.
- Análise dos dados por transeções (1, 2 e 3).
- Pelo gráfico exposto, será que a média é explicativa para os 3 comportamentos do teor de argila em função da posição?
- Para 1 e 2 a média expressa bem o teor de argila (%). Na transeção 3 a posição influenciou no teor de argila (%), e portanto esta deve ser considerada no cálculo da variância.
% Argila
Posição
% Argila
Posição
C - BREVE HISTÓRICO SOBRE GEOESTATÍSTICA
a) - Smith (1910)
- Montgomery (1913)
- Waynich e Sharp (1919)
Utilizavam a média e o desvio padrão para caracterizar fenômenos na área de solos – QUESTIONAMENTOS SOBRE OS MÉTODOS????
- “USANDO VALOR MÉDIO DE pH”.
D - Mercer & Hall (1911) “Experimento em branco em campos de milho na Inglaterra”.
Montaram um experimento com diversas parcelas pequenas em campo de milho para estudar a variação entre estas parcelas.
Observaram que a variância diminui com o aumento da parcela. Outro aspecto observado é que houve diferença entre os tratamentos (??).
σ2
Tamanho
“Tendência de estabilização da variância”.
A ideia de estabilização da σ2 é “um primeiro indicativo de geo”.
Verificaram que havia uma forte correlação entre as parcelas adjacentes nos campos de milho. (INTUIÇÃO DE DEPENDÊNCIA ESPACIAL).
Eles sugeriram comparar o desvio padrão da diferença entre unidades vizinhas ( BASE DO SEMIVARIOGRAMA)
“Tendência de estabilização da variância”.
“Tendência de estabilização da variância”.
σ2
“Tendência de estabilização da variância”.
σ2σ2
Tamanho
σ2
“Tendência de estabilização da variância”.
Tamanho
σ2
“Tendência de estabilização da variância”.
Tamanho
σ2
Percebendo estas questões e não tendo recurso computacional adequado, as ideias dos pesquisadores estatísticos começaram a fluir....
Fisher (1925) – Livro “Statistical Method for Reserch Workerks”
Snedecor (1937) – “Statistical Method”
“ Esta duas obras nortearam os princípios e fundamentos da estatística experimental (distribuição normal dos erros, independência entre as observações e aleatorização)”.
A PRINCIPAL HIPÓTESE DESSA ESTATÍSTICA É QUE AS VARIAÇÕES NUMA DADA CARACTERÍSTICA DE UM LOCAL PARA OUTRO SÃO ALEATÓRIAS, OU SEJA, NADA INFLUENCIA A σ2 DOS DADOS.
E - Daniel G. Krige (1951) – Começa a história da geoestatística
Concluiu que (µ) e (σ2) eram insuficientes para explicar o que acontecia com as estimativas de ouro nas jazidas da África do Sul.
Quando era explorado a jazida, os valores de média e variância gerados pela amostra eram viesados.
Krige e Sichel – desenvolveram uma estatística diferenciada e apropriada para estimar o cálculo da reserva.
“Introduziu o conceito de média móvel para evitar a superestimação sistemática da reserva”.
- Na situação (a) é como se Na situação (a) é como se tivesse um bloco de minério. Até tivesse um bloco de minério. Até a metade do bloco, o valor médio a metade do bloco, o valor médio é alto e as amostras variam ao é alto e as amostras variam ao redor do mesmo. A outra metade redor do mesmo. A outra metade o valor médio cai. Mesmo com os o valor médio cai. Mesmo com os valores variando ao redor do valores variando ao redor do mesmo. Mostra que não há um mesmo. Mostra que não há um continuidade (clássico) no bloco. continuidade (clássico) no bloco. O teor varia espacialmente...O teor varia espacialmente...
1962/1963 – Matheron com os dados de Krige desenvolveu a Teoria das Variáveis Regionalizadas.
“Modelagem Matemática para variáveis que ocorrem de forma contínua e que a variação de um local para outro tem influência da distância”.
F - Contextualização da Estatística Clássica com a Geoestatística
Estatística Clássica X Estatística Espacial – não veja esta comparação como competição entre 2 metodologias. As duas tem as suas respectivas vantagens. Temos que tirar o que de bom cada uma tem.
Procedimentos estatísticos tradicionais modelam os dados a partir do pressuposto de que os mesmos são independentes. Esta independência esta associada aos erros.
ixixiy )()(
µ
••
•
• •
• •
•
• •
•
•
•
•
•
•
••
•
•
•
• •
•
•
•
••
••
•
•••
••
•
•
•
DADOS
POSIÇÃO
iixixixi Sy )()()(
µ
DADOS
POSIÇÃO
•
• •
• ••
•
••
••
•
•
•
•
•
•
•
•
•
•
••
•
•
•
•
•
- SIMULANDO DADOS COM DEPENDÊNCIA ESPACIAL
- sim=grf(500,grid=“reg”,cov.pars=c(1,0.25))
- image(sim)
- sim2=grf(500,grid=“reg”,cov.pars=c(1,0.75))- Image(sim2)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
X Coord
Y C
oord
- sim3=grf(500,grid=“reg”,cov.pars=c(1,0.25),nugget=0.5)- Image(sim3)
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
X Coord
Y C
oord
EXEMPLO: Clássica X Espacial
A – Clássica: Gera intervalo de confiança (IC) – isto mostra com um determinado nível de confiança no qual o valor esperado num determinado ponto não amostrado na floresta. ( )IC x erro
Poderia ter mapa colorido caso fizesse o censo em cada unidade amostral da população estatística (N).
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
X Coord
Y C
oord
- SIMULANDO- sim=grf(500,grid=“reg”,cov.pars=c(1,0),nugget=1)- Image(sim)
De ante mão, por quê não conseguimos obter uma mapa variando de cor conforme a produtividade da área? A média e a variância da média não levam em consideração a correlação entre as parcelas. São estatísticas constante para toda a área...
B – Espacial, neste caso consegue-se um mapa de produtividade variando ao longo da área, pois a correlação é levada em consideração na estimativa de qualquer ponto dentro da área. Isto é conhecido sem fazer o censo na área.
= (Fe’-1Fe)-1 * Fe’-1 y VAR() = (Fe’-1Fe)-1
APLICAÇÃO DO CÁLCULO DA MÉDIA E DA VARIÂNCIA ESPACIAL MAIS A FRENTE NO CURSO...
2. OS PRIMEIROS PASSOS COM O R
O R é uma linguagem e ambiente para computação estatística e gráfica. Robert Gentleman e Ross Ihaka (1996). A principal vantagem do uso do R é ser gratuito e o usuário sabe o que ele está fazendo. a) Instalando o R
- www.r-project.org
O R é formado por um conjunto pacotes (funções criadas por alguém que as disponibilizou de forma gratuita no R). >library(NOME DO PACOTE) #O R carrega o pacote de seu interesse#.
O R é uma linguagem interativa que funciona através de linhas de comando. A linha de comando é sinalizada com “> ” quando o R está pronto para receber um comando.
>sqrt (9 #Veja o que acontece!!!!#>sqrt(9) <enter>
c) Criando objetos no R
>x=2 #Observe o que aconteceu...>x=5 # Qual foi a diferença?
dados<-c(20,21.2,50.5,60,102)
>length(dados)
>mode(dados)
>rm(a)
>ls()
3. ESTATÍSTICA DESCRITIVA – uso do R
A - Conceito de população
- Alvo
- Estatística
- COORDENADAS DO CONTORNO DA ÁREA
- COORDENADAS DE PARCELAS
B - Amostra
É um conjunto representativo da população estatística. Os dados para se trabalhar com geoestatística vem de informações da amostra.
Quando se trabalha com amostragem sistemática, ela possibilita “enxergar” melhor a estrutura de continuidade espacial da característica avaliada.
A observação da continuidade espacial, às vezes, é uma questão de escala. Se os pontos de observação estão distantes, pode-se concluir que a variável não é contínua. É preciso amostrar numa escala menor (TESSELA) para poder visualizar a magnitude desta continuidade espacial. [ Amostrar na pequena escala. Lá pode ter continuidade e a gente não enxergar]...
Uso R
(Parte 1)
1. Abrir o arquivo “dados_1.xls” e criar o arquivo “dados1.txt”;
2. Gerar um objeto (dados) data.frame com o arquivo “dados1.txt”;
dados=read.table("dados1.txt",header=T,dec=",")
4. Apresentar a função sample do R;
5. Criar 3 objetos utilizando a função sample;
a10=sample(dados$VCC,10,replace=F)
a50=sample(dados$VCC,50,replace=F)
a100=sample(dados$VCC,100,replace=F)
Observe que foram geradas 3 amostras de tamanhos diferentes (10; 50; 100).
C - Medidas de posição
As medidas de posição são: média; mediana e moda.
- FAZENDO NO RFAZENDO NO R
x=seq(10,220) fx1=dnorm(x,80,20) plot(x,fx1,ype=“l”) fx2=dnorm(x,100,20) lines(fx2) Fx3=dnor(x,120,80) lines(fx3)
2
22)(
*21exp
**2
1)(
xxf
Uso R(Parte 2)
6. Calcular a média e mediana para cada uma das amostras (a10; a50; a100);
mean(a10) median(a10)
mean(a50) median(a50)
mean(a100) median(a100)
7. Gerar o histograma de frequência para cada uma das amostras;
par(mfrow=c(1,3))
hist(a10,col="red",main="Média 1",label=T)
hist(a50,col="blue",main="Média 2",label=T)
hist(a100,col="orange",main="Média 3",label=T)
Observe o conceito do Teorema Central do Limite.
D - Medidas de dispersão
As principais medidas de dispersão são: Variância; Desvio padrão; CV e erro padrão.
- FAZENDO NO RFAZENDO NO R
x=seq(1,100) fx1=dnorm(x,50,5) plot(x,fx1,type=“l”) fx2=dnorm(x,50,10) lines(fx2) Fx3=dnorm(x,50,15) lines(fx3) abline(v=50)
Uso R
PARTE 3
1. Gerar aleatoriamente as seguintes intensidades amostrais: a20; a40; a60; a80; a100 e a120.
2. Para cada grupo encontrar a média, a variância, o desvio padrão, o CV e o erro padrão da média.
MEDIA=c(mean(a20),mean(a40),mean(a60),mean(a80),mean(a100),mean(a120))
RESULTADO=matrix(c(MEDIA,VARIANCIA,SD,CV),ncol=4)
colnames(RESULTADO)=c("MÉDIA","VARIÂNCIA","SD","CV")
3. Relacionar a intensidade amostral (x) com o coeficiente de variação (CV). X=c(20,40,60,80,100,120)
plot(X,CV)