análise geoestatística de dados composicionaisabtmartins:slidedefesatese.pdf · an alise geoestat...
TRANSCRIPT
Analise Geoestatıstica de Dados Composicionais
Ana Beatriz Tozzo Martins - PPGMNE-LEG/UFPRDES/UEM
Orientador: Prof. PhD. Paulo Justiniano Ribeiro Junior - LEG/UFPRPrograma de Pos-Graduacao em Metodos Numericos em Engenharia
PPGMNE - UFPR
09 de abril de 2010
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
TESE
1. Introducao
2. Revisao da Literatura:
• Modelo Geoestatıstico Gaussiano;• Predicao Linear Espacial - Classica e Bayesiana;
• Modelo Multivariado;• Dados Composicionais;
3. Metodos:
• Modelo Geoestatıstico Composicional - Classica e Bayesiana;• Analise de Dados Composicionais Simulados;
4. Resultados: Analise de Fracoes Granulometricas de um Solo;
5. Conclusao e Sugestoes de Trabalhos Futuros.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Motivacao
Figura: Quadrante irrigado por sistemapivo-central no campo experimental daESALQ-USP.
SOLO
fracoes granulometricas(composicao)
⇓
propriedades fısico−hıdricas
⇓
pratica agrıcola
⇓
agricultura de precisao
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Triangulo de Classificacao Textural
Figura: Diagrama de classificacao textural do solo.
Fonte: Lemos e Santos (1996) apud Reichardt e Timm (2004).Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Dados Composicionais - Aitchison (1986)
Areia Silte
Argila
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●●
●●●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●● ●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
Figura: Diagrama Ternario dascomposicoes.
•Composicao: X¯
=(X1,X2, ...,XB)′
X1 > 0, . . . ,XB > 0X1 + X2 + · · ·+ XB = 1
SB={X¯∈ RB ; Xi>0, i=1, ...,B; 1
¯′X¯
=1}
• Base: W¯
=(W1,W2, ...,WB)′
RB+={W
¯∈RB ; Wi>0, i = 1, ...,B}
• Operador fechamento:
C : RB+ −→ SB
W¯−→ C[W
¯] =
W¯
1¯′W
¯
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Geometria: Diagrama Ternario com altura unitaria
−0.6 −0.4 −0.2 0.0 0.2 0.4 0.6
0.0
0.2
0.4
0.6
0.8
1.0
H
h
L
E
10%
20%
30%
40%
50%
60%
70%
80%
90%
90%
80%
70%
60%
50%
40%
30%
20%
10%
90% 80% 70% 60% 50% 40%I
30% 20% 10%
X2
●
p
X1
X2X3
F M
A
Figura: O ponto p, (40, 40, 20)% em S3 e (−0, 115; 0, 40) em R2, representadono triangulo de altura unitaria e triangulo de classificacao textural.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Geometria: Diagrama Ternario com lado unitario
0.2 0.4 0.6 0.8 1.0 1.2
0.2
0.4
0.6
0.8
1.0
10%
20%
30%
40%
50%
60%
70%
80%
90%
90%
80%
70%
60%
50%
40%
30%
20%
10%
90% 80% 70% 60% 50% 40% 30% 20% 10%
●
p
X1
X2
X3
X2
F M
A
Figura: O ponto p, (40, 40, 20)% em S3 e (0, 60; 0, 55) em R2, representado notriangulo com lado unitario e triangulo de classificacao textural.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Caracterıstica do Diagrama Ternario
−0.6 −0.4 −0.2 0.0 0.2 0.4 0.6
0.0
0.2
0.4
0.6
0.8
1.0
H
● a
● b
●c
● d
●i
●j
●e
●f
●g
●n
● o
●
m
●
q
● s
L
10%
20%
30%
40%
50%
60%
70%
80%
90%
90%
80%
70%
60%
50%
40%
30%
20%
10%
90% 80% 70% 60% 50% 40% 30% 20% 10%F M
A
Figura: Diagrama ternario com pontos na mesma linha apresentando mesmarazao.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Dados Composicionais
Composicao: X¯
= (X1, X2, X3)′ = (Areia, Silte, Argila)′
Transformacao log-razao aditiva (ALR):
alr : SB −→ RB−1
X¯−→ alr
(X¯
)= Y
¯=
(ln
X1
XB, ..., ln
XB−1
XB
)′Transformacao logıstica generalizada aditiva (AGL):
agl : RB−1 −→ SB
Y¯−→ X
¯= C
((exp
{ln
(X1
XB
)}, . . . , exp{0}
)′).
Pawlowsky e Olea (2004).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Literatura
• Dados composicionais:
• Aitchison (1986).
• Modelos espaciais uni e multivaridados:
• Diggle e Ribeiro Jr (2007);
• Schmidt e Gelfand (2003);
• Banerjee, Carlin e Gelfand (2004);
• Schmidt e Sanso (2006).
• Combinacao de dados composicionais e espaciais:
• Pawlowsky e Olea (2004);
• Lark e Bishop (2007);
• Tjelmeland e Lund (2003).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Objetivo Geral
Propor e implementar um modelo geoestatıstico para dados espaciaiscomposicionais utilizando estruturas multivariadas como componentes domodelo especificados por funcao de correlacao, e desenvolvendo metodosde inferencia baseadas em verossimilhanca e sob o enfoque bayesiano.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Objetivos Especıficos
• Fazer modelagem alternativa a de Pawlowsky-Ghlan e Olea (2004);
• Construir um modelo em que a dependencia espacial e entre variaveisseja considerada na obtencao de uma funcao de covariancia valida;
• Derivar metodos de inferencia baseados em verossimilhanca;
• Aplicar metodos bayesianos para a inferencia dos parametros;
• Desenvolver rotinas computacionais para analise de dadoscomposicionais espacializados;
• Aplicar a metodologia em dados de solo elaborando mapas tematicosde modelos composicionais em estudo de caso.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Fundamentos Para Analise de Dados Composicionais
Composicao: X¯
(x¯
) = (X1(x¯
), X2(x¯
), X3(x¯
))′ = (Areia, Silte, Argila)′
Transformacao log-razao aditiva (ALR):
alr : SB −→ RB−1
X¯
(x¯
) −→ alr(X¯
(x¯
))
= Y¯
(x¯
) =
(ln
X1(x¯
)
XB(x¯
), ..., ln
XB−1(x¯
)
XB(x¯
)
)′Transformacao logıstica generalizada aditiva (AGL):
agl : RB−1 −→ SB
Y¯
(x¯
) −→ X¯
(x¯
) = C((
exp
{ln
(X1(x
¯)
XB(x¯
)
)}, . . . , exp{0}
)′).
Pawlowsky e Olea (2004).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Modelo Espacial
Modelo geoestatıstico bivariado para dados composicionais:{Y1(x
¯i ) = µ1(x¯i ) + σ1U(x
¯i ;φ) + τ1Z (x¯i ; ρ)
Y2(x¯i ′ ) = µ2(x
¯i ′ ) + σ2U(x¯i ′ ;φ) + τ2Z (x
¯i ′ ; ρ)
• x¯i , x¯i ′ ∈ R2; i , i
′= 1, ..., n1, n1 tamanho amostral;
• Y¯ n×1(x
¯) =
(Y1(x
¯1),Y2(x¯1), . . . ,Y1(x
¯n1),Y2(x
¯n1))′
;
• U ∼ N(0¯
; ΣU), ΣU : variancias unitarias e covariancias emfuncao de ρU(φ), exponencial;
• Z ∼ N(0¯
; ΣZ ), ΣZ : variancias unitarias e covariancias em funcao deρ induzida pela estrutura composicional.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Verossimilhanca I
• θ¯
= (µ1, µ2, σ1, σ2, τ1, τ2, φ, ρ)′ Reparam.+3 θ¯∗ = (η, ν1, ν2, φ, ρ)′
Σ = σ21V
• Log-Verossimilhanca → Normal multivariada com EMV:
µ¯
= (D′V−1D)−1(D′V−1Y¯
) e σ1 =√
Qe/n
Qe = (Y¯−Dµ
¯)′V−1(Y
¯−Dµ
¯)
• Log-verossimilhanca concentrada → solucao numerica:
l(θ¯∗,Y
¯) = −0, 5
[ln(|V|) + n
(ln(2π) + ln(Qe)− ln(n) + 1
)]Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Verossimilhanca II
• Estimativa obtida por otimizacao numerica: θ¯
∗= (η, ν1, ν2, φ, ρ)′;
• µ¯
= (D′V−1D)−1(D′V−1Y¯
) e σ1 =√
Qe/n
Qe = (Y¯−Dµ
¯)′V−1(Y
¯−Dµ
¯)
• Hessiano numerico;
• Metodo Delta:
• Var(µ¯
) = Io(µ¯
)−1 = σ21(D′V
−1D)−1
• Var(σ1) = Io(σ1)−1 =σ3
1
3Qe − nσ1
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Comentarios sobre precisao
• Qualidade limitada
• Aproximacoes quadraticas - parametros de covariancia/correlacao
• Alternativas: verossimilhanca
perfilhadamarginalcondicionalmodificada
• Tratamento bayesiano.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Predicao em RB−1
• Cokrigagem de Y¯ 0 em x
¯0 = (x¯10, x¯20, ..., x¯n20):
• µ¯Y
¯ 0|Y¯= µ
¯Y¯ 0
+ ΣY¯ 0Y¯
Σ−1Y¯Y¯
(Y¯− µ
¯Y¯
)
• ΣY¯ 0|Y¯
= ΣY¯ 0Y¯ 0
− ΣY¯ 0Y¯
Σ−1Y¯Y¯
ΣY¯Y¯ 0
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Predicao em SB - Aproximacao Numerica
1. Integracao de Gauss-Hermite multivariada de ordem k
•∫
RB−1
g(Z¯
)f (−Z¯′Z¯
)dZ¯≈
k∑i1=1
k∑i2=1
· · ·k∑
iB−1=1
ωi1ωi2 · · ·ωiB−1g(Zi1 ,Zi2 , ...,ZiB−1
)
pesos ωi1ωi2 · · ·ωiB−1e abscissas Zi1 ,Zi2 , ...,ZiB−1
Abramowitz e Stegun (1972)
• Outras referencias quadratura de Gauss-Hermite:Gamerman (2006),Paulino, Turkman e Murteira (2003)
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Predicao em SB - Aproximacao Numerica (cont.)
Solucao numerica - Momentos no simplex:
• µ¯X
¯
=∫
SB X¯
f (X¯
)dX¯
⇒ µ¯X
¯
=∫
RB−1 g1(Z¯
)f (−Z¯′Z¯
)dZ¯
• ΣX¯
=∫
SB (X¯−µ
¯X¯
)(X¯−µ
¯X¯
)′f (X¯
)dX¯⇒ ΣX
¯=∫
RB−1 g2(Z¯
)f (−Z¯′Z¯
)dZ¯
• Z¯
=1√2
(R′)−1(alr(X¯
)− µ¯Y
¯
) ; R cholesky de ΣY¯
• g1(Z¯
) = π−B−1
2 agl(µ¯Y
¯
+√
2R′Z¯
)• g2(Z
¯) = π−
B−12
(agl(µ
¯Y¯
+√
2R′Z¯
)−µ¯X
¯
)(agl(µ
¯Y¯
+√
2R′Z¯
)−µ¯X
¯
)′Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Predicao em SB - Simulacao
2. Simulacao:
a. gerar dados bivariados de uma distribuicao gaussiana multivariada comparametros obtidos por cokrigagem;
b. aplicar a transformacao AGL nos dados obtidos no item (a);
c. construir os mapas de medias de predicao para cada componente.
Funcionais:
i. maximos e mınimos;
ii. mediana, 5 e 95% de probabilidade;
iii. probabilidades a posteriori de classificacao nas diferentes classes desolo.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
0 50 100 150 200
050
100
150
200
● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ●
Figura: Distribuicao das localizacoes naarea de estudo.
• Goncalves (1997):Tese - ESALQ-USP;
• Area: quadrante irrigado porum sistema pivo-central;
• Grade de amostragem 20× 20m
⇒ 76 amostras:
AreiaSilteArgila.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
Areia
Fre
quen
cia
10 15 20 25 30 35 40 45
05
1015
2025
Silte
Fre
quen
cia
15 20 25 30
05
1015
2025
Argila
Fre
quen
cia
30 40 50 60 70
05
1015
2025
Areia Silte
Argila
●
●●●●
●
●
●●
●●
●●
●
●
●
● ●
●
●
●
●
●●●
●
●●●
●
●
●●
●
●
●●
●
●
●●
●●●●●
●
●
●
●●
●
●
●
●●
●●
●
●●●
●
●●●
●●
●
●
●
●●
●
●●
●
Figura: Distribuicao de areia, silte e argila e diagrama ternario das composicoes.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
ln(Areia/Argila)
Fre
qu
en
cia
−2.0 −1.0 0.0
05
10
15
20
ln(Silte/Argila)
Fre
qu
en
cia
−1.6 −1.2 −0.8 −0.4
05
10
15
20
●
●
●
●●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
● ●
●
●●
●
●
●
●●
●●
●
●
●
●●
●
●
●
−1.5 −1.0 −0.5 0.0
−1
.4−
1.0
−0
.6−
0.2
ln(Areia/Argila)
ln(S
ilte
/Arg
ila)
Figura: Distribuicao das log-razao e correspondente diagrama de dispersao.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
Tabela: Estimativas, erros padrao e intervalos de confianca pelo metodo Delta viametodo de otimizacao “L-BFGS-B”.
Parametros Estimativas Erro Padrao LI. Delta LS. Delta
µ1 -0,759 0,440 -1,200 -0,3195µ2 -0,794 0,229 -1,023 -0,5655σ1 0,450 0,121 0,330 0,5712σ2 0,115 0,052 0,064 0,1668τ1 0,287 0,045 0,242 0,3321τ2 0,267 0,031 0,236 0,2984φ 66,908 42,554 24,355 109,4623ρ 0,954 0,068 0,886 1,0224
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
• Mapas de predicao em S3
• Quadratura Gaussiana: grade de predicao de 2500 localizacoes,ordem de quadratura k = 7;
• Simulacao: 1000 simulacoes, grade de predicao de 1156 localizacoes.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
0 50 100 150 200
050
100
150
200 0.150.20.250.30.35
(A)Areia/QG
0 50 100 150 200
050
100
150
200 0.2150.220.2250.230.235
(B)Silte/QG
0 50 100 150 200
050
100
150
200 0.450.50.550.6
(C)Argila/QG
0 50 100 150 200
050
100
150
200 0.150.20.250.30.35
(D)Areia/Sim
0 50 100 150 200
050
100
150
200 0.2150.220.2250.230.2350.24
(E)Silte/Sim
0 50 100 150 200
050
100
150
200 0.450.50.550.6
(F)Argila/Sim
Figura: Mapas das fracoes de areia, silte e argila obtidos por quadratura deGauss-Hermite (A-C) e por simulacao (D-F).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
0 50 100 150 200
050
100
150
200 0.4 0.5 0.6 0.7 0.8
(A)Are/Max
0 50 100 150 200
050
100
150
200 0.4 0.45 0.5 0.55 0.6 0.65
(B)Sil/Max
0 50 100 150 200
050
100
150
200 0.8 0.85 0.9 0.95
(C)Arg/Max
0 50 100 150 200
050
100
150
200 0.02 0.04 0.06 0.08 0.1
(D)Are/Min
0 50 100 150 200
050
100
150
200 0.030.040.050.060.070.08
(E)Sil/Min
0 50 100 150 200
050
100
150
200 0.05 0.1 0.15 0.2
(F)Arg/Min
Figura: Mapas das fracoes maximas e mınimas por componente.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
0 50 100 150 200
050
100
150
200 0.150.20.250.30.35
(A)Are/50%
0 50 100 150 200
050
100
150
200 0.210.2150.220.2250.230.2350.24
(B)Sil/50%
0 50 100 150 200
050
100
150
200 0.40.450.50.550.6
(C)Arg/50%
0 50 100 150 200
050
100
150
200 0.05 0.1 0.15
(D)Are/5%
0 50 100 150 200
050
100
150
200 0.110.1150.120.1250.130.135
(E)Sil/5%
0 50 100 150 200
050
100
150
200 0.20.250.30.35
(F)Arg/5%
0 50 100 150 200
050
100
150
200 0.30.350.40.450.50.55
(G)Are/95%
0 50 100 150 200
050
100
150
200 0.30.320.340.360.38
(H)Sil/95%
0 50 100 150 2000
5010
015
020
0 0.7 0.75 0.8
(I)Arg/95%
Figura: Mapas das fracoes medianas, inferiores a 5% e 95% de probabilidade, porcomponente.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
Muito argilosa
Dens
idade
0.00 0.15 0.30
05
15
Argila
Dens
idade
0.0 0.2 0.4
05
15
Argila arenosa
Dens
idade
0.000 0.006 0.012
040
010
00
Argila siltosa
Dens
idade
0.000 0.002 0.004
010
00
Franco argilo−arenosa
Dens
idade
0.02 0.06 0.10 0.14
0.0
1.5
3.0
Franco argiloso
Dens
idade
0.00 0.10 0.20
020
40
Franco argilo−siltoso
Dens
idade
0.0000 0.0010 0.0020
020
0050
00
Franco arenoso
Dens
idade
0.0 0.4 0.8
02
46
Franco
Dens
idade
0.00 0.02 0.04 0.06
010
020
0Areia Franca
Dens
idade
0.000 0.004 0.008
040
010
00
Areia
Dens
idade
0.0000 0.0015
020
0050
00
Figura: Probabilidades a posteriori de classificacao nas diferentes classes de solo.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Inferencia Bayesiana
• θ¯
= (µ1, µ2, σ1, σ2, τ1, τ2, φ, ρ)′ → variaveis aleatorias
• Dist. conjunta = veros. x priori : P(Y¯, θ¯
) = P(Y¯|θ¯
) P(θ¯
).
• Teorema de Bayes ⇒ distribuicao a posteriori de θ¯
:
P(θ¯|Y¯
) =P(θ
¯,Y
¯)
P(Y¯
)=
P(Y¯|θ¯
)P(θ¯
)
P(Y¯
)=
P(Y¯|θ¯
)P(θ¯
)∫P(θ
¯,Y
¯)dθ
¯
∝ P(Y¯|θ¯
)P(θ¯
),
• Resumos estatısticos como esperancas a posteriori de funcoes de θ¯
:
E (f (θ¯
)|Y¯
) =
∫f (θ
¯)P(θ
¯)P(Y
¯|θ¯
)dθ¯∫
P(θ¯
)P(Y¯|θ¯
)dθ¯
∝∫
f (θ¯
)P(θ¯
)P(Y¯|θ¯
)dθ¯.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Inferencia Bayesiana (cont.)
• Resolucao:
• integracao Monte Carlo - cadeias de Markov de Monte Carlo(MCMC):
Gamerman (2006),Lee (2004),Gelman, Carlin, Stern e Rubin (2003),Gill (2002),Gilks, Richardson e Spiegelhalter (1996).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Inferencia Bayesiana (cont.)
• θ¯
= (µ1, µ2, σ1, σ2, τ1, τ2, φ, ρ)′
• θ¯∗ = (η, ν1, ν2, φ, ρ) e (µ
¯, σ2
1) independentes
• Distribuicao a posteriori de θ¯
:
P(µ¯, σ2
1, θ¯∗|Y
¯) ∝ P(Y
¯|µ¯, σ2
1, θ¯∗)P(µ
¯, σ2
1)P(θ¯∗)
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Inferencia Bayesiana (cont.)
Prioris:
• Conjugadas: levam a uma posteriori da mesma famılia dedistribuicoes.
• Casos extremos:
• parametros conhecidos ⇒ distribuicoes degeneradas (V ≡ 0);
• prioris vagas:
• prioris nao informativas (de Jeffrey’s) - P(θ) ∝p
I (θ) ou
P(θ¯
) ∝ |I (θ¯
)|1/2;• flat - P(θ) ∝ 1;
• impropia - P(θ) ∝ 1/σ2.
Ribeiro Jr e Diggle (1999)
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
IB (cont.) - Prioris
Prioris:
• P(µ¯, σ2
1);
• P(µ¯|σ2
1);
• P(η), P(ν1) e P(ν2);
• P(φ);
• P(ρ).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
IB (cont.) - Distribuicoes a Posteriori
•∫θ¯∗
P(µ¯, σ2
1, θ¯∗|Y
¯)dθ
¯∗ ∝
∫θ¯∗
P(Y¯|µ¯, σ2
1, θ¯∗)P(µ
¯, σ2
1)P(θ¯∗)dθ
¯∗
•P(µ
¯, σ2
1|Y¯) ∝ P(Y
¯|µ¯, σ2
1, θ¯∗)
1
σ21
∫θ¯∗
P(θ¯∗)dθ
¯∗.
∝ 1
σ21
P(Y¯|µ¯, σ2
1, θ¯∗)
•[µ¯|Y¯, σ2
1, θ∗] ∼ N
(µ¯
;σ21
(D′V−1D
)−1)µ¯
= (D′V−1D)−1(D′V−1Y¯
)
[σ2
1|Y¯, θ∗]∼χ2
Sinv
(n − nµ
¯; S2)
S2 =
`Y¯−Dµ
¯
´′V−1 Y
¯−Dµ
¯
´n − nµ
¯
.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
IB (cont.) - Passos Para Inferencia Bayesiana
1. Algoritmo Metropolis-Hastings ⇒ matriz de covariancia do modelo;
• θ(t) ⇒ θ(t+1): θ′ de q(·|θ(t)) com probabilidade
α(θ; θ′) = min
{1;
P(Y¯|θ′) P(θ′) q(θ|θ′)
P(Y¯|θ) P(θ) q(θ′|θ)
}
2. Calcular µ¯
e S2 e amostrar σ21 de
[σ2
1|Y¯]∼ χ2
Sinv
(n − nµ
¯; S2)
;
3. Calcular Var(µ¯
):[µ¯|Y¯, σ2
1
]∼ N
(µ¯
;σ21
(D′V−1
Y¯
D)−1
);
4. Amostrar um valor de µ¯
de[µ¯|Y¯, σ2
1
];
5. Repetir tantas vezes quanto o numero de simulacoes;
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
IB (cont.) - Distribuicoes a Posteriori
•∫θ¯∗
P(µ¯, σ2
1, θ¯∗|Y
¯)dθ
¯∗ ∝
∫θ¯∗
P(Y¯|µ¯, σ2
1, θ¯∗)P(µ
¯, σ2
1)P(θ¯∗)dθ
¯∗
•P(µ
¯, σ2
1|Y¯) ∝ P(Y
¯|µ¯, σ2
1, θ¯∗)
1
σ21
∫θ¯∗
P(θ¯∗)dθ
¯∗.
∝ 1
σ21
P(Y¯|µ¯, σ2
1, θ¯∗)
•[µ¯|Y¯, σ2
1, θ∗] ∼ N
(µ¯
;σ21
(D′V−1D
)−1)µ¯
= (D′V−1D)−1(D′V−1Y¯
)
[σ2
1|Y¯, θ∗]∼χ2
Sinv
(n − nµ
¯; S2)
S2=
(Y¯−Dµ
¯
)′V−1
(Y¯−Dµ
¯
)n − nµ
¯
.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
IB (cont.) - Passos Para Inferencia Bayesiana (cont.)
6. Predicao espacial:
6.1 Cokrigagem de Y¯ 0 em x
¯0 = (x¯10, x¯20, ..., x¯n20) com cada conjunto de
parametros simulados:
• µ¯Y
¯ 0|Y¯= µ
¯Y¯ 0
+ ΣY¯ 0Y¯
Σ−1
Y¯Y¯
(Y¯− µ
¯Y¯
)
• ΣY¯ 0|Y¯
= ΣY¯ 0Y¯ 0
− ΣY¯ 0Y¯
Σ−1
Y¯Y¯
ΣY¯Y¯ 0
6.2 Gerar uma amostra de NM ∼ (µ¯Y
¯ 0|Y¯; ΣY
¯ 0|Y¯) para cada conjunto de
parametros simulados.
6.3 Aplicar transformacao AGL.
6.4 Calcular a media das simulacoes para cada componente.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
IB (cont.) - Diagnostico de Convergencia
Metodos
• Autocorrelacoes dos parametros a posteriori, Gill (2002);
• Grafico da trajetoria da cadeia;
• Grafico da densidade estimada do parametro a posteriori ;
• Teste de Geweke: Gill (2002), Gamerman e Lopes (2006),teste de diferenca de medias usando umaaproximacao assintotica p/ o erro padrao dadiferenca. Preocupacao: zG > |2|
• Diagnostico de sequencia multipla de Gelman e Rubin:Gill (2002), Gamerman e Lopes (2006),
Indicador de convergencia - reducao de escala estimado:
√FRE =
√V ar(θ)
VD< 1, 2 ⇒ convergencia.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise Bayesiana de Fracoes Granulometricas de Um Solo
• Prioris:
• P(µ¯, σ2
1) ∝ 1
σ21
;
• P(µ¯|σ2
1) = 1;
• P(η), P(ν1) e P(ν2) → lognormais com mediasln(0, 24), ln(0, 63), ln(0, 59)e desvios padrao iguais a 0, 3
• P(φ) = Gama(66, 1);
• P(ρ) = 1
• no de simulacoes= 12000, burn-in= 1000 e salto= 10.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
Tabela: Estimativas obtidas por inferencia classica com respectivos intervalos de95% de confianca via metodo Delta e esperancas das 1200 simulacoes dadistribuicao a posteriori de θ e intervalos de 95% de credibilidade obtidos porinferencia bayesiana.
Par. Est.Class LI LS Esp.Bayes LI.cred. LS.cred
µ1 -0,759 -1,20 -0,32 -0,764 -1,20 -0,33µ2 -0,794 -1,02 -0,57 -0,794 -0,94 -0,67σ1 0,450 0,33 0,57 0,442 0,34 0,56σ2 0,115 0,06 0,17 0,112 0,06 0,18τ1 0,287 0,24 0,33 0,287 0,22 0,36τ2 0,266 0,24 0,30 0,265 0,23 0,31φ 66,908 24,35 109,46 65,727 51,53 84,46ρ 0,954 0,89 1,02 0,931 0,83 0,99
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Analise de Fracoes Granulometricas de Um Solo
0 50 100 150 200
050
100
150
200 0.15 0.2 0.25 0.3 0.35
(A)Areia/QG
0 50 100 150 200
050
100
150
200 0.2150.220.2250.230.235
(B)Silte/QG
0 50 100 150 200
050
100
150
200 0.45 0.5 0.55 0.6
(C)Argila/QG
0 50 100 150 200
050
100
150
200 0.15 0.2 0.25 0.3 0.35
(D)Areia/Sim
0 50 100 150 200
050
100
150
200 0.2150.220.2250.230.2350.24
(E)Silte/Sim
0 50 100 150 200
050
100
150
200 0.45 0.5 0.55 0.6
(F)Argila/Sim
0 50 100 150 200
050
100
150
200 0.15 0.2 0.25 0.3 0.35
(G)Areia/IB
0 50 100 150 200
050
100
150
200 0.2150.220.2250.230.2350.24
(H)Silte/IB
0 50 100 150 2000
5010
015
020
0 0.45 0.5 0.55 0.6
(I)Argila/IB
Figura: Mapas das fracoes de areia, silte e argila obtidos por quadraturagaussiana (GH), por simulacao (Sim) e por inferencia bayesiana (IB).
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Conclusao
• Modelo captura variacoes espaciais, induzidas pelas composicoes enao estruturadas;
• Construcao de mapas de areia, silte e argila garantindo que as fracoessomem 1, nos pontos observados e preditos;
• Metodologia baseada em verossimilhanca e declaracao explıcita domodelo permite fazer inferencias sobre parametros pelo metodoclassico e bayesiano considerando nas predicoes a incerteza associadaa estimacao dos parametros;
• Transformacao dos valores preditos para o simplex S3 por quadraturade Gauss-Hermite de ordem igual a 7 nao diferiram dos obtidos comordem 20.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Sugestoes de Trabalhos Futuros
1. Extensoes do presente trabalho: covariaveis, qualidade do modelo,zeros, procedimentos computacionais;
2. Extensoes para outros modelos: Schmidt e Sanso (2006), pacotespBayes;
3. Aplicacoes em outras areas: proporcoes de gases que formamefeito estufa, diversidade e riqueza de especies;
4. Extensoes gerais de estatıstica espacial: modelos naoestacionarios, modelos composicionais espaco-temporais.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Bibliografia
• AITCHISON, J., The statistical analysis of compositional data, New Jersey: TheBlackburn Press, 1986.
• DIGGLE, P.J.; RIBEIRO JR, P.J., Model-based geostatistics, USA: Springer Seriesin Statistics, 2007.
• GONCALVES, A.C.A., Variabilidade espacial de propriedades fısicas do solo parafins de manejo da irrigacao. 1997. 119p. Tese (Doutorado em Agronomia) -ESALQ-USP, Sao Paulo, Piracicaba.
• PAWLOWSKY-GLAHN, V.; OLEA, R.A., Geostatistical analysis of compositionaldata, New York: Oxford University Press, Inc., 2004.
• SCHMIDT, A.M.; GELFAND, A.E., A bayesian coregionalization approach formultivariate pollutant data. Journal of Geophysical Research, v. 108, p.10-1-18-8, 2003.
• SCHMIDT, A.M.; SANSO, B., Modelagem bayesiana da estrutura de covarianciade processos espaciais e espaco temporais, In: 17 SINAPE e ABE, Caxambu:Associacao Brasileira de Estatıstica, 2006, Minicurso.
• TJELMELAND, H.; LUND, K.V., Bayesian modelling of spatial compositionaldata. Journal of Applied Statistics, v. 30, n. 1, p. 87–100, 2003.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
OBRIGADA PELA ATENCAO!
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR
Agradecimentos
DES - Departamento de Estatıstica, UEM.
PPGMNE - Programa de Pos-Graduacao em
Metodos Numericos em Engenharia, UFPR.
LEG - Laboratorio de Estatıstica e Geoinformacao, UFPR.
CNPQ - Conselho Nacional de Desenvolvimento Cientıfico e
Tecnologico.
FINEP projeto CT-INFRA/UFPR.
Ana Beatriz Tozzo Martins - Orientador: Prof. PhD. Paulo Justiniano Ribeiro Jr PPGMNE - UFPR