alguns factos pouco conhecidos sobre a estimação do desvio ......conclusões recomenda-se a...

20
Ordem dos Engenheiros Colégio de Engenharia Geográfica Alguns factos pouco conhecidos sobre a estimação do desvio padrão João M. M. Casaca Membro Conselheiro

Upload: others

Post on 06-Aug-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Ordem dos Engenheiros

Colégio de Engenharia Geográfica

Alguns factos pouco conhecidos sobre a

estimação do desvio padrão

João M. M. Casaca

Membro Conselheiro

Page 2: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Resumo

� Cenários

� A distribuição do desvio padrão

� Gráficos da FDP e simulação de amostras

� Fórmula de Bayes-Laplace

� A abordagem não informativa de Laplace

� A distribuição posterior do desvio padrão

� Gráficos da FDP posterior

� Exemplo: a base de teste de DEM do LNEC

� Total: 20 “slides”

Page 3: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Cenários considerados

C1 (AAN)

� Amostra aleatória normal (iid):

� (X1,…,Xn) →→→→ Xi ∈∈∈∈ N(µµµµ,σσσσ2)

� σσσσ – desvio padrão da população

� Modelo de Gauss-Markov:

� B(m,n)ββββ(n,1) = y(m,1) + εεεε(m,1)

C2 (MGM)

� B(m,n)ββββ(n,1) = y(m,1) + εεεε(m,1)

� εεεε ∈∈∈∈ N(µµµµ(m,1), σσσσ2ΣΣΣΣ(m,m))

� σσσσ – desvio padrão do modelo

� B – matriz do modelo

� ββββ – vector dos coeficientes do modelo

� y – vector das grandezas observáveis

� εεεε – vector ruído

Page 4: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Amostra aleatória normal iid

� FDP conjunta e verosimilhança (likelihood) da amostra:

σσσσ

µµµµ−−−−++++−−−−

σσσσππππ====

σσσσµµµµ

σσσσµµµµ

σσσσµµµµ

2

22

22

22

2n1

2

)x(nnsexp

2

1

)s,x|,(L

),|s,x(f

),|x,,x(f K

� Máximo da verosimilhança: � Correcção de Bessel:

∑∑∑∑

∑∑∑∑

====

====

−−−−====

====

n1i

2i

2

n1i i

)xx(n

1s)ii

xn

1x)i

σσσσ====

====−−−−

σσσσ−−−−

====

22CB

2

22

ss1n

nE

n

1n)s(E

Page 5: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Modelo linear de Gauss-Markov

� FDP e verosimilhança do vector das observações:

� Máximo da verosimilhança:

σσσσ

ββββ−−−−ΣΣΣΣββββ−−−−−−−−

σσσσππππ====

σσσσββββ

σσσσββββ −−−−

2

1T

mm2

2

2

)By()By(exp

)2(

1

)y,B|,(L

),,B|y(f

1T11T −−−−−−−−−−−−

� Correcção de Bessel:

vvm

1)By()By(

m

1s)ii

;yB)BB()i

1T1T2

1T11T

−−−−−−−−

−−−−−−−−−−−−

ΣΣΣΣ====ββββ−−−−ΣΣΣΣββββ−−−−====

ΣΣΣΣΣΣΣΣ====ββββ

22CB

222 ssnm

mE

m

nm)s(E σσσσ====

====−−−−

⇒⇒⇒⇒σσσσ

−−−−====

Page 6: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A distribuição do desvio padrão empírico

� A FDP do DP empírico (s) condicionada pelo DP da população (σσσσ)e pelo número de graus de liberdade (νννν):

ωωωω−−−−

ννννΓΓΓΓ

ωωωω====ννννσσσσ

−−−−νννν

−−−−νννννννν

2

sexp

)2/(2

s),|s(f

2

1)2/(

12/

====ωωωω ====ωωωωmn

∫∫∫∫S s f(s|σσσσ)ds

� Moda e valor esperado:

−−−−====ννννσσσσ

====ωωωω

−−−−====ννννσσσσ

====ωωωω

nm

m

MGM)ii

1n

n

AAN)i 22

)2/(

)2/)1((2)s(E)ii

1)s(M)i

ννννΓΓΓΓ++++ννννΓΓΓΓ

××××ωωωω

====ωωωω−−−−νννν

====

Page 7: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A correcção de excentricidade (CE)

� O desvio padrão empírico (s) deve sofrer uma correc-ção de excentricidade:

−−−−ΓΓΓΓ

−−−−−−−−ΓΓΓΓ××××====××××====

ΓΓΓΓ

−−−−ΓΓΓΓ××××====××××====

)MGM()2/)nm((2

)2/)1nm((msCEss

)AAN()2/n(2

)2/)1n((nsCEss

CE

CE

n CE √√√√CB n CE √√√√CB

2 1,783 1,414 7 1,126 1,080

3 1,382 1,225 8 1,108 1,069

4 1,253 1,155 9 1,094 1,061

5 1,189 1,118 10 1,084 1,054

6 1,151 1,095 50 1,015 1,010

−−−−ΓΓΓΓ )2/)nm((2

Page 8: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

FDP do DP da amostra (s)

(n = 5, σσσσ = 2) →→→→ (M = 1,55, E = 1,68, DP = 0,61)

Page 9: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

17

19

21

23

25

27

29

Amostra pseudo-aleatória de desvios padrão empíricos

30 DPE (n = 5, σσσσ = 2, MODA = 1,55, média da amostra = 1,53)

Desta não estava eu à

espera!

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0

1

3

5

7

9

11

13

15

17espera!

Page 10: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

FDP do DP da amostra (s)

(n = 30, σσσσ = 2) → → → → (M = 1,93, E = 1,95, DP = 0,26)

Page 11: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

12

13

14

15

16

17

18

19

20

Amostra pseudo-aleatória de desvios padrão empíricos

20 DPE (n = 30, σσσσ = 2, MODA = 1,93, média da amostra = 1,93)

0,0 0,5 1,0 1,5 2,0 2,5

1

2

3

4

5

6

7

8

9

10

11

12

Assim está melhor!

Page 12: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A evolução do pitecantropo e o recurso aos métodos Bayesianos

Page 13: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A fórmula de Bayes-Laplace

� Relaciona a FDP posterior com a FDP anterior (prior) do parâme-tro θθθθ ∈∈∈∈ ΘΘΘΘ (espaço de parâmetros).

)(h)x|(Ld)(h)x|(L

)(h)x|(L)x|(p

tetancons

θθθθθθθθ∝∝∝∝θθθθθθθθθθθθ

θθθθθθθθ====θθθθ∫∫∫∫ΘΘΘΘ

444 3444 21

f(x|θθθθ) FDP da amostra (x) condicionada por θθθθ

L(θθθθ|x) ↔↔↔↔ f(x|θθθθ) Verosimilhança do parâmetro θθθθ, dada a amostra (x)

h(θθθθ) FDP anterior do parâmetro θθθθ

p(θθθθ|x) FDP posterior de θθθθ, dada a amostra (x)

tetancons

Page 14: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A FDP anterior de Laplace

� Quando não dispunha de informação anterior sobre o parâmetro,Laplace tomava h(θθθθ) = constante e transformava a verosimilhançana FDP posterior do parâmetro.

)x|(Ld)x|(L

)x|(L)x|(p θθθθ∝∝∝∝

θθθθθθθθθθθθ

====θθθθ∫∫∫∫ΘΘΘΘ

h(θθθθ) = 1 FDP anterior de Laplace

p(θθθθ|x) FDP posterior de θθθθ (verosimilhança normalizada)

Os máximos da FDP posterior de Laplace são iguais aos máximosda verosimilhança. As regiões de erro são diferentes.

∫∫∫∫ΘΘΘΘ

Page 15: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A distribuição posterior do DP da população

� A FDP posterior de Laplace do DP da população (σσσσ) pode ser ex-pressa na forma:

σσσσ−−−−

σσσσννννΓΓΓΓ====σσσσ

++++ 21a2

a bexp

)2/(

b2)b,a|(p

−−−−νννν

==== −−−−νννν

====2

2a

2

2a

∫∫∫∫ΘΘΘΘ L(θθθθ|x)dθθθθ

� Moda e valor esperado:

====

====

====

====

2

msb

2a

MGM)ii

2

nsb

2a

AAN)i22

)a(

)2/)1a2((b)(E)ii

1a2

b2)(M)i

ΓΓΓΓ−−−−ΓΓΓΓ

××××====σσσσ++++

====σσσσ

Page 16: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

A moda da FDP posterior de Laplace

� Moda da FDP do DP empírico (s):

444 3444 2144 344 21

MGMAAN

m

1nm)s(M)ii;

n

2n)s(M)i

−−−−−−−−σσσσ====

−−−−σσσσ====

(∂∂∂∂ln(L(θθθθ))/∂θ∂θ∂θ∂θ) = 0

� Moda da FDP posterior de Laplace do DP da população (σσσσ):

444 3444 2144 344 21

MGMAAN

1nm

ms)(M)ii;

2n

ns)(M)i

−−−−−−−−====σσσσ

−−−−====σσσσ

Page 17: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

FDP posterior de Laplace do DP da população (σσσσ)

(n = 5, s = 1,53) →→→→ (M = 1,96, E = 3,98, DP = 3,60)

Page 18: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

FDP posterior de Laplace do DP da população (σσσσ)

(n = 30, s = 1,89) →→→→ (M = 1,96, E = 2,05, DP = 0,29)

Page 19: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Exemplo: A base para teste de DEM do LNEC

� Cinco PE com centragem forçada e boa funda-ção a distâncias entre 25 m e 275 m.� Ensaios de um DEM Leica TC2003 (norma ISO).

DP (s)

2010 0,34 mm2011 0,15 mm2012 0,41 mm2014 0,22 mm2014 0,27 mm2014 0,14 mm

Moda da posterior Moda da posterior conjunta de Laplace

M(σσσσ) = 0,43 mm

)1nm(k

smk

1i2i

−−−−−−−−

∑∑∑∑ ====

Page 20: Alguns factos pouco conhecidos sobre a estimação do desvio ......Conclusões Recomenda-se a utilização da FDP posterior de Laplace para estimar o desvio padrão da população

Conclusões

� Recomenda-se a utilização da FDP posterior de Laplace paraestimar o desvio padrão da população (σσσσ) a partir do desvio padrãoempírico (s).

� No caso de amostras de tamanho médio ou grande, ou de mode-los com um número médio ou grande de graus de liberdade, aestimação convencional é satisfatória embora tenda a subesti-mar o desvio padrão da população.

� No caso de amostras de tamanho pequeno, ou de modelos com� No caso de amostras de tamanho pequeno, ou de modelos compoucos graus de liberdade, é importante estimar o desvio pa-drão da população com a FDP posterior de Laplace.

o Casaca, J. (2015). A Distribuição do Desvio Padrão Empírico.LNEC, Série ICT, INCB 21.

o Casaca, J. (2012). Análise de Regressão Multivariada: Uma Pers-pectiva Bayesiana. LNEC, Série ICT, INCB 18.

o Casaca, J. (2011). Introdução à Análise Bayesiana. LNEC, SérieICT, INCB 16.