alguns factos pouco conhecidos sobre a estimação do desvio ... · exemplo: a base de teste de dem...

20
Ordem dos Engenheiros Colégio de Engenharia Geográfica Alguns factos pouco conhecidos sobre a estimação do desvio padrão João M. M. Casaca Membro Conselheiro

Upload: tranngoc

Post on 09-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Ordem dos Engenheiros

Colégio de Engenharia Geográfica

Alguns factos pouco conhecidos sobre a

estimação do desvio padrão

João M. M. Casaca

Membro Conselheiro

Resumo

� Cenários

� A distribuição do desvio padrão

� Gráficos da FDP e simulação de amostras

� Fórmula de Bayes-Laplace

� A abordagem não informativa de Laplace

� A distribuição posterior do desvio padrão

� Gráficos da FDP posterior

� Exemplo: a base de teste de DEM do LNEC

� Total: 20 “slides”

Cenários considerados

C1 (AAN)

� Amostra aleatória normal (iid):

� (X1,…,Xn) →→→→ Xi ∈∈∈∈ N(µµµµ,σσσσ2)

� σσσσ – desvio padrão da população

� Modelo de Gauss-Markov:

� B(m,n)ββββ(n,1) = y(m,1) + εεεε(m,1)

C2 (MGM)

� B(m,n)ββββ(n,1) = y(m,1) + εεεε(m,1)

� εεεε ∈∈∈∈ N(µµµµ(m,1), σσσσ2ΣΣΣΣ(m,m))

� σσσσ – desvio padrão do modelo

� B – matriz do modelo

� ββββ – vector dos coeficientes do modelo

� y – vector das grandezas observáveis

� εεεε – vector ruído

Amostra aleatória normal iid

� FDP conjunta e verosimilhança (likelihood) da amostra:

σσσσ

µµµµ−−−−++++−−−−

σσσσππππ====

σσσσµµµµ

σσσσµµµµ

σσσσµµµµ

2

22

22

22

2n1

2

)x(nnsexp

2

1

)s,x|,(L

),|s,x(f

),|x,,x(f K

� Máximo da verosimilhança: � Correcção de Bessel:

∑∑∑∑

∑∑∑∑

====

====

−−−−====

====

n1i

2i

2

n1i i

)xx(n

1s)ii

xn

1x)i

σσσσ====

====−−−−

σσσσ−−−−

====

22CB

2

22

ss1n

nE

n

1n)s(E

Modelo linear de Gauss-Markov

� FDP e verosimilhança do vector das observações:

� Máximo da verosimilhança:

σσσσ

ββββ−−−−ΣΣΣΣββββ−−−−−−−−

σσσσππππ====

σσσσββββ

σσσσββββ −−−−

2

1T

mm2

2

2

)By()By(exp

)2(

1

)y,B|,(L

),,B|y(f

1T11T −−−−−−−−−−−−

� Correcção de Bessel:

vvm

1)By()By(

m

1s)ii

;yB)BB()i

1T1T2

1T11T

−−−−−−−−

−−−−−−−−−−−−

ΣΣΣΣ====ββββ−−−−ΣΣΣΣββββ−−−−====

ΣΣΣΣΣΣΣΣ====ββββ

22CB

222 ssnm

mE

m

nm)s(E σσσσ====

====−−−−

⇒⇒⇒⇒σσσσ

−−−−====

A distribuição do desvio padrão empírico

� A FDP do DP empírico (s) condicionada pelo DP da população (σσσσ)e pelo número de graus de liberdade (νννν):

ωωωω−−−−

ννννΓΓΓΓ

ωωωω====ννννσσσσ

−−−−νννν

−−−−νννννννν

2

sexp

)2/(2

s),|s(f

2

1)2/(

12/

====ωωωω ====ωωωωmn

∫∫∫∫S s f(s|σσσσ)ds

� Moda e valor esperado:

−−−−====ννννσσσσ

====ωωωω

−−−−====ννννσσσσ

====ωωωω

nm

m

MGM)ii

1n

n

AAN)i 22

)2/(

)2/)1((2)s(E)ii

1)s(M)i

ννννΓΓΓΓ++++ννννΓΓΓΓ

××××ωωωω

====ωωωω−−−−νννν

====

A correcção de excentricidade (CE)

� O desvio padrão empírico (s) deve sofrer uma correc-ção de excentricidade:

−−−−ΓΓΓΓ

−−−−−−−−ΓΓΓΓ××××====××××====

ΓΓΓΓ

−−−−ΓΓΓΓ××××====××××====

)MGM()2/)nm((2

)2/)1nm((msCEss

)AAN()2/n(2

)2/)1n((nsCEss

CE

CE

n CE √√√√CB n CE √√√√CB

2 1,783 1,414 7 1,126 1,080

3 1,382 1,225 8 1,108 1,069

4 1,253 1,155 9 1,094 1,061

5 1,189 1,118 10 1,084 1,054

6 1,151 1,095 50 1,015 1,010

−−−−ΓΓΓΓ )2/)nm((2

FDP do DP da amostra (s)

(n = 5, σσσσ = 2) →→→→ (M = 1,55, E = 1,68, DP = 0,61)

17

19

21

23

25

27

29

Amostra pseudo-aleatória de desvios padrão empíricos

30 DPE (n = 5, σσσσ = 2, MODA = 1,55, média da amostra = 1,53)

Desta não estava eu à

espera!

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0

1

3

5

7

9

11

13

15

17espera!

FDP do DP da amostra (s)

(n = 30, σσσσ = 2) → → → → (M = 1,93, E = 1,95, DP = 0,26)

12

13

14

15

16

17

18

19

20

Amostra pseudo-aleatória de desvios padrão empíricos

20 DPE (n = 30, σσσσ = 2, MODA = 1,93, média da amostra = 1,93)

0,0 0,5 1,0 1,5 2,0 2,5

1

2

3

4

5

6

7

8

9

10

11

12

Assim está melhor!

A evolução do pitecantropo e o recurso aos métodos Bayesianos

A fórmula de Bayes-Laplace

� Relaciona a FDP posterior com a FDP anterior (prior) do parâme-tro θθθθ ∈∈∈∈ ΘΘΘΘ (espaço de parâmetros).

)(h)x|(Ld)(h)x|(L

)(h)x|(L)x|(p

tetancons

θθθθθθθθ∝∝∝∝θθθθθθθθθθθθ

θθθθθθθθ====θθθθ∫∫∫∫ΘΘΘΘ

444 3444 21

f(x|θθθθ) FDP da amostra (x) condicionada por θθθθ

L(θθθθ|x) ↔↔↔↔ f(x|θθθθ) Verosimilhança do parâmetro θθθθ, dada a amostra (x)

h(θθθθ) FDP anterior do parâmetro θθθθ

p(θθθθ|x) FDP posterior de θθθθ, dada a amostra (x)

tetancons

A FDP anterior de Laplace

� Quando não dispunha de informação anterior sobre o parâmetro,Laplace tomava h(θθθθ) = constante e transformava a verosimilhançana FDP posterior do parâmetro.

)x|(Ld)x|(L

)x|(L)x|(p θθθθ∝∝∝∝

θθθθθθθθθθθθ

====θθθθ∫∫∫∫ΘΘΘΘ

h(θθθθ) = 1 FDP anterior de Laplace

p(θθθθ|x) FDP posterior de θθθθ (verosimilhança normalizada)

Os máximos da FDP posterior de Laplace são iguais aos máximosda verosimilhança. As regiões de erro são diferentes.

∫∫∫∫ΘΘΘΘ

A distribuição posterior do DP da população

� A FDP posterior de Laplace do DP da população (σσσσ) pode ser ex-pressa na forma:

σσσσ−−−−

σσσσννννΓΓΓΓ====σσσσ

++++ 21a2

a bexp

)2/(

b2)b,a|(p

−−−−νννν

==== −−−−νννν

====2

2a

2

2a

∫∫∫∫ΘΘΘΘ L(θθθθ|x)dθθθθ

� Moda e valor esperado:

====

====

====

====

2

msb

2a

MGM)ii

2

nsb

2a

AAN)i22

)a(

)2/)1a2((b)(E)ii

1a2

b2)(M)i

ΓΓΓΓ−−−−ΓΓΓΓ

××××====σσσσ++++

====σσσσ

A moda da FDP posterior de Laplace

� Moda da FDP do DP empírico (s):

444 3444 2144 344 21

MGMAAN

m

1nm)s(M)ii;

n

2n)s(M)i

−−−−−−−−σσσσ====

−−−−σσσσ====

(∂∂∂∂ln(L(θθθθ))/∂θ∂θ∂θ∂θ) = 0

� Moda da FDP posterior de Laplace do DP da população (σσσσ):

444 3444 2144 344 21

MGMAAN

1nm

ms)(M)ii;

2n

ns)(M)i

−−−−−−−−====σσσσ

−−−−====σσσσ

FDP posterior de Laplace do DP da população (σσσσ)

(n = 5, s = 1,53) →→→→ (M = 1,96, E = 3,98, DP = 3,60)

FDP posterior de Laplace do DP da população (σσσσ)

(n = 30, s = 1,89) →→→→ (M = 1,96, E = 2,05, DP = 0,29)

Exemplo: A base para teste de DEM do LNEC

� Cinco PE com centragem forçada e boa funda-ção a distâncias entre 25 m e 275 m.� Ensaios de um DEM Leica TC2003 (norma ISO).

DP (s)

2010 0,34 mm2011 0,15 mm2012 0,41 mm2014 0,22 mm2014 0,27 mm2014 0,14 mm

Moda da posterior Moda da posterior conjunta de Laplace

M(σσσσ) = 0,43 mm

)1nm(k

smk

1i2i

−−−−−−−−

∑∑∑∑ ====

Conclusões

� Recomenda-se a utilização da FDP posterior de Laplace paraestimar o desvio padrão da população (σσσσ) a partir do desvio padrãoempírico (s).

� No caso de amostras de tamanho médio ou grande, ou de mode-los com um número médio ou grande de graus de liberdade, aestimação convencional é satisfatória embora tenda a subesti-mar o desvio padrão da população.

� No caso de amostras de tamanho pequeno, ou de modelos com� No caso de amostras de tamanho pequeno, ou de modelos compoucos graus de liberdade, é importante estimar o desvio pa-drão da população com a FDP posterior de Laplace.

o Casaca, J. (2015). A Distribuição do Desvio Padrão Empírico.LNEC, Série ICT, INCB 21.

o Casaca, J. (2012). Análise de Regressão Multivariada: Uma Pers-pectiva Bayesiana. LNEC, Série ICT, INCB 18.

o Casaca, J. (2011). Introdução à Análise Bayesiana. LNEC, SérieICT, INCB 16.