camilo daleles rennó [email protected] camilo/estatistica/ estatística: aplicação ao...

18
Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/ estatistica/ Estatística: Aplicação ao Sensoriamento Estatística: Aplicação ao Sensoriamento Remoto Remoto SER 202 - ANO 2015 SER 202 - ANO 2015 Simulação Estocástica Simulação Estocástica

Upload: joao-batista-prada-affonso

Post on 07-Apr-2016

226 views

Category:

Documents


0 download

TRANSCRIPT

Camilo Daleles Rennó[email protected]

http://www.dpi.inpe.br/~camilo/estatistica/

Estatística: Aplicação ao Sensoriamento RemotoEstatística: Aplicação ao Sensoriamento Remoto

SER 202 - ANO 2015SER 202 - ANO 2015

Simulação EstocásticaSimulação Estocástica

SimulaçãoSimulaçãoO que é Simulação?é um experimento realizado a partir de modelos (reais ou virtuais)Pode ser:determinística: as entradas do modelo são fixas e para uma determinada

combinação de valores de entrada o resultado final é sempre o mesmoestocástica (ou probabilística): o modelo e/ou as entradas incorporam variações

aleatórias de modo que os resultados são diferentes a cada simulação

Para que fazer Simulação?avaliar propagação de incertezas (quando a solução analítica é inviável)avaliar cenários futuros (resultados possíveis)testar a sensibilidade de parâmetros de um modeloestimar pontualmente ou por intervalo um determinado resultado de um modelotestar a significância de um resultado num teste de hipótese

MODELOX1

X2...Xn

Y

entrada fixa + modelo determinístico

MODELOX1

X2...Xn

Y

entrada fixa + modelo estocástico

MODELOY

X1

X2

Xn

entrada estocástica + modelo determinístico

Simulação de Monte CarloSimulação de Monte Carlo

É um método que avalia um modelo determinístico através da aleatorização das entradas deste modelo.

É particularmente útil quando o modelo é complexo, não-linear, ou quando envolve muitos parâmetros de entrada (com diferentes graus de incerteza), o que dificultaria uma solução analítica.

Através de um grande número de repetições (acima de 1000), garante-se que todas as combinações de entradas possam ser avaliadas.

O termo Monte Carlo foi dado em homenagem a roleta, jogo muito popular de Monte Carlo, Mônaco.

1

2

3

45

0X ~ Binomial (n = 5; p = 0,4)

x P(X = x)0 7,78%1 25,92%2 34,56%3 23,04%4 7,68%5 1,02%

Geração de Números AleatóriosGeração de Números Aleatórios

Originalmente os números aleatórios eram gerados usando dados, roletas, tabelas, etc.

Atualmente os computadores são usados para gerar números chamados pseudo-aleatórios, que constituem uma sequencia de valores que, embora sejam gerados de forma determinística, simulam variáveis aleatórias uniformes [0,1] independentes.

Qualquer variável aleatória pode ser simulada a partir de uma variável aleatória uniforme [0,1] desde que se conheça a função de distribuição F(x) = P(X x).X ~ Binomial (n = 5; p = 0,4)x P(X = x) P(X x)0 7,78% 7,78%1 25,92% 33,70%2 34,56% 68,26%3 23,04% 91,30%4 7,68% 98,98%5 1,02% 100,00%

U = 0,4367X = 2

0 1 2 3 4 5

1,0

0,8

0,6

0,4

0,2

0,0

P(X

x

)

X

u(0,1)0,41380,91550,62180,38480,10580,27630,38550,8036

u(0,1) Y ~N(0,1)0,4138 -0,21770,9155 1,37530,6218 0,31010,3848 -0,29290,1058 -1,24920,2763 -0,59380,3855 -0,29100,8036 0,8546

u(0,1) Y ~N(0,1) X ~N(10,4)0,4138 -0,2177 9,56450,9155 1,3753 12,75050,6218 0,3101 10,62020,3848 -0,2929 9,41420,1058 -1,2492 7,50170,2763 -0,5938 8,81240,3855 -0,2910 9,41800,8036 0,8546 11,7092

Geração de Números AleatóriosGeração de Números Aleatórios

Originalmente os números aleatórios eram gerados usando dados, roletas, tabelas, etc.

Atualmente os computadores são usados para gerar números chamados pseudo-aleatórios, que constituem uma sequencia de valores que, embora sejam gerados de forma determinística, simulam variáveis aleatórias uniformes [0,1] independentes.

Qualquer variável aleatória pode ser simulada a partir de uma variável aleatória uniforme [0,1] desde que se conheça a função de distribuição F(x) = P(X x).Sorteio de 8 valores X ~ Normal ( = 10; 2 =

4)

10 ~ (0,1)2

XY N

2 10X Y 0,25

0,0

0,5

0,75

1,0

0 2 4-4 -2

P(Y

y

)

Y

Avaliação das SimulaçõesAvaliação das Simulações

• Estimação da Função de Probabilidade através das frequências relativas observadas (variáveis discretas)

• Métricas de tendência central e de dispersão:média, desvio padrão, mediana, quantis, amplitude, mínimo/máximo, etc

• Intervalos de Credibilidadeos limites são definidos, desprezando-se os valores extremos (mesma

proporção para ambos os lados)

• Box-plotmediana, 1o e 3o quartis e valores extremos (outliers)

BoxplotBoxplotÉ uma ótima alternativa para mostrar graficamente a dispersão de

observações de uma amostra e são muito úteis para comparar conjuntos de dados pois causam grande impacto visual e são fáceis de entender.

Há muitas variações de boxplot mas em geral representam:a)medianab)1o e 3o quartisc)mínimos e máximosd)“outliers”

Ex: amostra com 20 valores

0

20

40

60

80

100

120

DIQ (distância interquartil)

1,5*DIQ

1,5*DIQ

1o quartil

3o quartil

mediana

último pontosuperior

último pontoinferior

outliers1,5*DIQ

outliersextremos

BoxplotBoxplot

0

20

40

60

80

100

120

B C DA

a) qual é a distribuição mais simétrica?D

b) qual é a distribuição mais assimétrica?A

c) quais as 2 distribuições que mais se confundem entre si?A e B

d) quais as 2 distribuições que mais se distinguem entre si?B e C

Exemplos de AplicaçõesExemplos de Aplicações

Exemplo 1:estimar função de probabilidade de um experimento complexo (urnas)

Exemplo 2:simular a propagação de incertezas de uma equação não-linear (cond. hidráulica)

Exemplo 3:determinar o valor crítico de um teste estatístico (KS para duas amostras)

(ver Simulacao.xls)

Exemplo 1Exemplo 1I

A B

C

Etapas:I) Das urnas A e B, sorteia-se uma

bola de cada. As duas bolas são colocadas na urna C

Exemplo 1Exemplo 1

II

A B

C

Etapas:I) Das urnas A e B, sorteia-se uma

bola de cada. As duas bolas são colocadas na urna C

II)Da urna C, sorteiam-se duas bolas (sem reposição)

Exemplo 1Exemplo 1

bolas de mesma

cor?Sim Não

III

A B

C

Etapas:I) Das urnas A e B, sorteia-se uma

bola de cada. As duas bolas são colocadas na urna C

II)Da urna C, sorteiam-se duas bolas (sem reposição)

III)Se as bolas forem da mesma cor, ambas são colocadas na urna A. Caso contrário, ambas são colocadas na urna B

Exemplo 1Exemplo 1IV

Etapas:I) Das urnas A e B, sorteia-se uma

bola de cada. As duas bolas são colocadas na urna C

II)Da urna C, sorteiam-se duas bolas (sem reposição)

III)Se as bolas forem da mesma cor, ambas são colocadas na urna A. Caso contrário, ambas são colocadas na urna B

IV)Escolhe-se aleatoriamente a urna A ou B e dela retiram-se 5 bolas (sem reposição)

A B

CDefinindo-se X como o número de

bolas azuis nas 5 observações, qual a distribuição dos valores de X?

X FR0 8,62%1 45,73%2 39,92%3 5,03%4 0,70%5 0,00%

Exemplo 2Exemplo 2

Ks é a condutividade hidráulica saturada é a umidade volumétrica do solos é a umidade volumétrica do solo saturado

Cálculo da Condutividade Hidráulica do Solo (K)

A condutividade hidráulica K expressa a facilidade com que um fluido (água) é transportado através de um meio poroso (solo) e combina as propriedades do fluido e do meio

Exemplo 2Exemplo 2

2 3b

ss

K K

Cálculo da Condutividade Hidráulica do Solo (K)

Campbell (1974) formulou uma relação bastante prática para o cálculo da condutividade hidráulica:

Campbell, G.S. A simple method for determining unsaturated conductivity from moisture retention data. Soil Sci., 117(6):311-314, 1974.Clapp, R.B.; Hornberger, G.M. Empirical equations for some soil hydraulic properties. Water Resour. Res., 14(4):601-604, 1978.

Exemplo 2Exemplo 2

2 3b

ss

K K

Ks é a condutividade hidráulica saturada (mm/dia) é a umidade volumétrica do solo (cm3/cm3)s é a umidade volumétrica do solo saturado (cm3/cm3)b0 e b1 são coeficientes empíricosA é o teor de argila (g/g)

Cálculo da Condutividade Hidráulica do Solo (K)

0 1b b b A

20

21

~ ( 3,55; 0,0812)

~ ( 13,46; 0,7452)~ (0,1;0,6)/ ~ (0;1)

~ (100;500)S

s

b N

b NA U

UK U

Rawls, W.J.; Brakensiek, D.L.; Saxton, K.E. (1982). Estimation of soil water properties. Transaction of the ASAE, 25(5):1316-1320.

Rawl

s et

al.

(198

2)

Exemplo 2Exemplo 2

2 3b

ss

K K

Ks é a condutividade hidráulica saturada (mm/dia) é a umidade volumétrica do solo (cm3/cm3)s é a umidade volumétrica do solo saturado (cm3/cm3)b0 e b1 são coeficientes empíricosA é o teor de argila (g/g)

Cálculo da Condutividade Hidráulica do Solo (K)

0 1b b b A

20

21

~ ( 3,55; 0,0812)

~ ( 13,46; 0,7452)~ (0,1;0,6)/ ~ (0;1)

~ (100;500)S

s

b N

b NA U

UK U

Limite de Credibilidade de 95%

P(5,52.10-31 < K < 169,25) = 0,95

Obs: foram desconsideradas as correlações existentes entre as variáveis simuladas

Exemplo 3Exemplo 3

Região A Região B81 5678 5561 7689 5469 8358 9764 8584 6689 7883 8088 6156 6987 7195 5575 91

Exemplo: Um pesquisador deseja saber se duas regiões de uma mesma imagem apresentam a mesma distribuição de valores (desconhecida). Para testar esta hipótese, amostrou-se 15 pontos independentes de cada região. Os valores observados são apresentados na tabela abaixo. O que se conclui a partir destes valores?Valor FRAA FRAB |Dif|

54 0 1/15 1/1555 0 3/15 3/1556 1/15 4/15 3/1558 2/15 4/15 2/1561 3/15 5/15 2/1564 4/15 5/15 1/1566 4/15 6/15 2/1569 5/15 7/15 2/1571 5/15 8/15 3/1575 6/15 8/15 2/1576 6/15 9/15 3/1578 7/15 10/15 3/1580 7/15 11/15 4/1581 8/15 11/15 3/1583 9/15 12/15 3/1584 10/15 12/15 2/1585 10/15 13/15 3/1587 11/15 13/15 2/1588 12/15 13/15 1/1589 14/15 13/15 1/1591 14/15 14/15 095 15/15 14/15 1/1597 15/15 15/15 0

Dobs = 4/15

KDobs = 4H0: As duas amostras provêm da

mesma populaçãoH1: As duas amostras provêm de

populações diferentes (bilateral)

Conclusão: aceita-se H0, ou seja, as duas amostras provêem da mesma população, adotando-se 5% de significância

KDcrít 5% = 8 (obtido pela simulação)

Exem

plo

Slid

e 31

(Aul

a14)