aula 10 fundamentos téoricos da inferência por...

31
LCF5877 / BIE8751 João L. F. Batista & Paulo Inácio Prado Aula 10 Fundamentos Téoricos da Inferência por Verossimilhança

Upload: others

Post on 21-Nov-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Aula 10

Fundamentos Téoricos da Inferência por

Verossimilhança

Page 2: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Conceitos● Lei da Verossimilhança● Princípio da verossimilhança● Abordagem baseada em valor de

evidência● Comparação com abordagem

frequentista● Teorema de Bayes● Comparação com abordagem bayesiana

Page 3: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Testes de Hipótese

Sir Karl Popper (1902-1994)

● Basta uma observação proibida por uma hipótese para refutá-la

● Nos aproximamos da verdade pela rejeição das hipóteses falsas.

● Portanto nossa preferência por certas hipóteses tem validade lógica.

Page 4: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Resultado Negativo Também é Resultado?

ww

w.d

espa

ir.co

m

Page 5: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Como o conhecimento progride na prática?

John R. Platt1918-1992

Thomas C. Chamberlin1843-1928

The method of multiple working hypotheses. Science, 15:92–96 (1890)

Strong Inference: Certain systematic methods of scientific thinking may produce much more rapid progress than others. Science 146:347-353 (1964)

Page 6: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lei da Verossimilhança(Um Enunciado informal)

Dado que:● Há mais de uma explicação para um conjunto de

dados.● Cada hipótese atribui uma probabilidade diferente

aos dados.

Então:

A EXPLICAÇÃO MAIS PLAUSÍVEL SERÁ AQUELA QUE ATRIBUIR A MAIOR PROBABILIDADE AOS DADOS.

Page 7: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lei da Verossimilhança

Dada uma variável aleatória X, cujo comportamento pode ser descrito por duas hipóteses, H

1 e H

2 , sendo que:

● A hipótese H1afirma que a observação X=x seria observada com

probabilidade p1(x).

● A hipótese H2 afirma que a observação X=x seria observada com

probabilidade p2(x).

Então:

A observação X=x é uma evidência em favor de H1 vis-a-vis (face-a-face) H

2 se, e

somente se p1(x) > p

2(x)

A força de evidência em favor de H1 vis-a-vis H

2 é dada pela razão de

verossimilhança: p1 x

p2 x

Page 8: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lei da Verossimilhança:A observação governa

● Experimento binomial

● 20 cobaias (tentativas)

● Observação: N de mortos

● Hipóteses:

● H1: p = 0,5

● H2: p = 0,3

Page 9: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Princípio da Verossimilhança

Dado que:

● Uma evidência X=x favorece a hipótese H1 vis a vis a

hipótese H2

● Uma evidência Y=y favorece a hipótese H3 vis a vis a

hipótese H4

● As razões de verossimilhança são iguais:

Então:

As duas observações são equivalentes em termos de evidência.

p1 x

p2 x =

p3 y

p4 y

Page 10: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Dois delineamentos podem gerar a mesma evidência?

Objetivo:

Estimar a eficácia de uma dada droga, em termos de probabilidade de cura.

Controle:

A probabilidade de morte na ausência de tratamento é de 50%.

Laboratório Rico:

Fez o teste em 12 cobaias e contabilizou as mortes

Laboratório Pobre:

Testou uma cobaia por vez, até contabilizar 3 mortes.

Page 11: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lab. 1: Três de Doze Morreram

DADO: De 12 cobaias tratadas 3 morreram.

H1: atribui uma probabilidade de 0,054 a este resultado.

H2: atribui uma probabilidade de 0,258 a este resultado.

Page 12: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lab. 2: Três de Doze Morreram

DADO: a terceira morte ocorreu após 9 curas.

H1: atribui uma probabilidade de 0,013 a este resultado.

H2: atribui uma probabilidade de 0,065 a este resultado.

Page 13: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Razões de Verossimilhança

Laboratório 1:P(H2|3)/P(H1|3) = 0,054 / 0,258 = = 4,8Dado o resultado de 3 mortes em 12 tentativas, H2 é 4,8 vezes mais plausível que H1.

Laboratório 2:P(H2|9)/P(H1|9) = 0,065 / 0,013 = = 4,8Dado o resultado de 9 tentativas até a terceira morte, H2 é 4,8 vezes mais plausível que H1.

As duas observações são equivalentes em termos de evidência.

Q.E.D

Page 14: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Perfis de Verossimilhança

A função de verossimilhança caracteriza toda evidência contida nos dados a respeito de uma hipótese.

Page 15: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lab.1 - Teste de Significância

DADO: três mortes em 12 cobaias.

H0: o tratamento não teve efeito.

TESTE: A probabilidade de que 3 ou menos mortes ocorram caso a hipótese nula esteja correta é de p= 0,073

CONCLUSÃO: não rejeitamos a hipótese nula.

Page 16: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Lab.2 - Teste de Significância

DADO: terceira morte após 9 curas.

H0: o tratamento não teve efeito.

TESTE: A probabilidade de que 9 ou mais curas ocorram caso a hipótese nula esteja correta é de p= 0,033

CONCLUSÃO: rejeitamos a hipótese nula.

Page 17: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Conclusões:Princípio da Verossimilhança

Dado que:

● O valor de evidência de uma observação é sempre relativo às hipóteses comparadas, o que é expresso pela razão de verossimilhança,

● mas que a magnitude desta razão é uma medida absoluta de valor de evidência, independente das hipóteses comparadas, ou dos procedimentos que deram origem aos dados.

Então:

● A evidência contida nos dados a respeito de qualquer hipótese está totalmente caracterizada pela função de verossimilhança.

● Logo, uma vez tomados os dados, o espaço amostral é irrelevante, bem como suas expectativas prévias.

Page 18: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

O Reverendo e seus fiéis

Thomas Bayes1702–1761

Page 19: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Probabilidade Condicional

P A∣B=P A∩B

P B

Qual a probabilidade de um valor maior que 4 se o primeiro lançamento deu 1?

3/356 /35

=0,5

Page 20: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Teorema de Bayes

P A∣B=P A∩B

P BP B∣A=

P A∩BP A

P A∣BP B=P B∣AP A

P A∣B=P B∣AP A

P B

Page 21: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Estatística BayesianaRedefinição do Teorema

P H∣D =P D∣H P H

∑ P D∣H iP H i

H = hipótesesD = dados

Page 22: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Teorema de Bayes Exemplo Clássico

● 1% da população de um país tem uma certa doença

● O teste para a doença produz falsos negativos em 0,1% de suas aplicações

● O teste para a doença produz falsos positivos em 0,5% de suas aplicações

● Uma pessoa tomada ao acaso teve resultado positivo

● Dada esta observação, qual a probabilidade dessa pessoa estar doente?

Page 23: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Teorema de BayesExemplo Clássico

P D∣H 2=0,999

P H 1=0,99

∑ P D∣H iP H i=0,99×0,0010,01×0,999=0,01098

P H 1∣D=0,99×0,001

0,01098=0,0902

P H 2=0,01P D∣H 1=0,001

A pessoa não está doente

A pessoa está doente

A pessoa não está doente, dado um teste positivo

A pessoa está doente, dado um teste positivo

Page 24: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

O argumento Bayesiano do Baralho

Se uma carta tomada ao acaso de um baralho é um ás de espadas, isto indica que a hipótese de que o baralho tem apenas ases de espada é 52 vezes mais plausível do a hipótese de que o baralho é normal.

Page 25: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Teorema de BayesArgumento do Baralho

P D∣H 1=1,0

P H 1=0,001

∑ P D∣H iP H i=1,0×0,0011 /52×0,999=0,0202

P H 1∣D=1,0×0,001

0,0202=0,05

H1: O baralho tem só ases de espadas H2: O baralho é um baralho comum D : sorteio de uma carta e ela é um ás de espada

Page 26: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Teorema de BayesArgumento do Baralho

P D∣H1=1,0

P H1=0,5

∑ P D∣H iP H i =1,0×0,51 /52×0,5=0,5096

P H 1∣D=1,0×0,50,5096

=0,981

H1: O baralho tem só ases de espadas H2: O baralho é um baralho comum D : sorteio de uma carta e ela é um ás de espada

Page 27: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Probabilidades a priori são necessárias?

P H∣D=P D∣H

∑ P D∣H i⋅

P H

∑ P H i

Razão de verossimilhanças

Razão de risco (odds-ratio)

A razão de verossimilhanças é o que modifica as chances relativas de uma hipótese estar correta, em relação às demais.

Page 28: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Divagações: Não seria a evidência

sempre relativa?

● Frequentistas: espaço amostral

● Bayesianos: conhecimento a priori

● Verossimilhantistas: hipóteses concorrentes.

Page 29: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

As 3 Perguntas de Royall

● Qual o valor de evidência dos dados?

● No que devo acreditar?

● O que devo fazer?

Page 30: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Méritos da Abordagem de Verossimilhança

● A razão de verossimilhança é uma expressão direta do valor de evidência dos dados.

● É possível comparar quantas hipóteses se desejar, o que pode ou não incluir a tradicional "hipótese nula".

● Toma o dado como um fato e não como uma das realizações de um conjunto teórico de experimentos que podem ser repetidos, o que é mais adequado para estudos mensurativos.

● Os modelos estatísticos associados com cada hipótese devem ser explicitados.

Page 31: Aula 10 Fundamentos Téoricos da Inferência por ...cmq.esalq.usp.br/BIE5781/lib/exe/fetch.php?media=08...Argumento do Baralho P D∣H1 =1,0 P H1 =0,001 ∑P D∣Hi P Hi =1,0×0,001

LCF5877 / BIE8751

João L. F. Batista & Paulo Inácio Prado

Para saber mais

Royall, R.M. (1999) Statistical Evidence - A likelihood paradigm. New York, Chapman & Hall.

Edwards, A.W.F. (1972) Likelihood. New York, Cambridge Univ. Press.

Taper, M. L. & Lele, S. R. (2004). The Nature of Scientific Evidence – Statistical, Philosophical and Empirical Considerations. Chicago, Chicago University Press.

Sober, E. (2008). Evidence and Evolution: the logic behind the science. Cambridge, Cambridge University Press.