análise bayesiana de dados - aula 1mbranco/aula1_analisebayesiana2016.pdf · de matura˘c~ao. os...

45
Introdu¸ ao An´ alise Bayesiana de Dados - Aula 1 - arcia D’Elia Branco Universidade de S˜ ao Paulo Instituto de Matem´ atica e Estat´ ıstica www.ime.usp.br/ mbranco - sala 295-A - arcia D’Elia Branco An´ alise Bayesiana de Dados - Aula 1 -

Upload: others

Post on 23-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Analise Bayesiana de Dados - Aula 1 -

Marcia D’Elia Branco

Universidade de Sao PauloInstituto de Matematica e Estatıstica

www.ime.usp.br/ mbranco - sala 295-A -

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 2: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Paradigmas Bayesiano

Fazer inferencia e usar a informacao para reduzir a incertezasobre um objeto em estudo.

Existe duas fontes de informacao: amostral (associado aoexperimento) e conhecimentos previos (sua experiencia devida)

A incerteza a respeito de tudo o que e desconhecido deve sertraduzida por uma medida de probabilidade.

Interpretacoes subjetiva ou logica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, naocomo o limite da frequencia relativa (postura classica).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 3: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Paradigmas Bayesiano

Fazer inferencia e usar a informacao para reduzir a incertezasobre um objeto em estudo.

Existe duas fontes de informacao: amostral (associado aoexperimento) e conhecimentos previos (sua experiencia devida)

A incerteza a respeito de tudo o que e desconhecido deve sertraduzida por uma medida de probabilidade.

Interpretacoes subjetiva ou logica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, naocomo o limite da frequencia relativa (postura classica).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 4: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Paradigmas Bayesiano

Fazer inferencia e usar a informacao para reduzir a incertezasobre um objeto em estudo.

Existe duas fontes de informacao: amostral (associado aoexperimento) e conhecimentos previos (sua experiencia devida)

A incerteza a respeito de tudo o que e desconhecido deve sertraduzida por uma medida de probabilidade.

Interpretacoes subjetiva ou logica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, naocomo o limite da frequencia relativa (postura classica).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 5: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Paradigmas Bayesiano

Fazer inferencia e usar a informacao para reduzir a incertezasobre um objeto em estudo.

Existe duas fontes de informacao: amostral (associado aoexperimento) e conhecimentos previos (sua experiencia devida)

A incerteza a respeito de tudo o que e desconhecido deve sertraduzida por uma medida de probabilidade.

Interpretacoes subjetiva ou logica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, naocomo o limite da frequencia relativa (postura classica).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 6: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Paradigmas Bayesiano

Fazer inferencia e usar a informacao para reduzir a incertezasobre um objeto em estudo.

Existe duas fontes de informacao: amostral (associado aoexperimento) e conhecimentos previos (sua experiencia devida)

A incerteza a respeito de tudo o que e desconhecido deve sertraduzida por uma medida de probabilidade.

Interpretacoes subjetiva ou logica de probabilidade.

Probabilidade como uma medida pessoal de incerteza, naocomo o limite da frequencia relativa (postura classica).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 7: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Na escola Bayesiana cada observacao e unica.

A escola Classica e baseada na possibilidade de repetirexperimentos sob as mesmas condicoes.

Exemplo 1: Interpretacao da medida de probabilidade.EC: Se lancamos n vezes a mesma moeda sob as mesmascondicoes e calculamos a frequencia relativa do numero de caras,este valor se estabilizara em 1/2 (limite da frequencia relativa).EB: Para voce a credibilidade na ocorrencia de cara e a mesmaque na nao ocorrencia. Se voce tiver que apostar contra umoponente no resultado da moeda (cara) devera apostar 1 contra 1.Entao Prob(cara) = 1/2.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 8: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Na escola Bayesiana cada observacao e unica.A escola Classica e baseada na possibilidade de repetirexperimentos sob as mesmas condicoes.

Exemplo 1: Interpretacao da medida de probabilidade.EC: Se lancamos n vezes a mesma moeda sob as mesmascondicoes e calculamos a frequencia relativa do numero de caras,este valor se estabilizara em 1/2 (limite da frequencia relativa).EB: Para voce a credibilidade na ocorrencia de cara e a mesmaque na nao ocorrencia. Se voce tiver que apostar contra umoponente no resultado da moeda (cara) devera apostar 1 contra 1.Entao Prob(cara) = 1/2.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 9: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Na escola Bayesiana cada observacao e unica.A escola Classica e baseada na possibilidade de repetirexperimentos sob as mesmas condicoes.

Exemplo 1: Interpretacao da medida de probabilidade.EC: Se lancamos n vezes a mesma moeda sob as mesmascondicoes e calculamos a frequencia relativa do numero de caras,este valor se estabilizara em 1/2 (limite da frequencia relativa).

EB: Para voce a credibilidade na ocorrencia de cara e a mesmaque na nao ocorrencia. Se voce tiver que apostar contra umoponente no resultado da moeda (cara) devera apostar 1 contra 1.Entao Prob(cara) = 1/2.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 10: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Na escola Bayesiana cada observacao e unica.A escola Classica e baseada na possibilidade de repetirexperimentos sob as mesmas condicoes.

Exemplo 1: Interpretacao da medida de probabilidade.EC: Se lancamos n vezes a mesma moeda sob as mesmascondicoes e calculamos a frequencia relativa do numero de caras,este valor se estabilizara em 1/2 (limite da frequencia relativa).EB: Para voce a credibilidade na ocorrencia de cara e a mesmaque na nao ocorrencia. Se voce tiver que apostar contra umoponente no resultado da moeda (cara) devera apostar 1 contra 1.Entao Prob(cara) = 1/2.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 11: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Exemplo 2: Faz sentido utilizar toda a informacao disponıvel ousomente a amostral e relevante?

Voce deseja inferir sobre a capacidade de uma pessoa acertarresultados. Apresentam-se para o teste

∗ um especialista em musica que diz ser capaz de diferir asmusicas de Haydn e Mozart.

∗ um bebado que diz ser capaz de acertar os resultados nolancamento de uma moeda.

Se ambos sao submetidos a dez provas e acertam todas elas, entaosua inferencia baseada nos dados e a mesma. Sera razoavel?

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 12: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Exemplo 2: Faz sentido utilizar toda a informacao disponıvel ousomente a amostral e relevante?

Voce deseja inferir sobre a capacidade de uma pessoa acertarresultados. Apresentam-se para o teste

∗ um especialista em musica que diz ser capaz de diferir asmusicas de Haydn e Mozart.

∗ um bebado que diz ser capaz de acertar os resultados nolancamento de uma moeda.

Se ambos sao submetidos a dez provas e acertam todas elas, entaosua inferencia baseada nos dados e a mesma. Sera razoavel?

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 13: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Comparacao com a inferencia classica

Exemplo 2: Faz sentido utilizar toda a informacao disponıvel ousomente a amostral e relevante?

Voce deseja inferir sobre a capacidade de uma pessoa acertarresultados. Apresentam-se para o teste

∗ um especialista em musica que diz ser capaz de diferir asmusicas de Haydn e Mozart.

∗ um bebado que diz ser capaz de acertar os resultados nolancamento de uma moeda.

Se ambos sao submetidos a dez provas e acertam todas elas, entaosua inferencia baseada nos dados e a mesma. Sera razoavel?

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 14: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

Em estudos de populacao de peixes os cientistas estaointeressados na relacao entre o tamanho e a maturidadesexual da femea de uma determinada especie de peixe. Ointeresse e determinar o tamanho em que cerca de 50 % dasfemeas alcancam a maturidade sexual, denominado tamanhode maturacao.

Os dados na Tabela 1 representam o tamanho e a maturidadesexual de 17 femeas capturadas na costa sul do Brasil.

Considere yi o numero de femeas maduras e ni o numerototal de femeas. pi e a probabilidade de que uma femea naclasse i esteja madura.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 15: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

Tabela 1: Numero de femeas maduras por tamanho.Comprimento (cm) Total Maduras

10 - 20 3 020 - 30 5 130 - 40 4 340 - 70 5 5

Suponha yi uma Binomial(ni, pi) com pi a probabilidade de queuma femea na classe i esteja madura. xi e o ponto medio daclasse i. O modelo logıstico e dado por

log

(pi

1− pi

)= β0 + β1(xi − x)

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 16: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

A quantidade principal de interesse e

LT50 = −β0

β1+ x,

obtida quando substitui-se pi por 0.5.

A analise Bayesiana resulta na obtencao da distribuicao deprobabilidade associada a LT50.

Esta distribuicao de probabilidade representa a incerteza aposterior sobre a quantidade de interesse.

A partir da distribuicao a posterior, pode-se obter umaestimacao pontual igual a 28 cm e um intervalo, deprobabilidade 0.95, igual a (22.65 ; 35.25).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 17: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

A quantidade principal de interesse e

LT50 = −β0

β1+ x,

obtida quando substitui-se pi por 0.5.

A analise Bayesiana resulta na obtencao da distribuicao deprobabilidade associada a LT50.

Esta distribuicao de probabilidade representa a incerteza aposterior sobre a quantidade de interesse.

A partir da distribuicao a posterior, pode-se obter umaestimacao pontual igual a 28 cm e um intervalo, deprobabilidade 0.95, igual a (22.65 ; 35.25).

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 18: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

LT50 depende de dois parametros desconhecidos β0 e β1, osquais tambem possuem uma distribuicao de probabilidade aposterior.

Iniciamos com uma medida de probabilidade a priorif(β0, β1), por exemplo, normal bivariada.

Para obter a medida a posterior utilizamos a formula de Bayes

f(β0, β1 | y) =f(y | β0, β1)f(β0, β1)

f(y),

onde f(y | β0, β1) e a probabilidade conjunta de y1, y2, . . . , yksupondo os parametros conhecidos. No nosso caso, estaprobabilidade e o produto de binomias.

A quantidade f(y) e a distribuicao marginal e e obtida pelaintegracao do numerador. Nao existe solucao analıtica ealgoritmos numericos sao necessarios.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 19: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

LT50 depende de dois parametros desconhecidos β0 e β1, osquais tambem possuem uma distribuicao de probabilidade aposterior.

Iniciamos com uma medida de probabilidade a priorif(β0, β1), por exemplo, normal bivariada.

Para obter a medida a posterior utilizamos a formula de Bayes

f(β0, β1 | y) =f(y | β0, β1)f(β0, β1)

f(y),

onde f(y | β0, β1) e a probabilidade conjunta de y1, y2, . . . , yksupondo os parametros conhecidos. No nosso caso, estaprobabilidade e o produto de binomias.

A quantidade f(y) e a distribuicao marginal e e obtida pelaintegracao do numerador. Nao existe solucao analıtica ealgoritmos numericos sao necessarios.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 20: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

LT50 depende de dois parametros desconhecidos β0 e β1, osquais tambem possuem uma distribuicao de probabilidade aposterior.

Iniciamos com uma medida de probabilidade a priorif(β0, β1), por exemplo, normal bivariada.

Para obter a medida a posterior utilizamos a formula de Bayes

f(β0, β1 | y) =f(y | β0, β1)f(β0, β1)

f(y),

onde f(y | β0, β1) e a probabilidade conjunta de y1, y2, . . . , yksupondo os parametros conhecidos. No nosso caso, estaprobabilidade e o produto de binomias.

A quantidade f(y) e a distribuicao marginal e e obtida pelaintegracao do numerador. Nao existe solucao analıtica ealgoritmos numericos sao necessarios.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 21: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

Sob a abordagem classica os parametros podem ser estimadosutilizando-se os estimadores de maxima verossimilhanca e ateoria assintotica normal.

As estimativas pontuais, e por intervalo, de maximaverossimilhanca de β1 sao 0.266 e (-00188 ; 0.5526), comconfianca de 95 % .

Sob a abordagem Bayesiana, o intervalo de credibilidade e(0.112 ; 0.795), com probabilidade 95 %.

Esta diferenca justifica-se pela assimetria observada nadistribuicao a posteriori.

Enquanto que o intervalo classico indica que β1 pode ser zero,a distribuicao a posteriori indica claramente um valor positivo.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 22: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

Sob a abordagem classica os parametros podem ser estimadosutilizando-se os estimadores de maxima verossimilhanca e ateoria assintotica normal.

As estimativas pontuais, e por intervalo, de maximaverossimilhanca de β1 sao 0.266 e (-00188 ; 0.5526), comconfianca de 95 % .

Sob a abordagem Bayesiana, o intervalo de credibilidade e(0.112 ; 0.795), com probabilidade 95 %.

Esta diferenca justifica-se pela assimetria observada nadistribuicao a posteriori.

Enquanto que o intervalo classico indica que β1 pode ser zero,a distribuicao a posteriori indica claramente um valor positivo.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 23: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

Sob a abordagem classica os parametros podem ser estimadosutilizando-se os estimadores de maxima verossimilhanca e ateoria assintotica normal.

As estimativas pontuais, e por intervalo, de maximaverossimilhanca de β1 sao 0.266 e (-00188 ; 0.5526), comconfianca de 95 % .

Sob a abordagem Bayesiana, o intervalo de credibilidade e(0.112 ; 0.795), com probabilidade 95 %.

Esta diferenca justifica-se pela assimetria observada nadistribuicao a posteriori.

Enquanto que o intervalo classico indica que β1 pode ser zero,a distribuicao a posteriori indica claramente um valor positivo.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 24: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Motivacao: Estudo da maturidade sexual do peixe-galo.

Sob a abordagem classica os parametros podem ser estimadosutilizando-se os estimadores de maxima verossimilhanca e ateoria assintotica normal.

As estimativas pontuais, e por intervalo, de maximaverossimilhanca de β1 sao 0.266 e (-00188 ; 0.5526), comconfianca de 95 % .

Sob a abordagem Bayesiana, o intervalo de credibilidade e(0.112 ; 0.795), com probabilidade 95 %.

Esta diferenca justifica-se pela assimetria observada nadistribuicao a posteriori.

Enquanto que o intervalo classico indica que β1 pode ser zero,a distribuicao a posteriori indica claramente um valor positivo.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 25: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico probabilıstico.

Uma medida de probabilidade P e definida em um espaco(X ,A), onde A e uma sigma algebra de elementosmensuraveis.

Um espaco parametrico estatıstico e um conjunto (famılia) demedidas de probabilidade, associadas a um vetor aleatorio X,indexadas por um parametro θ,

(X ,A, Pθ), ∀θ

Sob o ponto de vista Bayesiano e preciso definir uma medidade probabilidade a prior para θ,

(Θ,B, π)

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 26: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico probabilıstico.

Uma medida de probabilidade P e definida em um espaco(X ,A), onde A e uma sigma algebra de elementosmensuraveis.

Um espaco parametrico estatıstico e um conjunto (famılia) demedidas de probabilidade, associadas a um vetor aleatorio X,indexadas por um parametro θ,

(X ,A, Pθ), ∀θ

Sob o ponto de vista Bayesiano e preciso definir uma medidade probabilidade a prior para θ,

(Θ,B, π)

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 27: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico probabilıstico.

Uma medida de probabilidade P e definida em um espaco(X ,A), onde A e uma sigma algebra de elementosmensuraveis.

Um espaco parametrico estatıstico e um conjunto (famılia) demedidas de probabilidade, associadas a um vetor aleatorio X,indexadas por um parametro θ,

(X ,A, Pθ), ∀θ

Sob o ponto de vista Bayesiano e preciso definir uma medidade probabilidade a prior para θ,

(Θ,B, π)

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 28: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Sob certas suposicoes, e possıvel definir uma medida deprobabilidade conjunta para X e θ .

Usa-se a formula de Bayes para obter a medida deprobabilidade condicional de θ dado o resultado da amostraX = x

f(θ | x) =P (X = x | θ)f(θ)∑

Θ

P (X = x | θ)f(θ)

f(θ | x) =f(x | θ)f(θ)∫

Θ

f(x | θ)f(θ)dθ

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 29: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial

Exemplo 1: O modelo binomial.X | θ, n ∼ Bin(n, θ) , 0 < θ < 1 e n inteiro.Suponha n conhecido, e preciso definir uma medida deprobabilidade para θ.Prior 1:

θ 0.25 0.50 0.75

f(θ) 0.25 0.50 0.25

Para n = 2 a posterior e

θ 0.25 0.50 0.75

f(θ | x = 0) 0.500 0.440 0.060

f(θ | x = 1) 0.214 0.572 0.214

f(θ | x = 2) 0.060 0.440 0.500

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 30: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial

Exemplo 1: O modelo binomial.X | θ, n ∼ Bin(n, θ) , 0 < θ < 1 e n inteiro.Suponha n conhecido, e preciso definir uma medida deprobabilidade para θ.Prior 1:

θ 0.25 0.50 0.75

f(θ) 0.25 0.50 0.25

Para n = 2 a posterior e

θ 0.25 0.50 0.75

f(θ | x = 0) 0.500 0.440 0.060

f(θ | x = 1) 0.214 0.572 0.214

f(θ | x = 2) 0.060 0.440 0.500

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 31: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Prior 2: θ ∼ Beta(a, b). Entao sua funcao de densidade e

f(θ) =Γ(a+ b)

Γ(a)Γ(b)θa−1(1− θ)b−1 , a > 0 b > 0.

Para obter a marginal f(x) integra-se em θ

f(x) =

1∫0

f(θ)Cn,x(θ)x(1− θ)n−xdθ.

Observe que nao ha necessidade de preocupar-se com a quantidadeCn,x (constante) pois

f(θ | x) =θa+x−1(1− θ)b+n−x−1

1∫0

(θ)a+x(1− θ)b+n−x−1

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 32: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Prior 2: θ ∼ Beta(a, b). Entao sua funcao de densidade e

f(θ) =Γ(a+ b)

Γ(a)Γ(b)θa−1(1− θ)b−1 , a > 0 b > 0.

Para obter a marginal f(x) integra-se em θ

f(x) =

1∫0

f(θ)Cn,x(θ)x(1− θ)n−xdθ.

Observe que nao ha necessidade de preocupar-se com a quantidadeCn,x (constante) pois

f(θ | x) =θa+x−1(1− θ)b+n−x−1

1∫0

(θ)a+x(1− θ)b+n−x−1

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 33: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Prior 2: θ ∼ Beta(a, b). Entao sua funcao de densidade e

f(θ) =Γ(a+ b)

Γ(a)Γ(b)θa−1(1− θ)b−1 , a > 0 b > 0.

Para obter a marginal f(x) integra-se em θ

f(x) =

1∫0

f(θ)Cn,x(θ)x(1− θ)n−xdθ.

Observe que nao ha necessidade de preocupar-se com a quantidadeCn,x (constante) pois

f(θ | x) =θa+x−1(1− θ)b+n−x−1

1∫0

(θ)a+x(1− θ)b+n−x−1

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 34: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Podemos mostrar que a distribuicao a posteriori eθ | x ∼ Beta(a+ x, b+ n− x).

Se as distribuicoes a priori e a posteriori estao na mesma classe dedistribuicoes, dizemos que sao conjugadas em relacao ao modeloestatıstico X | θ.

Como escolher a e b ?

Se a = b temos uma distribuicao simetrica.

Se a = b = 1 temos uma uniforme.

A media e a variancia a priori saoE[θ] = a

a+b

V ar[θ] = ab(a+b)2(a+b+1)

.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 35: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Podemos mostrar que a distribuicao a posteriori eθ | x ∼ Beta(a+ x, b+ n− x).

Se as distribuicoes a priori e a posteriori estao na mesma classe dedistribuicoes, dizemos que sao conjugadas em relacao ao modeloestatıstico X | θ.

Como escolher a e b ?

Se a = b temos uma distribuicao simetrica.

Se a = b = 1 temos uma uniforme.

A media e a variancia a priori saoE[θ] = a

a+b

V ar[θ] = ab(a+b)2(a+b+1)

.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 36: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Podemos mostrar que a distribuicao a posteriori eθ | x ∼ Beta(a+ x, b+ n− x).

Se as distribuicoes a priori e a posteriori estao na mesma classe dedistribuicoes, dizemos que sao conjugadas em relacao ao modeloestatıstico X | θ.

Como escolher a e b ?

Se a = b temos uma distribuicao simetrica.

Se a = b = 1 temos uma uniforme.

A media e a variancia a priori saoE[θ] = a

a+b

V ar[θ] = ab(a+b)2(a+b+1)

.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 37: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Podemos mostrar que a distribuicao a posteriori eθ | x ∼ Beta(a+ x, b+ n− x).

Se as distribuicoes a priori e a posteriori estao na mesma classe dedistribuicoes, dizemos que sao conjugadas em relacao ao modeloestatıstico X | θ.

Como escolher a e b ?

Se a = b temos uma distribuicao simetrica.

Se a = b = 1 temos uma uniforme.

A media e a variancia a priori saoE[θ] = a

a+b

V ar[θ] = ab(a+b)2(a+b+1)

.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 38: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Podemos mostrar que a distribuicao a posteriori eθ | x ∼ Beta(a+ x, b+ n− x).

Se as distribuicoes a priori e a posteriori estao na mesma classe dedistribuicoes, dizemos que sao conjugadas em relacao ao modeloestatıstico X | θ.

Como escolher a e b ?

Se a = b temos uma distribuicao simetrica.

Se a = b = 1 temos uma uniforme.

A media e a variancia a priori saoE[θ] = a

a+b

V ar[θ] = ab(a+b)2(a+b+1)

.

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 39: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Graficos da densidade Beta

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Densidades Beta simetricas

x

dens

idad

e

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 40: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Graficos da densidade Beta

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

2.5

Densidades Beta assimetricas a < b

x

dens

idad

e

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 41: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

O modelo parametrico binomial.

Usando o seu conhecimento para construir sua a priori.∗ Qual o significado de θ?∗ Informacoes a priori

θ (0.00 - 0.25) (0.25 - 0.50) (0.50 - 0.75) (0.75 - 1.00)

Prob. 0.10 0.40 0.40 0.10

∗ Densidade a priori : θ ∼ Beta(3, 3)

θ (0.00 - 0.25) (0.25 - 0.50) (0.50 - 0.75) (0.75 - 1.00)

Pbeta. 0.1035 0.3965 0.3965 0.1035

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 42: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Graficos das densidades a posteriori com n=2 e prioriBeta(3,3)

0.0 0.2 0.4 0.6 0.8 1.0

0.0

1.0

2.0

Priori e Posteriori, n=2, x=0

x

dens

idad

e

0.0 0.2 0.4 0.6 0.8 1.0

0.0

1.0

2.0

Priori e Posteriori, n=2, x=1

x

dens

idad

e

0.0 0.2 0.4 0.6 0.8 1.0

0.0

1.0

2.0

Priori e Posteriori, n=2, x=2

x

dens

idad

e

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 43: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Graficos das densidades a posteriori com n=50 e prioriBeta(3,3)

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

Priori e Posteriori, n=50, x=0

x

dens

idad

e

0.0 0.2 0.4 0.6 0.8 1.0

02

46

Priori e Posteriori, n=50, x=25

x

dens

idad

e

0.0 0.2 0.4 0.6 0.8 1.0

05

1015

Priori e Posteriori, n=50, x=50

x

dens

idad

e

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 44: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Graficos das densidades a posteriori com n=50 e prioriBeta(50,50)

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

Priori e Posteriori, n=50, x=0 (Priori II)

x

dens

idad

e

0.0 0.2 0.4 0.6 0.8 1.0

02

46

810

Priori e Posteriori, n=50, x=25 (Priori II)

x

dens

idad

e

0.0 0.2 0.4 0.6 0.8 1.0

02

46

8

Priori e Posteriori, n=50, x=50 (Priori II)

x

dens

idad

e

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -

Page 45: Análise Bayesiana de Dados - Aula 1mbranco/Aula1_AnaliseBayesiana2016.pdf · de matura˘c~ao. Os dados na Tabela 1 representam o tamanho e a maturidade sexual de 17 f^emeas capturadas

Introducao

Referencias.

Kinas, P.G. e Andrade, H.A. (2010). Introducao a analisebayesiana (com R). Editora: maisQnada.

Loschi, R. (2013). Estadıstica Bayesiana algunos de suaaspectos. Minicurso no Congreso Anual de la SociedadArgentina de Estadıstica, Mendoza

Marcia D’Elia Branco Analise Bayesiana de Dados - Aula 1 -