universidade federal de sÃo carlos centro de … · e explorado para estudo de tempo de vida e a...

18
ISSN 0104-0499 UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS RELATÓRIO TÉCNICO DEPARTAMENTO DE ESTATÍSTICA TEORIA E MÉTODO– SÉRIE A Abril/2011 nº 241 UMA INTRODUÇÃO A ANALISE DE REFERÊNCIA: INFERÊNCIA SOBRE A FUNÇÃO DE SOBREVIVÊNCIA DO MODELO EXPONENCIAL Vera Lucia D. Tomazella Mayara Piani Luna da Silva Camila Bertini Martins

Upload: phungtu

Post on 06-Jul-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

ISSN 0104-0499

UNIVERSIDADE FEDERAL DE SÃO CARLOS

CENTRO DE CIÊNCIAS EXATAS E

TECNOLÓGICAS

RELATÓRIO TÉCNICO DEPARTAMENTO DE ESTATÍSTICA

TEORIA E MÉTODO– SÉRIE A

Abril/2011

nº 241

UMA INTRODUÇÃO A ANALISE DE REFERÊNCIA: INFERÊNCIA SOBRE A FUNÇÃO

DE SOBREVIVÊNCIA DO MODELO EXPONENCIAL

Vera Lucia D. Tomazella Mayara Piani Luna da Silva

Camila Bertini Martins

Page 2: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Uma Introducao a Analise de Referencia: Inferencia Sobre a Funcao

de Sobrevivencia do Modelo Exponencial

Vera Lucia D. TomazellaMayara Piani Luna da Silva

Camila Bertini MartinsUniversidade Federal de Sao Carlos, SP-Brasil

Resumo

Em inferencia bayesiana frequentemente e desejavel encontrar densidade a posteriori refletindo principal-mente as informacoes dos dados amostrais. Assim e importante considerar densidade a priori a qual adicionapouca informacao para a amostra. Na literatura existe muitas proposta por exemplo Jeffreys (1967), Lindley(1963,1961), Bernardo, (1979), Zelner (1984), etc. Neste artigo nos oferecemos uma breve introducao aanalise de referencia bayesiana introduzida por Bernardo (1979), muitas vezes considerado o mais poderosometodo para produzir distribuicao a posteriori nao subjetiva baseado em modelos. O objetivo e apresentara metodologia para construir uma especıfica funcao a priori e posteriori de referencia para os parametros de-sconhecidos do modelo proposto, a qual sera dominada pelos dados observados. As ideia sao ilustradas comum interessante modelo de sobrevivencia , o modelo exponencial, onde os resultados encontrado neste tra-balho conduziu a distribuicoes a priori e a posteriori conhecidas na literatura podendo, estas serem utilizadaspara estimacoes dos parametros de interesse. Indicacoes sao fornecidas para literatura relacionadas.

• Palavras-Chaves: Analise de referencia, Analise bayesiana, Priori de referencia, Funcao de sobre-vivencia, Modelo exponencial, Priori nao informativa, Distribuicao Log-Gama Negativa.

1 Introducao

A teoria para dados de sobrevivencia tem sido bastante desenvolvida com o objetivo de estudar a funcao derisco/sobrevivencia de um paciente ou sistema. Esta metodologia permite determinar quais variaveis afetama forma da funcao de risco/sobrevivencia e obter estimativas destas funcoes para cada indivıduo. Esteestudo envolve o acompanhamento de unidades (indivıduos) ate a ocorrencia de algum evento de interesse,por exemplo, a falha (morte) da unidade. A funcao de sobrevivencia e definida como a probabilidade deuma observacao (indivıduo) sobreviver mais que um determinado tempo t, ou seja, nao falhar apos certotempo. Atraves da curva de sobrevivencia podemos comparar, por exemplo, dois ou mais tratamentos.Assim, uma curva de sobrevivencia com declive acentuado representa baixa taxa ou curto tempo de vida,enquanto uma curva com aclive representa alta taxa ou longo tempo de vida. Um dos modelos mais utile explorado para estudo de tempo de vida e a distribuicao exponencial. Neste trabalho consideramos omodelo de sobrevivencia exponencial e aplicamos a metodologia de analise de referencia Bayesiana objetiva(Bernardo, 1979) com objetivo de estimar a funcao de sobrevivencia.

A literatura sobre priori nao-informativa tem crescido muito nos ultimos anos, muitos livros e artigostem concentrado atencao em comparar diferentes abordagens para construcao a priori nao-informativa (verpor exemplo, Kass e Wasserman (1993), Bernardo e Smith, 1994). A priori de Jeffreys aparece quase semprecomo uma boa alternativa de construcao de priori nao informativa, mas tem limitacao como por exemplo nocaso multiparametrico. Ao restringir a classe de candidatas a funcao a priori, a metodologia de referenciatorna possıvel incorporar a analise qualquer conhecimento a priori verdadeiro. Desse ponto de vista, a

1

Page 3: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

derivacao de funcoes a priori de referencia introduzida por Bernardo (1979) pode ser descrita como umnovo e poderoso metodo para elicitacao. O metodo de analise de referencia generaliza muitos dos metodosconsiderados alternativos e os inclui como casos especiais, como por exemplo, o metodo de Jeffreys. Assimeste artigo tem por objetivo apresentar a construcao da priori e posteriori de referencia de forma simplese objetiva considerando como exemplo um simples modelo utilizado na area de sobrevivencia, o modeloexponencial.

Este trabalho esta organizado da seguinte forma: A Secao 2 contem uma breve revisao da metodologiade analise de referencia para o caso uniparametrico. Na Secao 3 apresentamos o modelo de sobrevivenciaexponencial. Nas Secoes 4 e 5 a metodologia sera aplicada para o modelo exponencial, o qual foi escolhidoporque combina importancia intrınseca e valor pedagogico, finalizando na secao 6 com as consideracoes finais.

2 Uma Revisao sobre Analise de Referencia

Neste secao, revisamos a metodologia de analise de referencia introduzida por Bernardo (1979), apre-sentando definicoes e propriedades para a construcao de distribuicao a priori de referencia, para modelosuniparametricos, que e o caso de interesse deste trabalho. Mais detalhes pode ser encontrado em Bernardo(2005) e Bernardo e Smith (1994).

Os problemas de inferencia estatıstica sao normalmente resolvidos condicionados na suposicao de que umdeterminado modelo estatıstico e uma descricao adequada do mecanismo probabilıstico que gerou os dados,bem como a escolha do modelo que naturalmente envolve um elemento de subjetividade. Isto tornou-se umapratica habitual, no entanto, descreve-se como objetiva qualquer analise estatıstica que depende apenas domodelo assumido e dos dados observados. Neste sentido, (e apenas neste sentido) a analise de referencia eum metodo de produzir inferencia Bayesiana ”objetiva”.

Argumentos fundacionais (Savage, 1954; de Finetti, 1970; Bernardo e Smith, 1994) ditam que os cientistasdevem elicitar uma unica (conjunta) distribuicao a priori para todos os elementos desconhecidos do problema,com base em informacoes disponıveis, e usar o Teorema de Bayes para combinar esta com as informacoesfornecidas pelos dados, encapsulado na funcao de verossimilhanca. Neste contexto, a (infelizmente muitofrequentes) ingenua utilizacao de simples prioris ”flats”, como presumıvel prioris ”nao informativas” fre-quentemente esconde importantes suposicoes que podem facilmente dominar, ou mesmo invalidar, a analise:ver, por exemplo, Hobert e Casella (1996, 1998), Casella (1996), Palmer e Pettit (1996), Hadjicostas e Berry(1999) e Berger (2000). O nao crıtico uso de tais prioris ”flats” deve ser fortemente desestimulado, e deve serutilizado uma adequada priori de referencia. Uma candidata natural a priori nesses casos seria uma priori”nao informativa”, em que o conhecimento a priori poderia ser dominado pela informacao fornecida pelosdados.

Tal como evidenciado pela extensa lista de referencias, ha um consideravel corpo de literatura teorica econceitual dedicada a identificar os procedimentos adequados para a formulacao de prioris ”nao informativas”.Comecando com o trabalho de Bayes (1763) e Laplace (1825), sob o nome de probabilidade inversa, autilizacao de prioris ”nao informativas” se tornou fundamental para o inıcio da literatura estatıstica, quena epoca era principalmente Bayesiana objetiva. O trabalho de Jeffreys (1946) levou um forte renascimentoda estatıstica Bayesiana objetiva; os livros de Jeffreys (1961), Lindley (1965), Zellner (1971), Press (1972)e Box e Tiao (1973), demonstraram que os convencionais problemas de estatısticas frequentistas poderiamser resolvidos a partir de uma perspectiva unificadora Bayesiana objetiva.

A teoria de informacao estatıstica foi utilizada para fornecer um significado preciso para esta dominanciaexigida. Note que prioris de referencia nao foram propostas como uma aproximacao para as crencas pessoaisdos cientistas (unicas), mas sim como uma colecao de consensos formais (nao necessariamente proprias) paraas funcoes a priori que poderiam ser convenientemente utilizadas como padroes de comunicacao cientıfica.De acordo com Box e Tiao (1973, p. 23), a priori de referencia e cuidadosamente escolhida para garantirque a informacao fornecida pelos dados nao sera influenciada pela crenca a priori do cientista.

A priori de referencia introduzida por Bernardo (1979) e mais adiante desenvolvida em umas series detrabalhos por Berger e Bernardo (1989, 1992a, 1992c), e um metodo de produzir afirmacoes de inferencia

2

Page 4: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Bayesiana o qual somente depende do modelo assumido e dos dados observados. A teoria de informacaoestatıstica e usada para definir a priori de referencia como uma funcao matematica que descreve a situacaoonde os dados dominarao melhor o conhecimento a priori sobre a quantidade de interesse. Distribuicoes aposteriori de referencia sao obtidos pelo uso formal do teorema de Bayes com a funcao a priori de referencia.O metodo de analise de referencia generaliza muitos dos metodos considerados alternativos e os inclui comocasos especiais, como por exemplo, o metodo de Jeffreys (Jeffreys, 1946).

Por definicao a priori de referencia e objetiva no sentido que ela e uma funcao matematica bem definidado parametro de interesse, do modelo assumido e a classe de priori candidatas P , com nenhum elementosubjetivo.

A priori de referencia tem muitas propriedades atrativas tais como: Generalidade, invariancia, marginal-izacao consistente e propriedade de amostragem consistente.

2.1 Construcao da priori de referencia caso uniparametrico

Considere o modelo uniparametrico M ≡ p(x|λ), x ∈ χ, λ ∈ Λ ⊂ R e seja P a classe de prioris candidataspara θ. A funcao π(θ) = π(θ|M,P ) e a priori de referencia para o modelo M dado P se esta e uma funcao apriori permissıvel tal que, para alguma sequencia crescente Θi∞i=1 com limi→∞Λi = Λ e

∫λiπ(λ)dλ ≤ ∞,

limk→∞Iπi|Mk

− I

pi|Mk

≥ 0, para todo Λi e para todo p ∈ P ,

sendo πi(λ) e pi(λ) as restricoes renormalizadas de π(λ) e p(λ) para Λi.A priori de referencia e definida como aquela que maximiza a falta de informacao que e a discrepancia

esperada entre o conhecimento a priori e o perfeito conhecimento; mas o perfeito conhecimento e apenasaproximado assintoticamente, quando k →∞.

A Definicao implica que a priori de referencia depende apenas do comportamento assintotico do mod-elo assumido, a caracterıstica simplifica muito sua derivacao atual; para obtermos a priori de referenciaπ(λ|M,P ) para o parametro λ do modelo M ≡ p(x|λ), x ∈ χ, λ ∈ Λ, isto e, ambos sao mecessarios e sufi-cientes para estabelecer o comportamento assintotico da distribuicao a posteriori sob repetecao amostral deM , que e a forma limitante, como k →∞, da densidade a posteriori π(λ|xk) = π(λ|x1, . . . , xk).

Como e de se esperar, a definicao da o resultado de maxima entropia no caso onde o espaco parametricoe finito e a quantidade de interesse e um valor atual do parametro

Forma explıcita da priori de referencia:

Considere um experimento ε, o qual consiste de uma observacao x de p(x|λ), λ ∈ Λ ⊂ <. Sejazk = (x1, . . . , xk) o resultado de k replicacoes independentes de ε. Assim que p(zk|λ) =

∏kj=1 p(xj |λ) e

seja tk = tk(zk) uma estatıstica suficiente assintoticamente. Seja h(λ) uma funcao positiva tal que parak suficientemente grande

∫λp(tk|λ)h(λ)dλ < ∞, onde p(tk|λ) e qualquer aproximacao assintotica da dis-

tribuicao a posteriori. Entao definimos,

fk(λ) = exp

p(tk|λ)log

(p(tk|λ)h(λ)∫

λp(tk|λ)h(λ)dλ

)dtk

, (1)

f(λ) = limk→∞

fk(λ)fk(λ0)

, (2)

sendo λ0 qualquer ponto interior de λ. Se f(λ) e uma funcao priori permissıvel entao, para qualquerc > 0, π(λ,M,P ) = cf(λ) e uma funcao priori de referencia.

Funcao Priori Permissıvel: Uma funcao positiva π(ω) e uma funcao priori permissıvel para o modeloM ≡ p(x|ω), x ∈ χ, ω ∈ Ω, se para todo x ∈ χ ha alguma sequencia crescente Ω∞i=1 de subconjuntos deΩ, tal que,

3

Page 5: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

• limi→∞ Ωi = Ω;

•∫

Ωiπ(λ)dω <∞;

• limi→∞∫χpi(x)δπi(ω|x), π(ω|x)dx = 0

isto e, π(ω) e a funcao a priori permissıvel para o modelo M se esta sempre da uma posteriori propria. Todasprioris proprias sao permissıveis no sentido da definicao acima, mas uma priori impropria pode ou nao serpermissıvel, embora as mesmas parecem ser arbitrariamente proximas de uma priori propria.

Teorema 1 (Priori de referencia sob normalidade assintotica): Seja os dados consistentes deuma amostra aleatoria do modelo M ≡ p(y|λ), y ∈ Υ, λ ∈ Λ ⊂ <, e seja P0 a classe de todas as prioriscontınuas com suporte Λ. Se a distribuicao a posteriori de λ, π(λ|y1, . . . , yk), e assintoticamente normalcom desvio padrao s(λk)/

√k, em que λk e o estimador consistente de λ, e s(λ)−1 e uma funcao a priori

permissıvel, entao uma funcao da forma

π(λ|M,P0) ∝ s(λ)−1 (3)

e a priori de referencia. Sob condicoes de regularidade a distribuicao a posteriori de λ e assintoticamentenormal com variancia i(λk)−1/k, onde λk e o estimador de maxima verossimilhanca de λ e

i(λ) = −∫

Υ

p(y|λ)∂2

∂λ2log p(y|λ)dy (4)

e a informacao de Fisher. Se este e o caso, e i(λ)1/2 e uma funcao a priori permissıvel, a priori de referenciae a priori de Jeffreys, π(λ|M,P0) ∝ i(λ)1/2. Assim sendo a priori de Jeffreys e um caso particular o qual eobtida quando S(λ)−1 = i(λ)1/2.

Teorema 2 (Priori de referencia sob condicoes de regularidade): Seja x ∈ X os dados deuma amostra aleatoria de tamanho n de um modelo uniparametrico M ≡ p(x|λ), x ∈ X,λ ∈ λ.Seja xk =x1, . . . xk uma amostra de tamanho k do modelo M , seja λk = λk(xk) ∈ λ uma estatıstica assintoticamentesuficiente o qual e um estimador consistente de λ e seja P0 a classe de todas as prioris contınuas com suporteλ. Seja πk(λ|λk) qualquer aproximacao assintotica (quando k → ∞) para a distribuicao a posteriori de λ,seja p(λk|λ) a distribuicao amostral de λk defina,

fak (λ) = π(λ|λk)|λk=λ, fa(λ) = limk→∞

fak (λ)fak (λ0)

f bk(λ) = p(λk|λ)|λk=λ, f b(λ) = limk→∞

f bk(λ)f bk(λ0)

onde λ0 e qualquer ponto interior de Λ. Entao sob condicoes tecnicas adicionais fa(λ) = f b(λ) = f(λ) e sef(λ) e uma priori permissıvel, π(λ|M,P0) ∝ f(λ) e a priori de referencia.

Para detalhes e justificativas eurısticas dos Teorema 1 e Teorema 2 ver Bernardo(2005) e Berger, Bernardoe Sun (2005).

Na analise de referencia bayesiana objetiva os esforcos se concentram em identificar para cada problemaparticular de inferencia, uma especıfica funcao a priori de referencia conjunta para todos os elementosdesconhecidos do problema que conduziria a uma distribuicao a posteriori de referencia (marginal) para aquantidade de interesse, a qual sempre sera dominada pela informacao fornecida pelos dados (Bernardo,1979b). Por outro lado, quando a informacao a priori subjetiva e especificada, a correspondente distribuicaoa posteriori subjetiva pode ser comparada com a distribuicao a posteriori de referencia - daı o seu nome -para avaliar a importancia relativa das opinioes iniciais na inferencia final.

4

Page 6: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

3 A Distribuicao Exponencial

A distribuicao mais simples e importante na area de sobrevivencia e a distribuicao exponencial. Inicialmente,ela foi utilizada para modelar o tempo de vida de componentes eletronicos. Cox e Snell (1981) utilizaram omodelo exponencial para descrever o tempo de vida de pacientes adultos com leucemia.

A distribuicao exponencial e tratada frequentemente como um modelo de falhas aleatorias. Ela e co-nhecida por ser a unica que “nao tem memoria” , ou seja, o tempo de vida do animal ou do indivıduonao afetam a sobrevivencia deles no futuro (ver Colosimo e Giolo, 2006 e Lawless,1982). Esta distribuicaoapresenta um unico parametro e e a unica que se caracteriza por ter uma funcao de taxa de falha (ou derisco) constante.

A funcao de densidade de probabilidade (f.d.p.) e definida como:

f(t) =1λ

exp− tλ

, t ≥ 0 (5)

em que o parametro λ > 0 e o tempo medio de vida. O parametro λ tem a mesma unidade do tempo defalha t. Isto e se t e medido em horas, λ tambem sera fornecido em horas.

A funcao de sobrevivencia S(t) e de taxa de falha h(t) sao dadas respectivamente, por,:

S(t) = exp− tλ

, t ≥ 0 (6)

e

h(t) =1λ, t ≥ 0 (7)

Quando λ e grande indica alto risco e λ pequeno, baixo risco. Outras caracterısticas importante dadistribuicao exponencial sao a media e a variancia, onde a media e λ e a variancia e λ2

Na figura (1.1) observamos o comportamento da funcao de densidade, de sobrevivencia e de risco, res-pectivamente, da distribuicao exponencial para alguns valores de λ.

A taxa de falha λ pode ser estimada pelo metodo da maxima verossimilhanca, onde a funcao de verossi-milhanca para o modelo exponencial (5) e dada por,

L (λ) = λ−n exp−∑ni=1 tiλ

. (8)

Tomando o logaritmo da funcao de verossimilhanca (8) e considerando∑ni=1 ti = r temos:

l (λ) = −n log(λ)− r

λ, (9)

assim, derivando l(λ) em relacao ao parametro λ temos,

∂l (λ)∂λ

= − 1λ

n∑i=1

δi +1λ2

n∑i=1

ti. (10)

5

Page 7: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Figure 1: Funcoes de densidade, (5) sobrevivencia (6) e risco (7)

Igualando a equacao (5) a zero e avaliando-a em λ, obtemos o seguinte estimador de maxima verossimi-lhanca (M.V). de λ:

λ =∑ni=1 ti∑ni=1 δi

. (11)

O termo∑ni=1 ti e denominado tempo total sob teste. Notamos que, se todas as observacoes fossem

nao-censuradas, o estimador da taxa λ seria dado por: λ = t.Do ponto de vista frequentista nao existe nenhum problema para estimar os parametros do modelo expo-

nencial, consequentemente o mesmo ocorre para a sua funcao de sobrevivencia (ver por exemplo, Colosimo eGiolo, 2006). Mas para muitos pesquisadores os metodos Bayesiano sao mais atrativos e tem sido su-geridoscomo alternativa na estimacao dos parametros desse modelo. E reconhecido que, sob a perspectiva Bayesiana,a distribuicao a posteriori para a quantidade de interesse representa a mais completa inferencia que podemosfazer a respeito dessa quantidade. Desse ponto de vista, a derivacao de funcoes a priori de referencia podeser descrita como um novo metodo para elicitacao de funcao a priori (Bernardo, 1979). Na proxima secaonos apresentamos uma sumarizacao da analise de referencia Bayesiana objetiva que sera considerada nesteartigo para estimar a funcao de sobrevivencia do modelo exponencial.

6

Page 8: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

4 Priori de referencia para os parametros do modelo exponencial

forma explicita

Seja x = x1, ..., xn uma amosstra aleatoria do modelo M =

1λ exp

−xλ, x > 0, λ > 0

. Considere

zk = x1, ..., xk k repeticoes de M .A funcao de Verossimilhanca e dada por

L(z|λ) = λke−λ

k∑j=1

xj

onde tk =k∑j=1

xj e uma estatıstica suficiente. A distribuicao de probabilidade de tk e aproximadamente

p(tk|λ) ≈ Gama(tk|k, λ).

Considere uma funcao positiva arbitraria h(λ) = 1 tal que a aproximacao assintotica para a distribuicaoa posteriori de λ, π(λ|tk) e dada por,

π(λ|tk) ∝ p(tk|λ)h(λ)

π(λ|tk) ∝ λk

Γ(k)tk−1k eλtk .1

π(λ|tk) ∝ λk+1−1eλtk

onde a correspondente posteriori π(λ|tk) tem densidade Gama(λ|k + 1, tk) e assim podemos calcular

fk(λ) = exp[∫p(tk|λ) log(π(λ|tk))dtk]

fk(λ) = exp[∫Gama(tk|k, λ) log(Gama(λ|k + 1, tk))dtk]

= exp[∫Gama(tk|k, λ) log(

tk−1

Γ(k + 1)λk+1−1eλtk)dtk]

= exp[(k + 1)∫

log(tk)Gama(tk|k, λ)dtk − log(Γ(k + 1))∫Gama(tk|k, λ)dtk

−(k + 1− 1) log(λ)− λ∫tkGama(tk|k, λ)dtk

= exp[(k + 1)[ψ(k)− log(λ)]− log(Γ(k + 1)) + (k + 1− 1) log(λ)− λk

λ

= exp[(k + 1)ψ(k)− (k + 1) log(λ)− log(Γ(k + 1)) + (k + 1) log(λ)− log(λ)− k

7

Page 9: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

=exp[(k + 1)ψ(k)− k]

Γ(k + 1)λ−1

fk(λ) = Ckλ−1 onde Ck =

exp[(k + 1)ψ(k)− k]Γ(k + 1)

e uma constante que nao contem λ.Entretanto usando (2) o limite de fk(λ) quando k →∞ e

f(λ) = limk→∞

Ckλ−1

Ckλ−10

= limk→∞

λ0

λ=λ0

λ.

Temos quef(λ) ∝ λ−1

f(λ) e uma funcao priori permissıvel e a priori de referencia e

π(λ) = f(λ) =1λ

(12)

Combinando a priori de referencia (12) e funcao de verossimilhanca (8) pelo uso do teorema de Bayes adistribuicao a posteriori de referencia depois dos dados observados e

π(λ|D) =rn

Γ[n]λ−(n+1)e−

rλ . (13)

Assim que, π(λ|D) tem uma distribuicao Gama Invertida com parametros n e r o qual e uma distribuicaopropria para todos os possıveis conjuntos de dados. A Figura (2) representa a densidade a priori (12) eposteriori (13) de referencia respectivamente

Figure 2: Funcao de densidade a prior e posteriori de referencia para λ

8

Page 10: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Priori de referencia sob normalidade assintotica

Considere zk = x1, ..., xk uma amostra de tamanho k de uma observacao de M . Seja λk = x umestimador de maxima verossimilhanca de λ o qual e consistente.

Considerando h(λ) = 1, p(λ|λk) tem distribuicao Gama(k + 1, kλk) que e assintoticamente normal comdesvio padrao s(λk)/k.

Como o modelo e regular, isto e, tem derivada primeira e segunda e e unimodal, podemos encontrar ainformacao de Fisher

As derivadas primeira e segunda do logaritmo da funcao de verossimilhanca (9) sao dadas por:

∂l(λ)∂λ

=−nλ

+∑ni=1 tiλ2

∂2l(λ)∂λ2

=n

λ2−

2∑ni=1 tiλ3

A informacao de Fisher e dado por,

i(λ) = E

[−∂

2l(λ)∂λ2

]=

n

λ2∝ 1λ2

Assim, utilizando o Teorema 1, a priori de referencia para o modelo Exponencial e igual priori de Jeffreys,dada por i(λ)1/2, isto e,

π(λ) ∝ 1λ. (14)

Combinando (8) e (14) e usando o teorema de Bayes para derivar a correspondente posteriori de referenciadado os dados observados, temos que a distribuicao a posteriori de referencia e dada como em (13)

Alternativamente considerando as condicoes do teorema 2 segue diretamente que

fak (λ) = π(λ|λk)|λk=λ =kk

Γ[k]λ−kλk

k−1e−k = cks(λ)−1

onde ck = kk

Γ[k]e−k e s(λ)−1 = λ−1. A priori de Jeffreys e o caso particular o qual e obtido quando

s(λ)−1 = i(λ)−1/2

5 Priori de referencia para funcao de sobrevivencia do modeloExponencial

Considerando que em geral o interesse do pesquisador e a funcao de sobrevivencia S = S(t), apresentamosa analise de referencia para a funcao de sobrevivencia do modelo exponencial (5).

Para encontrarmos a funcao a priori de referencia, primeiramente, consideramos a transformacaoS = exp

− t0λ

para t0 fixo e λ = − t0

log(S) . Assim a funcao de densidade (5) pode ser reescrita como,

f(t|S, t0) =log(1/S)

t0S

tt0 (15)

A funcao de verossimilhanca considerando∑ni=1 ti = r e dada por

9

Page 11: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

L(S) =(

log(1/S)t0

)nS

rt0 (16)

A figura (3) mostra a funcao de verossimilhanca (16), onde observamos que ela e aparentemente bemcomportada, possuindo um ponto de maximo e se assemelha a funcao de verossimilhanca de um modeloNormal.

Figure 3: Funcao de verossimilhanca (16)

Aplicando o logaritmo na funcao de verossimilhanca (16), temos:

l(S) ∝ n log(

log(

1S

))− r

t0log(

1S

). (17)

As derivadas primeira e segunda de (17) sao dadas por:

∂l(S)∂S

=r

St0− 1S log(1/S)

∂2l(S)∂S2

=r

S2t0+

1S2 log(1/S)2

− 1S2 log(1/S)

Calculando a informacao de Fisher temos:

i(S) =n− log(S) + n log(S)

S2 log(S)2

Fazendo uso do Teorema 1 temos que a priori de referencia para a funcao de sobrevivencia para o modeloexponencial e dada por,

π(S) ∝√n− log(S) + n log(S)

S log(S)(18)

A figura (4) mostra o grafico da priori de referencia (18) para a funcao de sobrevivencia S.Combinando a priori de referencia (18) e a funcao de verossimilhanca (16) temos que a distribuicao a

posteriori de referencia e dada por

10

Page 12: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Figure 4: Funcao a priori de referencia para a funcao de sobrevivencia, S, do modelo Exponencial.

π(S|r, t0) =(r/t0)n

Γ[n]S( rt0

)−1 log(1/S)n−1, 0 < S < 1 (19)

em que π(S|r, t0) tem uma distribuicao a posteriori de referencia Log-Gama Negativa (Martz e Waller, 1982)com parametros n e r

t0. Nesse caso nao somente obtemos uma distribuicao a posteriori para S, mas tambem

encontramos uma distribuicao conhecida.A media e a variancia posteriori de S sao respectivamente,

E(S) =[

r

r + t0

]ne

V (S) =[

r

r + 2t0

]n−[

r

r + t0

]2n

.

Considerando dados numericos para diferentes valores de t0. A Figura (5) mostra a distribuicao aposteriori de S Log-Gama Negativa.

11

Page 13: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Figure 5: Densidade a posteriori de referencia para S

5.1 Aplicacao

Considere o conjunto de dados que foi estudado em Martz e Waller(1982), os dados sao os tempos de falhade um novo tipo de valvulas de sodio na aplicacao de um reator nuclear. As valvulas foram sometidos a umteste acelerado, isto foi feito pelo fato que Bott e Hass(1978) desejavam estimar a taxa de falha, assim foramconsiderados para este teste 20 valvulas. O teste foi aplicado nas valvulas ate chegar numa quinta falha.Para esse estudo foi considerado a censura tipo II, porem neste exemplo os dados serao considerados semcensura, nestas condicoes temos que tempo total observado foi r = 160, 000 horas e consideramos t0 = 4000horas como em Martz e Waller(1982). Na figura (6) apresentamos a distribuicao a posteriori para S que edefinida como

π(S|1, 6× 105, 4× 103) =1

Γ(20)(40)20S39 log (1/S)19

, 0 < S < 1, (20)

onde a media e a variancia a posteriori sao respectivamente

E(R|1, 6× 105, 4× 103) =[

1, 6× 105

1, 6× 105 + 4× 103

]20

= 0.6103

V (R|1, 6× 105, 4× 103) =[

1, 6× 105

1, 6× 105 + 2× 4× 103

]20

−[

1, 6× 105

1, 6× 105 + 4× 103

]2×20

= 4.4589× 10−3

12

Page 14: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

0.0 0.2 0.4 0.6 0.8 1.0

0

1

2

3

4

5

6

s

Den

sida

de

Figure 6: Distribuicao a posteriori para o exemplo

6 Consideracoes Finais

Uma variedade de metodos de derivar prioris nao-informativa tem sido desenvolvido e aplicado para umaampla variedade de modelos estatısticos. Neste artigo demos enfase para a priori de referencia introduzidapor Bernardo em 1979, onde sumarizamos a construcao da priori no caso uniparametrico seguindo a ideiade Bernardo (2005). Nos consideramos tres opcoes para encontrar a priori de referencia, de forma explicita, sob normalidade assintotica (Teorema 1) e sob condicoes de regularidade (Teorema 2). O objetivo destetrabalho foi mostrar de forma simples e objetiva a metodologia para a construcao da priori de referencia,a qual fornece um metodo geral para derivar distribuicoes a priori nao informativa, generaliza muitos dosmetodos alternativos propostos e os inclui, como casos especiais, as solucoes apropriadas que tais metodosapresentam em contextos especıficos.

Ilustramos a metodologia atraves de um importante modelo de sobrevivencia, construindo a distribuicaoa posteriori de referencia para os parametros e para a funcao de sobrevivencia do modelo exponencial, ondeencontramos uma forma fechada e conhecida para a distribuicao a priori da funcao de sobrevivencia, adistribuicao Log-Gama Negativa, a qual pode ser trivialmente implementada. Assim consideramos comoaplicacao um simples exemplo ja estudado na literatura (ver Martz e Waller, 1982).

Note que as funcoes a priori de referencia nao foram propostas como uma aproximacao para as crencaspessoais dos cientistas, mas sim como uma colecao de consensos formais para as funcoes a priori que poderiamser convenientemente utilizadas como padroes de comunicacao. Assim que pesquisadores com informacao apriori subjetiva pode comparar suas distribuicoes a posteriori com a distribuicao de referencia encontradaneste artigo. A mesma tecnica utilizada aqui neste trabalho pode ser desenvolvida para outros modelos desobrevivencia.

A grande crıtica ao uso de priori objetiva vem de bayesianos subjetivista, que argumentam que a pri-ori devera ser uma expressao honesta do conhecimento previo do analista e nao uma funcao do modelo,especialmente se isso envolve integracao sobre o espaco amostral e, portanto, possa violar o princıpio deverossimilhanca. No entanto, do ponto de vista fundacional, a derivacao de uma posterior de referencia deve

13

Page 15: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

ser visto como parte de uma analise de sensibilidade saudavel, onde se deseja analisar as mudancas na poste-rior de interesse induzidas por mudancas na priori. Uma posterior referencia e apenas uma resposta para oque se questiona, ou seja, o que poderia ser dito sobre a quantidade de interesse com base nos dados, se umconhecimento a priori e dominados pelos dados. Se o experimento for alterado a priori de referencia podeser esperado mudar correspondentemente, se a informacao a priori subjetiva e especificada, a correspondenteposteriori poderia ser comparada com a posteriori de referencia, a fim de avaliar a importancia relativa dasopinioes iniciais no final de inferencia.

Para alguem especificamente interessados em distribuicoes de referencia, o documento original, Bernardo(1979), e de facil leitura e e seguido por uma discussao muito atrativa; Bernardo (1981) estende a teoriaa pro-blemas de decisao geral; Berger e Bernardo (1989, 1992c) contem cruciais extensoes matematicas.Bernardo (2005) apresenta um texto de formulacao geral e uma descricao nıvel livro-texto de analise dereferencia e fornecido em Bernardo e Smith (1994, cap. 5.4).

7 Reference

Bayes, T. (1763). An essay towards solving a problem in the doctrine of chances. Published posthumouslyin Phil. Trans. Roy. Soc. London 53, 370418 and 54, 296325. Reprinted in Biometrika 45 (1958),293315, with a biographical note by G. A. Barnard.

Berger, J. O. (2000). Bayesian analysis: A look at today and thoughts of tomorrow. J. Amer. Statist.Assoc. 95, 12691276.

Berger, J. O. e Bernardo, J. M. (1989). Estimating a product of means: Bayesian analysis with referencepriors. J. Amer. Statist. Assoc. 84, 200-207.

Berger, J. O. and Bernardo, J. M. (1992a). Ordered group reference priors with applications to a multino-mial problem. Biometrika 79, 25–37.

Berger, J. O. and Bernardo, J. M. (1992b). Reference priors in a variance components problem. BayesianAnalysis in Statistics and Econometrics (P. K. Goel and N. S. Iyengar, eds.) Berlin: Springer, 323–340.

Berger, J. O. and Bernardo, J. M. (1992c). On the development of reference priors. Bayesian Statistics4 (J. M. Bernardo, J. O. Berger, A. P. Dawid and A. F. M. Smith, eds.) Oxford: University Press,35–60 (with discussion).

Berger, J. O., Bernardo, J. M. and Sun, D. (2005). Reference priors from first principles: A generaldefinition. Tech. Rep., SAMSI, NC, USA.

Bernardo, J. M. (1979). Reference posterior distributions for Bayesian inference.J. Roy. Statist. Soc. B41, 113–147 (with discussion). Reprinted in Bayesian Inference (N. G. Polson and G. C. Tiao, eds.)Brookfield, VT: Edward Elgar, 1995, 229–263.

Bernardo, J. M. (1980). A Bayesian analysis of classical hypothesis testing. Bayesian Statistics (J. M.Bernardo, M. H. DeGroot, D. V. Lindley and A. F. M. Smith, eds.) Valencia: University Press,605–647 (with discussion).

Bernardo, J. M. (1981). Reference decisions. Symposia Mathematica 25, 8594.

Bernardo, J.M. (2005). Reference analysis, in: D.K. Dey and C.R. Rao, eds., Handbook of Statistics, Vol.25 (Elsevier, Amsterdam) 17-90.

Bernardo, J. M. and Smith, A. F. M. (1994). Bayesian Theory. Chichester: Wiley. Blyth, S. and Smith,A. F. M. (1998). Bayesian meta-analysis of frequentist p-values. Comm. Statist. Theory and Methods27, 2707–2724.

14

Page 16: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

Box, G. E. P. and Tiao, G. C. (1973). Bayesian Inference in Statistical Analysis. Reading, MA: Addison-Wesley.

Casella, G. (1996). Statistical inference and Monte Carlo algorithms. Test 5, 249 344 (with discussion).

Colosimo, E.A.; Giolo, S.R.. Analise de Sobrevivencia Aplicada. ABE - Projeto Fisher, Sao Paulo, 2006.

Cox, D. R.; Snell, E. J. (1981). Applied Statistics, Science Paperbacks. Chapman and Hall, London.

de Finetti, B. (1970). Teoria delle Probabilit 1. Turin: Einaudi. English translation as Theory of Probability1 in 1974, Chichester: Wiley.

Hadjicostas, P. (1998). Improper and proper posteriors with improper priors in a hierarchical model witha beta-Binomial likelihood. Comm. Statist. Theory and Methods 27, 19051914.

Hobert, J. P. and Casella, G. (1996). The effect of improper priors on Gibbs sampling in hierarchical linearmixed models. J. Amer. Statist. Assoc. 91, 14611473.

Hobert, J. P. and Casella, G. (1996). Functional compatibility, markov chains and Gibbs sampling withimproper posteriors. J. Comp. Graphical Statist. 7, 42-60.

Jeffreys, H. (1946). An invariant form for the prior probability in estimation problems. Proc. Roy. Soc. A186, 453–461.

Laplace, P. S. (1825). Essai Philosophique sur les Probabiliti´es. Paris: Courcier (5th ed). Englishtranslation in 1952 as Philosophical Essay on Probabilities. New York: Dover.

Lawless, J.F. (1982). Statisctical Models and Methods for Life Time Data. New York: Jonh Wiley.

Lindley, D. V. (1961). The use of prior probability distributions in statistical inference and decision. Proc.Fourth Berkeley Symp. 1 (J. Neyman and E. L. Scott, eds.) Berkeley: Univ. California Press, 453468.

Lindley, D. V. (1965). Introduction to Probability and Statistics from a Bayesian Viewpoint. Cambridge:University Press.

Martz, H.F. and Waller P. A. (1982). Bayesian Realibility Analysis, J. Wiley New York, NY.

Palmer, J. L. and Pettit, L. I. (1996). Risks of using improper priors with Gibbs sampling and autocorrelatederrors. J. Comp. Graphical Statist. 5 245 - 249.

Press, S. J. (1972). Applied Multivariate Analysis: using Bayesian and Frequentist Methods of Inference.Second edition in 1982, Melbourne, FL: Krieger.

Savage, L. J. (1954). The Foundations of Statistics. New York: Wiley. Second edition in 1972, New York:Dover.

Zellner, A. (1971). An Introduction to Bayesian Inference in Econometrics. New York: Wiley. Reprintedin 1987, Melbourne, FL: Krieger.

Abstract

In Bayesian inference is often desirable to find posterior density mainly reflecting the information of thesample data. So it is important to consider a priori density which adds little information for the sample.In the literature there are many proposed eg Jeffreys (1967), Lindley (1963.1961), Bernard (1979), Zelner(1984), etc.. This paper offers an introduction to Bayesian reference analysis, often regarded as the moresuccessful method to produce non-subjective, model-based, posterior distributions. The goal is to present themethodology to build a specific function priori and posterior of reference to the unknown parameters of the

15

Page 17: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

proposed model, which is dominated by the observed data. the idea are illustrated with an interesting modelof survival, the exponential model, where the results found in this study led to a priori and a posterioridistributions known in the literature and may be used to estimate parameters of interest. Signposts areprovided to the huge related literature.

Agradecimentos

Ao CNPq pelo financiamento do Projeto-Bolsa PIBIC de inciciacao cientıfica da UFSCar

16

Page 18: UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE … · e explorado para estudo de tempo de vida e a distribui˘c~ao exponencial. Neste trabalho consideramos o

PUBLICAÇÕES 2011

. LOUZADA-NETO, F.; MARCHI, V.; ROMAN, M.; “The Exponentiated Exponential-

Geometric Distribution: A distribution with decreasing, increasing and unimodal hazard

function” Janeiro/2011 Nº 235

. LOUZADA-NETO, F; SUZUKI, A. K.; CANCHO, V. G.; “The FGM Long-Term

Bivariate Survival Copula Model: Modeling, Bayesian Estimation and case influence

diagnostics” Janeiro/2011 Nº 236

. CALSAVARA, V. F.; TOMAZELLA, V. L. D.; FOGO, J. C.; “Modelos de

Sobrevivência com Fração de Cura para Dados de Tempo de Vida Weibull Modificada

Generalizada” Fevereiro/2011 Nº 237

. CALSAVARA, V. F.; TOMAZELLA, V. L. D.; FOGO, J. C.; “O Efeito do Termo de

Fragilidade no Modelo de Mistura Padrão”, Fevereiro/2011 Nº 238

. MILANI, E. A., TOMAZELLA, V. L. D., DIAS, T. C. M., LOUZADA, F. “The

generalized time-dependent logistic frailty model: na application to a population-based

prospective study of incidente cases of lung cancer diagnosed in Northern Ireland”

Março/2011 Nº 239

. DIAS, T. C. M., TOMAZELLA, V. L. D., MILANI, E. A. “Estimação Bayesiana

Objetiva do Modelo de Regressão de Feigl e Zelen” Abril/2011 Nº 240