universidade federal do rio de janeiro modelos dinamicos … · orientador: dani gamerman rio de...

Universidade Federal do Rio de Janeiro

MODELOS DINAMICOS E ESTATICOS DE

SOBREVIVENCIA COM FRAGILIDADE

ESPACIAL

Leonardo Soares Bastos

2003

UFRJ

Modelos Dinamicos e Estaticos de

Sobrevivencia com Fragilidade Espacial


Dissertacao de Mestrado submetida ao Programa

de Pos-graduacao em Estatıstica do Instituto

de Matematica da Universidade Federal do Rio

de Janeiro como parte dos requisitos necessarios

para obtencao do grau de Mestre em Ciencias

Estatısticas.

Orientador: Dani Gamerman

Rio de Janeiro

Dezembro de 2003




Orientador: Prof. Dani Gamerman

Dissertacao de Mestrado submetida ao Programa de Pos-gra-

duacao em Estatıstica do Instituto de Matematica da Universi-

dade Federal do Rio de Janeiro como parte dos requisitos necessarios

para obtencao do grau de Mestre em Ciencias Estatısticas.

Aprovada por :

Presidente, Prof. Dani Gamerman

Prof. Helio S. Migon

Profa. Silvia Shimakura

Rio de Janeiro

Dezembro de 2003

Bastos, Leonardo Soares

Modelos Dinamicos e Estaticos de Sobrevivencia com Frag-

ilidade Espacial / Leonardo Soares Bastos. - Rio de Janeiro:

UFRJ/IM, 2003.

xi, 163f.: il.; 31cm.

Orientador: Dani Gamerman

Dissertacao (mestrado) - UFRJ/IM/ Programa de Pos-

graduacao em Estatıstica, 2003.

Referencias Bibliograficas: f.137-142.

1. Analise de Sobrevivencia. 2. Estatıstica Bayesiana. 3.

Estatıstica Computacional. 4. Modelos Dinamicos I. Gamerman,

Dani II. Universidade Federal do Rio de Janeiro, Instituto de

Matematica. III. Tıtulo.

Resumo





Resumo da Dissertacao de Mestrado submetida ao Programa de Pos-

graduacao em Estatıstica, Instituto de Matematica, da Universidade Fede-

ral do Rio de Janeiro - UFRJ, como parte dos requisitos necessarios para

obtencao do grau de Mestre em Ciencias Estatısticas.

Os Modelos de sobrevivencia com fragilidade espacial alem de explicar

qual e o efeito de covariaveis no risco de um indivıduo falhar, eles visam

descrever a heterogeneidade nao observada entre as unidades em estudo com

alguma informacao espacial, introduzida no termo latente (fragilidade). A

modelagem sera inicialmente baseada nos modelos de riscos proporcionais

onde a funcao de risco de base sera ajustada de tres maneiras: supondo uma

forma parametrica, usando processos Gama e usando modelos dinamicos.

Uma outra forma de modelagem e baseada em modelos dinamicos de so-

brevivencia que supoem covariaveis dependentes do tempo. A fragilidade

espacial sera modelada usando processos Gaussianos. As estimativas serao

obtidas atraves de metodos computacionais baseados em MCMC. A aplicacao

sera feita a dois conjuntos de dados: um estudo de sobrevivencia de pessoas

residentes na Inglaterra que sofrem de Leucemia e uma estudo do tempo no

emprego nos municıpios do Rio de Janeiro no setor industrial.

Palavras-chave: Analise de sobrevivencia Bayesiana, Modelos de sobrevivencia

dinamicos, Modelos Semiparametricos, Geoestatıstica.

Abstract

Spatial Frailty Dynamic and

Static Survival Models



Abstract da Dissertacao de Mestrado submetida ao Programa de Pos-

graduacao em Estatıstica, Instituto de Matematica, da Universidade Fede-

ral do Rio de Janeiro - UFRJ, como parte dos requisitos necessarios para

obtencao do grau de Mestre em Ciencias Estatısticas.

Spatial frailty survival models besides explaining which is the covari-

ates effect in the risk of an individual to fail, aim at describing non-observed

heterogeneity between the units in the study with some spatial information,

introduced in a latent term (frailty). The modeling will be initially based on

proportional risk models where the baseline hazard function will be adjusted

in three ways: assuming parametric form, using Gamma processes and using

dynamic models. Another form of modeling is based on survival dynamic

models, that assume that the covariates effect can change over time. The

spatial frailty will be modeled using Gaussian processes. The estimates will

be based on computational methods using MCMC. The models will be ap-

plied to two data sets: a study of survival of residents in England who suffer

from Leukemia and a study of the employment duration time in the indus-

trial sector in the State of Rio de Janeiro.Key-words: Bayesian Survival Analysis,

Dynamic Survival Models, Semiparametrics Models, Geostatistics.

Agradecimentos

Em primeiro lugar a Deus. (E aos seus santos tambem.)

A Thaıs pelo apoio em todos os sentidos e por simplesmente ter apare-

cido na minha vida.

Ao cla dos Bastos, pelo apoio que eu sempre tive durante a minha

caminhada meu pai (Francisco), minha mae (Cleusa) e meu unico irmao

(Breno).

Gostaria de agradecer a todos os professores que me fizeram seguir

por esse caminho. Principalmente ao professor Dani, que pra mim foi uma

honra te-lo como orientador durante o mestrado, e as professoras Rosangela

e Cibele Queiroz da UFMG, que me orientaram durante a graduacao e eu

serei eternamente grato a elas.

Nao poderia de deixar de agradecer aos meus amigos. Os amigos

do bairro (Palmeiras-BH), dando um destaque para Lucio (Sasaki Kojiro

ou Lucin), Jason (Peacemaker), Gleison (Piledrivermaker), Valeria (Val) e

Flavia Komatsuzaki (Flavinha) que foram grandes companheiros e estao

quase sempre on-line. Aos amigos da UFMG, Cristiano (Negao), Inara, Paula

(Paulete), Roseli (Aose), Leonardo (Leo Giradi), Rafael e mais alguns que

i

estudaram comigo ou fizeram parte das horas de truco no centro de estudos,

nas longas viagens pro ENESTE e nas festas e calouradas da Federal. E no

Rio, eu destaco Aline, Cristiane, Rafael e o Zim, quero dizer o Gustavo, que

sao pessoas que eu admiro.

Outros fatos extremamente importantes nesse perıodo que passei cur-

sando o mestrado foram: O Cruzeiro Esporte Clube, que no ano de minha

defesa conseguiu a trıplice coroa ganhando o campeonato estadual, a Copa

do Brasil (pela quarta vez) e o campeonato brasileiro (tıtulo inedito para o

clube). O Metal que sempre foi o fundo musical durante o desenvolvimento

dessa dissertacao, algumas bandas eu posso destacar Nightwish, Sratovarius,

Symphony X, Blind Guardian, Angra e Shaman. E para finalizar as revistas

que li em sua grande maioria Mangas que eu gostaria de destacar Samurai

X, Cavaleiros do Zodıaco e Dragon Ball.

ii

Sumario

1 Introducao 1

1.1 Conceitos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Especificacao da Verossimilhanca . . . . . . . . . . . . . . . . 4

1.3 Modelos de Regressao . . . . . . . . . . . . . . . . . . . . . . . 5

1.4 Modelos de Fragilidade . . . . . . . . . . . . . . . . . . . . . . 7

1.5 Sumario da dissertacao . . . . . . . . . . . . . . . . . . . . . . 8

2 Inferencia Bayesiana 11

2.1 Conceitos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2 Monte Carlo via Cadeias de Markov . . . . . . . . . . . . . . . 14

2.2.1 Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . 15

2.2.2 Algoritmo de Metropolis-Hastings . . . . . . . . . . . . 16

2.2.3 Verificacao de Convergencia . . . . . . . . . . . . . . . 19

iii

2.3 Modelos Dinamicos . . . . . . . . . . . . . . . . . . . . . . . . 20

2.4 Geoestatıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Modelos Estaticos de Sobrevivencia 29

3.1 Definicao do Modelo . . . . . . . . . . . . . . . . . . . . . . . 30

3.2 Coeficientes de Regressao . . . . . . . . . . . . . . . . . . . . . 31

3.3 Funcao de Risco de Base . . . . . . . . . . . . . . . . . . . . . 32

3.3.1 Processos Parametricos . . . . . . . . . . . . . . . . . . 33

3.3.2 Processos Gama . . . . . . . . . . . . . . . . . . . . . . 35

3.3.3 Processos Correlacionados . . . . . . . . . . . . . . . . 38

3.3.4 Outros processos a priori . . . . . . . . . . . . . . . . . 41

3.4 Estudo Simulado . . . . . . . . . . . . . . . . . . . . . . . . . 42

4 Modelos de Fragilidade Espacial 50

4.1 Por que usar modelos com Fragilidade Espacial? . . . . . . . . 51

4.2 O Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3 Coeficientes de Regressao . . . . . . . . . . . . . . . . . . . . . 54

4.4 Funcao de Risco de Base . . . . . . . . . . . . . . . . . . . . . 54

4.4.1 Processos Parametricos . . . . . . . . . . . . . . . . . . 55

4.4.2 Processos Gama . . . . . . . . . . . . . . . . . . . . . . 55

iv

4.4.3 Processos Correlacionados . . . . . . . . . . . . . . . . 57

4.5 Fragilidade Espacial . . . . . . . . . . . . . . . . . . . . . . . . 58

4.6 Estudo simulado . . . . . . . . . . . . . . . . . . . . . . . . . 60

5 Modelos Dinamicos de Sobrevivencia com e sem Fragilidade

Espacial 76

5.1 Modelo Dinamico de Sobrevivencia . . . . . . . . . . . . . . . 78

5.2 Modelo Dinamico de Fragilidade Espacial . . . . . . . . . . . 81

5.3 Estudo Simulado . . . . . . . . . . . . . . . . . . . . . . . . . 85

6 Aplicacao a dados reais 96

6.1 Dados de Leucemia na Inglaterra . . . . . . . . . . . . . . . . 97

6.2 Dados de tempo no emprego . . . . . . . . . . . . . . . . . . . 114

7 Conclusoes e Trabalhos Futuros 134

Referencias Bibliograficas 137

Apendice 143

v

Capıtulo 1

Introducao

O objetivo desta dissertacao e apresentar uma analise Bayesiana de modelos

de sobrevivencia com fragilidade espacial. Esses modelos alem de explicar

o risco do indivıduo de falhar sob o efeito de covariaveis, como os modelos

de regressao em analise de sobrevivencia, visam descrever a heterogeneidade

nao observada entre as unidades em estudo levando em consideracao alguma

informacao espacial das observacoes.

O modelo de fragilidade espacial e uma extensao do modelo de frag-

ilidade, proposto inicialmente por Clayton (1978), onde ao efeito aleatorio

introduzido na funcao de risco sera incorporado uma estrutura espacial.

Essa estrutura sera modelada usando processos gaussianos utilizados em

Geoestatıstica, onde a informacao espacial esta contida na estrutura de cor-

relacao dos dados. Os modelos de fragilidade espacial sao bem mais recentes

que os modelos de fragilidade, Carlin e Banerjee (2002) e Henderson et al.

(2002) abordaram esse tema em seus trabalhos, os primeiros usando modelos

Condicionais Autoregressivos (CAR) e os segundos usando modelos Gama

1

Multivariados. Extendendo os modelos de fragilidade espacial sera apresen-

tada uma modelagem com parametros variando no tempo, usando modelos

dinamicos.

Na Secao 1.1 serao descritos os conceitos basicos em analise de so-

brevivencia. Na Secao 1.2 sera descrito como a funcao de verossimilhanca e

especificada. Na Secao 1.3 serao descritos os modelos de regressao em analise

de sobrevivencia e como sao introduzidas as covariaveis no modelo. Na Secao

1.4 sera feita uma breve apresentacao dos modelos de fragilidade onde sera

mostrado como o efeito de fragilidade e incorporado ao modelo. Um sumario

dessa dissertacao sera apresentado na Secao 1.5 .

1.1 Conceitos Basicos

Os dados de sobrevivencia consistem no tempo ate a ocorrencia de um de-

terminado evento, que sera chamado de morte ou falha. Uma caracterıstica

desse tipo de dado e a possibilidade da nao observacao do evento de interesse

em algumas observacoes, que pode ser uma censura ou um truncamento.

Dados truncados sao aqueles que para entrar no estudo foram sujeitos a um

condicionamento. Dados censurados sao divididos em tres tipos; censura a

direita, onde tudo que se sabe e que o evento ainda nao ocorreu ate o instante

observado, censura a esquerda, onde tudo o que se sabe e que o evento ocorreu

em algum instante de tempo antes do inıcio do estudo, e censura intervalar, e

aquela em que se sabe que o evento ocorreu dentro de um intervalo de tempo

conhecido. Nesta dissertacao apenas a modelagem com censura a direita sera

abordada. A ocorrencia ou nao de censura sera indicada por uma variavel

indicadora de falha, que vale 1 se a observacao falhou e 0 se foi censurada.

2

Alem do tempo de sobrevivencia e da variavel indicadora de falha, os da-

dos de sobrevivencia podem conter um conjunto de variaveis observaveis que

podem estar relacionadas com estes tempos. Estas variaveis sao conhecidas

por covariaveis ou variaveis explicativas. Quando os tempos de sobrevivencia

estao relacionados com as covariaveis diz-se que a populacao e heterogenea.

Caso contrario a populacao e dita homogenea.

Seja T uma variavel aleatoria (v.a.) que representa o tempo de so-

brevivencia de uma observacao com funcao de densidade f(t). A funcao de

sobrevivencia, S(t), e definida por

S(t) = Pr(T > t) (1.1)

onde T e uma variavel aleatoria contınua nao negativa.

A formulacao dos modelos de sobrevivencia e feita usualmente pela

funcao de risco, h(t), definida por

h(t) = lim∆→0+

Pr(t < T < t + ∆|T > t)

∆(1.2)

e a funcao de risco acumulada, H(t), e dada por

H(t) =∫ t

0h(u)du, t > 0 (1.3)

Sera assumido que os tempos de sobrevivencia sao variaveis aleatorias

absolutamente contınuas. Portanto, a funcao de risco determina completa-

mente a distribuicao de probabilidade destes tempos. As principais relacoes

entre f , S e h sao definidas a seguir. De (1.1), obtem-se que

f(t) = − d

dtS(t), (1.4)

e de (1.2) tem-se que

h(t) = lim∆→0+

Pr(t < T < t + ∆|T > t)

∆

3

=1

Pr(T > t)lim

∆→0+

Pr(t < T < t + ∆)

∆

=f(t)

S(t)(1.5)

Como T e uma v.a. positiva, h(t) = 0, t < 0. Substituindo (1.4) em

(1.5) e resolvendo a equacao para S(t),

S(t) = exp{−

∫ t

0h(u)du

}= exp {−H(t)} . (1.6)

Note que a funcao de risco e suficiente para especificar a distribuicao

de probabilidade da variavel, pois pode-se escrever a funcao de densidade de

probabilidade como funcao da funcao de risco, ou seja, usando (1.5) e (1.6)

tem-se que

f(t) = h(t) exp{−

∫ t

0h(u)du

}. (1.7)

1.2 Especificacao da Verossimilhanca

A contribuicao para a funcao de verossimilhanca para uma observacao que fal-

hou e a funcao de densidade, mas se a observacao for censurada a informacao

que se tem em maos e que a observacao sobreviveu ate aquele instante de

tempo, portanto a contribuicao para a funcao de verossimilhanca de um in-

divıduo que foi censurado e a funcao de sobrevivencia. A distincao entre falha

e censura e feita atraves da variavel indicadora de falha, δ. Desta forma, a

contribuicao, p(t), para a funcao de verossimilhanca de uma observacao e

dada por:

p(t) = f(t)δS(t)1−δ. (1.8)

Seja uma amostra de tamanho n de dados de sobrevivencia onde supoe-

4

se independencia e que as observacoes sejam provenientes de uma mesma

populacao, homogenea ou nao. A funcao de verossimilhanca e dada por

L(t1, . . . , tn) =n∏

i=1

p(ti)

=n∏

i=1

f(ti)δiS(ti)

1−δi . (1.9)

Usando as relacao (1.5) e (1.6) em (1.9) a funcao de verossimilhanca e

reescrita por

L(t1, . . . , tn) =n∏

i=1

h(ti)δi exp

{−

∫ ti

0h(u)d(u)

}. (1.10)

1.3 Modelos de Regressao

Frequentemente os dados de sobrevivencia sao provenientes de populacoes

heterogeneas, implicando na observacao de um conjunto de covariaveis jun-

tamente com os tempos de sobrevivencia. Portanto, e interessante conhecer

a influencia das covariaveis nos tempos de sobrevivencia, justificando o in-

teresse nos modelos de regressao.

O efeito das covariaveis em analise de sobrevivencia e expresso atraves

da funcao de risco. Nesta dissertacao, serao considerados apenas efeitos

multiplicativos. O principal modelo multiplicativo e o modelo de riscos pro-

porcionais ou modelo de Cox, (Cox, 1972), que e definido por

h(t|X, β) = h0(t)G(X; β) (1.11)

onde t e o tempo observado, X = (X1, . . . , Xp) e o vetor de covariaveis. Os co-

eficientes β = (β1, . . . , βp)T sao conhecidos por Coeficientes de Regressao.

A funcao h0(t) e conhecida por Funcao de Risco de Base e a funcao G(., .)

5

e uma funcao positiva, usualmente G(X; β) = exp{Xβ} e que tambem sera

a funcao utilizada nessa dissertacao. Assim (1.11) e reescrito como

h(t|X, β) = h0(t) exp{Xβ}. (1.12)

Este modelo e chamado de modelo de riscos proporcionais, pois a razao das

taxas de falha de dois indivıduos e constante no tempo, isto e, a razao das

funcoes de risco para dois indivıduos diferentes, i e j, e

h(t|Xi, β)

h(t|Xj, β)=

h0(t) exp{Xiβ}h0(t) exp{Xjβ}

= exp{Xiβ −Xjβ}

que nao depende do tempo. A funcao de verossimilhanca para os modelos de

regressao de riscos proporcionais e obtida, aplicando (1.12) em (1.10)

L(β, h0) =n∏

i=1

(h0(ti)e

Xiβ)δi

exp{−H0(ti)e

Xiβi

}(1.13)

onde H0(ti) e a funcao de risco de base acumulada, i = 1, . . . , n.

Quando a funcao de risco de base, h0(t), e especificada, ou seja, a funcao

tem uma forma parametrica conhecida, o modelo e chamado parametrico.

Mas quando a funcao h0(t) e nao especificada, o modelo e dividido em duas

partes: uma parametrica, associada aos coeficientes de regressao e a outra nao

parametrica, associada a funcao de risco de base. Esse modelo e conhecido

por semiparametrico.

O modelo de riscos proporcionais supoe que as covariaveis nao de-

pendem do tempo como extensao para o modelo de Cox. Seja X(t) =

(X1(t), . . . , Xp(t)) um conjunto de covariaveis no tempo t, a versao do modelo

de Cox com variaveis dependentes do tempo e dada atraves da substituicao

de X por X(t) em (1.12), ou seja,

h(t|X, β) = h0(t) exp{X(t)β} (1.14)

6

Uma outra extensao para os modelos de Cox com variaveis dependentes

do tempo foi proposta por Gamerman (1991). Ele propos uma classe de

modelos baseada em modelos dinamicos, que elimina o problema da suposicao

de riscos proporcionais e faz com que o modelo de riscos proporcionais seja

um caso particular, essa abordagem sera utilizada nessa dissertacao.

Uma outra forma de incluir covariaveis no modelo e usando modelos adi-

tivos, onde o principal modelo e o modelo de Aalen (1980). Essa modelagem

assim como, a classe de modelos de Gamerman(1991) e a classe extendida dos

modelos de Cox (1972), aceita covariaveis dependentes do tempo. A funcao

de risco do modelo de Aalen e dada por

h(t|X(t)) = α0(t) + ζ(X(t)α(t)) (1.15)

onde α(t) = [α1(t), . . . , αp(t)]T e α0(t) sao funcoes nao especificadas, X(t) =

(X1(t), . . . , Xp(t)) e o vetor de covariaveis dependentes do tempo e ζ(.) e uma

funcao positiva usualmente ζ(x) = x.

1.4 Modelos de Fragilidade

Os modelos de fragilidade sao caracterizados pela introducao de um efeito

aleatorio na funcao de risco. Clayton (1978) e Vaupel, Manton e Vallard

(1979) foram os primeiros a trabalhar com esta classe de modelos, o nome

fragilidade foi introduzido no segundo trabalho. A forma usual de se intro-

duzir a fragilidade no modelo de Cox e

h(t|X, β) = h0(t)u exp(Xβ) (1.16)

onde u e a fragilidade. Assume-se que u tem media 1 e variancia descon-

hecida, ξ. Usualmente assume-se tambem uma distribuicao Gama para ξ.

7

Note que se u = 0 o modelo (1.17) se reduz ao modelo de riscos propor-

cionais (1.12). Procedimentos de inferencia para esses modelos podem ser

encontradas em Klein e Moeschberger (1997), sob um ponto de vista classico,

Clayton (1991) e Silva (2001) apresentam metodos bayesianos para estes

modelos, o segundo autor tambem apresenta modelos aditivos de fragilidade.

Em algumas aplicacoes e conveniente escrever o modelo (1.16) como

h(t|X, β) = h0(t) exp(Xβ + w) (1.17)

onde w e a fragilidade, que segue uma distribuicao com media 0 e variancia σ2.

Note que se σ = 0 o modelo (1.17) se reduz ao modelo de risco proporcionais,

(1.12). Supor que w tem distribuicao normal e o mesmo que supor que u

tem distribuicao log-normal, pois w = log(u), e McGilchrist e Aisbett (1991)

modelaram a fragilidade usando a distribuicao log-normal.

1.5 Sumario da dissertacao

Os resultados basicos em analise de sobrevivencia que serao utilizados nessa

dissertacao foram apresentados neste capıtulo. O procedimento de inferencia

sera apresentado no Capıtulo 2, onde sera descrito de uma forma geral a

inferencia Bayesiana, apresentando as definicoes basicas, os metodos com-

putacionais bayesianos com enfase aos metodos de amostragem de Monte

Carlo via Cadeias de Markov (MCMC), uma apresentacao breve sobre Mod-

elos Dinamicos, Estatistica Espacial e metodos de comparacao de modelos.

No Capıtulo 3 serao apresentados os procedimentos de inferencia para

os Modelos Estaticos de Sobrevivencia, ou modelos de Regressao de Cox.

O modelo em questao e modelo de Cox (1.12), que tem como quantidades

8

desconhecidas a funcao de risco de base e os coeficientes de regressao. A

funcao de risco de base sera abordada de tres maneiras distintas, a primeira

usando uma modelagem parametrica, a segunda usando processos gama, in-

troduzidos em analise de sobrevivencia por Kalbfleish (1978) e, finalmente,

usando processos correlacionados baseados em modelos dinamicos, introduzi-

dos em analise de sobrevivencia por Gamerman (1991). Para os coeficientes

de regressao sera assumido uma distribuicao a priori. Essa metodologia sera

aplicada a dados simulados.

No Capıtulo 4 serao apresentados os Modelos Estaticos de Fragilidade

Espacial e sera explicado como um efeito aleatorio com uma estrutura es-

pacial e incorporado aos Modelos Estaticos. A funcao de risco de base e

os coeficientes de regressao serao abordados de maneira equivalente a abor-

dagem dos Modelos Estaticos com o acrescimo do termo da fragilidade. A

Fragilidade Espacial sera abordada usando processos Gaussianos usados em

Geoestatıstica, onde sera assumido alguma funcao de correlacao espacial para

explicar a relacao de dependencia espacial entre as observacoes. Para encer-

rar o capıtulo sera feito um estudo simulado

No Capıtulo 5, os Modelos Dinamicos em Sobrevivencia serao apre-

sentados. Logo em seguida os Modelos Dinamicos em Sobrevivencia serao

extendidos com a introducao de uma estrutura espacial, resultando nos Mo-

delos Dinamicos de Fragilidade Espacial. O procedimento de inferencia sera

descrito, onde serao definidas distribuicao a priori para os parametros descon-

hecidos. Um estudo simulado sera desenvolvido para os Modelos Dinamicos

com e sem Fragilidade Espacial.

No Capıtulo 6, as metodologias dos Capıtulos 3, 4 e 5 serao aplicadas a

dados reais. O primeiro conjunto de dados e um banco de dados de pessoas

9

residentes no Noroeste da Inglaterra que sofrem de leucemia. Esse conjunto

de dados foi utilizado no trabalho de Henderson et al. (2003), com dados

cedidos pelo autor. O outro conjunto de dados contem o tempo medio no

emprego em cada municıpio do estado do Rio de Janeiro para os grandes se-

tores de emprego definidos pelo Instituto Brasileiro de Geografia e Estatıstica

(IBGE). Estes dados foram cedidos pelo Ministerio do Trabalho e Emprego

(MTE).

No Capıtulo 7, serao apresentadas as conclusoes da dissertacao, uma

breve discussao computacional e propostas para trabalhos futuros. E em

seguida, no Apendice serao apresentadas todas as distribuicoes a posteriori

omitidas na dissertacao.

10

Capıtulo 2

Inferencia Bayesiana

Todos procedimentos de inferencia que serao utilizados nessa dissertacao sao

completamente Bayesianos. Portanto, neste Capıtulo serao descritos os con-

ceitos necessarios para se fazer inferencia Bayesiana. Na Secao 2.1 serao

definidos a distribuicao a priori de alguma quantidade desconhecida e como

se atualiza essa distribuicao, usando o Teorema de Bayes, a partir de um

conjunto de dados observados relacionados com a quantidade desconhecida

de interesse, para se obter a distribuicao a posteriori. Na Secao 2.2 serao

descritos metodos computacionais para o calculo da distribuicao a posteri-

ori, dando enfase aos metodos de amostragem de Monte Carlo via Cadeias

de Markov (MCMC). Outras tecnicas que serao utilizadas nessa dissertacao

serao apresentadas. Na Secao 2.3 serao descritos de forma resumida os Mo-

delos Dinamicos, com uma enfase nos modelos dinamicos de primeira ordem.

Na Secao 2.4 sera feita uma introducao a Estatıstica Espacial descrevendo

as tres grandes subdivisoes da Estatıstica Espacial: Geoestatıstica, Dados de

Area e Padroes de Ponto.

11

2.1 Conceitos Basicos

Um problema de inferencia estatıstica e conhecer o comportamento de uma

quantidade desconhecida, θ, que descreve o comportamento de uma determi-

nada caracterıstica de uma certa populacao. A quantidade θ assume valores

em um conjunto denotado por Θ, conhecido por espaco parametrico.

Seja H a informacao inicial sobre o parametro de interesse. Essa

informacao sera descrita em termos probabilısticos, podendo ser resumida

atraves de p(θ|H). Se a informacao contida em H e suficiente para descrever

o comportamento de θ, isto e tudo que se precisa.

Mas na maioria das vezes a informacao inicial H nao e suficiente para

descrever de forma razoavel o comportamento do parametro. Portanto, e

necessario obter mais informacao sobre θ. O que se faz usualmente e a ex-

perimentacao, isto e, realiza-se um experimento com a populacao de interesse,

uma amostragem dessa populacao. Observa-se quantidades aleatorias, deno-

tadas por X, que dependem do parametro θ. Antes de observar os valores de

X deve-se conhecer a distribuicao amostral de X dada por p(x|θ,H). Apos

observar o valor de X, a informacao sobre θ foi aumentada, ou seja, mudou

de H para H∗ = H ∩ {X = x}.

Agora a informacao sobre θ e resumida por p(θ|x,H). Em termos pro-

babilısticos essa passagem de p(θ|H) para p(θ|x,H) e feita atraves do Teo-

rema de Bayes1.

Teorema 2.1 (Teorema de Bayes) Seja p(θ|H) a distribuicao inicial da

1O Teorema de Bayes foi introduzido pelo Reverendo Thomas Bayes em dois artigos

em 1793 e 1794, publicados apos sua morte, como mencionado em Barnett (1973).

12

quantidade desconhecida θ e p(x|θ, H) a distribuicao amostral de X dado θ.

A distribuicao atualizada para θ e

p(θ|x,H) =p(θ|H)p(x|θ, H)

p(x|H)

onde

p(x|H) =∫

θ∈Θp(θ|H)p(x|θ,H)dθ.

Como a funcao do denominador do Teorema de Bayes nao depende de

θ, ele pode ser reescrito como

p(θ|x) ∝ p(θ)p(x|θ).

Note que a informacao inicial H foi omitida, mas apenas para simplificar

a notacao, pois e um fator comum em todos os termos. O Teorema de

Bayes e uma regra de atualizacao de probabilidades sobre θ, partindo de

uma distribuicao a priori p(θ) para a distribuicao a posteriori p(θ|x)

usando a informacao contida nos dados p(x|θ) conhecida por funcao de

verossimilhanca.

Toda inferencia sera feita com base na distribuicao a posteriori, de

onde obtem-se as estatısticas necessarias para resumir o comportamento de

θ. Dentre as principais estatısticas a posteriori pode-se citar:

• a media a posteriori, E(θ|x):

E(θ|x) =∫

θ∈Θθp(θ|x)dθ

• o quantil α a posteriori, Q(α):

Q(α) =

{θ′ ∈ Θ :

∫ θ′

−∞p(θ|x)dθ = α

}, α ∈ (0, 1);

note que quando α = 0.5 tem-se a mediana a posteriori.

13

• o intervalo 100(1− α)% de credibilidade a posteriori, (L,U):

(L,U) =

{(L′, U ′) ⊂ Θ2 :

∫ U ′

L′p(θ|x)dθ = 1− α

}, α ∈ (0, 1);

se o intervalo e simetrico, entao L = Q(α/2) e U = Q(1− α/2).

Para mais detalhes sobre aspectos teoricos envolvendo inferencia sob o

ponto de vista Bayesiano podem ser consultados os livros de Migon e Gamer-

man (1999) e O’Hagan (1994).

Muitas vezes a distribuicao a posteriori nao tem forma fechada, pois a

integral no denominador do Teorema de Bayes nao possui solucao analıtica.

Portanto, a distribuicao a posteriori tem que ser obtida atraves de metodos

numericos. Na proxima Secao sera apresentado um breve introducao aos

metodos de simulacao de Monte Carlo via Cadeias de Markov (MCMC).

2.2 Monte Carlo via Cadeias de Markov

A difusao da aplicacao dos metodos Bayesianos esteve limitada ate aos anos

90 pelo fato da distribuicao a posteriori em muitas situacoes praticas serem

analiticamente intrataveis. Nas ultimas decadas varios metodos numericos

foram propostos visando ultrapassar essa limitacao, nomeadamente, os metodos

baseados em aproximacoes assintoticas, aproximacoes de Laplace, aprox-

imacoes via quadratura Gaussiana e metodos baseados em simulacao es-

tocastica. Boas descricoes desses metodos podem ser encontradas em Tan-

ner (1996) e Gamerman (1997). Mas a aplicacao dos medodos Bayesianos

comecou realmente a se difundir apos a introducao dos metodos de Monte

Carlo via Cadeias de Markov, de onde destacam-se o amostrador de Gibbs e

o algoritmo de Metropolis-Hastings.

14

2.2.1 Amostrador de Gibbs

Geman e Geman (1984) propuseram um esquema de amostragem uma dis-

tribuicao2 explorando as distribuicoes condicionais completas atraves de um

algoritmo iterativo que define uma cadeia de Markov. Embora esse trabalho

fosse de conhecimento de parte da comunidade cientıfica estatıstica, este ar-

tigo foi destinado a area de processamentos de imagens e foi publicado em

revista da area. Isso provavelmente levou ao atraso de sua apreensao e com-

preesao pela comunidade como uma tecnica poderosa de abordagem de pro-

blemas dos mais variados de estatıstica Bayesiana. Esse erro de desenvolvi-

mento foi reparado pelo trabalho de Gelfand e Smith (1990) que comparam

o amostrador de Gibbs com outros esquemas de simulacao estocastica.

O amostrador de Gibbs, ( Geman e Geman, 1984), e essencialmente

um esquema amostral de uma cadeia de Markov cujo nucleo de transicao e

formado pelas condicionais completas. Para descrever o algoritmo, suponha

que a distribuicao de interesse e a distribuicao a posteriori p(θ|x) com θ =

(θ1, . . . , θS) e considere tambem que todas as condicionais completas a pos-

teriori p(θi|, θ−i, x) i = 1, . . . , n estejam disponıveis e que sabe-se gerar

amostras de cada uma delas. Portanto, o esquema de amostragem e dado

por:

2A distribuicao que Geman e Geman estavam interessados chama-se distribuicao de

Gibbs, que da nome ao amostrador, usada em Mecanica Estatıstica e tem a seguinte

forma

f(x1, . . . , xn) ∝ exp[− 1

kTE(x1, . . . , xn)

]

onde k e uma constante positiva, T e a temperatura e E e a energia do sistema, funcao

positiva.

15

Amostrador de Gibbs

I - Inicialize θ(0) = (θ(0)1 , . . . , θ

(0)S ) e k = 1

II - Obtenha um novo valor para θ(k) a partir de θ(k−1) atraves de

sucessivas geracoes de valores. Para i = 1 ate S, faca:

gere um valor para θ(k)i de

θ(k)i ∼ p(θi|θ(k)

1 , . . . , θ(k)i−1, θ

(k−1)i+1 , . . . , θ

(k−1)S , x)

III - Faca k = k + 1 e volte para II e repita o procedimento ate

alcancar a convergencia.

A medida que o numero de iteracoes aumenta, a cadeia se aproxima

da sua distribuicao de equilıbrio. Assim, assume-se que a convergencia e

atingida em uma iteracao cuja a distribuicao esteja proxima da distribuicao

de equilıbrio, p(θ|x), e nao no sentido formal e inatingıvel do numero de

iteracoes tendendo ao infinito.

2.2.2 Algoritmo de Metropolis-Hastings

O algoritmo de Metropolis foi apresentado inicialmente por Metropolis et

al. (1953) e generalizado por Hastings (1970) resultando no algoritmo de

Metropolis-Hastings. Esse metodo e usado geralmente quando e difıcil gerar

amostras da condicional completa a posteriori . Neste caso, gera-se valores

do parametro a partir de uma distribuicao proposta e esse e aceito ou nao

com uma certa probabilidade de aceitacao.

Para descrever o algoritmo, suponha que a distribuicao de interesse e a

16

distribuicao a posteriori p(θ|x) com θ = (θ1, . . . , θS). Considere tambem que

todas as condicionais completas a posteriori p(θi|θ−i, x). i = 1, . . . , n estejam

disponıveis mas nao se sabe gerar amostras diretamente de cada uma e que

amostras de um novo valor de θi serao geradas a partir de uma distribuicao

proposta condicional ao valor atual de θi, q(θ(p)i |θ(a)

i ), onde θ(p)i e o valor

proposto e θ(a)i e o valor atual3, para i = 1, . . . , n. Portanto o esquema de

amostragem e dado por:

Algoritmo de Metropolis-Hastings

I - Inicialize θ(0) = (θ(0)1 , . . . , θ

(0)S ) e k = 1

II - Obtenha um novo valor para θ(k) a partir de θ(k−1) atraves de

sucessivas geracoes de valores. Para i = 1 ate S, faca:

(i) Gere uma proposta para θ(k)i de

θ(p)i ∼ q(θi|θ(k−1)

i )

(ii) Aceite a proposta com probabilidade de aceitacao dada

por

α = min

1,

p(θ(p)i |θ(a)

i , x)q(θ(k−1)i |θ(p)

i )

p(θ(k−1)i |θ(a)

i , x)q(θ(p)i |θ(k−1)

i )

onde θ(a)−i = (θ

(k)1 , . . . , θ

(k)i−1, θ

(k−1)i+1 , . . . , θ

(k−1)S ).

III - Faca k = k + 1 e volte para II e repita o procedimento ate

alcancar a convergencia.

O algoritmo de Metropois-Hastings e bastante geral, e pode, pelo menos

3Entenda por valor atual o valor de θ exatamente antes da proposta ser gerada, ou

seja, o valor atualizado da iteracao anterior.

17

em princıpio, ser implementado com qualquer distribuicao condicional com-

pleta a posteriori e para qualquer proposta. Entretanto sob o ponto de vista

pratico, a escolha da proposta e crucial para o bom desenvolvimento do

algoritmo, ou seja, para sua convergencia para a distribuicao a posteriori.

Algumas propostas mais comuns sao:

Cadeias Simetricas:

Quando a distribuicao proposta e simetrica em torno da iteracao ante-

rior, isto e, q(θ(p)i |θ(k−1)

i ) = q(θ(k−1)i |θ(p)

i )

α = min

1,

p(θ(p)i |θ(a)

−i , x)

p(θ(k−1)i |θ(a)

−i , x)

Dentre as cadeias simetricas destaca-se o passeio aleatorio, θ(p)i =

θ(k−1)i + e, onde e tem um distribuicao simetrica em torno zero.

Cadeias independentes

Quando a proposta nao depende do passo anteriori, ou seja, q(θ(p)i |θ(k−1)

i ) =

q(θ(p)i ), e a probabilidade de aceitacao e dada por

α = min

1,

p(θ(p)i |θ(a)

−i , x)q(θ(k−1)i )

p(θ(k−1)i |θ(a)

−i , x)q(θ(p)i )

Um caso particular de cadeias independentes e quando a distribuicao

proposta e a distribuicao a priori para θi, neste caso a probabilidade

de aceitacao e dado somente pela funcao de verossimilhanca, isto e,

α = min

1,

p(x|θ(p)i , θ

(a)−i )

p(x|θ(k−1)i , θ

(a)−i )

Um outro caso particular de cadeias independentes e quando a dis-

tribuicao proposta e a propria condicional completa a posteriori, isto

18

e, q(θ(p)i ) = p(θ

(p)i |θ(a)

−i , x). Fazendo isto, a probabilidade de aceitacao

e igual a um. Gerar da condicional completa e aceitar sempre em um

algoritmo iterativo e a definicao do amostrador de Gibbs, portanto o

amostrador de Gibbs e um caso particular do algoritmo de Metropolis-

Hastings.

Para maiores informacoes veja em Gilks et al. (1996), onde sao apre-

sentados conceitos e resultados com aplicacoes dos metodos de simulacao de

Monte Carlo via Cadeias de Markov em inferencia Bayesiana e nao-Bayesiana.

2.2.3 Verificacao de Convergencia

Os metodo de MCMC sao uma otima ferramenta para resolucao de muitos

problemas praticos na analise Bayesiana. Porem, algumas questoes rela-

cionadas a convergencia nestes metodos ainda merecem bastante pesquisa.

Uma questao que pode surgir e “Quantas iteracoes deve ter o processo de

simulacao para garantir que a cadeia convergiu para o estado de equilıbrio?”

A resposta definitiva para esta questao podera nunca ser dada, visto que a

distribuicao estacionaria sera na pratica desconhecida, mas pode-se sempre

avaliar a convergencia das cadeias detectando problemas fora do perıodo de

aquecimento4. Para eliminar uma possıvel auto-correlacao das cadeias sele-

ciona a partir do burn-in a cada k iteracoes, o tamanho de k sera chamado

de lag.

Uma analise de convergencia em metodos de simulacao pode ser feita

preliminarmente analisando os graficos ou medidas descritivas dos valores

4O perıodo de aquecimento limitado superiormente pelo burn-in, onde burn-in e a

iteracao tal que acredita-se que a partir dela a cadeia convergiu.

19

simulados da quantidade de interesse, θ. Os graficos mais frequentes sao o

grafico de θ ao longo das iteracoes e um grafico da estimativa da distribuicao

a posteriori de θ, por exemplo um histograma ou uma densidade kernel. As

estatısticas usuais sao a media, o desvio padrao e os quantis (2,5%; 50%;

97,5%).

Uma segunda fase de avaliacao de convergencia em metodos de MCMC

faz-se usando algumas tecnicas de diagnostico de convergencia. As tecnicas

mais populares sao: Geweke (1992) que usa resultados baseados em analise

espectral, Heidelberger e Welch (1983) que tambem usa resultados baseados

em analise espectral, Raftery e Lewis (1992) que permite calcular quantas

iteracoes sao necessarias para uma cadeia atingir a distribuicao estacionaria

atraves da estimacao de quantis a posteriori com uma precisao previamente

fixada e Gelman e Rubin (1992) que usa resultados baseados na analise de

variancia classica para duas ou mais cadeias simuladas com valores inici-

ais diferentes. Estes metodos e outros foram comparados no trabalho de

Cowles e Carlin (1996), onde se chegou a conclusao de que nao se pode

afirmar qual deles e o mais eficiente. As tecnicas de Geweke, Heidelberger-

Welch, Raftery-Lewis, Gelman-Rubin e outras estao implementadas no pa-

cote CODA ( Cowles et al., 1997) executavel no freeware R.

2.3 Modelos Dinamicos

Nesta secao sera feita uma introducao aos modelos dinamicos, uma ampla

classe de modelos com parametros variando no tempo, adequados a mode-

lagem de series temporais e regressao.

20

Os modelos dinamicos foram apresentados por Harrison e Stevens (1976)

e estao bem estruturados em West e Harrison (1997).

Os modelos lineares dinamicos sao caracterizados por duas equacoes: a

equacao de observacao dada por

Yt = Ftβt + εt, εt ∼ N(0, σ2t ) (2.1)

e pela equacao de sistema dada por:

βt = Gtβt−1 + ut, ut ∼ N(0, Ut) (2.2)

onde no instante t, Yt denota a serie de observacoes independentes condi-

cionalmente em θt e σ2t , Ft e um vetor de constantes conhecidas (variaveis

explicativas), βt = (β1t, . . . , βpt)T e um vetor-coluna com p coeficientes, Gt

e uma matriz de termos conhecidos que define a evolucao sistematica dos

parametros, εt e ut sao erros mutuamente independentes e, σ2t e Ut, as

variancias dos erros associados a observacao e ao vetor de parametros, res-

pectivamente. O modelo e completado com a seguinte distribuicao a priori:

β1|D1 ∼ N(m1, C1), onde D0 e a informacao relevante a priori sobre β1.

Em resumo, um modelo linear dinamico fica completamente especifi-

cado pela quadrupla {Ft, Gt, σ2t , Ut}. Note que os modelos de series tempo-

rais sao caracterizados por Ft = F e Gt = G, ∀t e os modelos estaticos de

regressao sao caracterizados por Gt = Ip e Ut = 0.

Uma das principais caracterısticas de um modelo linear dinamico e

que a cada instante de tempo as informacoes existentes sao descritas pela

distribuicao a posteriori do vetor de estado βt. Em cada instante de tempo,

os seguintes passos sao feitos: evolucao, previsao e atualizacao. No modelo

{Ft, Gt, σ2t , Ut} com priori β1|D1 ∼ N(m1, C1) a dinamica e dada por:

21

Evolucao - De (2.1) tem-se que a distribuicao a priori em t e:

βt|Dt−1 ∼ N(at, Rt) (2.3)

onde at = Gtmt e Rt = GtCt−1GTt + Ut.

Previsao - De (2.3) chega-se que a distribuicao preditiva um passo a frente

e:

yt|Dt−1 ∼ N(ft, Qt) (2.4)

onde ft = Ftat e Qt = FtRtFT + σ2

t .

Atualizacao - Usando a verossimilhanca (2.1), a priori (2.3) e o Teorema

de Bayes tem-se que

βt|Dt ∼ N(mt, Ct) (2.5)

onde

Dt = {yt, Dt−1},mt = at + RtF

Tt (Qt + Vt)

−1(yt − ft),

Ct = Rt −RtFTt (Qt + Vt)

−1FtRTt .

Suponha que sejam feitas S observacoes do experimento Y , isto e, Y =

(Y1, . . . , YS). Suponha tambem o modelo {1, 1, σ2, U}, ou seja,

Yj = βj + ej, ej ∼ N(0, σ2), (2.6)

βj = βj−1 + uj, uj ∼ N(0, Uj), j = 2, . . . , S (2.7)

onde Uj = Ubj, bj e um valor conhecido e, completando o modelo β1 ∼N(m,C).

22

Desta forma a distribuicao conjunta a priori pra β = (β1, . . . , βp)T e

dada por

p(β) = p(β1)S∏

i=2

p(βi|βi−1)

∝ exp{−1

2(β −m)T Λ(β −m)

}(2.8)

que e o nucleo da distribuicao normal multivariada, ou S-variada, com media

m e matriz de variancias Λ−1, denotada por

β ∼ NS(m, Λ−1) (2.9)

onde

m = (m, . . . , m)T e (2.10)

Λ =

1C

+ 1b1U

− 1b2U

. . . 0 0

− 1b2U

1b2U

+ 1b3U

. . . 0 0

0 − 1b3U

. . . 0 0...

......

...

0 0 . . . 1bS−1U

+ 1bSU

− 1bSU

0 0 . . . − 1bSU

1bSU

. (2.11)

2.4 Geoestatıstica

Com o crescimento das tecnicas de georeferenciamento, os bancos de da-

dos mais atuais contem entre outras informacoes a posicao espacial das ob-

servacoes. Esta posicao espacial pode ser contınua, com a posicao exata de

cada indivıduo, onde se tem as suas coordenadas geograficas ou a posicao

espacial, determinada por alguma regiao que contenha esse indivıduo, por

exemplo bairro, munıcipio, estado, etc. Esta informacao espacial em deter-

23

minados estudos e relativamente barata de ser obtida. Por exemplo, em uma

pequisa medica saber o endereco do paciente e bastante simples.

Dados com informacao espacial vem sendo amplamente estudados em

problemas de estatıstica aplicada (Cressie, 1993), pois em muitas situacoes a

posicao espacial pode influenciar o resultado do evento de interesse. Os mo-

delos que incorporam alguma informacao espacial visam explicar de alguma

forma essa “influencia” no resultado do evento de interesse. O conjunto de

tecnicas estatısticas para modelar dados com informacao espacial e conhecido

por Estatıstica Espacial.

A Estatıstica Espacial considera os valores amostrais como sendo real-

izacoes de funcoes aleatorias com distribuicao no espaco e, nesse caso, o valor

de um ponto e funcao da sua posicao na regiao de estudo. Outro fator que

tambem e levado em consideracao na estatıstica espacial e a posicao relativa

dos pontos amostrados. Assim, a similaridade entre valores amostrais e quan-

tificada em funcao da distancia entre amostras, representando tal relacao o

fundamento desse campo especial da estatıstica aplicada.

Segundo Cressie (1993), existem tres grandes subdivisoes da estatıstica

espacial: Geoestatıstica, dados de area e padrao de pontos. Em Geoes-

tatıstica se tem interesse em conhecer o comportamento de algum processo

que varia continuamente na regiao de estudo. Nos Dados de Area, assim

com em Geoestatıstica, se tem interesse em conhecer o comportamento de

algum processo, mas os dados estao distribuıdos discretamente sob regiao de

interesse, ou seja, os pontos observados pertencem a sub-regioes que estao

contidas na regiao de interesse. E no Padrao de Pontos, diferente da duas

abordagens anteriores, se tem interesse em conhecer a posicao espacial na

qual um evento ira ocorrer. Nessa dissertacao o interesse e em descrever

24

o comportamento de um processo que pode ocorrer em qualquer lugar no

espaco. Portanto, sera utilizado apenas tecnicas de Geoestatıstica e Dados

de Area, dando uma enfase a primeira abordagem, pois esta abordagem sera

adotada na inferencia para o termo de fragilidade espacial.

A ideia basica de Geoestatıstica e que observacoes proximas tem com-

portamento similar e, a medida que a distancia entre as observacoes aumenta,

essa similaridade tende a diminuir. Os objetivos da analise de Geoestatıstica

sao: estimacao e previsao. A estimacao refere-se a inferencia de parametros

do processo gerador das observacoes. A previsao ou interpolacao refere-se a

inferencia em locais nao-observados.

Definicao 2.1 (Processos Gaussianos) A funcao W (.) assumindo valores

w(s) para s ∈ D, segue um Processo Gaussiano com funcao de media m(.) e

funcao de variancia C(., .) denotado por

W (.) ∼ PG (m(.), C(., .)) .

Se para todo s1, s2, . . . , sn ∈ D e n = 1, 2, . . ., a distribuicao conjunta de

W (s1),W (s2), . . . , W (sn) e normal multivariada com parametros dados por

E(W (si)) = m(si) e

Cov(W (si),W (sj)) = C(si, sj).

Seja W (.) um processo espacial Gaussiano estacionario isotropico5 com

media zero, mais podem ser encontrados em Cressie (1993), ou seja,

W (.) ∼ N(0, R(., .)) (2.12)

5Um processo e dito isotropico quando a estrutura de correlacao depende apenas da

distancia entre as observacoes e e a mesma em qualquer direcao.

25

para s1, s2, . . . , sn ∈ D, R(si, sj) = σ2ρ(dij), onde ρ(dij) e a funcao de cor-

relacao espacial e dij = ||si − sj|| e a distancia entre si e sj, ∀i, j.

As principais funcoes de correlacao espacial usadas em Geoestatıstica

sao: Esferica, Gaussiana, exponencial, exponencial potencia e a Matern. A

funcao de correlacao esferica e dada por

ρ(d; φ) =

1− 32

(dφ

)− 1

2

(dφ

)30 < d < φ

0 d > φ, φ > 0. (2.13)

Note que o parametro φ trunca a correlacao espacial.

A funcao de correlacao e Exponencial Potencia e dada por

ρ(d; φ, κ) = exp

{−

(d

φ

)κ}, φ > 0, κ ∈ (0, 2]. (2.14)

Essa funcao e bastante popular pois ela tem como casos particulares as funcao

Exponencial, quando κ = 1, e Gaussiana, quando κ = 2.

A funcao de correlacao Matern e dada por

ρ(d; φ, κ) ={2κ−1Γ(κ)

}−1(

d

φ

)κ

Kκ

(d

φ

), φ > 0, κ > 0, (2.15)

onde Kκ(.) denota a funcao Bessel de terceiro tipo de ordem κ.

Seja W = (W (s1),W (s2), . . . , W (sn)) uma amostra de observacoes de

um processo pertecente a uma regiao D, onde si indica a posicao espacial

do indivıduo i na regiao D e W (si) o valor do processo observado para o

indivıduo i, i = 1, . . . , n. Como a inferencia para os parametros do processo

sera feita sob o ponto de vista Bayesiano, tem-se que:

W |Σ ∼ Nn(0, Σ) (2.16)

onde Σ = σ2R, Rij = ρ(dij; θ) i, j = 1, . . . , n e θ depende da funcao de

correlacao espacial utilizada.

26

A distribuicao a posteriori dos parametros do processo gerador de W e

obtida atraves do Teorema de Bayes combinando uma distribuicao a priori

p(σ2, θ) com a verossimilhanca (2.16):

p(σ2, θ|W ) ∝ p(σ2, θ)(σ2)−n2 |R|− 1

2

× exp{− 1

2σ2W T R−1W

}(2.17)

onde |A| e o determinante da matriz A e p(σ2, θ) e a distribuicao a priori dos

parametros da estrutura espacial.

Prever valores nao observados a partir dos dados observados e um dos

objetivos da Geoestatıstica. Krige (1951) foi o pioneiro em previsao de valores

distribuıdos no espaco. Portanto a tecnica de prever valores nao observados

no espaco recebeu o nome de Krigagem. Sob o ponto de vista Bayesiano a

Krigagem e feita a partir da distribuicao preditiva.

Seja W (obs) = (W (s1), . . . , W (sn) uma amostra observada no espaco e

W (prev) = (W (sn+1), . . . , W (sn+P ) o conjunto de valores que se deseja prever.

Sera assumido que W (.) segue um processo Gaussiano Estacionario Isotropico

com media 0. Logo o par (W (obs),W (prev))T tem distribuicao normal multi-

variada com media 0 e matriz de variancias Σ = σ2R, Rij = ρ(dij; θ), {i, j} =

1, . . . , n + P , com dij = ||si − sj||, ou seja,

W (obs)

W (prev)

∼ Nn+P

0

0

, σ2

R(obs) R(obs),(prev)

R(prev),(obs) R(prev)

,

(2.18)

onde R(obs) = Rij, {i, j} = 1, . . . , n, R(obs)(prev) = Rij, i = 1, . . . , n, j =

n + 1, . . . , n + P , R(prev)(obs) = [R(obs)(prev)]T e R(prev) = Rij, {i, j} = n +

1, . . . , n + P .

Logo, usando uma propriedade da distribuicao normal multivariada a

distribuicao condicional de W (prev) dado a amostra observada e os parametros

27

Capıtulo 3

Modelos Estaticos de

Sobrevivencia

Neste Capıtulo serao apresentados os procedimentos de inferencia sob o ponto

vista Bayesiano para o modelo de Cox. A funcao risco do modelo de Cox

se divide em um produto de outras duas funcoes, uma que depende apenas

do tempo de falha, a funcao de risco de base, e a outra funcao que depende

apenas das covariaveis, ou variaveis explicativas, isto e, variaveis que nao

dependem do tempo. Alem disso, mais adiante serao apresentados mode-

los de sobrevivencia dinamicos, onde o efeito das covariaveis pode variar no

tempo. Portanto, o modelo de Cox sera chamado de Modelo Estatico de

Sobrevivencia por nao ter coeficientes dependentes do tempo. Na Secao 3.1

o Modelo Estatico de Sobrevivencia sera formalmente apresentado, explici-

tando suas quantidades desconhecidas: os coeficientes de regressao e a funcao

de risco de base. Serao descritos para este modelo, na Secao 3.2, os proce-

dimentos de inferencia para os coeficientes de regressao, onde sera assumida

29

uma distribuicao a priori. A funcao de risco de base, por ser uma funcao

contınua no tempo, nao permite elicitar diretamente a distribuicao a priori.

Desta forma, na Secao 3.3, a funcao de risco de base sera abordada usando

tres formulacoes distintas, a primeira usando uma modelagem parametrica,

a segunda usando processos Gama, introduzidos em analise de sobrevivencia

por Kalbfleish (1978) e, finalmente, usando processos correlacionados basea-

dos em modelos dinamicos, introduzidos em analise de sobrevivencia por

Gamerman (1991). Finalizando, na Secao 3.4 sera feito um estudo simulado

para o Modelo Estatico de Sobrevivencia.

3.1 Definicao do Modelo

O Modelo Estatico de Sobrevivencia, ou Modelo de Cox, vem sendo ampla-

mente utilizado em estatıstica aplicada, principalmente na area biomedica.

Ele foi proposto por Cox (1972). Este modelo ja foi apresentado anterior-

mente e sua funcao de risco e dada em (1.12), onde se tem interesse na funcao

de risco de base, h0, e nos coeficientes de regressao, β.

A distribuicao a posteriori para β e h0 e dada atraves da atualizacao da

distribuicao a priori via Teorema de Bayes com a funcao de verossimilhanca

(1.13):

p(β, h0|[dados]) ∝ p(β, h0)n∏

i=1

(h0(ti)e

Xiβ)δi

exp{−H0(ti)e

Xiβ}

. (3.1)

Sera assumido que β e h0 sao independentes a priori. Portanto, p(β, h0) =

p(β)p(h0). Essas distribuicoes a priori serao exploradas a seguir. Outro de-

talhe importante, a distribuicao a posteriori (3.1) nao possui forma analıtica

fechada portando um esquema de amostragem via MCMC sera utilizado.

30

Nas proximas secoes sera descrito como obter as condicionais completas a

posteriori de β e h0.

3.2 Coeficientes de Regressao

Os coeficientes de regressao serao modelados com a suposicao de que eles nao

dependam do tempo, esta e uma imposicao do proprio modelo. A distribuicao

a priori para os coeficientes de regressao e dada por

p(β) ∝ exp{−1

2(β −m)T V −1(β −m)

}(3.2)

onde p(β) e o nucleo da funcao de densidade da distribuicao Normal com

media m e variancia V . Os hiperparametros m e V sao valores conhecidos que

descrevem o conhecimento subjetivo que se tem a priori do comportamento

dos coeficientes. Uma priori nao informativa e dada quando aumenta-se as

variancias da priori indefinidamente.

A condicional completa dos coeficientes de regressao e obtida atraves da

combinacao da priori (3.2) com a verossimilhanca (1.10) usando o Teorema

de Bayes

p(β| · · ·) ∝ exp{−1

2(β −m)T V −1(β −m)

}

× exp

{n∑

i=1

[Xiβδi −H0(ti)e

Xiβ]}

(3.3)

onde p(θ| · · ·) define a distribuicao condicional completa a posteriori do parametro

θ.

Note que a distribuicao (3.3) nao e uma distribuicao conhecida, isto e,

nao se sabe gerar amostras diretamente dela. Portanto, os coeficientes serao

31

gerados conjuntamente atraves do seguinte passeio aleatorio como proposta

β(p) = β(a) + u, u ∼ N(0, Vβ), (3.4)

onde β(p) e o vetor de coeficientes propostos, β(a) e o vetor coeficientes da

iteracao atual. O valor proposto sera aceito ou nao de acordo com a pro-

babilidade de aceitacao dada pelo mınimo entre 1 e a razao das condicionais

completas, (3.3), de β(p) e β(a).

3.3 Funcao de Risco de Base

Como a funcao h0 e uma funcao contınua, nao e possıvel especificar uma

distribuicao diretamente para ela. Logo se faz necessario o uso de tecnicas

indiretas para estimar a funcao de risco de base. Essas tecnicas podem ser

parametricas que visam diminuir o numero de parametros a ser estimados

para que a funcao de risco de base fique bem especificada ou nao-parametricas

que visam dar mais flexibilidade ao modelo, sendo desnecessario supor a dis-

tribuicao dos tempos de falha. Na abordagem parametrica sera utilizada

a distribuicao Weibull, por ser simples e mais flexıvel que a distribuicao

exponencial. A abordagem nao-parametrica e mais flexıvel que a abor-

dagem parametrica, consequentemente e mais robusta. Nessa abordagem

serao utilizados os processos Gama com incrementos independentes. Uma

terceira abordagem que e uma mistura entre as abordagens parametrica e

nao-parametrica, pois e especificada uma distribuicao Exponencial por Partes

para o tempo de base, como na abordagem parametrica. Por ser uma dis-

tribuicao onde o numero de parametros pode ser muito grande, essa aprox-

imacao para a funcao de risco pode ser tambem considerada uma abordagem

nao-parametrica.

32

Quando se usa uma modelagem nao-parametrica para a funcao de risco

de base e para os coeficientes de regressao uma modelagem parametrica, o

modelo e dito semi-parametrico. Uma boa revisao de modelos semi-parametricos

para varios tipos de dados de sobrevivencia pode ser encontrada em Sinha e

Dey (1997).

3.3.1 Processos Parametricos

Os processos parametricos sao aqueles onde se conhece a distribuicao de

base, ou seja, conhece-se a forma da funcao de risco de base, esta depende

de um conjunto finito de parametros que precisam ser estimados. Dentre as

distribuicoes usuais, tem-se a distribuicao exponencial cuja funcao de risco e

dada por

h(t) = λ, λ > 0. (3.5)

Note que a distribuicao exponencial tem funcao de risco constante. E a

funcao mais simples em termos matematicos, mas em contra-partida nao se

adequa bem a situacoes praticas.

Um distribuicao mais flexıvel que a distribuicao exponencial e a dis-

tribuicao Weibull, proposta por Weibull (1951) em estudos de tempo de

falha devido a fadiga de metais. Ela tem a propriedade da funcao de risco

ser monotona, isto e, ela e crescente, decrescente ou constante. Logo a dis-

tribuicao exponencial e um caso particular. A funcao de risco da log-normal

e dada por

h(t) = αλtα−1, {α, λ} > 0. (3.6)

Se α = 1 tem-se a distribuicao exponencial com parametro λ.

Assim como a distribuicao Weibull, a distribuicao log-normal e muito

33

utilizada para descrever tempo de vida de produtos e indivıduos. A funcao

de risco nao tem forma analıtica fechada, mas o comportamento da funcao

risco e que a medida que aumenta o tempo a funcao de risco cresce, atinge

um valor maximo e depois decresce.

Por ser mais flexıvel que a distribuicao exponencial e ter forma fechada,

sera assumido que o tempo de base segue uma distribuicao Weibull com

parametros α e λ, forma e escala respectivamente. Vale lembrar que nada

impede o uso de outras distribuicoes como exponencial, log-normal ou qual-

quer outra distribuicao parametrica. Portanto, a funcao de risco de base e

dada por

h0(t) = αλtα−1, {α, λ} > 0. (3.7)

Substituindo (3.7) em (1.13) temos que

L(α, λ, β) =n∏

i=1

(αλtαi eXiβ

)δi

exp{−λtαi eXiβ

}. (3.8)

Sera assumido a priori que os parametros da distribuicao Weibull seguem

a seguinte distribuicao

α ∼ Gama(aα, bα) (3.9)

λ ∼ Gama(aλ, bλ), (3.10)

onde X ∼ Gama(a, b), significa que X tem distribuicao Gama com parametros

a > 0 e b > 0, tal que E(X) = ab

e V (X) = ab2

e o nucleo da funcao de densi-

dade e dado por p(x) ∝ xa−1 exp{−bx}. Os hiperparametros da distribuicao

a priori, (aα, bα, aλ, bλ), sao escolhidos de acordo com o conhecimento que se

tem a priori sobre α e λ.

Combinando as prioris (3.9) e (3.10) com a verossimilhanca (3.8) atraves

34

do Teorema de Bayes tem-se a seguinte condicional completa:

p(α, λ| · · ·) ∝ αaα−1e−bααλaλ−1e−bλλ

∝n∏

i=1

(αλtαi )δi exp{−λtαi eXiβ

}. (3.11)

Desta forma, a condicional completa de λ e dada por

p(λ| · · ·) ∝ λaλ+∑n

i=1δi−1 exp

{−λ

(bλ +

n∑

i=1

tαi eXiβ

)},

que e o nucleo da distribuicao Gama. A condicional completa de α e dada

por

p(α| · · ·) ∝ αaα−1e−bααn∏

i=1

(αλtαi )δi exp{−λtαi eXiβ

}. (3.12)

A distribuicao (3.12) nao e uma distribuicao conhecida. Portanto, α sera

gerado da seguinte forma

log(α(p)) = log(α(a)) + u, u ∼ N(0, Vα), (3.13)

onde a funcao de densidade de α(p) dado α(a) e

p(α(p)|α(a)) ∝ exp{− 1

2Vα

(α(p) − α(a))2}

1

α(p).

O valor proposto para α sera aceito com probabilidade dada pelo mınimo

entre 1 e p, onde p e dado por

p =p(α(p)| · · ·)p(α(a)|α(p))

p(α(a)| · · ·)p(α(p)|α(a))

=p(α(p)| · · ·)α(a)

p(α(a)| · · ·)α(p). (3.14)

3.3.2 Processos Gama

Nesta secao sera apresentada uma aproximacao nao-parametrica para a funcao

de risco de base acumulada H0(t). Esta aproximacao foi proposta por Kalbfleisch(1978)

35

e diz que a priori H0(t) e um processo que

E(H0(t)) = H∗(t), uma funcao positiva conhecida,

V (H0(t)) =H∗(t)

c,

e os incrementos dH0(t) sao independentes e seguem uma distribuicao Gama

com parametros de forma e escala cdH∗(t) e c, respectivamente. Ou seja,

dH0(t) ∼ Gama(cdH∗(t), c),

onde a funcao dH∗(t) e a constante c sao escolhidos a priori descrevendo o

conhecimento inicial do processo. Note que Menores valores de c maior a

variabilidade do processo H0(t) a priori.

Teorema 3.1 Se dX(t) ∼ Gama(dQ(t), r), ∀t ∈ (a, b) entao

∫ b

adX(t) ∼ Gama

(∫ b

adQ(t), r

)

Prova: Usando a funcao geradora de momentos e a suposicao de que os

incrementos sao independentes tem-se que

M∫ b

adX(t)

(u) = Pt∈(a,b)MdX(t)(u)

onde P e denominado integral produto1 definido como limite de produtos

finitos, analogamente ao usual operador∫, que e definido como o limite de

somas finitas. Como dX(t) tem distribuicao Gama entao

M∫ b

adX(t)

(u) = Pt∈(a,b)

(r

r − u

)dQ(t)

=(

r

r − u

)∫ b

adQ(t)

1O uso do operador P foi introduzido em analise de sobrevivencia no trabalho de Gill

e Johansen (1990).

36

que e a funcao geradora de momentos da distribuicao Gama com parametros∫ ba dQ(t) e r. 2

Portanto, o processo a priori para H0(t) e dado por

p(dH0(t)) ∝ dH0(t)cdH∗(t)−1e−cdH0(t) (3.15)

com dH0(t) e dH0(u) independentes ∀(t, u) > 0, com t 6= u.

Esse processo e conhecido por Processo Gama com incrementos inde-

pendentes. Aqui sera chamado apenas por Processo Gama. Usando o fato

que h0(ti) = dH0(t)dt

∣∣∣t=ti

a funcao de verossimilhanca (1.13) pode ser reescrita

por

L(h0) ∝n∏

i=1

(dH0(ti)

dt

)δi

exp{−

∫ ti

0dH0(u)eXiβ

}. (3.16)

Note que os termos que dependem somente de β foram considerados con-

stantes e omitidos. Combinando a priori (3.15) com a verossimilhanca (3.16)

tem-se que no instante de falha ti a condicional completa para dH0(ti), i =

1, . . . , n e

p(dH0(ti)| · · ·) ∝ dH0(ti)cdH∗(ti)+δi−1

× exp

−dH0(ti)(c +

∑

j∈R(ti)

eXjβ)

(3.17)

e para o instante t ∈ (ti−1, ti), i = 1, . . . , n a condicional completa de dH0(t)

e

p(dH0(t)| · · ·) ∝ dH0(t)cdH∗(t)−1

× exp

−dH0(t)(c +

∑

j∈R(ti)

eXjβ)

. (3.18)

Note que (3.17) e (3.18) sao o nucleo de duas distribuicoes Gama com

parametros (cdH∗(ti) + δi, c +∑

j∈R(ti) eXjβ) e (cdH∗(t), c +∑

j∈R(ti) eXjβ),

37

respectivamente. Como (3.18) e valido para todo t no intervalo (ti−1, ti)

entao usando o Teorema 3.1 tem-se que

∫ ti

ti−1

dH0(t)| · · · ∼ Gama

c

∫ ti

ti−1

dH∗(t), c +∑

j∈R(ti)

eXjβ

(3.19)

onde R(t) e o conjunto de ındices das observacoes sob risco, ou seja, e o

conjunto de ındices das observacoes que ainda nao falharam ou nao foram

censuradas no instante de tempo t.

Note que a posteriori o processo que governa H0(t) nao e mais contınuo

como assumido a priori e os pontos de descontinuidade sao os instantes de

falha, ou seja, o processo a posteriori para H0(t) e um processo discreto com

probabilidade 1, com pontos de descontinuidade dados pelos instantes de

falha. Essa observacao foi feita por Burridge (1981).

3.3.3 Processos Correlacionados

Esta especificacao foi usada por Gamerman (1987) e aproxima a distribuicao

dos tempos de falha usando a distribuicao exponencial por partes. Esta

utiliza uma particao do eixo do tempo, ou seja, um conjunto pre-especificado

de grupos de intervalos dados por

Ii =

[0, a1], i = 1,

(ai−1, ai], i = 2, . . . , J

(aJ ,∞), i = J + 1

(3.20)

com 0 < a1 < . . . < aJ < ∞, a seguinte funcao de risco

h(t) = λi, ∀t ∈ Ii, i = 1, . . . , J, J + 1. (3.21)

38

Sera assumido que a funcao de risco de base do modelo e Exponencial

por Partes, ou seja,

h0(t) = λ0i, ∀t ∈ Ii, i = 1, . . . , J, J + 1. (3.22)

Uma outra suposicao a priori que sera feita e que o logarıtmo da funcao

de risco de base no intervalo se modifica suavemente segundo um passeio

aleatorio, ou seja,

β0i = β0(i−1) + ui, ui ∼ N(0, Ui), i = 2 . . . , J (3.23)

β01 ∼ N(m0, C) (3.24)

onde β0i = log(λ0i), i = 1, . . . , J , m0 e C podem ser especificados de tal

forma que a distribuicao de β01 seja nao informativa, Ui = biU , onde bi =

ai − ai−1 e U e o hiperparametro que mede a forca da autocorrelacao e tem

como priori:

U ∼ GamInv

(cU

2,dU

2

)(3.25)

ou seja, U tem distribuicao Gama Invertida com parametros ( cU

2, dU

2) e funcao

de densidade dada por

p(U |cU , dU) ∝ U− cU2−1 exp

{− dU

U2

}, U > 0, cU , dU > 0)

A distribuicao conjunta de β0 = (β01, . . . , β0J)T e dada como produto

das densidades obtidas de (3.23) e (3.24), que e obtida de forma similar a

(2.8), ou seja

β0 ∼ NJ

(m0, Λ

−1)

(3.26)

onde m0 = m01, 1 = (1, . . . , 1)T e a matriz de variancias Λ−1 dada por

(2.11).

39

Dividindo o eixo do tempo nos conjuntos Ii’s a funcao de verossimi-

lhanca deve ser reescrita para se adaptar a essa particao. Antes da verossimi-

lhanca ser reescrita sera apresentado um resultado apresentado por Gamer-

man (1987), o Teorema da Fatorizacao da Verossimilhanca, TFL:

Teorema 3.2 (TFL) Seja T = ((t1, δ1), . . . , (tn, δn)) uma amostra de tem-

pos de sobrevivencia com distribuicao conjunta f(t|λ) em (<+)n. Defina τ =

(a1, . . . , aJ) onde 0 < a1 < . . . < aJ < ∞, I1 = [0, a1], Ii = (ai−1, ai] i =

2, . . . , J , IJ+1 = (aJ ,∞) e aj > maxi

ti. Entao a verossimilhanca para λ apos

observar os T en∏

i=1

J∏

j=1

(λj)χij exp

{−eλj(tij − aj−1)

}

onde λj e a funcao de risco no intervalo Ij, χij e 1 se o indivıduo i falhou no

intervalo Ij e 0 caso contrario,∑

j χij = δi e tij =

aj−1 se ti < aj−1,

ti se ti ∈ Ij,

aj se ti > aj.

.

Prova em Gamerman(1987).

Usando a distribuicao exponencial por partes, a funcao de risco do

modelo de estatico de sobrevivencia (1.12) e reescrita por

h(t|X, β) = h0,j exp{Xβ}= exp{β0,j + Xβ}, ∀t ∈ Ij. (3.27)

Substituindo λi pela funcao de risco (3.27) no Teorema 3.2, a funcao

de verossimilhanca para a funcao de risco de base se torna

L(h0, β) =n∏

i=1

J∏

j=1

(eβ0j+Xiβ)χij exp{−eβ0j+Xiβ(tij − aj−1)

}(3.28)

40

Combinando a verossimilhanca (3.28) com a priori (3.26) tem-se a

condicional completa para o vetor β0

p(β0| · · ·) ∝ exp{−1

2(β0 −m0)

T Λ(β0 −m0)}

× exp

n∑

i=1

J∑

j=1

[(β0j + Xiβ)χij − eβ0j+Xiβ(tij − aj−1)

](3.29)

Note que a distribuicao (3.29) nao e uma distribuicao conhecida, isto

e, nao se sabe gerar amostras diretamente dela. Portanto, os coeficientes

β0 serao gerados conjuntamente atraves do seguinte passeio aleatorio como

proposta

β(p)0 = β

(a)0 + E, E ∼ NJ(0, kΛ−1) (3.30)

onde k e uma constante usada para controlar a probabilidade de aceitacao

no algoritmo de Metropolis-Hastings.

Como a verossimilhanca nao depende de U , a distribuicao condicional

completa de U e dada combinando a priori de U , (3.25), com a priori de β0,

(3.26), que faz o papel analogo ao da funcao de verossimilhanca, logo

p(U | · · ·) ∝ U− c∗U2−1 exp

{− d∗U

2U

}(3.31)

que e o nucleo da distribuicao Gama Invertida com parametrosc∗U2

ed∗U2

onde

c∗U = cU + J e d∗U = dU +J∑

j=2

(β0j − β0(j−1))2

3.3.4 Outros processos a priori

Ferguson (1973) e Doss (1994) usam processos Dirichlet para modelar a

funcao de distribuicao de base F0(t) gerando uma falta de interpretacao sim-

ples em termos da funcao de risco, pois h0(t) = F ′0(t)/(1− F0(t)).

41

Gelfand e Mallick (1995) usam um processo de misturas de distribuicoes

Beta para uma transformacao da funcao de risco de base acumulada, esse

processo de Misturas de Betas foi usado para modelar a funcao de risco de

base em Carlin e Banerjee (2002).

No caso contınuo, Nieto-Barajas e Walker (2002) propuseram um mo-

delo Markoviano com funcao de risco dada por

h0(t) =∫ t

0exp{−a(t− u)}dL(u) (3.32)

onde a > 0 e L(u) e um processo com incrementos independentes em [0,∞)

sem componentes Gaussianos. Nieto-Barajas e Walker (2002) obtiveram a

distribuicao a posteriori de (3.32) para varios tipos de censura e discutem a

aplicacao em casos especiais.

3.4 Estudo Simulado

Foi gerada uma amostra de tempos de sobrevivencia de um modelo Weibull

com covariaveis. O modelo e dado por

h(t|X, β, α, λ) = αλtα−1eXβ

onde X e um vetor de covariaveis.

O tamanho da amostra e de 100 observacoes com 10% de censuras a

direita do tipo aleatoria, e duas covariaveis X = (X1, X2). X1 e uma variavel

dicotomica, gerada da distribuicao Bernoulli com parametro igual 0.5, X2 e

gerada de uma variavel Normal padrao, β = (1,−1)T , α = 1 e λ = 1.

O tempo mediano de sobrevivencia e 0,2952. Na Figura 3.1 tem-se a

funcao de sobrevivencia empırica dos tempos gerados sem as covariaveis, para

42

se ter uma ideia visual de como os dados estao distribuıdos. Perceba que as

falhas se concentram em tempo baixos, no instante de tempo 2 praticamente

80% das observacoes ja saıram do estudo, ou falharam ou foram censuradas.

0 1 2 3 4 5 6

0.00.2

0.40.6

0.81.0

t

S(t)

Figura 3.1: Funcao de Sobrevivencia Empırica linha (—) e o intervalo de

confianca de 95% linha (−−).

O grafico (a) da Figura 3.2 apresenta a variavel X1 versus o tempo.

Note que quando a covariavel assume valor igual a um as falhas ocorrem com

uma frequencia maior em tempo menores do que quando a covariavel assume

valor zero, indicando que em media o risco de falha quando a covariavel

assume valor um e maior que o risco quando a covariavel assume valor zero.

O que ja se sabe que e verdade pois β1 = 1. Uma interpretacao semelhante

acontece no grafico (b) da Figura 3.2, que apresenta a covariavel X2 versus o

tempo, pois a medida que o valor da covariavel diminui as falha ocorrem em

tempo menores, indicando que o risco de falha aumenta a medida que o valor

da covariavel diminui. O que tambem sabe-se que e verdade pois β2 = −1.

A inferencia sera feita com base na amostra da distribuicao a posteriori

43

−0.5 0.0 0.5 1.0 1.5

01

23

45

6

X1

Temp

o

−3 −2 −1 0 1 2

01

23

45

6

X2

Temp

o(a) Covariavel X1 (b) Covariavel X2

Figura 3.2: Plot das covariaveis versus o tempo observado.

gerada usando um algoritmo de Metropolis-Hastings, conforme descrito na

secao 2.2.2. As condicionais completas para os coeficientes de regressao na

Secao 3.2 e as diferentes formas de abordar a funcao de risco de base sao

descritas na Secao 3.3. Para simplificar cada modelo sera referenciado por

um codigo dado por:

MES - Wb Modelo Estatico usando distribuicao Weibull

MES - PG Modelo Estatico usando Processos Gama

MES - PC Modelo Estatico usando Processos Correla-

cionados

Para cada modelagem da funcao de risco base foi gerada uma cadeia

de tamanho 50000. A amostra a posteriori foi obtida utilizando um burn-in

de 40000 e lag = 50. Foram usadas as seguintes distribuicoes a priori:

β ∼ N

0

0

;

100 0

0 100

,

para o MES-Wb

α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10

44

λ ∼ Gama(0, 5; 0, 5), E(λ) = 1, V (λ) = 2

para o MES-PG foi considerado que

H∗0 (t) =

1

10t,

c = 0, 1,

e para o MES-PC

U ∼ GamInv(2, 05; 1, 05). E(U) = 1, V (U) = 20.

As estatısticas sumarizando as amostras geradas estao na Tabela 3.1.

Pode-se percerber que os modelos estimaram bem os parametros. A con-

vergencia foi verificada informalmente atraves do traco da cadeia onde e

razoavel supor que a partir do burn-in especificado a cadeia convergiu para

todos os modelos.

Modelo Par. Real Media Desvio 2.5% 50% 97,5%

MES-Wb β1 1 1,0658 0,2314 0,6150 1,0740 1,5280

β2 -1 -1,2798 0,1454 -1,5670 -1,278 -0,9939

α 1 1,1852 0,0922 1,0140 1,185 1,379

λ 1 1,0091 0,1555 0,7205 1,005 1,356

MES-PG β1 1 1,0671 0,2423 0,6397 1,0570 1,577

β2 -1 -1,1692 0,15860 -1,4690 -1,1720 -0,8365

MES-PC β1 1 0,8585 0,2384 0,3909 0,8590 1,3140

β2 -1 -1,06910 0,1157 -1,2920 -1,0690 -0,8471

U - 0,4215 0,2242 0,1436 0,3726 0,9565

Tabela 3.1: Estatısticas descritivas das amostras a posteriori.

45

As Figuras 3.3, 3.4 e 3.5 apresentam os histogramas da distribuicao

a posteriori para todos os parametros estimados em cada modelo, Weibull,

Processos Gama e processos Correlacionados, respectivamente. Na Figura

3.3 os dois primeiros graficos sao para os coeficientes de regressao e os outros

dois para os parametros da funcao de risco de base, α e λ, respectivamente.

Na Figura 3.4 os dois graficos sao referentes aos coeficientes de regressao.

E na Figura 3.5 os graficos sao para os coeficientes de regressao e para o

parametro que mede a forca da autocorrelacao de entre os intervalos adja-

centes da funcao de risco de base dos processos correlacionados.

A Figura 3.6 (a) apresenta a funcao de risco de base estimada pelo mo-

delo Weibull, onde os pontos visualizados na parte inferior da Figura mostram

os instantes de tempo observados, para se ter uma ideia da informacao que os

dados trazem para cada intervalo. Note que apesar da estimacao do processo

nao ser constante em media, quando se olha para o intervalo de credibili-

dade o valor verdadeiro da funcao de risco, h0(t) = 1, ∀t, esta contido no

intervalo. O grafico (c) apresenta uma aproximacao2 para a funcao de risco

de base para o modelo estatico com Procesdos Gama. Como a aproximacao

e a mais simples possıvel, esta nao e suficiente para concluir-se a respeito

da funcao de risco, mas da uma ideia de seu comportamento. O grafico (e)

apresenta estimativa de β0 a posteriori dos processos correlacionados. Note

que o valor Real esperado para o comportamento de β0 e que ele fosse con-

stante em torno de zero, pois a funcao de risco gerada era constante igual a

um. A marca“|”indica o instante onde foi observado uma falha. Os graficos

(b), (d) e (f) apresentam a funcao de risco de base acumulada a posteriori

na escala logarıtmica para os modelos Weibull, processos Gama e processos

2Essa aproximacao e feita a partir da funcao de risco de base acumulada gerada, onde

h0(ti) ≈ H0(ti)−H0(ti−1)ti−ti−1

.

46

β1

Densi

ty

0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8

0.00.5

1.01.5 Priori

β2

Densi

ty

−1.6 −1.4 −1.2 −1.0

0.00.5

1.01.5

2.02.5

Priori

α

Densi

ty

1.0 1.1 1.2 1.3 1.4

01

23

45

Priori

λ

Densi

ty

0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3

0.00.5

1.01.5

2.02.5

3.03.5

Priori

Figura 3.3: Histogramas dos parametros - Weibull

β1

Density

0.4 0.6 0.8 1.0 1.2 1.4 1.6

0.00.5

1.01.5 Priori

β2

Density

−1.6 −1.4 −1.2 −1.0 −0.8

0.00.5

1.01.5

2.02.5 Priori

Figura 3.4: Histogramas dos parametros - Processos Gama

correlacionados, respectivamente. Note que nos tres modelos as inferencias

foram satisfatorias, ou seja, o valor estimado esta proximo do valor usado na

geracao dos dados.

47

β1

Densi

ty

0.4 0.6 0.8 1.0 1.2 1.4

0.00.5

1.01.5

2.0

Priori

β2

Densi

ty

−1.4 −1.3 −1.2 −1.1 −1.0 −0.9

0.00.5

1.01.5

2.02.5

3.0 Priori

U

Densi

ty

0.2 0.4 0.6 0.8 1.0 1.2 1.4

0.00.5

1.01.5

2.0

Priori

Figura 3.5: Histogramas dos parametros - Processos Correlacionados

De acordo com o criterio DIC, Spiegelhalter et al. (2002). Este criterio

de comparacao e uma medida de ajuste do modelo corrigida pela complex-

idade dada por pD e quanto menor o valor do DIC melhor ajustado esta o

modelo. A Tabela 3.4 apresentado o valor do DIC e do pD para os modelos

ajustados e o melhor modelo apontado e o parametrico.

Modelo pD DIC

MES-Wb 1,4149 75,0895

MES-PG 0,9826 79,0895

MES-PC 0,0448 91,6713

Tabela 3.2: Criterio de comparacao de modelo.

48

0 1 2 3 4 5 6

0.00.5

1.01.5

2.02.5

t

h 0(t)

MediaIC 95%Real

| ||| | ||| | || | | || || || || ||| || ||| || | ||| |||| || | || ||| | || || || || ||| || | | || || || ||| ||||| | | || | ||| |||| | | ||| | ||| ||

−4 −2 0 2

−6−4

−20

2

log(t)

log(H 0(t)

)

MédiaIC 95%Real

(a) - h0(t) MES-Wb (b) - H0(t) MES-Wb

−4 −2 0 2

050

100

150

log(t)

h 0(t)

MédiaReal

| ||| | ||| | || | | || || || || ||| || ||| || | ||| |||| || | || ||| | || || | | || ||| || | | || || || || | ||||| | | || | ||| ||| | | | || | | ||| ||

−4 −2 0 2

−6−4

−20

2

log(t)

log(H 0(t)

)

MédiaIC 95%Real

(c) - h0(t) MES-PG (d) - H0(t) MES-PG

0 1 2 3 4 5 6

−10

12

Time

β 0(t)

| ||| | ||| | || | | || || || || ||| || ||| || | ||| |||| || | || ||| | || || || || ||| || | | || || || ||| ||||| | | || | ||| ||| | | | || | | ||| ||

MediaIC 95%Real

−4 −2 0 2

−4−2

02

log(t)

log(H 0(t)

)

MédiaIC 95%Real

(e) - h0(t) MES-PC (f) - H0(t) MES-PC

Figura 3.6: Estimativas para h0(t) e H0(t) nos modelos propostos, a linha

(—) e a media a posteriori, (−−) e o intervalo de credibilidade de 95% e

(· · ·) o valor verdadeiro.

49

Capıtulo 4

Modelos de Fragilidade

Espacial

Em algumas situacoes a posicao espacial do indivıduo pode alterar a funcao

de risco. Os trabalhos de Carlin e Banerjee (2002) e Henderson et al. (2002)

apresentaram algumas situacoes em que isso ocorre. O problema e que essa

variacao espacial pode vir de fontes nao identificadas ou de fontes identifi-

cadas, porem caras1 de se obter. Portanto, nesses casos aos modelos estaticos

serao incorporados uma variavel latente com uma estrutura espacial. Essa

variavel latente com estrutura espacial e incorporada a funcao de risco do

modelo e e conhecida por Fragilidade Espacial. Neste Capıtulo serao for-

malizados os Modelos Estaticos de Fragilidade Espacial juntamente com os

procedimentos de inferencia. A funcao de risco de base e os coeficientes de

regressao serao abordados de maneira similar a abordagem usada nos mod-

elos estaticos de sobrevivencia apresentados no Capıtulo anterior. A Frag-

1Uma observacao e dita cara quando ela e de difıcil acesso ou ate mesmo impossıvel de

se obter.

50

ilidade Espacial sera abordada atraves de processos Gaussianos usados em

Geoestatıstica. A metodologia sera aplicada a dados simulados.

O termo fragilidade foi introduzido em analise de sobrevivencia por

Vaupel et al. (1979) e apos seu trabalho varias pessoas vem incorporando

aos seus modelos o termo de fragilidade. Hougaard (1995) apresentou uma

lista de distribuicoes da fragilidade baseada nas propriedades de varios mo-

delos de sobrevivencia. Clayton (1991) foi o primeiro a introduzir uma abor-

dagem Bayesiana aos modelos de fragilidade. Na abordagem Bayesiana, a

distribuicao de fragilidade mais utilizada e a Gama, devido a conjugacao.

Entretanto outras distribuicoes de fragilidade tem sido pesquisadas, como

por exemplo a famılia de distribuicoes estaveis positivas, Qiou et. al. (1999).

4.1 Por que usar modelos com Fragilidade

Espacial?

Incluir a informacao espacial no modelo e interessante pois em algumas

situacoes a posicao espacial do indivıduo pode alterar sua chance de falhar,

ou seja, indivıduos semelhantes podem ter tempos de sobrevivencia diferentes

se morarem em lugares diferentes. Por exemplo, a chance de um indivıduo vir

a ter uma doenca pulmonar e maior quando ele mora em uma regiao poluıda

do que quando ele mora numa regiao com ar puro. Isso nem sempre ocorre,

mas ao se modelar os dados com uma estrutura espacial essa relacao podera

ser verificada caso a estrutura espacial seja significativa. Note que nesse

exemplo, o fator que altera a chance da pessoa ter uma doenca pulmonar e

a quantidade de poluicao na regiao onde ela mora. Porem a informacao da

51

quantidade de poluicao da regiao nao e facil de se obter. E mais ainda, pode

ser que existam outros fatores relacionados a posicao espacial que podem

estar alterando as chances de se ter a doenca, e nao estao sendo considera-

dos. Por isso, introduzir um termo de fragilidade com estrutura espacial e

interessante. Dessa forma, toda a heterogeneidade relacionada a estrutura

espacial podera ser captada na estimacao dos termos da fragilidade espacial.

O exemplo citado e fictıcio, mas existem situacoes reais onde a estru-

tura espacial foi verificada. Henderson et al. (2002) estudaram a variacao

espacial em tempos de sobrevivencia de pacientes com leucemia no noroeste

da Inglaterra. Esse conjunto de dados sera analisado nesta dissertacao mais

adiante. Carlin e Banerjee (2002) estudaram a variacao espacial em dados

de mortalidade infantial no estado de Minnesota, EUA. Em ambos os casos

foi constatada a presenca de heterogeneidade espacial.

4.2 O Modelo

Henderson et al. (2002) modelaram o termo de fragilidade espacial usando

uma distribuicao Gama Multivariada. Nesta dissertacao, toma-se o loga-

ritmo do termo de fragilidade adotado por Henderson e utiliza-se um processo

gaussiano para modela-lo, usando diretamente as tecnicas de Geoestatıstica.

O modelo de fragilidade espacial e uma extensao do modelo de fragili-

dade (1.17), onde alem de incluir ao modelo um termo com fragilidade com

alguma informacao espacial impoe-se a fragilidade uma estrutura espacial na

sua variabilidade. Sua funcao de risco e dada por

h(t|X, β, s) = h0(t) exp(Xβ + W (s)) (4.1)

52

onde s e a posicao espacial do invıduo e W (s) e a Fragilidade Espacial. Sera

assumido a priori que W (s) segue um processo Gaussiano com uma matriz

de variancias contendo a estrutura espacial.

A posicao espacial do indivıduo pode ser unica para cada indivıduo, ou

podem existir mais de um indivıduo em uma mesma posicao, onde a posicao

pode ser definida por uma regiao, por exemplo em um mesmo endereco,

bairro ou um nıvel mais agregado como cidade, municıpio, etc. Desta forma,

a funcao de verossimilhanca e construıda incorporando (4.1) em (1.10) logo

L(β, h0,W ) =R∏

r=1

nr∏

i=1

(h0(tir)e

Xirβ+W (sr))δir

exp{H0(tir)e

Xirβ+W (sr)}

(4.2)

onde tir e o instante de falha do i-esimo indivıduo da regiao r, Xir e o vetor

de covariaveis desse indivıduo, W (sr) e a fragilidade associada a regiao r das

R regioes possıveis, r = 1, . . . , R, i = 1, . . . , nr e nr e o numero de indivıduos

na regiao r. Note que regiao neste caso nao se refere necessariamente a uma

area no espaco, pode ser apenas um ponto no espaco.

Sem perda de generalidade sera assumido que cada indıviduo tem uma

posicao unica no espaco, ou seja, nr = 1 e R = n onde n e o numero de

indivıduos. portanto, a funcao (4.2) e reescrita por

L(β, h0,W ) =n∏

i=1

(h0(ti)e

Xiβ+W (si))δi

exp{H0(ti)e

Xiβ+W (si)}

(4.3)

onde ti e o tempo de falha do indivıduo i, Xi e o vetor de covariaveis desse

indivıduo e W (si) e a fragilidade espacial da regiao do indıviduo i, relem-

brando que regiao aqui tambem pode ser considerada como um ponto no

espaco.

Note que a funcao de verossimilhanca dos modelos estaticos de fragili-

dade espacial (4.3) difere da funcao de verrossimilhanca dos modelos estaticos

53

de sobrevivencia (1.13) apenas atraves do acrescimo da fragilidade espacial.

Portanto os coeficientes de regressao e a funcao de risco de base serao mode-

lados com os mesmos procedimentos definidos nas secoes 3.2 e 3.3, respecti-

vamente.

4.3 Coeficientes de Regressao

Analogamente a Secao 3.2 sera assumido uma distribuicao a priori para os

coeficientes de regressao dada pela equacao (3.2) e quando combinada com

a verossimilhanca (4.3) resulta na condicional para β completa a posteriori

p(β| · · ·) ∝ exp{−1

2(β −m)T V −1(β −m)

}

× exp

{n∑

i=1

[Xiβδi −H0(ti)e

Xiβ+W (si)]}

(4.4)

A distribuicao proposta para β sera o mesmo passeio aleatorio dado em

(3.4) com a probabilidade de aceitacao dada pelo mınimo entre 1 e a razao

entre as condicionais completas (4.4) de β(p) e β(a).

4.4 Funcao de Risco de Base

A funcao de risco de base sera abordada de forma analoga a da Secao 3.3.

Nessa Secao serao apresentados tres processos para descrever a funcao de

risco de base, os processos parametricos onde a distribuicao utilizada foi a

Weibull, os processos Gama com incrementos independentes e os processos

correlacionados usando modelos dinamicos.

54

4.4.1 Processos Parametricos

Utilizando a distribuicao Weibull com parametros α e λ, com funcao de risco

de base dada por (3.7), a funcao de verossiilhanca (4.3) e reescrita por

L(α, λ, β) =n∏

i=1

(αλtαi eXiβ+W (si)

)δi

exp{−λtαi eXiβ+W (si)

}(4.5)

Sera assumido a priori que os parametros da distribuicao Weibull seguem

as distribuicoes (3.9) e (3.10). Combinando com (4.5) a distribuicao condi-

cional completa a posteriori e dada por:

p(α, λ| · · ·) ∝ αaα−1e−bααλaλ−1e−bλλ

×n∏

i=1

(αλtαi )δi exp{−λtαi eXiβ+W (si)

}. (4.6)

Desta forma, a distribuicao condicional completa de λ e dada por

p(λ| · · ·) ∝ λaλ+∑n

i=1δi−1 exp

{−λ

(bλ +

n∑

i=1

tαi eXiβ+W (si)

)}

que o nucleo da distribuicao Gama. A condicional completa de α e dada por

p(α| · · ·) ∝ αaα−1e−bααn∏

i=1

(αλtαi )δi exp{−λtαi eXiβ+W (si)

}. (4.7)

A distribuicao (4.7) nao e uma distribuicao conhecida. Portanto, α sera

gerado usando o passeio aleatorio proposto para o logarıtmo de α dado em

(3.13) e a probabilidade de aceitacao e dada pelo mınimo entre 1 e p, onde p

e dado em (3.14) usando a distribuicao condicional (4.7).

4.4.2 Processos Gama

A descricao dos processos Gama foi dada na Secao 3.3 e sera a mesma uti-

lizada aqui, ou seja, sera considerado a priori que H0(t) segue um processo

55

Gama com incrementos indepentes. A diferenca esta na funcao de verossimi-

lhanca (3.16), pois ao se acrescentar o termo de fragilidade a nova funcao de

verossimilhanca e dada por

L(h0) ∝n∏

i=1

(dH0(ti)

dt

)δi

exp{−

∫ ti

0dH0(u)eXiβ+W (si)

}. (4.8)

Note que os termos que dependem somente de β foram considerados cons-

tantes e omitidos. Combinando a priori (3.15), que e a mesma da Secao 3.3,

com a verossimilhanca (4.8) tem-se que, no instante de falha ti, a condicional

completa para dH0(ti), i = 1, . . . , n, e

p(dH0(ti)| · · ·) ∝ dH0(ti)cdH∗(ti)+δi−1

× exp

−dH0(ti)

c +

∑

j∈R(ti)

eXjβ+W (sj)

. (4.9)

Para o instante t ∈ (ti−1, ti), i = 1, . . . , n a condicional completa de

dH0(t) e

p(dH0(t)| · · ·) ∝ dH0(t)cdH∗(t)−1

× exp

−dH0(t)

c +

∑

j∈R(ti)

eXjβ + W (sj)

. (4.10)

Usando o Teorema 3.1, tem-se que

∫ ti

ti−1

dH0(t)| · · · ∼ Gama

c

∫ ti

ti−1

dH∗(t), c +∑

j∈R(ti)

eXjβ

(4.11)

onde R(t) e o conjunto de ındices das observacoes sob risco, ou seja, o con-

junto de ındices das observacoes que ainda nao falharam ou nao foram cen-

suradas no instante de tempo t.

56

4.4.3 Processos Correlacionados

Inicialmente deve-se dividir o eixo do tempo em uma particao dada por (3.20)

com J intervalos, onde em cada intervalo sera assumido que a funcao de risco

de base e constante, ou seja, assumir uma distribuicao Exponencial por Partes

para o tempo de base. A metodologia de modelos dinamicos descrita na Secao

2.3 sera aplicada no logaritmo da funcao de risco de base. Tambem sera

assumido que o logaritmo da funcao de risco base em intervalos adjacentes

varia suavemente atraves de um processo auto-regressivo de primeria ordem

com equacao de sistema definida por (3.23) e (3.24) implicando na priori

conjunta para β0 = (β01, . . . , β0J)T dada em (3.26). A distribuicao a priori

para o parametro de suavidade U e dada por (3.25).

A especificacao a priori para os processos correlacionados e a mesma

da Secao 3.3. Assim como nos processos parametricos e nos processos Gama,

quando se inclui o termo de fragilidade a unica diferenca esta na funcao de

verossimilhanca, que e dada por

L(h0, β) =n∏

i=1

J∏

j=1

(eβ0j+Xiβ)χij exp{−eβ0j+Xiβ+W (si)(tij − aj−1)

}. (4.12)

Combinando a verossimilhanca (4.12) com a priori (3.26) tem-se a condicional

completa para o vetor β0

p(β0| · · ·) ∝ exp{−1

2(β0 −m0)

T Λ(β0 −m0)}

× exp

n∑

i=1

J∑

j=1

[(β0j + Xiβ)χij]

× exp

n∑

i=1

J∑

j=1

[−eβ0j+Xiβ+W (si)(tij − aj−1)

] . (4.13)

A distribuicao proposta para β0 sera o passeio aleatorio multivari-

ado dado em (3.30) e a distribuicao condicional completa a posteriori do

57

parametro de suavizacao, U , e dado por (3.31).

4.5 Fragilidade Espacial

Sera assumido que o termo de fragilidade espacial segue um processo Gaus-

siano estacionario isotropico com media zero, portanto

W |θ ∼ Nn (0, Σ) (4.14)

onde W = (W (s1), . . . , W (sn))T , Σ = σ2R, a matriz R carrega a estru-

tura espacial contida em s = (s1, . . . , sn)T , Rij = ρ(dij; θ), θ e o vetor de

hiperparametros da estrutura espacial e si e a posicao espacial da observacao

i = 1, . . . , n. A estrutura de correlacao espacial a ser utilizada sera a funcao

de correlacao exponencial potencia definida em (2.14), logo θ = (φ, κ) sao os

hiperparametros da estrutura de correlacao espacial.

Portanto, a estrutura de variancia espacial e dada por

Σ = σ2R, (4.15)

com

Rij = exp

{−

(dij

φ

)κ}, (i, j) = 1, . . . , n,

onde σ2 > 0, φ > 0, κ ∈ (0, 2] e dij = ||si − sj|| e a distancia Euclideana

das observacoes i e j. Lembrando que quando κ = 1 tem se a funcao de

correlacao de exponencial e quando κ = 2 tem-se a funcao de correlacao

Gaussiana.

Como priori para os hiperparametros sera utilizado:

φ ∼ Gama(aφ, bφ), aφ, bφ > 0. (4.16)

58

e

σ2 ∼ GamInv

(cσ2

2,dσ2

2

), cσ2 , dσ2 > 0. (4.17)

onde (aφ, bφ, cσ2 , dσ2) podem ser escolhidos de tal forma que as prioris se-

jam pouco informativas. Para o hiperparametro κ, devido a dificuldades

computacionais envolvendo convergencia da distribuicao a posteriori, sera

assumido uma priori degenerada, ou seja, sera assumido que κ e igual a

algum valor pre-especificado a priori.

Combinando a verossimilhanca (4.3) com a priori (4.14) usando a matriz

de variancias (4.15) tem-se a seguinte distribuicao condicional a posteriori

p(W | · · ·) ∝ exp{−1

2W T Σ−1W

}

× exp

{n∑

i=1

[δiW (si)−H0(ti)e

Xiβ+W (si)]}

(4.18)

Como (4.18) nao e uma distribuicao de facil amostragem, e necessario

propor o valor de uma distribuicao, a distribuicao proposta aqui sera um

passeio aleatorio multivariado dado por

W (p) = W (a) + E, E ∼ Nn(0, V ) (4.19)

onde W (p) e W (a) sao os valores proposto e da iteracao anterior, respectiva-

mente, para W (s). V e uma matriz de variancias que pode ser definida de

varias formas, mas destacam-se duas: kIn ou kΣ(a), onde k e uma constante

usada para controlar a probabilidade de aceitacao, In e a matriz identidade

de ordem n e Σ(a) e a matriz (4.15) com os valores da iteracao atual2 de φ e

σ2.

As condicionais completas a posteriori de (φ, σ2) sao obtidas combi-

nando (4.16) e (4.17), respectivamente, com (4.14) resultando nas seguintes

2Se o valor da iteracao atual nao estiver disponıvel, usa-se o valor da iteracao anterior.

59

condicionais completas a posteriori para φ

p(φ| · · ·) ∝ φaφ−1 exp{−bφφ}× |R|− 1

2 exp{− 1

2σ2W T R−1W

}(4.20)

e para σ2

p(σ2| · · ·) ∝ σ2−cσ22−1

exp

{− dσ2

2σ2

}

× σ2−n2 exp

{− 1

2σ2W T R−1W

}(4.21)

Para prever o valor da fragilidade em P regioes nao observadas sera

usada a distribuicao (2.18), que e uma suposicao a priori do modelo e a

distribuicao da previsao e dada por (2.19). Portanto, valores da distribuicao

prevista para regioes nao observadas podem ser gerados a partir de amostras

de fragilidades geradas para as regioes observadas, no proprio algoritmo de

MCMC.

O modelo de fragilidade espacial tem como caso particular o modelo de

fragilidade. Essa afirmacao e verificada quando a matriz R dada em (4.14)

e a identidade, ou seja, nao existe nenhuma estrutura de correlacao a priori

para os termos de fragilidade.

4.6 Estudo simulado

Nesta secao o modelo apresentado na Secao 4.2 sera aplicado a dados simula-

dos. Estes dados serao gerados a partir da distribuicao definida pela funcao

de risco abaixo:

h(ti|Xi, si) = αλtα−1i exp {Xiβ + W (si)} (4.22)

60

onde α = 1 e λ = 2 sao os parametros da funcao de risco de base Weibull,

β = (−2, 2)T e o vetor de parametros associados ao vetor de covariaveis

Xi = (X1i, X2i), onde X1i e uma variavel bernoulli com probabilidade 0,5 e

X2i e uma variavel nomal padrao, i = 1, . . . , n com n = 30. A proporcao de

censuras e 10% e a censura e do tipo aleatoria a direita. As posicoes espaciais

si’s foram geradas de forma aleatoria da regiao G = {(−3, 3) × (−3, 3)}. A

fragilidade W = (W (s1), . . . ,W (s30))T foi gerada a partir da distribuicao

normal multivariada dada por

W ∼ N30(0, Σ) (4.23)

onde Σ = σ2R, com Rij = ρ(dij; φ, κ) definida em (2.14), com φ = 1 e κ = 1,

dij = ||si − sj|| e a distancia Euclideana entre as posicoes si e sj geradas.

O tempo mediano e 0,8921, o tempo medio e 14,6850, havendo nos

dados tempos com valores de ate 140. Essas diferencas indicam a presenca

de uma grande variabilidade nos dados. A Figura 4.1 (a) apresenta a funcao

de sobrevivencia empırica incluındo todos os tempo gerados. A Figura 4.1

(b) apresenta a funcao de sobrevivencia empırica para tempos menores que

10 e foi gerada para se ter uma ideia melhor da distribuicao dos tempos

menores.

Parte dessa variabilidade e explicada por covariaveis. O grafico (a)

da Figura 4.2 apresenta a variavel X1 versus o tempo. Note que quando a

covariavel assume valor igual a zero as falhas ocorrem com uma frequencia

maior em tempo menores do que quando a covariavel assume valor um, in-

dicando que em media o risco de falha quando a covariavel assume valor um

e menor que o risco quando a covariavel assume valor zero. Essa suposicao

visual e verdadeira, pois sabe-se que β1 = −2.

61

0 20 40 60 80 100 120 140

0.00.2

0.40.6

0.81.0

t

S(t)

0 2 4 6 8

0.00.2

0.40.6

0.81.0

t

S(t)(a) Todos os dados (b) t < 10

Figura 4.1: Funcao de sobrevivencia Empırica linha (—) e o intervalo de

confianca de 95% linha (−−).

Uma interpretacao semelhante acontece na Figura 4.2 (b), que apre-

senta a covariavel X2 versus o tempo. A medida que o valor da covariavel

aumenta as falha ocorrem em tempo menores, indicando que o risco de falha

aumenta a medida que o valor da covariavel aumenta. O que tambem sabe-se

que e verdade pois β2 = 2. Note que os graficos do Figura 4.2 estao na escala

logarıtmica.

−0.5 0.0 0.5 1.0 1.5

020

4060

8010

012

014

0

X1

t

−2 −1 0 1

020

4060

8010

012

014

0

X2

t

(a) X1 (b) X2

Figura 4.2: Plot das covariaveis versus o tempo observado.

62

Outro fator que pode explicar a variabilidade dos dados e sua posicao

espacial, pois e intuitivo pensar que observacoes proximas tendem a ter ca-

racterısticas similares. A posicao espacial dos dados distribuıdos no espaco

estao na Figura 4.3. Na mesma Figura pode-se observar o valor gerado para

a fragilidade dividido por quartis, onde pode-se perceber que as observacoes

proximas tem valores similares da fragilidade. Era para ser assim, pois os

dados foram gerados com essa caracterıstica. Apesar de poucos dados, pode-

se perceber que existe uma similaridade entre valores proximos.

−4 −3 −2 −1 0 1 2 3

−3−2

−10

12

Latitude

Longitu

de

1o Q2o Q3o Q4o Q

Figura 4.3: Posicao espacial dos dados e a distribuicao da Fragilidade gerada,

o primero quartil da fragilidade esta representado por ◦, o segundo por 4, o

terceiro quartil por + e o quarto quartil por ×.

63


gerada usando um algoritmo de Metropolis-Hastings descrito na secao 2.2.2.

As condicionais completas para os coeficientes de regressao na Secao 4.3, as

diferentes formas de abordar a funcao de risco de base sao descritas na Secao

4.4 e a condicional completa para a fragilidade e descrita na Secao 4.5. Para

simplificar cada modelo sera referenciado por um codigo dado por:

MEFE-Wb Modelo estatico de fragilidade usando distribuicao

Weibull

MEFE-PG Modelo estatico de fragilidade usando Processos Gama

MEFE-PC Modelo estatico de fragilidade usando Processos Cor-

relacionados




β ∼ N(0; 100),

φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1

σ2W ∼ GamInv(3; 2), E(σ2

W ) = 1, V (σ2W ) = 1

para o MEFE-Wb

α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10

λ ∼ Gama(0, 5; 0, 5), E(φ) = 1, V (φ) = 2

para o MEFE-PG foi considerado que

H∗0 (t) =

t

10,

c = 0, 1,

64

e para o MEFE-PC

U ∼ GamInv(2, 05; 1, 05), E(U) = 1, V (U) = 20.


Pode-se perceber que os modelos estimaram bem os parametros, isto e o

valor real esta contido no intervalo de credibilidade a posteriori. Com a

excessao do coeficiente β1 que foi subestimado nos modelos Weibull (MEFE-

Wb) e processos correlacionados (MEFE-PC). A convergencia foi verificada

informalmente atraves do traco da cadeia onde e razoavel supor que a partir

do burn-in especificado a cadeia convergiu para todos os modelos. Para

se ter um ideia visual da distribuicap da amostra da posteriori as Figuras

4.4, 4.6 e 4.5 apresentam os histogramas da distribuicao a posteriori para os

parametros estimados em cada modelo, Weibull, Processos Gama e processos

Correlacionados, respectivamente.

Na Figura 4.4 os dois primeiros histogramas sao para os coeficientes de

regressao, os dois seguintes para os parametros da funcao de risco de base, α

e λ, respectivamente, e os dois graficos seguintes os hiperparametros da frag-

ilidade espacial, σ2 e φ, respectivamente. Na Figura 4.6 os dois primeiros his-

togramas sao referentes aos coeficientes de regressao e os seguintes aos hiper-

parametros da fragilidade. Na Figura 4.5 os primeiros histogramas sao para

os coeficientes de regressao, os seguintes sao referentes aos hiperparametros

da fragilidade e o ultimo histograma para o parametro U que mede a forca

da autocorrelacao entre os intervalos adjacentes da funcao de risco de base

dos processos correlacionados.

65

Modelo Param. Real Media Desvio 2,5% 50% 97,5%

MEFE-Wb β1 -2 -4,054 0,7457 -5,513 -3,989 -2,7348

β2 2 2,9141 0,5151 1,9282 2,883 3,9952

α 1 1,348 0,1802 1,0207 1,3415 1,7101

λ 2 3,0627 1,3237 1,2396 2,776 6,4542

σ2 1 1,3322 0,6005 0,5507 1,1935 2,8305

φ 1 1,0439 0,2914 0,5734 0,9944 1,6822

MEFE-PG β1 -2 -1,603 0,5059 -2,6671 -1,5765 -0,6506

β2 2 1,4384 0,3357 0,8409 1,4155 2,1602

σ2 1 0,8978 0,3141 0,4457 0,8503 1,6333

φ 1 1,3053 0,3574 0,7023 1,279 2,087

MEFE-PC β1 -2 -3,3648 0,6313 -4,5646 -3,3430 -2,1458

β2 2 2,3415 0,3073 1,6947 2,3545 2,9505

U - 0,4306 0,2904 0,1350 0,3424 1,2250

σ2 1 0,9888 0,4178 0,3913 0,9304 1,9405

φ 1 1,0131 0,2979 0,5144 0,9804 1,6459


66

β1

Den

sity

−6 −5 −4 −3 −2

0.0

0.1

0.2

0.3

0.4

0.5

Priori

β2

Den

sity

1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5

0.0

0.2

0.4

0.6

Priori

α

Den

sity

0.8 1.0 1.2 1.4 1.6 1.8 2.0

0.0

0.5

1.0

1.5

2.0

Priori

λ

Den

sity

0 2 4 6 8

0.0

0.1

0.2

0.3

Priori

σ2

Den

sity

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Priori

φ

Den

sity

0.5 1.0 1.5 2.0

0.0

0.5

1.0

1.5

Priori

Figura 4.4: Histogramas dos parametros - MEFE-Wb

67

β1

Den

sity

−6 −5 −4 −3 −2

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Priori

β2

Den

sity

1.5 2.0 2.5 3.0

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Priori

σ2

Den

sity

0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.2

0.4

0.6

0.8

1.0

Priori

φ

Den

sity

0.5 1.0 1.5 2.0

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

Priori

U

Den

sity

0.0 0.5 1.0 1.5 2.0

0.0

0.5

1.0

1.5

2.0 Priori

Figura 4.5: Histogramas dos parametros - MEFE-PC

68

β1

Dens

ity

−3.5 −2.5 −1.5 −0.5 0.0

0.00.1

0.20.3

0.40.5

0.60.7

Priori

β2

Dens

ity

1.0 1.5 2.0

0.00.2

0.40.6

0.81.0 Priori

σ2

Dens

ity

0.5 1.0 1.5 2.0

0.00.5

1.01.5 Priori

φ

Dens

ity

0.5 1.0 1.5 2.0 2.5 3.0

0.00.2

0.40.6

0.81.0

1.2

Priori

Figura 4.6: Histogramas dos parametros - MEFE-PG

69

A Figura 4.7, apresenta um conjunto de graficos relacionados a funcao

de risco de base e a funcao de risco de base acumulada. O grafico (a) apre-

senta a funcao de risco de base estimada pelo modelo Weibull. Note que

apesar do processo nao ser constante em media, quando se olha para o in-

tervalo de credibilidade o valor verdadeiro da funcao de risco, h0(t) = 2, ∀t,esta contido no intervalo. O grafico (c) apresenta uma aproximacao para a

funcao de risco de base para o modelo estatico com Processos Gama. Como

a aproximacao e a mais simples possıvel, a aproximacao nao e suficiente para

concluir-se a respeito da funcao de risco, mas da uma ideia de seu comporta-

mento. O grafico (e) apresenta os valores de β0 a posteriori dos processos cor-

relacionados, onde os pontos visualizados na parte inferior da figura mostram

os instantes de tempo observados, para se ter uma ideia da informacao que

os dados trazem para cada intervalo. Note que o valor real esperado para o

comportamento de β0 e que ele fosse constante e igual a zero, pois a funcao

de risco gerada era constante igual a um. Os graficos (a),(c) e (e) contem

na sua parte inferior uma marca “|”que informa o instante onde foi obser-

vado uma falha. Os graficos (b), (d) e (f) apresentam a funcao de risco de

base acumulada a posteriori na escala logarıtmica para os modelos Weibull,

processos Gama e processos correlacionados, respectivamente. Note que nos

tres modelos as inferencias foram satisfatorias, ou seja, o valor estimado esta

proximo do valor do qual os dados foram gerados.

70

−4 −2 0 2 4

−20

24

log(t)

log(h 0(t)

)

MediaIC 95%Real

|| |||| |||| ||| ||||| || ||| || || || |

−4 −2 0 2 4

−6−4

−20

24

68

log(t)

log(H 0(t)

)

MédiaIC 95%Real

(a) - h0(t) MEFE-Wb (b) H0(t) MEFE-Wb

−4 −2 0 2 4

02

46

810

log(t)

h 0(t)

MédiaReal

|| |||| |||| ||| ||||| || ||| || || || |

−4 −2 0 2 4

−4−2

02

log(t)

log(H 0(t)

)MédiaIC 95%Real

(c) - h0(t) MEFE-PG (d) H0(t) MEFE-PG

0 20 40 60 80 100 120 140

−10

−50

5

Time

β 0(t)

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

−4 −2 0 2 4

−4−2

02

46

log(t)

log(H 0(t)

)

MédiaIC 95%Real

(e) - β0(t) = log h0(t) MEFE-PC (f) H0(t) MEFE-PC

Figura 4.7: Estimativas para h0(t) e H0(t) nos modelos propostos. A linha

contınua representa a media a posteriori da funcao estimada, a linha trace-

jada indica o interevalo de credibilidade e a linha pontilhanda o valor real da

funcao.

71

Os termos de fragilidade espacial estimados para os modelos MEFE-

Wb, MEFE-PG e MEFE-PC sao apresentados nas Figura 4.8 e 4.9, onde

pode-se verificar que os tres modelo estimaram relativamente bem o termo

de fragilidade espacial.

Os modelos MEFE-Wb e MEFE-PC tiveram suas estimativas mais

proximas do valores reais, que e visto nos Box-Plots das amostras a pos-

teriori da fragilidade para os tres modelos, pode-se pecerber que a media

da fragilidade para cada indivıduo esta bem proxima do valor real (linha

contınua ), Mas, nos Box-plots (a) e (e), referentes aos modelos MEFE-Wb e

MEFE-PC, estao melhor ajustados que o modelo MFE-PG, Box-Plot (c). O

modelo Weibull ja era esperado de se adequar melhor aos dados, pois estes

foram gerados de um modelo Weibull.

As Figuras 4.8 (b) e (d) e 4.9 (b) apresentam os quartis da amostra da

posteriori da fragilidade espacial. Apesar de poucos dados, pode-se perceber

que existe uma similaridade entre valores proximos. Esses graficos podem

ser comparados com a figura 4.3 que apresenta a distribuicao espacial da

fragilidade verdadeira e nota-se que as estimativas estao similares ao valores

Real.

72

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

−4−2

02

4

W index

W

MediaReal

−4 −2 0 2

−3−2

−10

12

Latitude

Long

itude

1o Q2o Q3o Q4o Q

(a) - Box-Plot de W no MEFE-Wb (b) - W distribuıdo no espaco MEFE-Wb

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

−2−1

01

23

4

W index

W

MediaReal

−4 −2 0 2

−3−2

−10

12

Latitude

Long

itude

1o Q2o Q3o Q4o Q

(c) - Box-Plot de W no MEFE-PG (d) - W distribuıdo no espaco MEFE-PG

Figura 4.8: Estimativas para a Fragilidade Espacial nos modelos propostos.

Nas Figuras (b) e (d) o primero quartil esta representado por ◦, o segundo

por 4, o terceiro quartil por + e o quarto quartil por ×.

73

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

−20

24

W index

W

MediaReal

−4 −2 0 2

−3−2

−10

12

Latitude

Long

itude

1o Q2o Q3o Q4o Q

(a) - Box-Plot de W no MEFE-PC (b) - W distribuıdo no espaco MEFE-PC

Figura 4.9: Estimativas para a Fragilidade Espacial nos modelos propostos.

Na Figura (b) o primero quartil esta representado por ◦, o segundo por 4,

o terceiro quartil por + e o quarto quartil por ×.

A Figura 4.10 (a) compara as estimativas da fragilidade espacial gerada

pelos modelos. Para cada modelo foi ajustada uma reta e o melhor modelo

e aquele que estiver mais proximo da reta de 45o. Os modelos MEFE-Wb

e MEFE-PC se mostraram melhores que o modelo MEFE-PG. Mas, quando

se compara so riscos relativos3 os modelos ajustados tem comportamento

semelhante.

A Tabela 4.6 apresenta os valores do DIC e do pD para os modelos

ajustados. De acordo com esse criterio o melhor modelo e MEFE-PG, apesar

de nao apresentar as melhores estimativas para a fragilidade espacial W ,

suas estimativas para os coeficientes de regressao foram as mais proximas

dos valores verdadeiros.

3O risco relativo foi calculado usando como base a fragilidade espacial do primeiro

indivıduo, ou seja, W1 e a base.

74

−2 −1 0 1 2

−2−1

01

2

W − Verdadeiro

W − E

stima

do

RealMEFE−WbMEFE−PGMEFE−PC

−1 0 1 2

−10

12

log(RR de W) − Verdadeiro

log(R

R de

W) −

Estim

ado

RealMEFE−WbMEFE−PGMEFE−PC

(a) - Frgilidade Espacial (b) - log do Risco relativo de W

Figura 4.10: Comparacao das estimativas da Fragilidade Espacial com o valor

verdeiro. Os pontos representados pelo ◦ pertencem ao modelo MEFE-Wb,

os 4s representam MEFE-PG e as +s represetam o modelo MEFE-PC.

Modelo pD DIC

MEFE-Wb 7,5675 149,0566

MEFE-PG 13,9953 86,8785

MEFE-PC 22,3951 230,4926


75

Capıtulo 5

Modelos Dinamicos de

Sobrevivencia com e sem

Fragilidade Espacial

A suposicao de riscos proporcionais pode funcionar muito bem em alguns con-

juntos de dados de sobrevivencia, mas esta suposicao pode ser forte demais

para outras situacoes. Situacoes estas onde existem efeitos de covariaveis

dependentes do tempo, como por exemplo o risco de um idoso contrair uma

doenca e sua idade, a medida que a idade aumenta, ou seja, a medida que

o tempo cresce o risco de um indivıduo idoso contrair uma doenca tambem

cresce pois seu sistema imunologico vai ficando cada vez mais deficiente.

Modelos que estendem o modelo de Cox (1.12) incluındo covariaveis

cujo o efeito variem com o tempo ja vem sendo abordados na literatura, veja

em Klein e Moeschberg (1991). Sob o ponto de vista Bayesiano, Gamerman

(1991) usa processos correlacionados a priori, e mais recentemente o trabalho

76

de Hemming e Shaw (2002) usa um algoritmo de MCMC para o modelo de

Gamerman e aplica-o a dados de tempos de sobrevivencia de indivıduos com

cancer de mama.

Os modelos que estendem o modelo de Cox (1.12) com covariaveis e

seus efeitos dependentes do tempo tem a seguinte funcao de risco:

h(t|X) = h0(t)G(X(t); β(t)) (5.1)

onde G(.; .) e uma funcao positiva, usualmente G(.; .) = exp{.; .}, X(t) e um

vetor de covariaveis e β(t) e um vetor coluna com os efeitos das covariaveis

no instante t, onde X(t) = (X1(t), . . . , Xp(t)) e β(t) = (β1(t), . . . , βp(t))T .

Sera assumido que o valor das covariaveis do modelo nao se altera ao

longo do tempo, ou que mudem de forma determinıstica, como por exemplo

a idade, pois a medida que o tempo aumenta sabe-se exatamente quanto a

idade de indivıduo aumenta, ou seja, X(t) = X, ∀t.

Na Secao 5.1 sera apresentado o modelo de sobrevivencia dinamico

onde serao apresentadas distribuicoes a priori para os efeitos e seus hiper-

parametros, as distribuicoes condicionais completas a posteriori e propostas

para o MCMC. Na Secao 5.2 sera incorporado ao modelo dinamico de sobre-

vivencia o termo de fragilidade espacial, gerando uma nova classe de modelos,

os modelos dinamicos de fragilidade espacial onde serao apresentadas as dis-

tribuicoes a priori, as condicionais completas a posteriori e propostas para

o MCMC para todos os parametros e seus hiperparametros. Finalizando o

capıtulo, um estudo simulado sera conduzido para mostrar a eficiencia do

modelo.

77

5.1 Modelo Dinamico de Sobrevivencia

Seguindo a especificao de Gamerman (1991), o eixo de tempo sera parti-

cionado da mesma forma que na Secao 3.3.3, onde foi usada a abordagem de

modelos dinamicos para estudar a funcao de risco de base. Ou seja,

Ij =

[0, a1], j = 1,

(ai−1, ai], j = 2, . . . , J

(aS,∞), j = J + 1

(5.2)

com 0 < a1 < . . . < aJ < ∞.

Sera assumido que para tempos percentes a um mesmo intervalo Ij, j =

1, . . . , J , a funcao de risco (5.1) e constante com respeito ao tempo. Portanto

h(t; X, β) = exp {β0j + Xβ.,j} , t ∈ Ij, j = 1, . . . , J. (5.3)

onde h0(t) = exp{β0j} e β.,j = (β1j, . . . , βpj)T , ∀t ∈ Ij.

Com a particao (5.2) e a funcao de risco (5.3), usando o Teorema 3.2

da pagina 40 tem-se que a funcao de verossimilhanca e dada por

L(h0, β) = exp

n∑

i=1

J∑

j=1

χijXiβ.,j − eXiβ.,j(tij − aj−1)

(5.4)

onde χij assume valor 1 se o indivıduo i falha no intervalo j e 0 caso contrario.

Logo∑

j χij = δi e para simplificar a notacao foram feitas as seguintes ex-

pansoes: Xi = (1, Xi) e β.,j = (β0j, β.,j)T para simplificar a notacao.

Seja a matriz de coeficientes dada por:

β =

β0,1 β1,1 . . . βp,1

β0,2 β1,2 . . . βp,2

......

...

β0,J β1,J . . . βp,J

= [β0,, β1,, . . . , βp,] (5.5)

78

Suponha que ∀i = 0, 1, . . . , p tem-se o seguinte passeio aleatorio

βi,j = βi,j−1 + ui,j, ui,j ∼ N(0, σ2i bjU) (5.6)

onde bj e conhecido e dado por (aj − aj−1) e U mede a forca da evolucao.

Completando a especificacao a priori tem-se que

βi,1 ∼ N(mi, Cσ2i ). (5.7)

Portanto,

βi,. ∼ N(mi1, σ2

i Λ−1i

)(5.8)

onde 1 = (1, . . . , 1)T , e Λi e definida em (2.11). Supondo independencia dos

ui,j’s tem-se

uj = (u0,j, . . . , up,j) ∼ N(p+1)(0, bjUΣ) (5.9)

onde Σ = diag(σ20, . . . , σ

2p).

Supondo independencia na priori (5.7) tem-se que

β.,1 = (β0,1, . . . , βp,1) ∼ N(m,CΣ) (5.10)

onde m = (m0, . . . , mp)T e C e uma escalar comum.

Daı,

β ∼ N(1⊗mT , Λ−1, Σ

)(5.11)

onde Λ−1 = Λ−10 = . . . = Λ−1

p , ou seja,

vec(β) ∼ NJ(p+1)

(mT ⊗ 1, Σ⊗ Λ−1

)(5.12)

onde vec(A) e a vetorizacao da matriz A. A funcao de densidade e dada por

p(β|U, σ20 . . . , σ2

p) = (2π)−J(p+1)/2|Σ|−J/2|Λ|(p+1)/2

× exp{−1

2tr

[(β −B)T Λ(β −B)Σ−1

]}

79

onde |A| e tr(A) sao o determinante e o traco, respectivamente, da matriz

A. Algumas propriedades da distribuicao normal matriz-variada sao encon-

tradas em West e Harrison (1997) e Dawid (1981). Para os hiperparametros

U, σ20 . . . , σ2

p serao assumidas as seguintes distribuicoes a priori

U ∼ GamInv

(cU

2,dU

2

)(5.13)

σ2i ∼ GamInv

(ci

2,di

2

), i = 0, 1, . . . , p (5.14)

Os parametros ((cU , dU), (c0, d0), . . . , (cp, dp)) sao conhecidos a priori e

descrevem a informacao inicial de seus respectivos hiperparametros.

Combinando a priori (5.11) com a verossimilhanca (5.4) atraves do

Teorema de Bayes, tem-se que a condicional completa a posteriori para β e

dada por

p(β| · · ·) ∝ p(β) exp

n∑

i=1

J∑

j=1


∝ exp{−1

2tr

((β −B)T Λ(β −B)Σ−1

)}

× exp

n∑

i=1

J∑

j=1


(5.15)

A distribuicao condicional (5.15) nao e de facil amostragem. Portanto,

e necessario propor o valor de β de alguma distribuicao, que aqui sera um

passeio aletorio matricial, ou seja,

β(p) = β(a) + E, E ∼ NJ×p+1(0, kΛ(a)−1, Σ(a))

onde k e uma constante usada para controlar a taxa de aceitacao. A probabi-

lidade de aceitacao e dada pelo mınimo entre 1 e a razao entre as condicionais

completas de β(p) e β(a), dadas por (5.15).

80

As condicionais completas dos hiperparametros sao dadas atraves da

combinacao das (5.13) e (5.14) com a verossimilhanca dos hiperparametros

(5.11), logo

p(U | · · ·) ∝ U− c∗U2−1 exp

{d∗U2U

}(5.16)

onde

c∗U = cU + (p + 1) ∗ (J − 1)

d∗U = dU +J∑

j=2

p∑

i=0

(βi,j − βi,j−1)2

2bjσ2i

e as condicionais completas para σ2i , i = 0, . . . , p sao dadas por

p(σ2i | · · ·) ∝ σ2

i− c∗

i2−1

exp

{d∗i2σ2

i

}, i = 0, . . . , p (5.17)

onde

c∗i = ci + J

d∗i = di +[(β −B)T Λ(β −B)

]i,i

e [A]i,j significa o elemento da linha i e da coluna j da matriz A.

5.2 Modelo Dinamico de Fragilidade Espacial

Em alguns casos, a posicao espacial do indivıduo pode alterar o risco desse

indivıduo falhar, como ja foi discutido no Capıtulo 4. Nesta secao o termo de

fragilidade espacial sera incorporado a funcao de risco (5.1) com covariaveis

dependentes do tempo levando a uma nova classe de modelos, os Modelos

Dinamicos de Fragilidade Espacial. Ou seja, modelos que nao supoem riscos

proporcionais por aceitarem efeitos dependentes do tempo e alem disso in-

corporam a possıvel variacao espacial entres indivıduos. A funcao de risco e

81

dada por

h(t|X, s) = h0(t) exp(X(t)β(t) + W (s)) (5.18)

onde W (s) e a fragilidade atribuıda a posicao espacial s, X(t) e um vetor de

covariaveis e β(t) e um vetor coluna com os efeitos das covariaveis no instante

t, onde X(t) = (X1(t), . . . , Xp(t)) e β(t) = (β1(t), . . . , βp(t))T . Sera assumido

que o tempo afeta apenas os efeitos das covariaveis, nao as covariaveis, ou

seja, X(t) = X, ;∀t e a funcao de risco de base sera escrita por exp{β0(t)},portanto a funcao de risco de base e dada por

h(t|X, s) = exp{β0(t) + Xβ(t) + W (s)}. (5.19)

Este modelo tem como casos particulares os modelos estaticos de sobre-

vivencia (1.12), quando β(t) = β, ∀t e W (s) = 0, ∀s, os modelos estaticos

de fragilidade espacial (4.1), quando β(t) = β, ∀t e os modelos dinamicos de

sobrevivencia (5.1), quando W (s) = 0, ∀s.

Sera assumido a mesma discretizacao do eixo do tempo usada na secao

anterior, ou seja, o eixo do tempo sera dividido em J +1 intervalos disjuntos

dados em (5.2) e tempos percentes a um mesmo intervalo Ij, j = 1 . . . , J ,

a funcao de risco (5.19) sera assumida constante com respeito ao tempo.

Portanto

h(t; X, β, s) = exp {β0j + Xβ.,j + W (s)} ∀t ∈ Ij, j = 1, . . . , J. (5.20)

onde β.,j = [β1j, . . . , βpj]T , ∀t ∈ Ij.

Com a particao (5.2) e a funcao de risco (5.20), a funcao de verossimi-

lhanca e escrita a partir da aplicacao do Teorema 3.2 com a funcao de risco

(5.20) e particao (5.2), isto e

L(h0, β,W ) = exp

n∑

i=1

J∑

j=1

χij(Xiβ.,j + W (si))− eXiβ.,j+W (si)(tij − aj−1)

(5.21)

82

onde β = (β1, . . . , βJ)T ,χij assume valor 1 se o indivıduo i falha no intervalo

j e 0 caso contrario, logo∑

j χij = δi. Para simplificar a notacao as seguintes

expansoes foram feitas: Xi = (1, Xi) e βj = (β0j, βj)T .

Note que os procedimentos de inferencia para β serao muito similares

aos procedimentos descritos na secao anterior, com a diferenca da inclusao do

termo de fragilidade. Portanto, a distribuicao a priori para β e a distribuicao

normal matriz-variada dada em (5.11) com prioris para os hiperparametros

dados em (5.13) e (5.14).

Combinando a priori (5.11) com a verossimilhanca (5.21) atraves do

Teorema de Bayes, tem-se que a condicional completa a posteriori para β e

dada por

p(β| · · ·) ∝ p(β) exp

n∑

i=1

J∑

j=1

χijXiβ.,j − eXiβ.,j+W (si)(tij − aj−1)

∝ exp{−1

2tr

[(β −B)T Λ(β −B)Σ−1

]}

× exp

n∑

i=1

J∑

j=1

χijXiβ.,j − eXiβ.,j+W (si)(tij − aj−1)

(5.22)

Como (5.22) nao e de facil amostragem e necessario propor o valor de

uma distribuicao proposta que aqui sera um passeio aleatorio matriz-variado

dado por

β(p) = β(a) + E, E ∼ NJ×(p+1)(0, kΛ(a), Σ(a))

onde k e uma constante usada para controlar a taxa de aceitacao. A probabi-

lidade de aceitacao e dada pelo mınimo entre 1 e a razao entre as condicionais

completas de β(p) e β(a), dadas por (5.22).

As condicionais completas dos hiperparametros sao dadas atraves da

combinacao das (5.13) e (5.14) com a verossimilhanca dos hiperparametros

83

(5.11). Logo as condicionais completas sao identicas a (5.16) e (5.17).

O termo de fragilidade espacial sera modelado segundo um processo

Gaussiano usado em Geoestatıstica, dado em (4.14) com estrutura de cor-

relacao espacial definida em (2.14). As distribuicoes a priori para os hiper-

parametros da estrutura espacial,φ e σ, sao dadas em (4.16) e (4.17), respec-

tivamente. O hiperparametro κ, devido a dificuldades computacionais envol-

vendo convergencia da distribuicao a posteriori, sera assumido uma priori de-

generada, ou seja, sera assumido que κ e igual a algum valor pre-especificado

a priori.

Combinando a verossimilhanca (5.21) com a priori (4.14) usando a ma-

triz de variancias (4.15) tem-se a seguinte distribuicao condicional a posteriori

W = (W (s1), . . . , W (sn))

p(W | · · ·) ∝ exp

−

1

2W T Σ−1W +

n∑

i=1

J∑

j=1

χijW (si)

× exp

−

n∑

i=1

J∑

j=1

eXiβj+W (si)(tij − aj−1)

(5.23)

Lembrando que∑

j χij = δi e que W (si) nao depende do tempo, pode-se

reescrever (5.23) da seguinte forma

p(W | · · ·) ∝ exp

{−1

2W T Σ−1W +

n∑

i=1

δiW (si)

}

× exp

−

n∑

i=1

eW (si)J∑

j=1

eXiβj(tij − aj−1)

(5.24)

Como (5.24) nao e de facil amostragem e necessario propor o valor de

uma distribuicao proposta que aqui sera um passeio aleatorio multivariado

dado em (4.19). As condicionais completas a posteriori de (φ, σ2) sao dadas

em (4.20) e (4.21).

84

Para prever o valor da fragilidade em P regioes nao observadas sera

usado a distribuicao (2.18), que e uma suposicao a priori do modelo e a

distribuicao da previsao e dada por (2.19). Portanto, valores da distribuicao

preditiva para regioes nao observadas podem ser gerados a partir de amostras

de fragilidades geradas para as regioes observadas, no proprio algoritmo de

MCMC.

5.3 Estudo Simulado

Nesta Secao os modelos apresentados nas Secoes 5.1 e 5.2 serao aplicados a

dados simulados, estes dados serao gerados a partir da distribuicao definida

pela funcao de risco abaixo:

h(ti|Xi, si) = αλtα−1i exp {Xiβ + W (si)} (5.25)

onde α = 1 e λ = 2 sao os parametros da funcao de risco de base Weibull,

β = (−2, 2)T e o vetor de parametros associados ao vetor de covariaveis

Xi = (X1i, X2i), onde X1i e uma variavel bernoulli com probabilidade 0,5 e

X2i e uma variavel nomal padrao, i = 1, . . . , n com n = 30. A proporcao

de censuras e 10% e a censura e do tipo aleatoria. As posicoes espaciais

si’s foram geradas de forma aleatoria da regiao G = {(−3, 3) × (−3, 3)}.A fragilidade W = (W (s1), . . . ,W (s30))

T foi gerada a partir da distribuicao

normal multivariada dada por

W ∼ N30(0, Σ) (5.26)

onde Σ = σ2R, com rij = ρ(dij; φ, κ) definida em (2.14), com φ = 1 e κ = 1,

dij = ||si − sj|| e a distancia Euclideana entre as posicoes si e sj geradas.

85

Estes dados sao os mesmos utilizados na Secao 4.6 e nao possuem co-

variaveis depententes do tempo, portanto espera-se que as estimativas para

para os coeficientes indiquem que os coeficientes sejam constantes ao longo

do tempo.

As estatısticas descritivas para estes dados sao dadas na Secao 4.6 e a

inferencia sera feita com base na amostra da distribuicao a posteriori gerada

usando um algoritmo de Metropolis-Hastings descrito na secao 2.2.2. As

condicionais completas sao dadas nas Secoes 5.1 e 5.2. Para simplificar, os

modelos serao referenciados por:

MDS Modelo dinamico de sobreviencia

MDFE Modelo dinamico de fragilidade espacial




β.,1 ∼ N(0; diag(σ20, σ

21, σ

22))

U ∼ GamInv(2, 05; 0, 0105), E(U) = 0, 01, V (U) = 0, 002

σ2i ∼ GamInv(2, 05; 1, 05), E(σ2

i ) = 1, V (σ2i ) = 20, i = 0, 1, 2

φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1


W ) = 1, V (σ2W ) = 1.


Pode-se perceber que o parametro U que mede a forca da auto-correlacao en-

tre os intervalos da particao e pequeno quando comparada ao valor verdadeiro

dos parametros (β0, β1, β2) = (log(2),−2, 2), indicando que os intervalos ad-

jacentes sao muito similares, o que ja e um indıcio de que os coeficientes sejam

constantes. Os parametros da correlacao espacial da fragilidade foram muito

86

bem estimados, com a media proxima do valor verdadeiro e os intervalos de

credibiliade contendo o valor real, que sao σ2 = 1 e φ = 1.

Modelo Param. Media Desvio 2,5% 50% 97,5%

MDS σ20 0,8275 0,7043 0,2148 0,6267 3,0944

σ21 3,4428 3,3171 0,8499 2,5670 12,0505

σ22 1,3302 0,8711 0,3644 1,1275 3,7161

U 0,0053 0,0023 0,0021 0,0049 0,0111

MDFE σ20 0,7032 0,4007 0,2248 0,6054 1,7745

σ21 1,8244 1,3658 0,4233 1,3870 5,3898

σ22 2,2924 1,9422 0,5706 1,7730 7,0774

U 0,0077 0,0047 0,0023 0,0065 0,0182

σ2 0,9823 0,3258 0,496 0,9404 1,7585

φ 1,0437 0,3038 0,5214 1,0100 1,6919


A convergencia foi verificada informalmente atraves do traco da cadeia

onde e razoavel supor que a partir do burn-in especificado a cadeia convergiu

para todos os modelos. Para se ter um ideia visual da distribuicao da amostra

da posteriori as Figuras 5.1 e 5.2 apresentam os histogramas da distribuicao

a posteriori para todos os hiperparametros estimados em cada modelo, MDS

e MDFE, respectivamente.

Os efeitos associados as covariaveis ao longo do tempo para os modelos

MDS e MDFE sao apresentados nas Figuras 5.3, 5.4, 5.5 e 5.6. A Figura

5.3 apresenta o logarıtmo da funcao de risco de base, pode-se perceber que o

valor verdadeiro da funcao esta contido no intervalo de credibilidade de 95%.

O efeito da covariavel X2 tambem esta contido no intervalo, Figura 5.4 (b).

87

σ02

Dens

ity

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

Priori

σ12

Dens

ity0 10 20 30 40

0.00

0.05

0.10

0.15

Priori

σ22

Dens

ity

0 1 2 3 4 5 6 7

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Priori

U

Dens

ity

0.000 0.005 0.010 0.015

050

100

150

Priori

Figura 5.1: Histogramas dos hiperparametros - Modelo Dinamico de Sobre-

vivencia

Mas, o efeito da covariavel X1 foi subestimado, Figura 5.4 (a). Possivelmente

pelo fato da presenca de fragilidade nao estar sendo considerada no modelo,

fato observado tambem observado em Henderson e Oman (1999).

As Figuras 5.5 e 5.6 apresentam os resultados a posteriori gerados pelo

88

σ02

Dens

ity

0.0 0.5 1.0 1.5 2.0 2.5

0.0

0.5

1.0

1.5

Priori

σ12

Dens

ity

0 2 4 6 8

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

Priori

σ22

Dens

ity

0 5 10 15

0.00

0.05

0.10

0.15

0.20

0.25 Priori

U

Dens

ity

0.00 0.01 0.02 0.03 0.04

020

4060

80 Priori

σW2

Dens

ity

0.5 1.0 1.5 2.0

0.0

0.2

0.4

0.6

0.8

1.0

1.2

Priori

φ

Dens

ity

0.5 1.0 1.5 2.0

0.0

0.2

0.4

0.6

0.8

1.0

1.2 Priori

Figura 5.2: Histogramas dos hiperparametros - Modelo Dinamico de Fragili-

dade Espacial

modelo dinamico de fragilidade espacial, MDFE, para os dados simulados.

A Figura 5.5 apresenta a logaritmo da funcao de risco de base, note que

apesar do valor verdadeiro da funcao nao estar contido em todo intervalo,

ela esta contida onde existe a maior parte da informacao dos dados, mesmo

89

0 20 40 60 80 100 120 140

0.00.5

1.01.5

Time

β 0

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

Figura 5.3: Logarıtmo da funcao de risco de base - MDS. A linha contınua

representa a media a posteriori da funcao estimada, a linha tracejada indica

o interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O

caracter “|” indica o instante onde foi feita um observacao.

havendo uma sub-estimacao. Figura 5.6 (a) e (b) apresentam os efeitos das

covariaveis, observe que nao houve sub e nem super estimacao dos efeitos

das covariaveis, ou seja, os intervalos de credibilidade gerados incluem os

verdadeiros valores dos efeitos.

O termo de fragilidade foi bem estimado como pode-se verificar na

Figura 5.7, onde o valor real esta proximo ao valor medio e os histogramas

dao uma ideia da variabilidade da fragilidade em cada regiao. A Figura

5.8 apresenta os quartis da amostra da posteriori da fragilidade espacial.

Apesar de poucos dados, pode-se perceber que existe uma similaridade entre

valores proximos. Esses graficos podem ser comparados com a figura 4.3 que

apresenta a distribuicao espacial da fragilidade verdadeira e nota-se que as

estimativas estao similares ao valores verdadeiros. A Figura 5.9 apresenta as

estimativas com o valor verdadeiro, na figura (a) tem a fragilidade gerada

90

0 20 40 60 80 100 120 140

−6−5

−4−3

−2−1

Time

β 1

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

(a) - Efeito da covariavel X1

0 20 40 60 80 100 120 140

0.51.0

1.52.0

2.53.0

3.54.0

Time

β 2

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

(b) - Efeito da covariavel X2

Figura 5.4: Parametros variando no tempo - MDS. A linha contınua re-

presenta a media a posteriori da funcao estimada, a linha tracejada indica o

interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O


versus a fragilidade real, perceba que a reta estimada nao esta do longe do

que seria uma estiamcao otima. Na figura (b) tem-se uma comparacao das

estimativas do risco relativo tomando como base o primeiro elemento, W1.

Note que a reta estimada tambem nao esta longe do que seria o ideal.

91

0 20 40 60 80 100 120 140

−1.5−1.0

−0.50.0

0.51.0

1.5

Time

β 0

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

Figura 5.5: Logarıtmo da funcao de risco de base - MDFE. A linha contınua

representa a media a posteriori da funcao estimada, a linha tracejada indica

o interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O



dinamicos ajustados. De acordo com esse criterio o melhor modelo e MDFE.

O criterio apontou o modelo que era esperado, pois os dados foram gerados

de um processo que contem a fragilidade espacial.

Modelo pD DIC

MDE 4,4945 106,1899

MDFE 12,2713 97,4835


92

0 20 40 60 80 100 120 140

−4−3

−2−1

01

Time

β 1

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

(a)

0 20 40 60 80 100 120 140

−20

24

6

Time

β 2

|| |||| |||| ||| ||||||| ||| || || |||

MediaIC 95%Real

(b)

Figura 5.6: Parametros variando no tempo - MDFE. A linha contınua rep-

resenta a media a posteriori da funcao estimada, a linha tracejada indica o

interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O


93

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29

−20

24

W index

WMediaReal

Figura 5.7: Box plot da fragilidade espacial gerada por MDFE, a linha cheia

representa o valor real e os circulo representam a media a postariori de cada

fragilidade.

−4 −2 0 2

−3−2

−10

12

Latitude

Longitu

de

1o Q2o Q3o Q4o Q

Figura 5.8: Quartis da fragilidade espacial gerada por MDFE, o primero

quartil esta representado por ◦, o segundo por 4, o terceiro quartil por + e

o quarto quartil por ×

94

−2 −1 0 1 2

−2−1

01

2

W − Verdadeiro

W − E

stima

do

RealMDFE

−1 0 1 2

−10

12

log(RR de W) − Verdadeiro

log(R

R de

W) −

Estim

ado

RealMDFE

(a) - Frgilidade Espacial (b) - log do Risco relativo de W

Figura 5.9: Comparacao das estimativas da Fragilidade Espacial do MDFE

com o valor verdeiro.

95

Capıtulo 6

Aplicacao a dados reais

Neste capıtulo serao utilizadas as metodologias propostas nos Capıtulos 3, 4

e 5 para modelar dados de sobrevivencia reais com informacao espacial. O

primeiro conjunto de dados refere-se a pessoas residentes na Inglaterra que

sofrem de Leucemia. Esse conjunto de dados foi utilizados no trabalho de

Henderson et al. (2002), e os dados foram cedidos pela professora Silvia Shi-

makura que e uma das autoras do artigo. O outro conjunto de dados contem

o tempo medio no emprego de trabalhadores da industria nos municıpios do

estado do Rio de Janeiro. Nesse conjunto de dados nao se tem a informacao

individual. O que se tem em maos e o tempo medio por municıpio. Portanto,

tem-se uma observacao para cada municıpio e sera utilizado a sede do mu-

nicıpio como localizacao espacial. Estes dados foram cedidos pelo Ministerio

do Trabalho e Emprego.

Os modelos apresentados nos Capıtulos 3, 4 e 5 serao aplicados aos

dados de Leucemia na Inglaterra na Secao 6.1. Na Secao 6.2 os modelos serao

aplicados aos dados de emprego no Rio de Janeiro. A Tabela 6 apresenta

96

uma abreviacao dos modelos que serao utilizados.

MES-Wb Modelo Estatico de Sobreviencia - Weibull

MES-PG Modelo Estatico de Sobreviencia - Processos Gama

MES-PC Modelo Estatico de Sobreviencia - Processos Correla-

cionados

MEFE-Wb Modelo Estatico de Fragilidade Espacial - Weibull

MEFE-PG Modelo Estatico de Fragilidade Espacial - Processos

Gama

MEFE-PC Modelo Estatico de Fragilidade Espacial - Processos

Correlacionados

MDS Modelo Dinamico de Sobreviencia

MDFE Modelo Dinamico de Fragilidade Espacial

Tabela 6.1: Abreviaturas para os modelos

6.1 Dados de Leucemia na Inglaterra

Foi realizado um estudo observacional de casos de leucemia mieloide aguda

(AML1) em adultos no noroeste da Inglaterra no perıodo de 1982 ate 1998,

Figura 6.1. A Figura 6.2 mostra a divisao polıtica da regiao em 24 distritos.

A Figura 6.3 apresenta a funcao de sobrevivencia empırica, onde pode

se perceber que muitas falhas (mortes), 86%, ocorrem nos 3 primeiros anos

apos o diagnostico da doenca, dando indıcios de um alto risco nos primeiros

anos de diagnostico. 16% dos casos estudados foram censurados. A posicao

1do ingles acute myeloid leukaemia.

97

100km

Lancashire

GreaterManchester

Figura 6.1: A Regiao de estudo, noroeste da Inglaterra

-0.2 0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

Blackburn

BlackpoolBurnley

Chorley

FyldeHyndburn

Lancaster

Pendle

Preston

Ribble Valley

RossendaleSouth Ribble

West Lancashire

Wyre

BoltonBury

Manchester

Oldham

Rochdale

Salford

Stockport

Tameside

Trafford

Wigan

Figura 6.2: Distritos do noroeste ingles e divisao polıtica da regiao de estudo

98

espacial das 1043 observacoes podem ser visualisadas na Figura 6.4, onde

observa-se o Sudeste e o Oeste da regiao de estudo comtemplam a maioria

dos casos. O distrito de Wigan e o que teve o maior numero de pacientes

observados, 102 pacientes.

0 1000 2000 3000 4000 5000

0.00.2

0.40.6

0.81.0

t

S(t)

Figura 6.3: Funcao de Sobrevivencia Empırica do tempo (em dias) e o inter-

valo de confianca de 95% (linha tracejada).

Figura 6.4: Distribuicao espacial dos indivıduos observados no noroeste

ingles.

99

Os dados contem, alem do tempo, quatro covariaveis que sao: idade,

sexo, numero de globulos brancos no instante do diagnostico (WBC2) e uma

medida de privacao socioeconomica (Townsend) definida por Townsend et

al. (1988) e valores baixos dessa covariavel indicam baixos indıces socioe-

conomicos. A Figura 6.5 apresenta o comportamento das covariaveis com

respeito ao tempo, pode-se perceber que em valores mais altos da idade acon-

tecem mais falhas (Figura (a)), mas este aumento no numero de falhas e bem

suave. A variavel sexo nao apresenta visualmente uma variacao nos tempo

de falha entre um sexo e outro, (Figura (b)), que pode ser um indıcio de que

o efeito desta covariavel nao e significativo. A Figura 6.5 (c) mostra que a

medida que aumenta-se o valor de WBC as falhas tende a ocorrer em tempos

menores. A Figura 6.5 (d) mostra que aumentando o indıce Townsend o

numero de falhas tambem tende a ocorrer em tempos menores, esta relacao

e bem suave.

Para verificar se os efeitos das covariaveis, visualizados na Figura 6.5 sao

significativos ou nao e quantificar, se for o caso, esse efeito, serao ajustados

os modelos descritos no Capıtulo 3. Acreditando haver um efeito espacial

nao observado atuando no processo serao ajustados os modelos descritos no

Capıtulo 4.


gerada usando um algoritmo de Metropolis-Hastings. Para cada modelo foi

gerada uma cadeia de tamanho 50000. A amostra a posteriori foi obtida

utilizando um burn-in de 40000 e lag = 50. E a convergencia foi verificada

atraves do criterio de Geweke (1992). As seguintes especificacoes a priori

foram utilizadas:

2do ingles white blood cell count, truncado em 500 unidades com 1 unidade = 50×109/L.

100

20 40 60 80

010

0020

0030

0040

0050

00

X1

t

−2 −1 0 1 2

010

0020

0030

0040

0050

00

X2t

(a) Idade (b) Sexo

0 100 200 300 400 500

010

0020

0030

0040

0050

00

X3

t

−5 0 5 10

010

0020

0030

0040

0050

00

X4

t

(c) WBC (d) Townsend

Figura 6.5: Plot das covariaveis versus o tempo observado em dias.

Para os modelos estaticos,

β ∼ N(0; 100),

usando funcao de risco de base Weibull

α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10

λ ∼ Gama(0, 5; 0, 5), E(λ) = 1, V (λ) = 2

101

usando processos Gama

H∗0 (t) =

t

100,

c = 1,

usando processos correlacionados

U ∼ GamInv(2, 05; 1, 05), E(σ2U) = 1, V (σ2

U) = 20.

Para os hiperparametros da fragilidade

φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1


W ) = 1, V (σ2W ) = 1

As Tabelas 6.2 e 6.3 apresentam as estatısticas sumarizando as amostras

das distribuicoes a posteriori geradas via MCMC para os modelos estaticos

de sobrevivencia e de fragilidade espacial, respectivamente. Para os mod-

elos estaticos de sobrevivencia, Tabela 6.2, os modelos MES-Wb e MES-

PG tiveram resultados similares que indicam as variaveis idade, WBC e

Townsend quando aumentadas fazem com que o risco de falha (morte) tambem

aumenta. Entretanto, no modelo MES-PG as variaveis idade e WBC foram

significativas mas com efeito inverso aos outros dois modelos, ou seja, au-

mentando o valor dessas covariaveis o risco de falha diminui e a variavel

Townsend nao foi significativa, pois o valor zero pertence aos intervalos de

credibilidade. O resultado gerado pelo modelo MES-PG nao faz sentido na

pratica. A variavel sexo nos tres modelos estaticos de sobrevivencia nao foi

significativa.

Os resultados sumarizados para os modelos estaticos de fragilidade es-

pacial sao dados pela Tabela 6.3, com relacao aos coeficientes e ao hiper-

parametro φ da fragilidade os modelos MEFE-WB, MEFE-PG e MEFE-PC

102


MES-Wb β1 0,0302 0,0018 0,0268 0,0301 0,0336

β2 0,0342 0,0313 -0,0217 0,0327 0,0885

β3 0,0029 0,0005 0,0018 0,0029 0,0037

β4 0,0254 0,0091 0,0059 0,0252 0,0414

α 0,5761 0,0138 0,5495 0,5761 0,6028

λ 0,0045 0,0006 0,0032 0,0046 0,0057

MES-PG β1 -0,0269 0,0014 -0,0299 -0,0268 -0,0244

β2 0,0409 0,0293 -0,0123 0,0383 0,0946

β3 -0,0016 0,0006 -0,0025 -0,0016 -0,0004

β4 0,0034 0,0079 -0,0111 0,0034 0,0180

MES-PC β1 0,0335 0,0024 0,0290 0,0332 0,0381

β2 0,0207 0,0358 -0,0443 0,0180 0,0996

β3 0,0034 0,0005 0,0023 0,0033 0,0044

β4 0,0343 0,0087 0,0155 0,0341 0,0507

U 0,1254 0,0396 0,0672 0,1209 0,2393

Tabela 6.2: Estatısticas descritivas das amostras a posteriori para o Modelo

Estatico de Sobrevivencia.

foram bastante similares que indicam que o risco de falha aumenta quando

se aumenta pelo menos uma das variaveis idade, WBC e Townsend. O efeito

da variavel sexo nao foi significativo. Essa interpretacao coincide com a dos

modelos estaticos de sobrevivencia: MES-WB e MES-PC que confirmam

a analise grafica preliminar. Os histogramas da amostra a posteriori dos

parametros foram omitidos devido a grande quantidade.

A Tabela 6.4 apresenta os resultados obtidos no trabalho de Henderson

103


MEFE-Wb β1 0,0325 0,0018 0,029 0,0324 0,0361

β2 0,0327 0,0350 -0,0269 0,0299 0,1056

β3 0,0030 0,0005 0,0018 0,0030 0,0040

β4 0,0318 0,0075 0,0189 0,0325 0,0457

α 0,5943 0,0158 0,5651 0,5934 0,6263

λ 0,0087 0,0016 0,0066 0,0084 0,0122

σ2 0,5193 0,1599 0,2930 0,4922 0,9030

φ 0,8210 0,1022 0,5817 0,8426 0,9421

MEFE-PG β1 0,0316 0,0019 0,0283 0,0314 0,0355

β2 0,0362 0,0346 -0,0337 0,0375 0,0975

β3 0,0032 0,0004 0,0023 0,0032 0,0040

β4 0,0382 0,0100 0,0201 0,0374 0,0605

σ2 2,8770 0,7932 1,7412 2,7435 4,6146

φ 0,8869 0,0535 0,7669 0,9008 0,9469

MEFE-PC β1 0,0351 0,0018 0,0319 0,0348 0,0388

β2 0,0401 0,0331 -0,0236 0,0425 0,1035

β3 0,0035 0,0004 0,0026 0,0036 0,0043

β4 0,0357 0,0080 0,0218 0,0348 0,0510

U 0,1337 0,0459 0,0681 0,1249 0,2435

σ2 0,4923 0,1407 0,2936 0,4664 0,8559

φ 0,8083 0,1099 0,5469 0,8324 0,9455

Tabela 6.3: Estatısticas descritivas das amostras a posteriori para o Modelo

Estatico de Fragilidade Espacial.

et al. (2002) no nıvel de distrito. Perceba que as estimavas dos efeitos obtidas

pelos modelos estaticos sem fragilidade tabela 6.2 e com fragilidade tabela

104

6.3 estao proximas das obtidas no trabalho de Henderson, porem menores.

Vale salientar que a fragilidade do artigo de Henderson e Gama e neste tra-

balho e log-normal, alem disso a fragilidade no artigo e pontual tornando as

analises do termo de fragilidade bem distintas. Os hiperparametros da frag-

ilidade espacial nao sao diretamente comparaveis devido a forma que foram

abordados.

Param. Media 2,5% 50% 97,5%

β1 0,0461 0,0396 0,0460 0,0532

β2 0,0547 -0,0346 0,0548 0,1407

β3 0,0051 0,0037 0,0051 0,0065

β4 0,0525 0,0277 0,0519 0,0797

ξ 0,7291 0,4555 0,7207 1,0580

η 0,1972 0,1000 0,1818 0,4000

φ 0,2226 0,0662 0,2030 0,4600

Fonte: Henderson et. al (2002)

Tabela 6.4: Estimativas a posteriori do modelo de Henderson et al. em nıvel

de distrito usando a funcao de correlacao espacial Matern com κ = 1.

As Figuras 6.6 e 6.7 apresentam as estimativas relacionadas a funcao

de risco de base para os modelos estaticos de sobrevivencia e de fragilidade,

respectivamente. O comportamento da funcao de risco de base para mode-

los com a mesma especificacao para h0(t) sao similares. A funcao de risco

de base tem um comportamento decrescente indicando que a medida que o

tempo passa o risco de falha diminui, o que parece razoavel para dados de

cancer com um suave aumento do risco para tempos maiores, o que e esperado

na pratica. Fato observados nas estimativas dos modelos que usam proces-

105

sos Gama e procesos correlacionados, mas por uma restricao parametrica

os modelos que usam a ditribuicao Weibull nao apresentam esse aumento

no risco para valores altos tempos maiores. Outra diferenca estao nos val-

ores encontrados para a funcao de risco de base, os valores mais altos estao

associados as estimativas que usaram os processos Gama, em seguida vem

as estimativas que usaram a distribuicao Weibull e com menores valores da

funcao de risco de base3 as estimativas usando processos correlacionados.

A Figura 6.8 apresenta o box-plot das estimativas a posteriori da frag-

ilidade para os modelos MEFE-Wb, MEFE-PG e MEFE-PC. Comparando

visualmente as fragilidades estimadas para as diferentes especificacoes feitas

para h0(t) pode-se perceber que existe uma grande similaridade no compor-

tamento da fragilidade nas regioes, mas os valores da fragilidade em uma

mesma regiao sao bem distintos quando os modelos sao comparados.

As Figuras 6.9, 6.10 e 6.11 apresentam as estimativas a posteriori das

fragilidades geradas sob os modelos MEFE-Wb, MEFE-PG e MEFE-PC, re-

spectivamente. Cada uma dessas figuras contem quatro mapas, (a), (b), (c) e

(d). No mapa (a) se tem as fragilidades espaciais, W , geradas pelo respectivo

modelo, estas fragilidades podem conter valores distintos entre si, pois esses

valores dependem da especificacao da funcao de risco de base. Nos mapas

(b) e (c) sao apresentados o logaritmo dos riscos relativos tomando como

base no primeiro mapa o distrito com o maior numero de casos, Wigan, e no

segundo a base e a fragilidade media, lembrando que o risco relativo pode ser

obtido tomando a exponencial do valor estimado. O mapa (d) apresenta uma

estatıstica que ajuda visualizar quais distritos tem risco significativo, essa es-

tatıstica e dada pelo mınimo entre a probabilidade do logaritmo do risco

3Lembrando que β0(t) = log h0(t)

106

0 2 4 6 8

0.0000

0.0005

0.0010

0.0015

0.0020

0.0025

0.0030

log(t)

h 0(t)

MediaIC 95%

|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

0 2 4 6 8

−5−4

−3−2

−1

log(t)

log(H 0(t))

MédiaIC 95%

(a) - h0(t) MES-Wb (b) H0(t) MES-Wb

0 2 4 6 8

0.00

0.02

0.04

0.06

0.08

0.10

0.12

log(t)

h 0(t)

Média

|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

0 2 4 6 8

−4−2

02

4

log(t)

log(H 0(t))

MédiaIC 95%

(c) - h0(t) MES-PG (d) H0(t) MES-PG

0 1000 2000 3000 4000 5000

−16−14

−12−10

−8

Time

β 0(t)

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| | |||||||||| |||| ||| |||||| |||||| || ||||||||| |||| | || ||||| ||||||||| || | ||| | ||| |||| | |||| || | |||| || | | || |||| | | | || || | | | | | | | ||| | || | | || | | | | | | | | | | ||

MediaIC 95%

0 2 4 6 8

−8−7

−6−5

−4−3

−2−1

log(t)

log(H 0(t))

MédiaIC 95%

(e) - h0(t) MES-PC (f) H0(t) MES-PC

Figura 6.6: Estimativas para h0(t) e H0(t) nos modelos propostos.

relativo, usando a media media como base, ser maior que zero e o comple-

mentar dessa probabilidade. Ou seja, valores pequenos para essa estatıstica

107

0 2 4 6 8

0.000

0.001

0.002

0.003

0.004

0.005

0.006

0.007

log(t)

h 0(t)

MediaIC 95%

|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

0 2 4 6 8

−4−3

−2−1

0

log(t)

log(H 0(t))

MédiaIC 95%


0 2 4 6 8

0.00.5

1.01.5

log(t)

h 0(t)

Média

|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

0 2 4 6 8

−20

24

6

log(t)

log(H 0(t))

MédiaIC 95%


0 1000 2000 3000 4000 5000

−20−18

−16−14

−12−10

−8

Time

β 0(t)

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| | |||||||||| |||| ||| |||||| |||||| || ||||||||| |||| | || ||||| ||||||||| || | ||| | ||| |||| | |||| || | |||| || | | || |||| | | | || || | | | | | | | ||| | || | | || | | | | | | | | | | ||

MediaIC 95%

0 2 4 6 8

−7−6

−5−4

−3−2

−1

log(t)

log(H 0(t))

MédiaIC 95%

(e) - h0(t) MEFE-PC (f) H0(t) MEFE-PC

Figura 6.7: Estimativas para h0(t) e H0(t) nos modelos propostos.

indicam que o log do risco daquela regiao esta longe de zero. Portanto, tem

um risco relativo significativo.

108

As Figuras 6.9, 6.10 e 6.11 mapas (a), (b) e (c) apresentam compor-

tamento cumum para as estimativas geradas para os distritos, assim como

foi verificado nos Box-plots. Os riscos mais baixos encontram-se na regiao

sudoeste, envolvendo os distritos de Blackpool, Fylde, Wyre e Preston. Os

risco mais altos nao estao agrupados numa regiao, ao norte no distrito de

Lancaster, no sul no distrito de Wigan e no leste com os distritos Pendle e

Brunley. Na regiao sudeste tem-se riscos intermediarios. O mapa (a) das

tres figuras apresenta diferentes valores estimados pelos modelos, mas isso

pode ser explicado pela especificacao a priori da funcao de risco de base,

que podem estar bem ou mal especificadas. Os mapas (b) das tres figuras

apresentam as estimativas do logaritmo do risco relativo usando como base o

distrito de Wigan. Note que o risco do distrito de Wigan estimado pelos tres

modelos pode chegar a duas4 vezes o risco de um distrito nas regioes mais

claras do mapa por exemplo Blackpool.

No mapa (c) das 6.9, 6.10 e 6.11 os valores do logaritmo do risco relativo

estao padronizados, ou seja o valor apresentado no mapa mostra o logaritmo

do risco do distrito quando comparado a um distrito que nao possui risco,

que com o auxılio do mapa (d) se tem que no modelo MEFE-Wb, Figura

6.11, os distritos de Preston, Blackpool e Burnley sao significativos e os dois

primeiros apresentam um risco menor que a media e Burnley apresenta um

risco maior que a media. No modelo MEFE-PG, Figura 6.10, somente o

distrito de Preston foi significativo e tem um risco menor que a media. E

finalmente, no modelo MEFE-PC, Figura 6.11, os distritos significativos sao

Preston e Burnley, sendo que em Preston o risco e menor que media e em

Burnley e o maior que a media.

4Sendo mais preciso: 1exp{−0,76} = 2, 13 no modelo MEFE-Wb, 2,36 no MEFE-PG e

2,32 no MEFE-PC.

109

1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23

−1.5−1.0

−0.5

W index

W

Média

(a) - MEFE-Wb

1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23

−7.5−7.0

−6.5−6.0

−5.5

W index

W

Media

(b) - MEFE-PG

1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23

−1.5−1.0

−0.50.0

W index

W

Media

(e) - MEFE-PC

Figura 6.8: Box-plots da Fragilidade Espacial para os modelos propostos nos

distritos. A linha contınua apresenta as estimativas da media a posteriori da

fragilidade nos distritos.

110

(a) W gerado (b) RR (base = Wigan)

(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))

Figura 6.9: estimativas a posteriori das fragilidades geradas sob o modelo

MEFE-Wb.

111



Figura 6.10: Estimativas a posteriori das fragilidades geradas sob o modelo

MEFE-PG.

112



Figura 6.11: Estimativas a posteriori das fragilidades geradas sob o modelo

MEFE-PC.

113


ajustados. De acordo com esse criterio o melhor modelo e MES-PC, esse

resultao mostra que devido a sua flexibilidade os processos correlacionados e

uma boa suposicao para a funcao de risco de base. Perceba que usando uma

mesma especificacao para a funcao de risco de base os modelos sem fragili-

dade espacial tiveram melhor performance do que os modelos com fragilidade

espacial, esse fato era esperado devido ao pequeno numero de distritos com

risco da fragilidade espacial significativo, Figuras 6.9 (d), 6.10 (d) e 6.11 (d).

Lembrando que por dificuldades computacionais a dimensao dos dados es-

paciais foi reduzida de 1043, tinha-se a informacao espacial por indivıduo,

para 24 distritos. Essa reducao talves pode ter mascarado uma dependencia

espacial existente nos dados. Os valores de pD negativos sao explicados pelo

fato de que a funcao de verossimilhanca nao e log-concava.

Modelo pD DIC

MES-Wb -12,8278 -1850,4970

MEFE-Wb -10,5797 -552,6421

MES-PG -0,3385 5733,2320

MEFE-PG 27,9883 9647,0440

MES-PC -17,9361 -2250,4200

MEFE-PC 8,1284 -1484,9350


6.2 Dados de tempo no emprego

Os dados contem a informacao do tempo medio em semanas no emprego

nos 92 municıpios do estado do Rio de Janeiro para o setor industrial. O

114

setor industrial e um dos grandes setores de emprego definidos pelo IBGE5.

Os setores de emprego sao: industria, construcao civil, comercio, servicos,

agropecuaria e outros. Note que este conjunto de dados nao tem a presenca

de dados censurados.

Os dados sao provenientes da Relacao Anual de Informacoes Sociais -

RAIS do ano de 2001. Fundamentalmente, a RAIS e um Registro Admin-

istrativo, de ambito nacional, com periodicidade anual, obrigatorio por lei

para todos os estabelecimentos. A informacao sobre tempo no emprego e

disponibilizada somente em nıvel de municıpio.

As Figuras 6.12 e 6.13 apresentam a divisao polıtica do estado do Rio

de Janeiro, por municıpio e por microrregiao6 no ano de 2000. Note que os

dados sao referentes ao ano de 2001, enquanto a divisao polıtica mostrada

nos mapas e a que vigorava no ano de 2000. Isso gerou um problema, pois

em 2001 foi criado o municıpio de Mesquita e em 2000 ele fazia parte do

municıpio de Nova Iguacu. Portanto, os mapas nao conterao a informacao

sobre o municıpio de Mesquita. Mas ele nao sera ignorado na modelagem.

O tempo medio de emprego na industria nos municıpios do estado do

Rio de Janeiro, a partir de agora apenas o tempo medio no emprego, varia

entre 2,3 semanas em Casimiro de Abreu ate 62,5 semana em Arraial do

Cabo. A Figura 6.14 apresenta a distribuicao empırica dos tempos de so-

brevivencia sem considerar as covariaveis. Pode-se perceber que em 80% dos

municıpios o tempo medio e menor que 20 semanas. A Figura 6.15 apresenta

a distribuicao dos tempos no emprego nos municıpios. Perceba que a regiao

sul do estado possui uma maior concentracao de tempos mais altos no em-

5Instituto Brasileiro de Geografia e Estatıstica - http://www.ibge.gov.br6Divisao regional mais agregada que munıcipio definida pelo IBGE.

115

Figura 6.12: Divisao polıtica do estado do Rio de Janeiro por municıpio

Figura 6.13: Divisao polıtica do estado do Rio de Janeiro por microrregiao

prego, com a excessao dos municıpios da Baia de Ilha Grande. No centro do

Estado concentram-se tempo menores menores que 15 semanas no emprego.

Da mesma maneira que o nordeste do estado, excluindo as microrregioes de

Itaperuna e Santo Antonio de Padua que que possuem alguns municıpios

com tempo medio no emprego superior a 20 semanas.

116

0 10 20 30 40 50 60

0.00.2

0.40.6

0.81.0

Figura 6.14: Funcao de Sobrevivencia Empırica

Figura 6.15: Tempo medio no emprego em semanas por municıpio.

O banco de dados possui uma covariavel, o salario medio na industria

por municıpio. A Figura 6.16 mostra a dispersao dos salarios medios de

acordo com o tempo medio no emprego. Note que diminuindo o salario os

tempos no emprego tendem a ser menores, dando um indıcio de que o risco

de um indivıduo deixar o emprego diminiu quando o salario aumenta.

Os dados serao modelados usando os modelos descritos nesta dissertacao,

117

400 600 800 1000 1200

010

2030

4050

60

X1

Figura 6.16: Salario medio versus tempo medio no emprego

ou seja, os modelos estaticos de sobrevivencia, os modelos estaticos de fragili-

dade espacial, os modelos dinamicos de sobrevivencia e os modelos dinamicos

de fragilidade espacial. A tabela 6 descreve uma abreviatura para os modelos.

A inferencia sera feita com base na amostra da distribuicao a posteriori.

As amostras foram obtidas a partir dos procedimentos descritos nos capıtulo

3, 4 e 5 com as seguintes especificacoes a priori:

Para os modelos estaticos,

β ∼ N(0; 100),

usando funcao de risco de base Weibull

α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10

λ ∼ Gama(0, 5; 0, 5), E(φ) = 1, E(φ) = 1

usando processos Gama

H∗0 (t) = 0, 1t,

c = 1,

118

usando processos correlacionados

U ∼ GamInv(1, 05; 2, 05), E(σ2U) = 1, E(σ2

U) = 20.

Para os modelos dinamicos,

β.,1 ∼ N(0; diag(σ20, . . . , σ

2p))

U ∼ GamInv(2, 05; 0, 0105) E(U) = 0, 01, V (U) = 0, 20

σ2i ∼ GamInv(2, 05; 1, 05), E(σ2

i ) = 1, V (σ2i ) = 20, i = 0, . . . , p.

Para os hiperparametros da fragilidade

φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1


W ) = 1, V (σ2W ) = 1

O numero de iteracoes e o burn-in utilizados em cada modelo esta es-

pecificado na Tabela 6.6. Para todos os modelos tem-se lag = 50. Foi

assumido que a convergencia foi alcancada apos o perıodo de burn-in es-

pecificado. A convergencia dos parametros e hiperparametros foi verificada

usando o criterio de Geweke (1992) implementado no pacote CODA.

Modelo M burn-in Modelo M burn-in

MES-Wb 50k 40k MEFE-PG 50k 40k

MES-PG 50k 40k MEFE-PC 50k 40k

MES-PC 50k 40k MDS 100k 80k

MEFE-Wb 50k 40k MDFE 100k 80k

Tabela 6.6: Especificacoes para selecionar as amostras da posteriori, onde 1k

equivale a 1000.

A Tabela 6.7 apresenta as estimativas da amostra da posteriori para

os modelos estaticos. Perceba que o efeito do salario no tempo medio no

119

emprego e significativo, ou seja, o valor zero nao pertence ao intervalo de

credibilidade, para os modelos estaticos ajustados. O efeito estimado e nega-

tivo, indicando que quanto maior o salario menor sera o risco de deixar o

emprego. Perceba tambem que os modelos com a mesma especificacao para

a funcao de risco de base geraram estimativas muito similares. O efeito do

salario atribuıdo aos modelos que usam os processos Gama a priori para

modelar h0(t) foram maiores que dos outros,

A Tabela 6.8 apresenta as estimativas da amostra da posteriori para os

hiperparametros dos modelos dinamicos. Perceba que entre os dois modelos,

MDS e MDFE, as estimativas para as variancias sao bastante similares. O

parametro U que mede a forca da evolucao do efeitos e bem pequeno, in-

dicando que efeitos em instantes adjacentes tendem a ser muito similares.

As Figuras 6.17 e 6.18 apresentam estimativas relacionadas a funcao

de risco de base h0(t) para os modelos estaticos de sobrevivencia e para

os modelos estaticos de fragilidade espacial, respectivamente. Percebe-se

que as estimativas para a funcao de risco de base indicam que ela e uma

funcao crescente, isto e, o risco de um indivıduo deixar o emprego, aumenta

a medida que o tempo passa. As estimativas sao muito similares entre si,

principalmente estimativas que utilizam a mesma funcao especificacao para

a funcao de risco de base.

Os efeitos variando no tempo sao apresentados nas Figuras 6.19 (a),

(b), (c) e (d). As figuras (a) e (c), que correspondem ao logaritmo da funcao

de risco de base, indicam que a funcao de risco de base e constante ao longo

do tempo, diferente da interpretacao dos modelos estaticos que a forma que a

funcao de risco e crescente. Por outro lado, o efeito do salario medio, que nos

120


MES-Wb β1 -0,0033 0,0004 -0,0045 -0,0032 -0,0021

α 2,4580 0,2170 2,0598 2,4370 2,8890

λ 0,0051 0,0024 0,0015 0,0047 0,0104

MEFE-Wb β1 -0,0033 0,0007 -0,0046 -0,0033 -0,0020

α 2,5345 0,1905 2,1909 2,541 2,8675

λ 0,0041 0,0020 0,0018 0,0036 0,0089

σ2 0,5071 0,1258 0,3186 0,4982 0,7973

φ 1,1342 0,2706 0,6696 1,1430 1,6966

MES-PG β1 -0,0014 0,0004 -0,0023 -0,0014 -0,0007

MEFE-PG β1 -0,0013 0,0004 -0,0021 -0,0013 -0,0006

σ2 0,5002 0,1386 0,3091 0,4732 0,8305

φ 1,1768 0,2992 0,6894 1,1505 1,8316

MES-PC β1 -0,0033 0,0007 -0,0045 -0,0033 -0,0020

U 0,2599 0,0938 0,1282 0,2412 0,4817

MEFE-PC β1 -0,0030 0,0006 -0,0043 -0,0030 -0,0017

U 0,2978 0,1142 0,1439 0,2822 0,6092

σ2 0,7837 0,2363 0,4590 0,7312 1,3312

φ 0,8921 0,2748 0,4646 0,8442 1,4946

Tabela 6.7: Estatısticas descritivas das amostras a posteriori para os modelos

Estaticos.

modelos estaticos e assumido constante, tem um comportamento crescente

tendendo a zero, Figuras 6.19 (b) e (d). Ou seja, o salario do indivıduo

continua tendo um efeito negativo, ou seja, indivıduos com menores salarios

tem riscos maiores de sair do emprego, mas esse efeito tende a zero, fazendo

121


MDS σ20 0,1428 0,0544 0,0748 0,1310 0,2685

σ21 0,1240 0,0491 0,0626 0,1152 0,2330

U 0,0008 0,0002 0,0005 0,0007 0,0012

MDFE σ20 0,1411 0,0521 0,0751 0,1301 0,2620

σ21 0,1275 0,0446 0,0682 0,1168 0,2306

U 0,0008 0,0002 0,0005 0,0007 0,0013

σ2W 0,8352 0,2419 0,4665 0,8066 1,3601

φ 0,9032 0,2462 0,4688 0,8862 1,4781

Tabela 6.8: Estatısticas descritivas das amostras a posteriori para os modelos

Dinamicos.

com que os riscos diminuam ao longo do tempo. O que e um resultado

intuitivo, pois a partir de um certo tempo o indıviduo tende a se estabilizar

no emprego se adequando ao salario recebido.

122

1.0 1.5 2.0 2.5 3.0 3.5 4.0

02

46

810

1214

log(t)

h 0(t)

MediaIC 95%

| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |

1.0 1.5 2.0 2.5 3.0 3.5 4.0

−20

24

log(t)

log(H 0(t))

MédiaIC 95%

(a) - h0(t) MES-Wb (b) H0(t) MES-Wb

1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.00.5

1.01.5

log(t)

h 0(t)

Média

| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |

1.0 1.5 2.0 2.5 3.0 3.5 4.0

−3−2

−10

12

log(t)

log(H 0(t))

MédiaIC 95%

(c) - h0(t) MES-PG (d) H0(t) MES-PG

0 10 20 30 40 50 60

−4−2

02

4

Time

β 0(t)

| | | || | ||| || | | ||||| ||| | |||||||| ||||| | | || | ||| |||||||||| |||||||| | |||| ||| | | |||| | ||| | |||| | | | | | | | |

MediaIC 95%

1.0 1.5 2.0 2.5 3.0 3.5 4.0

−20

24

log(t)

log(H 0(t))

MédiaIC 95%

(e) - h0(t) MES-PC (f) H0(t) MES-PC

Figura 6.17: Estimativas para h0(t) e H0(t) para os modelos estaticos de

sobrevivencia, a linha (—) representa a media a posteriori e a linha (−−)

representa o intervalo de 95% de credibilidade.

123

1.0 1.5 2.0 2.5 3.0 3.5 4.0

05

1015

log(t)

h 0(t)

MediaIC 95%

| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |

1.0 1.5 2.0 2.5 3.0 3.5 4.0

−20

24

log(t)

log(H 0(t))

MédiaIC 95%


1.0 1.5 2.0 2.5 3.0 3.5 4.0

0.00.5

1.01.5

2.0

log(t)

h 0(t)

Média

| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |

1.0 1.5 2.0 2.5 3.0 3.5 4.0

−3−2

−10

12

log(t)

log(H 0(t))

MédiaIC 95%


0 10 20 30 40 50 60

−4−2

02

4

Time

β 0(t)

| | | || | ||| || | | ||||| ||| | |||||||| ||||| | | || | ||| |||||||||| |||||||| | |||| ||| | | |||| | ||| | |||| | | | | | | | |

MediaIC 95%

1.0 1.5 2.0 2.5 3.0 3.5 4.0

−20

24

log(t)

log(H 0(t))

MédiaIC 95%

(e) - h0(t) MEFE-PC (f) H0(t) MEFE-PC

Figura 6.18: Estimativas para h0(t) e H0(t) para os modelos estaticos de

fragilidade espacial, a linha (—) representa a media a posteriori e a linha

(−−) representa o intervalo de 95% de credibilidade.

124

0 10 20 30 40 50 60

−0.0

50.

000.

05

Time

β 0

|| ||||||||||| ||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||||| ||| | | | | |

MediaIC 95%

0 10 20 30 40 50 60

−0.0

12−0

.010

−0.0

08−0

.006

−0.0

04−0

.002

0.00

0

Time

β 1

|| ||||||||||| ||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||||| ||| | | | | |

MediaIC 95%

(a) β0 - MDS (b) β1 - MDS

0 10 20 30 40 50 60

−0.0

50.

000.

05

β0

Time

| | | | | | | || | | | | | | | || | || | || || ||| | | || | | | | | | | | | | || || ||| | || | | ||| | | | | ||| | || | | | || | | | | || | | | | | | | | | | | | |

MediaIC 95%

0 10 20 30 40 50 60

−0.0

15−0

.010

−0.0

050.

000

β1

Time

| | | | | | | || | | | | | | | || | || | || || ||| | | || | | | | | | | | | | || || ||| | || | | ||| | | | | ||| | || | | | || | | | | || | | | | | | | | | | | | |

MediaIC 95%

(c) β0 - MDFE (d) β1 - MDFE

Figura 6.19: Plot das covariaveis versus o tempo observado em dias.

125

A Figura 6.20 apresenta os Boxplots das estimativas a posteriori da

fragilidade dos municıpios do Rio de Janeiro, usando os modelos MEFE-Wb,

MEFE-PG, MEFE-PC e MDFE. Perceba que eles sao diferentes entre si,

portanto o efeito espacial em cada modelo sera diferente.

1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89

−1.5

−1.0

−0.5

0.0

0.5

1.0

1.5

W index

W

Média

1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89

−1.5

−1.0

−0.5

0.0

0.5

1.0

W index

W

Media

(a) MEFE-Wb (b) MEFE-PG

1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89

−2−1

01

W index

W

Media

1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89

−3−2

−10

12

W index

W

Média

(c) MEFE-PC (d) MDFE

Figura 6.20: Boxplots das estimativas a posteriori da fragilidade por mu-

nicıpios, usando os modelos MEFE-Wb, MEFE-PG, MEFE-PC e MDFE.

As Figuras 6.21, 6.22, 6.23 e 6.24 apresentam as estimativas a posteriori

126

das fragilidades geradas sob os modelos MEFE-Wb, MEFE-PG, MEFE-PC e

MDFE, respectivamente. Cada uma dessas figuras contem quatro mapas, (a),

(b), (c) e (d). No mapa (a) se tem as fragilidades espaciais, W , geradas pelo

respectivo modelo, estas fragilidades podem conter valores distintos entre si,

pois esses valores dependem da especificacao da funcao de risco de base. Nos

mapas (b) e (c) sao apresentados o logaritmo dos riscos relativos tomando

como base no primeiro mapa o municıpio mais importante, Rio de Janeiro,

e no segundo a base e a fragilidade media, lembrando que o risco relativo

pode ser obtido tomando a exponencial do valor estimado. O mapa (d)

apresenta uma estatıstica que ajuda visualizar quais municıpios tem risco

significativo, essa estatıstica e dada pelo mınimo entre a probabilidade do

logaritmo do risco relativo, usando a media media como base, ser maior que

zero e o complementar dessa probabilidade. Ou seja, valores pequenos para

essa estatıstica indicam que o log do risco daquela regiao esta longe de zero.

Portanto, tem um risco relativo significativo.

Usando o modelo MEFE-Wb, a Figura 6.21 mapas (a), (b) e (c) mostram

que a regiao centro-sul do estado e o litoral Norte sao as regioes de maior

risco. Enquanto a regiao dos Lagos e o norte do estado (Itaperuna e Santo

Antonio de Padua) sao as regioes de menor risco. De acordo com a mapa

(d) as regioes com risco significativo sao: Campos de Goytacases com risco

positivo e Itaperuna com risco negativo. As outras regioes apesar de apre-

sentarem uma aparente estrutura de vizinha, nao sao significativas.

No MEFE-PG, a Figura 6.22 mapas (a), (b) e (c) mostram que a regiao

central do estado apresenta os riscos maiores. Os riscos menores sao obser-

vados na principalmente na regiao Norte, inclusive no Litoral. O mapa (d)

mostra que o risco da maioria dos municıpios sao nao significativos, com a

127

excecao dos municıpios de Cabo Frio e Arraial do Cabo, com risco maiores, e

o municıpio de Quissama no litoral norte apresentando baixo risco de deixar

o emprego.

No MEFE-PC, a Figura 6.23 mapas (a), (b) e (c) mostram que as

regioes de maior risco sao a regiao central do estado com excecao da regiao

dos Lagos e no sul do estado nas regioes da Bahia de Ilha e Vale do Paraıba.

E as regioes de menor risco de deixar o emprego sao: A regiao dos Lagos no

centro do estado , Itaperuna e Santo Antonio de Padua no norte e no Sul

Vassouras e parte da Barra do Piraı. Mas novamente poucos municıpios tem

o risco significativo. Com risco baixos estao os municıpios de Sao Joao da

Barra, Itaperuna e Cabo Frio7 e com riscos altos estao os municıpios de Rio

Bonito e Silva Jardim.

No MDFE os riscos mais altos sao observados, no litoral sul do estado,

Figura 6.24 mapas (a), (b) e (c), envolvendo a regiao da Bahia da Ilha Grande

e a grande de Rio de Janeiro. Novamente a regiao Norte do estado, Itaperuna

e Santo Antonio de Padua sao as regioes de menor risco de deixar o emprego,

juntamente com o municıpio de Vassouras e barra do Piraı ao sul. No entanto,

para nenhum municıpio foi encontrado um risco significativo.

Como pode se observar, poucos municıpios dos modelos ajustados tiveram

a fragilidade espacial significativa, e alguns modelos tiveram resultados con-

traditorios no que diz respeito a posicao espacial. Portanto, para estes dados

acredita-se que nao exista de uma estrutura espacial. Fato tambem obser-

vado no criterio de selecao de modelo, Tabela 6.2, onde percebe-se que os

modelo sem estrutura espacial sao geralmente preferidos.

7Resultado contraditorio com o aprsentado no modelo MEFE-PG.

128

(a) W gerado (b) RR (base = Rio de Janeiro)


Figura 6.21: Quartis a posteriori das estimativas apresentadas sob o modelo

MEFE-Wb. O valor da legenda e o maximo do intervalo.

129




MEFE-PG. O valor da legenda e o maximo do intervalo.

130




MEFE-PC. O valor da legenda e o maximo do intervalo.

131


(c) RR (base = W ) (d) min(P (RR(c) > 0), P (RR(c) < 0))


MDFE. O valor da legenda e o maximo do intervalo.

132


ajustados. De acordo com esse criterio o melhor modelo e MES-PG. Perceba

que usando uma mesma especificacao para a funcao de risco de base os mod-

elos sem fragilidade espacial tiveram melhor performance do que os modelos

com fragilidade espacial, com a excecao dos modelos dinamicos, mas o ganho

que se obteve usando a fragilidade espacial nao compensa o esforco adicional.

Este fato era esperado devido ao pequeno numero de distritos com risco da

fragilidade espacial significativo, Figuras 6.21 (d), 6.22 (d),6.23 (d) e 6.24

(d). Lembrando que o ideal era fazer um estudo onde se tenha o tempo

no emprego de cada indivıduo, mas dados nao estao disponıveis por serem

sigilosos. Portanto, tratar o tempo medio pode estar mascarando uma certa

dependencia espacial ou nao existente nos dados. Os valores de pD negativos

sao explicados pelo fato de que a funcao de verossimilhanca nao e log-concava.

Modelo pD DIC

MES-Wb -20,0053 428,9566

MEFE-Wb -11,2119 446,6283

MES-PG -1,7515 287,2947

MEFE-PG 3,1334 332,4997

MES-PC -7,6645 439,5716

MEFE-PC -0,7035 500,6961

MDE 7,2832 638,1740

MDFE 22,8942 637,3450


133

Capıtulo 7

Conclusoes e Trabalhos Futuros

Os modelos dinamicos e estaticos de fragilidade espacial podem ser aplica-

dos em muitos casos de analise de sobrevivencia, pois eles tem como casos

particulares os modelos de Cox e os modelos de fragilidade que sao bastante

utilizados na pratica. E, alem disso, podem incorporar a analise uma estru-

tura espacial presentes nos dados.

Nos estudos simulados os modelos apresentados funcionaram bem gerando

estimativas proximas dos valores de onde os dados foram gerados. Para os

dados reais, tanto os dados de leucemia quanto o tempo no emprego, os mod-

elos geraram estimativas similares entre si, com algumas excecoes. E quando

comparados aos resultados de Henderson et. al (2002) nota-se que as estima-

tivas geradas sao razoaveis. Tecnicas de comparacao de modelo estao sendo

implementadas para que as comparacoes entre modelos sejam formalizadas.

A tecnica que sera utilizada e conhecida como DIC, deviance information

criterion, ( Spieglhalter et al., 2002).

O tempo computacional para os modelos de fragilidade espacial e bas-

134

tante elevado. Pois e necessario em cada iteracao do algoritmo avaliar os

parametros gerados na inversa de uma matriz r × r, onde r e o numero de

pontos no espaco distintos. Portanto, quando se aumenta o numero r de pon-

tos distintos no espaco, o tempo computacional aumenta consideravelmente.

Com isso, se faz necessario a implentacao de tecnicas de inversao de matrizes

de alta dimensao. Os dados de leucemia contem 1043 pontos no espaco, por

deficiencia computacional os indivıduos tiveram que ser agrupados nos 24

distritos.

Os modelos descritos nessa dissertacao foram implementados no Ox

version 3.20, que e uma excelente linguagem de programacao matricial orien-

tada a objeto, com muitas bibliotecas estatısticas e matematicas veja Doornik

(2002). Os graficos e estatısticas da amostra a posteriori gerada pelos progra-

mas em Ox foram feitos no R versao 1.4.1 e os mapas foram feitos utilizando

o Tab para Win versao 2.2. todos sao freewares e facilmente encontrados

para download na internet.

Em trabalhos futuros pretende-se desenvolver modelos dinamicos e estaticos

de fragilidade espacial num contexto multivariado, por exemplo os dados de

emprego no Rio de Janeiro, o setor estudado foi a Industria, mas poderiam

ser estudados outros tais com comercio, servicos, etc. Onde pode-se verificar

se existe alguma estrutura de correlacao entre setores.

Uma extensao dos modelos estaticos e fazer com os efeitos variem no

espaco, e que sejam modelados usando as tecnicas similares as descritas para

o termo de fragilidade. A funcao de risco para estes modelos e dada por:

h(t|X, s) = h0(t) exp {Xβ(s)} s ∈ D

onde β(s) = (β1(s), βp(s))T e cada βi(s) corresponde ao efeito relacionado

135

a covariavel Xi na posicao s. Se nao existir estrutura espacial tem-se que

β(s) = β, ∀s ∈ D. Portanto, esses modelos tem como caso particular os

modelos Estaticos.

Dando mais um passo a frente pode-se alem de fazer com que os efeitos

variem no espaco, pode-se pensar em modelos que tenha efeitos que variem no

espaco e no tempo com a seguinte funcao de risco: Modelos com parametros

variando no espaco

h(t|X, s) = h0(t) exp {Xβ(t, s)} s ∈ D

onde β(t, s) = (β1(t, s), βp(t, s))T e cada βi(t, s) corresponde ao efeito rela-

cionado a covariavel Xi na posicao s e no tempo t.

136

Referencias Bibliograficas

[1] Barnett, V. (1973). Statistical Prediction Analysis. Cambridge: Cam-

bridge University Press.

[2] Burridge, J. (1981). Empirical Bayes analysis of survival time data. Jour-

nal of Royal Statistical Society, Series B,43, 65-75.

[3] Carlin, B. P. e Banerjee, S. (2002). Hierarchical multivariate CAR mo-

dels for spatio-temporally correlated survival data, Em J. Bernardo, J.

Berger, A. Dawid e A. Smith (Editores), Bayesian Statistics 7, Oxford,

1-15, University Press.

[4] Clayton, D. G. (1978). A model for association in bivariate life tables

and its application in epidemiological studies of familial tendendy in

chronic disease incidence. Biometrika, 65, 141-151

[5] Clayton, D.G. (1991). A Monte Carlo method for Bayesian inference in

frailty models. Biometrics ,47, 467-485.

[6] Cowles, M. K. e Carlin, B. (1996). Markov chain Monte Carlo con-

vergences diagnostics: a comparative review. Journal of the American

Statistical Association, 91, 883-904.

137

[7] Cowles, M. K. Best, N., Vines, K. e Plummer, M. (1997) CODA - Con-

vergence and Diagnostics Output Analysis software for Gibbs sampling

output, Cambridge: MRC Biostatistics Unit.

[8] Cox, D. R. (1972). Regression models and life tables. Journal of Royal

Statistical Society, Series B,34, 187-220.

[9] Cressie N. A. C. (1993). Statistics for Spatial Data. Edicao revisada,

New York: Wiley.

[10] Dawid, A. P. (1981). Some matrix-variate distribution theory: notation,

consideration and Bayesian aplication, Biometrika, 68, 265-274.

[11] Doss, H. (1994). Bayesian nonparametric estimation for incomplete data

via sucessive substitution sampling. The Annals of Statistics, 22, 1763-

1786.

[12] Doornik, J. A. (2002). Object-Oriented Matrix Programming Using

Ox, 3rd ed. London: Timberlake Consultants Press and Oxford:

www.nuff.ox.ac.uk/Users/Doornik.

[13] Ferguson, T. S. (1973). A Bayesian analysis of some nonparametric pro-

blems. The Annals of Statistics, 1, 209-230.

[14] Gamerman, D. (1987). Dynamic Analisys of Survival Models and Related

Process. PhD Thesis. University of Warwick, Conventry.

[15] Gamerman, D. (1991). Dynamic Bayesian models for survival data. Ap-

plied Statistics,40, 63-79.

[16] Gamerman, D. (1997). Markov Chain Monte Carlo: Stochastic Simula-

tion for Bayesian Inference. London: Chapman & Hall.

138

[17] Gamerman, D. e West, M. (1987). An application of dynamic survival

models in unemployment studies. The Statistician, 36, 269-274.

[18] Gelfand, A. e Smith, A. M. F. (1990). Sampling-based approaches to

calculating marginal densities. Journal of the American Statistical As-

sociation, 85, 398-409.

[19] Gelfand, A. e Mallick, B. (1995). Bayesian analysis of proportional ha-

zards models built from monotone function. Biometrics, 51, 843-852.

[20] Gelman, A. e Rubin, D. B. (1992). Inference from iterative simulation

using multiple sequences (com discussoes). Statistical Science, 7, 457-511

[21] Geman, S. e Geman, D. (1984). Stochastic relation, Gibbs distribution

and the Bayesian restoration of images. IEEE Transactions on Pattern

Analysis and Machine Intelligence, 6, 721-741.

[22] Geweke, J. (1992). Evaluating the accuracy of sampling-based ap-

proaches to calculating posterior moments. Em J. Bernado, J. Berger,

A. Dawid e A. Smith (Editores), Bayesian Statistics 4, Oxford, 169-193,

University Press.

[23] Gilks, W. R., Richardson, S. e Spiegealhalter, D. R. (Editores) (1996).

Markov Chain Monte Carlo in Pratice. London: Chapman & Hall.

[24] Gill, J. K. e Johansen, S. (1990). A survey of product-integration with

a view toward application in survival analysis. The Annals of Statistics,

18, 1501-1555.

[25] Harrison, P. J. e Stevens, C. F. (1976). Bayesian Forecasting. Journal

of Royal Statistical Society, Series B, 38, 205-247.

139

[26] Hastings, W. K. (1970). Monte Carlo samplings using Markov chains

and their applications. Biometrika, 57, 97-109.

[27] Heidelberger, P. e Welch, P. (1983) Simulation run length control un the

presence of an initial trasient. Operations Research, 31, 1109-1144.

[28] Hemming, K. e Shaw, E. H. (2002). A parametric dynamical model

applied to breast cancer survival times. Applied Statistics, 51, 421-435.

[29] Hougaard, P. (1995). Frailty models for survival data. Lifetime Data

Analysis, 1, 255-273.

[30] Henderson, R. e Oman, P. (1999). Effect of frailty on marginal regresion

estimates in survival analysis. Journal of the Royal Statistical Society,

Series B, 61, 367-379.

[31] Henderson, R., Shimakura S. e Grost, D. (2002). Modelling spatial vari-

ation in Leukaemia survival data. Journal of the American Statistical

Association, 97, 965-972.

[32] Kalbfleish, J. D. (1978). Non-parametric Bayesian analysis of survival

time data. Journal of Royal Statistical Society, Series B,40, 214-221.

[33] Klein, J. P. e Moeschberger M. L. (1991). Survival Analysis: Techniques

for Censured and Truncated Data, Springer.

[34] Krige, D.G. (1951). A statistical approch to some basic mine evalua-

tion problems on the Witwatersrand. Johannesburg Chemistry Metal-

lurgy Mining Society South African, 52, 119-139.

[35] McGilchrist, C. A. e Aisbett, C. W. (1991). Regression with Frailty in

survival analisys. Biometrics, 47, 461-466.

140

[36] Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H. e

Teller, E. (1953). Equation od station calculations by fast computing

machine. Journal of Chemical Physics. 21, 1087-1091.

[37] Migon, H. S. e Gamerman, D. (1999). Statistical Inference an Integrated

Approach. London: Arnold.

[38] Nieto-Barajas, L. e Walker, S. G. (2002). Markov beta and gamma pro-

cesses for modelling hazard rates. Scandinavian Journal of Statistics,

29, 413-424.

[39] O’Hagan, A. (1994). Bayesian Inference. Volume B of Kendall’s Ad-

vanced Theory of Statistics. London: Edward Arnold.

[40] Qiou, Z., Ravinshanker, N. e Dey, D. K. (1999). Multivariate survival

analysis with positive stable frailties, Biometrics, 55, 637-644.

[41] Raftery, A. L. e Lewis, S. (1992). How many iterations in the Gibbs

sampler? Em J. Bernardo, J. Berger, A. Dawid e A. Smith (Editores),

Bayesian Statistics 4, Oxford, 763-774, University Press.

[42] Silva, G. L. (2001). Analise Bayesiana de Modelos de Sobrevivencia com

Fragilidade. Tese de Doutorado, Instituto Superior tecnico, universidade

Tecnica de Lisboa.

[43] Sinha, D. e Dey, D. K. (1997). Semiparametric Bayesian analysis of

survival Data. Journal of the American Statistical Association, 1997,

92, 1195-1211.

[44] Spiegelhalter, D.J., Best, N.G., Carlin, B.P. e Van der Linde, A. (2002).

Bayesian measure of model complexity and fit. Journal of Royal Statis-

tical Society, Series B, 64, Part 3, 1-34.

141

[45] Tanner, M. A. (1996). Tools for Statistical Inference-Methods for Explo-

ration of Posterior Distribuitions and Likelihood Functions (3a edicao).

New York: Springer Verlag.

[46] Townsend, P., Phillimore, P. e Beattie, A. (1988). Health and Depriva-

tion: Inequality and the North. London: Croom Helm.

[47] Vaupel, J. W., Manton, K. G. e Stallard, E. (1979). The Impact of hete-

rogeneity in individual frailty on dynamics of mortality. Demography,

16, 439-454.

[48] Weibull, W. (1951). A statistical distribution of wide applicability. Jour-

nal of Applied Mechanics, 18, 293-297.

[49] West, M. e Harrison, P. J. (1997). Bayesian Forecasting and Dynamic

Models (2a edicao). New York: Springer Verlag.

142

Apendice

Durante o texto da dissertacao foram apresentadas as condicionais comple-

tas e metodos para gerar amostras dessas distribuicoes de todos os modelos

propostos. As distribuicoes a posteriori serao apresentadas junto com os

principais calculos necessarios para a obtencao das mesmas. As distribuicoes

a posteriori serao apresentadas para tanto para os modelos estaticos quanto

para os modelos dinamicos, mas sera dado um destaque um pouco maior

para os modelos estaticos pois estes tem mais especificacoes a priori para a

funcao de risco de base, que sao: abordagem parametrica, usando processos

Gama e usando processos correlacionados baseados em modelos dinamicos.

Os modelos sem fragilidade e com fragilidade nao estruturada sao ca-

sos particulares dos modelos com fragilidade espacial. Basta assumir que

a fragilidade W (s) = 0, ∀s ∈ D, onde D e uma regiao no espaco para os

modelos sem fragilidade. E para os modelos com fragilidade assume-se que

W ∼ N(0, Σ) onde W = (W (s1), . . . , W (sn)) e Σ e uma matriz de variancias

sem dependencia espacial, por exemplo Σ = σI.

143

Modelos Estaticos com Fragilidade Espacial

A funcao de risco de um indivıduo no tempo t com vetor de covariaveis X

na posicao s ∈ D e dada por:

h(t; X, s) = h0(t) exp{Xβ + W (s)} (8.1)

onde h0(.) e a funcao de risco de base, β e o vetor (coluna) de efeitos associ-

ados as covariaveis e W (.) e a fragilidade espacial. as quantidades h0(.), β e

W (.) sao quantidades desconhecidas, portanto serao estimados valores para

essas quantidades.

A funcao de verossilhanca depende da especificacao a priori para a

funcao de risco de base, mas de uma forma geral a funcao de verossimilhanca,

para uma amostra de tamanho n e indicador de falha δ, e dada por:

L(β, h0,W ; t, δ,X, s) =n∏

i=1

(h0(ti)e

Xiβ+W (si))δi

exp{−H0(ti)e

Xiβ+W (si)}

(8.2)

As especificacoes para a funcao de risco de base estudas nesta dis-

sertacao foram: processos parametricos, processos Gama e processos correla-

cionados.

Processos Parametricos - MEFE-Wb

Seguindo uma especificacao parametrica para a funcao de risco de base e

necessario supor uma distribuicao, sera assumido para o tempo uma dis-

tribuicao Weibull, lembrando que qualquer distribuicao parametrica positiva

poderia ser usada para o tempo que implicaria em uma funcao de risco de

base dada por uma funcao dos parametros da distribuicao escolhida. Para o

144

caso Weibull a funcao de risco de base e dada por:

h0(t) = λαtα−1, λ > 0, α > 0 (8.3)

Com esta funcao de risco de base a funcao de verossimilhanca (8.2) pode ser

reescrita da seguinta forma:

L(β, α, λ,W ; t, δ,X, s) =n∏

i=1

(αλtα−1

i eXiβ+W (si))δi

exp{−λtαi eXiβ+W (si)

}

(8.4)

note que a funcao de risco de base por ser uma funcao de α e λ, portanto

sua estimativa a posteriori sera funcao das estimativas a posteriori de α e λ.

As especificacoes a priori para as quantidades desconhecidas sao dadas

a seguir. Como os coeficientes dos efeitos das covariaveis nao variam com o

tempo, sera utilizado uma distribuicao normal multivariada com os seguintes

hiperparametros m e V que descrevem o conhecimento inicial que se dos

efeitos. Ou seja,

p(β) ∝ exp{−1

2(β −m)T V −1(β −m)

}(8.5)

Os parametros da funcao de risco de base terao a distribuicao gama

com distribuicao a priori e os hiperparametros serao especificados de acordo

com algum conhecimento inicial que se tem do processo, ou seja:

p(α) ∝ αaα−1 exp{−bαα}, aα, bα > 0 (8.6)

p(λ) ∝ λaλ−1 exp{−bλλ}, aλ, bλ > 0 (8.7)

A fragilidade espacial sera ajustada usando processos Gaussianos de

forma similar a utilizada em Geoestatıstica. Onde a fragilidade segue um

processo Gaussiano estacionario isotropico com media zero, ou seja

W ∼ N(0, Σ) (8.8)

145

onde Σ = σ2W R, σ2 > 0, Rij = ρ(dij, φ, σ2

W ), dij e a distancia entre as

observacoes i e j. Sera assumido que ρ(.) e a funcao de correlacao exponencial

potencia, ou seja,

Rij = exp

{−

(dij

φ

)κ}(8.9)

Desta forma a funcao de densidade a priori da fragilidade espacial e

dada por

p(W |φ, σ2W ) ∝ exp

{− 1

2σ2W

W T R−1W

}(8.10)

onde Rij = ρ(dij, φ, σ2W ), os hiperparametros φ e σ2

W tem as distribuicoes

gama e gama invertida a priori, respectivamente, ou seja

p(σ2W ) ∝ (σ2

W )−cW2−1 exp{− dW

2σ2W

}, cW , dW > 0 (8.11)

p(φ) ∝ φaφ−1 exp{−bφφ}, aφ, bφ > 0 (8.12)

p(κ = k) = 1, k e uma constante pre-especificada. (8.13)

Combinando as distribuicoes a priori (8.5), (8.6), (8.7), (8.10), (8.11),

(8.12) e (8.13) com a funcao de verossimihanca (8.4) atraves do teorema de

Bayes temos que a distribuicao a posteriori e dada por

p(β, W, α, λ, σ2W , φ, κ| · · ·) ∝ αaα−1λaλ−1(σ2

W )−cW +n

2−1φaφ−1|R|−1(αλ)

∑n

i=1δi

× exp{−bαα− bλλ− bφφ− 1

2(β −m)T V −1(β −m)

}

× exp

{− 1

2σ2W

(W T R−1W + dW )

}n∏

i=1

(tδiα−1i eδi(Xiβ+W (si))

)

× exp

{−λ

n∑

i=1

tαi eXiβ+W (si)

}I(κ = k) (8.14)

146

Processos Gama - MEFE-PG

Ao assumir para a funcao de risco de base um processo Gama, a funcao de

risco de base sera estimada de forma nao parametrica. Este e um procedi-

mento bem mais robusto que o parametrico, mas por sua vez e bem mais

flexıvel. Os processos Gama utilizam os incrementos da funcao de risco de

base acumulada. Assim a funcao de verossimilhanca (8.2) sera reescrita da

seguinta forma:

L(β, dH0,W ; t, δ,X, s) =n∏

i=1

(d

dtH0(ti)e

Xiβ+W (si)

)δi

× exp{−

∫ ti

0dH0(u)eXiβ+W (si)

}(8.15)

onde∫ ti

0dH0(u) =

n∑

j=i

(dH0(tj) + DH0(tj)) e DH0(tj) =∫ tj

tj−1

dH(u), para

j ≤ i = 1, . . . , n.

Os coeficientes de regressao (β) assim como a fragilidade espacial (W )

por nao dependerem a priori da funcao de risco de base terao a mesma

especificacao a priori utilizada nos processos parametricos dadas em (8.5) e

(8.10).

A especificacao para a funcao de risco de base na verdade e uma es-

pecificacao para a funcao de risco de base acumulada H0(.), sera assumido

que H0(.) segue a priori um processo em media conhecido e alem disso possui

incrementos Gama independentes, ou seja,

E(H0(t)) = H∗(t), uma funcao positiva conhecida,

V (H0(t)) =H∗(t)

c,

e os incrementos dH0(t) sao independentes e seguem uma distribuicao Gama

147

com parametros de forma e escala cdH∗(t) e c, respectivamente.

p(dH0(t)) ∝ (dH0(t))cdH∗(t)−1 exp{−cdH0(t)} (8.16)

Com o mesmo parametro de escala, a partir do teorema 3.1 tem-se que

∀t > u:

p(H0(t)−H0(u)) ∝ (H0(t)−H0(u))c(H∗(t)−H∗(u))−1

× exp{−c(H0(t)−H0(u))}. (8.17)




p(β, W, dH0, σ2W , φ, κ| · · ·) ∝ (σ2

W )−cW +n

2−1φaφ−1 exp {−bφφ} |R|−1

× exp

{− 1

2σ2W

(W T R−1W + dW )

}

×n∏

i=1

(dH0(ti))δi+cdH∗(ti)−1 (DH0(ti))

cDH∗(ti)−1

×n∏

i=1

exp {−c[dH0(ti) + DH0(ti)] + Xiβ + W (si)}

×n∏

i=1

exp{−

∫ ti

0dH0(u)eXiβ+W (si)

}(8.18)

× exp{−1

2(β −m)T V −1(β −m)

}I(κ = k)

Processos Correlacionados - MEFE-PC

Esta especificacao aproxima a distribuicao dos tempos de falha usando a

distribuicao exponencial por partes. Ou seja, em intervalos de tempo pre-

estabelecidos a funcao de risco e contante, ou seja,

h(t; X, s) = h0(t)eXiβ+W (si) = exp{log(λ0i) + Xiβ + W (si)} (8.19)

148

onde ∀t ∈ Ii, i = 1, . . . , J, J + 1., os I’s sao elementos da particao definida

em (3.20) e os valores do logaritmo de λ0 se modificam suavemente segundo

um passeio aleatorio, ou seja,

β0i = β0(i−1) + ui, ui ∼ N(0, Ui), i = 2 . . . , J (8.20)

β01 ∼ N(m0, C) (8.21)

onde β0i = log(λ0i), i = 1, . . . , J , Ui = biU , onde bi = ai − ai−1 que

e o tamanho do intervalo Ii, U e o hiperparametro que mede a forca da

autocorrelacao e m0 e C sao variaveis conhecidas. Sera asumido para U

segue uma distribuicao Gama Invertida com parametros ( cU

2, dU

2) e funcao de

densidade dada por

p(U |cU , dU) ∝ U− cU2−1 exp

{− dU

U2

}, U > 0, cU , dU > 0) (8.22)

A distribuicao conjunta de β0 = (β01, . . . , β0J)T e dada como produto

das densidades obtidas de (8.20) e (8.21),

β0 ∼ NJ

(m0, Λ

−1)

(8.23)

onde m0 = m01, 1 = (1, . . . , 1)T e a matriz de variancias Λ−1 dada por

(2.11).

Usando o Teorema 3.2 e a funcao de risco 8.19a funcao de verossimil-

hanca (8.2) sera reescrita da seguinta forma:

L(β, W, β0; t, δ,X, s) =n∏

i=1

J∏

j=1

(eβ0j+Xiβ+W (si))χij

=n∏

i=1

J∏

j=1

exp{−eβ0j+Xiβ+W (si)(tij − aj−1)

}(8.24)

Os coeficientes de regressao (β)assim como a fragilidade espacial (W )

por nao dependerem a priori da funcao de risco de base terao a mesma

149

especificacao a priori utilizada nos processos parametricos e Gama, dadas

em (8.5) e (8.10).




p(β, W, β0, U, σ2W , φ, κ| · · ·) ∝ (σ2

W )−cW +n

2−1φaφ−1U− cU +J

2−1 exp {−bφφ} |R|−1

× exp

{−1

2(β −m)T V −1(β −m)− dW

2σ2W

}

× exp{−1

2(β0 −m0)

T Λ(β0 −m0)}

× exp

n∑

i=1

J∑

j=1

[(β0j + Xiβ + W (si))χij]

× exp

n∑

i=1

J∑

j=1

[−eβ0j+Xiβ+W (si)(tij − aj−1)

]

× exp

{− 1

2σ2W

W T R−1W

}I(κ = k) (8.25)

Modelos Dinamicos com Fragilidade Espacial

Agora os efeitos das covariaveis dependem do tempo, e para fazer a estimacao

dos efeitos dependentes do tempo usaremos um modelo de sobrevivencia

dinamico. Seja a particao do eixo do tempo dada por (5.2). Sera assumido

que para tempos percentes a um mesmo intervalo Ij, j = 1, . . . , J , a funcao

de risco e constante com respeito ao tempo. Portanto

h(t; X, β) = exp {β0j + Xβ.,j} , t ∈ Ij, j = 1, . . . , J. (8.26)

onde h0(t) = exp{β0j} e β.,j = (β1j, . . . , βpj)T , ∀t ∈ Ij. Note que a funcao de

risco de base tambem sera modelada de forma dinamica.

150

Com a particao (5.2) e a funcao de risco (8.26), usando o Teorema 3.2

tem-se que a funcao de verossimilhanca e dada por

L(β) = exp

n∑

i=1

J∑

j=1


(8.27)

onde χij assume valor 1 se o indivıduo i falha no intervalo j e 0 caso contrario.

Logo∑

j χij = δi e para simplificar a notacao foram feitas as seguintes ex-

pansoes: Xi = (1, Xi) e β.,j = (β0j, β.,j)T para simplificar a notacao. sob a

forma matricial tem-se

β =

β0,1 β1,1 . . . βp,1

β0,2 β1,2 . . . βp,2

......

...

β0,J β1,J . . . βp,J

= [β0,, β1,, . . . , βp,] (8.28)

Sera assumido a priori para a seguinte distribuicao a priori, ja descrita

no Capıtulo 5:

vec(β) ∼ NJ(p+1)

(mT ⊗ 1, Σ⊗ Λ−1

)(8.29)

onde vec(A) e a vetorizacao da matriz A. Σ = diag(σ20, . . . , σ

2p) e Λ e definida

em (2.11). A funcao de densidade e dada por

p(β|U, σ20 . . . , σ2

p) = (2π)−J(p+1)/2|Σ|−J/2|Λ|(p+1)/2

× exp{−1

2tr

[(β −B)T Λ(β −B)Σ−1

]}(8.30)

Para os hiperparametros U, σ20 . . . , σ2

p serao assumidas as seguintes dis-

tribuicoes a priori

p(U) ∝ UcU2−1 exp

{− dU

2U

}(8.31)

p(σ2i ) ∼ (σ2

i )− ci

2−1 exp

{− di

2σ2i

}, i = 0, 1, . . . , p (8.32)

151

onde os parametros ((cU , dU), (c0, d0), . . . , (cp, dp)) sao conhecidos a priori e

descrevem a informacao inicial de seus respectivos hiperparametros.

Como a fragilidade espacial (W ) nao depende do tempo e nem depende

a priori dos efeitos β, ela tera a mesma especificacao a priori utilizada nos

modelos estaticos com fragiildade espacial, dadas em (8.5) e (8.10).




p(β, W,U, σ20, . . . , σ

2p, φ, κ| · · ·) ∝ U

cU2

+(p+1)(J−1)−1 exp

{− dU

2U

}

×p∏

i=1

(σ2i )− ci+J

2−1 exp

{− di

2σ2i

}

× exp{−1

2tr

((β −B)T Λ(β −B)Σ−1

)}

× exp

n∑

i=1

J∑

j=1


× I(κ = k) (8.33)

152

universidade federal do rio de janeiro modelos dinamicos … · orientador: dani gamerman rio de...

Documents