universidade federal do rio de janeiro modelos dinamicos … · orientador: dani gamerman rio de...
TRANSCRIPT
Universidade Federal do Rio de Janeiro
MODELOS DINAMICOS E ESTATICOS DE
SOBREVIVENCIA COM FRAGILIDADE
ESPACIAL
Leonardo Soares Bastos
2003
UFRJ
Modelos Dinamicos e Estaticos de
Sobrevivencia com Fragilidade Espacial
Leonardo Soares Bastos
Dissertacao de Mestrado submetida ao Programa
de Pos-graduacao em Estatıstica do Instituto
de Matematica da Universidade Federal do Rio
de Janeiro como parte dos requisitos necessarios
para obtencao do grau de Mestre em Ciencias
Estatısticas.
Orientador: Dani Gamerman
Rio de Janeiro
Dezembro de 2003
Modelos Dinamicos e Estaticos de
Sobrevivencia com Fragilidade Espacial
Leonardo Soares Bastos
Orientador: Prof. Dani Gamerman
Dissertacao de Mestrado submetida ao Programa de Pos-gra-
duacao em Estatıstica do Instituto de Matematica da Universi-
dade Federal do Rio de Janeiro como parte dos requisitos necessarios
para obtencao do grau de Mestre em Ciencias Estatısticas.
Aprovada por :
Presidente, Prof. Dani Gamerman
Prof. Helio S. Migon
Profa. Silvia Shimakura
Rio de Janeiro
Dezembro de 2003
Bastos, Leonardo Soares
Modelos Dinamicos e Estaticos de Sobrevivencia com Frag-
ilidade Espacial / Leonardo Soares Bastos. - Rio de Janeiro:
UFRJ/IM, 2003.
xi, 163f.: il.; 31cm.
Orientador: Dani Gamerman
Dissertacao (mestrado) - UFRJ/IM/ Programa de Pos-
graduacao em Estatıstica, 2003.
Referencias Bibliograficas: f.137-142.
1. Analise de Sobrevivencia. 2. Estatıstica Bayesiana. 3.
Estatıstica Computacional. 4. Modelos Dinamicos I. Gamerman,
Dani II. Universidade Federal do Rio de Janeiro, Instituto de
Matematica. III. Tıtulo.
Resumo
Modelos Dinamicos e Estaticos de
Sobrevivencia com Fragilidade Espacial
Leonardo Soares Bastos
Orientador: Prof. Dani Gamerman
Resumo da Dissertacao de Mestrado submetida ao Programa de Pos-
graduacao em Estatıstica, Instituto de Matematica, da Universidade Fede-
ral do Rio de Janeiro - UFRJ, como parte dos requisitos necessarios para
obtencao do grau de Mestre em Ciencias Estatısticas.
Os Modelos de sobrevivencia com fragilidade espacial alem de explicar
qual e o efeito de covariaveis no risco de um indivıduo falhar, eles visam
descrever a heterogeneidade nao observada entre as unidades em estudo com
alguma informacao espacial, introduzida no termo latente (fragilidade). A
modelagem sera inicialmente baseada nos modelos de riscos proporcionais
onde a funcao de risco de base sera ajustada de tres maneiras: supondo uma
forma parametrica, usando processos Gama e usando modelos dinamicos.
Uma outra forma de modelagem e baseada em modelos dinamicos de so-
brevivencia que supoem covariaveis dependentes do tempo. A fragilidade
espacial sera modelada usando processos Gaussianos. As estimativas serao
obtidas atraves de metodos computacionais baseados em MCMC. A aplicacao
sera feita a dois conjuntos de dados: um estudo de sobrevivencia de pessoas
residentes na Inglaterra que sofrem de Leucemia e uma estudo do tempo no
emprego nos municıpios do Rio de Janeiro no setor industrial.
Palavras-chave: Analise de sobrevivencia Bayesiana, Modelos de sobrevivencia
dinamicos, Modelos Semiparametricos, Geoestatıstica.
Abstract
Spatial Frailty Dynamic and
Static Survival Models
Leonardo Soares Bastos
Orientador: Prof. Dani Gamerman
Abstract da Dissertacao de Mestrado submetida ao Programa de Pos-
graduacao em Estatıstica, Instituto de Matematica, da Universidade Fede-
ral do Rio de Janeiro - UFRJ, como parte dos requisitos necessarios para
obtencao do grau de Mestre em Ciencias Estatısticas.
Spatial frailty survival models besides explaining which is the covari-
ates effect in the risk of an individual to fail, aim at describing non-observed
heterogeneity between the units in the study with some spatial information,
introduced in a latent term (frailty). The modeling will be initially based on
proportional risk models where the baseline hazard function will be adjusted
in three ways: assuming parametric form, using Gamma processes and using
dynamic models. Another form of modeling is based on survival dynamic
models, that assume that the covariates effect can change over time. The
spatial frailty will be modeled using Gaussian processes. The estimates will
be based on computational methods using MCMC. The models will be ap-
plied to two data sets: a study of survival of residents in England who suffer
from Leukemia and a study of the employment duration time in the indus-
trial sector in the State of Rio de Janeiro.Key-words: Bayesian Survival Analysis,
Dynamic Survival Models, Semiparametrics Models, Geostatistics.
Agradecimentos
Em primeiro lugar a Deus. (E aos seus santos tambem.)
A Thaıs pelo apoio em todos os sentidos e por simplesmente ter apare-
cido na minha vida.
Ao cla dos Bastos, pelo apoio que eu sempre tive durante a minha
caminhada meu pai (Francisco), minha mae (Cleusa) e meu unico irmao
(Breno).
Gostaria de agradecer a todos os professores que me fizeram seguir
por esse caminho. Principalmente ao professor Dani, que pra mim foi uma
honra te-lo como orientador durante o mestrado, e as professoras Rosangela
e Cibele Queiroz da UFMG, que me orientaram durante a graduacao e eu
serei eternamente grato a elas.
Nao poderia de deixar de agradecer aos meus amigos. Os amigos
do bairro (Palmeiras-BH), dando um destaque para Lucio (Sasaki Kojiro
ou Lucin), Jason (Peacemaker), Gleison (Piledrivermaker), Valeria (Val) e
Flavia Komatsuzaki (Flavinha) que foram grandes companheiros e estao
quase sempre on-line. Aos amigos da UFMG, Cristiano (Negao), Inara, Paula
(Paulete), Roseli (Aose), Leonardo (Leo Giradi), Rafael e mais alguns que
i
estudaram comigo ou fizeram parte das horas de truco no centro de estudos,
nas longas viagens pro ENESTE e nas festas e calouradas da Federal. E no
Rio, eu destaco Aline, Cristiane, Rafael e o Zim, quero dizer o Gustavo, que
sao pessoas que eu admiro.
Outros fatos extremamente importantes nesse perıodo que passei cur-
sando o mestrado foram: O Cruzeiro Esporte Clube, que no ano de minha
defesa conseguiu a trıplice coroa ganhando o campeonato estadual, a Copa
do Brasil (pela quarta vez) e o campeonato brasileiro (tıtulo inedito para o
clube). O Metal que sempre foi o fundo musical durante o desenvolvimento
dessa dissertacao, algumas bandas eu posso destacar Nightwish, Sratovarius,
Symphony X, Blind Guardian, Angra e Shaman. E para finalizar as revistas
que li em sua grande maioria Mangas que eu gostaria de destacar Samurai
X, Cavaleiros do Zodıaco e Dragon Ball.
ii
Sumario
1 Introducao 1
1.1 Conceitos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Especificacao da Verossimilhanca . . . . . . . . . . . . . . . . 4
1.3 Modelos de Regressao . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Modelos de Fragilidade . . . . . . . . . . . . . . . . . . . . . . 7
1.5 Sumario da dissertacao . . . . . . . . . . . . . . . . . . . . . . 8
2 Inferencia Bayesiana 11
2.1 Conceitos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Monte Carlo via Cadeias de Markov . . . . . . . . . . . . . . . 14
2.2.1 Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . 15
2.2.2 Algoritmo de Metropolis-Hastings . . . . . . . . . . . . 16
2.2.3 Verificacao de Convergencia . . . . . . . . . . . . . . . 19
iii
2.3 Modelos Dinamicos . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4 Geoestatıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 Modelos Estaticos de Sobrevivencia 29
3.1 Definicao do Modelo . . . . . . . . . . . . . . . . . . . . . . . 30
3.2 Coeficientes de Regressao . . . . . . . . . . . . . . . . . . . . . 31
3.3 Funcao de Risco de Base . . . . . . . . . . . . . . . . . . . . . 32
3.3.1 Processos Parametricos . . . . . . . . . . . . . . . . . . 33
3.3.2 Processos Gama . . . . . . . . . . . . . . . . . . . . . . 35
3.3.3 Processos Correlacionados . . . . . . . . . . . . . . . . 38
3.3.4 Outros processos a priori . . . . . . . . . . . . . . . . . 41
3.4 Estudo Simulado . . . . . . . . . . . . . . . . . . . . . . . . . 42
4 Modelos de Fragilidade Espacial 50
4.1 Por que usar modelos com Fragilidade Espacial? . . . . . . . . 51
4.2 O Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3 Coeficientes de Regressao . . . . . . . . . . . . . . . . . . . . . 54
4.4 Funcao de Risco de Base . . . . . . . . . . . . . . . . . . . . . 54
4.4.1 Processos Parametricos . . . . . . . . . . . . . . . . . . 55
4.4.2 Processos Gama . . . . . . . . . . . . . . . . . . . . . . 55
iv
4.4.3 Processos Correlacionados . . . . . . . . . . . . . . . . 57
4.5 Fragilidade Espacial . . . . . . . . . . . . . . . . . . . . . . . . 58
4.6 Estudo simulado . . . . . . . . . . . . . . . . . . . . . . . . . 60
5 Modelos Dinamicos de Sobrevivencia com e sem Fragilidade
Espacial 76
5.1 Modelo Dinamico de Sobrevivencia . . . . . . . . . . . . . . . 78
5.2 Modelo Dinamico de Fragilidade Espacial . . . . . . . . . . . 81
5.3 Estudo Simulado . . . . . . . . . . . . . . . . . . . . . . . . . 85
6 Aplicacao a dados reais 96
6.1 Dados de Leucemia na Inglaterra . . . . . . . . . . . . . . . . 97
6.2 Dados de tempo no emprego . . . . . . . . . . . . . . . . . . . 114
7 Conclusoes e Trabalhos Futuros 134
Referencias Bibliograficas 137
Apendice 143
v
Capıtulo 1
Introducao
O objetivo desta dissertacao e apresentar uma analise Bayesiana de modelos
de sobrevivencia com fragilidade espacial. Esses modelos alem de explicar
o risco do indivıduo de falhar sob o efeito de covariaveis, como os modelos
de regressao em analise de sobrevivencia, visam descrever a heterogeneidade
nao observada entre as unidades em estudo levando em consideracao alguma
informacao espacial das observacoes.
O modelo de fragilidade espacial e uma extensao do modelo de frag-
ilidade, proposto inicialmente por Clayton (1978), onde ao efeito aleatorio
introduzido na funcao de risco sera incorporado uma estrutura espacial.
Essa estrutura sera modelada usando processos gaussianos utilizados em
Geoestatıstica, onde a informacao espacial esta contida na estrutura de cor-
relacao dos dados. Os modelos de fragilidade espacial sao bem mais recentes
que os modelos de fragilidade, Carlin e Banerjee (2002) e Henderson et al.
(2002) abordaram esse tema em seus trabalhos, os primeiros usando modelos
Condicionais Autoregressivos (CAR) e os segundos usando modelos Gama
1
Multivariados. Extendendo os modelos de fragilidade espacial sera apresen-
tada uma modelagem com parametros variando no tempo, usando modelos
dinamicos.
Na Secao 1.1 serao descritos os conceitos basicos em analise de so-
brevivencia. Na Secao 1.2 sera descrito como a funcao de verossimilhanca e
especificada. Na Secao 1.3 serao descritos os modelos de regressao em analise
de sobrevivencia e como sao introduzidas as covariaveis no modelo. Na Secao
1.4 sera feita uma breve apresentacao dos modelos de fragilidade onde sera
mostrado como o efeito de fragilidade e incorporado ao modelo. Um sumario
dessa dissertacao sera apresentado na Secao 1.5 .
1.1 Conceitos Basicos
Os dados de sobrevivencia consistem no tempo ate a ocorrencia de um de-
terminado evento, que sera chamado de morte ou falha. Uma caracterıstica
desse tipo de dado e a possibilidade da nao observacao do evento de interesse
em algumas observacoes, que pode ser uma censura ou um truncamento.
Dados truncados sao aqueles que para entrar no estudo foram sujeitos a um
condicionamento. Dados censurados sao divididos em tres tipos; censura a
direita, onde tudo que se sabe e que o evento ainda nao ocorreu ate o instante
observado, censura a esquerda, onde tudo o que se sabe e que o evento ocorreu
em algum instante de tempo antes do inıcio do estudo, e censura intervalar, e
aquela em que se sabe que o evento ocorreu dentro de um intervalo de tempo
conhecido. Nesta dissertacao apenas a modelagem com censura a direita sera
abordada. A ocorrencia ou nao de censura sera indicada por uma variavel
indicadora de falha, que vale 1 se a observacao falhou e 0 se foi censurada.
2
Alem do tempo de sobrevivencia e da variavel indicadora de falha, os da-
dos de sobrevivencia podem conter um conjunto de variaveis observaveis que
podem estar relacionadas com estes tempos. Estas variaveis sao conhecidas
por covariaveis ou variaveis explicativas. Quando os tempos de sobrevivencia
estao relacionados com as covariaveis diz-se que a populacao e heterogenea.
Caso contrario a populacao e dita homogenea.
Seja T uma variavel aleatoria (v.a.) que representa o tempo de so-
brevivencia de uma observacao com funcao de densidade f(t). A funcao de
sobrevivencia, S(t), e definida por
S(t) = Pr(T > t) (1.1)
onde T e uma variavel aleatoria contınua nao negativa.
A formulacao dos modelos de sobrevivencia e feita usualmente pela
funcao de risco, h(t), definida por
h(t) = lim∆→0+
Pr(t < T < t + ∆|T > t)
∆(1.2)
e a funcao de risco acumulada, H(t), e dada por
H(t) =∫ t
0h(u)du, t > 0 (1.3)
Sera assumido que os tempos de sobrevivencia sao variaveis aleatorias
absolutamente contınuas. Portanto, a funcao de risco determina completa-
mente a distribuicao de probabilidade destes tempos. As principais relacoes
entre f , S e h sao definidas a seguir. De (1.1), obtem-se que
f(t) = − d
dtS(t), (1.4)
e de (1.2) tem-se que
h(t) = lim∆→0+
Pr(t < T < t + ∆|T > t)
∆
3
=1
Pr(T > t)lim
∆→0+
Pr(t < T < t + ∆)
∆
=f(t)
S(t)(1.5)
Como T e uma v.a. positiva, h(t) = 0, t < 0. Substituindo (1.4) em
(1.5) e resolvendo a equacao para S(t),
S(t) = exp{−
∫ t
0h(u)du
}= exp {−H(t)} . (1.6)
Note que a funcao de risco e suficiente para especificar a distribuicao
de probabilidade da variavel, pois pode-se escrever a funcao de densidade de
probabilidade como funcao da funcao de risco, ou seja, usando (1.5) e (1.6)
tem-se que
f(t) = h(t) exp{−
∫ t
0h(u)du
}. (1.7)
1.2 Especificacao da Verossimilhanca
A contribuicao para a funcao de verossimilhanca para uma observacao que fal-
hou e a funcao de densidade, mas se a observacao for censurada a informacao
que se tem em maos e que a observacao sobreviveu ate aquele instante de
tempo, portanto a contribuicao para a funcao de verossimilhanca de um in-
divıduo que foi censurado e a funcao de sobrevivencia. A distincao entre falha
e censura e feita atraves da variavel indicadora de falha, δ. Desta forma, a
contribuicao, p(t), para a funcao de verossimilhanca de uma observacao e
dada por:
p(t) = f(t)δS(t)1−δ. (1.8)
Seja uma amostra de tamanho n de dados de sobrevivencia onde supoe-
4
se independencia e que as observacoes sejam provenientes de uma mesma
populacao, homogenea ou nao. A funcao de verossimilhanca e dada por
L(t1, . . . , tn) =n∏
i=1
p(ti)
=n∏
i=1
f(ti)δiS(ti)
1−δi . (1.9)
Usando as relacao (1.5) e (1.6) em (1.9) a funcao de verossimilhanca e
reescrita por
L(t1, . . . , tn) =n∏
i=1
h(ti)δi exp
{−
∫ ti
0h(u)d(u)
}. (1.10)
1.3 Modelos de Regressao
Frequentemente os dados de sobrevivencia sao provenientes de populacoes
heterogeneas, implicando na observacao de um conjunto de covariaveis jun-
tamente com os tempos de sobrevivencia. Portanto, e interessante conhecer
a influencia das covariaveis nos tempos de sobrevivencia, justificando o in-
teresse nos modelos de regressao.
O efeito das covariaveis em analise de sobrevivencia e expresso atraves
da funcao de risco. Nesta dissertacao, serao considerados apenas efeitos
multiplicativos. O principal modelo multiplicativo e o modelo de riscos pro-
porcionais ou modelo de Cox, (Cox, 1972), que e definido por
h(t|X, β) = h0(t)G(X; β) (1.11)
onde t e o tempo observado, X = (X1, . . . , Xp) e o vetor de covariaveis. Os co-
eficientes β = (β1, . . . , βp)T sao conhecidos por Coeficientes de Regressao.
A funcao h0(t) e conhecida por Funcao de Risco de Base e a funcao G(., .)
5
e uma funcao positiva, usualmente G(X; β) = exp{Xβ} e que tambem sera
a funcao utilizada nessa dissertacao. Assim (1.11) e reescrito como
h(t|X, β) = h0(t) exp{Xβ}. (1.12)
Este modelo e chamado de modelo de riscos proporcionais, pois a razao das
taxas de falha de dois indivıduos e constante no tempo, isto e, a razao das
funcoes de risco para dois indivıduos diferentes, i e j, e
h(t|Xi, β)
h(t|Xj, β)=
h0(t) exp{Xiβ}h0(t) exp{Xjβ}
= exp{Xiβ −Xjβ}
que nao depende do tempo. A funcao de verossimilhanca para os modelos de
regressao de riscos proporcionais e obtida, aplicando (1.12) em (1.10)
L(β, h0) =n∏
i=1
(h0(ti)e
Xiβ)δi
exp{−H0(ti)e
Xiβi
}(1.13)
onde H0(ti) e a funcao de risco de base acumulada, i = 1, . . . , n.
Quando a funcao de risco de base, h0(t), e especificada, ou seja, a funcao
tem uma forma parametrica conhecida, o modelo e chamado parametrico.
Mas quando a funcao h0(t) e nao especificada, o modelo e dividido em duas
partes: uma parametrica, associada aos coeficientes de regressao e a outra nao
parametrica, associada a funcao de risco de base. Esse modelo e conhecido
por semiparametrico.
O modelo de riscos proporcionais supoe que as covariaveis nao de-
pendem do tempo como extensao para o modelo de Cox. Seja X(t) =
(X1(t), . . . , Xp(t)) um conjunto de covariaveis no tempo t, a versao do modelo
de Cox com variaveis dependentes do tempo e dada atraves da substituicao
de X por X(t) em (1.12), ou seja,
h(t|X, β) = h0(t) exp{X(t)β} (1.14)
6
Uma outra extensao para os modelos de Cox com variaveis dependentes
do tempo foi proposta por Gamerman (1991). Ele propos uma classe de
modelos baseada em modelos dinamicos, que elimina o problema da suposicao
de riscos proporcionais e faz com que o modelo de riscos proporcionais seja
um caso particular, essa abordagem sera utilizada nessa dissertacao.
Uma outra forma de incluir covariaveis no modelo e usando modelos adi-
tivos, onde o principal modelo e o modelo de Aalen (1980). Essa modelagem
assim como, a classe de modelos de Gamerman(1991) e a classe extendida dos
modelos de Cox (1972), aceita covariaveis dependentes do tempo. A funcao
de risco do modelo de Aalen e dada por
h(t|X(t)) = α0(t) + ζ(X(t)α(t)) (1.15)
onde α(t) = [α1(t), . . . , αp(t)]T e α0(t) sao funcoes nao especificadas, X(t) =
(X1(t), . . . , Xp(t)) e o vetor de covariaveis dependentes do tempo e ζ(.) e uma
funcao positiva usualmente ζ(x) = x.
1.4 Modelos de Fragilidade
Os modelos de fragilidade sao caracterizados pela introducao de um efeito
aleatorio na funcao de risco. Clayton (1978) e Vaupel, Manton e Vallard
(1979) foram os primeiros a trabalhar com esta classe de modelos, o nome
fragilidade foi introduzido no segundo trabalho. A forma usual de se intro-
duzir a fragilidade no modelo de Cox e
h(t|X, β) = h0(t)u exp(Xβ) (1.16)
onde u e a fragilidade. Assume-se que u tem media 1 e variancia descon-
hecida, ξ. Usualmente assume-se tambem uma distribuicao Gama para ξ.
7
Note que se u = 0 o modelo (1.17) se reduz ao modelo de riscos propor-
cionais (1.12). Procedimentos de inferencia para esses modelos podem ser
encontradas em Klein e Moeschberger (1997), sob um ponto de vista classico,
Clayton (1991) e Silva (2001) apresentam metodos bayesianos para estes
modelos, o segundo autor tambem apresenta modelos aditivos de fragilidade.
Em algumas aplicacoes e conveniente escrever o modelo (1.16) como
h(t|X, β) = h0(t) exp(Xβ + w) (1.17)
onde w e a fragilidade, que segue uma distribuicao com media 0 e variancia σ2.
Note que se σ = 0 o modelo (1.17) se reduz ao modelo de risco proporcionais,
(1.12). Supor que w tem distribuicao normal e o mesmo que supor que u
tem distribuicao log-normal, pois w = log(u), e McGilchrist e Aisbett (1991)
modelaram a fragilidade usando a distribuicao log-normal.
1.5 Sumario da dissertacao
Os resultados basicos em analise de sobrevivencia que serao utilizados nessa
dissertacao foram apresentados neste capıtulo. O procedimento de inferencia
sera apresentado no Capıtulo 2, onde sera descrito de uma forma geral a
inferencia Bayesiana, apresentando as definicoes basicas, os metodos com-
putacionais bayesianos com enfase aos metodos de amostragem de Monte
Carlo via Cadeias de Markov (MCMC), uma apresentacao breve sobre Mod-
elos Dinamicos, Estatistica Espacial e metodos de comparacao de modelos.
No Capıtulo 3 serao apresentados os procedimentos de inferencia para
os Modelos Estaticos de Sobrevivencia, ou modelos de Regressao de Cox.
O modelo em questao e modelo de Cox (1.12), que tem como quantidades
8
desconhecidas a funcao de risco de base e os coeficientes de regressao. A
funcao de risco de base sera abordada de tres maneiras distintas, a primeira
usando uma modelagem parametrica, a segunda usando processos gama, in-
troduzidos em analise de sobrevivencia por Kalbfleish (1978) e, finalmente,
usando processos correlacionados baseados em modelos dinamicos, introduzi-
dos em analise de sobrevivencia por Gamerman (1991). Para os coeficientes
de regressao sera assumido uma distribuicao a priori. Essa metodologia sera
aplicada a dados simulados.
No Capıtulo 4 serao apresentados os Modelos Estaticos de Fragilidade
Espacial e sera explicado como um efeito aleatorio com uma estrutura es-
pacial e incorporado aos Modelos Estaticos. A funcao de risco de base e
os coeficientes de regressao serao abordados de maneira equivalente a abor-
dagem dos Modelos Estaticos com o acrescimo do termo da fragilidade. A
Fragilidade Espacial sera abordada usando processos Gaussianos usados em
Geoestatıstica, onde sera assumido alguma funcao de correlacao espacial para
explicar a relacao de dependencia espacial entre as observacoes. Para encer-
rar o capıtulo sera feito um estudo simulado
No Capıtulo 5, os Modelos Dinamicos em Sobrevivencia serao apre-
sentados. Logo em seguida os Modelos Dinamicos em Sobrevivencia serao
extendidos com a introducao de uma estrutura espacial, resultando nos Mo-
delos Dinamicos de Fragilidade Espacial. O procedimento de inferencia sera
descrito, onde serao definidas distribuicao a priori para os parametros descon-
hecidos. Um estudo simulado sera desenvolvido para os Modelos Dinamicos
com e sem Fragilidade Espacial.
No Capıtulo 6, as metodologias dos Capıtulos 3, 4 e 5 serao aplicadas a
dados reais. O primeiro conjunto de dados e um banco de dados de pessoas
9
residentes no Noroeste da Inglaterra que sofrem de leucemia. Esse conjunto
de dados foi utilizado no trabalho de Henderson et al. (2003), com dados
cedidos pelo autor. O outro conjunto de dados contem o tempo medio no
emprego em cada municıpio do estado do Rio de Janeiro para os grandes se-
tores de emprego definidos pelo Instituto Brasileiro de Geografia e Estatıstica
(IBGE). Estes dados foram cedidos pelo Ministerio do Trabalho e Emprego
(MTE).
No Capıtulo 7, serao apresentadas as conclusoes da dissertacao, uma
breve discussao computacional e propostas para trabalhos futuros. E em
seguida, no Apendice serao apresentadas todas as distribuicoes a posteriori
omitidas na dissertacao.
10
Capıtulo 2
Inferencia Bayesiana
Todos procedimentos de inferencia que serao utilizados nessa dissertacao sao
completamente Bayesianos. Portanto, neste Capıtulo serao descritos os con-
ceitos necessarios para se fazer inferencia Bayesiana. Na Secao 2.1 serao
definidos a distribuicao a priori de alguma quantidade desconhecida e como
se atualiza essa distribuicao, usando o Teorema de Bayes, a partir de um
conjunto de dados observados relacionados com a quantidade desconhecida
de interesse, para se obter a distribuicao a posteriori. Na Secao 2.2 serao
descritos metodos computacionais para o calculo da distribuicao a posteri-
ori, dando enfase aos metodos de amostragem de Monte Carlo via Cadeias
de Markov (MCMC). Outras tecnicas que serao utilizadas nessa dissertacao
serao apresentadas. Na Secao 2.3 serao descritos de forma resumida os Mo-
delos Dinamicos, com uma enfase nos modelos dinamicos de primeira ordem.
Na Secao 2.4 sera feita uma introducao a Estatıstica Espacial descrevendo
as tres grandes subdivisoes da Estatıstica Espacial: Geoestatıstica, Dados de
Area e Padroes de Ponto.
11
2.1 Conceitos Basicos
Um problema de inferencia estatıstica e conhecer o comportamento de uma
quantidade desconhecida, θ, que descreve o comportamento de uma determi-
nada caracterıstica de uma certa populacao. A quantidade θ assume valores
em um conjunto denotado por Θ, conhecido por espaco parametrico.
Seja H a informacao inicial sobre o parametro de interesse. Essa
informacao sera descrita em termos probabilısticos, podendo ser resumida
atraves de p(θ|H). Se a informacao contida em H e suficiente para descrever
o comportamento de θ, isto e tudo que se precisa.
Mas na maioria das vezes a informacao inicial H nao e suficiente para
descrever de forma razoavel o comportamento do parametro. Portanto, e
necessario obter mais informacao sobre θ. O que se faz usualmente e a ex-
perimentacao, isto e, realiza-se um experimento com a populacao de interesse,
uma amostragem dessa populacao. Observa-se quantidades aleatorias, deno-
tadas por X, que dependem do parametro θ. Antes de observar os valores de
X deve-se conhecer a distribuicao amostral de X dada por p(x|θ,H). Apos
observar o valor de X, a informacao sobre θ foi aumentada, ou seja, mudou
de H para H∗ = H ∩ {X = x}.
Agora a informacao sobre θ e resumida por p(θ|x,H). Em termos pro-
babilısticos essa passagem de p(θ|H) para p(θ|x,H) e feita atraves do Teo-
rema de Bayes1.
Teorema 2.1 (Teorema de Bayes) Seja p(θ|H) a distribuicao inicial da
1O Teorema de Bayes foi introduzido pelo Reverendo Thomas Bayes em dois artigos
em 1793 e 1794, publicados apos sua morte, como mencionado em Barnett (1973).
12
quantidade desconhecida θ e p(x|θ, H) a distribuicao amostral de X dado θ.
A distribuicao atualizada para θ e
p(θ|x,H) =p(θ|H)p(x|θ, H)
p(x|H)
onde
p(x|H) =∫
θ∈Θp(θ|H)p(x|θ,H)dθ.
Como a funcao do denominador do Teorema de Bayes nao depende de
θ, ele pode ser reescrito como
p(θ|x) ∝ p(θ)p(x|θ).
Note que a informacao inicial H foi omitida, mas apenas para simplificar
a notacao, pois e um fator comum em todos os termos. O Teorema de
Bayes e uma regra de atualizacao de probabilidades sobre θ, partindo de
uma distribuicao a priori p(θ) para a distribuicao a posteriori p(θ|x)
usando a informacao contida nos dados p(x|θ) conhecida por funcao de
verossimilhanca.
Toda inferencia sera feita com base na distribuicao a posteriori, de
onde obtem-se as estatısticas necessarias para resumir o comportamento de
θ. Dentre as principais estatısticas a posteriori pode-se citar:
• a media a posteriori, E(θ|x):
E(θ|x) =∫
θ∈Θθp(θ|x)dθ
• o quantil α a posteriori, Q(α):
Q(α) =
{θ′ ∈ Θ :
∫ θ′
−∞p(θ|x)dθ = α
}, α ∈ (0, 1);
note que quando α = 0.5 tem-se a mediana a posteriori.
13
• o intervalo 100(1− α)% de credibilidade a posteriori, (L,U):
(L,U) =
{(L′, U ′) ⊂ Θ2 :
∫ U ′
L′p(θ|x)dθ = 1− α
}, α ∈ (0, 1);
se o intervalo e simetrico, entao L = Q(α/2) e U = Q(1− α/2).
Para mais detalhes sobre aspectos teoricos envolvendo inferencia sob o
ponto de vista Bayesiano podem ser consultados os livros de Migon e Gamer-
man (1999) e O’Hagan (1994).
Muitas vezes a distribuicao a posteriori nao tem forma fechada, pois a
integral no denominador do Teorema de Bayes nao possui solucao analıtica.
Portanto, a distribuicao a posteriori tem que ser obtida atraves de metodos
numericos. Na proxima Secao sera apresentado um breve introducao aos
metodos de simulacao de Monte Carlo via Cadeias de Markov (MCMC).
2.2 Monte Carlo via Cadeias de Markov
A difusao da aplicacao dos metodos Bayesianos esteve limitada ate aos anos
90 pelo fato da distribuicao a posteriori em muitas situacoes praticas serem
analiticamente intrataveis. Nas ultimas decadas varios metodos numericos
foram propostos visando ultrapassar essa limitacao, nomeadamente, os metodos
baseados em aproximacoes assintoticas, aproximacoes de Laplace, aprox-
imacoes via quadratura Gaussiana e metodos baseados em simulacao es-
tocastica. Boas descricoes desses metodos podem ser encontradas em Tan-
ner (1996) e Gamerman (1997). Mas a aplicacao dos medodos Bayesianos
comecou realmente a se difundir apos a introducao dos metodos de Monte
Carlo via Cadeias de Markov, de onde destacam-se o amostrador de Gibbs e
o algoritmo de Metropolis-Hastings.
14
2.2.1 Amostrador de Gibbs
Geman e Geman (1984) propuseram um esquema de amostragem uma dis-
tribuicao2 explorando as distribuicoes condicionais completas atraves de um
algoritmo iterativo que define uma cadeia de Markov. Embora esse trabalho
fosse de conhecimento de parte da comunidade cientıfica estatıstica, este ar-
tigo foi destinado a area de processamentos de imagens e foi publicado em
revista da area. Isso provavelmente levou ao atraso de sua apreensao e com-
preesao pela comunidade como uma tecnica poderosa de abordagem de pro-
blemas dos mais variados de estatıstica Bayesiana. Esse erro de desenvolvi-
mento foi reparado pelo trabalho de Gelfand e Smith (1990) que comparam
o amostrador de Gibbs com outros esquemas de simulacao estocastica.
O amostrador de Gibbs, ( Geman e Geman, 1984), e essencialmente
um esquema amostral de uma cadeia de Markov cujo nucleo de transicao e
formado pelas condicionais completas. Para descrever o algoritmo, suponha
que a distribuicao de interesse e a distribuicao a posteriori p(θ|x) com θ =
(θ1, . . . , θS) e considere tambem que todas as condicionais completas a pos-
teriori p(θi|, θ−i, x) i = 1, . . . , n estejam disponıveis e que sabe-se gerar
amostras de cada uma delas. Portanto, o esquema de amostragem e dado
por:
2A distribuicao que Geman e Geman estavam interessados chama-se distribuicao de
Gibbs, que da nome ao amostrador, usada em Mecanica Estatıstica e tem a seguinte
forma
f(x1, . . . , xn) ∝ exp[− 1
kTE(x1, . . . , xn)
]
onde k e uma constante positiva, T e a temperatura e E e a energia do sistema, funcao
positiva.
15
Amostrador de Gibbs
I - Inicialize θ(0) = (θ(0)1 , . . . , θ
(0)S ) e k = 1
II - Obtenha um novo valor para θ(k) a partir de θ(k−1) atraves de
sucessivas geracoes de valores. Para i = 1 ate S, faca:
gere um valor para θ(k)i de
θ(k)i ∼ p(θi|θ(k)
1 , . . . , θ(k)i−1, θ
(k−1)i+1 , . . . , θ
(k−1)S , x)
III - Faca k = k + 1 e volte para II e repita o procedimento ate
alcancar a convergencia.
A medida que o numero de iteracoes aumenta, a cadeia se aproxima
da sua distribuicao de equilıbrio. Assim, assume-se que a convergencia e
atingida em uma iteracao cuja a distribuicao esteja proxima da distribuicao
de equilıbrio, p(θ|x), e nao no sentido formal e inatingıvel do numero de
iteracoes tendendo ao infinito.
2.2.2 Algoritmo de Metropolis-Hastings
O algoritmo de Metropolis foi apresentado inicialmente por Metropolis et
al. (1953) e generalizado por Hastings (1970) resultando no algoritmo de
Metropolis-Hastings. Esse metodo e usado geralmente quando e difıcil gerar
amostras da condicional completa a posteriori . Neste caso, gera-se valores
do parametro a partir de uma distribuicao proposta e esse e aceito ou nao
com uma certa probabilidade de aceitacao.
Para descrever o algoritmo, suponha que a distribuicao de interesse e a
16
distribuicao a posteriori p(θ|x) com θ = (θ1, . . . , θS). Considere tambem que
todas as condicionais completas a posteriori p(θi|θ−i, x). i = 1, . . . , n estejam
disponıveis mas nao se sabe gerar amostras diretamente de cada uma e que
amostras de um novo valor de θi serao geradas a partir de uma distribuicao
proposta condicional ao valor atual de θi, q(θ(p)i |θ(a)
i ), onde θ(p)i e o valor
proposto e θ(a)i e o valor atual3, para i = 1, . . . , n. Portanto o esquema de
amostragem e dado por:
Algoritmo de Metropolis-Hastings
I - Inicialize θ(0) = (θ(0)1 , . . . , θ
(0)S ) e k = 1
II - Obtenha um novo valor para θ(k) a partir de θ(k−1) atraves de
sucessivas geracoes de valores. Para i = 1 ate S, faca:
(i) Gere uma proposta para θ(k)i de
θ(p)i ∼ q(θi|θ(k−1)
i )
(ii) Aceite a proposta com probabilidade de aceitacao dada
por
α = min
1,
p(θ(p)i |θ(a)
i , x)q(θ(k−1)i |θ(p)
i )
p(θ(k−1)i |θ(a)
i , x)q(θ(p)i |θ(k−1)
i )
onde θ(a)−i = (θ
(k)1 , . . . , θ
(k)i−1, θ
(k−1)i+1 , . . . , θ
(k−1)S ).
III - Faca k = k + 1 e volte para II e repita o procedimento ate
alcancar a convergencia.
O algoritmo de Metropois-Hastings e bastante geral, e pode, pelo menos
3Entenda por valor atual o valor de θ exatamente antes da proposta ser gerada, ou
seja, o valor atualizado da iteracao anterior.
17
em princıpio, ser implementado com qualquer distribuicao condicional com-
pleta a posteriori e para qualquer proposta. Entretanto sob o ponto de vista
pratico, a escolha da proposta e crucial para o bom desenvolvimento do
algoritmo, ou seja, para sua convergencia para a distribuicao a posteriori.
Algumas propostas mais comuns sao:
Cadeias Simetricas:
Quando a distribuicao proposta e simetrica em torno da iteracao ante-
rior, isto e, q(θ(p)i |θ(k−1)
i ) = q(θ(k−1)i |θ(p)
i )
α = min
1,
p(θ(p)i |θ(a)
−i , x)
p(θ(k−1)i |θ(a)
−i , x)
Dentre as cadeias simetricas destaca-se o passeio aleatorio, θ(p)i =
θ(k−1)i + e, onde e tem um distribuicao simetrica em torno zero.
Cadeias independentes
Quando a proposta nao depende do passo anteriori, ou seja, q(θ(p)i |θ(k−1)
i ) =
q(θ(p)i ), e a probabilidade de aceitacao e dada por
α = min
1,
p(θ(p)i |θ(a)
−i , x)q(θ(k−1)i )
p(θ(k−1)i |θ(a)
−i , x)q(θ(p)i )
Um caso particular de cadeias independentes e quando a distribuicao
proposta e a distribuicao a priori para θi, neste caso a probabilidade
de aceitacao e dado somente pela funcao de verossimilhanca, isto e,
α = min
1,
p(x|θ(p)i , θ
(a)−i )
p(x|θ(k−1)i , θ
(a)−i )
Um outro caso particular de cadeias independentes e quando a dis-
tribuicao proposta e a propria condicional completa a posteriori, isto
18
e, q(θ(p)i ) = p(θ
(p)i |θ(a)
−i , x). Fazendo isto, a probabilidade de aceitacao
e igual a um. Gerar da condicional completa e aceitar sempre em um
algoritmo iterativo e a definicao do amostrador de Gibbs, portanto o
amostrador de Gibbs e um caso particular do algoritmo de Metropolis-
Hastings.
Para maiores informacoes veja em Gilks et al. (1996), onde sao apre-
sentados conceitos e resultados com aplicacoes dos metodos de simulacao de
Monte Carlo via Cadeias de Markov em inferencia Bayesiana e nao-Bayesiana.
2.2.3 Verificacao de Convergencia
Os metodo de MCMC sao uma otima ferramenta para resolucao de muitos
problemas praticos na analise Bayesiana. Porem, algumas questoes rela-
cionadas a convergencia nestes metodos ainda merecem bastante pesquisa.
Uma questao que pode surgir e “Quantas iteracoes deve ter o processo de
simulacao para garantir que a cadeia convergiu para o estado de equilıbrio?”
A resposta definitiva para esta questao podera nunca ser dada, visto que a
distribuicao estacionaria sera na pratica desconhecida, mas pode-se sempre
avaliar a convergencia das cadeias detectando problemas fora do perıodo de
aquecimento4. Para eliminar uma possıvel auto-correlacao das cadeias sele-
ciona a partir do burn-in a cada k iteracoes, o tamanho de k sera chamado
de lag.
Uma analise de convergencia em metodos de simulacao pode ser feita
preliminarmente analisando os graficos ou medidas descritivas dos valores
4O perıodo de aquecimento limitado superiormente pelo burn-in, onde burn-in e a
iteracao tal que acredita-se que a partir dela a cadeia convergiu.
19
simulados da quantidade de interesse, θ. Os graficos mais frequentes sao o
grafico de θ ao longo das iteracoes e um grafico da estimativa da distribuicao
a posteriori de θ, por exemplo um histograma ou uma densidade kernel. As
estatısticas usuais sao a media, o desvio padrao e os quantis (2,5%; 50%;
97,5%).
Uma segunda fase de avaliacao de convergencia em metodos de MCMC
faz-se usando algumas tecnicas de diagnostico de convergencia. As tecnicas
mais populares sao: Geweke (1992) que usa resultados baseados em analise
espectral, Heidelberger e Welch (1983) que tambem usa resultados baseados
em analise espectral, Raftery e Lewis (1992) que permite calcular quantas
iteracoes sao necessarias para uma cadeia atingir a distribuicao estacionaria
atraves da estimacao de quantis a posteriori com uma precisao previamente
fixada e Gelman e Rubin (1992) que usa resultados baseados na analise de
variancia classica para duas ou mais cadeias simuladas com valores inici-
ais diferentes. Estes metodos e outros foram comparados no trabalho de
Cowles e Carlin (1996), onde se chegou a conclusao de que nao se pode
afirmar qual deles e o mais eficiente. As tecnicas de Geweke, Heidelberger-
Welch, Raftery-Lewis, Gelman-Rubin e outras estao implementadas no pa-
cote CODA ( Cowles et al., 1997) executavel no freeware R.
2.3 Modelos Dinamicos
Nesta secao sera feita uma introducao aos modelos dinamicos, uma ampla
classe de modelos com parametros variando no tempo, adequados a mode-
lagem de series temporais e regressao.
20
Os modelos dinamicos foram apresentados por Harrison e Stevens (1976)
e estao bem estruturados em West e Harrison (1997).
Os modelos lineares dinamicos sao caracterizados por duas equacoes: a
equacao de observacao dada por
Yt = Ftβt + εt, εt ∼ N(0, σ2t ) (2.1)
e pela equacao de sistema dada por:
βt = Gtβt−1 + ut, ut ∼ N(0, Ut) (2.2)
onde no instante t, Yt denota a serie de observacoes independentes condi-
cionalmente em θt e σ2t , Ft e um vetor de constantes conhecidas (variaveis
explicativas), βt = (β1t, . . . , βpt)T e um vetor-coluna com p coeficientes, Gt
e uma matriz de termos conhecidos que define a evolucao sistematica dos
parametros, εt e ut sao erros mutuamente independentes e, σ2t e Ut, as
variancias dos erros associados a observacao e ao vetor de parametros, res-
pectivamente. O modelo e completado com a seguinte distribuicao a priori:
β1|D1 ∼ N(m1, C1), onde D0 e a informacao relevante a priori sobre β1.
Em resumo, um modelo linear dinamico fica completamente especifi-
cado pela quadrupla {Ft, Gt, σ2t , Ut}. Note que os modelos de series tempo-
rais sao caracterizados por Ft = F e Gt = G, ∀t e os modelos estaticos de
regressao sao caracterizados por Gt = Ip e Ut = 0.
Uma das principais caracterısticas de um modelo linear dinamico e
que a cada instante de tempo as informacoes existentes sao descritas pela
distribuicao a posteriori do vetor de estado βt. Em cada instante de tempo,
os seguintes passos sao feitos: evolucao, previsao e atualizacao. No modelo
{Ft, Gt, σ2t , Ut} com priori β1|D1 ∼ N(m1, C1) a dinamica e dada por:
21
Evolucao - De (2.1) tem-se que a distribuicao a priori em t e:
βt|Dt−1 ∼ N(at, Rt) (2.3)
onde at = Gtmt e Rt = GtCt−1GTt + Ut.
Previsao - De (2.3) chega-se que a distribuicao preditiva um passo a frente
e:
yt|Dt−1 ∼ N(ft, Qt) (2.4)
onde ft = Ftat e Qt = FtRtFT + σ2
t .
Atualizacao - Usando a verossimilhanca (2.1), a priori (2.3) e o Teorema
de Bayes tem-se que
βt|Dt ∼ N(mt, Ct) (2.5)
onde
Dt = {yt, Dt−1},mt = at + RtF
Tt (Qt + Vt)
−1(yt − ft),
Ct = Rt −RtFTt (Qt + Vt)
−1FtRTt .
Suponha que sejam feitas S observacoes do experimento Y , isto e, Y =
(Y1, . . . , YS). Suponha tambem o modelo {1, 1, σ2, U}, ou seja,
Yj = βj + ej, ej ∼ N(0, σ2), (2.6)
βj = βj−1 + uj, uj ∼ N(0, Uj), j = 2, . . . , S (2.7)
onde Uj = Ubj, bj e um valor conhecido e, completando o modelo β1 ∼N(m,C).
22
Desta forma a distribuicao conjunta a priori pra β = (β1, . . . , βp)T e
dada por
p(β) = p(β1)S∏
i=2
p(βi|βi−1)
∝ exp{−1
2(β −m)T Λ(β −m)
}(2.8)
que e o nucleo da distribuicao normal multivariada, ou S-variada, com media
m e matriz de variancias Λ−1, denotada por
β ∼ NS(m, Λ−1) (2.9)
onde
m = (m, . . . , m)T e (2.10)
Λ =
1C
+ 1b1U
− 1b2U
. . . 0 0
− 1b2U
1b2U
+ 1b3U
. . . 0 0
0 − 1b3U
. . . 0 0...
......
...
0 0 . . . 1bS−1U
+ 1bSU
− 1bSU
0 0 . . . − 1bSU
1bSU
. (2.11)
2.4 Geoestatıstica
Com o crescimento das tecnicas de georeferenciamento, os bancos de da-
dos mais atuais contem entre outras informacoes a posicao espacial das ob-
servacoes. Esta posicao espacial pode ser contınua, com a posicao exata de
cada indivıduo, onde se tem as suas coordenadas geograficas ou a posicao
espacial, determinada por alguma regiao que contenha esse indivıduo, por
exemplo bairro, munıcipio, estado, etc. Esta informacao espacial em deter-
23
minados estudos e relativamente barata de ser obtida. Por exemplo, em uma
pequisa medica saber o endereco do paciente e bastante simples.
Dados com informacao espacial vem sendo amplamente estudados em
problemas de estatıstica aplicada (Cressie, 1993), pois em muitas situacoes a
posicao espacial pode influenciar o resultado do evento de interesse. Os mo-
delos que incorporam alguma informacao espacial visam explicar de alguma
forma essa “influencia” no resultado do evento de interesse. O conjunto de
tecnicas estatısticas para modelar dados com informacao espacial e conhecido
por Estatıstica Espacial.
A Estatıstica Espacial considera os valores amostrais como sendo real-
izacoes de funcoes aleatorias com distribuicao no espaco e, nesse caso, o valor
de um ponto e funcao da sua posicao na regiao de estudo. Outro fator que
tambem e levado em consideracao na estatıstica espacial e a posicao relativa
dos pontos amostrados. Assim, a similaridade entre valores amostrais e quan-
tificada em funcao da distancia entre amostras, representando tal relacao o
fundamento desse campo especial da estatıstica aplicada.
Segundo Cressie (1993), existem tres grandes subdivisoes da estatıstica
espacial: Geoestatıstica, dados de area e padrao de pontos. Em Geoes-
tatıstica se tem interesse em conhecer o comportamento de algum processo
que varia continuamente na regiao de estudo. Nos Dados de Area, assim
com em Geoestatıstica, se tem interesse em conhecer o comportamento de
algum processo, mas os dados estao distribuıdos discretamente sob regiao de
interesse, ou seja, os pontos observados pertencem a sub-regioes que estao
contidas na regiao de interesse. E no Padrao de Pontos, diferente da duas
abordagens anteriores, se tem interesse em conhecer a posicao espacial na
qual um evento ira ocorrer. Nessa dissertacao o interesse e em descrever
24
o comportamento de um processo que pode ocorrer em qualquer lugar no
espaco. Portanto, sera utilizado apenas tecnicas de Geoestatıstica e Dados
de Area, dando uma enfase a primeira abordagem, pois esta abordagem sera
adotada na inferencia para o termo de fragilidade espacial.
A ideia basica de Geoestatıstica e que observacoes proximas tem com-
portamento similar e, a medida que a distancia entre as observacoes aumenta,
essa similaridade tende a diminuir. Os objetivos da analise de Geoestatıstica
sao: estimacao e previsao. A estimacao refere-se a inferencia de parametros
do processo gerador das observacoes. A previsao ou interpolacao refere-se a
inferencia em locais nao-observados.
Definicao 2.1 (Processos Gaussianos) A funcao W (.) assumindo valores
w(s) para s ∈ D, segue um Processo Gaussiano com funcao de media m(.) e
funcao de variancia C(., .) denotado por
W (.) ∼ PG (m(.), C(., .)) .
Se para todo s1, s2, . . . , sn ∈ D e n = 1, 2, . . ., a distribuicao conjunta de
W (s1),W (s2), . . . , W (sn) e normal multivariada com parametros dados por
E(W (si)) = m(si) e
Cov(W (si),W (sj)) = C(si, sj).
Seja W (.) um processo espacial Gaussiano estacionario isotropico5 com
media zero, mais podem ser encontrados em Cressie (1993), ou seja,
W (.) ∼ N(0, R(., .)) (2.12)
5Um processo e dito isotropico quando a estrutura de correlacao depende apenas da
distancia entre as observacoes e e a mesma em qualquer direcao.
25
para s1, s2, . . . , sn ∈ D, R(si, sj) = σ2ρ(dij), onde ρ(dij) e a funcao de cor-
relacao espacial e dij = ||si − sj|| e a distancia entre si e sj, ∀i, j.
As principais funcoes de correlacao espacial usadas em Geoestatıstica
sao: Esferica, Gaussiana, exponencial, exponencial potencia e a Matern. A
funcao de correlacao esferica e dada por
ρ(d; φ) =
1− 32
(dφ
)− 1
2
(dφ
)30 < d < φ
0 d > φ, φ > 0. (2.13)
Note que o parametro φ trunca a correlacao espacial.
A funcao de correlacao e Exponencial Potencia e dada por
ρ(d; φ, κ) = exp
{−
(d
φ
)κ}, φ > 0, κ ∈ (0, 2]. (2.14)
Essa funcao e bastante popular pois ela tem como casos particulares as funcao
Exponencial, quando κ = 1, e Gaussiana, quando κ = 2.
A funcao de correlacao Matern e dada por
ρ(d; φ, κ) ={2κ−1Γ(κ)
}−1(
d
φ
)κ
Kκ
(d
φ
), φ > 0, κ > 0, (2.15)
onde Kκ(.) denota a funcao Bessel de terceiro tipo de ordem κ.
Seja W = (W (s1),W (s2), . . . , W (sn)) uma amostra de observacoes de
um processo pertecente a uma regiao D, onde si indica a posicao espacial
do indivıduo i na regiao D e W (si) o valor do processo observado para o
indivıduo i, i = 1, . . . , n. Como a inferencia para os parametros do processo
sera feita sob o ponto de vista Bayesiano, tem-se que:
W |Σ ∼ Nn(0, Σ) (2.16)
onde Σ = σ2R, Rij = ρ(dij; θ) i, j = 1, . . . , n e θ depende da funcao de
correlacao espacial utilizada.
26
A distribuicao a posteriori dos parametros do processo gerador de W e
obtida atraves do Teorema de Bayes combinando uma distribuicao a priori
p(σ2, θ) com a verossimilhanca (2.16):
p(σ2, θ|W ) ∝ p(σ2, θ)(σ2)−n2 |R|− 1
2
× exp{− 1
2σ2W T R−1W
}(2.17)
onde |A| e o determinante da matriz A e p(σ2, θ) e a distribuicao a priori dos
parametros da estrutura espacial.
Prever valores nao observados a partir dos dados observados e um dos
objetivos da Geoestatıstica. Krige (1951) foi o pioneiro em previsao de valores
distribuıdos no espaco. Portanto a tecnica de prever valores nao observados
no espaco recebeu o nome de Krigagem. Sob o ponto de vista Bayesiano a
Krigagem e feita a partir da distribuicao preditiva.
Seja W (obs) = (W (s1), . . . , W (sn) uma amostra observada no espaco e
W (prev) = (W (sn+1), . . . , W (sn+P ) o conjunto de valores que se deseja prever.
Sera assumido que W (.) segue um processo Gaussiano Estacionario Isotropico
com media 0. Logo o par (W (obs),W (prev))T tem distribuicao normal multi-
variada com media 0 e matriz de variancias Σ = σ2R, Rij = ρ(dij; θ), {i, j} =
1, . . . , n + P , com dij = ||si − sj||, ou seja,
W (obs)
W (prev)
∼ Nn+P
0
0
, σ2
R(obs) R(obs),(prev)
R(prev),(obs) R(prev)
,
(2.18)
onde R(obs) = Rij, {i, j} = 1, . . . , n, R(obs)(prev) = Rij, i = 1, . . . , n, j =
n + 1, . . . , n + P , R(prev)(obs) = [R(obs)(prev)]T e R(prev) = Rij, {i, j} = n +
1, . . . , n + P .
Logo, usando uma propriedade da distribuicao normal multivariada a
distribuicao condicional de W (prev) dado a amostra observada e os parametros
27
da estrutura espacial (σ2, θ), e dada por
W (prev)|W (obs) ∼ NP
(µ(prev)|(obs), Σ(prev)|(obs)
)(2.19)
onde
µ(prev)|(obs) = R(prev),(obs)R(obs)−1W (obs)
e
Σ(prev)|(obs) = σ2(R(prev) −R(prev),(obs)R(obs)−1
R(obs),(prev)).
28
Capıtulo 3
Modelos Estaticos de
Sobrevivencia
Neste Capıtulo serao apresentados os procedimentos de inferencia sob o ponto
vista Bayesiano para o modelo de Cox. A funcao risco do modelo de Cox
se divide em um produto de outras duas funcoes, uma que depende apenas
do tempo de falha, a funcao de risco de base, e a outra funcao que depende
apenas das covariaveis, ou variaveis explicativas, isto e, variaveis que nao
dependem do tempo. Alem disso, mais adiante serao apresentados mode-
los de sobrevivencia dinamicos, onde o efeito das covariaveis pode variar no
tempo. Portanto, o modelo de Cox sera chamado de Modelo Estatico de
Sobrevivencia por nao ter coeficientes dependentes do tempo. Na Secao 3.1
o Modelo Estatico de Sobrevivencia sera formalmente apresentado, explici-
tando suas quantidades desconhecidas: os coeficientes de regressao e a funcao
de risco de base. Serao descritos para este modelo, na Secao 3.2, os proce-
dimentos de inferencia para os coeficientes de regressao, onde sera assumida
29
uma distribuicao a priori. A funcao de risco de base, por ser uma funcao
contınua no tempo, nao permite elicitar diretamente a distribuicao a priori.
Desta forma, na Secao 3.3, a funcao de risco de base sera abordada usando
tres formulacoes distintas, a primeira usando uma modelagem parametrica,
a segunda usando processos Gama, introduzidos em analise de sobrevivencia
por Kalbfleish (1978) e, finalmente, usando processos correlacionados basea-
dos em modelos dinamicos, introduzidos em analise de sobrevivencia por
Gamerman (1991). Finalizando, na Secao 3.4 sera feito um estudo simulado
para o Modelo Estatico de Sobrevivencia.
3.1 Definicao do Modelo
O Modelo Estatico de Sobrevivencia, ou Modelo de Cox, vem sendo ampla-
mente utilizado em estatıstica aplicada, principalmente na area biomedica.
Ele foi proposto por Cox (1972). Este modelo ja foi apresentado anterior-
mente e sua funcao de risco e dada em (1.12), onde se tem interesse na funcao
de risco de base, h0, e nos coeficientes de regressao, β.
A distribuicao a posteriori para β e h0 e dada atraves da atualizacao da
distribuicao a priori via Teorema de Bayes com a funcao de verossimilhanca
(1.13):
p(β, h0|[dados]) ∝ p(β, h0)n∏
i=1
(h0(ti)e
Xiβ)δi
exp{−H0(ti)e
Xiβ}
. (3.1)
Sera assumido que β e h0 sao independentes a priori. Portanto, p(β, h0) =
p(β)p(h0). Essas distribuicoes a priori serao exploradas a seguir. Outro de-
talhe importante, a distribuicao a posteriori (3.1) nao possui forma analıtica
fechada portando um esquema de amostragem via MCMC sera utilizado.
30
Nas proximas secoes sera descrito como obter as condicionais completas a
posteriori de β e h0.
3.2 Coeficientes de Regressao
Os coeficientes de regressao serao modelados com a suposicao de que eles nao
dependam do tempo, esta e uma imposicao do proprio modelo. A distribuicao
a priori para os coeficientes de regressao e dada por
p(β) ∝ exp{−1
2(β −m)T V −1(β −m)
}(3.2)
onde p(β) e o nucleo da funcao de densidade da distribuicao Normal com
media m e variancia V . Os hiperparametros m e V sao valores conhecidos que
descrevem o conhecimento subjetivo que se tem a priori do comportamento
dos coeficientes. Uma priori nao informativa e dada quando aumenta-se as
variancias da priori indefinidamente.
A condicional completa dos coeficientes de regressao e obtida atraves da
combinacao da priori (3.2) com a verossimilhanca (1.10) usando o Teorema
de Bayes
p(β| · · ·) ∝ exp{−1
2(β −m)T V −1(β −m)
}
× exp
{n∑
i=1
[Xiβδi −H0(ti)e
Xiβ]}
(3.3)
onde p(θ| · · ·) define a distribuicao condicional completa a posteriori do parametro
θ.
Note que a distribuicao (3.3) nao e uma distribuicao conhecida, isto e,
nao se sabe gerar amostras diretamente dela. Portanto, os coeficientes serao
31
gerados conjuntamente atraves do seguinte passeio aleatorio como proposta
β(p) = β(a) + u, u ∼ N(0, Vβ), (3.4)
onde β(p) e o vetor de coeficientes propostos, β(a) e o vetor coeficientes da
iteracao atual. O valor proposto sera aceito ou nao de acordo com a pro-
babilidade de aceitacao dada pelo mınimo entre 1 e a razao das condicionais
completas, (3.3), de β(p) e β(a).
3.3 Funcao de Risco de Base
Como a funcao h0 e uma funcao contınua, nao e possıvel especificar uma
distribuicao diretamente para ela. Logo se faz necessario o uso de tecnicas
indiretas para estimar a funcao de risco de base. Essas tecnicas podem ser
parametricas que visam diminuir o numero de parametros a ser estimados
para que a funcao de risco de base fique bem especificada ou nao-parametricas
que visam dar mais flexibilidade ao modelo, sendo desnecessario supor a dis-
tribuicao dos tempos de falha. Na abordagem parametrica sera utilizada
a distribuicao Weibull, por ser simples e mais flexıvel que a distribuicao
exponencial. A abordagem nao-parametrica e mais flexıvel que a abor-
dagem parametrica, consequentemente e mais robusta. Nessa abordagem
serao utilizados os processos Gama com incrementos independentes. Uma
terceira abordagem que e uma mistura entre as abordagens parametrica e
nao-parametrica, pois e especificada uma distribuicao Exponencial por Partes
para o tempo de base, como na abordagem parametrica. Por ser uma dis-
tribuicao onde o numero de parametros pode ser muito grande, essa aprox-
imacao para a funcao de risco pode ser tambem considerada uma abordagem
nao-parametrica.
32
Quando se usa uma modelagem nao-parametrica para a funcao de risco
de base e para os coeficientes de regressao uma modelagem parametrica, o
modelo e dito semi-parametrico. Uma boa revisao de modelos semi-parametricos
para varios tipos de dados de sobrevivencia pode ser encontrada em Sinha e
Dey (1997).
3.3.1 Processos Parametricos
Os processos parametricos sao aqueles onde se conhece a distribuicao de
base, ou seja, conhece-se a forma da funcao de risco de base, esta depende
de um conjunto finito de parametros que precisam ser estimados. Dentre as
distribuicoes usuais, tem-se a distribuicao exponencial cuja funcao de risco e
dada por
h(t) = λ, λ > 0. (3.5)
Note que a distribuicao exponencial tem funcao de risco constante. E a
funcao mais simples em termos matematicos, mas em contra-partida nao se
adequa bem a situacoes praticas.
Um distribuicao mais flexıvel que a distribuicao exponencial e a dis-
tribuicao Weibull, proposta por Weibull (1951) em estudos de tempo de
falha devido a fadiga de metais. Ela tem a propriedade da funcao de risco
ser monotona, isto e, ela e crescente, decrescente ou constante. Logo a dis-
tribuicao exponencial e um caso particular. A funcao de risco da log-normal
e dada por
h(t) = αλtα−1, {α, λ} > 0. (3.6)
Se α = 1 tem-se a distribuicao exponencial com parametro λ.
Assim como a distribuicao Weibull, a distribuicao log-normal e muito
33
utilizada para descrever tempo de vida de produtos e indivıduos. A funcao
de risco nao tem forma analıtica fechada, mas o comportamento da funcao
risco e que a medida que aumenta o tempo a funcao de risco cresce, atinge
um valor maximo e depois decresce.
Por ser mais flexıvel que a distribuicao exponencial e ter forma fechada,
sera assumido que o tempo de base segue uma distribuicao Weibull com
parametros α e λ, forma e escala respectivamente. Vale lembrar que nada
impede o uso de outras distribuicoes como exponencial, log-normal ou qual-
quer outra distribuicao parametrica. Portanto, a funcao de risco de base e
dada por
h0(t) = αλtα−1, {α, λ} > 0. (3.7)
Substituindo (3.7) em (1.13) temos que
L(α, λ, β) =n∏
i=1
(αλtαi eXiβ
)δi
exp{−λtαi eXiβ
}. (3.8)
Sera assumido a priori que os parametros da distribuicao Weibull seguem
a seguinte distribuicao
α ∼ Gama(aα, bα) (3.9)
λ ∼ Gama(aλ, bλ), (3.10)
onde X ∼ Gama(a, b), significa que X tem distribuicao Gama com parametros
a > 0 e b > 0, tal que E(X) = ab
e V (X) = ab2
e o nucleo da funcao de densi-
dade e dado por p(x) ∝ xa−1 exp{−bx}. Os hiperparametros da distribuicao
a priori, (aα, bα, aλ, bλ), sao escolhidos de acordo com o conhecimento que se
tem a priori sobre α e λ.
Combinando as prioris (3.9) e (3.10) com a verossimilhanca (3.8) atraves
34
do Teorema de Bayes tem-se a seguinte condicional completa:
p(α, λ| · · ·) ∝ αaα−1e−bααλaλ−1e−bλλ
∝n∏
i=1
(αλtαi )δi exp{−λtαi eXiβ
}. (3.11)
Desta forma, a condicional completa de λ e dada por
p(λ| · · ·) ∝ λaλ+∑n
i=1δi−1 exp
{−λ
(bλ +
n∑
i=1
tαi eXiβ
)},
que e o nucleo da distribuicao Gama. A condicional completa de α e dada
por
p(α| · · ·) ∝ αaα−1e−bααn∏
i=1
(αλtαi )δi exp{−λtαi eXiβ
}. (3.12)
A distribuicao (3.12) nao e uma distribuicao conhecida. Portanto, α sera
gerado da seguinte forma
log(α(p)) = log(α(a)) + u, u ∼ N(0, Vα), (3.13)
onde a funcao de densidade de α(p) dado α(a) e
p(α(p)|α(a)) ∝ exp{− 1
2Vα
(α(p) − α(a))2}
1
α(p).
O valor proposto para α sera aceito com probabilidade dada pelo mınimo
entre 1 e p, onde p e dado por
p =p(α(p)| · · ·)p(α(a)|α(p))
p(α(a)| · · ·)p(α(p)|α(a))
=p(α(p)| · · ·)α(a)
p(α(a)| · · ·)α(p). (3.14)
3.3.2 Processos Gama
Nesta secao sera apresentada uma aproximacao nao-parametrica para a funcao
de risco de base acumulada H0(t). Esta aproximacao foi proposta por Kalbfleisch(1978)
35
e diz que a priori H0(t) e um processo que
E(H0(t)) = H∗(t), uma funcao positiva conhecida,
V (H0(t)) =H∗(t)
c,
e os incrementos dH0(t) sao independentes e seguem uma distribuicao Gama
com parametros de forma e escala cdH∗(t) e c, respectivamente. Ou seja,
dH0(t) ∼ Gama(cdH∗(t), c),
onde a funcao dH∗(t) e a constante c sao escolhidos a priori descrevendo o
conhecimento inicial do processo. Note que Menores valores de c maior a
variabilidade do processo H0(t) a priori.
Teorema 3.1 Se dX(t) ∼ Gama(dQ(t), r), ∀t ∈ (a, b) entao
∫ b
adX(t) ∼ Gama
(∫ b
adQ(t), r
)
Prova: Usando a funcao geradora de momentos e a suposicao de que os
incrementos sao independentes tem-se que
M∫ b
adX(t)
(u) = Pt∈(a,b)MdX(t)(u)
onde P e denominado integral produto1 definido como limite de produtos
finitos, analogamente ao usual operador∫, que e definido como o limite de
somas finitas. Como dX(t) tem distribuicao Gama entao
M∫ b
adX(t)
(u) = Pt∈(a,b)
(r
r − u
)dQ(t)
=(
r
r − u
)∫ b
adQ(t)
1O uso do operador P foi introduzido em analise de sobrevivencia no trabalho de Gill
e Johansen (1990).
36
que e a funcao geradora de momentos da distribuicao Gama com parametros∫ ba dQ(t) e r. 2
Portanto, o processo a priori para H0(t) e dado por
p(dH0(t)) ∝ dH0(t)cdH∗(t)−1e−cdH0(t) (3.15)
com dH0(t) e dH0(u) independentes ∀(t, u) > 0, com t 6= u.
Esse processo e conhecido por Processo Gama com incrementos inde-
pendentes. Aqui sera chamado apenas por Processo Gama. Usando o fato
que h0(ti) = dH0(t)dt
∣∣∣t=ti
a funcao de verossimilhanca (1.13) pode ser reescrita
por
L(h0) ∝n∏
i=1
(dH0(ti)
dt
)δi
exp{−
∫ ti
0dH0(u)eXiβ
}. (3.16)
Note que os termos que dependem somente de β foram considerados con-
stantes e omitidos. Combinando a priori (3.15) com a verossimilhanca (3.16)
tem-se que no instante de falha ti a condicional completa para dH0(ti), i =
1, . . . , n e
p(dH0(ti)| · · ·) ∝ dH0(ti)cdH∗(ti)+δi−1
× exp
−dH0(ti)(c +
∑
j∈R(ti)
eXjβ)
(3.17)
e para o instante t ∈ (ti−1, ti), i = 1, . . . , n a condicional completa de dH0(t)
e
p(dH0(t)| · · ·) ∝ dH0(t)cdH∗(t)−1
× exp
−dH0(t)(c +
∑
j∈R(ti)
eXjβ)
. (3.18)
Note que (3.17) e (3.18) sao o nucleo de duas distribuicoes Gama com
parametros (cdH∗(ti) + δi, c +∑
j∈R(ti) eXjβ) e (cdH∗(t), c +∑
j∈R(ti) eXjβ),
37
respectivamente. Como (3.18) e valido para todo t no intervalo (ti−1, ti)
entao usando o Teorema 3.1 tem-se que
∫ ti
ti−1
dH0(t)| · · · ∼ Gama
c
∫ ti
ti−1
dH∗(t), c +∑
j∈R(ti)
eXjβ
(3.19)
onde R(t) e o conjunto de ındices das observacoes sob risco, ou seja, e o
conjunto de ındices das observacoes que ainda nao falharam ou nao foram
censuradas no instante de tempo t.
Note que a posteriori o processo que governa H0(t) nao e mais contınuo
como assumido a priori e os pontos de descontinuidade sao os instantes de
falha, ou seja, o processo a posteriori para H0(t) e um processo discreto com
probabilidade 1, com pontos de descontinuidade dados pelos instantes de
falha. Essa observacao foi feita por Burridge (1981).
3.3.3 Processos Correlacionados
Esta especificacao foi usada por Gamerman (1987) e aproxima a distribuicao
dos tempos de falha usando a distribuicao exponencial por partes. Esta
utiliza uma particao do eixo do tempo, ou seja, um conjunto pre-especificado
de grupos de intervalos dados por
Ii =
[0, a1], i = 1,
(ai−1, ai], i = 2, . . . , J
(aJ ,∞), i = J + 1
(3.20)
com 0 < a1 < . . . < aJ < ∞, a seguinte funcao de risco
h(t) = λi, ∀t ∈ Ii, i = 1, . . . , J, J + 1. (3.21)
38
Sera assumido que a funcao de risco de base do modelo e Exponencial
por Partes, ou seja,
h0(t) = λ0i, ∀t ∈ Ii, i = 1, . . . , J, J + 1. (3.22)
Uma outra suposicao a priori que sera feita e que o logarıtmo da funcao
de risco de base no intervalo se modifica suavemente segundo um passeio
aleatorio, ou seja,
β0i = β0(i−1) + ui, ui ∼ N(0, Ui), i = 2 . . . , J (3.23)
β01 ∼ N(m0, C) (3.24)
onde β0i = log(λ0i), i = 1, . . . , J , m0 e C podem ser especificados de tal
forma que a distribuicao de β01 seja nao informativa, Ui = biU , onde bi =
ai − ai−1 e U e o hiperparametro que mede a forca da autocorrelacao e tem
como priori:
U ∼ GamInv
(cU
2,dU
2
)(3.25)
ou seja, U tem distribuicao Gama Invertida com parametros ( cU
2, dU
2) e funcao
de densidade dada por
p(U |cU , dU) ∝ U− cU2−1 exp
{− dU
U2
}, U > 0, cU , dU > 0)
A distribuicao conjunta de β0 = (β01, . . . , β0J)T e dada como produto
das densidades obtidas de (3.23) e (3.24), que e obtida de forma similar a
(2.8), ou seja
β0 ∼ NJ
(m0, Λ
−1)
(3.26)
onde m0 = m01, 1 = (1, . . . , 1)T e a matriz de variancias Λ−1 dada por
(2.11).
39
Dividindo o eixo do tempo nos conjuntos Ii’s a funcao de verossimi-
lhanca deve ser reescrita para se adaptar a essa particao. Antes da verossimi-
lhanca ser reescrita sera apresentado um resultado apresentado por Gamer-
man (1987), o Teorema da Fatorizacao da Verossimilhanca, TFL:
Teorema 3.2 (TFL) Seja T = ((t1, δ1), . . . , (tn, δn)) uma amostra de tem-
pos de sobrevivencia com distribuicao conjunta f(t|λ) em (<+)n. Defina τ =
(a1, . . . , aJ) onde 0 < a1 < . . . < aJ < ∞, I1 = [0, a1], Ii = (ai−1, ai] i =
2, . . . , J , IJ+1 = (aJ ,∞) e aj > maxi
ti. Entao a verossimilhanca para λ apos
observar os T en∏
i=1
J∏
j=1
(λj)χij exp
{−eλj(tij − aj−1)
}
onde λj e a funcao de risco no intervalo Ij, χij e 1 se o indivıduo i falhou no
intervalo Ij e 0 caso contrario,∑
j χij = δi e tij =
aj−1 se ti < aj−1,
ti se ti ∈ Ij,
aj se ti > aj.
.
Prova em Gamerman(1987).
Usando a distribuicao exponencial por partes, a funcao de risco do
modelo de estatico de sobrevivencia (1.12) e reescrita por
h(t|X, β) = h0,j exp{Xβ}= exp{β0,j + Xβ}, ∀t ∈ Ij. (3.27)
Substituindo λi pela funcao de risco (3.27) no Teorema 3.2, a funcao
de verossimilhanca para a funcao de risco de base se torna
L(h0, β) =n∏
i=1
J∏
j=1
(eβ0j+Xiβ)χij exp{−eβ0j+Xiβ(tij − aj−1)
}(3.28)
40
Combinando a verossimilhanca (3.28) com a priori (3.26) tem-se a
condicional completa para o vetor β0
p(β0| · · ·) ∝ exp{−1
2(β0 −m0)
T Λ(β0 −m0)}
× exp
n∑
i=1
J∑
j=1
[(β0j + Xiβ)χij − eβ0j+Xiβ(tij − aj−1)
](3.29)
Note que a distribuicao (3.29) nao e uma distribuicao conhecida, isto
e, nao se sabe gerar amostras diretamente dela. Portanto, os coeficientes
β0 serao gerados conjuntamente atraves do seguinte passeio aleatorio como
proposta
β(p)0 = β
(a)0 + E, E ∼ NJ(0, kΛ−1) (3.30)
onde k e uma constante usada para controlar a probabilidade de aceitacao
no algoritmo de Metropolis-Hastings.
Como a verossimilhanca nao depende de U , a distribuicao condicional
completa de U e dada combinando a priori de U , (3.25), com a priori de β0,
(3.26), que faz o papel analogo ao da funcao de verossimilhanca, logo
p(U | · · ·) ∝ U− c∗U2−1 exp
{− d∗U
2U
}(3.31)
que e o nucleo da distribuicao Gama Invertida com parametrosc∗U2
ed∗U2
onde
c∗U = cU + J e d∗U = dU +J∑
j=2
(β0j − β0(j−1))2
3.3.4 Outros processos a priori
Ferguson (1973) e Doss (1994) usam processos Dirichlet para modelar a
funcao de distribuicao de base F0(t) gerando uma falta de interpretacao sim-
ples em termos da funcao de risco, pois h0(t) = F ′0(t)/(1− F0(t)).
41
Gelfand e Mallick (1995) usam um processo de misturas de distribuicoes
Beta para uma transformacao da funcao de risco de base acumulada, esse
processo de Misturas de Betas foi usado para modelar a funcao de risco de
base em Carlin e Banerjee (2002).
No caso contınuo, Nieto-Barajas e Walker (2002) propuseram um mo-
delo Markoviano com funcao de risco dada por
h0(t) =∫ t
0exp{−a(t− u)}dL(u) (3.32)
onde a > 0 e L(u) e um processo com incrementos independentes em [0,∞)
sem componentes Gaussianos. Nieto-Barajas e Walker (2002) obtiveram a
distribuicao a posteriori de (3.32) para varios tipos de censura e discutem a
aplicacao em casos especiais.
3.4 Estudo Simulado
Foi gerada uma amostra de tempos de sobrevivencia de um modelo Weibull
com covariaveis. O modelo e dado por
h(t|X, β, α, λ) = αλtα−1eXβ
onde X e um vetor de covariaveis.
O tamanho da amostra e de 100 observacoes com 10% de censuras a
direita do tipo aleatoria, e duas covariaveis X = (X1, X2). X1 e uma variavel
dicotomica, gerada da distribuicao Bernoulli com parametro igual 0.5, X2 e
gerada de uma variavel Normal padrao, β = (1,−1)T , α = 1 e λ = 1.
O tempo mediano de sobrevivencia e 0,2952. Na Figura 3.1 tem-se a
funcao de sobrevivencia empırica dos tempos gerados sem as covariaveis, para
42
se ter uma ideia visual de como os dados estao distribuıdos. Perceba que as
falhas se concentram em tempo baixos, no instante de tempo 2 praticamente
80% das observacoes ja saıram do estudo, ou falharam ou foram censuradas.
0 1 2 3 4 5 6
0.00.2
0.40.6
0.81.0
t
S(t)
Figura 3.1: Funcao de Sobrevivencia Empırica linha (—) e o intervalo de
confianca de 95% linha (−−).
O grafico (a) da Figura 3.2 apresenta a variavel X1 versus o tempo.
Note que quando a covariavel assume valor igual a um as falhas ocorrem com
uma frequencia maior em tempo menores do que quando a covariavel assume
valor zero, indicando que em media o risco de falha quando a covariavel
assume valor um e maior que o risco quando a covariavel assume valor zero.
O que ja se sabe que e verdade pois β1 = 1. Uma interpretacao semelhante
acontece no grafico (b) da Figura 3.2, que apresenta a covariavel X2 versus o
tempo, pois a medida que o valor da covariavel diminui as falha ocorrem em
tempo menores, indicando que o risco de falha aumenta a medida que o valor
da covariavel diminui. O que tambem sabe-se que e verdade pois β2 = −1.
A inferencia sera feita com base na amostra da distribuicao a posteriori
43
−0.5 0.0 0.5 1.0 1.5
01
23
45
6
X1
Temp
o
−3 −2 −1 0 1 2
01
23
45
6
X2
Temp
o(a) Covariavel X1 (b) Covariavel X2
Figura 3.2: Plot das covariaveis versus o tempo observado.
gerada usando um algoritmo de Metropolis-Hastings, conforme descrito na
secao 2.2.2. As condicionais completas para os coeficientes de regressao na
Secao 3.2 e as diferentes formas de abordar a funcao de risco de base sao
descritas na Secao 3.3. Para simplificar cada modelo sera referenciado por
um codigo dado por:
MES - Wb Modelo Estatico usando distribuicao Weibull
MES - PG Modelo Estatico usando Processos Gama
MES - PC Modelo Estatico usando Processos Correla-
cionados
Para cada modelagem da funcao de risco base foi gerada uma cadeia
de tamanho 50000. A amostra a posteriori foi obtida utilizando um burn-in
de 40000 e lag = 50. Foram usadas as seguintes distribuicoes a priori:
β ∼ N
0
0
;
100 0
0 100
,
para o MES-Wb
α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10
44
λ ∼ Gama(0, 5; 0, 5), E(λ) = 1, V (λ) = 2
para o MES-PG foi considerado que
H∗0 (t) =
1
10t,
c = 0, 1,
e para o MES-PC
U ∼ GamInv(2, 05; 1, 05). E(U) = 1, V (U) = 20.
As estatısticas sumarizando as amostras geradas estao na Tabela 3.1.
Pode-se percerber que os modelos estimaram bem os parametros. A con-
vergencia foi verificada informalmente atraves do traco da cadeia onde e
razoavel supor que a partir do burn-in especificado a cadeia convergiu para
todos os modelos.
Modelo Par. Real Media Desvio 2.5% 50% 97,5%
MES-Wb β1 1 1,0658 0,2314 0,6150 1,0740 1,5280
β2 -1 -1,2798 0,1454 -1,5670 -1,278 -0,9939
α 1 1,1852 0,0922 1,0140 1,185 1,379
λ 1 1,0091 0,1555 0,7205 1,005 1,356
MES-PG β1 1 1,0671 0,2423 0,6397 1,0570 1,577
β2 -1 -1,1692 0,15860 -1,4690 -1,1720 -0,8365
MES-PC β1 1 0,8585 0,2384 0,3909 0,8590 1,3140
β2 -1 -1,06910 0,1157 -1,2920 -1,0690 -0,8471
U - 0,4215 0,2242 0,1436 0,3726 0,9565
Tabela 3.1: Estatısticas descritivas das amostras a posteriori.
45
As Figuras 3.3, 3.4 e 3.5 apresentam os histogramas da distribuicao
a posteriori para todos os parametros estimados em cada modelo, Weibull,
Processos Gama e processos Correlacionados, respectivamente. Na Figura
3.3 os dois primeiros graficos sao para os coeficientes de regressao e os outros
dois para os parametros da funcao de risco de base, α e λ, respectivamente.
Na Figura 3.4 os dois graficos sao referentes aos coeficientes de regressao.
E na Figura 3.5 os graficos sao para os coeficientes de regressao e para o
parametro que mede a forca da autocorrelacao de entre os intervalos adja-
centes da funcao de risco de base dos processos correlacionados.
A Figura 3.6 (a) apresenta a funcao de risco de base estimada pelo mo-
delo Weibull, onde os pontos visualizados na parte inferior da Figura mostram
os instantes de tempo observados, para se ter uma ideia da informacao que os
dados trazem para cada intervalo. Note que apesar da estimacao do processo
nao ser constante em media, quando se olha para o intervalo de credibili-
dade o valor verdadeiro da funcao de risco, h0(t) = 1, ∀t, esta contido no
intervalo. O grafico (c) apresenta uma aproximacao2 para a funcao de risco
de base para o modelo estatico com Procesdos Gama. Como a aproximacao
e a mais simples possıvel, esta nao e suficiente para concluir-se a respeito
da funcao de risco, mas da uma ideia de seu comportamento. O grafico (e)
apresenta estimativa de β0 a posteriori dos processos correlacionados. Note
que o valor Real esperado para o comportamento de β0 e que ele fosse con-
stante em torno de zero, pois a funcao de risco gerada era constante igual a
um. A marca“|”indica o instante onde foi observado uma falha. Os graficos
(b), (d) e (f) apresentam a funcao de risco de base acumulada a posteriori
na escala logarıtmica para os modelos Weibull, processos Gama e processos
2Essa aproximacao e feita a partir da funcao de risco de base acumulada gerada, onde
h0(ti) ≈ H0(ti)−H0(ti−1)ti−ti−1
.
46
β1
Densi
ty
0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8
0.00.5
1.01.5 Priori
β2
Densi
ty
−1.6 −1.4 −1.2 −1.0
0.00.5
1.01.5
2.02.5
Priori
α
Densi
ty
1.0 1.1 1.2 1.3 1.4
01
23
45
Priori
λ
Densi
ty
0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3
0.00.5
1.01.5
2.02.5
3.03.5
Priori
Figura 3.3: Histogramas dos parametros - Weibull
β1
Density
0.4 0.6 0.8 1.0 1.2 1.4 1.6
0.00.5
1.01.5 Priori
β2
Density
−1.6 −1.4 −1.2 −1.0 −0.8
0.00.5
1.01.5
2.02.5 Priori
Figura 3.4: Histogramas dos parametros - Processos Gama
correlacionados, respectivamente. Note que nos tres modelos as inferencias
foram satisfatorias, ou seja, o valor estimado esta proximo do valor usado na
geracao dos dados.
47
β1
Densi
ty
0.4 0.6 0.8 1.0 1.2 1.4
0.00.5
1.01.5
2.0
Priori
β2
Densi
ty
−1.4 −1.3 −1.2 −1.1 −1.0 −0.9
0.00.5
1.01.5
2.02.5
3.0 Priori
U
Densi
ty
0.2 0.4 0.6 0.8 1.0 1.2 1.4
0.00.5
1.01.5
2.0
Priori
Figura 3.5: Histogramas dos parametros - Processos Correlacionados
De acordo com o criterio DIC, Spiegelhalter et al. (2002). Este criterio
de comparacao e uma medida de ajuste do modelo corrigida pela complex-
idade dada por pD e quanto menor o valor do DIC melhor ajustado esta o
modelo. A Tabela 3.4 apresentado o valor do DIC e do pD para os modelos
ajustados e o melhor modelo apontado e o parametrico.
Modelo pD DIC
MES-Wb 1,4149 75,0895
MES-PG 0,9826 79,0895
MES-PC 0,0448 91,6713
Tabela 3.2: Criterio de comparacao de modelo.
48
0 1 2 3 4 5 6
0.00.5
1.01.5
2.02.5
t
h 0(t)
MediaIC 95%Real
| ||| | ||| | || | | || || || || ||| || ||| || | ||| |||| || | || ||| | || || || || ||| || | | || || || ||| ||||| | | || | ||| |||| | | ||| | ||| ||
−4 −2 0 2
−6−4
−20
2
log(t)
log(H 0(t)
)
MédiaIC 95%Real
(a) - h0(t) MES-Wb (b) - H0(t) MES-Wb
−4 −2 0 2
050
100
150
log(t)
h 0(t)
MédiaReal
| ||| | ||| | || | | || || || || ||| || ||| || | ||| |||| || | || ||| | || || | | || ||| || | | || || || || | ||||| | | || | ||| ||| | | | || | | ||| ||
−4 −2 0 2
−6−4
−20
2
log(t)
log(H 0(t)
)
MédiaIC 95%Real
(c) - h0(t) MES-PG (d) - H0(t) MES-PG
0 1 2 3 4 5 6
−10
12
Time
β 0(t)
| ||| | ||| | || | | || || || || ||| || ||| || | ||| |||| || | || ||| | || || || || ||| || | | || || || ||| ||||| | | || | ||| ||| | | | || | | ||| ||
MediaIC 95%Real
−4 −2 0 2
−4−2
02
log(t)
log(H 0(t)
)
MédiaIC 95%Real
(e) - h0(t) MES-PC (f) - H0(t) MES-PC
Figura 3.6: Estimativas para h0(t) e H0(t) nos modelos propostos, a linha
(—) e a media a posteriori, (−−) e o intervalo de credibilidade de 95% e
(· · ·) o valor verdadeiro.
49
Capıtulo 4
Modelos de Fragilidade
Espacial
Em algumas situacoes a posicao espacial do indivıduo pode alterar a funcao
de risco. Os trabalhos de Carlin e Banerjee (2002) e Henderson et al. (2002)
apresentaram algumas situacoes em que isso ocorre. O problema e que essa
variacao espacial pode vir de fontes nao identificadas ou de fontes identifi-
cadas, porem caras1 de se obter. Portanto, nesses casos aos modelos estaticos
serao incorporados uma variavel latente com uma estrutura espacial. Essa
variavel latente com estrutura espacial e incorporada a funcao de risco do
modelo e e conhecida por Fragilidade Espacial. Neste Capıtulo serao for-
malizados os Modelos Estaticos de Fragilidade Espacial juntamente com os
procedimentos de inferencia. A funcao de risco de base e os coeficientes de
regressao serao abordados de maneira similar a abordagem usada nos mod-
elos estaticos de sobrevivencia apresentados no Capıtulo anterior. A Frag-
1Uma observacao e dita cara quando ela e de difıcil acesso ou ate mesmo impossıvel de
se obter.
50
ilidade Espacial sera abordada atraves de processos Gaussianos usados em
Geoestatıstica. A metodologia sera aplicada a dados simulados.
O termo fragilidade foi introduzido em analise de sobrevivencia por
Vaupel et al. (1979) e apos seu trabalho varias pessoas vem incorporando
aos seus modelos o termo de fragilidade. Hougaard (1995) apresentou uma
lista de distribuicoes da fragilidade baseada nas propriedades de varios mo-
delos de sobrevivencia. Clayton (1991) foi o primeiro a introduzir uma abor-
dagem Bayesiana aos modelos de fragilidade. Na abordagem Bayesiana, a
distribuicao de fragilidade mais utilizada e a Gama, devido a conjugacao.
Entretanto outras distribuicoes de fragilidade tem sido pesquisadas, como
por exemplo a famılia de distribuicoes estaveis positivas, Qiou et. al. (1999).
4.1 Por que usar modelos com Fragilidade
Espacial?
Incluir a informacao espacial no modelo e interessante pois em algumas
situacoes a posicao espacial do indivıduo pode alterar sua chance de falhar,
ou seja, indivıduos semelhantes podem ter tempos de sobrevivencia diferentes
se morarem em lugares diferentes. Por exemplo, a chance de um indivıduo vir
a ter uma doenca pulmonar e maior quando ele mora em uma regiao poluıda
do que quando ele mora numa regiao com ar puro. Isso nem sempre ocorre,
mas ao se modelar os dados com uma estrutura espacial essa relacao podera
ser verificada caso a estrutura espacial seja significativa. Note que nesse
exemplo, o fator que altera a chance da pessoa ter uma doenca pulmonar e
a quantidade de poluicao na regiao onde ela mora. Porem a informacao da
51
quantidade de poluicao da regiao nao e facil de se obter. E mais ainda, pode
ser que existam outros fatores relacionados a posicao espacial que podem
estar alterando as chances de se ter a doenca, e nao estao sendo considera-
dos. Por isso, introduzir um termo de fragilidade com estrutura espacial e
interessante. Dessa forma, toda a heterogeneidade relacionada a estrutura
espacial podera ser captada na estimacao dos termos da fragilidade espacial.
O exemplo citado e fictıcio, mas existem situacoes reais onde a estru-
tura espacial foi verificada. Henderson et al. (2002) estudaram a variacao
espacial em tempos de sobrevivencia de pacientes com leucemia no noroeste
da Inglaterra. Esse conjunto de dados sera analisado nesta dissertacao mais
adiante. Carlin e Banerjee (2002) estudaram a variacao espacial em dados
de mortalidade infantial no estado de Minnesota, EUA. Em ambos os casos
foi constatada a presenca de heterogeneidade espacial.
4.2 O Modelo
Henderson et al. (2002) modelaram o termo de fragilidade espacial usando
uma distribuicao Gama Multivariada. Nesta dissertacao, toma-se o loga-
ritmo do termo de fragilidade adotado por Henderson e utiliza-se um processo
gaussiano para modela-lo, usando diretamente as tecnicas de Geoestatıstica.
O modelo de fragilidade espacial e uma extensao do modelo de fragili-
dade (1.17), onde alem de incluir ao modelo um termo com fragilidade com
alguma informacao espacial impoe-se a fragilidade uma estrutura espacial na
sua variabilidade. Sua funcao de risco e dada por
h(t|X, β, s) = h0(t) exp(Xβ + W (s)) (4.1)
52
onde s e a posicao espacial do invıduo e W (s) e a Fragilidade Espacial. Sera
assumido a priori que W (s) segue um processo Gaussiano com uma matriz
de variancias contendo a estrutura espacial.
A posicao espacial do indivıduo pode ser unica para cada indivıduo, ou
podem existir mais de um indivıduo em uma mesma posicao, onde a posicao
pode ser definida por uma regiao, por exemplo em um mesmo endereco,
bairro ou um nıvel mais agregado como cidade, municıpio, etc. Desta forma,
a funcao de verossimilhanca e construıda incorporando (4.1) em (1.10) logo
L(β, h0,W ) =R∏
r=1
nr∏
i=1
(h0(tir)e
Xirβ+W (sr))δir
exp{H0(tir)e
Xirβ+W (sr)}
(4.2)
onde tir e o instante de falha do i-esimo indivıduo da regiao r, Xir e o vetor
de covariaveis desse indivıduo, W (sr) e a fragilidade associada a regiao r das
R regioes possıveis, r = 1, . . . , R, i = 1, . . . , nr e nr e o numero de indivıduos
na regiao r. Note que regiao neste caso nao se refere necessariamente a uma
area no espaco, pode ser apenas um ponto no espaco.
Sem perda de generalidade sera assumido que cada indıviduo tem uma
posicao unica no espaco, ou seja, nr = 1 e R = n onde n e o numero de
indivıduos. portanto, a funcao (4.2) e reescrita por
L(β, h0,W ) =n∏
i=1
(h0(ti)e
Xiβ+W (si))δi
exp{H0(ti)e
Xiβ+W (si)}
(4.3)
onde ti e o tempo de falha do indivıduo i, Xi e o vetor de covariaveis desse
indivıduo e W (si) e a fragilidade espacial da regiao do indıviduo i, relem-
brando que regiao aqui tambem pode ser considerada como um ponto no
espaco.
Note que a funcao de verossimilhanca dos modelos estaticos de fragili-
dade espacial (4.3) difere da funcao de verrossimilhanca dos modelos estaticos
53
de sobrevivencia (1.13) apenas atraves do acrescimo da fragilidade espacial.
Portanto os coeficientes de regressao e a funcao de risco de base serao mode-
lados com os mesmos procedimentos definidos nas secoes 3.2 e 3.3, respecti-
vamente.
4.3 Coeficientes de Regressao
Analogamente a Secao 3.2 sera assumido uma distribuicao a priori para os
coeficientes de regressao dada pela equacao (3.2) e quando combinada com
a verossimilhanca (4.3) resulta na condicional para β completa a posteriori
p(β| · · ·) ∝ exp{−1
2(β −m)T V −1(β −m)
}
× exp
{n∑
i=1
[Xiβδi −H0(ti)e
Xiβ+W (si)]}
(4.4)
A distribuicao proposta para β sera o mesmo passeio aleatorio dado em
(3.4) com a probabilidade de aceitacao dada pelo mınimo entre 1 e a razao
entre as condicionais completas (4.4) de β(p) e β(a).
4.4 Funcao de Risco de Base
A funcao de risco de base sera abordada de forma analoga a da Secao 3.3.
Nessa Secao serao apresentados tres processos para descrever a funcao de
risco de base, os processos parametricos onde a distribuicao utilizada foi a
Weibull, os processos Gama com incrementos independentes e os processos
correlacionados usando modelos dinamicos.
54
4.4.1 Processos Parametricos
Utilizando a distribuicao Weibull com parametros α e λ, com funcao de risco
de base dada por (3.7), a funcao de verossiilhanca (4.3) e reescrita por
L(α, λ, β) =n∏
i=1
(αλtαi eXiβ+W (si)
)δi
exp{−λtαi eXiβ+W (si)
}(4.5)
Sera assumido a priori que os parametros da distribuicao Weibull seguem
as distribuicoes (3.9) e (3.10). Combinando com (4.5) a distribuicao condi-
cional completa a posteriori e dada por:
p(α, λ| · · ·) ∝ αaα−1e−bααλaλ−1e−bλλ
×n∏
i=1
(αλtαi )δi exp{−λtαi eXiβ+W (si)
}. (4.6)
Desta forma, a distribuicao condicional completa de λ e dada por
p(λ| · · ·) ∝ λaλ+∑n
i=1δi−1 exp
{−λ
(bλ +
n∑
i=1
tαi eXiβ+W (si)
)}
que o nucleo da distribuicao Gama. A condicional completa de α e dada por
p(α| · · ·) ∝ αaα−1e−bααn∏
i=1
(αλtαi )δi exp{−λtαi eXiβ+W (si)
}. (4.7)
A distribuicao (4.7) nao e uma distribuicao conhecida. Portanto, α sera
gerado usando o passeio aleatorio proposto para o logarıtmo de α dado em
(3.13) e a probabilidade de aceitacao e dada pelo mınimo entre 1 e p, onde p
e dado em (3.14) usando a distribuicao condicional (4.7).
4.4.2 Processos Gama
A descricao dos processos Gama foi dada na Secao 3.3 e sera a mesma uti-
lizada aqui, ou seja, sera considerado a priori que H0(t) segue um processo
55
Gama com incrementos indepentes. A diferenca esta na funcao de verossimi-
lhanca (3.16), pois ao se acrescentar o termo de fragilidade a nova funcao de
verossimilhanca e dada por
L(h0) ∝n∏
i=1
(dH0(ti)
dt
)δi
exp{−
∫ ti
0dH0(u)eXiβ+W (si)
}. (4.8)
Note que os termos que dependem somente de β foram considerados cons-
tantes e omitidos. Combinando a priori (3.15), que e a mesma da Secao 3.3,
com a verossimilhanca (4.8) tem-se que, no instante de falha ti, a condicional
completa para dH0(ti), i = 1, . . . , n, e
p(dH0(ti)| · · ·) ∝ dH0(ti)cdH∗(ti)+δi−1
× exp
−dH0(ti)
c +
∑
j∈R(ti)
eXjβ+W (sj)
. (4.9)
Para o instante t ∈ (ti−1, ti), i = 1, . . . , n a condicional completa de
dH0(t) e
p(dH0(t)| · · ·) ∝ dH0(t)cdH∗(t)−1
× exp
−dH0(t)
c +
∑
j∈R(ti)
eXjβ + W (sj)
. (4.10)
Usando o Teorema 3.1, tem-se que
∫ ti
ti−1
dH0(t)| · · · ∼ Gama
c
∫ ti
ti−1
dH∗(t), c +∑
j∈R(ti)
eXjβ
(4.11)
onde R(t) e o conjunto de ındices das observacoes sob risco, ou seja, o con-
junto de ındices das observacoes que ainda nao falharam ou nao foram cen-
suradas no instante de tempo t.
56
4.4.3 Processos Correlacionados
Inicialmente deve-se dividir o eixo do tempo em uma particao dada por (3.20)
com J intervalos, onde em cada intervalo sera assumido que a funcao de risco
de base e constante, ou seja, assumir uma distribuicao Exponencial por Partes
para o tempo de base. A metodologia de modelos dinamicos descrita na Secao
2.3 sera aplicada no logaritmo da funcao de risco de base. Tambem sera
assumido que o logaritmo da funcao de risco base em intervalos adjacentes
varia suavemente atraves de um processo auto-regressivo de primeria ordem
com equacao de sistema definida por (3.23) e (3.24) implicando na priori
conjunta para β0 = (β01, . . . , β0J)T dada em (3.26). A distribuicao a priori
para o parametro de suavidade U e dada por (3.25).
A especificacao a priori para os processos correlacionados e a mesma
da Secao 3.3. Assim como nos processos parametricos e nos processos Gama,
quando se inclui o termo de fragilidade a unica diferenca esta na funcao de
verossimilhanca, que e dada por
L(h0, β) =n∏
i=1
J∏
j=1
(eβ0j+Xiβ)χij exp{−eβ0j+Xiβ+W (si)(tij − aj−1)
}. (4.12)
Combinando a verossimilhanca (4.12) com a priori (3.26) tem-se a condicional
completa para o vetor β0
p(β0| · · ·) ∝ exp{−1
2(β0 −m0)
T Λ(β0 −m0)}
× exp
n∑
i=1
J∑
j=1
[(β0j + Xiβ)χij]
× exp
n∑
i=1
J∑
j=1
[−eβ0j+Xiβ+W (si)(tij − aj−1)
] . (4.13)
A distribuicao proposta para β0 sera o passeio aleatorio multivari-
ado dado em (3.30) e a distribuicao condicional completa a posteriori do
57
parametro de suavizacao, U , e dado por (3.31).
4.5 Fragilidade Espacial
Sera assumido que o termo de fragilidade espacial segue um processo Gaus-
siano estacionario isotropico com media zero, portanto
W |θ ∼ Nn (0, Σ) (4.14)
onde W = (W (s1), . . . , W (sn))T , Σ = σ2R, a matriz R carrega a estru-
tura espacial contida em s = (s1, . . . , sn)T , Rij = ρ(dij; θ), θ e o vetor de
hiperparametros da estrutura espacial e si e a posicao espacial da observacao
i = 1, . . . , n. A estrutura de correlacao espacial a ser utilizada sera a funcao
de correlacao exponencial potencia definida em (2.14), logo θ = (φ, κ) sao os
hiperparametros da estrutura de correlacao espacial.
Portanto, a estrutura de variancia espacial e dada por
Σ = σ2R, (4.15)
com
Rij = exp
{−
(dij
φ
)κ}, (i, j) = 1, . . . , n,
onde σ2 > 0, φ > 0, κ ∈ (0, 2] e dij = ||si − sj|| e a distancia Euclideana
das observacoes i e j. Lembrando que quando κ = 1 tem se a funcao de
correlacao de exponencial e quando κ = 2 tem-se a funcao de correlacao
Gaussiana.
Como priori para os hiperparametros sera utilizado:
φ ∼ Gama(aφ, bφ), aφ, bφ > 0. (4.16)
58
e
σ2 ∼ GamInv
(cσ2
2,dσ2
2
), cσ2 , dσ2 > 0. (4.17)
onde (aφ, bφ, cσ2 , dσ2) podem ser escolhidos de tal forma que as prioris se-
jam pouco informativas. Para o hiperparametro κ, devido a dificuldades
computacionais envolvendo convergencia da distribuicao a posteriori, sera
assumido uma priori degenerada, ou seja, sera assumido que κ e igual a
algum valor pre-especificado a priori.
Combinando a verossimilhanca (4.3) com a priori (4.14) usando a matriz
de variancias (4.15) tem-se a seguinte distribuicao condicional a posteriori
p(W | · · ·) ∝ exp{−1
2W T Σ−1W
}
× exp
{n∑
i=1
[δiW (si)−H0(ti)e
Xiβ+W (si)]}
(4.18)
Como (4.18) nao e uma distribuicao de facil amostragem, e necessario
propor o valor de uma distribuicao, a distribuicao proposta aqui sera um
passeio aleatorio multivariado dado por
W (p) = W (a) + E, E ∼ Nn(0, V ) (4.19)
onde W (p) e W (a) sao os valores proposto e da iteracao anterior, respectiva-
mente, para W (s). V e uma matriz de variancias que pode ser definida de
varias formas, mas destacam-se duas: kIn ou kΣ(a), onde k e uma constante
usada para controlar a probabilidade de aceitacao, In e a matriz identidade
de ordem n e Σ(a) e a matriz (4.15) com os valores da iteracao atual2 de φ e
σ2.
As condicionais completas a posteriori de (φ, σ2) sao obtidas combi-
nando (4.16) e (4.17), respectivamente, com (4.14) resultando nas seguintes
2Se o valor da iteracao atual nao estiver disponıvel, usa-se o valor da iteracao anterior.
59
condicionais completas a posteriori para φ
p(φ| · · ·) ∝ φaφ−1 exp{−bφφ}× |R|− 1
2 exp{− 1
2σ2W T R−1W
}(4.20)
e para σ2
p(σ2| · · ·) ∝ σ2−cσ22−1
exp
{− dσ2
2σ2
}
× σ2−n2 exp
{− 1
2σ2W T R−1W
}(4.21)
Para prever o valor da fragilidade em P regioes nao observadas sera
usada a distribuicao (2.18), que e uma suposicao a priori do modelo e a
distribuicao da previsao e dada por (2.19). Portanto, valores da distribuicao
prevista para regioes nao observadas podem ser gerados a partir de amostras
de fragilidades geradas para as regioes observadas, no proprio algoritmo de
MCMC.
O modelo de fragilidade espacial tem como caso particular o modelo de
fragilidade. Essa afirmacao e verificada quando a matriz R dada em (4.14)
e a identidade, ou seja, nao existe nenhuma estrutura de correlacao a priori
para os termos de fragilidade.
4.6 Estudo simulado
Nesta secao o modelo apresentado na Secao 4.2 sera aplicado a dados simula-
dos. Estes dados serao gerados a partir da distribuicao definida pela funcao
de risco abaixo:
h(ti|Xi, si) = αλtα−1i exp {Xiβ + W (si)} (4.22)
60
onde α = 1 e λ = 2 sao os parametros da funcao de risco de base Weibull,
β = (−2, 2)T e o vetor de parametros associados ao vetor de covariaveis
Xi = (X1i, X2i), onde X1i e uma variavel bernoulli com probabilidade 0,5 e
X2i e uma variavel nomal padrao, i = 1, . . . , n com n = 30. A proporcao de
censuras e 10% e a censura e do tipo aleatoria a direita. As posicoes espaciais
si’s foram geradas de forma aleatoria da regiao G = {(−3, 3) × (−3, 3)}. A
fragilidade W = (W (s1), . . . ,W (s30))T foi gerada a partir da distribuicao
normal multivariada dada por
W ∼ N30(0, Σ) (4.23)
onde Σ = σ2R, com Rij = ρ(dij; φ, κ) definida em (2.14), com φ = 1 e κ = 1,
dij = ||si − sj|| e a distancia Euclideana entre as posicoes si e sj geradas.
O tempo mediano e 0,8921, o tempo medio e 14,6850, havendo nos
dados tempos com valores de ate 140. Essas diferencas indicam a presenca
de uma grande variabilidade nos dados. A Figura 4.1 (a) apresenta a funcao
de sobrevivencia empırica incluındo todos os tempo gerados. A Figura 4.1
(b) apresenta a funcao de sobrevivencia empırica para tempos menores que
10 e foi gerada para se ter uma ideia melhor da distribuicao dos tempos
menores.
Parte dessa variabilidade e explicada por covariaveis. O grafico (a)
da Figura 4.2 apresenta a variavel X1 versus o tempo. Note que quando a
covariavel assume valor igual a zero as falhas ocorrem com uma frequencia
maior em tempo menores do que quando a covariavel assume valor um, in-
dicando que em media o risco de falha quando a covariavel assume valor um
e menor que o risco quando a covariavel assume valor zero. Essa suposicao
visual e verdadeira, pois sabe-se que β1 = −2.
61
0 20 40 60 80 100 120 140
0.00.2
0.40.6
0.81.0
t
S(t)
0 2 4 6 8
0.00.2
0.40.6
0.81.0
t
S(t)(a) Todos os dados (b) t < 10
Figura 4.1: Funcao de sobrevivencia Empırica linha (—) e o intervalo de
confianca de 95% linha (−−).
Uma interpretacao semelhante acontece na Figura 4.2 (b), que apre-
senta a covariavel X2 versus o tempo. A medida que o valor da covariavel
aumenta as falha ocorrem em tempo menores, indicando que o risco de falha
aumenta a medida que o valor da covariavel aumenta. O que tambem sabe-se
que e verdade pois β2 = 2. Note que os graficos do Figura 4.2 estao na escala
logarıtmica.
−0.5 0.0 0.5 1.0 1.5
020
4060
8010
012
014
0
X1
t
−2 −1 0 1
020
4060
8010
012
014
0
X2
t
(a) X1 (b) X2
Figura 4.2: Plot das covariaveis versus o tempo observado.
62
Outro fator que pode explicar a variabilidade dos dados e sua posicao
espacial, pois e intuitivo pensar que observacoes proximas tendem a ter ca-
racterısticas similares. A posicao espacial dos dados distribuıdos no espaco
estao na Figura 4.3. Na mesma Figura pode-se observar o valor gerado para
a fragilidade dividido por quartis, onde pode-se perceber que as observacoes
proximas tem valores similares da fragilidade. Era para ser assim, pois os
dados foram gerados com essa caracterıstica. Apesar de poucos dados, pode-
se perceber que existe uma similaridade entre valores proximos.
−4 −3 −2 −1 0 1 2 3
−3−2
−10
12
Latitude
Longitu
de
1o Q2o Q3o Q4o Q
Figura 4.3: Posicao espacial dos dados e a distribuicao da Fragilidade gerada,
o primero quartil da fragilidade esta representado por ◦, o segundo por 4, o
terceiro quartil por + e o quarto quartil por ×.
63
A inferencia sera feita com base na amostra da distribuicao a posteriori
gerada usando um algoritmo de Metropolis-Hastings descrito na secao 2.2.2.
As condicionais completas para os coeficientes de regressao na Secao 4.3, as
diferentes formas de abordar a funcao de risco de base sao descritas na Secao
4.4 e a condicional completa para a fragilidade e descrita na Secao 4.5. Para
simplificar cada modelo sera referenciado por um codigo dado por:
MEFE-Wb Modelo estatico de fragilidade usando distribuicao
Weibull
MEFE-PG Modelo estatico de fragilidade usando Processos Gama
MEFE-PC Modelo estatico de fragilidade usando Processos Cor-
relacionados
Para cada modelagem da funcao de risco base foi gerada uma cadeia
de tamanho 50000. A amostra a posteriori foi obtida utilizando um burn-in
de 40000 e lag = 50. Foram usadas as seguintes distribuicoes a priori:
β ∼ N(0; 100),
φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1
σ2W ∼ GamInv(3; 2), E(σ2
W ) = 1, V (σ2W ) = 1
para o MEFE-Wb
α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10
λ ∼ Gama(0, 5; 0, 5), E(φ) = 1, V (φ) = 2
para o MEFE-PG foi considerado que
H∗0 (t) =
t
10,
c = 0, 1,
64
e para o MEFE-PC
U ∼ GamInv(2, 05; 1, 05), E(U) = 1, V (U) = 20.
As estatısticas sumarizando as amostras geradas estao na Tabela 4.1.
Pode-se perceber que os modelos estimaram bem os parametros, isto e o
valor real esta contido no intervalo de credibilidade a posteriori. Com a
excessao do coeficiente β1 que foi subestimado nos modelos Weibull (MEFE-
Wb) e processos correlacionados (MEFE-PC). A convergencia foi verificada
informalmente atraves do traco da cadeia onde e razoavel supor que a partir
do burn-in especificado a cadeia convergiu para todos os modelos. Para
se ter um ideia visual da distribuicap da amostra da posteriori as Figuras
4.4, 4.6 e 4.5 apresentam os histogramas da distribuicao a posteriori para os
parametros estimados em cada modelo, Weibull, Processos Gama e processos
Correlacionados, respectivamente.
Na Figura 4.4 os dois primeiros histogramas sao para os coeficientes de
regressao, os dois seguintes para os parametros da funcao de risco de base, α
e λ, respectivamente, e os dois graficos seguintes os hiperparametros da frag-
ilidade espacial, σ2 e φ, respectivamente. Na Figura 4.6 os dois primeiros his-
togramas sao referentes aos coeficientes de regressao e os seguintes aos hiper-
parametros da fragilidade. Na Figura 4.5 os primeiros histogramas sao para
os coeficientes de regressao, os seguintes sao referentes aos hiperparametros
da fragilidade e o ultimo histograma para o parametro U que mede a forca
da autocorrelacao entre os intervalos adjacentes da funcao de risco de base
dos processos correlacionados.
65
Modelo Param. Real Media Desvio 2,5% 50% 97,5%
MEFE-Wb β1 -2 -4,054 0,7457 -5,513 -3,989 -2,7348
β2 2 2,9141 0,5151 1,9282 2,883 3,9952
α 1 1,348 0,1802 1,0207 1,3415 1,7101
λ 2 3,0627 1,3237 1,2396 2,776 6,4542
σ2 1 1,3322 0,6005 0,5507 1,1935 2,8305
φ 1 1,0439 0,2914 0,5734 0,9944 1,6822
MEFE-PG β1 -2 -1,603 0,5059 -2,6671 -1,5765 -0,6506
β2 2 1,4384 0,3357 0,8409 1,4155 2,1602
σ2 1 0,8978 0,3141 0,4457 0,8503 1,6333
φ 1 1,3053 0,3574 0,7023 1,279 2,087
MEFE-PC β1 -2 -3,3648 0,6313 -4,5646 -3,3430 -2,1458
β2 2 2,3415 0,3073 1,6947 2,3545 2,9505
U - 0,4306 0,2904 0,1350 0,3424 1,2250
σ2 1 0,9888 0,4178 0,3913 0,9304 1,9405
φ 1 1,0131 0,2979 0,5144 0,9804 1,6459
Tabela 4.1: Estatısticas descritivas das amostras a posteriori.
66
β1
Den
sity
−6 −5 −4 −3 −2
0.0
0.1
0.2
0.3
0.4
0.5
Priori
β2
Den
sity
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5
0.0
0.2
0.4
0.6
Priori
α
Den
sity
0.8 1.0 1.2 1.4 1.6 1.8 2.0
0.0
0.5
1.0
1.5
2.0
Priori
λ
Den
sity
0 2 4 6 8
0.0
0.1
0.2
0.3
Priori
σ2
Den
sity
0 1 2 3 4
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Priori
φ
Den
sity
0.5 1.0 1.5 2.0
0.0
0.5
1.0
1.5
Priori
Figura 4.4: Histogramas dos parametros - MEFE-Wb
67
β1
Den
sity
−6 −5 −4 −3 −2
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Priori
β2
Den
sity
1.5 2.0 2.5 3.0
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Priori
σ2
Den
sity
0.5 1.0 1.5 2.0 2.5 3.0
0.0
0.2
0.4
0.6
0.8
1.0
Priori
φ
Den
sity
0.5 1.0 1.5 2.0
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
Priori
U
Den
sity
0.0 0.5 1.0 1.5 2.0
0.0
0.5
1.0
1.5
2.0 Priori
Figura 4.5: Histogramas dos parametros - MEFE-PC
68
β1
Dens
ity
−3.5 −2.5 −1.5 −0.5 0.0
0.00.1
0.20.3
0.40.5
0.60.7
Priori
β2
Dens
ity
1.0 1.5 2.0
0.00.2
0.40.6
0.81.0 Priori
σ2
Dens
ity
0.5 1.0 1.5 2.0
0.00.5
1.01.5 Priori
φ
Dens
ity
0.5 1.0 1.5 2.0 2.5 3.0
0.00.2
0.40.6
0.81.0
1.2
Priori
Figura 4.6: Histogramas dos parametros - MEFE-PG
69
A Figura 4.7, apresenta um conjunto de graficos relacionados a funcao
de risco de base e a funcao de risco de base acumulada. O grafico (a) apre-
senta a funcao de risco de base estimada pelo modelo Weibull. Note que
apesar do processo nao ser constante em media, quando se olha para o in-
tervalo de credibilidade o valor verdadeiro da funcao de risco, h0(t) = 2, ∀t,esta contido no intervalo. O grafico (c) apresenta uma aproximacao para a
funcao de risco de base para o modelo estatico com Processos Gama. Como
a aproximacao e a mais simples possıvel, a aproximacao nao e suficiente para
concluir-se a respeito da funcao de risco, mas da uma ideia de seu comporta-
mento. O grafico (e) apresenta os valores de β0 a posteriori dos processos cor-
relacionados, onde os pontos visualizados na parte inferior da figura mostram
os instantes de tempo observados, para se ter uma ideia da informacao que
os dados trazem para cada intervalo. Note que o valor real esperado para o
comportamento de β0 e que ele fosse constante e igual a zero, pois a funcao
de risco gerada era constante igual a um. Os graficos (a),(c) e (e) contem
na sua parte inferior uma marca “|”que informa o instante onde foi obser-
vado uma falha. Os graficos (b), (d) e (f) apresentam a funcao de risco de
base acumulada a posteriori na escala logarıtmica para os modelos Weibull,
processos Gama e processos correlacionados, respectivamente. Note que nos
tres modelos as inferencias foram satisfatorias, ou seja, o valor estimado esta
proximo do valor do qual os dados foram gerados.
70
−4 −2 0 2 4
−20
24
log(t)
log(h 0(t)
)
MediaIC 95%Real
|| |||| |||| ||| ||||| || ||| || || || |
−4 −2 0 2 4
−6−4
−20
24
68
log(t)
log(H 0(t)
)
MédiaIC 95%Real
(a) - h0(t) MEFE-Wb (b) H0(t) MEFE-Wb
−4 −2 0 2 4
02
46
810
log(t)
h 0(t)
MédiaReal
|| |||| |||| ||| ||||| || ||| || || || |
−4 −2 0 2 4
−4−2
02
log(t)
log(H 0(t)
)MédiaIC 95%Real
(c) - h0(t) MEFE-PG (d) H0(t) MEFE-PG
0 20 40 60 80 100 120 140
−10
−50
5
Time
β 0(t)
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
−4 −2 0 2 4
−4−2
02
46
log(t)
log(H 0(t)
)
MédiaIC 95%Real
(e) - β0(t) = log h0(t) MEFE-PC (f) H0(t) MEFE-PC
Figura 4.7: Estimativas para h0(t) e H0(t) nos modelos propostos. A linha
contınua representa a media a posteriori da funcao estimada, a linha trace-
jada indica o interevalo de credibilidade e a linha pontilhanda o valor real da
funcao.
71
Os termos de fragilidade espacial estimados para os modelos MEFE-
Wb, MEFE-PG e MEFE-PC sao apresentados nas Figura 4.8 e 4.9, onde
pode-se verificar que os tres modelo estimaram relativamente bem o termo
de fragilidade espacial.
Os modelos MEFE-Wb e MEFE-PC tiveram suas estimativas mais
proximas do valores reais, que e visto nos Box-Plots das amostras a pos-
teriori da fragilidade para os tres modelos, pode-se pecerber que a media
da fragilidade para cada indivıduo esta bem proxima do valor real (linha
contınua ), Mas, nos Box-plots (a) e (e), referentes aos modelos MEFE-Wb e
MEFE-PC, estao melhor ajustados que o modelo MFE-PG, Box-Plot (c). O
modelo Weibull ja era esperado de se adequar melhor aos dados, pois estes
foram gerados de um modelo Weibull.
As Figuras 4.8 (b) e (d) e 4.9 (b) apresentam os quartis da amostra da
posteriori da fragilidade espacial. Apesar de poucos dados, pode-se perceber
que existe uma similaridade entre valores proximos. Esses graficos podem
ser comparados com a figura 4.3 que apresenta a distribuicao espacial da
fragilidade verdadeira e nota-se que as estimativas estao similares ao valores
Real.
72
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
−4−2
02
4
W index
W
MediaReal
−4 −2 0 2
−3−2
−10
12
Latitude
Long
itude
1o Q2o Q3o Q4o Q
(a) - Box-Plot de W no MEFE-Wb (b) - W distribuıdo no espaco MEFE-Wb
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
−2−1
01
23
4
W index
W
MediaReal
−4 −2 0 2
−3−2
−10
12
Latitude
Long
itude
1o Q2o Q3o Q4o Q
(c) - Box-Plot de W no MEFE-PG (d) - W distribuıdo no espaco MEFE-PG
Figura 4.8: Estimativas para a Fragilidade Espacial nos modelos propostos.
Nas Figuras (b) e (d) o primero quartil esta representado por ◦, o segundo
por 4, o terceiro quartil por + e o quarto quartil por ×.
73
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
−20
24
W index
W
MediaReal
−4 −2 0 2
−3−2
−10
12
Latitude
Long
itude
1o Q2o Q3o Q4o Q
(a) - Box-Plot de W no MEFE-PC (b) - W distribuıdo no espaco MEFE-PC
Figura 4.9: Estimativas para a Fragilidade Espacial nos modelos propostos.
Na Figura (b) o primero quartil esta representado por ◦, o segundo por 4,
o terceiro quartil por + e o quarto quartil por ×.
A Figura 4.10 (a) compara as estimativas da fragilidade espacial gerada
pelos modelos. Para cada modelo foi ajustada uma reta e o melhor modelo
e aquele que estiver mais proximo da reta de 45o. Os modelos MEFE-Wb
e MEFE-PC se mostraram melhores que o modelo MEFE-PG. Mas, quando
se compara so riscos relativos3 os modelos ajustados tem comportamento
semelhante.
A Tabela 4.6 apresenta os valores do DIC e do pD para os modelos
ajustados. De acordo com esse criterio o melhor modelo e MEFE-PG, apesar
de nao apresentar as melhores estimativas para a fragilidade espacial W ,
suas estimativas para os coeficientes de regressao foram as mais proximas
dos valores verdadeiros.
3O risco relativo foi calculado usando como base a fragilidade espacial do primeiro
indivıduo, ou seja, W1 e a base.
74
−2 −1 0 1 2
−2−1
01
2
W − Verdadeiro
W − E
stima
do
RealMEFE−WbMEFE−PGMEFE−PC
−1 0 1 2
−10
12
log(RR de W) − Verdadeiro
log(R
R de
W) −
Estim
ado
RealMEFE−WbMEFE−PGMEFE−PC
(a) - Frgilidade Espacial (b) - log do Risco relativo de W
Figura 4.10: Comparacao das estimativas da Fragilidade Espacial com o valor
verdeiro. Os pontos representados pelo ◦ pertencem ao modelo MEFE-Wb,
os 4s representam MEFE-PG e as +s represetam o modelo MEFE-PC.
Modelo pD DIC
MEFE-Wb 7,5675 149,0566
MEFE-PG 13,9953 86,8785
MEFE-PC 22,3951 230,4926
Tabela 4.2: Criterio de comparacao de modelo.
75
Capıtulo 5
Modelos Dinamicos de
Sobrevivencia com e sem
Fragilidade Espacial
A suposicao de riscos proporcionais pode funcionar muito bem em alguns con-
juntos de dados de sobrevivencia, mas esta suposicao pode ser forte demais
para outras situacoes. Situacoes estas onde existem efeitos de covariaveis
dependentes do tempo, como por exemplo o risco de um idoso contrair uma
doenca e sua idade, a medida que a idade aumenta, ou seja, a medida que
o tempo cresce o risco de um indivıduo idoso contrair uma doenca tambem
cresce pois seu sistema imunologico vai ficando cada vez mais deficiente.
Modelos que estendem o modelo de Cox (1.12) incluındo covariaveis
cujo o efeito variem com o tempo ja vem sendo abordados na literatura, veja
em Klein e Moeschberg (1991). Sob o ponto de vista Bayesiano, Gamerman
(1991) usa processos correlacionados a priori, e mais recentemente o trabalho
76
de Hemming e Shaw (2002) usa um algoritmo de MCMC para o modelo de
Gamerman e aplica-o a dados de tempos de sobrevivencia de indivıduos com
cancer de mama.
Os modelos que estendem o modelo de Cox (1.12) com covariaveis e
seus efeitos dependentes do tempo tem a seguinte funcao de risco:
h(t|X) = h0(t)G(X(t); β(t)) (5.1)
onde G(.; .) e uma funcao positiva, usualmente G(.; .) = exp{.; .}, X(t) e um
vetor de covariaveis e β(t) e um vetor coluna com os efeitos das covariaveis
no instante t, onde X(t) = (X1(t), . . . , Xp(t)) e β(t) = (β1(t), . . . , βp(t))T .
Sera assumido que o valor das covariaveis do modelo nao se altera ao
longo do tempo, ou que mudem de forma determinıstica, como por exemplo
a idade, pois a medida que o tempo aumenta sabe-se exatamente quanto a
idade de indivıduo aumenta, ou seja, X(t) = X, ∀t.
Na Secao 5.1 sera apresentado o modelo de sobrevivencia dinamico
onde serao apresentadas distribuicoes a priori para os efeitos e seus hiper-
parametros, as distribuicoes condicionais completas a posteriori e propostas
para o MCMC. Na Secao 5.2 sera incorporado ao modelo dinamico de sobre-
vivencia o termo de fragilidade espacial, gerando uma nova classe de modelos,
os modelos dinamicos de fragilidade espacial onde serao apresentadas as dis-
tribuicoes a priori, as condicionais completas a posteriori e propostas para
o MCMC para todos os parametros e seus hiperparametros. Finalizando o
capıtulo, um estudo simulado sera conduzido para mostrar a eficiencia do
modelo.
77
5.1 Modelo Dinamico de Sobrevivencia
Seguindo a especificao de Gamerman (1991), o eixo de tempo sera parti-
cionado da mesma forma que na Secao 3.3.3, onde foi usada a abordagem de
modelos dinamicos para estudar a funcao de risco de base. Ou seja,
Ij =
[0, a1], j = 1,
(ai−1, ai], j = 2, . . . , J
(aS,∞), j = J + 1
(5.2)
com 0 < a1 < . . . < aJ < ∞.
Sera assumido que para tempos percentes a um mesmo intervalo Ij, j =
1, . . . , J , a funcao de risco (5.1) e constante com respeito ao tempo. Portanto
h(t; X, β) = exp {β0j + Xβ.,j} , t ∈ Ij, j = 1, . . . , J. (5.3)
onde h0(t) = exp{β0j} e β.,j = (β1j, . . . , βpj)T , ∀t ∈ Ij.
Com a particao (5.2) e a funcao de risco (5.3), usando o Teorema 3.2
da pagina 40 tem-se que a funcao de verossimilhanca e dada por
L(h0, β) = exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j(tij − aj−1)
(5.4)
onde χij assume valor 1 se o indivıduo i falha no intervalo j e 0 caso contrario.
Logo∑
j χij = δi e para simplificar a notacao foram feitas as seguintes ex-
pansoes: Xi = (1, Xi) e β.,j = (β0j, β.,j)T para simplificar a notacao.
Seja a matriz de coeficientes dada por:
β =
β0,1 β1,1 . . . βp,1
β0,2 β1,2 . . . βp,2
......
...
β0,J β1,J . . . βp,J
= [β0,, β1,, . . . , βp,] (5.5)
78
Suponha que ∀i = 0, 1, . . . , p tem-se o seguinte passeio aleatorio
βi,j = βi,j−1 + ui,j, ui,j ∼ N(0, σ2i bjU) (5.6)
onde bj e conhecido e dado por (aj − aj−1) e U mede a forca da evolucao.
Completando a especificacao a priori tem-se que
βi,1 ∼ N(mi, Cσ2i ). (5.7)
Portanto,
βi,. ∼ N(mi1, σ2
i Λ−1i
)(5.8)
onde 1 = (1, . . . , 1)T , e Λi e definida em (2.11). Supondo independencia dos
ui,j’s tem-se
uj = (u0,j, . . . , up,j) ∼ N(p+1)(0, bjUΣ) (5.9)
onde Σ = diag(σ20, . . . , σ
2p).
Supondo independencia na priori (5.7) tem-se que
β.,1 = (β0,1, . . . , βp,1) ∼ N(m,CΣ) (5.10)
onde m = (m0, . . . , mp)T e C e uma escalar comum.
Daı,
β ∼ N(1⊗mT , Λ−1, Σ
)(5.11)
onde Λ−1 = Λ−10 = . . . = Λ−1
p , ou seja,
vec(β) ∼ NJ(p+1)
(mT ⊗ 1, Σ⊗ Λ−1
)(5.12)
onde vec(A) e a vetorizacao da matriz A. A funcao de densidade e dada por
p(β|U, σ20 . . . , σ2
p) = (2π)−J(p+1)/2|Σ|−J/2|Λ|(p+1)/2
× exp{−1
2tr
[(β −B)T Λ(β −B)Σ−1
]}
79
onde |A| e tr(A) sao o determinante e o traco, respectivamente, da matriz
A. Algumas propriedades da distribuicao normal matriz-variada sao encon-
tradas em West e Harrison (1997) e Dawid (1981). Para os hiperparametros
U, σ20 . . . , σ2
p serao assumidas as seguintes distribuicoes a priori
U ∼ GamInv
(cU
2,dU
2
)(5.13)
σ2i ∼ GamInv
(ci
2,di
2
), i = 0, 1, . . . , p (5.14)
Os parametros ((cU , dU), (c0, d0), . . . , (cp, dp)) sao conhecidos a priori e
descrevem a informacao inicial de seus respectivos hiperparametros.
Combinando a priori (5.11) com a verossimilhanca (5.4) atraves do
Teorema de Bayes, tem-se que a condicional completa a posteriori para β e
dada por
p(β| · · ·) ∝ p(β) exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j(tij − aj−1)
∝ exp{−1
2tr
((β −B)T Λ(β −B)Σ−1
)}
× exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j(tij − aj−1)
(5.15)
A distribuicao condicional (5.15) nao e de facil amostragem. Portanto,
e necessario propor o valor de β de alguma distribuicao, que aqui sera um
passeio aletorio matricial, ou seja,
β(p) = β(a) + E, E ∼ NJ×p+1(0, kΛ(a)−1, Σ(a))
onde k e uma constante usada para controlar a taxa de aceitacao. A probabi-
lidade de aceitacao e dada pelo mınimo entre 1 e a razao entre as condicionais
completas de β(p) e β(a), dadas por (5.15).
80
As condicionais completas dos hiperparametros sao dadas atraves da
combinacao das (5.13) e (5.14) com a verossimilhanca dos hiperparametros
(5.11), logo
p(U | · · ·) ∝ U− c∗U2−1 exp
{d∗U2U
}(5.16)
onde
c∗U = cU + (p + 1) ∗ (J − 1)
d∗U = dU +J∑
j=2
p∑
i=0
(βi,j − βi,j−1)2
2bjσ2i
e as condicionais completas para σ2i , i = 0, . . . , p sao dadas por
p(σ2i | · · ·) ∝ σ2
i− c∗
i2−1
exp
{d∗i2σ2
i
}, i = 0, . . . , p (5.17)
onde
c∗i = ci + J
d∗i = di +[(β −B)T Λ(β −B)
]i,i
e [A]i,j significa o elemento da linha i e da coluna j da matriz A.
5.2 Modelo Dinamico de Fragilidade Espacial
Em alguns casos, a posicao espacial do indivıduo pode alterar o risco desse
indivıduo falhar, como ja foi discutido no Capıtulo 4. Nesta secao o termo de
fragilidade espacial sera incorporado a funcao de risco (5.1) com covariaveis
dependentes do tempo levando a uma nova classe de modelos, os Modelos
Dinamicos de Fragilidade Espacial. Ou seja, modelos que nao supoem riscos
proporcionais por aceitarem efeitos dependentes do tempo e alem disso in-
corporam a possıvel variacao espacial entres indivıduos. A funcao de risco e
81
dada por
h(t|X, s) = h0(t) exp(X(t)β(t) + W (s)) (5.18)
onde W (s) e a fragilidade atribuıda a posicao espacial s, X(t) e um vetor de
covariaveis e β(t) e um vetor coluna com os efeitos das covariaveis no instante
t, onde X(t) = (X1(t), . . . , Xp(t)) e β(t) = (β1(t), . . . , βp(t))T . Sera assumido
que o tempo afeta apenas os efeitos das covariaveis, nao as covariaveis, ou
seja, X(t) = X, ;∀t e a funcao de risco de base sera escrita por exp{β0(t)},portanto a funcao de risco de base e dada por
h(t|X, s) = exp{β0(t) + Xβ(t) + W (s)}. (5.19)
Este modelo tem como casos particulares os modelos estaticos de sobre-
vivencia (1.12), quando β(t) = β, ∀t e W (s) = 0, ∀s, os modelos estaticos
de fragilidade espacial (4.1), quando β(t) = β, ∀t e os modelos dinamicos de
sobrevivencia (5.1), quando W (s) = 0, ∀s.
Sera assumido a mesma discretizacao do eixo do tempo usada na secao
anterior, ou seja, o eixo do tempo sera dividido em J +1 intervalos disjuntos
dados em (5.2) e tempos percentes a um mesmo intervalo Ij, j = 1 . . . , J ,
a funcao de risco (5.19) sera assumida constante com respeito ao tempo.
Portanto
h(t; X, β, s) = exp {β0j + Xβ.,j + W (s)} ∀t ∈ Ij, j = 1, . . . , J. (5.20)
onde β.,j = [β1j, . . . , βpj]T , ∀t ∈ Ij.
Com a particao (5.2) e a funcao de risco (5.20), a funcao de verossimi-
lhanca e escrita a partir da aplicacao do Teorema 3.2 com a funcao de risco
(5.20) e particao (5.2), isto e
L(h0, β,W ) = exp
n∑
i=1
J∑
j=1
χij(Xiβ.,j + W (si))− eXiβ.,j+W (si)(tij − aj−1)
(5.21)
82
onde β = (β1, . . . , βJ)T ,χij assume valor 1 se o indivıduo i falha no intervalo
j e 0 caso contrario, logo∑
j χij = δi. Para simplificar a notacao as seguintes
expansoes foram feitas: Xi = (1, Xi) e βj = (β0j, βj)T .
Note que os procedimentos de inferencia para β serao muito similares
aos procedimentos descritos na secao anterior, com a diferenca da inclusao do
termo de fragilidade. Portanto, a distribuicao a priori para β e a distribuicao
normal matriz-variada dada em (5.11) com prioris para os hiperparametros
dados em (5.13) e (5.14).
Combinando a priori (5.11) com a verossimilhanca (5.21) atraves do
Teorema de Bayes, tem-se que a condicional completa a posteriori para β e
dada por
p(β| · · ·) ∝ p(β) exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j+W (si)(tij − aj−1)
∝ exp{−1
2tr
[(β −B)T Λ(β −B)Σ−1
]}
× exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j+W (si)(tij − aj−1)
(5.22)
Como (5.22) nao e de facil amostragem e necessario propor o valor de
uma distribuicao proposta que aqui sera um passeio aleatorio matriz-variado
dado por
β(p) = β(a) + E, E ∼ NJ×(p+1)(0, kΛ(a), Σ(a))
onde k e uma constante usada para controlar a taxa de aceitacao. A probabi-
lidade de aceitacao e dada pelo mınimo entre 1 e a razao entre as condicionais
completas de β(p) e β(a), dadas por (5.22).
As condicionais completas dos hiperparametros sao dadas atraves da
combinacao das (5.13) e (5.14) com a verossimilhanca dos hiperparametros
83
(5.11). Logo as condicionais completas sao identicas a (5.16) e (5.17).
O termo de fragilidade espacial sera modelado segundo um processo
Gaussiano usado em Geoestatıstica, dado em (4.14) com estrutura de cor-
relacao espacial definida em (2.14). As distribuicoes a priori para os hiper-
parametros da estrutura espacial,φ e σ, sao dadas em (4.16) e (4.17), respec-
tivamente. O hiperparametro κ, devido a dificuldades computacionais envol-
vendo convergencia da distribuicao a posteriori, sera assumido uma priori de-
generada, ou seja, sera assumido que κ e igual a algum valor pre-especificado
a priori.
Combinando a verossimilhanca (5.21) com a priori (4.14) usando a ma-
triz de variancias (4.15) tem-se a seguinte distribuicao condicional a posteriori
W = (W (s1), . . . , W (sn))
p(W | · · ·) ∝ exp
−
1
2W T Σ−1W +
n∑
i=1
J∑
j=1
χijW (si)
× exp
−
n∑
i=1
J∑
j=1
eXiβj+W (si)(tij − aj−1)
(5.23)
Lembrando que∑
j χij = δi e que W (si) nao depende do tempo, pode-se
reescrever (5.23) da seguinte forma
p(W | · · ·) ∝ exp
{−1
2W T Σ−1W +
n∑
i=1
δiW (si)
}
× exp
−
n∑
i=1
eW (si)J∑
j=1
eXiβj(tij − aj−1)
(5.24)
Como (5.24) nao e de facil amostragem e necessario propor o valor de
uma distribuicao proposta que aqui sera um passeio aleatorio multivariado
dado em (4.19). As condicionais completas a posteriori de (φ, σ2) sao dadas
em (4.20) e (4.21).
84
Para prever o valor da fragilidade em P regioes nao observadas sera
usado a distribuicao (2.18), que e uma suposicao a priori do modelo e a
distribuicao da previsao e dada por (2.19). Portanto, valores da distribuicao
preditiva para regioes nao observadas podem ser gerados a partir de amostras
de fragilidades geradas para as regioes observadas, no proprio algoritmo de
MCMC.
5.3 Estudo Simulado
Nesta Secao os modelos apresentados nas Secoes 5.1 e 5.2 serao aplicados a
dados simulados, estes dados serao gerados a partir da distribuicao definida
pela funcao de risco abaixo:
h(ti|Xi, si) = αλtα−1i exp {Xiβ + W (si)} (5.25)
onde α = 1 e λ = 2 sao os parametros da funcao de risco de base Weibull,
β = (−2, 2)T e o vetor de parametros associados ao vetor de covariaveis
Xi = (X1i, X2i), onde X1i e uma variavel bernoulli com probabilidade 0,5 e
X2i e uma variavel nomal padrao, i = 1, . . . , n com n = 30. A proporcao
de censuras e 10% e a censura e do tipo aleatoria. As posicoes espaciais
si’s foram geradas de forma aleatoria da regiao G = {(−3, 3) × (−3, 3)}.A fragilidade W = (W (s1), . . . ,W (s30))
T foi gerada a partir da distribuicao
normal multivariada dada por
W ∼ N30(0, Σ) (5.26)
onde Σ = σ2R, com rij = ρ(dij; φ, κ) definida em (2.14), com φ = 1 e κ = 1,
dij = ||si − sj|| e a distancia Euclideana entre as posicoes si e sj geradas.
85
Estes dados sao os mesmos utilizados na Secao 4.6 e nao possuem co-
variaveis depententes do tempo, portanto espera-se que as estimativas para
para os coeficientes indiquem que os coeficientes sejam constantes ao longo
do tempo.
As estatısticas descritivas para estes dados sao dadas na Secao 4.6 e a
inferencia sera feita com base na amostra da distribuicao a posteriori gerada
usando um algoritmo de Metropolis-Hastings descrito na secao 2.2.2. As
condicionais completas sao dadas nas Secoes 5.1 e 5.2. Para simplificar, os
modelos serao referenciados por:
MDS Modelo dinamico de sobreviencia
MDFE Modelo dinamico de fragilidade espacial
Para cada modelagem da funcao de risco base foi gerada uma cadeia
de tamanho 100000. A amostra a posteriori foi obtida utilizando um burn-in
de 80000 e lag = 50. Foram usadas as seguintes distribuicoes a priori:
β.,1 ∼ N(0; diag(σ20, σ
21, σ
22))
U ∼ GamInv(2, 05; 0, 0105), E(U) = 0, 01, V (U) = 0, 002
σ2i ∼ GamInv(2, 05; 1, 05), E(σ2
i ) = 1, V (σ2i ) = 20, i = 0, 1, 2
φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1
σ2W ∼ GamInv(3; 2), E(σ2
W ) = 1, V (σ2W ) = 1.
As estatısticas sumarizando as amostras geradas estao na Tabela 5.1.
Pode-se perceber que o parametro U que mede a forca da auto-correlacao en-
tre os intervalos da particao e pequeno quando comparada ao valor verdadeiro
dos parametros (β0, β1, β2) = (log(2),−2, 2), indicando que os intervalos ad-
jacentes sao muito similares, o que ja e um indıcio de que os coeficientes sejam
constantes. Os parametros da correlacao espacial da fragilidade foram muito
86
bem estimados, com a media proxima do valor verdadeiro e os intervalos de
credibiliade contendo o valor real, que sao σ2 = 1 e φ = 1.
Modelo Param. Media Desvio 2,5% 50% 97,5%
MDS σ20 0,8275 0,7043 0,2148 0,6267 3,0944
σ21 3,4428 3,3171 0,8499 2,5670 12,0505
σ22 1,3302 0,8711 0,3644 1,1275 3,7161
U 0,0053 0,0023 0,0021 0,0049 0,0111
MDFE σ20 0,7032 0,4007 0,2248 0,6054 1,7745
σ21 1,8244 1,3658 0,4233 1,3870 5,3898
σ22 2,2924 1,9422 0,5706 1,7730 7,0774
U 0,0077 0,0047 0,0023 0,0065 0,0182
σ2 0,9823 0,3258 0,496 0,9404 1,7585
φ 1,0437 0,3038 0,5214 1,0100 1,6919
Tabela 5.1: Estatısticas descritivas das amostras a posteriori.
A convergencia foi verificada informalmente atraves do traco da cadeia
onde e razoavel supor que a partir do burn-in especificado a cadeia convergiu
para todos os modelos. Para se ter um ideia visual da distribuicao da amostra
da posteriori as Figuras 5.1 e 5.2 apresentam os histogramas da distribuicao
a posteriori para todos os hiperparametros estimados em cada modelo, MDS
e MDFE, respectivamente.
Os efeitos associados as covariaveis ao longo do tempo para os modelos
MDS e MDFE sao apresentados nas Figuras 5.3, 5.4, 5.5 e 5.6. A Figura
5.3 apresenta o logarıtmo da funcao de risco de base, pode-se perceber que o
valor verdadeiro da funcao esta contido no intervalo de credibilidade de 95%.
O efeito da covariavel X2 tambem esta contido no intervalo, Figura 5.4 (b).
87
σ02
Dens
ity
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
Priori
σ12
Dens
ity0 10 20 30 40
0.00
0.05
0.10
0.15
Priori
σ22
Dens
ity
0 1 2 3 4 5 6 7
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Priori
U
Dens
ity
0.000 0.005 0.010 0.015
050
100
150
Priori
Figura 5.1: Histogramas dos hiperparametros - Modelo Dinamico de Sobre-
vivencia
Mas, o efeito da covariavel X1 foi subestimado, Figura 5.4 (a). Possivelmente
pelo fato da presenca de fragilidade nao estar sendo considerada no modelo,
fato observado tambem observado em Henderson e Oman (1999).
As Figuras 5.5 e 5.6 apresentam os resultados a posteriori gerados pelo
88
σ02
Dens
ity
0.0 0.5 1.0 1.5 2.0 2.5
0.0
0.5
1.0
1.5
Priori
σ12
Dens
ity
0 2 4 6 8
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
Priori
σ22
Dens
ity
0 5 10 15
0.00
0.05
0.10
0.15
0.20
0.25 Priori
U
Dens
ity
0.00 0.01 0.02 0.03 0.04
020
4060
80 Priori
σW2
Dens
ity
0.5 1.0 1.5 2.0
0.0
0.2
0.4
0.6
0.8
1.0
1.2
Priori
φ
Dens
ity
0.5 1.0 1.5 2.0
0.0
0.2
0.4
0.6
0.8
1.0
1.2 Priori
Figura 5.2: Histogramas dos hiperparametros - Modelo Dinamico de Fragili-
dade Espacial
modelo dinamico de fragilidade espacial, MDFE, para os dados simulados.
A Figura 5.5 apresenta a logaritmo da funcao de risco de base, note que
apesar do valor verdadeiro da funcao nao estar contido em todo intervalo,
ela esta contida onde existe a maior parte da informacao dos dados, mesmo
89
0 20 40 60 80 100 120 140
0.00.5
1.01.5
Time
β 0
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
Figura 5.3: Logarıtmo da funcao de risco de base - MDS. A linha contınua
representa a media a posteriori da funcao estimada, a linha tracejada indica
o interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O
caracter “|” indica o instante onde foi feita um observacao.
havendo uma sub-estimacao. Figura 5.6 (a) e (b) apresentam os efeitos das
covariaveis, observe que nao houve sub e nem super estimacao dos efeitos
das covariaveis, ou seja, os intervalos de credibilidade gerados incluem os
verdadeiros valores dos efeitos.
O termo de fragilidade foi bem estimado como pode-se verificar na
Figura 5.7, onde o valor real esta proximo ao valor medio e os histogramas
dao uma ideia da variabilidade da fragilidade em cada regiao. A Figura
5.8 apresenta os quartis da amostra da posteriori da fragilidade espacial.
Apesar de poucos dados, pode-se perceber que existe uma similaridade entre
valores proximos. Esses graficos podem ser comparados com a figura 4.3 que
apresenta a distribuicao espacial da fragilidade verdadeira e nota-se que as
estimativas estao similares ao valores verdadeiros. A Figura 5.9 apresenta as
estimativas com o valor verdadeiro, na figura (a) tem a fragilidade gerada
90
0 20 40 60 80 100 120 140
−6−5
−4−3
−2−1
Time
β 1
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
(a) - Efeito da covariavel X1
0 20 40 60 80 100 120 140
0.51.0
1.52.0
2.53.0
3.54.0
Time
β 2
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
(b) - Efeito da covariavel X2
Figura 5.4: Parametros variando no tempo - MDS. A linha contınua re-
presenta a media a posteriori da funcao estimada, a linha tracejada indica o
interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O
caracter “|” indica o instante onde foi feita um observacao.
versus a fragilidade real, perceba que a reta estimada nao esta do longe do
que seria uma estiamcao otima. Na figura (b) tem-se uma comparacao das
estimativas do risco relativo tomando como base o primeiro elemento, W1.
Note que a reta estimada tambem nao esta longe do que seria o ideal.
91
0 20 40 60 80 100 120 140
−1.5−1.0
−0.50.0
0.51.0
1.5
Time
β 0
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
Figura 5.5: Logarıtmo da funcao de risco de base - MDFE. A linha contınua
representa a media a posteriori da funcao estimada, a linha tracejada indica
o interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O
caracter “|” indica o instante onde foi feita um observacao.
A Tabela 5.3 apresenta os valores do DIC e do pD para os modelos
dinamicos ajustados. De acordo com esse criterio o melhor modelo e MDFE.
O criterio apontou o modelo que era esperado, pois os dados foram gerados
de um processo que contem a fragilidade espacial.
Modelo pD DIC
MDE 4,4945 106,1899
MDFE 12,2713 97,4835
Tabela 5.2: Criterio de comparacao de modelo.
92
0 20 40 60 80 100 120 140
−4−3
−2−1
01
Time
β 1
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
(a)
0 20 40 60 80 100 120 140
−20
24
6
Time
β 2
|| |||| |||| ||| ||||||| ||| || || |||
MediaIC 95%Real
(b)
Figura 5.6: Parametros variando no tempo - MDFE. A linha contınua rep-
resenta a media a posteriori da funcao estimada, a linha tracejada indica o
interevalo de credibilidade e a linha pontilhanda o valor real da funcao. O
caracter “|” indica o instante onde foi feita um observacao.
93
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
−20
24
W index
WMediaReal
Figura 5.7: Box plot da fragilidade espacial gerada por MDFE, a linha cheia
representa o valor real e os circulo representam a media a postariori de cada
fragilidade.
−4 −2 0 2
−3−2
−10
12
Latitude
Longitu
de
1o Q2o Q3o Q4o Q
Figura 5.8: Quartis da fragilidade espacial gerada por MDFE, o primero
quartil esta representado por ◦, o segundo por 4, o terceiro quartil por + e
o quarto quartil por ×
94
−2 −1 0 1 2
−2−1
01
2
W − Verdadeiro
W − E
stima
do
RealMDFE
−1 0 1 2
−10
12
log(RR de W) − Verdadeiro
log(R
R de
W) −
Estim
ado
RealMDFE
(a) - Frgilidade Espacial (b) - log do Risco relativo de W
Figura 5.9: Comparacao das estimativas da Fragilidade Espacial do MDFE
com o valor verdeiro.
95
Capıtulo 6
Aplicacao a dados reais
Neste capıtulo serao utilizadas as metodologias propostas nos Capıtulos 3, 4
e 5 para modelar dados de sobrevivencia reais com informacao espacial. O
primeiro conjunto de dados refere-se a pessoas residentes na Inglaterra que
sofrem de Leucemia. Esse conjunto de dados foi utilizados no trabalho de
Henderson et al. (2002), e os dados foram cedidos pela professora Silvia Shi-
makura que e uma das autoras do artigo. O outro conjunto de dados contem
o tempo medio no emprego de trabalhadores da industria nos municıpios do
estado do Rio de Janeiro. Nesse conjunto de dados nao se tem a informacao
individual. O que se tem em maos e o tempo medio por municıpio. Portanto,
tem-se uma observacao para cada municıpio e sera utilizado a sede do mu-
nicıpio como localizacao espacial. Estes dados foram cedidos pelo Ministerio
do Trabalho e Emprego.
Os modelos apresentados nos Capıtulos 3, 4 e 5 serao aplicados aos
dados de Leucemia na Inglaterra na Secao 6.1. Na Secao 6.2 os modelos serao
aplicados aos dados de emprego no Rio de Janeiro. A Tabela 6 apresenta
96
uma abreviacao dos modelos que serao utilizados.
MES-Wb Modelo Estatico de Sobreviencia - Weibull
MES-PG Modelo Estatico de Sobreviencia - Processos Gama
MES-PC Modelo Estatico de Sobreviencia - Processos Correla-
cionados
MEFE-Wb Modelo Estatico de Fragilidade Espacial - Weibull
MEFE-PG Modelo Estatico de Fragilidade Espacial - Processos
Gama
MEFE-PC Modelo Estatico de Fragilidade Espacial - Processos
Correlacionados
MDS Modelo Dinamico de Sobreviencia
MDFE Modelo Dinamico de Fragilidade Espacial
Tabela 6.1: Abreviaturas para os modelos
6.1 Dados de Leucemia na Inglaterra
Foi realizado um estudo observacional de casos de leucemia mieloide aguda
(AML1) em adultos no noroeste da Inglaterra no perıodo de 1982 ate 1998,
Figura 6.1. A Figura 6.2 mostra a divisao polıtica da regiao em 24 distritos.
A Figura 6.3 apresenta a funcao de sobrevivencia empırica, onde pode
se perceber que muitas falhas (mortes), 86%, ocorrem nos 3 primeiros anos
apos o diagnostico da doenca, dando indıcios de um alto risco nos primeiros
anos de diagnostico. 16% dos casos estudados foram censurados. A posicao
1do ingles acute myeloid leukaemia.
97
100km
Lancashire
GreaterManchester
Figura 6.1: A Regiao de estudo, noroeste da Inglaterra
-0.2 0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
Blackburn
BlackpoolBurnley
Chorley
FyldeHyndburn
Lancaster
Pendle
Preston
Ribble Valley
RossendaleSouth Ribble
West Lancashire
Wyre
BoltonBury
Manchester
Oldham
Rochdale
Salford
Stockport
Tameside
Trafford
Wigan
Figura 6.2: Distritos do noroeste ingles e divisao polıtica da regiao de estudo
98
espacial das 1043 observacoes podem ser visualisadas na Figura 6.4, onde
observa-se o Sudeste e o Oeste da regiao de estudo comtemplam a maioria
dos casos. O distrito de Wigan e o que teve o maior numero de pacientes
observados, 102 pacientes.
0 1000 2000 3000 4000 5000
0.00.2
0.40.6
0.81.0
t
S(t)
Figura 6.3: Funcao de Sobrevivencia Empırica do tempo (em dias) e o inter-
valo de confianca de 95% (linha tracejada).
Figura 6.4: Distribuicao espacial dos indivıduos observados no noroeste
ingles.
99
Os dados contem, alem do tempo, quatro covariaveis que sao: idade,
sexo, numero de globulos brancos no instante do diagnostico (WBC2) e uma
medida de privacao socioeconomica (Townsend) definida por Townsend et
al. (1988) e valores baixos dessa covariavel indicam baixos indıces socioe-
conomicos. A Figura 6.5 apresenta o comportamento das covariaveis com
respeito ao tempo, pode-se perceber que em valores mais altos da idade acon-
tecem mais falhas (Figura (a)), mas este aumento no numero de falhas e bem
suave. A variavel sexo nao apresenta visualmente uma variacao nos tempo
de falha entre um sexo e outro, (Figura (b)), que pode ser um indıcio de que
o efeito desta covariavel nao e significativo. A Figura 6.5 (c) mostra que a
medida que aumenta-se o valor de WBC as falhas tende a ocorrer em tempos
menores. A Figura 6.5 (d) mostra que aumentando o indıce Townsend o
numero de falhas tambem tende a ocorrer em tempos menores, esta relacao
e bem suave.
Para verificar se os efeitos das covariaveis, visualizados na Figura 6.5 sao
significativos ou nao e quantificar, se for o caso, esse efeito, serao ajustados
os modelos descritos no Capıtulo 3. Acreditando haver um efeito espacial
nao observado atuando no processo serao ajustados os modelos descritos no
Capıtulo 4.
A inferencia sera feita com base na amostra da distribuicao a posteriori
gerada usando um algoritmo de Metropolis-Hastings. Para cada modelo foi
gerada uma cadeia de tamanho 50000. A amostra a posteriori foi obtida
utilizando um burn-in de 40000 e lag = 50. E a convergencia foi verificada
atraves do criterio de Geweke (1992). As seguintes especificacoes a priori
foram utilizadas:
2do ingles white blood cell count, truncado em 500 unidades com 1 unidade = 50×109/L.
100
20 40 60 80
010
0020
0030
0040
0050
00
X1
t
−2 −1 0 1 2
010
0020
0030
0040
0050
00
X2t
(a) Idade (b) Sexo
0 100 200 300 400 500
010
0020
0030
0040
0050
00
X3
t
−5 0 5 10
010
0020
0030
0040
0050
00
X4
t
(c) WBC (d) Townsend
Figura 6.5: Plot das covariaveis versus o tempo observado em dias.
Para os modelos estaticos,
β ∼ N(0; 100),
usando funcao de risco de base Weibull
α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10
λ ∼ Gama(0, 5; 0, 5), E(λ) = 1, V (λ) = 2
101
usando processos Gama
H∗0 (t) =
t
100,
c = 1,
usando processos correlacionados
U ∼ GamInv(2, 05; 1, 05), E(σ2U) = 1, V (σ2
U) = 20.
Para os hiperparametros da fragilidade
φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1
σ2W ∼ GamInv(3; 2), E(σ2
W ) = 1, V (σ2W ) = 1
As Tabelas 6.2 e 6.3 apresentam as estatısticas sumarizando as amostras
das distribuicoes a posteriori geradas via MCMC para os modelos estaticos
de sobrevivencia e de fragilidade espacial, respectivamente. Para os mod-
elos estaticos de sobrevivencia, Tabela 6.2, os modelos MES-Wb e MES-
PG tiveram resultados similares que indicam as variaveis idade, WBC e
Townsend quando aumentadas fazem com que o risco de falha (morte) tambem
aumenta. Entretanto, no modelo MES-PG as variaveis idade e WBC foram
significativas mas com efeito inverso aos outros dois modelos, ou seja, au-
mentando o valor dessas covariaveis o risco de falha diminui e a variavel
Townsend nao foi significativa, pois o valor zero pertence aos intervalos de
credibilidade. O resultado gerado pelo modelo MES-PG nao faz sentido na
pratica. A variavel sexo nos tres modelos estaticos de sobrevivencia nao foi
significativa.
Os resultados sumarizados para os modelos estaticos de fragilidade es-
pacial sao dados pela Tabela 6.3, com relacao aos coeficientes e ao hiper-
parametro φ da fragilidade os modelos MEFE-WB, MEFE-PG e MEFE-PC
102
Modelo Param. Media Desvio 2,5% 50% 97,5%
MES-Wb β1 0,0302 0,0018 0,0268 0,0301 0,0336
β2 0,0342 0,0313 -0,0217 0,0327 0,0885
β3 0,0029 0,0005 0,0018 0,0029 0,0037
β4 0,0254 0,0091 0,0059 0,0252 0,0414
α 0,5761 0,0138 0,5495 0,5761 0,6028
λ 0,0045 0,0006 0,0032 0,0046 0,0057
MES-PG β1 -0,0269 0,0014 -0,0299 -0,0268 -0,0244
β2 0,0409 0,0293 -0,0123 0,0383 0,0946
β3 -0,0016 0,0006 -0,0025 -0,0016 -0,0004
β4 0,0034 0,0079 -0,0111 0,0034 0,0180
MES-PC β1 0,0335 0,0024 0,0290 0,0332 0,0381
β2 0,0207 0,0358 -0,0443 0,0180 0,0996
β3 0,0034 0,0005 0,0023 0,0033 0,0044
β4 0,0343 0,0087 0,0155 0,0341 0,0507
U 0,1254 0,0396 0,0672 0,1209 0,2393
Tabela 6.2: Estatısticas descritivas das amostras a posteriori para o Modelo
Estatico de Sobrevivencia.
foram bastante similares que indicam que o risco de falha aumenta quando
se aumenta pelo menos uma das variaveis idade, WBC e Townsend. O efeito
da variavel sexo nao foi significativo. Essa interpretacao coincide com a dos
modelos estaticos de sobrevivencia: MES-WB e MES-PC que confirmam
a analise grafica preliminar. Os histogramas da amostra a posteriori dos
parametros foram omitidos devido a grande quantidade.
A Tabela 6.4 apresenta os resultados obtidos no trabalho de Henderson
103
Modelo Param. Media Desvio 2,5% 50% 97,5%
MEFE-Wb β1 0,0325 0,0018 0,029 0,0324 0,0361
β2 0,0327 0,0350 -0,0269 0,0299 0,1056
β3 0,0030 0,0005 0,0018 0,0030 0,0040
β4 0,0318 0,0075 0,0189 0,0325 0,0457
α 0,5943 0,0158 0,5651 0,5934 0,6263
λ 0,0087 0,0016 0,0066 0,0084 0,0122
σ2 0,5193 0,1599 0,2930 0,4922 0,9030
φ 0,8210 0,1022 0,5817 0,8426 0,9421
MEFE-PG β1 0,0316 0,0019 0,0283 0,0314 0,0355
β2 0,0362 0,0346 -0,0337 0,0375 0,0975
β3 0,0032 0,0004 0,0023 0,0032 0,0040
β4 0,0382 0,0100 0,0201 0,0374 0,0605
σ2 2,8770 0,7932 1,7412 2,7435 4,6146
φ 0,8869 0,0535 0,7669 0,9008 0,9469
MEFE-PC β1 0,0351 0,0018 0,0319 0,0348 0,0388
β2 0,0401 0,0331 -0,0236 0,0425 0,1035
β3 0,0035 0,0004 0,0026 0,0036 0,0043
β4 0,0357 0,0080 0,0218 0,0348 0,0510
U 0,1337 0,0459 0,0681 0,1249 0,2435
σ2 0,4923 0,1407 0,2936 0,4664 0,8559
φ 0,8083 0,1099 0,5469 0,8324 0,9455
Tabela 6.3: Estatısticas descritivas das amostras a posteriori para o Modelo
Estatico de Fragilidade Espacial.
et al. (2002) no nıvel de distrito. Perceba que as estimavas dos efeitos obtidas
pelos modelos estaticos sem fragilidade tabela 6.2 e com fragilidade tabela
104
6.3 estao proximas das obtidas no trabalho de Henderson, porem menores.
Vale salientar que a fragilidade do artigo de Henderson e Gama e neste tra-
balho e log-normal, alem disso a fragilidade no artigo e pontual tornando as
analises do termo de fragilidade bem distintas. Os hiperparametros da frag-
ilidade espacial nao sao diretamente comparaveis devido a forma que foram
abordados.
Param. Media 2,5% 50% 97,5%
β1 0,0461 0,0396 0,0460 0,0532
β2 0,0547 -0,0346 0,0548 0,1407
β3 0,0051 0,0037 0,0051 0,0065
β4 0,0525 0,0277 0,0519 0,0797
ξ 0,7291 0,4555 0,7207 1,0580
η 0,1972 0,1000 0,1818 0,4000
φ 0,2226 0,0662 0,2030 0,4600
Fonte: Henderson et. al (2002)
Tabela 6.4: Estimativas a posteriori do modelo de Henderson et al. em nıvel
de distrito usando a funcao de correlacao espacial Matern com κ = 1.
As Figuras 6.6 e 6.7 apresentam as estimativas relacionadas a funcao
de risco de base para os modelos estaticos de sobrevivencia e de fragilidade,
respectivamente. O comportamento da funcao de risco de base para mode-
los com a mesma especificacao para h0(t) sao similares. A funcao de risco
de base tem um comportamento decrescente indicando que a medida que o
tempo passa o risco de falha diminui, o que parece razoavel para dados de
cancer com um suave aumento do risco para tempos maiores, o que e esperado
na pratica. Fato observados nas estimativas dos modelos que usam proces-
105
sos Gama e procesos correlacionados, mas por uma restricao parametrica
os modelos que usam a ditribuicao Weibull nao apresentam esse aumento
no risco para valores altos tempos maiores. Outra diferenca estao nos val-
ores encontrados para a funcao de risco de base, os valores mais altos estao
associados as estimativas que usaram os processos Gama, em seguida vem
as estimativas que usaram a distribuicao Weibull e com menores valores da
funcao de risco de base3 as estimativas usando processos correlacionados.
A Figura 6.8 apresenta o box-plot das estimativas a posteriori da frag-
ilidade para os modelos MEFE-Wb, MEFE-PG e MEFE-PC. Comparando
visualmente as fragilidades estimadas para as diferentes especificacoes feitas
para h0(t) pode-se perceber que existe uma grande similaridade no compor-
tamento da fragilidade nas regioes, mas os valores da fragilidade em uma
mesma regiao sao bem distintos quando os modelos sao comparados.
As Figuras 6.9, 6.10 e 6.11 apresentam as estimativas a posteriori das
fragilidades geradas sob os modelos MEFE-Wb, MEFE-PG e MEFE-PC, re-
spectivamente. Cada uma dessas figuras contem quatro mapas, (a), (b), (c) e
(d). No mapa (a) se tem as fragilidades espaciais, W , geradas pelo respectivo
modelo, estas fragilidades podem conter valores distintos entre si, pois esses
valores dependem da especificacao da funcao de risco de base. Nos mapas
(b) e (c) sao apresentados o logaritmo dos riscos relativos tomando como
base no primeiro mapa o distrito com o maior numero de casos, Wigan, e no
segundo a base e a fragilidade media, lembrando que o risco relativo pode ser
obtido tomando a exponencial do valor estimado. O mapa (d) apresenta uma
estatıstica que ajuda visualizar quais distritos tem risco significativo, essa es-
tatıstica e dada pelo mınimo entre a probabilidade do logaritmo do risco
3Lembrando que β0(t) = log h0(t)
106
0 2 4 6 8
0.0000
0.0005
0.0010
0.0015
0.0020
0.0025
0.0030
log(t)
h 0(t)
MediaIC 95%
|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 2 4 6 8
−5−4
−3−2
−1
log(t)
log(H 0(t))
MédiaIC 95%
(a) - h0(t) MES-Wb (b) H0(t) MES-Wb
0 2 4 6 8
0.00
0.02
0.04
0.06
0.08
0.10
0.12
log(t)
h 0(t)
Média
|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 2 4 6 8
−4−2
02
4
log(t)
log(H 0(t))
MédiaIC 95%
(c) - h0(t) MES-PG (d) H0(t) MES-PG
0 1000 2000 3000 4000 5000
−16−14
−12−10
−8
Time
β 0(t)
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| | |||||||||| |||| ||| |||||| |||||| || ||||||||| |||| | || ||||| ||||||||| || | ||| | ||| |||| | |||| || | |||| || | | || |||| | | | || || | | | | | | | ||| | || | | || | | | | | | | | | | ||
MediaIC 95%
0 2 4 6 8
−8−7
−6−5
−4−3
−2−1
log(t)
log(H 0(t))
MédiaIC 95%
(e) - h0(t) MES-PC (f) H0(t) MES-PC
Figura 6.6: Estimativas para h0(t) e H0(t) nos modelos propostos.
relativo, usando a media media como base, ser maior que zero e o comple-
mentar dessa probabilidade. Ou seja, valores pequenos para essa estatıstica
107
0 2 4 6 8
0.000
0.001
0.002
0.003
0.004
0.005
0.006
0.007
log(t)
h 0(t)
MediaIC 95%
|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 2 4 6 8
−4−3
−2−1
0
log(t)
log(H 0(t))
MédiaIC 95%
(a) - h0(t) MEFE-Wb (b) H0(t) MEFE-Wb
0 2 4 6 8
0.00.5
1.01.5
log(t)
h 0(t)
Média
|||||||||||||||||||||||||| |||||||||||||||||||||| ||||||||||||||||| |||||||||||| ||||||||||| ||||||||||||| |||||||||||||| |||||||| ||||||| ||||||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 2 4 6 8
−20
24
6
log(t)
log(H 0(t))
MédiaIC 95%
(c) - h0(t) MEFE-PG (d) H0(t) MEFE-PG
0 1000 2000 3000 4000 5000
−20−18
−16−14
−12−10
−8
Time
β 0(t)
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| | |||||||||| |||| ||| |||||| |||||| || ||||||||| |||| | || ||||| ||||||||| || | ||| | ||| |||| | |||| || | |||| || | | || |||| | | | || || | | | | | | | ||| | || | | || | | | | | | | | | | ||
MediaIC 95%
0 2 4 6 8
−7−6
−5−4
−3−2
−1
log(t)
log(H 0(t))
MédiaIC 95%
(e) - h0(t) MEFE-PC (f) H0(t) MEFE-PC
Figura 6.7: Estimativas para h0(t) e H0(t) nos modelos propostos.
indicam que o log do risco daquela regiao esta longe de zero. Portanto, tem
um risco relativo significativo.
108
As Figuras 6.9, 6.10 e 6.11 mapas (a), (b) e (c) apresentam compor-
tamento cumum para as estimativas geradas para os distritos, assim como
foi verificado nos Box-plots. Os riscos mais baixos encontram-se na regiao
sudoeste, envolvendo os distritos de Blackpool, Fylde, Wyre e Preston. Os
risco mais altos nao estao agrupados numa regiao, ao norte no distrito de
Lancaster, no sul no distrito de Wigan e no leste com os distritos Pendle e
Brunley. Na regiao sudeste tem-se riscos intermediarios. O mapa (a) das
tres figuras apresenta diferentes valores estimados pelos modelos, mas isso
pode ser explicado pela especificacao a priori da funcao de risco de base,
que podem estar bem ou mal especificadas. Os mapas (b) das tres figuras
apresentam as estimativas do logaritmo do risco relativo usando como base o
distrito de Wigan. Note que o risco do distrito de Wigan estimado pelos tres
modelos pode chegar a duas4 vezes o risco de um distrito nas regioes mais
claras do mapa por exemplo Blackpool.
No mapa (c) das 6.9, 6.10 e 6.11 os valores do logaritmo do risco relativo
estao padronizados, ou seja o valor apresentado no mapa mostra o logaritmo
do risco do distrito quando comparado a um distrito que nao possui risco,
que com o auxılio do mapa (d) se tem que no modelo MEFE-Wb, Figura
6.11, os distritos de Preston, Blackpool e Burnley sao significativos e os dois
primeiros apresentam um risco menor que a media e Burnley apresenta um
risco maior que a media. No modelo MEFE-PG, Figura 6.10, somente o
distrito de Preston foi significativo e tem um risco menor que a media. E
finalmente, no modelo MEFE-PC, Figura 6.11, os distritos significativos sao
Preston e Burnley, sendo que em Preston o risco e menor que media e em
Burnley e o maior que a media.
4Sendo mais preciso: 1exp{−0,76} = 2, 13 no modelo MEFE-Wb, 2,36 no MEFE-PG e
2,32 no MEFE-PC.
109
1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23
−1.5−1.0
−0.5
W index
W
Média
(a) - MEFE-Wb
1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23
−7.5−7.0
−6.5−6.0
−5.5
W index
W
Media
(b) - MEFE-PG
1 2 3 4 5 6 7 8 9 11 13 15 17 19 21 23
−1.5−1.0
−0.50.0
W index
W
Media
(e) - MEFE-PC
Figura 6.8: Box-plots da Fragilidade Espacial para os modelos propostos nos
distritos. A linha contınua apresenta as estimativas da media a posteriori da
fragilidade nos distritos.
110
(a) W gerado (b) RR (base = Wigan)
(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))
Figura 6.9: estimativas a posteriori das fragilidades geradas sob o modelo
MEFE-Wb.
111
(a) W gerado (b) RR (base = Wigan)
(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))
Figura 6.10: Estimativas a posteriori das fragilidades geradas sob o modelo
MEFE-PG.
112
(a) W gerado (b) RR (base = Wigan)
(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))
Figura 6.11: Estimativas a posteriori das fragilidades geradas sob o modelo
MEFE-PC.
113
A Tabela 6.1 apresenta os valores do DIC e do pD para os modelos
ajustados. De acordo com esse criterio o melhor modelo e MES-PC, esse
resultao mostra que devido a sua flexibilidade os processos correlacionados e
uma boa suposicao para a funcao de risco de base. Perceba que usando uma
mesma especificacao para a funcao de risco de base os modelos sem fragili-
dade espacial tiveram melhor performance do que os modelos com fragilidade
espacial, esse fato era esperado devido ao pequeno numero de distritos com
risco da fragilidade espacial significativo, Figuras 6.9 (d), 6.10 (d) e 6.11 (d).
Lembrando que por dificuldades computacionais a dimensao dos dados es-
paciais foi reduzida de 1043, tinha-se a informacao espacial por indivıduo,
para 24 distritos. Essa reducao talves pode ter mascarado uma dependencia
espacial existente nos dados. Os valores de pD negativos sao explicados pelo
fato de que a funcao de verossimilhanca nao e log-concava.
Modelo pD DIC
MES-Wb -12,8278 -1850,4970
MEFE-Wb -10,5797 -552,6421
MES-PG -0,3385 5733,2320
MEFE-PG 27,9883 9647,0440
MES-PC -17,9361 -2250,4200
MEFE-PC 8,1284 -1484,9350
Tabela 6.5: Criterio de comparacao de modelo.
6.2 Dados de tempo no emprego
Os dados contem a informacao do tempo medio em semanas no emprego
nos 92 municıpios do estado do Rio de Janeiro para o setor industrial. O
114
setor industrial e um dos grandes setores de emprego definidos pelo IBGE5.
Os setores de emprego sao: industria, construcao civil, comercio, servicos,
agropecuaria e outros. Note que este conjunto de dados nao tem a presenca
de dados censurados.
Os dados sao provenientes da Relacao Anual de Informacoes Sociais -
RAIS do ano de 2001. Fundamentalmente, a RAIS e um Registro Admin-
istrativo, de ambito nacional, com periodicidade anual, obrigatorio por lei
para todos os estabelecimentos. A informacao sobre tempo no emprego e
disponibilizada somente em nıvel de municıpio.
As Figuras 6.12 e 6.13 apresentam a divisao polıtica do estado do Rio
de Janeiro, por municıpio e por microrregiao6 no ano de 2000. Note que os
dados sao referentes ao ano de 2001, enquanto a divisao polıtica mostrada
nos mapas e a que vigorava no ano de 2000. Isso gerou um problema, pois
em 2001 foi criado o municıpio de Mesquita e em 2000 ele fazia parte do
municıpio de Nova Iguacu. Portanto, os mapas nao conterao a informacao
sobre o municıpio de Mesquita. Mas ele nao sera ignorado na modelagem.
O tempo medio de emprego na industria nos municıpios do estado do
Rio de Janeiro, a partir de agora apenas o tempo medio no emprego, varia
entre 2,3 semanas em Casimiro de Abreu ate 62,5 semana em Arraial do
Cabo. A Figura 6.14 apresenta a distribuicao empırica dos tempos de so-
brevivencia sem considerar as covariaveis. Pode-se perceber que em 80% dos
municıpios o tempo medio e menor que 20 semanas. A Figura 6.15 apresenta
a distribuicao dos tempos no emprego nos municıpios. Perceba que a regiao
sul do estado possui uma maior concentracao de tempos mais altos no em-
5Instituto Brasileiro de Geografia e Estatıstica - http://www.ibge.gov.br6Divisao regional mais agregada que munıcipio definida pelo IBGE.
115
Figura 6.12: Divisao polıtica do estado do Rio de Janeiro por municıpio
Figura 6.13: Divisao polıtica do estado do Rio de Janeiro por microrregiao
prego, com a excessao dos municıpios da Baia de Ilha Grande. No centro do
Estado concentram-se tempo menores menores que 15 semanas no emprego.
Da mesma maneira que o nordeste do estado, excluindo as microrregioes de
Itaperuna e Santo Antonio de Padua que que possuem alguns municıpios
com tempo medio no emprego superior a 20 semanas.
116
0 10 20 30 40 50 60
0.00.2
0.40.6
0.81.0
Figura 6.14: Funcao de Sobrevivencia Empırica
Figura 6.15: Tempo medio no emprego em semanas por municıpio.
O banco de dados possui uma covariavel, o salario medio na industria
por municıpio. A Figura 6.16 mostra a dispersao dos salarios medios de
acordo com o tempo medio no emprego. Note que diminuindo o salario os
tempos no emprego tendem a ser menores, dando um indıcio de que o risco
de um indivıduo deixar o emprego diminiu quando o salario aumenta.
Os dados serao modelados usando os modelos descritos nesta dissertacao,
117
400 600 800 1000 1200
010
2030
4050
60
X1
Figura 6.16: Salario medio versus tempo medio no emprego
ou seja, os modelos estaticos de sobrevivencia, os modelos estaticos de fragili-
dade espacial, os modelos dinamicos de sobrevivencia e os modelos dinamicos
de fragilidade espacial. A tabela 6 descreve uma abreviatura para os modelos.
A inferencia sera feita com base na amostra da distribuicao a posteriori.
As amostras foram obtidas a partir dos procedimentos descritos nos capıtulo
3, 4 e 5 com as seguintes especificacoes a priori:
Para os modelos estaticos,
β ∼ N(0; 100),
usando funcao de risco de base Weibull
α ∼ Gama(0, 1; 0, 1), E(α) = 1, V (α) = 10
λ ∼ Gama(0, 5; 0, 5), E(φ) = 1, E(φ) = 1
usando processos Gama
H∗0 (t) = 0, 1t,
c = 1,
118
usando processos correlacionados
U ∼ GamInv(1, 05; 2, 05), E(σ2U) = 1, E(σ2
U) = 20.
Para os modelos dinamicos,
β.,1 ∼ N(0; diag(σ20, . . . , σ
2p))
U ∼ GamInv(2, 05; 0, 0105) E(U) = 0, 01, V (U) = 0, 20
σ2i ∼ GamInv(2, 05; 1, 05), E(σ2
i ) = 1, V (σ2i ) = 20, i = 0, . . . , p.
Para os hiperparametros da fragilidade
φ ∼ Gama(1; 1), E(φ) = 1, V (φ) = 1
σ2W ∼ GamInv(2; 3), E(σ2
W ) = 1, V (σ2W ) = 1
O numero de iteracoes e o burn-in utilizados em cada modelo esta es-
pecificado na Tabela 6.6. Para todos os modelos tem-se lag = 50. Foi
assumido que a convergencia foi alcancada apos o perıodo de burn-in es-
pecificado. A convergencia dos parametros e hiperparametros foi verificada
usando o criterio de Geweke (1992) implementado no pacote CODA.
Modelo M burn-in Modelo M burn-in
MES-Wb 50k 40k MEFE-PG 50k 40k
MES-PG 50k 40k MEFE-PC 50k 40k
MES-PC 50k 40k MDS 100k 80k
MEFE-Wb 50k 40k MDFE 100k 80k
Tabela 6.6: Especificacoes para selecionar as amostras da posteriori, onde 1k
equivale a 1000.
A Tabela 6.7 apresenta as estimativas da amostra da posteriori para
os modelos estaticos. Perceba que o efeito do salario no tempo medio no
119
emprego e significativo, ou seja, o valor zero nao pertence ao intervalo de
credibilidade, para os modelos estaticos ajustados. O efeito estimado e nega-
tivo, indicando que quanto maior o salario menor sera o risco de deixar o
emprego. Perceba tambem que os modelos com a mesma especificacao para
a funcao de risco de base geraram estimativas muito similares. O efeito do
salario atribuıdo aos modelos que usam os processos Gama a priori para
modelar h0(t) foram maiores que dos outros,
A Tabela 6.8 apresenta as estimativas da amostra da posteriori para os
hiperparametros dos modelos dinamicos. Perceba que entre os dois modelos,
MDS e MDFE, as estimativas para as variancias sao bastante similares. O
parametro U que mede a forca da evolucao do efeitos e bem pequeno, in-
dicando que efeitos em instantes adjacentes tendem a ser muito similares.
As Figuras 6.17 e 6.18 apresentam estimativas relacionadas a funcao
de risco de base h0(t) para os modelos estaticos de sobrevivencia e para
os modelos estaticos de fragilidade espacial, respectivamente. Percebe-se
que as estimativas para a funcao de risco de base indicam que ela e uma
funcao crescente, isto e, o risco de um indivıduo deixar o emprego, aumenta
a medida que o tempo passa. As estimativas sao muito similares entre si,
principalmente estimativas que utilizam a mesma funcao especificacao para
a funcao de risco de base.
Os efeitos variando no tempo sao apresentados nas Figuras 6.19 (a),
(b), (c) e (d). As figuras (a) e (c), que correspondem ao logaritmo da funcao
de risco de base, indicam que a funcao de risco de base e constante ao longo
do tempo, diferente da interpretacao dos modelos estaticos que a forma que a
funcao de risco e crescente. Por outro lado, o efeito do salario medio, que nos
120
Modelo Param. Media Desvio 2,5% 50% 97,5%
MES-Wb β1 -0,0033 0,0004 -0,0045 -0,0032 -0,0021
α 2,4580 0,2170 2,0598 2,4370 2,8890
λ 0,0051 0,0024 0,0015 0,0047 0,0104
MEFE-Wb β1 -0,0033 0,0007 -0,0046 -0,0033 -0,0020
α 2,5345 0,1905 2,1909 2,541 2,8675
λ 0,0041 0,0020 0,0018 0,0036 0,0089
σ2 0,5071 0,1258 0,3186 0,4982 0,7973
φ 1,1342 0,2706 0,6696 1,1430 1,6966
MES-PG β1 -0,0014 0,0004 -0,0023 -0,0014 -0,0007
MEFE-PG β1 -0,0013 0,0004 -0,0021 -0,0013 -0,0006
σ2 0,5002 0,1386 0,3091 0,4732 0,8305
φ 1,1768 0,2992 0,6894 1,1505 1,8316
MES-PC β1 -0,0033 0,0007 -0,0045 -0,0033 -0,0020
U 0,2599 0,0938 0,1282 0,2412 0,4817
MEFE-PC β1 -0,0030 0,0006 -0,0043 -0,0030 -0,0017
U 0,2978 0,1142 0,1439 0,2822 0,6092
σ2 0,7837 0,2363 0,4590 0,7312 1,3312
φ 0,8921 0,2748 0,4646 0,8442 1,4946
Tabela 6.7: Estatısticas descritivas das amostras a posteriori para os modelos
Estaticos.
modelos estaticos e assumido constante, tem um comportamento crescente
tendendo a zero, Figuras 6.19 (b) e (d). Ou seja, o salario do indivıduo
continua tendo um efeito negativo, ou seja, indivıduos com menores salarios
tem riscos maiores de sair do emprego, mas esse efeito tende a zero, fazendo
121
Modelo Param. Media Desvio 2,5% 50% 97,5%
MDS σ20 0,1428 0,0544 0,0748 0,1310 0,2685
σ21 0,1240 0,0491 0,0626 0,1152 0,2330
U 0,0008 0,0002 0,0005 0,0007 0,0012
MDFE σ20 0,1411 0,0521 0,0751 0,1301 0,2620
σ21 0,1275 0,0446 0,0682 0,1168 0,2306
U 0,0008 0,0002 0,0005 0,0007 0,0013
σ2W 0,8352 0,2419 0,4665 0,8066 1,3601
φ 0,9032 0,2462 0,4688 0,8862 1,4781
Tabela 6.8: Estatısticas descritivas das amostras a posteriori para os modelos
Dinamicos.
com que os riscos diminuam ao longo do tempo. O que e um resultado
intuitivo, pois a partir de um certo tempo o indıviduo tende a se estabilizar
no emprego se adequando ao salario recebido.
122
1.0 1.5 2.0 2.5 3.0 3.5 4.0
02
46
810
1214
log(t)
h 0(t)
MediaIC 95%
| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |
1.0 1.5 2.0 2.5 3.0 3.5 4.0
−20
24
log(t)
log(H 0(t))
MédiaIC 95%
(a) - h0(t) MES-Wb (b) H0(t) MES-Wb
1.0 1.5 2.0 2.5 3.0 3.5 4.0
0.00.5
1.01.5
log(t)
h 0(t)
Média
| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |
1.0 1.5 2.0 2.5 3.0 3.5 4.0
−3−2
−10
12
log(t)
log(H 0(t))
MédiaIC 95%
(c) - h0(t) MES-PG (d) H0(t) MES-PG
0 10 20 30 40 50 60
−4−2
02
4
Time
β 0(t)
| | | || | ||| || | | ||||| ||| | |||||||| ||||| | | || | ||| |||||||||| |||||||| | |||| ||| | | |||| | ||| | |||| | | | | | | | |
MediaIC 95%
1.0 1.5 2.0 2.5 3.0 3.5 4.0
−20
24
log(t)
log(H 0(t))
MédiaIC 95%
(e) - h0(t) MES-PC (f) H0(t) MES-PC
Figura 6.17: Estimativas para h0(t) e H0(t) para os modelos estaticos de
sobrevivencia, a linha (—) representa a media a posteriori e a linha (−−)
representa o intervalo de 95% de credibilidade.
123
1.0 1.5 2.0 2.5 3.0 3.5 4.0
05
1015
log(t)
h 0(t)
MediaIC 95%
| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |
1.0 1.5 2.0 2.5 3.0 3.5 4.0
−20
24
log(t)
log(H 0(t))
MédiaIC 95%
(a) - h0(t) MEFE-Wb (b) H0(t) MEFE-Wb
1.0 1.5 2.0 2.5 3.0 3.5 4.0
0.00.5
1.01.5
2.0
log(t)
h 0(t)
Média
| | | | | | | || || | | ||||| ||| ||||||||| ||||| | ||||||||||||||||| |||||||| |||||||| || |||| ||||||||| ||| | | | | |
1.0 1.5 2.0 2.5 3.0 3.5 4.0
−3−2
−10
12
log(t)
log(H 0(t))
MédiaIC 95%
(c) - h0(t) MEFE-PG (d) H0(t) MEFE-PG
0 10 20 30 40 50 60
−4−2
02
4
Time
β 0(t)
| | | || | ||| || | | ||||| ||| | |||||||| ||||| | | || | ||| |||||||||| |||||||| | |||| ||| | | |||| | ||| | |||| | | | | | | | |
MediaIC 95%
1.0 1.5 2.0 2.5 3.0 3.5 4.0
−20
24
log(t)
log(H 0(t))
MédiaIC 95%
(e) - h0(t) MEFE-PC (f) H0(t) MEFE-PC
Figura 6.18: Estimativas para h0(t) e H0(t) para os modelos estaticos de
fragilidade espacial, a linha (—) representa a media a posteriori e a linha
(−−) representa o intervalo de 95% de credibilidade.
124
0 10 20 30 40 50 60
−0.0
50.
000.
05
Time
β 0
|| ||||||||||| ||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||||| ||| | | | | |
MediaIC 95%
0 10 20 30 40 50 60
−0.0
12−0
.010
−0.0
08−0
.006
−0.0
04−0
.002
0.00
0
Time
β 1
|| ||||||||||| ||||| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||||| ||| | | | | |
MediaIC 95%
(a) β0 - MDS (b) β1 - MDS
0 10 20 30 40 50 60
−0.0
50.
000.
05
β0
Time
| | | | | | | || | | | | | | | || | || | || || ||| | | || | | | | | | | | | | || || ||| | || | | ||| | | | | ||| | || | | | || | | | | || | | | | | | | | | | | | |
MediaIC 95%
0 10 20 30 40 50 60
−0.0
15−0
.010
−0.0
050.
000
β1
Time
| | | | | | | || | | | | | | | || | || | || || ||| | | || | | | | | | | | | | || || ||| | || | | ||| | | | | ||| | || | | | || | | | | || | | | | | | | | | | | | |
MediaIC 95%
(c) β0 - MDFE (d) β1 - MDFE
Figura 6.19: Plot das covariaveis versus o tempo observado em dias.
125
A Figura 6.20 apresenta os Boxplots das estimativas a posteriori da
fragilidade dos municıpios do Rio de Janeiro, usando os modelos MEFE-Wb,
MEFE-PG, MEFE-PC e MDFE. Perceba que eles sao diferentes entre si,
portanto o efeito espacial em cada modelo sera diferente.
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89
−1.5
−1.0
−0.5
0.0
0.5
1.0
1.5
W index
W
Média
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89
−1.5
−1.0
−0.5
0.0
0.5
1.0
W index
W
Media
(a) MEFE-Wb (b) MEFE-PG
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89
−2−1
01
W index
W
Media
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89
−3−2
−10
12
W index
W
Média
(c) MEFE-PC (d) MDFE
Figura 6.20: Boxplots das estimativas a posteriori da fragilidade por mu-
nicıpios, usando os modelos MEFE-Wb, MEFE-PG, MEFE-PC e MDFE.
As Figuras 6.21, 6.22, 6.23 e 6.24 apresentam as estimativas a posteriori
126
das fragilidades geradas sob os modelos MEFE-Wb, MEFE-PG, MEFE-PC e
MDFE, respectivamente. Cada uma dessas figuras contem quatro mapas, (a),
(b), (c) e (d). No mapa (a) se tem as fragilidades espaciais, W , geradas pelo
respectivo modelo, estas fragilidades podem conter valores distintos entre si,
pois esses valores dependem da especificacao da funcao de risco de base. Nos
mapas (b) e (c) sao apresentados o logaritmo dos riscos relativos tomando
como base no primeiro mapa o municıpio mais importante, Rio de Janeiro,
e no segundo a base e a fragilidade media, lembrando que o risco relativo
pode ser obtido tomando a exponencial do valor estimado. O mapa (d)
apresenta uma estatıstica que ajuda visualizar quais municıpios tem risco
significativo, essa estatıstica e dada pelo mınimo entre a probabilidade do
logaritmo do risco relativo, usando a media media como base, ser maior que
zero e o complementar dessa probabilidade. Ou seja, valores pequenos para
essa estatıstica indicam que o log do risco daquela regiao esta longe de zero.
Portanto, tem um risco relativo significativo.
Usando o modelo MEFE-Wb, a Figura 6.21 mapas (a), (b) e (c) mostram
que a regiao centro-sul do estado e o litoral Norte sao as regioes de maior
risco. Enquanto a regiao dos Lagos e o norte do estado (Itaperuna e Santo
Antonio de Padua) sao as regioes de menor risco. De acordo com a mapa
(d) as regioes com risco significativo sao: Campos de Goytacases com risco
positivo e Itaperuna com risco negativo. As outras regioes apesar de apre-
sentarem uma aparente estrutura de vizinha, nao sao significativas.
No MEFE-PG, a Figura 6.22 mapas (a), (b) e (c) mostram que a regiao
central do estado apresenta os riscos maiores. Os riscos menores sao obser-
vados na principalmente na regiao Norte, inclusive no Litoral. O mapa (d)
mostra que o risco da maioria dos municıpios sao nao significativos, com a
127
excecao dos municıpios de Cabo Frio e Arraial do Cabo, com risco maiores, e
o municıpio de Quissama no litoral norte apresentando baixo risco de deixar
o emprego.
No MEFE-PC, a Figura 6.23 mapas (a), (b) e (c) mostram que as
regioes de maior risco sao a regiao central do estado com excecao da regiao
dos Lagos e no sul do estado nas regioes da Bahia de Ilha e Vale do Paraıba.
E as regioes de menor risco de deixar o emprego sao: A regiao dos Lagos no
centro do estado , Itaperuna e Santo Antonio de Padua no norte e no Sul
Vassouras e parte da Barra do Piraı. Mas novamente poucos municıpios tem
o risco significativo. Com risco baixos estao os municıpios de Sao Joao da
Barra, Itaperuna e Cabo Frio7 e com riscos altos estao os municıpios de Rio
Bonito e Silva Jardim.
No MDFE os riscos mais altos sao observados, no litoral sul do estado,
Figura 6.24 mapas (a), (b) e (c), envolvendo a regiao da Bahia da Ilha Grande
e a grande de Rio de Janeiro. Novamente a regiao Norte do estado, Itaperuna
e Santo Antonio de Padua sao as regioes de menor risco de deixar o emprego,
juntamente com o municıpio de Vassouras e barra do Piraı ao sul. No entanto,
para nenhum municıpio foi encontrado um risco significativo.
Como pode se observar, poucos municıpios dos modelos ajustados tiveram
a fragilidade espacial significativa, e alguns modelos tiveram resultados con-
traditorios no que diz respeito a posicao espacial. Portanto, para estes dados
acredita-se que nao exista de uma estrutura espacial. Fato tambem obser-
vado no criterio de selecao de modelo, Tabela 6.2, onde percebe-se que os
modelo sem estrutura espacial sao geralmente preferidos.
7Resultado contraditorio com o aprsentado no modelo MEFE-PG.
128
(a) W gerado (b) RR (base = Rio de Janeiro)
(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))
Figura 6.21: Quartis a posteriori das estimativas apresentadas sob o modelo
MEFE-Wb. O valor da legenda e o maximo do intervalo.
129
(a) W gerado (b) RR (base = Rio de Janeiro)
(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))
Figura 6.22: Quartis a posteriori das estimativas apresentadas sob o modelo
MEFE-PG. O valor da legenda e o maximo do intervalo.
130
(a) W gerado (b) RR (base = Rio de Janeiro)
(c) RR (base = W ) (d) min(P (RR > 0), P (RR < 0))
Figura 6.23: Quartis a posteriori das estimativas apresentadas sob o modelo
MEFE-PC. O valor da legenda e o maximo do intervalo.
131
(a) W gerado (b) RR (base = Rio de Janeiro)
(c) RR (base = W ) (d) min(P (RR(c) > 0), P (RR(c) < 0))
Figura 6.24: Quartis a posteriori das estimativas apresentadas sob o modelo
MDFE. O valor da legenda e o maximo do intervalo.
132
A Tabela 6.1 apresenta os valores do DIC e do pD para os modelos
ajustados. De acordo com esse criterio o melhor modelo e MES-PG. Perceba
que usando uma mesma especificacao para a funcao de risco de base os mod-
elos sem fragilidade espacial tiveram melhor performance do que os modelos
com fragilidade espacial, com a excecao dos modelos dinamicos, mas o ganho
que se obteve usando a fragilidade espacial nao compensa o esforco adicional.
Este fato era esperado devido ao pequeno numero de distritos com risco da
fragilidade espacial significativo, Figuras 6.21 (d), 6.22 (d),6.23 (d) e 6.24
(d). Lembrando que o ideal era fazer um estudo onde se tenha o tempo
no emprego de cada indivıduo, mas dados nao estao disponıveis por serem
sigilosos. Portanto, tratar o tempo medio pode estar mascarando uma certa
dependencia espacial ou nao existente nos dados. Os valores de pD negativos
sao explicados pelo fato de que a funcao de verossimilhanca nao e log-concava.
Modelo pD DIC
MES-Wb -20,0053 428,9566
MEFE-Wb -11,2119 446,6283
MES-PG -1,7515 287,2947
MEFE-PG 3,1334 332,4997
MES-PC -7,6645 439,5716
MEFE-PC -0,7035 500,6961
MDE 7,2832 638,1740
MDFE 22,8942 637,3450
Tabela 6.9: Criterio de comparacao de modelo.
133
Capıtulo 7
Conclusoes e Trabalhos Futuros
Os modelos dinamicos e estaticos de fragilidade espacial podem ser aplica-
dos em muitos casos de analise de sobrevivencia, pois eles tem como casos
particulares os modelos de Cox e os modelos de fragilidade que sao bastante
utilizados na pratica. E, alem disso, podem incorporar a analise uma estru-
tura espacial presentes nos dados.
Nos estudos simulados os modelos apresentados funcionaram bem gerando
estimativas proximas dos valores de onde os dados foram gerados. Para os
dados reais, tanto os dados de leucemia quanto o tempo no emprego, os mod-
elos geraram estimativas similares entre si, com algumas excecoes. E quando
comparados aos resultados de Henderson et. al (2002) nota-se que as estima-
tivas geradas sao razoaveis. Tecnicas de comparacao de modelo estao sendo
implementadas para que as comparacoes entre modelos sejam formalizadas.
A tecnica que sera utilizada e conhecida como DIC, deviance information
criterion, ( Spieglhalter et al., 2002).
O tempo computacional para os modelos de fragilidade espacial e bas-
134
tante elevado. Pois e necessario em cada iteracao do algoritmo avaliar os
parametros gerados na inversa de uma matriz r × r, onde r e o numero de
pontos no espaco distintos. Portanto, quando se aumenta o numero r de pon-
tos distintos no espaco, o tempo computacional aumenta consideravelmente.
Com isso, se faz necessario a implentacao de tecnicas de inversao de matrizes
de alta dimensao. Os dados de leucemia contem 1043 pontos no espaco, por
deficiencia computacional os indivıduos tiveram que ser agrupados nos 24
distritos.
Os modelos descritos nessa dissertacao foram implementados no Ox
version 3.20, que e uma excelente linguagem de programacao matricial orien-
tada a objeto, com muitas bibliotecas estatısticas e matematicas veja Doornik
(2002). Os graficos e estatısticas da amostra a posteriori gerada pelos progra-
mas em Ox foram feitos no R versao 1.4.1 e os mapas foram feitos utilizando
o Tab para Win versao 2.2. todos sao freewares e facilmente encontrados
para download na internet.
Em trabalhos futuros pretende-se desenvolver modelos dinamicos e estaticos
de fragilidade espacial num contexto multivariado, por exemplo os dados de
emprego no Rio de Janeiro, o setor estudado foi a Industria, mas poderiam
ser estudados outros tais com comercio, servicos, etc. Onde pode-se verificar
se existe alguma estrutura de correlacao entre setores.
Uma extensao dos modelos estaticos e fazer com os efeitos variem no
espaco, e que sejam modelados usando as tecnicas similares as descritas para
o termo de fragilidade. A funcao de risco para estes modelos e dada por:
h(t|X, s) = h0(t) exp {Xβ(s)} s ∈ D
onde β(s) = (β1(s), βp(s))T e cada βi(s) corresponde ao efeito relacionado
135
a covariavel Xi na posicao s. Se nao existir estrutura espacial tem-se que
β(s) = β, ∀s ∈ D. Portanto, esses modelos tem como caso particular os
modelos Estaticos.
Dando mais um passo a frente pode-se alem de fazer com que os efeitos
variem no espaco, pode-se pensar em modelos que tenha efeitos que variem no
espaco e no tempo com a seguinte funcao de risco: Modelos com parametros
variando no espaco
h(t|X, s) = h0(t) exp {Xβ(t, s)} s ∈ D
onde β(t, s) = (β1(t, s), βp(t, s))T e cada βi(t, s) corresponde ao efeito rela-
cionado a covariavel Xi na posicao s e no tempo t.
136
Referencias Bibliograficas
[1] Barnett, V. (1973). Statistical Prediction Analysis. Cambridge: Cam-
bridge University Press.
[2] Burridge, J. (1981). Empirical Bayes analysis of survival time data. Jour-
nal of Royal Statistical Society, Series B,43, 65-75.
[3] Carlin, B. P. e Banerjee, S. (2002). Hierarchical multivariate CAR mo-
dels for spatio-temporally correlated survival data, Em J. Bernardo, J.
Berger, A. Dawid e A. Smith (Editores), Bayesian Statistics 7, Oxford,
1-15, University Press.
[4] Clayton, D. G. (1978). A model for association in bivariate life tables
and its application in epidemiological studies of familial tendendy in
chronic disease incidence. Biometrika, 65, 141-151
[5] Clayton, D.G. (1991). A Monte Carlo method for Bayesian inference in
frailty models. Biometrics ,47, 467-485.
[6] Cowles, M. K. e Carlin, B. (1996). Markov chain Monte Carlo con-
vergences diagnostics: a comparative review. Journal of the American
Statistical Association, 91, 883-904.
137
[7] Cowles, M. K. Best, N., Vines, K. e Plummer, M. (1997) CODA - Con-
vergence and Diagnostics Output Analysis software for Gibbs sampling
output, Cambridge: MRC Biostatistics Unit.
[8] Cox, D. R. (1972). Regression models and life tables. Journal of Royal
Statistical Society, Series B,34, 187-220.
[9] Cressie N. A. C. (1993). Statistics for Spatial Data. Edicao revisada,
New York: Wiley.
[10] Dawid, A. P. (1981). Some matrix-variate distribution theory: notation,
consideration and Bayesian aplication, Biometrika, 68, 265-274.
[11] Doss, H. (1994). Bayesian nonparametric estimation for incomplete data
via sucessive substitution sampling. The Annals of Statistics, 22, 1763-
1786.
[12] Doornik, J. A. (2002). Object-Oriented Matrix Programming Using
Ox, 3rd ed. London: Timberlake Consultants Press and Oxford:
www.nuff.ox.ac.uk/Users/Doornik.
[13] Ferguson, T. S. (1973). A Bayesian analysis of some nonparametric pro-
blems. The Annals of Statistics, 1, 209-230.
[14] Gamerman, D. (1987). Dynamic Analisys of Survival Models and Related
Process. PhD Thesis. University of Warwick, Conventry.
[15] Gamerman, D. (1991). Dynamic Bayesian models for survival data. Ap-
plied Statistics,40, 63-79.
[16] Gamerman, D. (1997). Markov Chain Monte Carlo: Stochastic Simula-
tion for Bayesian Inference. London: Chapman & Hall.
138
[17] Gamerman, D. e West, M. (1987). An application of dynamic survival
models in unemployment studies. The Statistician, 36, 269-274.
[18] Gelfand, A. e Smith, A. M. F. (1990). Sampling-based approaches to
calculating marginal densities. Journal of the American Statistical As-
sociation, 85, 398-409.
[19] Gelfand, A. e Mallick, B. (1995). Bayesian analysis of proportional ha-
zards models built from monotone function. Biometrics, 51, 843-852.
[20] Gelman, A. e Rubin, D. B. (1992). Inference from iterative simulation
using multiple sequences (com discussoes). Statistical Science, 7, 457-511
[21] Geman, S. e Geman, D. (1984). Stochastic relation, Gibbs distribution
and the Bayesian restoration of images. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 6, 721-741.
[22] Geweke, J. (1992). Evaluating the accuracy of sampling-based ap-
proaches to calculating posterior moments. Em J. Bernado, J. Berger,
A. Dawid e A. Smith (Editores), Bayesian Statistics 4, Oxford, 169-193,
University Press.
[23] Gilks, W. R., Richardson, S. e Spiegealhalter, D. R. (Editores) (1996).
Markov Chain Monte Carlo in Pratice. London: Chapman & Hall.
[24] Gill, J. K. e Johansen, S. (1990). A survey of product-integration with
a view toward application in survival analysis. The Annals of Statistics,
18, 1501-1555.
[25] Harrison, P. J. e Stevens, C. F. (1976). Bayesian Forecasting. Journal
of Royal Statistical Society, Series B, 38, 205-247.
139
[26] Hastings, W. K. (1970). Monte Carlo samplings using Markov chains
and their applications. Biometrika, 57, 97-109.
[27] Heidelberger, P. e Welch, P. (1983) Simulation run length control un the
presence of an initial trasient. Operations Research, 31, 1109-1144.
[28] Hemming, K. e Shaw, E. H. (2002). A parametric dynamical model
applied to breast cancer survival times. Applied Statistics, 51, 421-435.
[29] Hougaard, P. (1995). Frailty models for survival data. Lifetime Data
Analysis, 1, 255-273.
[30] Henderson, R. e Oman, P. (1999). Effect of frailty on marginal regresion
estimates in survival analysis. Journal of the Royal Statistical Society,
Series B, 61, 367-379.
[31] Henderson, R., Shimakura S. e Grost, D. (2002). Modelling spatial vari-
ation in Leukaemia survival data. Journal of the American Statistical
Association, 97, 965-972.
[32] Kalbfleish, J. D. (1978). Non-parametric Bayesian analysis of survival
time data. Journal of Royal Statistical Society, Series B,40, 214-221.
[33] Klein, J. P. e Moeschberger M. L. (1991). Survival Analysis: Techniques
for Censured and Truncated Data, Springer.
[34] Krige, D.G. (1951). A statistical approch to some basic mine evalua-
tion problems on the Witwatersrand. Johannesburg Chemistry Metal-
lurgy Mining Society South African, 52, 119-139.
[35] McGilchrist, C. A. e Aisbett, C. W. (1991). Regression with Frailty in
survival analisys. Biometrics, 47, 461-466.
140
[36] Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H. e
Teller, E. (1953). Equation od station calculations by fast computing
machine. Journal of Chemical Physics. 21, 1087-1091.
[37] Migon, H. S. e Gamerman, D. (1999). Statistical Inference an Integrated
Approach. London: Arnold.
[38] Nieto-Barajas, L. e Walker, S. G. (2002). Markov beta and gamma pro-
cesses for modelling hazard rates. Scandinavian Journal of Statistics,
29, 413-424.
[39] O’Hagan, A. (1994). Bayesian Inference. Volume B of Kendall’s Ad-
vanced Theory of Statistics. London: Edward Arnold.
[40] Qiou, Z., Ravinshanker, N. e Dey, D. K. (1999). Multivariate survival
analysis with positive stable frailties, Biometrics, 55, 637-644.
[41] Raftery, A. L. e Lewis, S. (1992). How many iterations in the Gibbs
sampler? Em J. Bernardo, J. Berger, A. Dawid e A. Smith (Editores),
Bayesian Statistics 4, Oxford, 763-774, University Press.
[42] Silva, G. L. (2001). Analise Bayesiana de Modelos de Sobrevivencia com
Fragilidade. Tese de Doutorado, Instituto Superior tecnico, universidade
Tecnica de Lisboa.
[43] Sinha, D. e Dey, D. K. (1997). Semiparametric Bayesian analysis of
survival Data. Journal of the American Statistical Association, 1997,
92, 1195-1211.
[44] Spiegelhalter, D.J., Best, N.G., Carlin, B.P. e Van der Linde, A. (2002).
Bayesian measure of model complexity and fit. Journal of Royal Statis-
tical Society, Series B, 64, Part 3, 1-34.
141
[45] Tanner, M. A. (1996). Tools for Statistical Inference-Methods for Explo-
ration of Posterior Distribuitions and Likelihood Functions (3a edicao).
New York: Springer Verlag.
[46] Townsend, P., Phillimore, P. e Beattie, A. (1988). Health and Depriva-
tion: Inequality and the North. London: Croom Helm.
[47] Vaupel, J. W., Manton, K. G. e Stallard, E. (1979). The Impact of hete-
rogeneity in individual frailty on dynamics of mortality. Demography,
16, 439-454.
[48] Weibull, W. (1951). A statistical distribution of wide applicability. Jour-
nal of Applied Mechanics, 18, 293-297.
[49] West, M. e Harrison, P. J. (1997). Bayesian Forecasting and Dynamic
Models (2a edicao). New York: Springer Verlag.
142
Apendice
Durante o texto da dissertacao foram apresentadas as condicionais comple-
tas e metodos para gerar amostras dessas distribuicoes de todos os modelos
propostos. As distribuicoes a posteriori serao apresentadas junto com os
principais calculos necessarios para a obtencao das mesmas. As distribuicoes
a posteriori serao apresentadas para tanto para os modelos estaticos quanto
para os modelos dinamicos, mas sera dado um destaque um pouco maior
para os modelos estaticos pois estes tem mais especificacoes a priori para a
funcao de risco de base, que sao: abordagem parametrica, usando processos
Gama e usando processos correlacionados baseados em modelos dinamicos.
Os modelos sem fragilidade e com fragilidade nao estruturada sao ca-
sos particulares dos modelos com fragilidade espacial. Basta assumir que
a fragilidade W (s) = 0, ∀s ∈ D, onde D e uma regiao no espaco para os
modelos sem fragilidade. E para os modelos com fragilidade assume-se que
W ∼ N(0, Σ) onde W = (W (s1), . . . , W (sn)) e Σ e uma matriz de variancias
sem dependencia espacial, por exemplo Σ = σI.
143
Modelos Estaticos com Fragilidade Espacial
A funcao de risco de um indivıduo no tempo t com vetor de covariaveis X
na posicao s ∈ D e dada por:
h(t; X, s) = h0(t) exp{Xβ + W (s)} (8.1)
onde h0(.) e a funcao de risco de base, β e o vetor (coluna) de efeitos associ-
ados as covariaveis e W (.) e a fragilidade espacial. as quantidades h0(.), β e
W (.) sao quantidades desconhecidas, portanto serao estimados valores para
essas quantidades.
A funcao de verossilhanca depende da especificacao a priori para a
funcao de risco de base, mas de uma forma geral a funcao de verossimilhanca,
para uma amostra de tamanho n e indicador de falha δ, e dada por:
L(β, h0,W ; t, δ,X, s) =n∏
i=1
(h0(ti)e
Xiβ+W (si))δi
exp{−H0(ti)e
Xiβ+W (si)}
(8.2)
As especificacoes para a funcao de risco de base estudas nesta dis-
sertacao foram: processos parametricos, processos Gama e processos correla-
cionados.
Processos Parametricos - MEFE-Wb
Seguindo uma especificacao parametrica para a funcao de risco de base e
necessario supor uma distribuicao, sera assumido para o tempo uma dis-
tribuicao Weibull, lembrando que qualquer distribuicao parametrica positiva
poderia ser usada para o tempo que implicaria em uma funcao de risco de
base dada por uma funcao dos parametros da distribuicao escolhida. Para o
144
caso Weibull a funcao de risco de base e dada por:
h0(t) = λαtα−1, λ > 0, α > 0 (8.3)
Com esta funcao de risco de base a funcao de verossimilhanca (8.2) pode ser
reescrita da seguinta forma:
L(β, α, λ,W ; t, δ,X, s) =n∏
i=1
(αλtα−1
i eXiβ+W (si))δi
exp{−λtαi eXiβ+W (si)
}
(8.4)
note que a funcao de risco de base por ser uma funcao de α e λ, portanto
sua estimativa a posteriori sera funcao das estimativas a posteriori de α e λ.
As especificacoes a priori para as quantidades desconhecidas sao dadas
a seguir. Como os coeficientes dos efeitos das covariaveis nao variam com o
tempo, sera utilizado uma distribuicao normal multivariada com os seguintes
hiperparametros m e V que descrevem o conhecimento inicial que se dos
efeitos. Ou seja,
p(β) ∝ exp{−1
2(β −m)T V −1(β −m)
}(8.5)
Os parametros da funcao de risco de base terao a distribuicao gama
com distribuicao a priori e os hiperparametros serao especificados de acordo
com algum conhecimento inicial que se tem do processo, ou seja:
p(α) ∝ αaα−1 exp{−bαα}, aα, bα > 0 (8.6)
p(λ) ∝ λaλ−1 exp{−bλλ}, aλ, bλ > 0 (8.7)
A fragilidade espacial sera ajustada usando processos Gaussianos de
forma similar a utilizada em Geoestatıstica. Onde a fragilidade segue um
processo Gaussiano estacionario isotropico com media zero, ou seja
W ∼ N(0, Σ) (8.8)
145
onde Σ = σ2W R, σ2 > 0, Rij = ρ(dij, φ, σ2
W ), dij e a distancia entre as
observacoes i e j. Sera assumido que ρ(.) e a funcao de correlacao exponencial
potencia, ou seja,
Rij = exp
{−
(dij
φ
)κ}(8.9)
Desta forma a funcao de densidade a priori da fragilidade espacial e
dada por
p(W |φ, σ2W ) ∝ exp
{− 1
2σ2W
W T R−1W
}(8.10)
onde Rij = ρ(dij, φ, σ2W ), os hiperparametros φ e σ2
W tem as distribuicoes
gama e gama invertida a priori, respectivamente, ou seja
p(σ2W ) ∝ (σ2
W )−cW2−1 exp{− dW
2σ2W
}, cW , dW > 0 (8.11)
p(φ) ∝ φaφ−1 exp{−bφφ}, aφ, bφ > 0 (8.12)
p(κ = k) = 1, k e uma constante pre-especificada. (8.13)
Combinando as distribuicoes a priori (8.5), (8.6), (8.7), (8.10), (8.11),
(8.12) e (8.13) com a funcao de verossimihanca (8.4) atraves do teorema de
Bayes temos que a distribuicao a posteriori e dada por
p(β, W, α, λ, σ2W , φ, κ| · · ·) ∝ αaα−1λaλ−1(σ2
W )−cW +n
2−1φaφ−1|R|−1(αλ)
∑n
i=1δi
× exp{−bαα− bλλ− bφφ− 1
2(β −m)T V −1(β −m)
}
× exp
{− 1
2σ2W
(W T R−1W + dW )
}n∏
i=1
(tδiα−1i eδi(Xiβ+W (si))
)
× exp
{−λ
n∑
i=1
tαi eXiβ+W (si)
}I(κ = k) (8.14)
146
Processos Gama - MEFE-PG
Ao assumir para a funcao de risco de base um processo Gama, a funcao de
risco de base sera estimada de forma nao parametrica. Este e um procedi-
mento bem mais robusto que o parametrico, mas por sua vez e bem mais
flexıvel. Os processos Gama utilizam os incrementos da funcao de risco de
base acumulada. Assim a funcao de verossimilhanca (8.2) sera reescrita da
seguinta forma:
L(β, dH0,W ; t, δ,X, s) =n∏
i=1
(d
dtH0(ti)e
Xiβ+W (si)
)δi
× exp{−
∫ ti
0dH0(u)eXiβ+W (si)
}(8.15)
onde∫ ti
0dH0(u) =
n∑
j=i
(dH0(tj) + DH0(tj)) e DH0(tj) =∫ tj
tj−1
dH(u), para
j ≤ i = 1, . . . , n.
Os coeficientes de regressao (β) assim como a fragilidade espacial (W )
por nao dependerem a priori da funcao de risco de base terao a mesma
especificacao a priori utilizada nos processos parametricos dadas em (8.5) e
(8.10).
A especificacao para a funcao de risco de base na verdade e uma es-
pecificacao para a funcao de risco de base acumulada H0(.), sera assumido
que H0(.) segue a priori um processo em media conhecido e alem disso possui
incrementos Gama independentes, ou seja,
E(H0(t)) = H∗(t), uma funcao positiva conhecida,
V (H0(t)) =H∗(t)
c,
e os incrementos dH0(t) sao independentes e seguem uma distribuicao Gama
147
com parametros de forma e escala cdH∗(t) e c, respectivamente.
p(dH0(t)) ∝ (dH0(t))cdH∗(t)−1 exp{−cdH0(t)} (8.16)
Com o mesmo parametro de escala, a partir do teorema 3.1 tem-se que
∀t > u:
p(H0(t)−H0(u)) ∝ (H0(t)−H0(u))c(H∗(t)−H∗(u))−1
× exp{−c(H0(t)−H0(u))}. (8.17)
Combinando as distribuicoes a priori (8.5), (8.16), (8.17), (8.10), (8.11),
(8.12) e (8.13) com a funcao de verossimihanca (8.15) atraves do teorema de
Bayes temos que a distribuicao a posteriori e dada por
p(β, W, dH0, σ2W , φ, κ| · · ·) ∝ (σ2
W )−cW +n
2−1φaφ−1 exp {−bφφ} |R|−1
× exp
{− 1
2σ2W
(W T R−1W + dW )
}
×n∏
i=1
(dH0(ti))δi+cdH∗(ti)−1 (DH0(ti))
cDH∗(ti)−1
×n∏
i=1
exp {−c[dH0(ti) + DH0(ti)] + Xiβ + W (si)}
×n∏
i=1
exp{−
∫ ti
0dH0(u)eXiβ+W (si)
}(8.18)
× exp{−1
2(β −m)T V −1(β −m)
}I(κ = k)
Processos Correlacionados - MEFE-PC
Esta especificacao aproxima a distribuicao dos tempos de falha usando a
distribuicao exponencial por partes. Ou seja, em intervalos de tempo pre-
estabelecidos a funcao de risco e contante, ou seja,
h(t; X, s) = h0(t)eXiβ+W (si) = exp{log(λ0i) + Xiβ + W (si)} (8.19)
148
onde ∀t ∈ Ii, i = 1, . . . , J, J + 1., os I’s sao elementos da particao definida
em (3.20) e os valores do logaritmo de λ0 se modificam suavemente segundo
um passeio aleatorio, ou seja,
β0i = β0(i−1) + ui, ui ∼ N(0, Ui), i = 2 . . . , J (8.20)
β01 ∼ N(m0, C) (8.21)
onde β0i = log(λ0i), i = 1, . . . , J , Ui = biU , onde bi = ai − ai−1 que
e o tamanho do intervalo Ii, U e o hiperparametro que mede a forca da
autocorrelacao e m0 e C sao variaveis conhecidas. Sera asumido para U
segue uma distribuicao Gama Invertida com parametros ( cU
2, dU
2) e funcao de
densidade dada por
p(U |cU , dU) ∝ U− cU2−1 exp
{− dU
U2
}, U > 0, cU , dU > 0) (8.22)
A distribuicao conjunta de β0 = (β01, . . . , β0J)T e dada como produto
das densidades obtidas de (8.20) e (8.21),
β0 ∼ NJ
(m0, Λ
−1)
(8.23)
onde m0 = m01, 1 = (1, . . . , 1)T e a matriz de variancias Λ−1 dada por
(2.11).
Usando o Teorema 3.2 e a funcao de risco 8.19a funcao de verossimil-
hanca (8.2) sera reescrita da seguinta forma:
L(β, W, β0; t, δ,X, s) =n∏
i=1
J∏
j=1
(eβ0j+Xiβ+W (si))χij
=n∏
i=1
J∏
j=1
exp{−eβ0j+Xiβ+W (si)(tij − aj−1)
}(8.24)
Os coeficientes de regressao (β)assim como a fragilidade espacial (W )
por nao dependerem a priori da funcao de risco de base terao a mesma
149
especificacao a priori utilizada nos processos parametricos e Gama, dadas
em (8.5) e (8.10).
Combinando as distribuicoes a priori (8.5), (8.23), (8.22), (8.10), (8.11),
(8.12) e (8.13) com a funcao de verossimihanca (8.24) atraves do teorema de
Bayes temos que a distribuicao a posteriori e dada por
p(β, W, β0, U, σ2W , φ, κ| · · ·) ∝ (σ2
W )−cW +n
2−1φaφ−1U− cU +J
2−1 exp {−bφφ} |R|−1
× exp
{−1
2(β −m)T V −1(β −m)− dW
2σ2W
}
× exp{−1
2(β0 −m0)
T Λ(β0 −m0)}
× exp
n∑
i=1
J∑
j=1
[(β0j + Xiβ + W (si))χij]
× exp
n∑
i=1
J∑
j=1
[−eβ0j+Xiβ+W (si)(tij − aj−1)
]
× exp
{− 1
2σ2W
W T R−1W
}I(κ = k) (8.25)
Modelos Dinamicos com Fragilidade Espacial
Agora os efeitos das covariaveis dependem do tempo, e para fazer a estimacao
dos efeitos dependentes do tempo usaremos um modelo de sobrevivencia
dinamico. Seja a particao do eixo do tempo dada por (5.2). Sera assumido
que para tempos percentes a um mesmo intervalo Ij, j = 1, . . . , J , a funcao
de risco e constante com respeito ao tempo. Portanto
h(t; X, β) = exp {β0j + Xβ.,j} , t ∈ Ij, j = 1, . . . , J. (8.26)
onde h0(t) = exp{β0j} e β.,j = (β1j, . . . , βpj)T , ∀t ∈ Ij. Note que a funcao de
risco de base tambem sera modelada de forma dinamica.
150
Com a particao (5.2) e a funcao de risco (8.26), usando o Teorema 3.2
tem-se que a funcao de verossimilhanca e dada por
L(β) = exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j(tij − aj−1)
(8.27)
onde χij assume valor 1 se o indivıduo i falha no intervalo j e 0 caso contrario.
Logo∑
j χij = δi e para simplificar a notacao foram feitas as seguintes ex-
pansoes: Xi = (1, Xi) e β.,j = (β0j, β.,j)T para simplificar a notacao. sob a
forma matricial tem-se
β =
β0,1 β1,1 . . . βp,1
β0,2 β1,2 . . . βp,2
......
...
β0,J β1,J . . . βp,J
= [β0,, β1,, . . . , βp,] (8.28)
Sera assumido a priori para a seguinte distribuicao a priori, ja descrita
no Capıtulo 5:
vec(β) ∼ NJ(p+1)
(mT ⊗ 1, Σ⊗ Λ−1
)(8.29)
onde vec(A) e a vetorizacao da matriz A. Σ = diag(σ20, . . . , σ
2p) e Λ e definida
em (2.11). A funcao de densidade e dada por
p(β|U, σ20 . . . , σ2
p) = (2π)−J(p+1)/2|Σ|−J/2|Λ|(p+1)/2
× exp{−1
2tr
[(β −B)T Λ(β −B)Σ−1
]}(8.30)
Para os hiperparametros U, σ20 . . . , σ2
p serao assumidas as seguintes dis-
tribuicoes a priori
p(U) ∝ UcU2−1 exp
{− dU
2U
}(8.31)
p(σ2i ) ∼ (σ2
i )− ci
2−1 exp
{− di
2σ2i
}, i = 0, 1, . . . , p (8.32)
151
onde os parametros ((cU , dU), (c0, d0), . . . , (cp, dp)) sao conhecidos a priori e
descrevem a informacao inicial de seus respectivos hiperparametros.
Como a fragilidade espacial (W ) nao depende do tempo e nem depende
a priori dos efeitos β, ela tera a mesma especificacao a priori utilizada nos
modelos estaticos com fragiildade espacial, dadas em (8.5) e (8.10).
Combinando as distribuicoes a priori (8.30), (8.31), (8.32), (8.10), (8.11),
(8.12) e (8.13) com a funcao de verossimihanca (8.27) atraves do teorema de
Bayes temos que a distribuicao a posteriori e dada por
p(β, W,U, σ20, . . . , σ
2p, φ, κ| · · ·) ∝ U
cU2
+(p+1)(J−1)−1 exp
{− dU
2U
}
×p∏
i=1
(σ2i )− ci+J
2−1 exp
{− di
2σ2i
}
× exp{−1
2tr
((β −B)T Λ(β −B)Σ−1
)}
× exp
n∑
i=1
J∑
j=1
χijXiβ.,j − eXiβ.,j(tij − aj−1)
× I(κ = k) (8.33)
152