análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/ericeira...
TRANSCRIPT
Introdução Modelos Base de dados Resultados
Análise conjunta de dados longitudinais ede sobrevivência: Abordagem Bayesiana
Rui Martins, Valeska Andreozzi e Giovani Silva
Ericeira, 2010
Introdução Modelos Base de dados Resultados
Índice
1 IntroduçãoAnálise conjunta de Dados Longitudinais e deSobrevivência
2 ModelosModelo LongitudinalModelo de sobrevivênciaModelo Conjunto
3 Base de dadosAnálise descritiva
4 ResultadosModelos separadosModelo conjunto
Introdução Modelos Base de dados Resultados
Análise conjunta de Dados Longitudinais e de Sobrevivência
Motivação
ensaios clínicos e estudosepidemiológicos recolhemfrequentemente váriosresultados de cada indivíduo(medidas repetidas e tempoaté um evento de interesse)a abordagem separada nãoconsidera as associaçõesentre processo longitudinal(PL) e processo desobrevivência (PS)a abordagem conjunta permitereduzir o viés e aumentar aeficiência das estimativas
Introdução Modelos Base de dados Resultados
Análise conjunta de Dados Longitudinais e de Sobrevivência
Notação
indivíduos, i = 1, . . . ,m
[0, τ [ - tempo de observação
Medidas Longitudinais {yij, j = 1, . . . , ni} nos instantes{sij, j = 1, . . . , ni} (possíveis omissões)
ti - tempo de acompanhamento (possivelmente censurado)
covariáveis de base Xi
Parâmetros θ
O PL e o PS são assumidos como independentes dado umprocesso latente Gaussiano bivariado de ligação e dadas ascovariáveis.
Introdução Modelos Base de dados Resultados
Modelo Longitudinal
Modelo misto
Dada a sequência de medidas yi1, yi2, . . . , yini para o i-ésimo indivíduonos instantes si1, si2, . . . , sini o modelo longitudinal é:
yij = µi(sij) + W1i(sij) + εij
onde
µi(s) = xT1iβ1 é a resposta média global
x1i(s) – variáveis explicativas, possivelmente dependentes dotempo
β1 – coeficientes de regressão
W1i(s) = dT1i(s)Ui – efeitos aleatórios
Ui ∼ N(0,Σ) – vectores de efeitos aleatórios correspondendo àsvariáveis explicativas d1i(s) (que pode ser um subconjunto dex1i(s))
εij ∼ N(0, σ2ε) – sequência de erros de medida mutuamente
independentes
Introdução Modelos Base de dados Resultados
Modelo de sobrevivência
Weibull
ti ∼Weibull(r, µi(t)) , r > 0
ondelog(µi(t)) = xT
2i(t)β2 + W2i(t)
x2i(t) - variáveis explanatórias (possivelmentedependentes do tempo)β2 - coeficientes de regressãoW2i(t) - semelhante a W1i(s)O risco no instante t é dado por
λi(t) = rtr−1µi(t) = rtr−1 exp{
xT2i(t)β2 + W2i(t)
}Se r = 1 reduz-se ao modelo exponencial
Introdução Modelos Base de dados Resultados
Modelo Conjunto
Henderson et al. (2000)
O modelo conjunto liga o PL e o PS considerando
W1i(s) = U1i + U2i(s)
eW2i(t) = γ1U1i + γ2U2i + γ3(U1i + U2it) + U3i
Assume-se dependência estocástica entre W1i e W2i
Wi(t) = (W1i,W2i)T é independente de indivíduo para indivíduo
Wi(t) – processo Gaussiano estocástico latente bivariado
o PL e o PS são independentes dado Wi(t) e as covariáveis
γ1, γ2 e γ3 medem a associação entre os dois submodelos
As variáveis latentes Ui = (U1i,U2i)T são um processo
Gaussiano bivariado de média nula, N(0,Σ)
U3i – termos de fragilidade independentes, modelados comoN(0, σ2
3), independentes de Ui
Introdução Modelos Base de dados Resultados
Modelo Conjunto
Henderson et al. (2000) - versão bayesiana
MCMC
WinBUGS
Prioris “não informativas”
β1 = (β11, β12, β13, β14, β15) ∼ NM(0,Σ1), Σ1 = diag(0.01, 5, 5)
σ2ε ∼ GI(1, 10)
β2 = (β21, β22, β23, β24) ∼ NM(0,Σ2), Σ2 = diag(0.01, 4, 4)
(U1i,U2i) ∼ NM(0,Σ), Σ ∼ W(R, 23), R = diag(100, 2, 2)
γ1 e γ2 ∼ N(0, 0.01), σ = diag(100, 2, 2)
U3i ∼ N(0, σ23), σ2
3 ∼ GI(1, 10)
Introdução Modelos Base de dados Resultados
Análise descritiva
Amostra
amostra aleatória de casos VIH/SIDA do Brasilregistados no SISCEL (Sistema de Controlo de ExamesLaboratoriais de CD4/CD8 e Carga Viral) e no SINAN(Sistema de informação de agravos de notificação)Janeiro de 2002 a Dezembro de 2006tamanho aproximadamente igual a 10% do número totalde casos registados nesse período (47660)3207 foram óbitosAmostra obtida através do cruzamento das basesnacionais do SINAN-AIDS, SIM (Sistema de Informaçõessobre Mortalidade) e SISCEL, tendo sido utilizada ametodologia de relacionamento probabilístico, Recordlinkage por forma a constituírem uma só.
Introdução Modelos Base de dados Resultados
Análise descritiva
Critério de inclusão no estudo
Casos de VIH/SIDA diagnosticados entre Janeiro de 2002e Dezembro de 2006notificados no SINAN-AIDS até Junho de 2007registados no SISCELencontrados ou não no SIMSó abrange indivíduos diagnosticados a partir de 2002,porque só nessa altura o SISCEL estava realmenteimplementado e o SINAN, que sofreu alterações em 2000,ficou mais robusto a partir de 2002.
Introdução Modelos Base de dados Resultados
Análise descritiva
Variáveis
Tempo entre o diagnóstico de SIDA e a morte, ou censura, foicomposto pelas seguintes datas:
Data inicial = data do diagnósticoData final
data final = data do óbito→ indivíduos que faleceramdata final = data do último exame de CD4→ indivíduos quenão faleceram:
Covariáveis sócio demográficasSexo, Idade, Raça, Estado de residência, Região deResidência
Covariáveis clínicasCritérios de diagnóstico (CDC, RJ/Caracas, cd4<350),Categorias de exposição à doença (Heterossexual,Homossexual, Utilizador de drogas injectáveis, Outros),Contagem de células CD4 e CD8 e Tratamento com ARV
Introdução Modelos Base de dados Resultados
Análise descritiva
Análise Descritiva
total de indivíduos = 4657
total de exames CD4 = 21516
óbitos = 321
1879 Mulheres; 2775 Homens; 3NA
3154 Hetero; 855 HSH; 336UDI; 298 Ignorado; 14 Outros
313 Centro-Oeste; 537Nordeste; 222 Norte; 2806Sudeste; 779 Sul
2249 Branca; 1166 Parda; 471;Preta; 771 NA
Distribuição das Idades
Idade
Den
sity
20 30 40 50 60 70 80
0.00
0.02
● ●●● ●●● ●●● ●● ●●● ●●● ●● ●● ● ●●● ●●●● ●●●● ● ●● ●● ●●
20 30 40 50 60 70 80
Óbito SIDA Óbito Outras Censurados
010
0020
0030
0040
00
242 96
4319
Introdução Modelos Base de dados Resultados
Análise descritiva
Análise Descritiva de CD4
Introdução Modelos Base de dados Resultados
Análise descritiva
●
●●●●●●●
●
●●●●
●
●
●
●●
●
●●
●
●
●●
●●●●●
●●
●
●●●
●●
●
●
●
●
●●
●●●●●●
●
●●
●
●●
●
●●●
●●●●●●●●
●●●●
●●●●●●
●●
●
●
●
●
●
●
●
●
●
●
●
●●●●●●
●●
●●
●
●
●
●
●●
●●●●●
●
●
●
●●
●
●
●
●
●●
●
●●
●●●●●●●●●●●●●
●●
●●
●●●●
●
●●●●●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●●
●●●●●●
●
●
●●●
●
●
●
●●●●●
●●●
●
●●●●●
●●
●
●●
●●●
●
●
●●
●
●●●●
●
●
●
●●●●
●
●●●●●
●●●●●●●●●
●
●●
●●
●●●●
●●
●
●
●
●
●
●
●●●
●
●
●
●●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
0 1 2 3 40
500
1500
2500
CD4 por região
●●●●●
●●●●●●●●●●●●
●
●
●●
●●●●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●●●●●
●
●●
●●
●
●
●
●●
●●●●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●
●
●
●●●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●●●
●●●●●●●●
●●
●●●●●●●
●
●●●●●
●
●●
●●
●●●●
●●●●
●
●
●
●
●
●●
●●●
●
●
●
●●
●
●
●
●
●●
●
●
●●●●●●●●●●●●●●●●●
●●●●●●
●●
●
●
●●
●●●
●
●●●●●●●
●
●
●
●
●
●●●●●●
●
●
●●●●
●
●●
●
●●
●●
●●●
●
●
●
●
●
●
●●
●
●
●
●●●
●
●●●
●
●
●
●
●●
●
●
●●
●
●●
●
●
●
●●●
●
●
●
●●●●●●●●
●
●
0 1
050
015
0025
00
CD4 por sexo
●●
●
●●●●●●●●●●●●●●●
●
●
●
●
●●●
●●
●
●
●
●
●
●
●
●
●●●●●●
●
●●
●●
●
●
●●
●●●●
●
●
●
●●●●
●
●●
●
●●
●●●●●●●●●●●●●●
●
●
●
●
●
●●●●●●●●
●
●
●
●
●
●
●
●
●
●●●●●
●
●
●●●
●
●
●
●
●●
●●●
●●●●●●
●●●
●
●
●
●●●
●●
●
●●
●●
●●
●
●
●
●●●
●
●
●●●●●●
●●
●
●
●●
●
●
●●●
●●●
●
●
●
●
●●●●
●
●●
●
●●
●●
●
●
●
●
●
●●●●●
●●
●●●
●
●
●●
●
●●
●●●
●
●
●
●
●●●●
●●
●
●
●●●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●●●●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●●●
●
●●●●
●●●●
0 2 3
050
015
0025
00
CD4 por raça
Introdução Modelos Base de dados Resultados
Análise descritiva
0.0
0.2
0.4
0.6
0.8
1.0
K−M por Sexo
Tempo (Dias)
FemMasc
0.0
0.2
0.4
0.6
0.8
1.0
K−M por Raça
Tempo (Dias)
BrancaPardaPreta
0.0
0.2
0.4
0.6
0.8
1.0
K−M por Região
Tempo (Dias)
C_OesteNordesteNorteSudesteSul
Introdução Modelos Base de dados Resultados
Modelos separados
Modelo longitudinal
yij = β11+β12×sij+β13×genderi+β14×racai+β15×regiaoi+W1i(sij)+εij
ondeyij - medidas de CD4
W1i = U1i + U2isij
(U1i,U2i)T ∼ N(0,Σ)
Modelo de sobrevivência
log(µi) = β21 + β22 × genderi + β23 × racai + β24 × regiaoi
Introdução Modelos Base de dados Resultados
Modelo conjunto
Submodelo longitudinal
yij = β11+β12×sij+β13×genderi+β14×racai+β15×regiaoi+W1i(sij)+εij
ondeW1i = U1i + U2isij
(U1i,U2i)T ∼ N(0,Σ)
Submodelo de sobrevivência
log(µi) = β21 + β22× genderi + β23× racai + β24× regiaoi + W2i(t)
ondeW2i = γ1U1i + γ2U2i
Introdução Modelos Base de dados Resultados
Modelo conjunto
05
1015
2025
30
CD4 ao longo dos meses
meses
sqrt
(CD
4)
0 12 24 36 48
565730
0 200 400 600 800 1000
0.00
00.
010
0.02
0
Tempo mediano de sobrevivência
Paciente − 565
Den
sity
jointsep
0 200 400 600 800 1000
0.00
00.
010
0.02
00.
030
Tempo mediano de sobrevivência
Paciente − 730
Den
sity joint
sep
Paciente Y1 Y2 Y3 Y4 Y5 surv.T idade sexo raça uf. Res. região status prevoi565 67 267 432 639 NA 1361 28 f b Pará Sul 0 1730 89 297 512 642 826 1774 29 m b Roraima SE 0 1
Introdução Modelos Base de dados Resultados
Modelo conjunto
05
1015
2025
30
CD4 ao longo dos meses
meses
sqrt
(CD
4)
0 12 24 36 48
21162
0 100 200 300 400 500 600
0.00
00.
010
0.02
0
Tempo mediano de sobrevivência
Paciente − 2
Den
sity
jointsep
0 50 100 150 200 250 300
0.00
00.
010
0.02
00.
030
Tempo mediano de sobrevivência
Paciente − 1162
Den
sity joint
sep
Paciente Y1 Y2 Y3 Y4 Y5 surv.T idade sexo raça uf. Res. região status prevoi2 309 298 134 99 NA 1206 44 f b Amapá Norte 0 1
1162 220 150 188 157 187 1812 36 m b Goiás C.Oeste 0 0
Introdução Modelos Base de dados Resultados
Modelo conjunto
Guo, X., and Carlin, B. Separate and joint modelling of longitudinal and eventtime data using standard computer packages. The American Statistician 16-24(2004).
Henderson, R., Diggle, P., and Dobson, A. Joint modelling of longitudinalmeasurements and event time data. Biostatistics 1, 4 (Dec 2000), 465-480.
Fitzmaurice, G., Laird, N. and Ware, J., Applied Longitudinal Data Analysis,Wiley (2004)