análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/ericeira...

20
Introdução Modelos Base de dados Resultados Análise conjunta de dados longitudinais e de sobrevivência: Abordagem Bayesiana Rui Martins, Valeska Andreozzi e Giovani Silva Ericeira, 2010

Upload: others

Post on 22-May-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise conjunta de dados longitudinais ede sobrevivência: Abordagem Bayesiana

Rui Martins, Valeska Andreozzi e Giovani Silva

Ericeira, 2010

Page 2: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Índice

1 IntroduçãoAnálise conjunta de Dados Longitudinais e deSobrevivência

2 ModelosModelo LongitudinalModelo de sobrevivênciaModelo Conjunto

3 Base de dadosAnálise descritiva

4 ResultadosModelos separadosModelo conjunto

Page 3: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise conjunta de Dados Longitudinais e de Sobrevivência

Motivação

ensaios clínicos e estudosepidemiológicos recolhemfrequentemente váriosresultados de cada indivíduo(medidas repetidas e tempoaté um evento de interesse)a abordagem separada nãoconsidera as associaçõesentre processo longitudinal(PL) e processo desobrevivência (PS)a abordagem conjunta permitereduzir o viés e aumentar aeficiência das estimativas

Page 4: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise conjunta de Dados Longitudinais e de Sobrevivência

Notação

indivíduos, i = 1, . . . ,m

[0, τ [ - tempo de observação

Medidas Longitudinais {yij, j = 1, . . . , ni} nos instantes{sij, j = 1, . . . , ni} (possíveis omissões)

ti - tempo de acompanhamento (possivelmente censurado)

covariáveis de base Xi

Parâmetros θ

O PL e o PS são assumidos como independentes dado umprocesso latente Gaussiano bivariado de ligação e dadas ascovariáveis.

Page 5: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo Longitudinal

Modelo misto

Dada a sequência de medidas yi1, yi2, . . . , yini para o i-ésimo indivíduonos instantes si1, si2, . . . , sini o modelo longitudinal é:

yij = µi(sij) + W1i(sij) + εij

onde

µi(s) = xT1iβ1 é a resposta média global

x1i(s) – variáveis explicativas, possivelmente dependentes dotempo

β1 – coeficientes de regressão

W1i(s) = dT1i(s)Ui – efeitos aleatórios

Ui ∼ N(0,Σ) – vectores de efeitos aleatórios correspondendo àsvariáveis explicativas d1i(s) (que pode ser um subconjunto dex1i(s))

εij ∼ N(0, σ2ε) – sequência de erros de medida mutuamente

independentes

Page 6: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo de sobrevivência

Weibull

ti ∼Weibull(r, µi(t)) , r > 0

ondelog(µi(t)) = xT

2i(t)β2 + W2i(t)

x2i(t) - variáveis explanatórias (possivelmentedependentes do tempo)β2 - coeficientes de regressãoW2i(t) - semelhante a W1i(s)O risco no instante t é dado por

λi(t) = rtr−1µi(t) = rtr−1 exp{

xT2i(t)β2 + W2i(t)

}Se r = 1 reduz-se ao modelo exponencial

Page 7: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo Conjunto

Henderson et al. (2000)

O modelo conjunto liga o PL e o PS considerando

W1i(s) = U1i + U2i(s)

eW2i(t) = γ1U1i + γ2U2i + γ3(U1i + U2it) + U3i

Assume-se dependência estocástica entre W1i e W2i

Wi(t) = (W1i,W2i)T é independente de indivíduo para indivíduo

Wi(t) – processo Gaussiano estocástico latente bivariado

o PL e o PS são independentes dado Wi(t) e as covariáveis

γ1, γ2 e γ3 medem a associação entre os dois submodelos

As variáveis latentes Ui = (U1i,U2i)T são um processo

Gaussiano bivariado de média nula, N(0,Σ)

U3i – termos de fragilidade independentes, modelados comoN(0, σ2

3), independentes de Ui

Page 8: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo Conjunto

Henderson et al. (2000) - versão bayesiana

MCMC

WinBUGS

Prioris “não informativas”

β1 = (β11, β12, β13, β14, β15) ∼ NM(0,Σ1), Σ1 = diag(0.01, 5, 5)

σ2ε ∼ GI(1, 10)

β2 = (β21, β22, β23, β24) ∼ NM(0,Σ2), Σ2 = diag(0.01, 4, 4)

(U1i,U2i) ∼ NM(0,Σ), Σ ∼ W(R, 23), R = diag(100, 2, 2)

γ1 e γ2 ∼ N(0, 0.01), σ = diag(100, 2, 2)

U3i ∼ N(0, σ23), σ2

3 ∼ GI(1, 10)

Page 9: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

Amostra

amostra aleatória de casos VIH/SIDA do Brasilregistados no SISCEL (Sistema de Controlo de ExamesLaboratoriais de CD4/CD8 e Carga Viral) e no SINAN(Sistema de informação de agravos de notificação)Janeiro de 2002 a Dezembro de 2006tamanho aproximadamente igual a 10% do número totalde casos registados nesse período (47660)3207 foram óbitosAmostra obtida através do cruzamento das basesnacionais do SINAN-AIDS, SIM (Sistema de Informaçõessobre Mortalidade) e SISCEL, tendo sido utilizada ametodologia de relacionamento probabilístico, Recordlinkage por forma a constituírem uma só.

Page 10: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

Critério de inclusão no estudo

Casos de VIH/SIDA diagnosticados entre Janeiro de 2002e Dezembro de 2006notificados no SINAN-AIDS até Junho de 2007registados no SISCELencontrados ou não no SIMSó abrange indivíduos diagnosticados a partir de 2002,porque só nessa altura o SISCEL estava realmenteimplementado e o SINAN, que sofreu alterações em 2000,ficou mais robusto a partir de 2002.

Page 11: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

Variáveis

Tempo entre o diagnóstico de SIDA e a morte, ou censura, foicomposto pelas seguintes datas:

Data inicial = data do diagnósticoData final

data final = data do óbito→ indivíduos que faleceramdata final = data do último exame de CD4→ indivíduos quenão faleceram:

Covariáveis sócio demográficasSexo, Idade, Raça, Estado de residência, Região deResidência

Covariáveis clínicasCritérios de diagnóstico (CDC, RJ/Caracas, cd4<350),Categorias de exposição à doença (Heterossexual,Homossexual, Utilizador de drogas injectáveis, Outros),Contagem de células CD4 e CD8 e Tratamento com ARV

Page 12: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

Análise Descritiva

total de indivíduos = 4657

total de exames CD4 = 21516

óbitos = 321

1879 Mulheres; 2775 Homens; 3NA

3154 Hetero; 855 HSH; 336UDI; 298 Ignorado; 14 Outros

313 Centro-Oeste; 537Nordeste; 222 Norte; 2806Sudeste; 779 Sul

2249 Branca; 1166 Parda; 471;Preta; 771 NA

Distribuição das Idades

Idade

Den

sity

20 30 40 50 60 70 80

0.00

0.02

● ●●● ●●● ●●● ●● ●●● ●●● ●● ●● ● ●●● ●●●● ●●●● ● ●● ●● ●●

20 30 40 50 60 70 80

Óbito SIDA Óbito Outras Censurados

010

0020

0030

0040

00

242 96

4319

Page 13: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

Análise Descritiva de CD4

Page 14: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

●●●●●●●

●●●●

●●

●●

●●

●●●●●

●●

●●●

●●

●●

●●●●●●

●●

●●

●●●

●●●●●●●●

●●●●

●●●●●●

●●

●●●●●●

●●

●●

●●

●●●●●

●●

●●

●●

●●●●●●●●●●●●●

●●

●●

●●●●

●●●●●

●●

●●

●●

●●●●●●

●●●

●●●●●

●●●

●●●●●

●●

●●

●●●

●●

●●●●

●●●●

●●●●●

●●●●●●●●●

●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

0 1 2 3 40

500

1500

2500

CD4 por região

●●●●●

●●●●●●●●●●●●

●●

●●●●

●●●

●●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●●●●●●●

●●

●●●●●●●

●●●●●

●●

●●

●●●●

●●●●

●●

●●●

●●

●●

●●●●●●●●●●●●●●●●●

●●●●●●

●●

●●

●●●

●●●●●●●

●●●●●●

●●●●

●●

●●

●●

●●●

●●

●●●

●●●

●●

●●

●●

●●●

●●●●●●●●

0 1

050

015

0025

00

CD4 por sexo

●●

●●●●●●●●●●●●●●●

●●●

●●

●●●●●●

●●

●●

●●

●●●●

●●●●

●●

●●

●●●●●●●●●●●●●●

●●●●●●●●

●●●●●

●●●

●●

●●●

●●●●●●

●●●

●●●

●●

●●

●●

●●

●●●

●●●●●●

●●

●●

●●●

●●●

●●●●

●●

●●

●●

●●●●●

●●

●●●

●●

●●

●●●

●●●●

●●

●●●

●●●

●●●●●

●●

●●●●

●●●●

●●●●

0 2 3

050

015

0025

00

CD4 por raça

Page 15: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Análise descritiva

0.0

0.2

0.4

0.6

0.8

1.0

K−M por Sexo

Tempo (Dias)

FemMasc

0.0

0.2

0.4

0.6

0.8

1.0

K−M por Raça

Tempo (Dias)

BrancaPardaPreta

0.0

0.2

0.4

0.6

0.8

1.0

K−M por Região

Tempo (Dias)

C_OesteNordesteNorteSudesteSul

Page 16: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelos separados

Modelo longitudinal

yij = β11+β12×sij+β13×genderi+β14×racai+β15×regiaoi+W1i(sij)+εij

ondeyij - medidas de CD4

W1i = U1i + U2isij

(U1i,U2i)T ∼ N(0,Σ)

Modelo de sobrevivência

log(µi) = β21 + β22 × genderi + β23 × racai + β24 × regiaoi

Page 17: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo conjunto

Submodelo longitudinal

yij = β11+β12×sij+β13×genderi+β14×racai+β15×regiaoi+W1i(sij)+εij

ondeW1i = U1i + U2isij

(U1i,U2i)T ∼ N(0,Σ)

Submodelo de sobrevivência

log(µi) = β21 + β22× genderi + β23× racai + β24× regiaoi + W2i(t)

ondeW2i = γ1U1i + γ2U2i

Page 18: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo conjunto

05

1015

2025

30

CD4 ao longo dos meses

meses

sqrt

(CD

4)

0 12 24 36 48

565730

0 200 400 600 800 1000

0.00

00.

010

0.02

0

Tempo mediano de sobrevivência

Paciente − 565

Den

sity

jointsep

0 200 400 600 800 1000

0.00

00.

010

0.02

00.

030

Tempo mediano de sobrevivência

Paciente − 730

Den

sity joint

sep

Paciente Y1 Y2 Y3 Y4 Y5 surv.T idade sexo raça uf. Res. região status prevoi565 67 267 432 639 NA 1361 28 f b Pará Sul 0 1730 89 297 512 642 826 1774 29 m b Roraima SE 0 1

Page 19: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo conjunto

05

1015

2025

30

CD4 ao longo dos meses

meses

sqrt

(CD

4)

0 12 24 36 48

21162

0 100 200 300 400 500 600

0.00

00.

010

0.02

0

Tempo mediano de sobrevivência

Paciente − 2

Den

sity

jointsep

0 50 100 150 200 250 300

0.00

00.

010

0.02

00.

030

Tempo mediano de sobrevivência

Paciente − 1162

Den

sity joint

sep

Paciente Y1 Y2 Y3 Y4 Y5 surv.T idade sexo raça uf. Res. região status prevoi2 309 298 134 99 NA 1206 44 f b Amapá Norte 0 1

1162 220 150 188 157 187 1812 36 m b Goiás C.Oeste 0 0

Page 20: Análise conjunta de dados longitudinais e de sobrevivência ...gi3ceaul.fc.ul.pt/Ericeira 2010/RuiMartins.pdf · Análise conjunta de Dados Longitudinais e de Sobrevivência Motivação

Introdução Modelos Base de dados Resultados

Modelo conjunto

Guo, X., and Carlin, B. Separate and joint modelling of longitudinal and eventtime data using standard computer packages. The American Statistician 16-24(2004).

Henderson, R., Diggle, P., and Dobson, A. Joint modelling of longitudinalmeasurements and event time data. Biostatistics 1, 4 (Dec 2000), 465-480.

Fitzmaurice, G., Laird, N. and Ware, J., Applied Longitudinal Data Analysis,Wiley (2004)