análise de dados longitudinais modelos lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf ·...

55
An´ alise de Dados Longitudinais Modelos Lineares Generalizados Longitudinais Enrico A. Colosimo-UFMG www.est.ufmg.br/enricoc 1/55

Upload: danglien

Post on 13-Feb-2019

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Analise de Dados LongitudinaisModelos Lineares Generalizados Longitudinais

Enrico A. Colosimo-UFMGwww.est.ufmg.br/∼enricoc

1/55

Page 2: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Respostas Longitudinal Nao-Gaussiana

1 Yij , i = 1, . . . ,N; j = 1, . . . ,n: binaria, contagem, etc.

2 Modelos Estatısticos

Modelos Lineares Generalizados Mistos.

Modelos Marginais: GEE

2/55

Page 3: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Exemplos

1 Mecanismo Evacuatorio de Recem-Nascidos

2 Fatores de Risco Coronariano: MCRF, (FLW, pag. 364)

3/55

Page 4: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Mecanismo Evacuatorio de Recem-Nascidos

151 recem-nascidos acompanhados nos primeiros 12 meses devida no Hospital das Clınicas da UFMG em 2010 e 2011.

Acompanhamento mensal totalizando 1751 medidas (61 perdas)

Respostas: (1) Binarias: Dificuldade para evacuar, Esforcoevacuatorio, Dor ao evacuar e (2) Contagem: Frequenciaevacuatoria/semana.

Variavel temporal: idade (em dias ou meses).

Covariaveis: 1- fixa (sexo) e 2- dependentes do tempo:Aleitamento materno, dieta (0/1): cereais; frutas; vegetais, carnes,etc.Objetivo: avaliar o comportamento temporal das respostas e seusrespectivos indicadores.

4/55

Page 5: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Resposta: Dificuldade e Esforco para Evacuar

Obs.: idade foi arrendonda para mes (um unico digito).

2 4 6 8 10 12

0.10

0.15

0.20

0.25

idade (meses)

prop

orçã

o

Dif. Evacuar

2 4 6 8 10 12

0.30

0.35

0.40

0.45

idade (meses)

prop

orçã

o

Esforço Evacuat

5/55

Page 6: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Covariaveis: Consumo de Cereais e de Carnes

2 4 6 8 10 12

0.10

0.15

0.20

0.25

idade (meses)

prop

orçã

o

Consumo de Cereais

2 4 6 8 10 12

0.0

0.2

0.4

0.6

0.8

1.0

idade (meses)

prop

orçã

o

Consumo de Carnes

6/55

Page 7: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

”Muscatine Coronary Risk Factor Study”

Estudo longitudinal de criancas em idade escolar realizado emMuscatine, Iowa, Estados Unidos na decada de 80.

Cinco coortes de criancas, inicialmente com idades em 5-7, 7-9,9-11, 11-13 e 13-15 foram acompanhadas bianualmente de 1977a 1981 (3 medidas).

Resposta binaria: obesidade.

Variavel temporal: idade (em dias ou meses).

Covariavel: sexo.

Objetivo: avaliar (1) se o risco de obesidade aumenta com aidade e (2) se os padroes de obesidade sao os mesmos parameninos e meninas.

7/55

Page 8: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

”Muscatine Coronary Risk Factor Study”

Obesidade ( %)Genero Coorte Idade 1977 1979 1981Meninos

5-7 7.9 15.4 21.27-9 18.8 20.5 23.7

9-11 21.2 22.7 22.511-13 24.3 21.8 19.413-15 19.2 21.1 18.2

Meninas5-7 14.0 17.2 25.17-9 16.5 24.0 24.9

9-11 25.4 26.2 22.211-13 23.8 22.1 19.913-15 22.9 25.8 20.9

8/55

Page 9: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Revisao: Modelos Lineares Generalizados

Modelos Lineares Generalizados (MLG) e uma classe unificada demodelos de Regressao.

1 Considere Y1, . . .YN uma amostra aleatoria de respostasunivariadas (desenho transversal).

2 Um vetor de p-covariaveis associados a cada resposta Yi . Ouseja

Xi =

Xi0Xi1...

Xip

em que Xi0 = 1.

9/55

Page 10: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Lineares Generalizados (MLG)

3 O MLG e definido por tres componentes:

Distribuicao de Yi .

Componente Sistematico (preditor linear).

ηi = X ′i β = β0 + β1Xi1 + · · ·+ βpXip

Funcao de Ligacao.

10/55

Page 11: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

MLG - Famılia Exponencial

A distribuicao de Yi pertence a famılia exponencial que inclue osprincipais modelos estatısticos: normal, binomial, poisson,exponencial, etc.

Ou seja,Yi tem densidade f (Yi |θ, φ) pertencente a famılia exponencial.

f (yi |θi , φ) = exp{φ−1(yiθi − ψ(θi)) + c(yi , φ)}

em que θi e parametro natural, φ e o de escala e especıficas funcoesψ(.) e c(.).

11/55

Page 12: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Lineares Generalizados

ψ(.) e a funcao geradora de momentos

µ = E(Y ) = ψ′(θ) eVar(Y ) = φψ

′′(θ)

Em geral, media e variancia sao relacionadas.

Var(Y ) = φψ′′

(ψ′−1(µ) = φν(µ) )

A funcao ν(µ) e chamada de funcao de variancia.

ψ′−1 que relaciona θ com µ e chamada de funcao de ligacao.

12/55

Page 13: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Exemplos

1 Modelo Normal (µ, σ2)

θ = µ

φ = σ2

ψ(θ) = θ2/2

Media: µ = θ e ν(µ) = 1

Observe que no modelo normal, media e variancia nao saorelacionadas

φν(µ) = σ2

Funcao de ligacao natural: θ = µ.

13/55

Page 14: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Exemplos

2 Modelo Bernoulli (π)

θ = log(π/(1− π)

φ = 1

ψ(θ) = log(1− π) = log(1 + exp(θ))

Media: µ = π = exp(θ)1+exp(θ) e ν(µ) = π(1− π) = exp(θ)

1+exp(θ)2

Observe que no modelo bernoulli, media e variancia saorelacionadas

φν(µ) = µ(1− µ)

Funcao de ligacao natural: θ = log(µ/(1− µ).

14/55

Page 15: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Funcao de Ligacao Natural ou Canonica

g(µi) = ηi = X ′i β = β0 + β1Xi1 + · · ·+ βpXip

Gaussiano: g(µi) = ηi (identidade)

Bernoulli: g(µi) = logit(ηi).

Poisson: g(µi) = log(ηi)

15/55

Page 16: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Inferencia por MV

Funcao de log-verossimilhanca logL(.) = l(.)

L(β) =N∏

i=1

f (yi |θi , φ) =N∏

i=1

exp{φ−1(yiθi − ψ(θi)) + c(yi , φ)}

Equacoes escore: derivada de l(.).

Inferencia baseada na teoria assintotica de MV.

Referencias: Dobson (1990) e Cordeiro e Demetrio (201?)

16/55

Page 17: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Exemplo - Regressao Binaria

Uma amostra de 100 indivıduos acompanhados por um perıodode cinco anos.Resposta: ocorrencia de doenca coronariana.Resposta para cada indivıduo foi sim (1) ou nao (0).Covariavel de interesse: 8 faixas etarias (idade): 20-29, ..., 60-69.Aconteceram 43 ocorrencias de doenca coronariana.

Ref: Giolo (2010) pg. 98- Introducao a Analise de Dados Categoricos.

17/55

Page 18: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Entrada dos Dados

Existem duas formas de entrada dos dados para resposta binaria.

Forma 1: Uma linha para cada indivıduo:

indivıduo faixa etaria resposta1 1 (25) 0

..... .. .100 5 (47) 1

Total ... 43

18/55

Page 19: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Entrada dos Dados

Forma 2: Uma linha para cada combinacao de covariaveis.

Faixa Etaria Sim Nao20-29 (25) 1 930-34 (32) 2 1335-39 (38) 3 940-44 (43) 5 1045-49 (47) 6 750-54 (53) 5 355-59 (57) 13 460-69 (65) 8 2

19/55

Page 20: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Descricao Grafica por Faixa Etaria

30 40 50 60

0.0

0.2

0.4

0.6

0.8

idade

E(Y

|x)

20/55

Page 21: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

MLG

logit(idadei) = log{µi/(1− µi)} = β0 + β1idadei

e

E(Yi/idadei) = P(Yi = 1/idadei)

O modelo logıstico pode ser escrito como:

P(Yi = 1/idadei) =exp(β0 + β1idadei)

1 + exp(β0 + β1idadei)

21/55

Page 22: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Resultados do Ajuste MV

Coefficients:Estimate Std. Error z value Pr(>|z|)

(Intercept) -5.12300 1.11111 -4.611 4.01e-06 ***idade 0.10578 0.02337 4.527 5.99e-06 ***

Number of Fisher Scoring iterations: 4

> anova(ajust1,test="Chisq")

Terms added sequentially (first to last)

Df Deviance Resid. Df Resid. Dev P(>|Chi|)NULL 7 28.7015idade 1 28.118 6 0.5838 1.142e-07 ***

22/55

Page 23: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Resultados do Ajuste

Y : presenca ou nao de doenca coronariana;X : idade (em anos);n = 100.Variavel Estimativa E.P. WaldIdade 0,106 0,023 4,53 (p < 0,001)Constante -5,123 1,11 -4,61 (p < 0,001)

π(x) =exp(−5,12 + 0,106 idade)

1 + exp(−5,12 + 0,106 idade)

logit(x) = −5,12 + 0,106 idade

log(verossimilhanca) = log L(β0, β1) = −10,86

Sob H0 : β1 = 0, logL(β0) = −24,92.

TRV = 2(−10, 86 + 24, 92) = Null Deviance − Residual Deviance = 28, 118.23/55

Page 24: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelo Estimado

30 40 50 60

0.0

0.2

0.4

0.6

0.8

idade

E(Y

|x)

24/55

Page 25: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Interpretacao dos Coeficientes

Interpretacao: Razao de chances = exp(0,1058) = 1,11 (1,06;1,16),isto significa que para o aumento de um ano na idade a chance dedoenca coronariana aumenta em 11%.

25/55

Page 26: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Outros MLG

Y tem uma Bernoulli.

Outras funcoes de ligacao:

π(x) = Φ(x) (probit)

π(x) = exp−exp(x) (complemento log-log)

etc (qualquer funcao de distribuicao)

26/55

Page 27: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos para Resposta Gaussiana Longitudinal

1 Modelo MarginalYij = X ′ijβ + εij

eE(Yij |Xij) = X ′ijβ.

2 Modelo Condicional

Yij = X ′ijβ + Z ′ijbi + εij

em que:(β)p×1 : efeitos fixos;(bi)q×1 : efeitos aletaorios.

e,bi ∼ Nq(0,Σ) e εij ∼ N(0, σ2)

Sendo bi e εij independentes.

27/55

Page 28: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos para Resposta Gaussiana

Media Condicional ou Especıfica por Indivıduo

E(Yij |bi ,Xij) = X ′ijβ + Z ′ijbi .

e a Covariancia Marginal

Var(Yi) = ZiΣZ ′i + σ2In.

28/55

Page 29: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos para Resposta Nao-Gaussiana

Extensao natural dos modelos lineares generalizados;

Levar em consideracao a variacao intra-indivıduo;

Duas classes de modelos:

Modelos Marginais: baseado na media da populacao;

Modelos de Efeitos Mistos: especıfico por indivıduo

Interpretacao dos coeficientes de regressao para os doismodelos:

Mesma para resposta contınua (gaussiana);

Diferente para resposta bınaria, poisson

Escolha do modelo deve ser baseada nos objetivos do estudo.

29/55

Page 30: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos para Resposta Nao-Gaussiana

1 µij = E(Yij |Xij) (modelo marginal)

µij = E(Yij |bi ,Xij) (modelo condicional).

2 Modelo Bernoulli

Yij : 0/1 (Bernoulli)

funcao de ligacao: logit (mais comum)

logit(µij ) = X ′ijβ Modelo Marginal

logit(µij ) = X ′ijβ + Z ′ijbi Modelo Condicional

30/55

Page 31: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos para Resposta Nao-Gaussiana

3 Modelo Poisson

Yij :contagem (Poisson)

funcao de ligacao: logarıtmica (mais comum)

log(µij ) = X ′ijβ Modelo Marginal

log(µij ) = X ′ijβ + Z ′ijbi Modelo Condicional

31/55

Page 32: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Lineares Generalizados Longitudinais

1 Facil transferencia entre modelos (marginal e condicional) pararesposta gaussiana.

2 Transferencia dıficil entre modelos quando a resposta nao egaussiana.

3 Modelos Marginais

Especificacao completa: o ajuste por MV pode ser complicado.

Alternativa Nao-Verossimilhanca: MQG, GEE, etc.

4 Modelos Condicionais: ajuste complicado.

32/55

Page 33: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Resposta Longitudinal Nao-Gaussiano

1 Equacoes de Estimacao Generalizadas (ModeloMarginal)

2 Modelos Lineares Mistos Generalizados (Modelode Efeitos Aleatorios)

33/55

Page 34: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelando a Media

Necessitamos modelar a media em ambos modelos;

Usamos Analise Exploratoria para propor uma forma parametrica;

Precisamos fazer os graficos na escala da funcao de ligacao.

34/55

Page 35: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Resposta Binaria: Dificuldade para Evacuar

Obs.: idade foi arrendonda para mes (um unico digito).

2 4 6 8 10 12

−2.

4−

2.2

−2.

0−

1.8

−1.

6−

1.4

−1.

2

idade (meses)

logi

t

Dif. Evacuar (escala logit)

35/55

Page 36: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Resposta Contagem: Freq. Evac / semana

Obs.: idade foi arrendonda para mes (um unico digito).

2 4 6 8 10 12

01

23

4

idade (meses)

log

cont

agem

Dif. Evacuar (escala logit)

36/55

Page 37: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

”Muscatine Coronary Risk Factor Study”

Obesidade ( %)Genero Coorte Idade 1977 1979 1981Meninos

5-7 7.9 15.4 21.27-9 18.8 20.5 23.7

9-11 21.2 22.7 22.511-13 24.3 21.8 19.413-15 19.2 21.1 18.2

Meninas5-7 14.0 17.2 25.17-9 16.5 24.0 24.9

9-11 25.4 26.2 22.211-13 23.8 22.1 19.913-15 22.9 25.8 20.9

37/55

Page 38: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Marginais: GEE

Modelo Marginal significa que a media (populacional) dependesomente das covariaveis de interesse.

Em outras palavras, a media nao incorpora dependencia atravesde efeitos aleatorios nem de repostas em tempos anteriores.

Nao e necessario assumir distribuicao para a resposta: GEE.

Nao e necessario ser balanceado.

38/55

Page 39: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Marginais: GEE

Equacoes de Estimacao Generalizadas

N∑i=1

D′i V−1i (Yi − µi) = 0,

em que

Di = ∂µi/∂β e µi = g−1(Xiβ), ou seja, o inverso da funcao deligacao g.

Var(Yi) = Vi = φA1/2i (β)Ri(α)A1/2

i (β)

em que Ai e uma matriz diagonal formada por Var(Yij), Ri ematriz de correlacao de trabalho e φ e um parametro dedispersao/escala.Var(β) e estimada pela variancia robusta (estimador sanduiche).

39/55

Page 40: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Formas de Correlacao de Trabalho

independencia, R i(α) = In;⇒ dados longitudinais nao correlacionados.

simetria composta, especifica que R i(α) = ρ1n1′n + (1− ρ)1n;⇒ mesma correlacao.

AR-1, para a qual R i(α) = ρ|j−j ′|;⇒ valida para medidas igualmente espacadas no tempo;

nao estruturada estima todas as n(n − 1)/2 correlacoes de R.

40/55

Page 41: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Variancia do Estimador

1 Naive ou “baseada no modelo”

Var(β) =

(N∑

i=1

D′iV i(α)−1D i

)−1

. (1)

2 Robusta ou “empırica”

Var(β) = M−10 M1M−1

0 , (2)

em que

M0 =N∑

i=1

D′iV i(α)−1D i ,

M1 =N∑

i=1

D′iV i(α)−1(y i − µi)(y i − µi)

′V i(α)−1D i .

41/55

Page 42: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Exemplo: Bernoulli-logit

1 µij = E(Yij) = P(Yij = 1).

2

logit(µij) = log(µij/(1− µij)) = X ′ijβ

µij =eX ′

ijβ

1 + eX ′ijβ

3

Var(Yij) = µij(1− µij)

4

νij = µij(1− µij) Ai = diag(νi1, νi2 . . . , νin)

42/55

Page 43: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Exemplo: Poisson-log

1 log(µij) = X ′ijβ.

µij = eX ′ijβ

2

Var(Yij) = µij = eX ′ijβ

3

νij = eX ′ijβ = µij

43/55

Page 44: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Estimando a Correlacao de Trabalho

Liang e Zeger (1986) utilizaram estimativas de momento para osparametros da matriz de correlacao de trabalho.

Ou seja, utilizar estimadores baseados nos resıduos para asquantidades envolvidas em Ri .

Resıduos de Pearson:

eij =yij − µij√

νij,

em que νij = µij(1− µij) para resposta binaria e νij = µij , paracontagem.

44/55

Page 45: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Estimadores de Momento usando Resıduos

Estrutura Cor(Yij ,Yil ) EstimativaIndependencia 0 -Simetria Composta α α = 1/N

∑Ni=1 1/(n(n − 1)

∑j 6=l eijeil

AR1 α α = 1/N∑N

i=1 1/(n − 1)∑

j≤k−1 eijeij+1

Nao Estruturada αjl αjl = 1/N∑N

i=1 eijeil

φ =1N

N∑i=1

1n

n∑i=1

e2ij

45/55

Page 46: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Ajustando GEE

1 Use MLE para encontrar a estimativa inicial para β (assumindoindependencia)

2 Encontre os resıduos e estime α e φ.

3 Faca iteracoes em 1-2 ate a convergencia.

4 Estime Var(β) usando o estimador sanduıche.

46/55

Page 47: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Ajustando GEE

geeglm(formula = difpevac ˜ sexo + legumin + idademeses + sangue +constag + factor(aleitamcod3), family = binomial(link = "logit"),data = dados, id = Paciente, corstr = "exchangeable",std.err = "san.se")

Coefficients:Estimate Std.err Wald Pr(>|W|)

(Intercept) -0.8132 0.2272 12.81 0.00034 ***sexo -0.5263 0.2182 5.82 0.01585 *legumin 0.4818 0.2465 3.82 0.05065 .idademeses -0.1860 0.0382 23.67 1.1e-06 ***sangue 2.1227 0.3308 41.17 1.4e-10 ***constag 0.5268 0.2851 3.41 0.06465 .factor(aleitamcod3)1 0.0290 0.2617 0.01 0.91175factor(aleitamcod3)2 0.6493 0.3256 3.98 0.04615 *---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Estimated Scale Parameters:Estimate Std.err

(Intercept) 0.984 0.193

Correlation: Structure = exchangeable Link = identity

Estimated Correlation Parameters:Estimate Std.err

alpha 0.184 0.0539Number of clusters: 151 Maximum cluster size: 12

47/55

Page 48: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Lineares Generalizados Mistos

1 Modelos Lineares Generalizados

Resposta na famılia exponencial: normal, gama, exponencial,Bernoulli, Poisson, etc.

Preditor Linear: X ′i β.

Funcao de Ligacao: g(µi ) = X ′i β.

2 Modelos Lineares Generalizados Mistos

Preditor Linear:

Xiβ + Zibi

.48/55

Page 49: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Modelos Generalizado Misto Longitudinal

1

g(E(Yij |bi)) = X ′ijβ + Z ′ijbi

em que:(β)p×1 : efeitos fixos;(bi)q×1 : efeitos aletaorios.

e,2

bi ∼ Nq(0,Σ) e εij ∼ N(0, σ2)

Sendo bi e εij independentes.

49/55

Page 50: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Funcao de Verossimilhanca

L(θ/y) =N∏

i=1

p(yi/θ)

=N∏

i=1

∫p(yi ,bi/θ)dbi

=N∏

i=1

∫p(yi/bi , θ)p(bi/θ)dbi

=N∏

i=1

∫ n∏j=1

p(yij/bi , θ)p(bi/θ)dbi

em que,p(yi/bi , θ) ∼ Bernoulli-logit/Poisson-log, etc

ep(bi/θ) ∼ Nq(0,Σ)

50/55

Page 51: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Solucao

No modelo linear-normal, a integral pode ser resolvidaanaliticamente.

Em geral, aproximacoes sao necessarias no caso nao-normal.

Aproximacao do integrando: Laplace

Aproximacao dos dados

Aproximacao da integral: quadratura gaussiana.

Usualmente, a combinacao normal-logit nao tem solucao simples.

51/55

Page 52: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Interpretacao dos Parametros

Vetor β no GEE tem interpretacao populacional. Ou seja, amesma interpretacao dos modelos transversais.

Vetor β no modelo GLMM tem interpretacao condicional sob onıvel dos efeitos aleatorios. Ou seja, interpretacao especıfica paracada indivıduo.

Por exemplo:

log(

P(Yij = 1|bi)

P(Yij = 0|bi)

)= X ′ijβ + bi

A interpretacao e de razao de chances somente para o mesmoindivıduo, caso contrario teremos bi e bj que nao vao cancelar.

52/55

Page 53: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Interpretacao dos Parametros

Portanto, as estimativas dos modelos sao diferentes.

Em casos mais simples, os parametros apresentam uma relacao.

Por exemplo, modelo logıstico com somente intercepto aleatorio,

βEA

βM=√

c2σ2β0

+ 1 > 1

em que

c =16√

(3)

15π= 0,346

53/55

Page 54: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Interpretacao dos Parametros

Exemplo: Razao de Chances - Modelo Logit-normal

RC =P(Yi = 1|Xi = x + 1)/P(Yi = 0|Xi = x + 1)

P(Yl = 1|Xl = x)/P(Yl = 0|Xl = x)

= bi + β(x + 1)− (bl + βx)

= β + (bi − bl)

54/55

Page 55: Análise de Dados Longitudinais Modelos Lineares ...enricoc/pdf/longitudinais/aulas/aula8.pdf · Analise de Dados Longitudinais´ ... 2 Modelos Estat´ısticos Modelos Lineares Generalizados

Mecanismo Evacuatorio de Recem-Nascidos

151 recem-nascidos acompanhados nos primeiros 12 meses devida no Hospital das Clınicas da UFMG em 2010 e 2011.

Acompanhamento mensal totalizando 1751 medidas (61 perdas)

Resposta: Binarias: Dificuldade para evacuar.

Variavel temporal: idade (em dias ou meses).

Covariaveis: 1- fixa (sexo) e 2- dependentes do tempo:Aleitamento materno, dieta (0/1): cereais; frutas; vegetais, carnes,etc.Objetivo: avaliar o comportamento temporal das respostas e seusrespectivos indicadores.

55/55