análise de dados longitudinais modelos lineares mistosenricoc/pdf/longitudinais/aulas/aula6.pdf ·...

61
An´ alise de Dados Longitudinais Modelos Lineares Mistos Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ ˜ enricoc/ 1/61

Upload: others

Post on 16-Mar-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Analise de Dados LongitudinaisModelos Lineares Mistos

Enrico A. Colosimo/UFMGhttp://www.est.ufmg.br/˜enricoc/

1/61

Page 2: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto

1 Modelo de Efeitos Fixos: apresenta somente fatores fixos, excetoo termo do erro experimental (erro de medida).

2 Modelo Misto: apresenta tanto fatores fixos quanto aleatorios,alem do erro experimental.

2/61

Page 3: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto

Ideia:

Os parametros da regressao variam de indivıduo paraindivıduo explicando as fontes de heterogeneidade dapopulacao.

Cada indivıduo tem a sua propria trajetoria media e umsubconjunto dos parametros de regressao sao tomadoscomo aleatorios.

Efeitos fixos sao compatilhados por todos os indivıduos e osaleatorios sao especificos de cada um.

3/61

Page 4: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto

Exemplo: Intercepto aleatorio

Yij = β0i + β1tij + εij = β0 + b0i + β1tij + εij

Intercepto Aleatório

Xij

E((Y

ij))

4/61

Page 5: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto

Exemplo: Intercepto e Inclinacao aleatorios

Yij = β0i + β1i tij + εij = β0 + b0i + β1tij + b1i tij + εij

Intecepto e Inclinação Aleatórios

tempo_ij

E((Y

ij))

5/61

Page 6: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto

Caracterısticas:

1 Caracterısticas populacionais β (fixos);

2 Caracterısticas individuais βi ou bi (aleatorios).

Efeito:

1 Media: E(Yi ) = Xiβ

2 Estrutura de Covariancia: Efeito aleatorio induz Var(Yi ).

Separa a variacao entre individuos daquela intra individuos.

3 Permite obter estimativa de trajetorias individuais no tempo.

6/61

Page 7: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto - Simetria Composta

Exemplo: Yij = β0i + βtij + εij (Intercepto aleatorio).

β0i ∼ N(β0, σ2β0

).

εij ∼ N(0, σ2).β0i e εij sao independentes.

1 Var(Yij) = σ2 + σ2β0

.2 Cov(Yij ,Yij ′) = σ2

β0

7/61

Page 8: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo Linear Misto - Inclinacao aleatoria

Exemplo: Yij = β0i + β1i tij + εij (Intercepto e inclinacao aleatorios).

β0i ∼ N(β0, σ2β0

), β1i ∼ N(β1, σ2β1

), Cov(β0i , β1i) = σβ01 .

εij ∼ N(0, σ2).β′ = (β0i , β1i) e εij sao independentes.

1 Var(Yij) = σ2β0

+ σ2β1

t2ij + 2tijσβ01 + σ2.

2 Cov(Yij ,Yij ′) = σ2β0

+ tij tij ′σ2β1

+ (tij + tij ′)σβ01 .

8/61

Page 9: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Vantagens

1 Predizer trajetorias individuais

Yij = Xijβ + bi + εij

Resposta Media populacional:

E(Yij) = Xijβ

Resposta media para o i-esimo indivıduo (trajetoria):

E(Yij/bi) = Xijβ + bi .

2 Flexibilidade em acomodar estruturas nao balanceadas

9/61

Page 10: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Forma Geral do Modelo Misto

Yi = Xiβ + Zibi + εi

em que:

(β)p×1 : efeitos fixos;(bi)q×1 : efeitos aletaorios.

e,bi ∼ Nq(0,Σ) e εij ∼ N(0, σ2)

Sendo bi e εij independentes.

q ≤ p ⇒ Zi e um subconjunto de Xi

Incluimos efeitos aleatorios somente para as covariaveis que variamcom o tempo.

10/61

Page 11: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Caracterıstica do Modelo

1 Media Populacional ou Marginal

E(Yi) = Xiβ.

2 Media condicional ou especıfica por indivıduo

E(Yi |bi) = Xiβ + Zibi .

3 Covariancia Marginal

Var(Yi) = ZiVar(bi)Z ′i + σ2Ini .

4 Podemos assumir que εi ∼ N(0,Ri) mas o usual e tomarRi = σ2Ini e interpreta-lo como covariancia condicional. Ou seja,

Var(Yi/bi) = Ri = σ2Ini .

11/61

Page 12: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Inferencia para o Modelo Misto

Yi = Xiβ + Zibi + εi ,

em que,bi ∼ Nq(0,Σ(α)) e εij ∼ N(0, σ2),

bi e εij independentes.

Desta forma tem-se:

p efeitos fixos e q(q+1)2 + 1 efeitos aletaorios.

Inferencia Estatıstica para θ = (β, α, σ2);

1 Maxima Verossimilhanca.

2 Maxima Verossimilhanca Restrita.

12/61

Page 13: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Funcao de Verossimilhanca

L(θ/y) =N∏

i=1

p(yi/θ)

=N∏

i=1

∫p(yi ,bi/θ)dbi

=N∏

i=1

∫p(yi/bi , θ)p(bi/θ)dbi

em que,p(yi/bi , θ) ∼ Nn(Xiβ + Zibi , σ

2I)

ep(bi/θ) ∼ Nq(0,Σ)

13/61

Page 14: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Observacoes

1 EMV E obtido usando verossimilhanca perfilada e iteracoes viaalgoritmo EM ou/e Newton-Raphson. Detalhes numericos podemser encontrados em Pinheiro e Bates (2000), Cap. 2.

2 O EMVR tambem pode ser obtido atraves de

l ∗ (θ) = l(θ) + termo.

3 A funcao lme do R fornece EMVR e EMV usando um enfoquehıbrido (EM + Newton-Raphson). Esta funcao e de autoria dePinheiro e Bates.

4 EMV e EMVR tem assintoticamente as propriedades usuais deum estimador de maxima verossimilhanca (consistencia enormalidade).

14/61

Page 15: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Avaliacao dos Componentes de Variancia

1 Numero de componentes e igual a q(q+1)2 + 1 em que q e o

numero de efeitos aleatorios no modelo.

2 Muitas situacoes envolvem q = 2 (intercepto e inclinacaoaleatorios) e portanto:

2(2 + 1)

2+ 1 = 4,

que permite termos heterogeneidade de variancias e covarianciaspois ficam em funcao do tempo.

3 A escolha da ”melhor”estrutura de variancia-covariancia pode serrealizada utilizando o teste da RMVR. Estes testes, usualmente,sao na fronteira do espaco de parametros. Neste caso, aestatıstica da RMVR nao tem, sob H0 uma distribuicaoqui-quadrado.

15/61

Page 16: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Dist. da Estatıstica da RMVR sob H0

1 Para comparar dois modelos encaixados, respectivamente comq + 1 e q efeitos aleatorios correlacionados, a distribuicao, sob H0e uma mistura (50:50) de dist. qui-quadrados. Ou seja,

RMVR ∼ 0,5χq + 0,5χq+1

2 Exemplo (H0 : σβ1 = σ01 = 0)Modelo completo: q=2 (intercepto e inclinacao aleatorios)Modelo restrito: q=1 (somente intercepto aleatorio)

Teste usual (errado): nıvel de significancia: 5,99Teste correto:

RMVR ∼ 0,5χ1 + 0,5χ2

nıvel e 5,14 (Tabela, Apend. C, Fitzmaurice et al, 2004).

3 Proposta ad hoc: para testar a 0,05, use o nıvel de 0,10, nestecaso o nıvel e 4,61.

16/61

Page 17: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Transmissao Vertical - HIV

Estudo Longitudinal Desbalanceado: Avaliacao longitudinal docrescimento de lactentes nascidos de maes infectadas com o HIV-1.

Comparar longitudinalmente altura de lactentes infectados enao-infectados nascidos de maes infectadas pelo HIV.

Uma coorte aberta acompanhada no ambulatorio de AIDSpediatrica do Hospital das Clınicas da Universidade Federal deMinas Gerais.

Perıodo: 1995 a 2003.

Inclusao: primeiros tres meses de vida.

Grupos: (1) nao-infectados: 97; (2) infectados: 42.

Controlado por sexo.17/61

Page 18: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Perfis medio por grupo

0 5 10 15

5060

70

Gráfico para os Grupos

Idade

Altu

ra

infectadosnão−infectados

0 5 10 15

5060

70

Gráfico para Meninos e Meninas

Idade

Altu

ra

meninasmeninos

18/61

Page 19: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelo para a Media Populacional

Modelo Polinomial:

E(Yij) = β0 + β1tij + β2t2ij + β3sexoi + β4statusi

+ β5tij ∗ sexoi + β6tij ∗ grupoi + β7t2ij ∗ sexoi + β8t2

ij ∗ grupoi

19/61

Page 20: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Criancas - Transmissao Vertical - Modelos Misto

Modelo quadratico para a media com termos de interacao.

Termos aleatorios: intercepto + linear, intercepto + linear +quadratico.

Comparacao dos dois modelos: RMVR (combinacao dequi-quadrado)> anova(out,out1)

Model df AIC BIC logLik Test L.Ratio p-valueout 1 16 5708.332 5791.164 -2838.166out1 2 13 5817.677 5884.978 -2895.838 1 vs 2 115.3451 <.0001

Resultados para os quatro termos da interacao.

Coeficiente Interc. Inter + linear tres termosEst. EP Est. EP Est. EP

Idade:grupo −0,142 0,027 −0,161 0.049 −0,148 0,050Idade2:grupo 0,018 0,005 0,022 0,004 0,026 0,007Idade:sexo 0,100 0,025 0,131 0,045 0,114 0,046Idade2:sexo −0,015 0,005 −0,009 0,004 −0,013 0,007

20/61

Page 21: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Criancas - Transmissao Vertical - Modelo Marginal (gls)

Modelo quadratico para a media com termos de interacao.

Algumas formas para a Var(Yi): exponencial, simetria composta.

Resultados para os quatro termos da interacao.

Coeficiente Indep. (Incorreto) Exponencial Simetria CompostaEst. EP Est. EP Est. EP

Idade:grupo −0,164 0,041 −0,160 0.057 −0,142 0,027Idade2:grupo 0,020 0,008 0,017 0,008 0,018 0,005Idade:sexo 0,046 0,037 0,165 0,052 0,100 0,025Idade2:sexo −0,014 0,007 −0,020 0,008 −0,015 0,005

21/61

Page 22: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Criancas - Transmissao Vertical - GEE

Modelo quadratico para a media com termos de interacao.

Algumas formas para a Var(Yi): exponencial, simetria composta.

Modelo para media com 9 termos (interceptos diferentes)

Resultados para os quatro termos da interacao.

Coeficiente Independente Simetria CompostaEst. EP Est. EP

Idade:grupo −0,164 0,059 −0,142 0,057Idade2:grupo 0,020 0,011 0,018 0,008Idade:sexo 0,046 0,050 0,100 0,047Idade2:sexo −0,014 0,009 −0,015 0,007

Obs. As estimativas sao as mesmas do gls-normal e o erro-padraofica inflacionado (ambos simetria composta).

22/61

Page 23: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Formulacao em dois Estagios do Modelo Linear Misto

1 Estagio 1

Medidas Longitudinais no i-esimo indivıduo sao modeladas como:

Yi = Ziβi + εi

em que Zi covariaveis intra-indivıduo (tempo dependente) e

εi ∼ N(0, σ2In).

2 Estagio 2

βi : aleatorio (variando de indivıduo para indivıduo) tal que:

E(βi) = Aiβ

em que Ai contem somente covariaveis que variam entreindivıduos (nao dependente do tempo) e

23/61

Page 24: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Formulacao em dois Estagios do Modelo Linear Misto

Var(βi) = Σ.

Desta forma,

Yi = Zi(Aiβ + bi) + εi

= Xiβ + Zibi + εi

Em que,

Xi = ZiAi

obtem-se o modelo de efeitos aleatorios.

24/61

Page 25: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Predicao dos Efeitos Aleatorios

Objetivo: predizer perfis individuais ou identificar indivıduos acima ouabaixo do perfil medio.

Obs.: nao dizemos estimar os efeitos pois os mesmos sao aleatorios.Dizemos predizer os efeitos aleatorios.

Deseja-se:Yi = E(Yi/bi) = Xi β + Zi bi

e para tal necessita-se de bi , o chamado Estimador BLUP (”BestLinear Unbiased Predictor”) de bi .

25/61

Page 26: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Predicao dos Efeitos Aleatorios

No modelo linear misto,

Yi e bi tem uma distribuicao conjunta normal multivariada.

Usando conhecidas propriedades da normal multivariada, temosque

E(bi/Yi , β) = ΣZ ′i Var(Yi)−1(Yi − Xi β)

Usando os estimadores MVR dos componentes de variancia,

bi = ΣZ ′i Var(Yi)−1(Yi − Xi β)

o BLUP de bi .

26/61

Page 27: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Predicao dos Efeitos Aleatorios

Desta forma obtemos:

Yi = Xi β + Zi bi

= Xi β + Zi ΣZ ′i Var(Yi)−1(Yi − Xi β)

= Xi β + (Zi ΣZ ′i + Ri − Ri)Var(Yi)−1(Yi − Xi β)

= (Ri Var(Yi)−1)Xi β + (Ini − Ri Var(Yi)

−1)Yi

em que Var(εi) = Ri .

Interpretacao: media ponderada entre a media populacional Xi β e oi-esimo perfil observado. Isto signfica que o perfil predito e encolhidona direcao da media populacional.

27/61

Page 28: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Interpretacao dos Efeitos Aleatorios Preditos

Ou seja,

Ri : variacao intra-indivıduo:Var(Yi): variacao total.

Ri grande, mais peso em Xi β;Var(bi) grande, mais peso em Yi ;ni pequeno mais peso em Xi β.

28/61

Page 29: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Analise de Resıduos e Diagnostico

Pontos Principais:

A analise de dados longitudinais nao fica completa sem aexaminacao dos resıduos. Ou seja, a verificacao das suposicoesimpostas ao modelo e ao processo de inferencia.

As ferramentas usuais de analise de resıduos para a regressaoconvencional (com observacoes independentes) podem serestendidas para a estrutura longitudinal.

29/61

Page 30: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Suposicoes dos Modelos

Estrutura da media: forma analıtica, linearidade dos β’s.

Normalidade (resposta e efeitos aleatorios).

Estrutura de Variancia-Covariancia: Homocedasticidade ecorrelacao das medidas do mesmo indivıduo.

30/61

Page 31: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Resıduos

Defina o vetor de resıduos para cada indivıduo

ri = Yi − Xi β, i = 1, . . . ,N,

que e um estimador para o vetor de erros

εi = Yi − Xiβ, i = 1, . . . ,N.

Tratando-se de dados longitudinais, sabemos que oscomponentes do vetor de resıduos ri sao correlacionados e naonecessariamente tem variancia constante.

31/61

Page 32: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Utilidade dos Resıduos ri

Graficos:

Grafico de rij vs Yij : e util para identificar alguma tendenciasistematica (por exemplo, presenca de curvatura) e presenca depontos extremos (”outliers”). O modelo corretamente especificadonao deve apresentar nenhuma tendencia neste grafico.

Limitacao: este grafico nao tem necessariamente uma larguraconstante. Ou seja, cuidado ao interpretar este grafico comrelacao a homocedasticidade.

Grafico de rij vs tij : e tambem util para identificar algumatendencia sistematica da media no tempo.

32/61

Page 33: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Solucao: Examinar resıduos transformados

Ha muitas possibilidades para transformar os resıduos.

A tranformacao deve ser realizada de forma que os resıduos“imitem”aqueles da regressao linear padrao.

Os resıduos r∗i definidos a seguir sao nao-correlacionados e temvariancia unitaria:

r∗i = L−1i ri ,

em que Li e a matriz triangular superior resultante dadecomposicao de Cholesky da matriz de covariancias estimadaVar(Yi), ou seja, Var(Yi) = LiL′i .

33/61

Page 34: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Resıduos transformados

Podemos aplicar a mesma transformacao ao vetor de valorespreditos Yi , ao vetor da variavel resposta Yi e a matriz decovariaveis Xi :

Yi∗

= L−1i Yi

Y ∗i = L−1i Yi

X∗i = Li−1

Xi

e entao todos os diagnosticos de resıduos usuais para aregressao linear padrao podem ser aplicados para r∗i .

34/61

Page 35: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Graficos de Adequacao

Grafico de dispersao dos resıduos transformados r∗ij versus osvalores preditos transformados Y ∗ij : nao deve apresentar nenhumpadrao sistematico para um modelo corretamente especificado.Ou seja, deve apresentar um padrao aleatorio em torno de umamedia zero. Util para verificar homocedasticidade.

Grafico de dispersao dos resıduos transformados r∗ij versuscovariaveis transformadas X ∗ij (em especial, idade ou tempo):verificar padroes de mudanca na resposta media ao longo dotempo;

QQ-plot de r∗i : verificar normalidade e identificar outliers.

35/61

Page 36: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Semi-variograma

O semi-variograma, denotado por γ(hijk ), e dado por:

γ(hijk ) =12

E(rij − rik )2,

em que hijk = tij − tik .

O semi-variograma pode ser utilizado como uma ferramenta paraverificar a adequacao do modelo selecionado para a estrutura decovariancia dos dados.

36/61

Page 37: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Semi-variograma

Como os resıduos tem media zero, o semi-variograma pode serreescrito como:

γ(hijk ) =12

E(rij − rik )2

=12

E(r2ij + r2

ik − 2rij rik )

=12

Var(rij) +12

Var(rik )− Cov(rij , rik ).

Quando o semivariograma e aplicado aos resıduostransformados, r∗ij , a seguinte simplificacao e obtida:

γ(hijk ) =12

(1) +12

(1)− 0 = 1.

37/61

Page 38: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Semi-variograma

Logo, se o modelo e corretamente especificado para a matriz decovariancias, o grafico do semi-variograma amostral γ(hijk ) dosresıduos transformados versus hijk deveria flutuar aleatoriamenteem torno de uma linha horizontal centrada em 1.

O semi-variograma e muito sensıvel a outliers.

38/61

Page 39: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Estudo de caso: Influencia da menarca nas mudancas dopercentual de gordura corporal

Estudo prospectivo do aumento de gordura corporal em umacoorte de 162 garotas.

Sabe-se que o percentual de gordura nas garotas tem umaumento consideravel no perıodo em torno da menarca (primeiramenstruacao).

Parece que este aumento continua significativo poraproximadamente quatro anos depois da menarca, mas estecomportamento ainda nao foi devidamente estudado.

As meninas foram acompanhadas ate quatro anos depois damenarca.

39/61

Page 40: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Estudo de Caso

Ha um total de 1049 medidas, com uma media de 6,4 medidaspor menina.

Variaveis de interesse:Resposta: Percentual de gordura corporal;

Covariaveis: Tempo em relacao a menarca (Idade da menina noinstante observado menos Idade quando teve a menarca) - podeser positivo ou negativo.

40/61

Page 41: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Figura: Grafico de perfis com curva alisada

41/61

Page 42: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

O modelo inicialmente proposto considera que cada garota temuma curva de crescimento spline linear com um knot no tempo damenarca.

Ajustou-se o seguinte modelo linear de efeitos mistos:

E(Yij |bi) = β1 + β2tij + β3(tij)+ + b1i + b2i tij + b3i(tij)+,

em que

(tij)+ =

{tij se tij > 00 se tij ≤ 0.

42/61

Page 43: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Lembremos que no modelo linear de efeitos mistos, a matriz devariancia-covariancia de Yi e dada por:

Var(Yi) = ZiΣZ ′i + σ2Ini ,

em que Zi e a matriz de covariaveis relacionadas aos efeitosaleatorios, Σ e a matriz de covariancia dos efeitos aleatorios e nie o numero de observacoes do i−esimo indivıduo, i = 1, . . . ,N.

Logo, os resıduos transformados neste caso podem ser obtidos apartir da decomposicao de Cholesky da matriz estimadaVar(Yi) = Zi ΣZ ′i + σ2Ini .

43/61

Page 44: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Resultados do ajuste:

Tabela: Coeficientes de regressao estimados (efeitos fixos) e erros padroes

Variavel Estimativa EP t p-valorIntercepto 21,3614 0,5646 37,8400 0,0000

Tempo 0,4171 0,1572 2,6500 0,0081(Tempo)+ 2,0471 0,2280 8,9800 0,0000

Tabela: Covariancias estimadas para os efeitos aleatorios (G) e variancia estimadapara os erros (σ2)

Parametro Estimativa Parametro EstimativaVar(b1i) = g11 45,9407 Cov(b1i , b2i) = g12 2,5275Var(b2i) = g22 1,6309 Cov(b1i , b3i) = g13 -6,1141Var(b3i) = g33 2,7496 Cov(b2i , b3i) = g23 -1,7513

Var(ei) = σ2 9,4734

44/61

Page 45: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Analise de resıduos:

Resíduos

Den

sida

de

−20 −10 0 10 20

0.00

0.02

0.04

Resíduos transformados

Den

sida

de

−4 −2 0 2 4

0.00

0.10

0.20

0.30

Figura: Histograma dos resıduos e resıduos transformados, com curva Normal

45/61

Page 46: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

−3 −2 −1 0 1 2 3

−20

−10

010

20

Quantis da Normal Padrão

Qua

ntis

dos

Res

íduo

s

−3 −2 −1 0 1 2 3−

4−

20

24

Quantis da Normal Padrão

Qua

ntis

dos

Res

íduo

s Tr

ansf

orm

ados

Figura: QQ-plot dos resıduos e resıduos transformados

46/61

Page 47: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

20 22 24 26 28 30 32

−20

−10

010

20

Valores preditos

Res

íduo

s

−5 0 5

−4

−2

02

4

Valores preditos transformados

Res

íduo

s tr

ansf

orm

ados

Figura: Resıduos vs Preditos e Resıduos transformados vs Preditos transformados

47/61

Page 48: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

−6 −4 −2 0 2 4

−20

−10

010

20

Tempo em relação à menarca

Res

íduo

s

−0.5 0.0 0.5 1.0

−4

−2

02

4

Tempo transformado

Res

íduo

s tr

ansf

orm

ados

Figura: Resıduos vs Tempo e Resıduos transformados vs Tempo transformado

48/61

Page 49: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Da figura anterior (Resıduos vs Tempo), observa-se umatendencia quadratica no perıodo apos a menarca.

Refinando o modelo anterior, consideraremos agora que cadagarota tem uma curva de crescimento spline linear-quadraticacom um knot no tempo da menarca.

Ajustou-se o seguinte modelo linear de efeitos mistos:

E(Yij |bi) = β1 + β2tij + β3(tij)+ + β4(tij)2+ + b1i + b2i tij +

+ b3i(tij)+ + b4i(tij)2+,

em que

(tij)2+ =

{t2ij se tij > 00 se tij ≤ 0.

49/61

Page 50: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Resultados do ajuste:

Tabela: Coeficientes de regressao estimados (efeitos fixos) e erros padroes

Variavel Estimativa EP t p-valorIntercepto 20,4201 0,5817 35,1032 0,0000

Tempo -0,0155 0,1612 -0,0962 0,9234(Tempo)+ 4,8439 0,4055 11,9446 0,0000(Tempo)2

+ -0,6469 0,0772 -8,3842 0,0000

Tabela: Covariancias estimadas para os efeitos aleatorios (G) e variancia estimadapara os erros (σ2)

Parametro Estimativa Parametro EstimativaVar(b1i) = g11 48,0586 Cov(b1i , b3i) = g13 -9,5900Var(b2i) = g22 1,7326 Cov(b1i , b4i) = g14 0,6479Var(b3i) = g33 5,3693 Cov(b2i , b3i) = g23 -1,5342Var(b4i) = g44 0,1172 Cov(b2i , b4i) = g24 -0,1735

Cov(b1i , b2i) = g12 3,0295 Cov(b3i , b4i) = g34 -0,4395

Var(ei) = σ2 8,027450/61

Page 51: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Analise de resıduos:

Resíduos

Den

sida

de

−20 −10 0 10 20

0.00

0.02

0.04

Resíduos transformados

Den

sida

de

−4 −2 0 2 4 6

0.00

0.10

0.20

0.30

Figura: Histograma dos resıduos e resıduos transformados, com curva Normal

51/61

Page 52: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

−3 −2 −1 0 1 2 3

−20

−10

010

20

Quantis da Normal Padrão

Qua

ntis

dos

Res

íduo

s

−3 −2 −1 0 1 2 3−

4−

20

24

Quantis da Normal Padrão

Qua

ntis

dos

Res

íduo

s Tr

ansf

orm

ados

Figura: QQ-plot dos resıduos e resıduos transformados

52/61

Page 53: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

20 22 24 26 28 30 32

−20

−10

010

20

Valores preditos

Res

íduo

s

−5 0 5

−4

−2

02

4

Valores preditos transformados

Res

íduo

s tr

ansf

orm

ados

Figura: Resıduos vs Preditos e Resıduos transformados vs Preditos transformados

53/61

Page 54: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

−6 −4 −2 0 2 4

−20

−10

010

20

Tempo em relação à menarca

Res

íduo

s

−1.0 −0.5 0.0 0.5 1.0

−4

−2

02

4

Tempo transformado

Res

íduo

s tr

ansf

orm

ados

Figura: Resıduos vs Tempo e Resıduos transformados vs Tempo transformado

54/61

Page 55: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Figura: Semi-variograma empırico para os resıduos transformados

55/61

Page 56: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Graficos de dispersao nao apresentam mais nenhuma tendenciaacentuada.

Semi-variograma esta oscilando aleatoriamente em torno da linhahorizontal 1.

Pela analise de resıduos, confirmamos a adequacao do segundomodelo proposto.

56/61

Page 57: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

O que fazer frente a violacao de suposicoes?

Verificar a estrutura da media.

Transformar a resposta.

Propor outra estrutura de Variancia-Covariancia para os erros(Modelo Marginal)

Modelar a estrutura variancia-covariancia do erro intra-indivıduo(erro de medida, Modelo de Efeito Aleatorios).

57/61

Page 58: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Verificar a Estrutura da Media

Existe alguma proposta teorica da area?

Perfis, especialmente os alisados, sao as principais ferramentas.

Propostas Empıricas: splines (com um ou no maximo dois knots),modelos lineares ou quadraticos. Possivelmente algo comodecaimento exponencial.

58/61

Page 59: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Transformar a resposta

Vantagens quando temos distribuicao assimetrica para aresposta. Por exemplo: custo. Utilizar transformacao logarıtmica.

Desvantagem: interpretacao dos resultados.

59/61

Page 60: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Propor outra estrutura de Variancia-Covariancia para os erros(Modelo Marginal)

Utilizar a nao-estruturada em delineamentos balanceados quandoo numero de tempos medidos nao for excessivo.

Incluir heterocedasticidade quando possıvel.

60/61

Page 61: Análise de Dados Longitudinais Modelos Lineares Mistosenricoc/pdf/longitudinais/aulas/aula6.pdf · Os parametros da regressˆ ao variam de indiv˜ ´ıduo para indiv´ıduo explicando

Modelar a variancia-covariancia do erro Intra Indivıduos (Modelode Efeito Aleatorios)

Suposicao: Var(εi) = σ2I.Podemos estruturar a

Var(εi).

Isso pode ser feito inclusive em termos de covariaveis.

O R ajusta alguns tipos de estrutura.

61/61