mÉtodos paramÉtricos para a anÁlise de dados de …de.ufpb.br/~tarciana/as/aula5.pdf · mÉtodos...

20
MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica, para estimar as funções básicas da análise de sobrevida, assume-se que o tempo de falha T segue uma distribuição conhecida de probabilidade. PERGUNTA: Que tipo de distribuição de probabilidade poderia representar T? LEMBRANDO: T é uma V.A. contínua não-negativa. I. T é uma V.A. contínua não-negativa. II. T apresenta forte assimetria. Dessa forma, a distribuição normal, que permite valores negativos, não é adequada para modelar o tempo de sobrevida. Alguns modelos mais utilizados, por se adaptarem a uma grande variedade de situações, são: exponencial, weibull e lognormal.

Upload: others

Post on 13-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA

� Nesta abordagem paramétrica, para estimar as funções básicas da análise de sobrevida, assume-se que o tempo de falha T segue uma distribuição conhecida de probabilidade.

� PERGUNTA: Que tipo de distribuição de probabilidade poderia representar T?

� LEMBRANDO: T é uma V.A. contínua não-negativa.I. T é uma V.A. contínua não-negativa.

II. T apresenta forte assimetria.

�Dessa forma, a distribuição normal, que permite valores negativos, não é adequada para modelar o tempo de sobrevida.

� Alguns modelos mais utilizados, por se adaptarem a uma grande variedade de situações, são: exponencial, weibull e lognormal.

Page 2: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

DISTRIBUIÇÕES BÁSICAS EM SOBREVIVÊNCIA

1. DISTRIBUIÇÃO EXPONENCIAL

� Em termos matemáticos, a distribuição exponencial é um dos modelos probabilísticos mais simples para descrever o tempo de vida .

� Esta distribuição apresenta um único parâmetro e é a única que se caracteriza por ter uma função de risco constante.

� É bastante utilizada para descrever o tempo de vida de certos produtos, bem como, o tempo de vida e remissão em doenças crônicas e infecciosas.

�A função densidade de probabilidade é dada por:

�Em que o parâmetro λ tem a mesma unidade do tempo de vida T.

.0),exp()( >−= λλλ ttf

Page 3: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� Utilizando-se as relações entre as funções básicas é possível obter as demais funções de sobrevivência.

� A função de sobrevivência é dada por:

� As funções de risco é dada por:

Page 4: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

ILUSTRAÇÃO DAS FUNÇÕES DE SOBREVIVÊNCIA SEGUNDO O MODELO EXPONENCIAL.

Page 5: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� O fato da taxa de falha (função de risco) ser constante significa que tanto uma unidade velha, quanto uma nova, que ainda não falharam, tem o mesmo risco de falhar em um intervalo futuro.

� Esta propriedade é chamada de falta de memória da distribuição exponencial.

� Apesar da simplicidade matemática, a suposição de risco constante é pouco plausível na maioria dos fenômenos da saúde e engenharia.pouco plausível na maioria dos fenômenos da saúde e engenharia.

� A distribuição exponencial pode ser uma boa aproximação quando o tempo de acompanhamento é curto o suficiente para que o risco naquele período possa ser considerado constante.

� Por exemplo, o risco de óbito de crianças entre dois e cinco anos pode ser considerado constante nesse intervalo.

Page 6: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� Lembrando: E(T)=1/λ e Var(T)=1/ λ2.

� TEMPO MÉDIO:

� TEMPO MEDIANO:

Como a variável T é assimétrica, muitas vezes faz mais sentido calcular o tempo mediano.

CARACTERÍSTICAS DE INTERESSE.

λ

1=médiot

� PERCENTIL 100p%:

5,0)( =medtS 5,0=− medte

λ

λλ

=−

=pp

t p

1ln

ln

Page 7: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

PROPRIEDADE DE FALTA DE MEMÓRIADA EXPONENCIAL

Page 8: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� EXEMPLO: Considere um estudo de 193 pacientes com aids, onde observou-se o tempo desde o diagnóstico até o óbito. Um modelo exponencial foi utilizado com λ=0,000497.

a) Obtenha o tempo médio de vida dos pacientes.

b) Qual o tempo mediano de vida?

c) Qual o tempo tal que cerca de 90% dos pacientes ainda estarão vivos?

d) Qual o percentual de pacientes que ainda estarão vivos após 10 anos do início do estudo?

Page 9: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

DISTRIBUIÇÕES BÁSICAS EM SOBREVIVÊNCIA

2. DISTRIBUIÇÃO WEIBULL

� A distribuição Weibull é uma generalização da distribuição exponencial.

� É bastante utilizada em aplicações práticas por apresentar uma grande variedade de formas: a sua função de risco é monótona, isto é, ela é variedade de formas: a sua função de risco é monótona, isto é, ela é crescente, decrescente ou constante.

� A distribuição Weibull é uma das mais utilizada para modelar tempos de sobrevida, particularmente em estudos nas áreas biomédica e industrial.

� Alguns exemplos: tempo até a ocorrência de tumores, estudo de mortalidade por causas específicas e tempo de incubação do HIV.

Page 10: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� A f.d.p. de uma V.A. T com distribuição de Weibull é dada por:

� O parâmetro de forma, e o de escala, são ambos positivos.

� O parâmetro λ tem a mesma unidade de medida do tempo e γ não tem unidade de medida.

� Função de sobrevivência:

γλγλλγ )(1)()( tettf

−−=

γ λ

Page 11: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� Funções de risco:

� Observe que para γ > 1: A função de risco é estritamente crescente.

γ < 1: A função de risco é estritamente decrescente.

γ = 1: A função de risco é constante, equivalendo ao modelo exponencial.

Page 12: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

ILUSTRAÇÃO DAS FUNÇÕES DE SOBREVIVÊNCIA SEGUNDO O MODELO WEIBULL.

Page 13: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

CARACTERÍSTICAS DE INTERESSE.

� As expressões para a média e a variância da Weibull incluem o uso da função gama.

λ

γ

=

11

)(TE

+Γ−

+Γ=

2

21121

1)(

γγλTVar

com

� Tempo mediano:

∫∞

−−=Γo

xkdxexk

1)(

Page 14: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

CARACTERÍSTICAS DE INTERESSE.

� Percentil: O percentil tp pode ser obtido por:

λ

γ1

1ln

=p

t p

Page 15: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� EXEMPLO: O tempo em dias para desenvolvimento de tumor em ratos expostios a uma substância cancerígena segue uma distribuição de Weibull com λ=0,01 e γ=2.

a) Qual é a probabilidade de um rato sobreviver sem tumor aos primeiros 30 dias?

b) Qual o tempo mediano até o aparecimento do tumor?

c) Ache a taxa de falha (risco) de aparecimento de tumor aos 30, 45 e 60 dias. Interprete esses valores.

Page 16: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

3. DISTRIBUIÇÃO LOGNORMAL

� É muito utilizada para caracterizar tempos de vida de produtos e indivíduos.

� Alguns exemplos: fadiga de metal, semicondutores e pacientes com leucemia.

� Existe uma relação entre as distribuições lognormal e normal que facilita a apresentação e análise de dados. que facilita a apresentação e análise de dados.

� O logaritmo de uma variável com distribuição lognormal segue uma distribuição normal com parâmetros e .

� A f.d.p. de uma variável aleatória T com distribuição lognormal é dada por:

0,)ln(

2

1exp

2

1)(

2

>

−−= t

t

ttf

σ

µ

πσ

µ 2σ

Page 17: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� A função de sobrevivência de uma variável lognormal não apresenta uma forma analítica explícita e é representada por:

em que é a função de distribuição acumulada de uma normal padrão.

� A função de risco apresenta uma forma analítica explícita e é representada por:

−−=−=

σ

µφ

)ln(1)(1)(

ttFtS

(.)φ

)()(

tfth =

representada por:

� A média (tempo médio) e a variância da distribuição lognormal são dadas, respectivamente, por

)(

)()(

tS

tfth =

{ }2

exp)(2σµ +=TE { }( ) { }22 2exp1exp)( σµσ +−=TVar

Page 18: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

ILUSTRAÇÃO DAS FUNÇÕES DE SOBREVIVÊNCIA SEGUNDO O MODELO LOGNORMAL.

Page 19: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� Observe que as funções de risco não são monótonas como as da distribuição Weibull. Elas crescem, atingem um valor máximo e depois decrescem.

� Os percentis podem ser obtidos por

Com zp o 100p% percentil da distribuição normal padrão (ver tabela da distribuição normal padrão).

[ ]µσ += pp zt exp

distribuição normal padrão).

� O tempo mediano:

� A popularidade dessa distribuição é em parte devido ao fato de que o valor acumulado de ln(t) pode ser obtido da tabela da distribuição normal padrão e o correspondente valor de t é então encontrado pela aplicação de antilogaritmo.

[ ]µσ += 5,0exp ztmed

Page 20: MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE …de.ufpb.br/~tarciana/AS/Aula5.pdf · MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA Nesta abordagem paramétrica,

� EXEMPLO: Considere que o tempo de duração de um equipamento seja uma V.A. modelada por uma distribuição log-normal com µ=0 e σ2=0,5. Encontre o tempo médio e o tempo mediano de duração do equipamento.