introduÇÃo À anÁlise de sobrevivÊncia e confiabilidade fulano de tal 1 beltrano da silva 2...

1
INTRODUÇÃO À ANÁLISE DE SOBREVIVÊNCIA E CONFIABILIDADE Fulano de Tal 1 Beltrano da Silva 2 Cleber Giugioli Carrasco 3* 1 Bolsista PIBIC/CNPq 2 Bolsista PBIC/UEG 3 Orientador – Curso de Matemática – Unidade Universitária de Ciências Exatas e Tecnológicas – UEG •e-mail: cleber.carrasco@ueg.br INTRODUÇÃO Análise de Sobrevivência é o estudo de dados relacionados ao tempo até a ocorrência de um determinado evento de interesse (falha), a partir de um tempo inicial até um tempo final (tempo de falha). A análise de sobrevivência e confiabilidade é uma das áreas da estatística que mais tem crescido nos últimos anos, uma evidência quantitativa deste sucesso é o número de aplicações de análise de sobrevivência na área médica e industrial. Na medicina, além do tempo até o falecimento do paciente, estuda-se entre outros, o tempo até a ocorrência de uma determinada doença ou complicação da mesma, tempo de duração da doença, tempo até a cura, etc. Condições similares ocorrem em outras áreas do conhecimento, como, por exemplo, na engenharia, onde são comuns os estudos para determinar se certo produto dura mais do que tantos anos. Essa área é denominada Confiabilidade. Em análise de sobrevivência e confiabilidade é comum termos a presença de censuras nos dados. Vários fatos podem colaborar para a ocorrência de censuras. Entre outros podemos citar, o evento de interesse pode não ocorrer até o final do tempo de estudo, devido a diversas peculiaridades como, por exemplo, o abandono de pacientes antes do término da pesquisa ou a falha de um determinado componente devido a outras causas não consideradas no estudo. Estes fatos comprometem a observação do tempo de vida para alguns indivíduos. Portanto, a necessidade da introdução de uma variável que indique se o tempo de vida foi ou não observado se faz necessária. Essa variável é definida na literatura como variável indicadora de censura ou simplesmente censura. Neste trabalho faz-se uma pequena introdução à análise de sobrevivência e confiabilidade, apresentando a função de sobrevivência e a função de risco. Também apresentamos um método não- paramétrico de estimação da função de sobrevivência conhecido como estimador de Kaplan-Meier. Exemplos numéricos ilustram a metodologia adotada. MATERIAL E MÉTODO Seja T uma variável aleatória não-negativa a qual representa o tempo de falha, tal variável é usualmente especificada pela sua função de sobrevivência ou função de taxa de falha (ou risco). A seguir apresentamos estas duas funções e apresentaremos o estimador de Kaplan-Meier. A Função de Sobrevivência A função de sobrevivência S(t) é definida como a probabilidade de uma observação não falhar até um certo tempo t. Desta forma, podemos escrever S(t) como: ( 1 ) A Tabela 1 apresenta algumas funções de sobrevivência que podem ser expressas analiticamente e que são normalmente utilizadas em análise de sobrevivência e confiabilidade. Tabela 1: Algumas funções de sobrevivência paramétricas. * é a função distribuição acumulada de uma normal padrão. A Função de Risco A função de risco, representada por h(t), especifica a taxa de falha instantânea no tempo t condicionada à sobrevivência até o tempo t e é dada por (Cox & Oakes, 1984): ( 2 ) Devido a sua interpretação, a função de risco tem sido preferida por muitos autores, uma vez que ela descreve como a probabilidade instantânea de falha se modifica com o passar do tempo. Além disso, através da função de risco podemos obter classes especiais de distribuições de sobrevivência. Por exemplo, a distribuição exponencial acomoda funções de riscos constantes, isto é, h(t)=1/μ, enquanto que se a função de risco for monotonicamente decrescente ou crescente em t, temos uma distribuição de Weibull (Lawless, 1982). As distribuições log-normal e log-logística acomodam funções de risco unimodais (Kalbfleish & Prentice, 1980). A Tabela 2 apresenta algumas funções de risco que podem ser expressas analiticamente e que são comumente utilizadas em análise de sobrevivência paramétrica. Tabela 2: Algumas funções de risco paramétricas. A função de risco do modelo log-normal não pode ser escrita analiticamente. Estimador de Kaplan-Meier Considere um estudo envolvendo n indivíduos, e que os tempos (não censurados) de sobrevivência (distintos), são ordenados, isto é, t (1) < t (2) < ... < t (r) . Note que r n (no caso em que o conjunto de dados não apresenta nenhum valor repetido e nenhum valor censurado temos r = n). O estimador de Kaplan-Meier é dado por: RESULTADOS E DISCUSSÃO Consideremos o exemplo extraído de Colosimo (2001), onde o fabricante de um tipo de isolador elétrico quer conhecer o comportamento de seu produto funcionando na temperatura de 200ºC. Um teste de vida foi realizado nestas condições usando 60 isoladores elétricos. O teste terminou quando 45 deles haviam falhado, e os tempos (horas) das falhas foram: 151, 164, 336, 365, 403, 454, 455, 473, 538, 577, 592, 628, 632, 647, 675, 675, 727, 785, 801, 811, 816, 867, 893, 930, 937, 976, 1008, 1040, 1051, 1060, 1183, 1329, 1334, 1379, 1380, 1633, 1769, 1827, 1831, 1849, 2016, 2282, 2415, 2430, 2686, 2729. As 15 unidades que não haviam falhado foram censuradas em t = 2729. Dessa forma temos as funções de sobrevivência dos modelos exponencial, weibull e log-normal dadas abaixo por: ( 4 ) ( 5 ) ( 6 ) A Tabela 3 apresenta os resultados das estimativas para a função de sobrevivência através do estimador de Kaplan-Meier e, através dos modelos paramétricos ajustados: exponencial, weibull e log-normal. Por exemplo no tempo t = 403, temos que a estimativa de Kaplan-Meier é de 0,917, enquanto que as estimativas dos modelos ajustados log-normal, weibull e exponencial são 0,901; 0,879 e 0,819, respectivamente. Tabela 3: Estimativas da função de sobrevivência para os modelos exponencial, weibull, log-normal e para estimador de Kaplan-Meier. A Figura 1 abaixo, apresenta um indicativo de que o modelo log-normal se ajusta melhor ao conjunto de dados do que os outros dois modelos propostos: weibull e exponencial. Figura 1: Gráfico da Função de Sobrevivência para os Modelos exponencial(verde), weibull(vermelha),log-normal(azul) e para o estimador de Kaplan-Meier(preta). CONCLUSÕES Neste trabalho introduzimos o conceito de análise de sobrevivência e confiabilidade, apresentando as definições das funções de sobrevivência e de risco. Também, apresentamos algumas funções paramétricas de sobrevivência e de risco que são comumente utilizadas em análise de sobrevivência e confiabilidade. Para o exemplo extraído de Colosimo (2001), modelamos os dados através da função de sobrevivência paramétrica, onde podemos observar (Figura 1) que há um indicativo de que o modelo log-normal se ajusta melhor aos dados, do que os modelos exponencial e weibull. REFERÊNCIAS BIBLIOGRÁFICAS 1. Cox, D. R. Oakes, D. Analysis of Survival Data. London: Chapman and Hall, 1984. 201p. 2. Colosimo, E. A. Análise de Sobrevivência Aplicada. 46ª Rbras. 2001. 145p. . t T P t S D istribuição Função de Sobrevivência Exponencial t e W eibull t e Log-N orm al / log t * . / lim 0 t t T t t T t P t h t D istribuição Função de Risco Exponencial 1 W eibull 1 t Log-Logística t t 1 UNIVERSIDADE ESTADUAL DE GOIÁS UNIVERSIDADE ESTADUAL DE GOIÁS l exponenci ) 2018 / exp( ) ( ˆ t t S weib ] ) 1994 / ( exp[ ) ( ˆ 28 , 1 t t S normal - log ] 95 , 0 / ) 225 , 7 ) (log( [ ) ( ˆ t t S t i K-M Exp. W eib. Lnor. t i K-M Exp. W eib. Lnor. 151 0,983 0,928 0,964 0,990 937 0,600 0,629 0,684 0,656 164 0,967 0,922 0,960 0,987 976 0,583 0,616 0,670 0,640 336 0,950 0,847 0,903 0,931 1008 0,567 0,607 0,659 0,627 365 0,933 0,835 0,893 0,918 1040 0,550 0,597 0,648 0,615 403 0,917 0,819 0,879 0,901 1051 0,533 0,594 0,644 0,611 454 0,900 0,799 0,861 0,878 1060 0,517 0,591 0,641 0,607 455 0,883 0,798 0,860 0,877 1183 0,500 0,556 0,599 0,562 473 0,867 0,791 0,854 0,869 1329 0,483 0,518 0,552 0,514 538 0,850 0,766 0,830 0,838 1334 0,467 0,516 0,550 0,512 577 0,833 0,751 0,815 0,819 1379 0,450 0,505 0,536 0,498 592 0,817 0,746 0,810 0,812 1380 0,433 0,505 0,536 0,498 628 0,800 0,733 0,796 0,795 1633 0,417 0,445 0,461 0,428 632 0,783 0,731 0,795 0,793 1769 0,400 0,416 0,424 0,395 647 0,767 0,726 0,789 0,786 1827 0,383 0,404 0,409 0,382 675 0,750 0,716 0,779 0,772 1831 0,367 0,404 0,408 0,381 727 0,733 0,697 0,760 0,748 1849 0,350 0,400 0,403 0,377 785 0,717 0,678 0,739 0,722 2016 0,333 0,368 0,363 0,343 801 0,700 0,672 0,733 0,715 2282 0,317 0,323 0,304 0,297 811 0,683 0,669 0,729 0,710 2415 0,300 0,302 0,278 0,276 816 0,667 0,667 0,727 0,708 2430 0,283 0,300 0,276 0,274 867 0,650 0,651 0,709 0,686 2686 0,267 0,264 0,231 0,240 893 0,633 0,642 0,699 0,675 2729 0,250 0,259 0,224 0,235 930 0,617 0,631 0,686 0,659 t t i i i t t i i i i i i n d n d n t S / / , 1 ) ( ˆ 0 500 1000 1500 2000 2500 3000 tem po 0.0 0.2 0.4 0.6 0.8 1.0 S o b revivê ncia

Upload: internet

Post on 22-Apr-2015

104 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: INTRODUÇÃO À ANÁLISE DE SOBREVIVÊNCIA E CONFIABILIDADE Fulano de Tal 1 Beltrano da Silva 2 Cleber Giugioli Carrasco 3* 1 Bolsista PIBIC/CNPq 2 Bolsista

INTRODUÇÃO À ANÁLISE DE SOBREVIVÊNCIA E CONFIABILIDADE

Fulano de Tal1

Beltrano da Silva2

Cleber Giugioli Carrasco3*

1 Bolsista PIBIC/CNPq2 Bolsista PBIC/UEG

3 Orientador – Curso de Matemática – Unidade Universitária de Ciências Exatas e Tecnológicas – UEG•e-mail: [email protected]

INTRODUÇÃO

Análise de Sobrevivência é o estudo de dados relacionados ao tempo até a ocorrência de um determinado evento de interesse (falha), a partir de um tempo inicial até um tempo final (tempo de falha). A análise de sobrevivência e confiabilidade é uma das áreas da estatística que mais tem crescido nos últimos anos, uma evidência quantitativa deste sucesso é o número de aplicações de análise de sobrevivência na área médica e industrial.

Na medicina, além do tempo até o falecimento do paciente, estuda-se entre outros, o tempo até a ocorrência de uma determinada doença ou complicação da mesma, tempo de duração da doença, tempo até a cura, etc. Condições similares ocorrem em outras áreas do conhecimento, como, por exemplo, na engenharia, onde são comuns os estudos para determinar se certo produto dura mais do que tantos anos. Essa área é denominada Confiabilidade.

Em análise de sobrevivência e confiabilidade é comum termos a presença de censuras nos dados. Vários fatos podem colaborar para a ocorrência de censuras. Entre outros podemos citar, o evento de interesse pode não ocorrer até o final do tempo de estudo, devido a diversas peculiaridades como, por exemplo, o abandono de pacientes antes do término da pesquisa ou a falha de um determinado componente devido a outras causas não consideradas no estudo. Estes fatos comprometem a observação do tempo de vida para alguns indivíduos. Portanto, a necessidade da introdução de uma variável que indique se o tempo de vida foi ou não observado se faz necessária. Essa variável é definida na literatura como variável indicadora de censura ou simplesmente censura.

Neste trabalho faz-se uma pequena introdução à análise de sobrevivência e confiabilidade, apresentando a função de sobrevivência e a função de risco. Também apresentamos um método não-paramétrico de estimação da função de sobrevivência conhecido como estimador de Kaplan-Meier. Exemplos numéricos ilustram a metodologia adotada.

MATERIAL E MÉTODO

Seja T uma variável aleatória não-negativa a qual representa o tempo de falha, tal variável é usualmente especificada pela sua função de sobrevivência ou função de taxa de falha (ou risco). A seguir apresentamos estas duas funções e apresentaremos o estimador de Kaplan-Meier.

• A Função de Sobrevivência

A função de sobrevivência S(t) é definida como a probabilidade de uma observação não falhar até um certo tempo t. Desta forma, podemos escrever S(t) como:

( 1 )

A Tabela 1 apresenta algumas funções de sobrevivência que podem ser expressas analiticamente e que são normalmente utilizadas em análise de sobrevivência e confiabilidade.

Tabela 1: Algumas funções de sobrevivência paramétricas.

* é a função distribuição acumulada de uma normal padrão.

• A Função de Risco

A função de risco, representada por h(t), especifica a taxa de falha instantânea no tempo t condicionada à sobrevivência até o tempo t e é dada por (Cox & Oakes, 1984):

( 2 )

Devido a sua interpretação, a função de risco tem sido preferida por muitos autores, uma vez que ela descreve como a probabilidade instantânea de falha se modifica com o passar do tempo. Além disso, através da função de risco podemos obter classes especiais de distribuições de sobrevivência. Por exemplo, a distribuição exponencial acomoda funções de riscos constantes, isto é, h(t)=1/μ, enquanto que se a função de risco for monotonicamente decrescente ou crescente em t, temos uma distribuição de Weibull (Lawless, 1982). As distribuições log-normal e log-logística acomodam funções de risco unimodais (Kalbfleish & Prentice, 1980). A Tabela 2 apresenta algumas funções de risco que podem ser expressas analiticamente e que são comumente utilizadas em análise de sobrevivência paramétrica.

Tabela 2: Algumas funções de risco paramétricas.

A função de risco do modelo log-normal não pode ser escrita analiticamente.

• Estimador de Kaplan-Meier

Considere um estudo envolvendo n indivíduos, e que os tempos (não censurados) de sobrevivência (distintos), são ordenados, isto é, t(1) < t(2) < ... < t(r). Note que r n (no caso em que o conjunto de dados não apresenta nenhum valor repetido e nenhum valor censurado temos r = n).

O estimador de Kaplan-Meier é dado por:

( 3 )

onde: di: número de falhas no tempo ti; ni: número de observações sob risco (não falhou e não foi censurado) até o tempo ti (exclusive).

RESULTADOS E DISCUSSÃO

Consideremos o exemplo extraído de Colosimo (2001), onde o fabricante de um tipo de isolador elétrico quer conhecer o comportamento de seu produto funcionando na temperatura de 200ºC. Um teste de vida foi realizado nestas condições usando 60 isoladores elétricos. O teste terminou quando 45 deles haviam falhado, e os tempos (horas) das falhas foram: 151, 164, 336, 365, 403, 454, 455, 473, 538, 577, 592, 628, 632, 647, 675, 675, 727, 785, 801, 811, 816, 867, 893, 930, 937, 976, 1008, 1040, 1051, 1060, 1183, 1329, 1334, 1379, 1380, 1633, 1769, 1827, 1831, 1849, 2016, 2282, 2415, 2430, 2686, 2729. As 15 unidades que não haviam falhado foram censuradas em t = 2729.

Dessa forma temos as funções de sobrevivência dos modelos exponencial, weibull e log-normal dadas abaixo por:

( 4 )

( 5 )

( 6 )

A Tabela 3 apresenta os resultados das estimativas para a função de sobrevivência através do estimador de Kaplan-Meier e, através dos modelos paramétricos ajustados: exponencial, weibull e log-normal. Por exemplo no tempo t = 403, temos que a estimativa de Kaplan-Meier é de 0,917, enquanto que as estimativas dos modelos ajustados log-normal, weibull e exponencial são 0,901; 0,879 e 0,819, respectivamente.

Tabela 3: Estimativas da função de sobrevivência para os modelos exponencial, weibull, log-normale para estimador de Kaplan-Meier.

A Figura 1 abaixo, apresenta um indicativo de que o modelo log-normal se ajusta melhor ao conjunto de dados do que os outros dois modelos propostos: weibull e exponencial.

Figura 1: Gráfico da Função de Sobrevivência para os Modelos exponencial(verde), weibull(vermelha),log-normal(azul) e para o estimador de Kaplan-Meier(preta).

CONCLUSÕES

Neste trabalho introduzimos o conceito de análise de sobrevivência e confiabilidade, apresentando as definições das funções de sobrevivência e de risco. Também, apresentamos algumas funções paramétricas de sobrevivência e de risco que são comumente utilizadas em análise de sobrevivência e confiabilidade. Para o exemplo extraído de Colosimo (2001), modelamos os dados através da função de sobrevivência paramétrica, onde podemos observar (Figura 1) que há um indicativo de que o modelo log-normal se ajusta melhor aos dados, do que os modelos exponencial e weibull.

REFERÊNCIAS BIBLIOGRÁFICAS

1. Cox, D. R. Oakes, D. Analysis of Survival Data. London: Chapman and Hall, 1984. 201p.2. Colosimo, E. A. Análise de Sobrevivência Aplicada. 46ª Rbras. 2001. 145p.3. Kalbfleisch, J.D., Prentice, R.L. The Statistical Analysis of Failure Time Data. New York: Wiley, 1980.4. Kaplan. E.L. and Meier P.,”Nonparametric estimation from incomplete observations”, Journal American Statistical Association, 53, 1958.5. Lawless, J.F. Statistical Models and Methods for Lifetime Data. New York: Wiley, 1982. 580p.

.tTPtS

Distribuição Função de Sobrevivência

Exponencial

t

e

Weibull

t

e

Log-Normal /log t *

.

/lim

0 t

tTttTtPth

t

Distribuição Função de Risco

Exponencial

1

Weibull

1t

Log-Logística

t

t 1

UNIVERSIDADE ESTADUAL DE GOIÁSUNIVERSIDADE ESTADUAL DE GOIÁS

lexponencia )2018/exp()(ˆ ttS

weibull])1994/(exp[)(ˆ 28,1ttS

normal-log ]95,0/)225,7)(log([)(ˆ ttS

ti K-M Exp. Weib. Lnor. ti K-M Exp. Weib. Lnor. 151 0,983 0,928 0,964 0,990 937 0,600 0,629 0,684 0,656 164 0,967 0,922 0,960 0,987 976 0,583 0,616 0,670 0,640 336 0,950 0,847 0,903 0,931 1008 0,567 0,607 0,659 0,627 365 0,933 0,835 0,893 0,918 1040 0,550 0,597 0,648 0,615 403 0,917 0,819 0,879 0,901 1051 0,533 0,594 0,644 0,611 454 0,900 0,799 0,861 0,878 1060 0,517 0,591 0,641 0,607 455 0,883 0,798 0,860 0,877 1183 0,500 0,556 0,599 0,562 473 0,867 0,791 0,854 0,869 1329 0,483 0,518 0,552 0,514 538 0,850 0,766 0,830 0,838 1334 0,467 0,516 0,550 0,512 577 0,833 0,751 0,815 0,819 1379 0,450 0,505 0,536 0,498 592 0,817 0,746 0,810 0,812 1380 0,433 0,505 0,536 0,498 628 0,800 0,733 0,796 0,795 1633 0,417 0,445 0,461 0,428 632 0,783 0,731 0,795 0,793 1769 0,400 0,416 0,424 0,395 647 0,767 0,726 0,789 0,786 1827 0,383 0,404 0,409 0,382 675 0,750 0,716 0,779 0,772 1831 0,367 0,404 0,408 0,381 727 0,733 0,697 0,760 0,748 1849 0,350 0,400 0,403 0,377 785 0,717 0,678 0,739 0,722 2016 0,333 0,368 0,363 0,343 801 0,700 0,672 0,733 0,715 2282 0,317 0,323 0,304 0,297 811 0,683 0,669 0,729 0,710 2415 0,300 0,302 0,278 0,276 816 0,667 0,667 0,727 0,708 2430 0,283 0,300 0,276 0,274 867 0,650 0,651 0,709 0,686 2686 0,267 0,264 0,231 0,240 893 0,633 0,642 0,699 0,675 2729 0,250 0,259 0,224 0,235 930 0,617 0,631 0,686 0,659

tti i

i

tti i

ii

iin

d

n

dntS

//

,1)(ˆ

0 500 1000 1500 2000 2500 3000

tempo

0.0

0.2

0.4

0.6

0.8

1.0

So

bre

viv

ên

cia