avaliação de testes disgnóstivo probabilidade

Upload: alecir-silva

Post on 02-Mar-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    1/21

    Universidade Federal de Minas GeraisInstituto de Cincias ExatasDepartamento de Estatstica

    Avaliao de Testes Diagnsticos

    Edna Afonso Reis

    Ilka Afonso Reis

    Relatrio Tcnico

    RTP-02/2002Srie Ensino

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    2/21

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    3/21

    NDICE

    1. Introduo 5

    2. Noes de Probabilidade 52.1. Conceitos Bsicos 52.2. Definio de Probabilidade 7

    2.3. Propriedades de Probabilidade 72.4. Probabalidade Condicional 82.5. Independncia de Eventos 8

    3. Medidas da Qualidade do Teste Diagnstico 93.1. Sensibilidade e Especificidade 93.2. A Influncia do Ponto de Corte 11

    4. Medidas da Qualidade do Diagnstico Baseado em um Teste 144.1. Os Valores de Predio Positiva e Negativa 144.2. Estimando os Valores de Predio 154.3. O Efeito da Prevalncia nos Valores de Predio 154.4. O Efeito da Sensibilidade e da Especificidade nos Valores de Predio 17

    5. Outros Exemplos Interessantes 19

    Referncias Bibliogrficas 21

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    4/21

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    5/21

    1. Introduo

    O diagnstico de uma doena um procedimento delicado por involver a vida depacientes, sejam eles seres humanos, animais e at mesmo plantas. Como instrumento auxiliarno processo de diagnstico, comum o uso de testes construdos a partir de medies feitas nos

    pacientes, sejam elas quantitativas ou qualititativas. Esses testes so chamados testes clnicosou

    testes diagnsticos.

    Atualmente, esses instrumentos tornaram-se to importantes e difundidos que existem grandesindstrias e laboratrios inteiramente dedicados produo de testes diagnsticos cada vez maisprecisos, mais rpidos e, s vezes, mais baratos.

    Sendo os testes diagnsticos procedimentos humanos, esto sujeitos a erro. Desse modo,antes que um teste seja adotado como instrumento auxiliar no diagnstico de determinadadoena, necessrio que suas possibilidades de erro sejam avaliadas. As medidas de avaliaoda qualidade de um teste clnico e do diagnstico baseado nele so o assunto deste texto.

    Quando falamos em diagnstico, no pensamos apenas em exames ou testes de detecode doenas. Podemos imaginar todo tipo de recurso para identificar uma dentre duas situaes,como o detector de mentira que, baseado em alteraes da voz, dos batimentos cardacos ou

    respirao, tem o objetivo de identificar uma mentira ou verdade. Ou ainda um exame anti-

    dopping em atletas, onde a doena seria o fato do atleta ter ingerido algum tipo de droga.Porm, como a grande maioria dos testes clnicos est relacionada ao diagnstico de doenas,

    essa abordagem tornou-se a mais comum. Neste texto, usaremos os termos doena, doentee sadio , sem nos esquecer de que as idias aqui apresentadas podem ser aplicadas a outroscontextos, como mostramos em alguns dos exemplos.

    Antes de conhecermos as medidas de qualidade para um teste clnico e para o diagnsticobaseado nele, devemos estudar um pouco de Probabilidade, que nos ajudar a lidar com aincerteza do diagntico a ser dado ao paciente.

    2. Noes de Probabilidade

    Probabilidade pode ser definida como a medida da (in)certeza sobre o acontecimento de

    um fato ou evento. Em nossa vida diria estamos freqentemente tomando decises baseadasna probabilidade, mesmo que, muitas vezes, no nos demos conta disso. Por exemplo, se, aosairmos de casa pela manh, no estamos certos sobre o fato de o tempo continuar ensolarado,procuramos nos precaver levando um guarda-chuva. Inconscientemente, atribumos um grau deincerteza ocorrncia de chuva baseados nas nuvens no cu, umidade no ar, comportamentodos bichos, etc.

    Em algumas situaes, possvel calcular a probabilidade de ocorrncia de um evento.Vamos comear a estudar os conceitos bsicos de probabilidade nessas situaes.

    2.1. Conceitos Bsicos

    Vamos definir experimento aleatrio, espao amostral e evento, conceitos importantes na

    definio de probabilidade.

    Experimento aleatrio aquele no qual os resultados possveis so conhecidos, mas nosabemos de antemo qual deles ir ocorrer.

    So exemplos de experimentos aleatrios:Experimento aleatrio 1: retirar uma carta de um baralho de 52 cartas e verificar sua cor;Experimento aleatrio 2: retirar uma carta de um baralho de 52 cartas e verificar o seu naipe;Experimento aleatrio 3: jogar um dado e observar a face de cima;Experimento aleatrio 4: sortear um estudante de uma lista e verificar a cor de seus olhos;Experimento aleatrio 5: sortear uma mulher na cidade e verificar quantos filhos ela tem.

    O conjunto de resultados possveis para um experimento chamado de seu espao amostral,(representado peloa letra E). Vejamos:

    Espao amostral do experimento aleatrio 1: E1= {preta, vermelha};

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    6/21

    Espao amostral do experimento aleatrio 2: E2= {copas, paus, ouros, espada};

    Espao amostral do experimento aleatrio 3: E3= {1, 2, 3, 4, 5, 6};

    Espao amostral do experimento aleatrio 4: E4= {preto, castanho, verde, azul};

    Espao amostral do experimento aleatrio 5: E5= {0, 1, 2, 3, 4, 5, 6, 7, 8,....}.

    Todo subconjunto do espao amostral de um experimento aleatrio chamado evento.No experimento aleatrio 1, se definirmos o evento A carta preta, ele ser representado

    pelo conjunto A={preta}. O evento A um exemplo de evento simples, pois contm somente um

    dos elementos do espao amostral.No experimento aleatrio 2, podemos definir o evento B como sendo carta vermelha. Assim,B = {copas,ouros}. Para o Experimento Aleatrio 5, o evento F mulher com nmero de filhosinferior a trs representado pelo conjunto F = {0,1,2}.

    No experimento aleatrio 3, o evento D face de cima igual a 7 um exemplo de evento

    vazio, pois o dado no tem a face 7. O evento D representado pelo conjunto vazio D = { } ou D =

    .Existe ainda um outro tipo de evento chamado evento complementar. O complementar de um

    evento formado pelos elementos do espao amostral que no fazem parte do evento. Porexemplo, considerando o evento B = {copas,ouros}, definido no espao amostral do ExperimentoAleatrio 2, o complementar de B formado por B = {paus, espada} . Juntos, os eventos B e Bformam o espao amostral E2. Da o nome evento complementar.

    Novos eventos sao obtidos pela combino de outros, atevs da unio ou interseo:

    Unio de Eventos (AB): o evento A unio B formado pelos elementos que esto em A ouem B.

    Interseo de Eventos (AB): o evento A interseo B formado pelos elementos queesto

    em A e em B ao mesmo tempo.

    Exemplo 2.1: Sejam os eventos A sair um nmero par na jogada de um dado , A = { 2, 4, 6}

    e B sair um nmero menor do que 4 na jogada de um dado, B = {1, 2, 3} .

    O evento unio formado por (A B) = {1, 2, 3, 4, 6} e o evento interseo formado por (A B) = { 2 }.

    O Diagrama de Venn uma representao grfica til para a visualizao das combinaesde eventos. No diagramas abaixo os eventos resultantes da unio e da interseo dos eventos A eB so representados pela rea hachurada.

    Evento (A B): Evento (A B):

    Dois eventos somutuamente exclusivosquando no possuem interseo. Este nome vemdo fato de que, se os eventos A e B no possuem elementos em comum, a ocorrncia de umdeles automaticamente exclui a ocorrncia do outro e vice-versa. Por exemplo, considere oexperimento aleatrio sortear cinco letras do alfabeto e formar uma palavra , cujo o espaoamostral formado pelas 26 letras do alfabeto. Seja o evento A as cinco primeiras letras doalfabeto, A = {a,b,c,d,e}, e o evento B a palavra formada POMBO. Se o experimento realizado e o evento A ocorre, a ocorrncia do evento B j est automaticamente excluda. Casoo evento B ocorra, o evento A estar automaticamente excludo. Um evento e seu complementarso sempre mutuamente exclusivos.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    7/21

    2.2. Definio de Probabilidade

    Quando os elementos do espao amostral tm a mesma probabilidade de ocorrerem, a

    definio clssica da probabilidadede um evento A ocorrer dada por

    amostralespaodoelementosdetotal

    AeventodoelementosdenmeroP(A)= .

    Exemplo 2.2: seja o experimento aleatrio jogar um dado e observar a face de cima. Se o dadofor honesto, todas as seis faces tm a mesma probabilidade de sarem para cima. Assim, aprobabilidade do evento F o nmero par, F = {2,4,6}, dada por P(F)=3/6=0,5.

    No entanto, a definio clssica no pode ser aplicada a situaes onde os elementos doespao amostral no possuam a mesma probabilidade de ocorrer, o que o caso da maioria das

    situaes prticas. Nesses casos, usaremos a definio frequentista de probabilidade, que forneceuma estimativa da probabilidade do evento de interesse atravs de sua frequncia em umgrande nmero de realizaes independentes do experimento.

    Exemplo 2.3: suponha que desejssemos conhecer a probabilidade de uma pessoa estar

    infectada com a bactria H. pylori. O experimento aleatrio consiste em selecionar uma pessoado grupo de interesse e verificar um dos resultados possveis: est infectada ou no estinfectada. Estes dois eventos do espao amostral no tm a mesma probabilidade de ocorrncia,o que impossibilita o uso da definio clssica de probabilidade. Atravs do exame de umagrande amostra de pessoas, usaremos a definio frequentista e estimaremos a probabilidade deuma pessoa estar infectada com a H. pyloriusando a frequncia relativa de pessoas infectadasnessa amostra.

    2.3. Propriedades da Probabilidade

    Seja um experimento aleatrio cujo o espao amostral dado pelo conjunto E. O evento A um evento definido dentro do espao amostral E. Para que um nmero possa ser consideradouma probabilidade, ele deve atender s seguintes propriedades.

    1.

    0 P(A) 12.

    P(E) = 13.

    P( A ) = 1 P(A)

    A propriedade 1 diz que no existe probabilidade que seja negativa e nem maior do que 1.Ou seja, um evento pode ser impossvel (probabilidade igual a zero), ou ocorrer com uma certaprobabilidade ou acontecer com certeza (probabilidade igual a 1).

    A propriedade 2 diz que a probabilidade de ocorra algum evento do espao amostral 1, ouseja, o resultado do experimento aleatrio tem que ser um ou mais elementos do espao amostral.

    A propriedade 3 muito til, pois freqentemente no sabemos como calcular aprobabilidade do evento A diretamente, mas sabemos como calcular a probabilidade do seucomplementar. Pela propriedade 3, podemos calcular a probabilidade de A indiretamente.

    A probabilidade da unio de dois1eventos calculada pela seguinte equao:

    P(A B) = P(A) + P(B) P(A B).

    Quando os eventos A e B forem mutuamente exclusivos, P(A B) = P(A) + P(B), pois P(A B)= 0.

    1 A expresso para o clculo da probabilidade da unio de trs eventos facilmente entendida com a ajuda do

    diagrama de Venn: P(A B C) = P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) + 2 P(A B C).

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    8/21

    Exemplo 2.4: Considere o experimento aleatrio jogar um dado e observar a face de cima.Sejam dois eventos: A o nmero maior do que 3, A = {4,5,6}; e B o nmero par , B = {2,4,6}.O evento (AB)={4,6}. Assim, P(A) = 3/6, P(B) = 3/6 e P(A B) = 2/6.Pela definio acima, P(A B) = 3/6 + 3/6 2/6 = 4/6.Se usarmos o fato de que (A B)= {2,4,5,6} e a primeira definio de probabilidade, chegaremosao mesmo resultado, pois

    6

    4

    amostralespaodoelementosdetotal

    B)(Aeventodoelementosdenmero)( =

    =BAP

    2.4. Probabilidade Condicional

    A probabilidade de um evento A ocorrer dado que o evento B ocorreu dada por:

    )(

    )()|(

    BP

    BAPBAP

    = , se P(B )> 0. (1)

    Exemplo 2.5: Considere o experimento aleatrio jogar um dado e observar a face de cima.Sejam dois eventos: F o nmero par, F = {2,4,6}; e B o nmero 2 , B={2}. Depois que oexperimento realizado, algum informa que o evento F ocorreu, ou seja, a face par. Dado que

    o evento F ocorreu, qual a probabilidade de o evento B ocorrer? Ou seja, dado que o nmero par, qual a probabilidade de ser o nmero 2?

    Usando definio (1), temos que

    3

    1

    63

    61

    })6,4,2({

    })2({

    )(

    )()|( ===

    =

    P

    P

    FP

    BFPFBP

    Outra maneira de obter esse resultado enxergar a informao da ocorrncia do evento F comouma reduo no espao amostral inicial, E={1,2,3,4,5,6}. Se sabemos que o nmero par, o novoespao amostral para a ocorrncia do evento B E={2,4,6}. Desse modo, podemos usar adefinio clssica diretamente: o nmero de elementos favorveis a B 1 dentre os trs resultados

    possveis do espao amostral reduzido E, sendo P(B|F) = 1/3.

    2.5. Independncia de Eventos

    Quando o conhecimento sobre a ocorrncia de um evento no altera a probabilidade deocorrncia de outro evento, esses eventos so ditosindependentes. Ou seja, se a ocorrncia de Bno altera a probabilidade de ocorrncia de A, os eventos A e B so independentes.

    Dizemos que o evento A independente do evento B se )()|( APBAP = .

    Assim, pela definio (1), se os eventos A e B so independentes P(A B) = P(A) x P(B).

    Exemplo 2.6: os eventos B e F do Exemplo 2.5 so exemplos de eventos dependentes, pois o

    conhecimento sobre a ocorrncia do evento F aumentou a probabilidade do evento B, que antesera de 1/6. Ou seja P(B|F) P(B). Se B dependente de F, tambm dependente docomplementar de F (F ), os nmeros mpares. Sabendo que o nmero mpar, a probabilidade deser o nmero 2 zero.

    Exemplo 2.7: seja o seguinte experimento aleatrio observar o nascimento dos dois primeiros f ilhosde um casal e verificar o sexo das crianas . O espao amostral E={ (F1 M2) , (F1 F2) ,(M1 F2), (M1 M2) }, onde F1 denota menina no primeiro nascimento e M2 denota menino nosegundo nascimento e assim por diante. At onde se sabe, cada uma das quatro combinaesque compem o espao amostral tem a mesma probabilidade de ocorrer, ou seja, . Mas, serque a ocorrncia de um menino no segundo nascimento (M2) independente da ocorrncia deuma menina no primeiro nascimento (F1)?

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    9/21

    Vejamos: O evento F1 menina no primeiro nascimento a unio de dois dos eventos do

    espao amostral, F1={(F1 M2) (F1 F2)}. Como no existe interseo entre esse dois eventos,P(F1) dada pela soma da probabilidade dos dois eventos, isto , 2/4. Usando o mesmoraciocnio, chegaremos concluso de que P(M2) tambm igual a 2/4. A probabilidade dainterseo de F1 e M2 P(F1 M2) = . Assim, verificamos que P(F1) x P(M2) = (2/4) x (2/4) = =P(F1 M2), ento os eventos F1 e M2 so independentes.

    3. Medidas da Qualidade do Teste Diagnstico

    Quando um teste diagnstico proposto para uma doena, ele deve passar por umaavaliao da sua qualidade de diagnosticar a doena ou a ausncia dela.

    A Figura 1 ilustra o que pode ocorrer quando o teste a ser avaliado aplicado a amostras deduas populaes, uma de pessoas sabidamente doentes e outra de no doentes. O resultado

    positivono teste significa um diagnstico de presena da doena e o resultado negativosignificaum diagnstico de ausncia da doena.

    Figura 1:

    O indivduo doente

    ouO indivduo

    no doente

    resultadopositivono teste

    ouresultadonegativono teste

    resultadopositivono teste

    ouresultadonegativono teste

    acerto

    do testeerro

    do testeerro

    do testeacerto

    do teste

    A definio da doena feita por outro teste ou critrio, chamado padro ouro. O padroouro tem baxissima possibilidade de erro, mas, em geral, um teste caro, difcil de ser feito oucausador de desconforto para o paciente.

    3.1.A Sensibilidade e a Especificidade de um Teste

    As duas situaes de acerto do teste diagnstico mostradas na Figura 1 esto associadas sprobabilidades chamadas de sensibilidade e especificidade do teste. Vamos adotar a seguintenotao para os eventos:

    D: o indivduo doente,

    D : o indivduo no doente,+: o indivduo do teste positivo,- : o indivduo do teste negativo.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    10/21

    Sensibilidade (s): a probabilidade do teste ter resultado positivo dado que o indivduo estdoente. Assim, na notao de probabilidade, temos

    )(

    )()|(

    DP

    DPDPs +

    =+= (2)

    que, na prtica, estimada pela proporo de resultados positivos do testedentre os indivduos sabidamente doentes.

    Especificidade(e): a probabilidade do teste teve resultado negativo dado que o indivduo noest doente. Assim na notao de probabilidade, temos

    )(

    )()|(

    DP

    DPDPe

    == (3)

    que, na prtica, estimada pela proporo de resultados negativos do testedentre os indivduos sabidamente no doentes.

    Assim, um teste muito sensvel til para detectar a presena da doena em indivduosdoentes: se o indivduo est doente, ele vai indicar isto com alta probabilidade. Por outro lado, umteste muito especfico um teste til para excluir a presena da doena em indivduos sadios: se oindivduo no est doente, ele vai indicar isto com alta probabilidade.

    Exemplo 1: O teste de Papanicolaou permite o diagnstico precoce do cncer de colo detero. Para avaliar a acurcia diagnstica deste teste, realizou-se um estudo com 373 pacientesatendidas no Hospital das Clnicas de Botucatu (Pinho e Matos, 2002). O teste padro-ouroutilizado em cada paciente para classific-la em portadora ou no do cncer de colo de terofoi o exame histopatolgico de uma amostra de tecido atravs de bipsia cervical. Os resultadosso apresentados na Tabela 1.

    Tabela 1: Resultados do teste Papanicolaou na deteco de cncer de colo de tero.Cncer de colo de teroResultado do testePapanicolaou Doente No Doente

    Total

    Positivo 265 47 312Negativo 11 50 61

    Total 276 97 373

    Baseados nesta amostra de 276 pacientes portadoras do cncer de colo tero, podemosestimar a sensibilidade do teste Papanicolaou:

    0,96

    276

    265===+=

    doentespacientesdeno.

    positivoresultadocomdoentespacientesdeno.)|( DPs ou 96%.

    Do mesmo modo, atravs da amostra de 97 pacientes no portadoras do cncer de colotero, podemos estimar a especificidade do teste Papanicolaou:

    0,51597

    50====

    doentesnopacientesdeno.

    negativoresultadocomdoentesnopacientesdeno.)|( DPe ou 51,5%.

    Este teste tem alta sensibilidade mas especificidade muito baixa.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    11/21

    Muitas vezes, quando divulga-se a capacidade de acerto de um teste, dado apenas o totalde acertos dividido pelo total de indivduos testados, sem separar os indivduos sadios dos doentes.No exemplo anterior, esta porcentagem de 84,5% ([265+50]/373).

    Entretanto, esta capacidade de acerto globaldo teste, sem distino entre acertos dentre osdoentes (sensibilidade) e os acertos entre no doentes (especificidade), pode ser poucoinformativa ou mesmo enganosa. Por exemplo, se um teste deu resultado positivo em 45 dos 50indivduos doentes, e resultado negativo em 15 dos 25 pacientes no doentes, a tal capacidadede acerto global do teste de (45+15)/(50+25)= 0,80 (80%), que pode ser considerada alta. Masnote que, embora a capacidade de acerto do teste seja mesmo bastante alta entre os doentes (s= 0,90), no alta entre os no doentes (e = 0,60). Informar apenas esta porcentagem global deacertos poderia levar falsa concluso de que o teste tem 80% de chance de acertar emqualquer caso (dado que o indivduo doente ou dado que o indivduo sadio), o que no verdade.

    3.2. A Influncia do Ponto de Corte

    Considere um exemplo genrico, onde a presena de uma doena detectada por umteste atravs da ocorrncia de valores altos de uma certa varivel contnua medida nospacientes, como, por exemplo, a medio de glicose no sangue para diagnosticar diabetes. Adefinio dos resultadospositivoe negativodo teste feita a partir da escolha de umponto de corte

    na escala valores da varivel: valores da medio acima do ponto de corte definem umresultado positivo e, abaixo, um resultado negativo no teste.A Figura 2 mostra, para esta situao, a distribuio dos valores da varivel entre os indivduos

    sadios e entre os indivduos doentes de uma populao, considerando trs pontos de corte.Nesta figura, a sensibilidade do teste a rea na curva dos doentes que est acima do ponto

    de corte; a especificidade a rea na curva dos no doentes que est abaixo do ponto decorte.

    medida que o ponto de corte aumenta, ou seja, passando da Figura 2(a) para a Figura3(c), a sensibilidade diminui, pois estamos sendo mais rigorosos na definio de um doente aoexigir valores mais altos da varivel para consider-lo positivo; ao mesmo tempo, aespecificidade aumenta.

    Este exemplo mostra que, em relao definio do ponto de corte, aumentar asensibilidade de um teste implica necessariamente em reduzir sua especificidade, e vice-versa.

    Nos testes baseados na medio de variveis quantitativas, a escolha do ponto de corte pode sera ferramenta para tornar o teste mais sensvel ou mais especfico, conforme o objetivo do seu uso.Na seo 4.4, veremos como esta escolha influenciar na qualidade do diagnstico baseado noteste.

    Exemplo 2:Acredita-se que um valor alto para a razo da medida da cintura pela medida doquadril (RCQ) seja indicativo de hipertenso arterial. Pereira at alli(1999) fizeram um estudo comhomens e mulheres de diversas faixas etrias. Foram consideradas hipertensas as pessoas compresso sistlica igual ou maior que 140 mmHg ou presso diastlica maior ou igual que 50 mmHg.

    Vrios pontos de corte do valor de RCQ foram considerados para definir o resultado positivono teste (valor de RCQ acima do ponto de corte). O Quadro 1 reproduz os resultados mostradosno artigo para mulheres de 40 a 50 anos de idade, das quais 59 foram consideradas hipertensas e

    326 no hipertensas.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    12/21

    Figura 2: A influncia do ponto de corte de definio do resultadodo teste na sensibilidade e na especificidade

    (a)

    (b)

    (c)

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    13/21

    Quadro 1: Reproduo de parte da Tabela 2 do artigo original de Pereira at alli (1999),referente aos resultados para mulheres de 40 a 50 anos de idade.

    Teste RCQ + se

    Hipertensa eTeste RCQ +

    Hipertensa eTeste RCQ -

    No hipertensae Teste RCQ +

    No hipertensae Teste RCQ -

    Sensibi--lidade (%)

    Especifi--cidade (%)

    > 0,75 59 0 325 1 100 0,3> 0,80 58 1 311 15 98,3 4,6> 0,85 54 5 262 64 91,5 19,6> 0,90 38 21 183 143 64,4 43,9

    > 0,95 28 31 95 231 47,5 70,9> 1,00 13 46 42 284 22 87,1> 1,05 5 54 18 308 8,5 94,5> 1,10 5 54 10 316 8,5 96,9> 1,15 0 59 7 319 0 97,9

    Os valores de sensibilidade e especificidade do Quadro 1 podem ser facilmente reproduzidospelo leitor. Por exemplo, para ponto de corte RCQ > 0,85, temos:

    0,915554

    54=

    +

    ==+=

    shipertensadeno.

    positivoresultadocomshipertensadeno.)|( DPs

    0,19664262

    64=

    +

    ===

    shipertensadeno.

    negativoresultadocomshipertensanodeno.)|( DPe .

    A Figura 3 mostra as curvas de sensibilidade e especificidade em funo dos diversos pontosde corte para o teste do RCQ. Verifica-se que, quanto maior o ponto de corte do RCQ, menor asensibilidade do teste. Isto ocorre porque se aumentamos o ponto de corte do RCQ, menospessoas hipertensas sero consideradas positivas pelo teste, reduzindo a sensibilidade. Por outrolado, mais pessoas no hipertensas sero consideradas negativas pelo teste, aumentando suaespecificidade, como podemos notar na Figura 3.

    Figura 3: Reproduo de parte da Figura 2 do artigo original de Pereira at alli (1999),referente aos resultados para mulheres de 40 a 50 anos de idade.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    14/21

    4. Medidas da Qualidade do Diagnstico Baseado em um Teste

    Um vez que um teste clnico adotado, devemos avaliar a qualidade do diagnsticobaseado nele. O usurio do teste no sabe se o indivduo est doente ou no; a nicainformao que ele tem o resultado do teste, positivo ou negativo. A Figura 4 ilustra o que podeocorrer quando o teste a ser avaliado aplicado a um indivduo.

    Figura 4:

    O resultado noteste positivo

    ouO resultado no

    teste negativo

    O indivduo doente

    ouO indivduono doente

    O indivduo doente

    ouO indivduo

    no doente

    acerto dodiagnstico

    erro dodiagnstico

    erro dodiagnstico

    acerto dodiagnstico

    4.1. Os Valores de Predio Positiva e Negativa

    s duas situaes de acerto do diagnstico baseado no teste mostradas na Figura 4 estoassociadas probabilidades chamadas de valor de predio positivae valor de predio negativadodiagnstico. Vejamos suas definies a seguir.

    Valor de Predio Positiva (VPP): a probabilidade do indivduo estar doente dado que o seuteste teve resultado positivo. Assim:

    )(

    )()|(

    +

    +=+=

    P

    DPDPVPP (4)

    Valor de Predio Negativa (VPN): a probabilidade do indivduo no estar doente dado queo seu teste teve resultado negativo. Assim:

    )(

    )()|(

    ==

    P

    DPDPVPN (5)

    Desse modo, o VPP e o VPN so, respectivamente, a probabilidade de acerto do diagnsticopositivo e a probabilidade de acerto do diagnstico negativo do teste. As probabilidades doseventos complementares deste acertos so chamadas Proporo de Falsos Positivos e Proporode Falsos Negativos, definidas a seguir.

    Proporo de Falsos Positivos (PFP): a probabilidade do paciente no estar doente dadoque o teste teve resultado positivo. Assim:

    )(

    )()|(

    +

    +=+=

    P

    DPDPPFP ou seja, VPPPFP = 1

    Proporo de Falsos Negativos (PFN): a probabilidade do paciente estar doente dado que oteste teve resultado negativo. Assim:

    )(

    )()|(

    ==

    P

    DPDPVPN ou seja, VPNPFN = 1

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    15/21

    4.2. Estimando os Valores de Predio

    A proporo de indivduos portadores da doena na populao chamada de prevalnciada doena na populao, denotada por p. A prevalncia p tambm pode ser interpretadacomo a probabilidade de um indviduo, selecionado aleatoriamente desta populao, serdoente, ou seja P(D) = p. Desse modo, a probabilidade do indivduo no ser doente dada porP( D )= 1 - p.

    O VPP e o VPN do diagnstico baseado no teste depende: da sensibilidade e da

    especificidade do teste, e da prevalncia da doena na populao. Deste modo, conhecendo s,ee p, podemos calcular o VPP e o VPN atravs das seguintes equaes

    2:

    +

    = (6)

    e

    +

    = (7)

    Exemplo 1 (continuao):Vamos voltar ao teste Papanicolaou para diagnstico do cncer decolo de tero apresentado anteriormente. Considerando uma populao com uma prevalnciade cncer de tero de 5% (p=0,05), os valores de predio positiva e negativa seriam calculadosda seguinte forma:

    094,0515,0

    =

    +

    =

    e 996,096,0

    =

    +

    =

    Assim, se aplicado a uma populao com uma prevalncia de cncer de tero de 5%, umapaciente com resultado negativo no teste Papanicolaou tem uma probabilidade muito alta(99,6%) de no ser portadora do cncer de colo de tero. No entanto, uma paciente comresultado positivo tem uma probabilidade muito pequena de ser realmente portadora da doena(9,4%). Desse modo, o resultado positivo do teste Papanicolaou pouco conclusivo, mas o

    resultado negativo muito confivel.Vamos considerar o VPP e o VPN do teste Papanicolaou aplicado a uma populao com

    prevalncia maior de cncer do colo do tero, digamos, p = 0,20:

    664,0515,0

    =

    +

    =

    e 981,096,0

    =

    +

    =

    .

    Note que h um aumento significativo no VPP e uma queda pequena no VPN. Na prximaseo discutiremos o efeito da prevalncia, da sensibilidade e da especificidade nos valores depredio positiva e negativa.

    4.3. O Efeito da Prevalncia nos Valores de PredioAtravs das equaes (6) e (7), reproduzidas abaixo, podemos ver que, para um

    determinado teste (ou seja, para valores fixos de sensibilidade e especificidade), quando maior aprevalncia da doena maior ser o VPP e menor ser o VPN:

    p)(1sp

    spVPP

    +

    =

    )1( e e

    s)pp)-e(1

    p)-e(1VPN

    +

    =

    1(.

    2Voc pode derivar estas equaes a partir das definies (4) e (5), escrevendo-as em funo das definies (2) e (3).

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    16/21

    Para visualizar este efeito da prevalncia nos valores de predio, observe a Figura 5. Nestegrfico, para avaliar apenas o efeito da prevalncia no VPP e no VPN fixamos os valor dasensibilidade em 0,8 e da especificidade em 0,7:

    p)0,3(10,8p

    0,8pVPP

    +

    = e0,2pp)-0,7(1

    p)-0,7(1VPN

    +

    = .

    Agora, nas equaes acima, VPP e VPN dependem apenas da prevalncia: para cada valor

    de p termos um valor diferente de VPP e VPN. Por exemplo, fazendo p = 0,4, temos:

    0,640,4)0,3(10,8(0,4)

    0,8(0,4)VPP =

    +

    = e 0,840,2(0,4)0,4)-0,7(1

    0,4)-0,7(1VPN =

    +

    = .

    Na Figura 4, mostramos os valores de VPP e VPN fazendo a prevalncia variar entre 0 e pode-se ver claramente que quanto maior a prevalncia da doena, maior ser o VPP e menor ser oVPN do disgnstico.

    Figura 5: Efeito da Prevalncia no VPP e no VPN.

    s = 0,8 ee = 0,7

    0,00

    0,20

    0,40

    0,60

    0,80

    1,00

    0 0,2 0,4 0,6 0,8 1

    Prevalncia

    VPPe

    VPN

    VPP

    VPN

    Exemplo 3: Atualmente, a presena do HIV-AIDS detectada rotineiramente pelo teste ELISAque tem sensibilidade de 95,0% e especificidade de 99,8% (Laboratrio ABBOTT). Em novembro de2002, o Laboratrio OraSure lanou o teste OraQuick (o resultado fica pronto em 20 minutos)

    com sensibilidade de 99,6% e especificidade de 100,0%.A Tabela 2 mostra os valores de predio positiva e negativa do diagnstico do HIV-AIDS

    baseado nestes testes para crescentes nveis de prevalncia da infeco.Como podemos notar, especialmente para o teste ELISA, medida que a prevalncia cresce,

    ocorre aumento no VPP e diminuio do VPN. Isso significa que o diagnstico baseado no testeELISA tem uma grande proporo de falsos positivos em populaes com baixa proporo deinfectados pelo HIV-AIDS, de modo que um resultado positivo deve ser investigada comrepeties do teste ou com outro teste. Por outro lado, o resultado negativo tem um valor depredio muito alto mesmo em grupos de altssima prevalncia. Esta uma caracterstica dostestes de triagem, onde os resultados negativos devem ser altamente confiveis, enquanto oscasos positivos so triados para novos testes.

    No caso do teste OraQuick, possvel observar somente um pequeno decrscimo no VPNpara grupos de altssimo risco. O VPP ser sempre o valor mximo de 100% devido ao fato de que

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    17/21

    o teste identifica todas as pessoas no infectadas (especificidade igual a 100%). Esta influncia dasensibilidade e da especificidade nos valores de predio assunto da prxima seo.

    Tabela 2: Valores de Predio Positiva e Negativa no diagnosticodo HIV-AIDS do teste Elisa e do teste OraQuick.

    ELISA (ABBOTT) OraQuick Prevalncia

    VPP (%) VPN (%) VPP (%) VPN (%)

    1 em 1 milho 0,05 100 100 1001 em 500 mil 0,09 100 100 1001 em 100 mil 0,47 100 100 1001 em 50 mil 0,94 100 100 1001 em 10 mil 4,54 100 100 1001 em 5 mil 8,68 100 100 1001 em mil 32,23 99,99 100 1001 em 500 48,77 99,99 100 1001 em 100 82,75 99,95 100 1001 em 50 90,65 99,90 100 99,991 em 10 98,14 99,45 100 99,96

    4.4. Estudando o Efeito da Sensibilidade e da Especificidade nos Valores de Predio

    Atravs das equaes (6) e (7), reproduzidas abaixo, podemos ver que, para prevalnciafixa, quanto maior o valor da sensibilidade e/ou da especificidade, maior ser o VPP e o VPN:

    +

    = e

    +

    = .

    Entretanto, vamos ver que o VPP mais afetado pela especificidade do que pela sensibilidade eque o VPN, ao contrrio, mais afetado pela sensibilidade.

    A Figura 6(a) mostra o efeito da especificidade no VPP, para prevalncia fixa em 5% e trsvalores fixos de sensibilidade, correspondentes a cada uma das curvas. Note que, em cada curva

    (sensibilidade fixa), quando a especificidade sobe de 0,75 para 0,95, o VPP aumentado em 0,30,enquanto que, para um valor fixo de especificidade, passando de uma curva para outra(aumento a sensibilidade de 0,75 para 0,95), ao VPP acrescido de apenas 0,08,aproximadamente. O grfico mostra que o mesmo aumento na especificidade ou nasensibilidade produz efeitos diferentes no VPP. Assim, se desejamos aumentar o valor de prediopositiva de um diagnstico (reduzir a probabilidade de falsos positivos), devemos investir noaumento da especificidade do teste.

    O efeito inverso mostrado na Figura 6(b): o mesmo aumento na sensibilidade ou naespecificidade produz efeitos diferentes no VPN, efeito este muito maior no caso de aumento nasensibilidade. Desse modo, se desejamos aumentar o valor de predio negativa de umdiagnstico (reduzir a probabilidade de falsos negativos), devemos investir no aumento dasensibilidade do teste.

    Juntamente com a anlise grfica feita anteriormente, podemos ver como a especificidade

    tem mais efeito no VPP do que no VPN considerando um caso extremo de um teste comespecicifidade em seu valor mximo. Se e=P(-|ND)=1, o resultado do teste negativo para todosos no-doentes. Como no existem no-doentes com teste positivo, todos os positivos so dedoentes: P(D|+) = 1 = VPP, ou seja, conseguimos fazer o VPP atingir seu valor mximo. Entretanto,no conseguimos este efeito no VPN=P(ND|-), pois, mesmo que a especificidade seja mxima,nem todos os negativos seriam de no-doentes.

    O mesmo raciocnio pode ser usado para ver que a sensibilidade influencia mais o VPN queno VPP. Se s = P(+|D) = 1, o teste d positivo para todos os doentes; ento no h doentes comteste negativo, ou seja, todos os negativos so de no-doentes: P(ND|-) = 1= VPN. Mas noconseguimos que VPP = P(D|+) seja igual a 1, pois nem todos os positivos seriam de doentes.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    18/21

    Figura 6(a): Efeito da especificidade no Valor de Predio Positiva

    0,12

    0,16

    0,20

    0,24

    0,28

    0,32

    0,36

    0,40

    0,44

    0,48

    0,52

    0,75 0,8 0,85 0,9 0,95

    Especificidade

    VPP

    s = 0,95

    s = 0,85

    s = 0,75

    p = 0,05

    Figura 6(b): Efeito da sensibilidade no Valor de Predio Negativa

    0,10

    0,15

    0,20

    0,25

    0,30

    0,35

    0,40

    0,45

    0,50

    0,75 0,8 0,85 0,9 0,95

    Sensibilidade

    VPN

    e = 0,95

    e = 0,85

    e = 0,75

    p = 0,95

    Exemplo 4: O Mini Exame do Estado Mental (MEEM) um teste usado para diagnosticardemncia. O MEEM composto por diversas questes com o objetivo de avaliar funescognitivas especficas do paciente. Seu escore um nmero inteiro, podendo variar de 0 a 30pontos: quanto menor o escore, maior o indcio de demncia. A escala simples de usar e podeser facilmente administrada em 5 a 10 minutos, inclusive por profissionais no mdicos.

    Com o objetivo de investigar o melhor ponto de corte na escala do MEEM para classificar opaciente como portador ou no de demncia, Almeida (1998) realizou um estudo com 211pacientes idosos, dos quais 70 receberam diagnstico de demncia de acordo com as diretrizesda CID-10 (o teste padro-ouro neste caso)3.

    3Classificao Internacional de Doenas, que um catlogo com a classificao de doenas, usado como referncia em

    todo o mundo.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    19/21

    Os 30 possveis valores do MEEM foram avaliados quanto sua sensibilidade e especificidadepara o diagnstico de demncia, gerando a Figura 7.

    Figura 7: Reproduo da Figura 1 do artigo original Almeida (1998)

    O ponto de corte tradicional (positivo se menor ou igual a 23 pontos, o MEEM-23) revelousensibilidade de 84,3% e especificidade de 60,3%. Segundo o artigo, a prevalncia de demnciaentre idosos de 60 a 80 anos de 5% Assim, aplicando o MEEM-23 a um paciente com idade entre60 e 80 anos, o VPP ser de 10% e o VPN de 98,6%. Portanto, o MEEM-23 com ponto de corte noescore 23 til para descartar a demncia, ou seja, satisfatrio como um teste de triagem (que o seu objetivo, j que mais rpido e mais simples que a classificao baseada na CID-10).

    Entre idosos com mais de 80 anos, a prevalncia de demncia de 20%. Desse modo,aplicando o MEEM-23 a um paciente nesta faixa etria, o VPP sobe para 34,7% e o VPN sofre umaqueda pequena, indo para 93,9%. Nesta situao, o MEEM-23 continua sendo um teste til apenaspara triagem. Entretanto, se um VPN de 93,9% no for considerado suficientemente alto, este valorpode ser aumentado se a sensibilidade do MEEM for aumentada, o que pode ser conseguidoabaixando-se o ponto de corte.

    5. Outros Exemplos Interessantes

    Exemplo 5: A associao entre a presena da bactria Helicobacter pylori (HP) no tratoestomacal e a existncia de lcera pptica foi estabelecida na dcada de 80 e, desde ento, aquesto de como detectar a HP em exames de rotina ganhou grande importncia. O

    procedimento ideal para deteco da HP realizar uma endoscopia digestiva, que um examecaro e causador de muito desconforto para o paciente.

    Outro procedimento, chamado UBT (Urea Breath Test), tambm pode ser utilizado paradetectar a HP. Para se submeter ao UBT, o paciente ingere uma soluo com um istopo decarbono marcado. Se o paciente possui a HP em seu trato estomacal, espera-se que o istopo decarbono seja quebrado em amnia e CO

    2marcado, que absorvido no sangue e expelido na

    respirao. Amostras de CO2 expelido so coletadas e analisadas para a presena do istopo.

    Dois istopos de carbono podem ser usados: 14C, um istopo radioativo, e 13C, no radioativo.Gomes e colegas (2002) realizaram um estudo para avaliar a qualidade do UBT feito com o

    14C, que denominaram 14C-UBT. O estudo envolveu 137 pacientes do Hospital das Clnicas daFaculdade de Medicina de Ribeiro Preto (USP), dos quais 115 eram portadores da HP. O testepadro-ouro utilizado foi a endoscopia digestiva.

    O resultado do 14C-UBT foi medido pela radioatividade do ar expelido pelo paciente e

    expresso em contagens por minuto (cpm). Foram feitas duas coletas de ar: uma 15 minutos depois

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    20/21

    da ingesto da soluo com o 14C e outra 30 minutos depois da ingesto. Trs pontos de cortepara a medio da radioatividade foram estudados: 1000 cpm, 1500 cpm e 2000 cpm. Oresultado considerado positivo se o valor da medio maior do que o ponto de corte utilizado.

    O Quadro 2 reproduz parte dos resultados apresentados no artigo original.

    Quadro 2: Reproduo de parte da Tabela 2 do artigo original de Gomes e colegas (2002)1000 cpm 1500 cpm 2000 cpmTempo aps

    a ingesto Sensibilidade Especificidade Sensibilidade Especificidade Sensibilidade Especificidade15 minutos 99% 95% 97% 95% 94% 100%30 minutos 99% 95% 96% 100% 90% 100%

    Podemos notar que, em ambos os tempos de coleta, a sensibilidade do teste cai com oaumento do ponto de corte, ocorrendo o inverso com a especificidade. Como j sabemos, istoocorre porque, com o aumento do ponto de corte, diminui o nmero de pacientes com resultadopositivos para o teste e aumenta o nmero de negativos, causando a queda da sensibilidade e oaumento da especificidade.

    Exemplo 6: Estudos epidemiolgicos trazendo informaes ocupacionais obtidas em entrevistas

    com familiares de trabalhadores so muito freqentes. Entretanto, h poucos trabalhos avaliandoa qualidade destas informaes.Cordeiro (2000) realizou um estudo no qual 2460 pessoas foram questionadas sob sua histria

    ocupacional, e a mesma informao sobre esta pessoa foi pedida a seus familliares. Nestasituao, o teste a informao dada pelo familiar. A informao fornecida pela prpriapessoa o padro-ouro.

    O Quadro 3 reproduz a Tabela 2 do artigo original, que mostra os valores de sensibilidade eespecificidade da informao fornecida pelo familiar para vrios subgrupos ocupacionais.

    Quadro 3: Reproduo da Tabela 2 do artigo de Cordeiro (2000)

    Um resultado interessante que o mais alto valor de sensibilidade da informao do familiarocorre quando a pessoa se classifica como sem ocupao. Isso significa que, dado que apessoa notem ocupao, o familiar consegue identificar esta situao com maior facilidade. Poroutro lado, a menor sensibilidade ocorre quando a pessoa se classifica como trabalhadorbraal, talvez pelo fato desta categoria englobar outras, como lavrador, construo civil, etc.

  • 7/26/2019 Avaliao de Testes Disgnstivo Probabilidade

    21/21

    Referncias Bibliogrficas

    Almeida, O.P. (1998) Mini Exame do Estado Mental e Diagnstico de Demncia no Brasil.Arquivosde Neuropsiquiatria, v. 56, n. 3-B, p. 605-612.

    Cordeiro, R. (2000) Validade de Histrias Ocupacionais de Informantes Secundrios. Revista deSade Pblica, v. 34, n. 5, p. 522-528.

    Gomes, A.T.B., Coelho, L.K., Secaf, M., Modena, J.L.P., Troncon, L.E.A. e Oliveira, R.B. (2002)Accuracy of 14C-urea test for the diagonis of Helicobacter pylori . So Paulo Medical Journal Revista Paulista de Medicina, volume 120, no. 3, pgina 68-71.

    Pereira, R.A., Sichieri, R. e Marins, V.M.R. (1999) Razo cintura/quadril como preditor dehipertenso arterial. Cadernos de Sade Pblica, v. 15, n. 2, p. 333-344.

    Pinho, A.A. e Matos, M.C.F.I (2002) Validade da citologia cervicovaginal na deteco de lesespr-neoplsicas e neoplsicas de colo de tero.Jornal Brasileiro de Patologiae Medicina Laboratorial,v. 38, n. 3, p. 225-231.