noções de epidemiologia e bioestatística aplicada

108
 Página 1 de 108  Noções de Epid emiol ogi a e Bioestatísti ca aplicada Tópicos: a Natureza da Estatística; Medicina: Ciência e Arte .  Medi cin a: Ciência e Arte A prática da Medicina é uma complexa combinação de Ciência e Arte. Esta é uma profissão que engloba a Ciência Biomédica em estreita relação com atributos pessoais, humanísticos e profissionais. A grande evolução da Medicina nos últimos séculos, e a continuidade deste processo de constante melhoramento da Medicina virada para a pessoa doente e, cada vez mais, da Medicina virada para a pessoa saudável, estão diretamente relacionados com os avanços da Ciência Biomédica. Esta é um elemento fundamental para a compreensão da doença; o estudo da sua distribuição e dos fatores que com ela estão relacionados; o estabelecimento do diagnóstico; a avaliação e utilização de novos tratamentos e medidas preventivas; a predição da evolução da doença; a aplicação de novas tecnologias na prática clínica; entre muitos outros aspectos. O médico, hoje em dia, está num constante processo de aprendizagem e atualização que o obriga a ter uma forte base de conhecimentos de e sobre a Ciência. Esta base deve-lhe permitir, não só, adquirir, avaliar e criticar o novo conhecimento, mas também, encontrar maneiras de o aplicar aos seus doentes. Apesar disto, a Medicina vai muito além da Ciência Biomédica. Estabelecer uma Relação Médico-Doente (baseada na compreensão, confiança e disponibilidade); compreender o indivíduo em toda a sua dimensão (o indivíduo como unidade bio- psico-socio-cultural); ter a capacidade de extrair a informação útil de um emaranhado de sinais, sintomas e resultados de exames auxiliares de diagnóstico; tomar decisões em relação ao tratamento e fazer avaliações de risco-benefício, tendo em conta a realidade individual de cada doente são questões que ultrapassam largamente o âmbito da Ciência Biomédica e que fazem parte do dia- a-dia de um médico. É esta combinação de conhecimento, intuição, sensibilidade, compreensão e capacidade de decisão que define a Arte da Medicina e é tão ou mais importante quanto uma forte base científica. O Método Científico  Te ndo e m conta o papel f un d amen t al da Ciência n a Medicina t o r n a -se indispensável, ao aluno de Medicina, estar familiarizado com o Método Científico.

Upload: sandra-kelle

Post on 03-Apr-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 1/108

 

Página 1 de 108

 

Noções de Epidemiologia e Bioestatística aplicada 

Tópicos: a Natureza da Estatística; Medicina: Ciência e Arte . 

Medicina: Ciência e Arte

A prática da Medicina é uma complexa combinação de Ciência e Arte. Esta é umaprofissão que engloba a Ciência Biomédica em estreita relação com atributospessoais, humanísticos e profissionais.

A grande evolução da Medicina nos últimos séculos, e a continuidade desteprocesso de constante melhoramento da Medicina virada para a pessoa doente e,cada vez mais, da Medicina virada para a pessoa saudável, estão diretamenterelacionados com os avanços da Ciência Biomédica. Esta é um elementofundamental para a compreensão da doença; o estudo da sua distribuição e dosfatores que com ela estão relacionados; o estabelecimento do diagnóstico; aavaliação e utilização de novos tratamentos e medidas preventivas; a predição daevolução da doença; a aplicação de novas tecnologias na prática clínica; entremuitos outros aspectos.O médico, hoje em dia, está num constante processo de aprendizagem eatualização que o obriga a ter uma forte base de conhecimentos de e sobre a

Ciência. Esta base deve-lhe permitir, não só, adquirir, avaliar e criticar o novoconhecimento, mas também, encontrar maneiras de o aplicar aos seus doentes.Apesar disto, a Medicina vai muito além da Ciência Biomédica. Estabelecer umaRelação Médico-Doente (baseada na compreensão, confiança e disponibilidade);compreender o indivíduo em toda a sua dimensão (o indivíduo como unidade bio-psico-socio-cultural); ter a capacidade de extrair a informação útil de umemaranhado de sinais, sintomas e resultados de exames auxiliares de diagnóstico;tomar decisões em relação ao tratamento e fazer avaliações de risco-benefício,tendo em conta a realidade individual de cada doente são questões queultrapassam largamente o âmbito da Ciência Biomédica e que fazem parte do dia-a-dia de um médico.

É esta combinação de conhecimento, intuição, sensibilidade, compreensão ecapacidade de decisão que define a Arte da Medicina e é tão ou mais importantequanto uma forte base científica.

O Método Científico

 Tendo em conta o papel fundamental da Ciência na Medicina torna-seindispensável, ao aluno de Medicina, estar familiarizado com o Método Científico.

Page 2: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 2/108

 

Página 2 de 108

Este conhecimento é essencial ao desenvolvimento de uma atitude crítica naavaliação da ciência tal como lhe é apresentada.

O termo "Método" refere-se a um processo ordenado e padronizado de execuçãode uma determinada atividade e, no presente contexto, implica um conjunto deregras que especificam o modo como o conhecimento deve ser adquirido eapresentado e o modo de avaliação da verdade ou falsidade do mesmo.

Antes de iniciar a discussão sobre o Método Científico será útil, a título decontraste, descrever sumariamente outros métodos de conhecimento usados emMedicina:

1. Autoridade: de acordo com este método, o conhecimento é consideradoverdadeiro tendo em conta a tradição e/ou a opinião de clínicos distintos eexperientes. Este é um método muito usado e útil, por exemplo, durante o períodode aprendizagem de um Médico. Tem, no entanto, inúmeros problemas. Ébaseado em opiniões pessoais e, muitas vezes, subjetiva; não tem em conta asposições de outros profissionais distintos e experientes que podem, mesmo, sercontraditórias; resguarda-se, muitas vezes, na tradição sem ter em conta aevidência empírica e objetiva.

2. Racionalismo: a razão e a lógica são usadas para avaliar a verdade doconhecimento. Claramente, a limitação da lógica formal é que só funciona na

prática se tivermos os meios para estabelecer a verdade factual das premissas deonde o raciocínio parte. É evidente que a lógica e a matemática são fundamentaisà ciência, no entanto, para além destas, é necessário uma forte base de evidênciaempírica, não sendo suficiente o simples raciocínio lógico.

3. Intuição: o conhecimento surge, por vezes, através de um súbito e inesperado"insight", na ausência de raciocínio consciente. A verdade é julgada pela claridadeda experiência e pelo seu conteúdo emocional (a experiência da "Eureka!").Lamentavelmente, mesmo as mais fortes intuições podem revelar-se falsasquando postas perante a prova empírica. A intuição é, por vezes, um momento degrande brilhantismo mas um método muito pouco fiável a longo prazo.

Autoridade, lógica e intuição têm todos o seu devido lugar na prática médica,porém, o Método Científico tem grandes vantagens sobre eles. De um modo geral,o método científico contrasta com esses outros métodos pela ênfase que dá ànecessidade da evidência empírica.

Page 3: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 3/108

 

Página 3 de 108

OO MMééttooddoo CCiieennttí í f f iiccoo ee aa vviissããoo ppoossiittiivviissttaa 

O método Científico evoluiu ao longo de vários séculos, concomitantemente com ocrescimento da própria investigação científica. As origens da Moderna CiênciaOcidental remontam à Europa do século XVI, um tempo marcado por profundasmudanças sociais, econômicas e culturais. Essas mudanças permitiram, então,que filósofos como Descartes e Francis Bacon desafiassem os dogmas dopensamento medieval, e que cientistas como Galileu, Newton e Harveypropusessem novos modelos e teorias de explicação do real. Os métodosutilizados por esses pensadores e cientistas tinham três idéias elementares queconstituem a base do Método Científico.

O cepticismo, isto é, a noção de que qualquer proposição ou afirmação, mesmoquando proferida por grandes autoridades, está sujeita à dúvida e à análise;

O determinismo, ou seja, a noção de que a realidade está dependente de leis ecausas regulares e constantes e não dos caprichos ou desejos dos "demônios" ou"bruxas";

e o empirismo segundo o qual a investigação científica deve ser conduzida pelaobservação e verificação através da experiência.

A indução é uma outra noção chave, provavelmente a mais importante econtroversa, do Método Científico e será focada mais adiante.O indutivismo é,

geralmente, atribuído a Francis Bacon (no seu livro Novum Organum de 1620),apesar de haver, antes deste, outros filósofos que se aproximam dessa idéia.

O Método Científico está representado de modo simplificado e esquemático nafigura 1.

Observação, descrição e medição:

Page 4: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 4/108

 

Página 4 de 108

 

A descrição dos fenômenos naturais, envolvendo o registo preciso e válido de

observações sobre pessoas, objetos ou acontecimentos, constitui a base empíricade todos os ramos da Ciência. As observações podem ser na forma de descriçõesnominais ou conjuntos de medições. As percepções pessoais e subjetiva têm quedar lugar às formulações descritivas e medições que possam ser entendidas ereplicadas por outros investigadores. Muitos dos avanços da Ciência, ao longo dosúltimos séculos, devem-se diretamente ao desenvolvimento de instrumentos deauxílio à observação cada vez mais potentes. Não deve ser esquecido, noentanto, que o uso de instrumentação complexa não é indispensável à realizaçãode observações científicas. As características essenciais para uma observaçãopoder ser considerada científica são a precisão, validade e reprodutibilidade.As observações, quando adequadamente sintetizadas e confirmadas por outros,

constituem a base factual, empírica, do conhecimento científico.

Generalização e Indução:

Afirmações e medições representando observações são integradas em sistemasinterpretativos designados Hipóteses e Teorias. A lógica subjacente àgeneralização inerente ao método científico é designada Indução. A induçãopermite o estabelecimento de proposições gerais sobre uma classe de fenômenoscom base na análise de um número limitado de observações de elementos

selecionados. Por exemplo, tendo verificado que a penicilina é útil na cura dapneumonia num número limitado de doentes, propõe-se a generalização - "Aadministração de penicilina cura a pneumonia (em todos os doentes)".

Hipóteses:

A proposição "A administração de penicilina cura a pneumonia" é uma hipótese.Hipóteses científicas são proposições que especificam a natureza da relação entredois ou mais conjuntos de observações. No exemplo exposto, o primeiro conjuntode observações relaciona-se com a administração de penicilina, e o segundo,relaciona-se com as modificações das observações ou medições do estado clínico

dos doentes no que se refere à pneumonia. Uma hipótese científica deve serapresentada usando referências claras e observáveis, não podendo depender deinterpretações subjetivas.

 Teorias:

 Teorias científicas são, essencialmente, conjecturas que representam o nossoatual estado de conhecimento sobre o mundo real. As hipóteses são integradasem sistemas interpretativos mais abrangentes, designados teorias. A teoria tentaexplicar as relações existentes entre diversos tipos de observações e hipóteses.Por exemplo, uma teoria que pretenda explicar porque certos fármacos

Page 5: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 5/108

 

Página 5 de 108

designados antibióticos são eficazes na cura de certas doenças infecciosas teráque integrar evidências de variadas fontes, tais como a microbiologia, afarmacologia, a fisiologia celular e a medicina clínica. Outros exemplos de teorias

são a teoria heliocêntrica do sistema solar, a teoria genética da hereditariedadebaseada no DNA e a teoria neuronal de organização do sistema nervoso central.Algumas teorias estão ligadas ou podem ser representadas por um modelo, que éuma representação matemática ou física da própria teoria. Deste modo, as teoriasidentificam as causas dos acontecimentos, e proporcionam meios conceptuais depredição e influência sobre esses mesmos acontecimentos.

Dedução:

As teorias científicas devem levar à formulação de um conjunto de proposiçõesempiricamente verificáveis, ou seja, hipóteses. As hipóteses são deduzidas,

obedecendo à lógica formal, das proposições e/ou modelos matemáticos queespecificam a relação causal postulada pela teoria. Por exemplo, se aceitarmos ateoria de que um conjunto de neurônios, anatomicamente adjacentes, do lobooccipital são responsáveis pela visão nos seres humanos, então, a hipótese quepode ser deduzida é a de que a ativação desses neurônios (por exemplo, atravésde estimulação por elétrodo) provocará o aparecimento de certas sensaçõesvisuais. O teste das hipóteses através da observação deve ser levada a cabo,preferencialmente, em condições controladas. A observação deve ser controladade modo a permitir o afastamento de hipóteses alternativas na explicação dosfenômenos sobre os quais se fez a predição. Por exemplo, se quisermosdemonstrar que a estimulação do lobo occipital provoca sensações visuais, temos

que mostrar que estamos a controlar a observação para outro tipo de estimulaçãocerebral que possa estar a provocar tais sensações. Inversamente, teríamos,também, que demonstrar que a estimulação do lobo occipital não leva a uma sériede outras sensações que não as visuais.

Verificação e falsificação:

Depois da evidência ter sido colhida, o investigador decide se os achados sãoconsistentes ou não com as predições da hipótese. Se a hipótese é confirmada

pela evidência, então, a teoria de onde proveio a hipótese é fortalecida ouverificada. Porém, quando os dados não confirmam a hipótese, a teoria subjacenteé falsificada. Se uma teoria não continua a conseguir predizer ou explicar asobservações torna-se menos útil, e é normalmente substituída por novas teoriasmais fortes e consistentes. Assim, as teorias científicas não devem ser entendidascomo verdades absolutas e finais, mas meras explicações provisórias daevidência existente até ao momento.

Foi a aplicação do processo acima descrito que permitiu o espetacularcrescimento do conhecimento científico a que temos assistido nos últimos séculose, em especial, nos últimos cem anos. É desta forma que o método científico

Page 6: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 6/108

 

Página 6 de 108

contribui para a concretização dos nossos objetivos, ajudando-nos a descrever,explicar, predizer e, por vezes, controlar o mundo em que vivemos

Controvérsias em Relação ao Método Científico

Seria falso defender que a descrição feita acima é a única maneira de interpretar ométodo científico. De fato, esta matéria é, ainda hoje, fonte de enormescontrovérsias.

Em primeiro lugar, à metodologia deve ser aplicada a mesma lógica que o métododefende. Assim, o método científico não é uma verdade eterna e absoluta, masantes, está aberto à crítica, ao debate e à mudança.

Em segundo lugar, a interpretação do Método Científico é uma afetividade a quese dedica a filosofia da ciência e a epistemologia. Ao adaptarem diferentesenquadramentos teóricos (Realismo, Idealismo, etc.) sobre a natureza darealidade e do conhecimento os filósofos geram, indefinidamente, controvérsiassobre a natureza do Método Científico.

Como Cientistas ou Profissionais da Saúde, não nos podemos dar ao luxo deestar sentados e aguardar que os filósofos decidam qual o melhor método paraadquirir conhecimento. No entanto, tal como será exemplificado abaixo, seriamuito perigoso não ter em conta algumas das mais importantes ideias da história efilosofia da ciência.

AA oobbsseerrvvaaççããoo ddeeppeennddeennttee ddaa tteeoorriiaa 

Alguns críticos, como Chalmers (1976), argumentam que é simplista acreditar queas observações são feitas independentemente das noções teóricas do observador.O observador é seletivo em relação àquilo que registra como evidência. As nossasobservações e facos são influenciadas pela teoria dominante, isto é, a própriateoria especifica que observações são importantes e que aspectos devem serregistrados ou ignorados. Assim, ao utilizar o Método Científico, existe, à partida,um viés em favor da teoria dominante e da sua veracidade que é necessário terem conta.

AA vvaalliiddaaddee ddaa iinndduuççããoo 

As primeiras críticas sérias à base indutivista do Método Científico surgiram noséculo XVIII na voz de David Hume. Segundo este autor, um argumento indutivonão possuía qualquer força lógica; pelo contrário, não era mais que umasuposição sobre o fato de certos acontecimentos no futuro seguirem o mesmopadrão que apresentaram no passado. Hume sublinha que, por muito razoáveis eevidentes que estas suposições sejam, não existe a força da lógica nem danecessidade por trás delas. Para Hume, assumia um papel central a questão dainferência causal e da incapacidade do indutivismo ser o alicerce lógico desta.

Page 7: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 7/108

 

Página 7 de 108

Por outras palavras, não interessa quantas vezes uma determinada seqüência deeventos se repete da mesma forma, pois isso nunca será uma prova lógica de queexiste uma relação causal entre os eventos. A inferência causal, baseada na mera

coincidência dos acontecimentos, constitui a falácia conhecida como "pos hocergo propter hoc" (depois disto, logo por causa disto). Essa falácia é um casoespecial de uma outra falácia lógica mais abrangente e que é conhecida como afalácia da afirmação do conseqüente.Essa falácia toma a seguinte forma geral: "Sabe-se que se H é verdadeira, entãoB tem que ser verdadeira; e sabemos que B é verdadeira; então, H tem que serverdadeira". Esta falácia é utilizada, por rotina, pelos cientistas na interpretação dedados. Bertrand Russell (1945) resume esta falácia nas seguintes palavras: "if p,then q; now q is true; therefore p is true.' E.g., 'If pigs have wings, then somewinged animals are good to eat; now some winged animals are good to eat;therefore pigs have wings.'This form of inference is called 'scientific method".

OO rreef f uuttaacciinniissmmoo 

Russell e Hume não foram os únicos a lamentar a falta de coerência lógica doraciocínio científico como ele é usado normalmente. Muitos outros pensadores,desde os tempos de Hume, tentaram estabelecer uma firme base lógica para oraciocínio científico. Um dos autores a quem se tem dado mais atenção é ofilosofo Karl Popper.Popper (1959) abordou o problema levantado por Hume estabelecendo que ashipóteses científicas não podem nunca ser provadas ou afirmadas comoverdadeiras num sentido lógico estrito. Pelo contrário, defendeu que as hipóteses

científicas só podem ser ou não consistentes com as observações. Uma vez que épossível que as observações sejam consistentes com mais do que uma hipótese,que podem elas mesmas ser mutuamente inconsistentes, a consistência entreuma observação e uma hipótese não é prova da veracidade da hipótese. Porém,uma observação válida que seja inconsistente com uma hipótese implica que ahipótese, tal como enunciada, seja falsa, logo, refuta a hipótese.Por exemplo, o fato de todos os dias o sol nascer não nos permite concluir que osol nasce todos os dias; no entanto, bastaria um dia em que o sol não nascessepara podermos afirmar que é falso dizer que o sol nasce todos os dias. SegundoPopper, a Ciência avança através de um processo de eliminação a que dá o nomede "Conjectura e Refutação". Os cientistas constroem hipóteses baseadas na

intuição, conjectura e experiência anterior. Os "bons" cientistas usam a lógicadedutiva para fazer predições a partir da hipótese e comparam, depois, asobservações com as predições. As hipóteses cujas predições são concordantescom as observações são confirmadas só no sentido em que podem continuar aser usadas como explicações dos fenômenos naturais. A qualquer momento, noentanto, podem ser refutadas por novas observações e substituídas por outrashipóteses que expliquem melhor as observações.

A esta maneira de encarar a inferência científica é dado o nome de refutacionismoou falcificacionismo. Os refutacionistas consideram a indução como uma simples

Page 8: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 8/108

 

Página 8 de 108

muleta psicológica: observações repetidas não induzem a formulação de uma leinatural, mas antes a crença de que tal lei foi encontrada. Para um refutacionista sóo conforto psicológico dado pela indução pode explicar o fato de continuarem a

existir defensores da mesma.O refutacionismo tem profundas implicações em relação ao Método Científico.Este processo encoraja uma abordagem que considere múltiplas hipóteses e aprocura de testes que permitam decidir entre hipóteses concorrentes através dafalsificação de uma delas. Uma vez que a falsificação é o objectivo, este processotende a despersonalizar as teorias. Isto é positivo por evitar os viéses inerentes àafectividade do cientista em relação às suas próprias teorias.

OOuuttrrooss aauuttoorreess iimmppoorrttaanntteess 

Muitos outros autores se dedicaram a esta questão na procura incessante de dar

um enquadramento lógico à ciência e ao Método Científico.Destacam-se as idéias de Thomas Khun (1962) sobre o papel da comunidadecientífica na determinação da validade das teorias científicas e a sua descrição daevolução da ciência, através do confronto entre paradigmas, e a existência dequebras epistemológicas entre dois paradigmas concorrentes.De grande importância são, também, as ideias propostas por Thomas Bayes(1764), que, tal como o refutacionismo, vê o conhecimento como intrinsecamenteincerto, mas foca a sua atenção, não na verdade deste, mas no conhecimento emsi. De modo muito simplificado, Bayes defende que se conseguirmos atribuir umdeterminado grau de certeza às premissas de onde parte o argumento válido (priorprobability, probabilidade antecedente ou probabilidade pré-teste), então

poderemos usar a teoria das probabilidades para atribuir uma probabilidade decerteza para a conclusão assim obtida (posterior probability, probabilidadeposterior ou probabilidade pós-teste), e esta certeza será uma consequêncialógica das certezas originais. A proposta de Bayes constitui uma tentativaconstrutiva de lidar com o dilema da incerteza inerente à ciência e consegue,mesmo, propôr uma maneira de quantificar os limites dessa incerteza.

A Ciência como um Processo

A investigação científica, utilizando o método científico, procura, de uma formasistemática e controlada, descrever a realidade de modo preciso e válido,

recorrendo a métodos de estatística descritiva e inferência e, num patamar maiselevado de evidência, estabelecer relações de causalidade (p. ex., verificandocritérios de causalidade comumente aceites) que permitam, a partir de condiçõesconhecidas, prever o acontecimento de determinados resultados.Esta descrição do Método Científico que, por uma questão pedagógica, seráapresentado como um processo constituído por oito fases, será feita com base noparadigma da Investigação Médica.

Page 9: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 9/108

 

Página 9 de 108

11.. FFoorrmmuullaaççããoo ddaa qquueessttããoo 

A investigação inicia-se pela identificação de lacunas em determinadas áreas doconhecimento, ou seja, pela formulação da questão. Muitos são os meios usadospara identificar as lacunas de conhecimento: problemas encontrados na práticaclínica, leitura de bibliografia científica, problemas focados em congressos ereuniões, entre muitos outros.Após esta formulação faz-se, geralmente, uma revisão do conhecimento (revisãobibliográfica) existente sobre o assunto a ser tratado. A revisão bibliográfica éimportante para identificar as questões que se mantêm em aberto, os métodosgeralmente usados no estudo das questões em causa e os erros e limitações deoutros trabalhos.

A formulação da questão, sendo a primeira e, talvez, mais importante fase para a

execução de um bom trabalho de investigação, deverá identificar o objetivo eexplicitar o objeto do trabalho de investigação.

22.. CCoonncceeppççããoo ddoo ddeesseennhhoo ddoo eessttuuddoo 

A principal função de desenho do estudo é explicitar o modo como é supostoserem encontradas as respostas à questão formulada.Ao conceber o desenho do estudo definem-se certas características básicas doestudo, como sejam, a população a ser estudada, a unidade de análise, aexistência ou não de intervenção direta sobre a exposição, a existência e tipo deseguimento dos indivíduos, entre outras.

Num trabalho de investigação, a seleção de um desenho apropriado é essencialpara a obtenção de resultados e conclusões válidos. A escolha inadequada dodesenho do estudo leva à obtenção de resultados incorretos e ao desperdício derecursos humanos e financeiros. Ao selecionar determinado desenho é importanteassegurar-se da sua validade e exeqüibilidade. Na comunidade científica, aimportância de um determinado trabalho de investigação é primariamente avaliadaà luz do desenho de estudo adaptado. Existe uma enorme variedade de desenhosde estudos e é necessário ter conhecimentos básicos sobre, pelo menos, os maisfreqüentemente utilizados.

O investigador deve ser capaz de escolher e desenvolver o desenho mais

apropriado para responder à questão formulada. Deve ainda ser capaz de justificaressa selecção e conhecer as vantagens, desvantagens e limitações da escolhaque foi feita.

33.. SSeelleeccççããoo ddaass f f oonntteess ddee ddaaddooss 

A validade e precisão das conclusões de um trabalho de investigação dependem,em grande medida, da criação de instrumentos adequados para a colheita dedados.Se pensa fazer a colheita de dados especificamente para o estudo, isto é, utilizardados primários, é necessário construir instrumentos ou selecionar instrumentos já

Page 10: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 10/108

 

Página 10 de 108

construídos por outros investigadores que permitam a colheita dos mesmos. Sepensa utilizar dados secundários (informação previamente colhida com outrospropósitos) devem desenvolver-se instrumentos que permitam a extração dos

dados pretendidos a partir das suas fontes originais. É importante, neste contexto,ter os conhecimentos necessários ao desenvolvimento de instrumentos, assimcomo conhecer os conceitos de validade e precisão aplicados aos mesmos.O uso dos instrumentos para colheita de dados num estudo piloto é uma das maisimportantes partes da construção destes. O estudo piloto, por regra, deve serlevado a cabo, não na amostra escolhida para o estudo a realizar, mas sim numaamostra, normalmente mais pequena, proveniente da mesma população.

44.. SSeelleeççããoo ddooss ppaarrttiicciippaanntteess 

A seleção dos participantes envolve a definição dos critérios de inclusão e

exclusão, tendo em conta a população que se pretende estudar, e a seleção deum grupo restrito de indivíduos dessa população - amostragem - que irão serestudados.O objetivo principal de qualquer método de seleção de participantes é diminuir,tanto quanto possível, tendo em conta as limitações existentes, as discrepânciasentre os resultados obtidos a partir da amostra escolhida e as verdadeirascaracterísticas da população em estudo. O método de amostragem baseia-se napremissa de que um número relativamente pequeno de indivíduos de umapopulação, quando selecionadas adequadamente, podem fornecer resultados quese aproximam, com um determinado grau de certeza, daqueles que seencontrariam se estudasse a população de onde a amostra proveio na sua

totalidade.

A teoria da amostragem é guiada por dois princípios essenciais:

1. evitar o enviesamento na escolha da amostra;2. atingir a máxima precisão possível com os recursos disponíveis.

Existem três métodos principais de amostragem:

•  amostragem aleatória (simples, sistemática, estratificada, de grupo);•  amostragem não aleatória (consecutiva, conveniência, de juízo);•  amostragem mista.

É necessário conhecer e saber utilizar estes métodos de amostragem, assimcomo, conhecer as vantagens e desvantagens de cada um e as situaçõesespecíficas em que podem ou não ser usados, de modo a poder escolher o maisapropriado para o estudo a ser realizado.O tipo de amostragem usada vai determinar a capacidade de generalização dosresultados do estudo realizado, para a população estudada, e determinar o tipo deanálise estatística que deve ser levada a cabo.

Page 11: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 11/108

 

Página 11 de 108

55.. EEllaabboorraaççããoo ddoo pprroottooccoolloo 

Até ao momento, foi sendo desenvolvido todo o trabalho preparatório do estudo.

O próximo passo será conjugar todos os vários elementos de modo a poderapresentar a descrição e estruturação do estudo a ser realizado.O protocolo é um plano geral que informa quem o lê sobre o problema em questãoe do modo como se tenta resolvê-lo. As várias instituições podem ter diferentespadrões, tanto para a forma, como para o conteúdo dos protocolos, mas a maioriadelas requer aquilo que aqui se define, sendo as diretrizes apresentadasaceitáveis para a maioria delas.

A principal função do protocolo é a de tornar possível a comunicação clara,detalhada e estruturada, do seguinte:

•  Problema que se pretende abordar e a sua relevância;•  Objetivo que se pretende atingir;•  Desenho do estudo;•  Amostra e técnica de amostragem;•  Instrumentos para colheita de dados;•  Métodos de processamento e análise dos dados;•  Listagem e calendarização das tarefas que serão levadas a cabo.

66.. CCoollhheeiittaa ddee ddaaddooss 

 Tendo definido o desenho do estudo e os outros passos preliminares do trabalhode investigação, é chegado o momento de iniciar a realização do estudopropriamente dito.A primeira fase será a obtenção dos dados. O desenho do estudo já deve terdefinido, à partida, os procedimentos a adaptar para a obtenção dos dados e oprotocolo do estudo já deve conter a estruturação e calendarização das tarefasnecessárias à obtenção dos dados.A partir dos dados vão fazer-se generalizações e tirar-se conclusões; eles vão sero suporte de todo o estudo, logo, deve ter-se grande atenção a esta fase, pois énela que, muitas vezes, surgem problemas que inviabilizam ou diminuemgrandemente a validade do estudo. Existe uma grande variedade de métodos e

estratégias que podem ser utilizados para a colheita dos dados e que convémconhecer e saber utilizar apropriadamente.

77.. PPrroocceessssaammeennttoo ee aannáálliissee ddee ddaaddooss 

O processamento e a análise estatística dos dados são, também, fases essenciaisna realização do trabalho de investigação propriamente dito.

O processamento compreende a introdução, edição, limpeza e a manipulação (ex:categorização de variáveis contínuas) dos dados em bruto, fases importantes para

Page 12: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 12/108

 

Página 12 de 108

a preparação da análise estatística.A análise dos dados consiste na aplicação de técnicas de estatística descritiva einferência, com o objetivo de retirar informação útil das observações realizadas.

Ao longo da disciplina de Introdução à Medicina serão focados os aspectosbásicos relacionados com a análise estatística de dados.

88.. DDiivvuullggaaççããoo ddee rreessuullttaaddooss 

A divulgação de resultados é o passo final de todo o processo de investigação, evai constituir o meio pelo qual vão ser comunicados ao mundo os resultados econclusões resultantes do trabalho de investigação realizado.

A decisão sobre a maneira como os resultados vão ser comunicados já deve ter

sido tomada inicialmente, na altura da elaboração do protocolo.

Resta, agora, pôr as mãos à obra e escrever. Antes de começar, porém, deve criarum esquema, que deve ser incluído no protocolo e que ajuda a organizar os temase ideias. Os moldes em que a divulgação dos resultados será feita derivam,necessariamente, do tipo de investigação realizada, dos fins a que se destina edas preferências pessoais.

Basicamente, os resultados podem ser apresentados em três formatos diferentes:

1. Apresentação oral;2. Pôster;3. Publicação - em papel ou on-line.

A publicação dos resultados pode tomar várias formas:

1) sumário;

2) comunicação curta;

3) artigo original;

4) relatório de investigação;

5) tese ou dissertação.

Cada um destes meios de comunicação tem as suas regras próprias, mas alémdestas devem ser, ainda, seguidos alguns princípios básicos, tais como anecessidade de clareza e brevidade. O texto deve ser apresentado na terceira

Page 13: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 13/108

 

Página 13 de 108

pessoa, de maneira lógica e com linguagem precisa. Uma vez concluído o texto,qualquer outro investigador deverá ser capaz de reproduzir, se o desejar,integralmente, todos os passos do trabalho de investigação.

O Método Clínico

Nesta aula apresentar-se-á, somente, uma curta discussão sobre o MétodoClínico, uma vez que ele será apresentado de uma forma mais aprofundada, juntamente com a sua componente prática, que é a maneira mais adequada de oaprender/ensinar, em fases mais avançadas do curso de Medicina.

O Médico, ao praticar Medicina, tem, de modo semelhante ao que acontece com oMétodo Científico, necessidade de colher, analisar e sintetizar dados ouobservações, assim como formular e testar hipóteses, com o intuito de obterinformação útil que será, depois, usada no processo de decisão aplicado a cadaindivíduo. A todo esse processo, desde a colheita da informação até à decisão ediscussão desta com o doente e o estabelecimento de um plano terapêutico, dá-seo nome de Método Clínico. Este, tal como o Método Científico, tem evoluido aolongo do tempo e tem sido alvo de algumas controvérsias.

O raciocínio clínico é um processo, ainda hoje, não totalmente compreendido.Sabe-se, porém, que ele tem por base múltiplos fatores, como a experiência e a

aprendizagem, o raciocínio dedutivo e indutivo, a interpretação de evidênciacientífica, que é variável em reprodutibilidade e validade, e a intuição que é umaspecto difícil de definir.

Com o objetivo de melhorar o raciocínio clínico, várias tentativas de análisequantitativa dos vários fatores nele envolvidos têm sido feitas (ex: estudo dosprocessos cognitivos envolvidos no raciocínio clínico, criação de sistemas deapoio à decisão, etc). Embora estas tentativas tenham sido úteis no avanço dacompreensão do raciocínio clínico, todas elas têm problemas teóricos ou práticosque limitam a sua aplicabilidade à prática clínica diária. Estas tentativas deaplicação do rigor e lógica inerentes ao método quantitativo têm, no entanto,

proporcionado grandes avanços na compreensão do raciocínio clínico, epermitiram identificar modos de melhorar este processo, tornando-o mais eficaz eeficiente.

Usando um modelo simplificado, pode descrever-se o Método Clínico como umprocesso dividido em cinco fases.

História Clínica e Exame Físico

A primeira fase consiste na colheita da História Clínica, através de entrevista. AHistória Clínica deve incluir a seguinte informação: identificação do doente, motivo

Page 14: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 14/108

 

Página 14 de 108

da consulta, história da doença atual, antecedentes pessoais, história social eocupacional, antecedentes familiares e a revisão de sintomas por aparelhos esistemas. Esta colheita de informação avança em função de um processo iterativo

de formulação e refutação de hipóteses diagnósticas, que levam, na maior partedos casos, a um diagnóstico carreto, já nesta fase.

Ainda nesta primeira fase tem lugar a realização do Exame Físico, com especialênfase nos órgãos provavelmente envolvidos na doença atual. Este exame deveser completo e sistematizado e é guiado pelas hipóteses formuladas na colheitada História Clínica.

Esta primeira fase é muito importante por duas razões: primeiro, porque é nestafase que se devem obter, de forma rigorosa, completa, válida e precisa, os dadosou observações que estarão na base do raciocínio que levará à formulação do

diagnóstico. Esta colheita de dados ou observações deve ser feita com "o rigorcientífico". Segundo, porque é no decorrer desta fase que se estabelece edesenvolve a relação Médico-Doente, que será a base do restante do processo eque dá "um toque de arte" ao mesmo.

Exames Auxiliares de Diagnóstico

Numa segunda fase, o clínico pode requisitar um conjunto de exames auxiliaresdo diagnóstico que julgue necessários à confirmação das possibilidadesdiagnósticas levantadas na fase anterior. O clínico deve conhecer,pormenorizadamente, as características operacionais de cada exame

(sensibilidade, especificidade, valores preceptivos e exatidão), as suas indicaçõesespecíficas e os potenciais riscos e benefícios que a sua utilização tem. Claro que,tendo em conta os riscos e benefícios dos exames, estes só deverão serrequisitados quando necessário e quando a história clínica e o exame físico semostrarem insuficientes para estabelecer o diagnóstico com a precisão adequada.

Integração dos Dados Clínicos e dos Exames Auxiliares de Diagnóstico

Numa terceira fase faz-se a integração da informação proveniente das váriasfontes disponíveis (história clínica, exame físico e exames auxiliares dediagnóstico), com o intuito de estabelecer o diagnóstico e o prognóstico (tendo em

conta as características específicas do indivíduo). Uma das formas de fazer estaintegração da informação é usando um método quantitativo designado AnáliseBayesiana. Este método permite, a partir do conhecimento da probabilidade de umindivíduo ter uma doença antes de um qualquer exame ser realizado(probabilidade pré-teste ou probabilidade antecedente), e tendo conhecimentosobre as características do exame (sensibilidade e especificidade), calcular aprobabilidade de existência de doença após o conhecimento do resultado desseexame (probabilidade pós-teste ou probabilidade posterior). Uma discussão maisampla sobre este método está fora do âmbito desta aula, mas chama-se a atençãopara a sua importância na compreensão do raciocínio clínico, pois este é,provavelmente, o modelo matemático que mais se lhe assemelha.

Page 15: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 15/108

 

Página 15 de 108

Comparação de Riscos e Benefícios: Análise de Decisão

Os riscos e benefícios de subseqüentes opções diagnósticas ou terapêuticasdevem ser avaliados. Após esta avaliação deve ser tomada a decisão sobre o queserá recomendado ao doente. Um método quantitativo, designado Análise deDecisão, foi proposto para, através da análise de riscos e benefícios dasintervenções e das probabilidades dos diferentes resultados possíveis, se obter amelhor decisão para cada doente. A sua utilização na prática clínica tem, noentanto, várias limitações. A discussão deste método está fora do âmbito destaaula.

Recomendação e Início do Plano Terapêutico

Na quinta e última fase, a recomendação que foi produto da decisão anterior, após

análise de riscos e benefícios das várias opções, será apresentada ao doente. Aapresentação da recomendação do médico deve ser acompanhada de umadiscussão sobre as várias opções que se apresentam ao doente, de um modosimples e conciso, que lhe permitam perceber, claramente, o que está em causa.Por último, após a decisão final, deve ser iniciado o plano terapêutico escolhido efeita a programação do seguimento do indivíduo, quando apropriado.

Instrumentos de recolha de dados e seleção de participantesIntrodução

Leia atentamente os seguintes textos:

Case-control studies of antenatal drug exposure and birth defects often rely onmaternal recall of drug use in pregnancy. Differential recall among mothers of cases and controls can lead to information bias ("maternal recall bias"), and theopportunity for such bias increases as ascertainment of drug exposure diminishes. The effect of questionnaire design on the ascertainment of drug use in pregnancywas examined in two studies. In a pilot interview study of 532 women inObstetric/gynecologic practices, information on drug use in the past year was

obtained by means of three questions asked in sequence: The first question wasopen-ended, the second asked about drug use for selected indications, and thethird asked about use of specifically named drugs. Among obstetric patients whoreported use of any of five drugs, less than 50% did so in response to the open-ended question, and approximately 20-40% reported use only when the specificdrug name was asked. In a case-control Birth Defects Study of 5,435 mothers of malformed children, information on drug use in pregnancy was obtained by askingquestions in sequence about indications and specifically named drugs. Among thewomen who reported use of any of 11 drugs, 6-40% did so only when asked aboutthe specific drug by name. These findings suggest that completeness of ascertainment of antenatal drug exposure varies according to how the mother is

Page 16: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 16/108

 

Página 16 de 108

questioned and is directly related to the specificity of the questions asked. (Effect of questionnaire design on recall of drug exposure in pregnancy. Mitchell

 AA, Cottler LB, Shapiro S. Am J Epidemiol 1986 Apr;123(4):670-6) 

"The first persons in whom the cytomegalovirus infection was diagnosed werethose with severe disease, this virus was initially thought to be highly virulent. Asmore people were tested for the virus, it became clear that the virus is widespreadand only rarely leads to serious illness." (Biomedical Bestiary. Michael III, Max; W. Thomas Boyce, Allen J. Wilcox; Little,Brown and Company. 1984.) 

1. O primeiro texto mostra como o tipo de questão (aberta ou fechada) influência aresposta. Que vantagens e desvantagens tem o uso de questões de respostaaberta?

2. Qual a razão da conclusão errada tirada inicialmente no estudo descrito nosegundo texto?

Instrumentos de recolha de dados

 Todo e qualquer instrumento que seja utilizado com o intuito de colher informaçãopara o estudo cabe dentro da definição de instrumento para a recolha de dados,sendo assim incluídos dentro desta designação, por exemplo, os registros deobservações, os questionários, a calendarização das entrevistas ou os guias doentrevistador. A criação de instrumentos para a colheita de dados é a primeira

tarefa prática a ser executada num estudo.

É necessário decidir o modo como se irá fazer a colheita de dados e construir,então, os instrumentos necessários à sua execução.

Se pensa fazer a colheita de dados especificamente para o estudo, isto é, utilizardados primários, é necessário construir instrumentos ou seleccionar instrumentos já construídos por outros investigadores que permitam a colheita dos mesmos. Éimportante, neste contexto, ter os conhecimentos necessários ao desenvolvimentode instrumentos, assim como, conhecer os conceitos de validade e precisãoaplicados aos mesmos.

Se pensa utilizar dados secundários (informação previamente colhida com outrospropósitos) devem desenvolver-se instrumentos que permitam a extração dosdados pretendidos a partir das suas fontes originais.

QuestionáriosO instrumento de colheita de dados mais usado é o questionário. Um questionárioé um documento escrito usado para guiar uma ou mais pessoas a responder auma ou mais perguntas.

Page 17: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 17/108

 

Página 17 de 108

 Tipos de questionários:

Auto resposta (via correio)

A maior parte das pessoas associa um questionário ao questionáriovia correio. J á quase todos nós recebemos, pelo menos uma vez, umquestionário por correio.Este tipo de questionário tem muitas vantagens, pois pode serenviado a um grande número de pessoas, de uma forma não muitodispendiosa e a pessoa que responde pode fazê-lo quando lhe formais conveniente. Contudo, os questionários enviados via correiotêm, também, as suas desvantagens, uma delas é a baixa taxa deresposta que são obtidas, este tipo de questionários também não éo melhor veículo para perguntas que exigem respostas muito

detalhadas.

Auto resposta (em grupo)

Um grupo de pessoas são reunidas e as perguntas são-lhes feitasem simultâneo, contudo, cada pessoa responde individualmente aoseu questionário. Os grupos são reunidos consoante algum critériode conveniência (aqueles que estão presentes e que muitoprovavelmente vão ter uma boa taxa de resposta). Se as pessoasque estão a ser questionadas não entenderem o significado dealguma pergunta podem pedir ajuda ou esclarecer o propósito do

estudo. Este tipo de questionário é, muitas vezes, usado emempresas ou escolas.

Auto resposta (porta a porta)

Este tipo de questionário é menos habitual. O investigador, nestecaso, desloca-se a casa ou ao emprego dos questionados, entrega eexplica o questionário e depois volta para recebe-lo ou pede que odevolvam por correio. Este tipo de questionário tem a vantagem depoder ser feito quando é mais conveniente ao questionado tal comonos questionários via correio e tem a vantagem de ser possível um

contacto com o investigador com o fim de esclarecer dúvidas nainterpretação das respostas ou no objetivo do estudo. A grandedesvantagem deste tipo de questionários são os custos financeirosassociados.

Entrevista (pessoal)

Através de uma entrevista, o investigador preenche o questionáriocom as respostas às perguntas que vai fazendo ao questionado. Háum contato pessoal e direto entre o investigador e o questionado. Aocontrario dos outros tipos de questionário, o entrevistador tem a

Page 18: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 18/108

 

Página 18 de 108

oportunidade de se certificar que o questionado quer dizer é mesmoo que disse. As entrevistas facilitam, também, as respostas aperguntas que pedem opiniões.

O questionário por entrevista consome muito tempo e,conseqüentemente, é muito dispendiosoO entrevistador é considerado parte do instrumento de recolha dedados e precisa de um treino prévio para aprender a conduzir umaentrevista e como ultrapassar as dificuldade.

Entrevista (telefônica)

Este tipo de entrevista possibilita ao investigado ter a informaçãorapidamente. Tal como as entrevistas pessoais, este tipo de

entrevistas possibilita ao investigador o contacto pessoal e diretocom o questionado, desta forma, facilitam as respostas a perguntasque pedem opiniões, a questões de folow up e dão ao entrevistadora oportunidade de se certificar que o que o questionado respondeuera exatamente aquilo que queria dizer.Contudo, também têm desvantagens. Muita gente não gosta que lhetelefonem para casa, outras não têm telefone que conste nas listastelefônicas. Este tipo de entrevistas não podem ser muito compridas.

Construção de questionários:

Construir um questionário é uma arte. Há inúmeras decisões que têm que sertomadas, decisões relacionadas com a linguagem, com o formato e com o tipo dequestão. Estas decisões podem ter conseqüências muito importantes para oestudo e podem até compromete-lo. Não há uma forma perfeita de fazer umquestionário, contudo, há uma série de conselhos que podem ajudar a obter umproduto final melhor.

Problemas de linguagem

A linguagem deve ser clara e objetiva. Por exemplo, a questão "Quanto costumabeber?" não é clara nem objetiva, pois não diz a que tipo de bebida se refere e se

a resposta fosse, por exemplo, 3 ficaríamos sem saber se a pessoa em questãobebia 3 copos por mês ou 3 garrafões por dia. Uma alternativa seria "Quantoscopos de vinho bebe, em média, por dia?"

A linguagem deve ser simples, evitando perguntas longas, com palavras difíceisou de estrutura gramatical complexa. Por exemplo, a pergunta "Tem casos detrissomia 21 na família?" poderia ser substituída por "Tem casos de mongolismona família?", pois a palavra mongolismo é mais comum e fácil de entender quetrissomia 21.

Page 19: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 19/108

 

Página 19 de 108

A linguagem deve também ser neutra, de forma a que não influencie oquestionado. Por exemplo a pergunta "Concorda que as futuras mães possammatar os babes quando eles ainda estão dentro da sua barriga até à 7ª semana

de gravidez?" não é neutra e influencia o questionado a responder negativamente.Uma alternativa a esta pergunta seria "Concorda com a interrupção voluntária dagravidez até à 7ª semana?"

A unicidade é uma questão de linguagem que, também, deve ser levada em conta.Por exemplo, a pergunta " Alguma vez teve tonturas e dores de cabeça aoacordar ?" A resposta a esta pergunta pode ser mais complexa do que sim ou não,pois, pode já ter tido apenas uma das situações, desta forma a resposta pode serduvidosa se o questionado não especificar, exatamente, a que se refere. Apergunta anterior deveria ser dividida em duas: " Alguma vez teve tonturas aoacordar ?" e " Alguma vez teve dores de cabeça ao acordar ?", assim, não haverá

dúvidas ao interpretar a resposta.

A linguagem deve ser temporal, estabelecendo, claramente, o período a que serefere. Por exemplo, à pergunta "Ultimamente tem tido dores de cabeça?" duaspessoas que tiveram dores de cabeça no mês passado, podem responder sim enão consoante o seu conceito de "ultimamente". Sendo assim, a pergunta poderiaser substituída por "Nos últimos 3 meses tem tido dores de cabeça?".

Problemas de formato

Um questionário deve semprecomeçar com uma introdução quedeve descrever os seus objetivo e ouso que vai ser dado à informação. Oquestionado tem o direito de saberporque está a responder às perguntase o que vai ser feito com a informaçãoque está a dar.Um questionário deve, também, terinstruções claras de preenchimento.Deve ainda, assegurar aconfidencialidade dos dadosrecolhidos, apresentar as questões deuma forma seqüencialmente lógica e

Page 20: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 20/108

 

Página 20 de 108

com um tempo de resposta o maiscurto possível.

 Tipos de Questão

A escolha do tipo de questão a usar deve ser apropriada. Asquestões de resposta aberta, isto é, respostas pelas palavras do

inquirido, tem algumas vantagens, pois estimulam o pensamentolivre, ajudam a clarificar posições e são mesmo indispensáveis paraestudos explanatórios, como por exemplo o desenvolvimento denovas questões de resposta fechada para futuros estudos. Porém,para responder a este tipo de questões, é necessário encontrar eorganizar os termos necessários o que pode tornar a resposta maiscomplicada, podem ser dadas respostas incompletas ou mesmoirrelevantes. Este tipo de questões tornam também mais complicadaanálise estatística.As questões de resposta fechada, isto é, o questionado assinala aopção que pretende responder dentro de uma possível lista de

respostas, facilitam a resposta ao questionado assim como acodificação e análise, porém limitam as possibilidades de respostacorrendo o risco de omitir respostas importantes. Neste tipo dequestão, as respostas potenciais devem ser exaustivas emutuamente exclusivas.

Escalas e codificação.

As respostas devem ser codificadas com vista à sua análise.

Page 21: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 21/108

Page 22: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 22/108

 

Página 22 de 108

 Escalas de Likert: são, geralmente, usadas para quantificar uma opiniãoou atitude. Por exemplo, na questão III para avaliação da utilidade docomputador na Medicina, é pedido a quem responde ao inquérito queassinale a resposta que mais se aproxima da sua opinião usando umaescala de 1 (discordo totalmente) a 5 (concordo totalmente). Oinvestigador pode obter a pontuação geral desta pergunta sumando aspontuações de cada alínea.

Escalas de Guttman: contêmuma série de opções deresposta que expressam umcrescimento de intensidade de

uma determinadacaracterística. Na questão IV épedido a quem responde queassinale todas as frases comque concorda. Idealmente, asrespostas devem serconsistentes, por exemplo, seuma pessoa concorda com asegunda opção,necessariamente, tem queconcordar com a primeira. Se

as respostas foremconsistentes o grau deconcordância da pessoa querespondeu será o número defrases assinaladas.

Algumas respostas podem influenciar a resposta á pergunta seguinte obrigando,ao uso de questões de filtro (exemplo: Se respondeu não à pergunta 1 passe paraa pergunta 3). As questões deste tipo podem tornar-se muito complexas,

portanto, devem explicar muito claramente e de uma forma intuitiva que perguntasnão devem ser respondidas e em que circunstâncias.

Fases de desenho de questionários

escolher o tipo de questionário

elaborar uma lista de variáveis

consultar questionário previamente testados

Page 23: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 23/108

 

Página 23 de 108

preparar o questionário

testar o questionário

fazer a versão final do questionário

pré-codificar

Seleção de participantesA seleção dos participantes envolve a definição dos critérios de inclusão eexclusão, tendo em conta a população que se pretende estudar, e, a seleção deum grupo restrito de indivíduos dessa população – amostragem – que irão serestudados.O objetivo principal de qualquer método de seleção de participantes é diminuir,

tanto quanto possível, tendo em conta as limitações financeiras, a discrepânciaentre os resultados obtidos, a partir da amostra escolhida e as verdadeirascaracterísticas da população em estudo.

Podemos dividir o processo de seleção de participantes num estudo, nasseguintes fases:

Fase 1: Conceptualização da população alvo.

A população alvo é o grupo ao qual se pretende generalizar os resultados doestudo.

A conceptualização da população alvo envolve a especificação de critérios deinclusão, como por exemplo, características demográficas, profissionais, clínicas,etc ...É deste grupo que nós gostaríamos de colher a nossa amostra pois é este o grupopara o qual queremos generalizar. Contudo, imaginemos que queremosgeneralizar o nosso estudo aos homens Portugueses que vivem na cidade e comidades compreendidas entre os 30 e o 50. Com esta população alvo iríamos levarmuito tempo a desenvolver um plano razoável de amostragem. Provavelmenteirão ser encontradas dificuldades em obter uma lista atualizada desta população emesmo que isso acontecesse iram ser muito dispendioso percorrer todas ascidades de Portugal. Será então necessário identificar a população disponível

representativa.

Fase 2: Identificação de uma população disponível representativa da populaçãoalvo.A população disponível representativa é a parte da população alvo a que temosacesso e da qual iremos tirar a amostra. A identificação desta amostar podeenvolver a especificação de novos critérios de inclusão e de exclusão

Fase 3: Desenho de um método de amostragem da população disponível.O método de amostragem baseia-se na premissa de que um número

Page 24: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 24/108

 

Página 24 de 108

relativamente pequeno de indivíduos de uma população, quando selecionadosadequadamente, podem fornecer resultados que se aproximam, com umdeterminado grau de certeza, daqueles que se encontrariam se se estuda-se a

população de onde a amostra proveio, na sua totalidade.

Métodos de amostragem:

Existem três métodos principais de amostragem, amostragem aleatória, nãoaleatória e mista.É necessário conhecer e saber utilizar estes métodos de amostragem,assim como, conhecer as vantagens e desvantagens de cada um e assituações específicas em que podem ou não ser usados, de modo a poderescolher o mais apropriado para o estudo a ser realizado.O método de amostragem usado vai determinar a capacidade de

generalização dos resultados do estudo realizado para a populaçãoestudada e determinar o tipo de análise estatística que deve ser levada acabo.

(1) Amostragem aleatória:

simples:todos os indivíduos têm probabilidades iguais eindependentes de serem selecionados.

estratificada:

a população é dividida em estratos, por uma variável deinteresse, e dentro desses estratos são escolhidos,aleatoriamente, indivíduos.

por grupos:

há dois ou mais estágios no processo de amostragem. Emprimeiro lugar, grupos de unidades são escolhidos,aleatoriamente, em seguida, dentro desses grupos sãoescolhidos todos os indivíduos ou são selecionados,aleatoriamente, apenas alguns.

(2) Amostragem não aleatória:

quotas:a amostra é escolhida num local que convenha aoinvestigador e quando aparece uma pessoa que preenchadeterminada característica é lhe sugerido que participe noestudo.

Page 25: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 25/108

 

Página 25 de 108

acidental:a amostra é escolhida num local que convenha aoinvestigador, que sugere a quem aparece que participe no

estudo (sem ter que preencher determinada característica).

bola de neve:

alguns indivíduos, de um determinado grupo são escolhidos,depois, é lhes pedido que identifiquem outras pessoas dessegrupo e que as juntem à amostra e assim sucessivamente atéatingir o tamanho de amostra requerido.

 juízo:o investigador seleciona, apenas, as pessoas que ele pensa

serem as mais indicadas para o estudo.

(3) Amostragem mista:

sistemática:são escolhidos intervalos, no primeiro intervalo é escolhido umelemento, aleatoriamente. Nos outros intervalos é escolhido oelemento que tem a mesma ordem do elemento que foiescolhido no primeiro intervalo.

Fase 4: Recrutamento.

Ao fazer o recrutamento devemos esclarecer e incentivar os participantes, tentarprecaver erros técnicos recorrendo a estudos piloto e ter em conta o tamanho deamostra apropriado.

 Tamanho da amostra

Em geral um estudo pode ter dois objetivos: estimar um efeito outestar a significância de um efeito.

Quando se pretende estimar um efeito da população, as estatísticas

obtidas têm um determinado erro padrão e, como o erro padrão estárelacionado com o tamanho da amostra é possível calcular otamanho de amostra necessário para obter um determinado erropadrão.

Quando se pretende testar uma hipótese o tamanho da amostradepende de outros critério: que certeza temos ao dizer que ahipótese é falsa (erro tipo I), a mínima diferença detectável e o poderdo teste.

Page 26: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 26/108

 

Página 26 de 108

 Reprodutibilidade e validade de medidasIntrodução

Leia atentamente os seguintes textos:

 Thirty-four consecutive women undergoing endometrial laserablation, as a treatment of menorrhagia, were recruited to assess thevalidity of fluid absorption monitoring by a new continuous automatedsystem (AquaSens). The same group of women also had monitoringof fluid absorption carried out by our standard technique of weighing. The intra-class correlation coefficient for the fluid deficit estimated byAquaSens compared to our standard technique of manually weighingthe irrigation bags was 0.98 (95% CI 0.96-0.99). Aquasens therefore

provides a valid and non-invasive method of continuously monitoringfluid deficit amongst patients undergoing operative hysteroscopyprocedures, thereby reducing the risk of unexpected fluid absorptionand its potentially fatal sequelae. (The validity of continuous automated fluid monitoring duringendometrial surgery: luxury or necessity? Hawe JA, Chien PF, MartinD, Phillips AG, Garry R. Br J Obstet Gynaecol 1998 Jul;105(7):797-801) 

OBJ ECTIVE: To evaluate interobserver agreement in visual analysisof each cardiotocographic event. METHODS: Three experts

independently divided 16 antepartum and 17 intrapartumcardiotocograms into baseline segments, accelerations anddecelerations, according to the FIGO guidelines. Baseline segmentswere further classified as having normal, reduced or increasedvariability and decelerations as early, late and variable. Uterineactivity was divided into tonus and contractions. Agreement wasassessed by the proportions of agreement (pa) with 95% confidenceintervals. RESULTS: Reproducibility in assessment of baselinesegments with normal variability, accelerations and uterine activitywas acceptable (pa = 0.56-0.71) whereas that of other segments wasnot (pa = 0.14-0.45). CONCLUSIONS: Analysis of most

cardiotocographic events is poorly reproducible, even when expertsuse the FIGO guidelines. This may be explained by some stillambiguous guidelines, by eyeball limitations in evaluation of subtleevents, and by the incapacity of busy clinicians to assess complexand multiple cardiotocographic events in a systematic and disciplinedfashion. (Evaluation of interobserver agreement of cardiotocograms.Bernardes J, Costa-Pereira A, Ayres-de-Campos D, van Geijn HP,Pereira-Leite L. nt J Gynaecol Obstet 1997 Apr;57(1):33-7) 

Page 27: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 27/108

 

Página 27 de 108

1. Que concluiu o estudo do primeiro texto quanto à validade do novosistema para a monitorizarão contínua do déficit de fluido emprocedimento cirúrgicos por histeroscopia? Que benefícios trouxe

este novo sistema em relação aos anteriores. Que Gold Standard foiusado neste estudo de validade?

2. Que concluiu o estudo do segundo texto quanto àreprodutibilidade (concordância inter-observador) da análise visualdo cardiotocograma?

Estudos de reprodutibilidade:

Idealmente, num estudo a única fonte de variabilidade existente deveria ser avariabilidade biológica intrínseca aos sujeitos em estudo, contudo muitas vezesexiste também variabilidade que está dependente da medição do observador oudo instrumento que mede.Os estudos de reprodutibilidade pretendem medir o grau de concordância entre aobservações feitas nas mesmas circunstâncias pelo mesmoobservador/instrumento (concordância intra-observador/instrumento) ou porobservadores diferentes (concordância inter-observador/instrumento).A variabilidade intra-observador é predominantemente aleatória, a variabilidadeinter-observador pode ser aleatória ou sistemática.

Diz-se que uma medida é reprodutível se provém de um procedimentoreprodutível ou seja se repetido nas mesmas condições obtém as mesmasmedidas.

Conseqüências da falta de reprodutibilidade:

A falta de reprodutibilidade nas medidas pode levar a importantesconseqüências a nível científico, clínico e médico-legal.Conseqüências a nível científico:

Se num estudo científico for usado um procedimento nãoreprodutível ao repetir o mesmo estudo nas mesmas circunstânciasvamos obter diferentes medidas e conseqüentemente diferentesresultados e conclusões. Desta forma sem ter feito um estudo préviode reprodutibilidade e sem ter a certeza que os procedimentosusados são reprodutíveis não faz sentido realizar um estudocientífico.Conseqüências a nível clínico:

A utilização de meios não reprodutíveis pode levar a resultadosinesperadamente opostos. Por exemplo usando um teste de

Page 28: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 28/108

 

Página 28 de 108

diagnóstico não reprodutível um paciente pode obter um resultadopositivo e negativo em duas vezes que é submetido ao teste nasmesmas circunstâncias. Desta forma o paciente corre o risco de

obter um resultado positivo sendo este negativo ou vice versa.

Conseqüências a nível médico legal:

 Também a nível legal não pode haver igualdade perante a lei se osprocessos médico-legais se basearem em piratagens nãoreprodutíveis.

Como melhorar procedimentos pouco reprodutíveis:

Por vezes, é possível melhorar procedimento pouco reprodutíveis.Seguem-se alguns exemplos de formas de melhorar areprodutibilidade na medição da pressão arterial.

 Treino do observador:

O treino do observador pode aumentar a reprodutibilidade de umprocedimento especialmente na concordância inter-observador. Umobservador mais experiente pode obter resultados diferentes de ummenos experiente na prática do procedimento. Por exemplo, a

medição pressão arterial pode resultar em valores diferentes nasmesmas circunstâncias, quando medida por dois observadoresdiferentes, um mais e outro menos experiente. Uma forma deaumentar a reprodutibilidade inter-observador, neste caso, podepassar pelo treino dos observadores na medição da pressão arterial.Normas:A falta de normas simples e objetiva podem também ser uma causada falta de reprodutibilidade de um procedimento. Por exemplo, avariação na medição da pressão arterial pode ser influenciada peladefinição da velocidade de desinsuflação do cuff. Uma forma deaumentar a reprodutibilidade inter-observador, neste caso, pode

passar pela definição da norma objectiva: A velocidade dedesinsuflação do cufff será de taxa de 2 mmHg/seg.Automatização:A automatização ou informatização dos procedimentos podeaumentar a sua reprodutibilidade. Por exemplo, alguns observadorespodem ter preferência por alguns dígitos e inconscientementearredondar os valores que vão observando. Neste caso, a falta dereprodutibilidade pode ser ultrapassada usando um aparelho queesconde o resultado até que lhe seja solicitado, mostrando o valorexato apenas nesse momento.Múltiplas opiniões:

Page 29: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 29/108

 

Página 29 de 108

Por vezes a falta de reprodutibilidade na obtenção de algumasmedidas só se consegue melhorar baseando a decisão em múltiplasopiniões independentes, arbitradas ou consensualizadas.

Por exemplo, usando a média de várias medições da pressão arterialfeitas por diferentes observadores independentes

Estudos de validade:

Os estudos de validade pretendem medir o impacto dos erros (sistemáticos) devalidade introduzidos e recorrem a amostras onde são feitos os doisprocedimentos, o que se pretende testar e o de referência, que está já validado(gold standard).Um dos grandes problemas deste tipo de estudo é exatamente o fato de, porvezes, não existir um gold standard, usando-se, nestes casos, o melhorprocedimento disponível como procedimento de referência.

Uma medida é válida se provém de um procedimento válido ou seja se medeaquilo que era suposto medir.

É importante verificar que um procedimento não reprodutível não pode ser válido,desta forma não faz sentido fazer um teste de validade a um procedimento nãoreprodutível.

Conseqüências da falta de validade:

 Também a falta de validade nas medidas pode levar a importantesconseqüências a nível científico, clínico e médico-legal.Conseqüências a nível científico:

A validade é especialmente importante em estudos onde sepretendem estimar parâmetros. Usando por exemplo uma balançaque pesa sistematicamente mais 10 kg do que o verdadeiro peso doindivíduo, num estudo que pretende estimar o peso médio dapopulação Portuguesa vamos obter um resultado enviesado. J á numestudo que pretenda testar se os homens Portugueses adultos sãoem média mais ou menos pesados que as mulheres, e se asmedidas obtidas pela balança forem reprodutíveis, então a sua faltade validade não terá conseqüências tão graves na conclusão do

Page 30: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 30/108

 

Página 30 de 108

estudo.Conseqüências a nível clínico:

A utilização de meios não validos pode levar a conclusões erradas econseqüentes procedimentos prejudiciais.

Por exemplo, se um aparelho automático de medição da pressãoarterial não válido medir sistematicamente um valor de pressãoarterial superior ao verdadeiro, poderá levar o médico à prescriçãode medicamentos anti-hipertensores não indicados para o pacienteem causa.Conseqüências a nível médico legal:

 Também a nível legal pode não ser feita justiça se os processos

médico-legais se basearem em piratagens não válidas.

Como melhorar procedimentos não válidos:

Por vezes é possível melhorar procedimento não válidos. Seguem-sealguns exemplos de formas de melhorar a validade.

 Treino do observador:

 Tal como no caso da falta de reprodutibilidade o treino do observadorpode aumentar a validade de um procedimento. Por exemplo, um

observador pouco experiente pode cometer um erro que o leve aobter resultados sistematicamente mais baixos.

Normas: Também a falta de normas simples e objetivas podem ser umacausa da falta de validade de um procedimento. Da mesma forma,por não estar definida uma norma simples de utilização de umaparelho pode levar a uma medida sistematicamente diferente dareal (mais alta ou mais baixa).

Automatização: Também a automatização ou informatização dos procedimentospode aumentar a sua validade.

Por exemplo, o observador podem ter a tendência para exagerar naleitura dos resultados obtendo sistematicamente resultados maisgraves o que pode ser ultrapassado pela leitura computorizada.

Ocultamento:Por vezes a falta de validade na obtenção de algumas medidas está

Page 31: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 31/108

 

Página 31 de 108

relacionada com a sugestão do observador. Por exemplo, quandonum ensaio clínico o investigador encontra sistematicamenteresultados mais graves em pacientes sujeitos a um placebo e menos

graves nos pacientes que testam um novo medicamento. Nestecaso, o fato de se ocultar do investigador a proveniência (grupo decontrolo ou grupo experimental) do indivíduo pode aumentar avalidade dos resultados.

Métodos de quantificação da concordância:

Os métodos usados para quantificar a concordância, tanto em estudos dereprodutibilidade como em estudos de validade, dependem da escala dasvariáveis em estudo ( Contínuas ou Categóricas: ordinais, nominais, dicotómicas).

Page 32: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 32/108

Concordância em:

Estudos deReprodutibilidade

Estudos de Validade

Escala Escala do testeem estudo

Escala doreferência

Sensibilidade e Especificidade - Categóricadicotómica

Categóricadicotómica

Valores preditivos - Categóricadicotômica

Categóricadicotômica

Área sob a curva ROC - Continua Categóricadicotômica

Likelihood ratios  - Continua Categóricadicotômica

Proporções de concordância Categórica A mesma escala Categórica

Estatística Kappa Categórica dicotômica A mesma escala categórica dico

Estatística Kappa ponderada Categórica ordinal A mesma escala categórica ord

Page 33: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 33/108

Limites de concordância(Bland & Altman)

Continua A mesma escala contínua

Coeficiente de Correlação Intra-

classe

Continua A mesma escala contínua

Page 34: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 34/108

 

Página 34 de 108

Estatística DescritivaIntrodução

Numa análise estatística de uma amostra podemos distinguir duas etapas: Adescrição dos dados amostrais - estatística descritiva - e a extrapolação destesresultados para a população - estatística inferências.

Neste capítulo estudaremos as técnicas de sumariar e apresentar dados queratravés de medidas apropriadas (medidas de sumário), quer através de tabelas egráficos.

Estatística descritivaClassificação de variáveis

Apesar de haver vários formas de classificar variáveis, vão ser apresentadosapenas os tipos de de variáveis que mais condicionam a análise estatística.

Contínuas(ex: tensão arterial,idade, altura,...)

nominais (ex:sexo, grupo sanguíneo,...)Variáveis

Categóricas ordinais (ex:escala qualitativa - ..., suf, bom,mto bom; Apagar; estadiamento de cancro,;...)

As variáveis contínuas são variáveis que podem assumir qualquer valor numintervalo. Por exemplo o peso é uma variável contínua pois pode assumir qualquervalor (78,453437.... Kg). J á o número de filhos só pode assumir determinadosvalores (1,2,3...); a estas variáveis dá-se o nome de categóricas pois os valoresque assumem podem ser considerados categorias.

Não faz sentido falar na categoria 78,453437...Kg mas já faz sentido falar nacategoria "casal com 2 filhos".

As variáveis categóricas por sua vez ainda se dividem em ordinais e nominais. Seas categorias da variável têm uma ordem, isto é, se pode dizer que uma categoria

está antes da outra, a variável diz-se ordinal; se as categorias não têm ordem (porexemplo as categorias do sexo, feminino e masculino, não têm uma ordenaçãoprópria) as variáveis designam-se de nominais.

Muitas vezes, por conveniência da análise "categorizam-se" variáveis contínuas.Por exemplo a idade (variável contínua) pode ser "categorizada" em gruposetários (variável categórica), assim um indivíduo que tenha 24,4 anos pertence,por exemplo, á categoria [20 a 30 anos].

A seguir veremos como se pode sumariar a informação dos diferentes tipos devariáveis

Page 35: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 35/108

 

Página 35 de 108

 

Estatística descritivaVariáveis categóricasVVaarriiáávveeiiss nnoommiinnaaiiss 

Uma forma simples de sumariar variáveis nominais é contar o número deindivíduos em cada categoria. Esta contagem é designada por freqüência de umacategoria. A variável pode então ser descrita numa tabela de freqüências, ondesão indicadas as categorias da variável e as respectivas freqüências. Pode serainda acrescentada na tabela as freqüências expressas em forma depercentagem.

A tabela 1, refere-se á

distribuição de 489 recémnascidos por Hospital. Databela observa-se, porexemplo, que 195 dosrecém nascidos nasceramno Hospital B e que 33%nasceram no Hospital C.

Outra forma de apresentar as freqüências é usar um gráfico de barras como nafigura 1. Cada barra representa a freqüência de cada categoria. No caso dasvariáveis nominais as categorias podem ser apresentadas por qualquer ordem. Nográfico da figura 1, referente à tabela 1, optou-se por apresentar as categorias por

ordem decrescente de freqüência.

 Tabela 1 - Distribuição de 489 nascimentos pohospital

Figura 1

Page 36: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 36/108

 

Página 36 de 108

Para este tipo de variáveis também se costuma usar um gráfico circular. O círculorepresenta os 100% dos indivíduos e cada 'fatia' é proporcional à freqüência decada categoria. Na figura 2 pode-se observar que o Hospital B tem mais recémnascidos que o Hospital A e C.

VVaarriiáávveeiiss oorrddiinnaaiiss 

A forma de sumariar variáveis ordinais é semelhante à das variáveis nominais,ainda que não se possa alterar a ordem das categorias uma vez que estas têmuma ordem própria. A tabela de freqüências em baixo (tabela 2) apresenta aescolaridade das mães dos 489 recém-nascidos. Nesta tabela inclui-se tambémuma coluna com a percentagem acumulada, que indica soma da percentagem da

categoria respectiva com as percentagens das categorias anteriores.

Figura 2

 Tabela 2 - Distribuição do grau de escolaridade das mães de 489 recémnascidos

Page 37: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 37/108

 

Página 37 de 108

Da tabela 2 pode-se então observar que 6% das mães (28 mães) não tiverameducação formal e que 63% tiveram menos que a escola secundária, isto é, 6%sem educação formal mais 57% com a escola primária.

Variáveis contínuas

Para descrever ou sumariar variáveis contínuas uma tabela de freqüências não é,normalmente, muito útil, pois grande parte dos valores terão freqüência 1 e destaforma a tabela de freqüências seria uma grande lista de valores pouco menoscomplexa que a totalidade dos dados da variável. Da mesma forma um gráfico debarras para dados contínuos seria composto por uma séria de pequenas barras.Uma melhor opção a este gráfico é o histograma. O histograma é semelhante aográfico de barras com a diferença que cada barra representa a freqüência de umintervalo de valores. Cada intervalo de valores tem a continuação no intervalo da

barra seguinte. Por isso as barras são representadas todas juntas.Na figura 1 o histograma refere-se ao peso à nascença de 462 recém nascidos. Abarra mais escura representa o número de recém nascidos (setenta e três) compeso entre os 3300gr e 3500gr.

As variáveis contínuas podem também ser sumariadas usando medidas desumário. A média é um exemplo bem conhecido destas medidas (a média é emparticular uma medida de posição e, dentro destas, uma medida de tendênciacentral). Uma forma de sumariar os peso dos 462 recém nascidos é apresentar opeso médio, 3263gr. Este valor é calculado somando os 462 pesos e dividindo por462.

Outra medida de tendência central é a mediana. A mediana indica o centro dadistribuição da variável, ou seja, é o valor acima do qual estão 50% dos valores davariável e abaixo os restantes 50%.

Uma forma simples de calcular a mediana é ordenando todos os valores sendo amediana o valor central. Por exemplo, para calcular oa mediana do conjunto 4, 2,3, 2, 7 vamos primeiro ordená-lo: 2, 2, 3, 4, 7. O valor do meio é o 3, então 3 é amediana do conjunto.

Figura 1

Page 38: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 38/108

 

Página 38 de 108

 

Figura 2: Peso mediano dos recém nascidos.

Na figura 2 está representada a distribuição do peso de 462 recém nascidos. Amediana neste caso é 3300gr, o que quer dizer que 50% dos recém nascidos (231recém nascidos) têm um peso inferior a 3300gr e os restantes 50% têm um pesosuperior a 3300gr.

O conceito da mediana pode ser generalizado para outras percentagens além dos50%. Por exemplo, podemos querer saber qual é o valor abaixo do qual estão10% dos indivíduos. A esta medida de posição dá-se o nome de percentil 10. Amediana é portanto, o percentil 50. Alguns percentis têm uma designaçãoespecial. Por exemplo o percentil 25 e o percentil 75 são referidos como o 1ºquartil e o 3º quartil, respectivamente.

Page 39: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 39/108

 

Página 39 de 108

 

Figura 3: Percentil 5 e percentil 95 do peso dos recém nascidos

No exemplo dos 462 recém nascidos os percentis 5 e 95 são respectivamente2303gr e 4097gr. Isto quer dizer que 90% dos recém nascidos têm o pesocompreendido entre as 2303gr e 4097gr como está indicado na figura 3 .

Outro tipo de medidas de sumário são usadas para indicar o grau de dispersãodos dados; estas medidas designam-se por medidas de dispersão. O desviopadrão é um exemplo destas medidas e indica a variação dos dados à volta damédia.

A tabela 1 apresenta alguns exemplos dos desvio à média dos pesos à nascençados 462 recém nascidos

Page 40: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 40/108

 

Página 40 de 108

 Tabela 1 - Desvios (diferenças) à média dos pesos dos recém nascidos

O desvio padrão é uma medida que resume todos estes desvios a um único valor,neste caso 553.5gr.

Figura 4: Duas distribuições com a mesma média e desvios padrões diferentes.

Os dois histogramas da figura 4 referem-se a dados com a mesma média mascom diferentes dispersões à volta dos mesmos. Os dados referentes aohistograma A têm uma maior dispersão do que os do histograma B, assim odesvio padrão do A é maior do que o B.

A diferença entre dois percentis pode também ser usada para descrever avariação dos dados. A esta medida dá-se o nome de âmbito (range). Por exemploo âmbito dos percentis 5 e 95 do peso dos 463 recém nascidos 1794 gr. (4097gr -2303gr). Um dos âmbitos mais usados é o âmbito interquartil, ou seja, a diferençaentre o percentil 75 e 25.

A escolha das medidas de posição e dispersão apropriadas

Peso - média diferença

3920 - 3263 6573020 - 3263 2433290 - 3263 27

:::

:::

Page 41: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 41/108

 

Página 41 de 108

Um dos fatores que se deve ter em conta na escolha das medidas a usar é o tipode distribuição da variável.

A média é mais informativa do que a mediana pois no seu cálculo são utilizados osvalores da variável, enquanto no cálculo da mediana apenas se usa a posiçãorelativa de cada valor. Consideremos o seguinte conjunto de valores comoexemplo,

2, 4, 5, 6, 8

A média é (2+4+5+6+8)/5 = 5 e a mediana também é 5. Mas se alterarmos oúltimo valor para 23, isto é

2, 4, 5, 6, 23

a mediana continua a ser 5 mas a média foi alterada para 8.

Neste exemplo pode-se observar que a média é mais afetada por valoresextremos do que a mediana. Em situações em que a variável apresenta valoresmuito extremos, deve-se optar pela mediana dando assim uma indicação maiscorretas da zona central da distribuição. Uma regra geral muitas vezes utilizada éapresentar a média em distribuições simétricas e a mediana em distribuiçõesassimétricas.

Relativamente às medidas de dispersão, estas dever ser escolhidas em função da

medida de tendência central. O desvio padrão só deverá ser apresentado seestiver associado à média, uma vez que esta medida se refere aos desvios àmédia. No caso de se apresentar a mediana poder-se-á optar por indicar o âmbito,por exemplo interquartil, ou apresentar dois pecentis. Os pares de percentis maisfreqüentemente usados são o (percentil 5, percentil 95) e o (percentil 25, percentil75).

Comunicação de ResultadosComunicação de resultados

"Brilliance has an obligation not only to create but also to communicate"J. R. Platt 

A disseminação dos conhecimentos e observações teve sempre um papelessencial na evolução da ciência, poder-se-ia dizer que é mesmo um dever docientista comunicar as suas descobertas ao mundo e, assim, alimentar oprogresso da ciência. Hoje em dia, a disseminação de informação faz-se a umavelocidade espantosa, graças à comunicação eletrônica e digital. A publicação deartigos na Internet é uma realidade, mas ainda não substituiu a publicação empapel, nem é provável que o venha a fazer a curto prazo. Isto tem tanto a ver comuma resistência por parte de alguns cientistas, baseada em medos, alguns bem

Page 42: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 42/108

 

Página 42 de 108

reais outros infundados, como com razões editoriais e critérios de verificação dequalidade.

Paradoxalmente, e enquanto a comunicação entre investigadores se torna cadavez mais fácil, rápida e completa, graças às novas tecnologias, observa-se emalgumas áreas, como a genética e as novas ciências da bioengenharia, a nãodivulgação de certos resultados, devido a questões relacionadas com o registro depatentes e potenciais lucros de novos métodos e produtos, já que, além de dar aconhecer à comunidade científica os resultados de uma investigação, umacomunicação serve, também, outros objetivos, nomeadamente, noestabelecimento de patentes e como certificado de primazia de uma determinadadescoberta.

A investigação científica em Medicina é em si mesma um fim e um meio, pois além

de prover novos e importantes conhecimentos para toda a comunidade, obrigaaqueles que a fazem a uma atualização constante de nível superior, que permitedispensar os melhores tratamentos e métodos de diagnóstico.

Para dar a conhecer os resultados de uma investigação existem vários métodos,mas nenhum tem o impacto de um bom artigo publicado numa revista de topocomo o New England J ournal of Medicine ou a Nature.

Antes de começar

1. Determinar o objetivo da apresentação;2. Análise da audiência/público alvo, isto é, qual o seu grau de instrução,

quais as suas atitudes e experiências :a. grau e homogeneidade da audiência a nível educacional e de

conhecimentos;b. nível de exigência técnica da audiência (se é ou não necessário

apresentar todos os detalhes técnicos);c. capacidade de interpretação de gráficos, figuras e tabelas – número,

estilo e conteúdo das imagens, uso de equações e fórmulas, etc.;3. Seleção do nível da apresentação – visão superficial e global ou

abordagem aprofundada;4. Escolha do formato da apresentação - tendo em conta os objetivos da

comunicação, o público alvo e a quantidade de informação se querfornecer;

5. Seleção do material relevante – limites de tempo ou de nº de palavras;6. Construção de componentes – tabelas, gráficos, diagramas, fotografias;7. Equilibrar os componentes – material de apoio, linguagem, estrutura global;

Page 43: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 43/108

 

Página 43 de 108

8. Ajustar às exigências editoriais ou de tempo.

Uma apresentação efetiva deve combinar uma escolha apropriada da quantidadee nível do material, com uma audiência receptiva a esse mesmo material.

Uso carreto da linguagem

A redação de trabalhos científicos não é um exercício de estilo ou de capacidadesliterárias, é sim uma apresentação do trabalho realizado, sendo executadasegundo uma série de regras precisas. Embora o talento individual vá, semdúvida, influenciar a qualidade do trabalho, é a prática e o estudo das técnicas emétodos de redação que vai influenciar mais fortemente o resultado final.

O texto deve ser breve, a linguagem, qualquer que seja o meio de comunicaçãoescolhido, deve ser simples, concisa e clara.

Qualquer que seja a língua escolhida os autores devem dominá-la. Se a nãodominam completamente, devem recorrer à ajuda de um tradutor familiarizadocom o tema e que conheça o calão técnico apropriado, aliás, em relação a estecalão técnico ou jargão, é importante referir que deve ser usado o menos possível,de modo a simplificar a mensagem, pois, quanto mais simples esta for, melhorserá compreendida.Se decidir escrever em Inglês existem uma grande variedade de livros disponiveisna nossa biblioteca que o podem ajudar, como o "How to write and publish papers

in the Medical sciences" ou o "Medical writing a prescription for clarity". O livro"Redacção e apresentação de trabalhos científicos" tem alguns bons conselhospara escrever correctamente em Português assim como algumas referênciasúteis.Para escrever segundo as regras de estilo, convém estar familiarizado os UniformRequirements for Manuscripts Submitted to Biomedical J ournals. 

A chave para uma comunicação clara e sem ruído é a existência de um contextopartilhado, isto é, que tanto o autor como a sua audiência atribuam o mesmosignificado às mesmas palavras e símbolos, ainda que, haja sempre umcomponente subjetivo devido às experiências únicas de cada um. Por esse

motivo, é importante que use poucas abreviaturas e siglas, indicando sempre aque expressão completa correspondem, quando as usar pela primeira vez, pois,por exemplo, VCI tanto pode querer dizer Via de Cintura Interna como Veia CavaInferior. A maneira correta de usar uma sigla é: primeiro, só usar siglas se aexpressão aparecer no texto um número significativo de vezes; segundo, aprimeira vez que a expressão aparecer, por exemplo, Síndrome deImunodeficiência Adquirida, escreva a sigla à frente entre parênteses (SIDA), emmaiúsculas e sem pontos.A capacidade de comunicar eficazmente é algo que seaprende, essencialmente, com a prática, quantos mais artigos e comunicaçõesorais fizer, melhores serão os resultados.

Page 44: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 44/108

 

Página 44 de 108

Antes de começar a escrever a sua comunicação, existem alguns exercícios que opoderão ajudar:

•  Pense;•  Discuta o assunto;•  Crie uma estrutura;•  Comece pelo meio, ou pela secção que seja mais fácil, geralmente os

resultados.

Existem, ainda, algumas regras que o podem ajudar, conhecidas com regras deRansom:

•  Se é ambíguo é errado;•  Conheça a audiência – Assunto e propósito;•  Se não se lembra de uma razão para por uma vírgula não a ponha;•  Escrita correta, clara e concisa;•  Se resulta faça-o.

Depois de criar um rascunho, edite-o profusamente, corrija a gramática e errosdatilográficos, depois, reveja o artigo, dê-o a alguém para ler e edite-o novamente,repita o processo até estar satisfeito.

Por fim, tenha sempre em mente uma atitude de cuidadoso auto-escrutínio econtrolo científico, tenha confiança nos seus achados científicos, e uma pitada dehumildade e criatividade.

 Tipos de Comunicação cientifica

Basicamente, existem 3 tipos de comunicação: oral, pôster e publicações.

Cada uma destas tem métodos próprios. A escolha do tipo de comunicaçãodepende de vários fatores, entre os quais se destacam o tipo de investigação, osresultados obtidos, a quem devem ser comunicados, e o objectivo que se pretendeatingir (persuasão, instrução/educação, informação).

Por sua vez, os resultados a serem publicados podem sê-lo como:

1.artigo original ou de investigação (em papel ou em formato eletrônico);

2. relatório de investigação;

3. tese / dissertação;

4. cartas ao editor;

Page 45: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 45/108

 

Página 45 de 108

5. artigo de revisão;

6. análise de séries de casos;

7. monografias e relatórios técnicos;

8. livro de texto.

Estatística DescritivaIntrodução

Numa análise estatística de uma amostra podemos distinguir duas etapas: Adescrição dos dados amostrais - estatística descritiva - e a extrapolação destesresultados para a população - estatística inferencial.

Neste capítulo estudaremos as técnicas de sumariar e apresentar dados queratravés de medidas apropriadas (medidas de sumário), quer através de tabelas egráficos.

Intervalo de confiança para a médiaIntrodução

Vimos no capítulo do erro padrão como se comporta a distribuição de médias deamostras de uma população.

Quando efetuamos uma amostra, a média desta estará situada algures nadistribuição das médias de amostras da população (figura 1 e figura 2).

Page 46: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 46/108

 

Página 46 de 108

 

Figura 1: Várias amostras da população e respectivas médias

Figura 2: Distribuição das médias de amostras feitas numa população

O intervalo,

de a ,

Page 47: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 47/108

 

Página 47 de 108

inclui 95% das possíveis médias de amostras da população(figura 3). Pode-seentão afirmar que com 95% de confiança a média da amostra observada encontra-se nesse intervalo .

Figura 3: 95% das médias de amostras da população estãono intervalo sombreado

Mas dizer que a média da amostra se encontra no intervalo referido é equivalentea afirmar, com 95% de certeza, que média da população se encontra no intervalo

( , )

Princípio dos Testes de Hipótese

Quando se determinam parâmetros da amostra (por exemplo a média) é por vezesnecessário saber se esse está de acordo com o valor previsto para a população. Aeste procedimento chamamos teste de hipótese.

Consideremos o seguinte exemplo:

Queremos saber se uma determinada moeda é equilibrada, ou seja, quandoatirada ao ar a probabilidade de sair caras ou coroas é igual a 1/2. Inicialmente,não temos nada que nos indique o contrário. Assim, a nossa hipótese inicial -chamada Hipótese Nula - é que a moeda é equilibrada. Para testarmos essa

Page 48: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 48/108

 

Página 48 de 108

hipótese, decidimos fazer uma amostra de 100 lançamentos e com base noresultado decidimos se aceitamos ou rejeitamos a Hipótese Nula.

Suponhamos que o resultado dos lançamentos foi 48 coroas e 52 caras. Será esteresultado suficientemente forte para rejeitarmos a Hipótese Nula? Ou seja, seráque este resultado é compatível com a hipótese da moeda ser equilibrada?

Efetivamente, a probabilidade de obter 48 ou menos coroas em 100 lançamentos,com uma moeda equilibrada, é de aproximadamente 0.38. Este valor é demasiadoelevado para rejeitar esta hipótese, isto é, a probabilidade de obter este resultado(ou um resultado mais extremo) com uma moeda equilibrada é alta. Assimdevemos aceitar a Hipótese Nula (HN).

Note-se que a afirmação é aceitar e não provar a Hipótese Nula (HN), pois a

moeda pode eventualmente estar viciada. O fato é que nos nossos lançamentosnão observamos nado que nos fizesse suspeitar disso. O resultado apenas não foisuficientemente forte para rejeitar a HN.

Suponhamos agora, que o resultado do lançamento foi 30 coroas e 70 caras. Aprobabilidade de se obter um resultado, tão ou mais extremo do que este, comuma moeda equilibrada é de 0.002. Podemos dizer que esta situação é poucoprovável de acontecer com uma moeda equilibrada.

Duas decisões podem ser tomadas mediante este resultado:

1) aceitar que ocorreu uma situação rara e continuar a acreditar naHipótese Nula,

2) ou, por ser demasiado raro observar o resultado com uma moedaequilibrada, rejeitar a Hipótese Nula

Pode experimentar numa simulação, alguns resultados de lançamentos de umamoeda.

A situação de comparar duas médias é algo semelhante ao exemplo anterior doteste a uma moeda.

Comparação de duas médias

O exemplo refere-se a desitometrias ósseas (medição da densidade mineralóssea) de indivíduos com e sem fratura do colo do fêmur. Na tabela 1 estãoindicadas as médias de densidade mineral óssea (BMD) para os dois grupos.

Page 49: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 49/108

 

Página 49 de 108

 

Perante este resultado poderemos afirmar que os indivíduos que fraturam o colodo fêmur têm um BMD mais baixo do que os indivíduos sem fraturam?

Efetivamente verificou-se uma diferença na amostra (0.26 = 0.96 - 0.70). Mas seráesta diferença devida a erros aleatórios do processo da amostragem ou devida auma diferença na população? Da mesma forma que não esperávamos que 100lançamentos de uma moeda equilibrada tivesse um resultado exato de 50 caras ecoroas; ainda que não haja diferenças entre o BMD dos dois grupos, não seria deesperar que as duas médias da amostra fossem exatamente iguais.

Vamos então calcular a probabilidade de, numa população onde não existediferença entre os dois grupos, ocorrer uma amostra com uma diferença de 0.26,ou uma diferença maior.

Hipótese nula (HN): médianão fracturados = médiafracturados , ou de outra forma,HN: médianão fracturados - médiafracturados=0

Na amostra observamos que: não fraturados - fraturados = 0.26

Utilizando um teste para comparação de médias, obtêm-se que a probabilidade dese observar esta diferença na amostra, ou uma superior, se a hipótese nula forverdadeira, é menor do que 0.001.

Este teste de comparação de duas médias designa-se de t-student, ou

simplesmente teste t. A razão do nome vem da utilização da distribuição com omesmo nome, que substitui a distribuição normal no caso de não se conhecer odesvio padrão da população e em vez deste utilizar-se o desvio padrão daamostra.

Para utilizar este teste é necessário fazer duas assunções. A primeira é que osdois grupos têm distribuições normais e a segunda é que o desvio padrão dos doisgrupos é semelhante. Este apresente primeiro um teste de comparação dosdesvios padrões (Teste de Levene).

 Tipos de Erros

 Tabela 1 - Médias da densidade mineralóssea de

indivíduos com e sem fratura do colo dofêmur.

Page 50: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 50/108

 

Página 50 de 108

Quando se rejeita ou aceita uma hipótese usando um teste estatístico baseadonuma probabilidade, dois erros podem acontecer:

•  Rejeitar a Hipótese Nula e esta ser verdadeira - Erro Tipo I (alfa)•  Aceitar (não rejeitar) a Hipótese Nula e esta ser falsa - Erro Tipo II (beta).

Como normalmente a Hipótese Nula é contrária à hipótese de investigação, hátendência para uma maior preocupação com o erro tipo I. Para ilustrar isto,imagine a situação de uma investigação sobre efeito de um novo fármaco (aHipótese Nula seria o fármaco não tem efeito) e que erradamente se rejeita aHipótese Nula com a conseqüente afirmação de que o fármaco tem efeito...

Por tradição (e sem mais nenhuma razão) costuma-se limitar o Erro Tipo I a 0.05.Isto equivale a dizer que se a probabilidade observada do teste de hipótese for

inferior a 0.05, rejeita-se a hipótese nula, caso contrário diz-se que não háevidência suficiente para rejeitar a Hipótese Nula (ou seja aceita-se).

Apesar desta comparação da probabilidade com o erro tipo I, não se deveconfundir a probabilidade com o erro.

No exemplo anterior do peso à nascença, seguindo a regra apresentadadeveríamos rejeitar a Hipótese de que não há diferença entre o BMD dosfraturados e não fraturados, ou seja, afirmar que indivíduos com fratura do colo dofêmur têm BMD diferente dos sem fratura.

 Tabelas de contingência e Qui-quadrado

 Tabelas de contingência

As tabelas de contingência são utilizadas para estudar a relação entre duasvariáveis categóricas descrevendo a freqüências das categorias de uma dasvariáveis relativamente às categorias de outra.

 Tabela 1 - Distribuição do consumo de álcool por grupoetário

Page 51: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 51/108

 

Página 51 de 108

Na base de dados,vamos observar qual o consumo de tabaco no início dagravidez, em função do grupo etário da mãe .

A Tabela (de contingência) 1 apresenta o consumo de tabaco por grupo etário(ambas as variáveis são categóricas). Podemos ler na tabela que 252 mães têmidade entre 21 e 30 anos e não fumaram no início da gravidez.

Conforme o problema a estudar, a tabela pode ser completada com aspercentagens referentes ao total da linha, coluna ou ao valor total. No exemplo da Tabela 1, fará sentido acrescentar as percentagens por para se comparar em cadagrupo etário qual a percentagem de mães que fumaram (Tabela 2).

Na Tabela 2 podemos então observar que há mais mães fumadoras no grupoetário do 13 aos 20 anos (35%) do que no grupo etário dos 36 aos 55 anos (5%).

Qui-quadrado

Podemos observar na tabela 1 que parece haver uma relação entre a idade dasmães e o consumo do tabaco, ou seja, parece que há mais fumadadoras entre as

mães mais jovens do que entre as mais velhas.

 Tabela 2- Distribuição do consumo de álcool por grupoetário

Page 52: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 52/108

 

Página 52 de 108

A questão agora, é saber se esta relação encontrada na amostra é significativa, ouseja, se há evidência suficiente para considerarmos que existe uma relação entre

consumo de tabaco e a idade das mães.Pode-se observar que no total, 12% das mães fumaram no início da gravidez. Senão existisse relação com o grupo etário, seria de esperar que esta percentagemde mantivesse em todos os grupos.

Por exemplo, existem 297 mães no grupo etário dos 21ao 30 anos, portanto seriade esperar que 36 mães fossem fumadoras (297x12%=36 mães).

Este cálculo pode ser generalizado para obter o valor esperado para cada célulada tabela, multiplicado o total da linha pelo total da coluna e dividir pelo total

(figura 1).Para testar a hipótese nula de que não existe relação entre as duas variáveis,

usamos a seguinte estatística designada de qui-quadrado ( ).

 Tabela 1- Distribuição do consumo de álcool por grupo etário

Page 53: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 53/108

 

Página 53 de 108

Figura 1 - Cálculo do valor esperado para a situação da hipótese nula serverdadeira

No exemplo anterior o valor do qui-quadrado é:

O qui-quadrado não é mais do que uma comparação dos valores observados natabela com os valores esperados se não existisse relação entre as duas variáveis,ou seja se a hipótese nula fosse verdadeira. A partir do qui-quadrado pode-seentão calcular a probabilidade de se obter a diferença entre os valores observadose esperados, ou uma diferença superior, se a Hipótese Nula fosse verdadeira(valor p). Como em todos os testes de hipótese, é com base nesta probabilidade

que decidimos se rejeitamos ou aceitamos a Hipótese Nula.

No caso da relação do consumo de tabaco e grupo etário das mães, o valor passociado ao qui-quadrado encontrado (17,6) é 0.001, ou seja, podemos dizer queexiste uma relação (estatística) entre o consumo de tabaco e a idade das mães.

Page 54: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 54/108

 

Página 54 de 108

Correlação e regressão linear simplesIntrodução

Leia atentamente o seguinte abstract:

Diet and gastric cancer in Portugal-a multivariate model. Azevedo LF, Salgueiro LF, Claro R, Teixeira-Pinto A, Costa-Pereira A Serviço de Bioestatística e Informática Médica, Faculdade de Medicina daUniversidade do Porto, Portugal. 

Eur J Cancer Prev 1999 Feb;8(1):41-8 

Diet and gastric cancer mortality in Portugal was studied using a multivariateecological model. The factors investigated over 18 districts were the relationship

between gastric cancer mortality (1994-96), dietary habits, and socio-economicfactors (1980-81). Mortality geographical pattern was established using age-standardized mortality rates, per capita dietary consumption of foodstuffs andnutrients was obtained from the National limentary Survey (1980-81), and data onsocio-economic factors from the 1981 National Census. Pearson correlationcoefficients and simple and multiple linear regression models were used. Themortality geographical pattern resembled a north-south gradient, and dietary habitsand socio-economic factors had great variability throughout the country. Thehighest negative correlation coefficients between dietary consumption and gastriccancer mortality were obtained for vegetables, fruit, vitamin A and caroteneconsumption, and the highest positive coefficients were for rice, wine and

carbohydrate consumption. No significant correlations were obtained for socio-economic factors. In multiple regression analysis, vegetable and rice consumptioncould account for 79% of the gastric cancer mortality variability for males, andvegetable and meat consumption could account for 69% of this variability forfemales. Interestingly, meat consumption was found to be protective. A meanincrease of 100 g/person/day in vegetable consumption would imply a meanpredicted decrease of 10 (95% CI 6-14) and 5 (95% CI 3-7) gastric cancer deathsper 100,000 persons/year, for males and females respectively, in simple regressionanalysis. Such a decrease represents about one-third of the mean national gastriccancer mortality rate. Therefore, an increase in vegetable consumption is stronglyrecommended. 

Consideremos o exemplo do estudo referente ao abstract apresentadoanteriormente. Nesse estudo analisou-se a relação entre o consumo de váriosalimentos pelos 18 distritos de Portugal com a mortalidade por cancro doestômago (gastric cancer ) feminino e masculino nessas mesmas regiões.

Page 55: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 55/108

 

Página 55 de 108

Os dados apresentados na Tabela 1 referem-se ao consumo médio de vegetais

por dia e às respectivas taxas de mortalidade do sexo masculino e feminino emcada um dos distritos. (Pode fazer

Figura 1 - Diagrama de dispersão do consumo médio diário de vegetais e da taxade mortalidade feminina. Os valores para o distrito do Porto estão assinalados atítulo de exemplo.

Uma forma simples de visualizar uma possível relação entre a quantidade devegetais consumida e a taxa de mortalidade é utilizar um diagrama de dispersão

para estas duas variáveis.Podem-se observar na figura 1 e figura 2, os diagrama de dispersão para cadasexo, relativos ao consumo médio diário de vegetais e taxas de mortalidade.

Page 56: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 56/108

 

Página 56 de 108

 

Figura 2 - Diagrama de dispersão do consumo médio diário de vegetais e a taxade mortalidade masculina.

Cada ponto do diagrama refere-se a um determinado distrito de Portugal,indicando o consumo médio de vegetais e a respectiva taxa de mortalidade. Nafigura 1 está assinalado o ponto correspondente ao distrito do Porto.

Figura 3 - Diagrama de dispersão do consumo médio diário de vegetais e a taxade mortalidade feminina com a reta que melhor aproxima a relação entre as duasvariáveis.

Uma observação dos gráficos da figura 1 e figura 2 sugere que com o aumentoconsumo de vegetais a taxa de mortalidade diminui.

Page 57: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 57/108

 

Página 57 de 108

Esta relação pode ser aproximada pela reta indicada na figura 3 e figura 4.

Figura 4 - Diagrama de dispersão do consumo médio diário de vegetais e a taxade mortalidade masculina com a recta que melhor aproxima a relação entre asduas variáveis

A recta apenas aproxima a sugestionada relação entre as duas variáveis. Se estafosse usada para estimar a taxa de mortalidade para um determinado consumo devegetais teria, como se observa na figura 4, um erro associado.

Correlação e Regressão linear simplesCorrelação

Antes de continuarmos com o exemplo anterior, observemos os diagramas dedispersão da figura 5.

Page 58: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 58/108

 

Página 58 de 108

 

Figura 5 - Quatro diagramas de dispersão com diferentes relações entre X e Y e areta que aproxima estas relações. No gráfico D está a ponteado uma curva quemelhor aproxima a relação quadrática das variáveis

Os diagramas apresentam quatro situações distintas:

 A – A reta representa a relação perfeita entre X e Y. A relação entre

as duas variáveis é negativa, i.e., quando X aumenta Y diminui.

B - A reta é uma boa aproximação da relação entre X e Y. A relaçãoentre as duas variáveis é positiva, i.e., quando X aumenta Y tambémaumenta.

C - A reta não é uma boa aproximação pois não há relação entre X eY.

D - A reta não é uma boa aproximação da relação entre X e Y. Arelação entre X e Y não é linear, i.e., não é representada por uma

reta. Na figura é sugerida, a tracejado, uma relação quadrática.

Para avaliar se a reta é, ou não, uma boa aproximação da relação entre duasvariáveis utiliza-se uma estatística designada coeficiente de correlação dePearson, ou simplesmente, correlação. Este coeficiente é normalmenterepresentada pela letra r.

A correlação, é então, uma medida da 'qualidade' da aproximação da relaçãoentre duas variáveis por uma reta, ou seja, a correlação mede a 'força' daassociação linear entre duas variáveis.

Page 59: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 59/108

 

Página 59 de 108

Nota: A fórmula de cálculo do coeficiente de correlação não faz partedo programa deste módulo, mas pode ser consultada aqui.

O coeficiente de correlação varia entre -1 e 1. O valor 0 (zero) significa que não hárelação linear, o valor 1 indica uma relação linear perfeita e o valor -1 tambémindica uma relação linear perfeita mas inversa, ou seja quando uma das variáveisaumenta a outra diminui. Quanto mais próximo estiver de 1 ou -1, mais forte é aassociação linear entre as duas variáveis.

Nota: Uma correlação 0, ou próxima de 0, não implicaobrigatoriamente, que as duas variáveis não estão relacionadas masapenas que as duas variáveis não estão relacionadas de uma formalinear. No caso do diagrama D da figura 5 as duas variáveis estãorelacionadas mas não linearmente.

Nos diagramas de dispersão apresentados (figura 5) os coeficientes de correlaçãosão respectivamente, A:-1,B: 0.91, C: 0 e D: 0.

Figura 6 - Matriz de correlação das variáveis VEGETAIS, MORTM e MORTF

No estudo da relação entre o consumo de vegetais e taxa de mortalidade, obtém-se uma correlação de -0.743 e -0.814 para o sexo feminino e masculinorespectivamente (figura 6).

Outra vantagem do uso da correlação como medida de associação linear de duasvariáveis é que o quadrado deste coeficiente (r2) é interpretado como apercentagem de variação explicada por uma das variáveis em relação à outra. Nocaso estudado, pode-se dizer que o consumo de vegetais explica 55% (=0.7432)da variação da taxa de mortalidade feminina e 66% (=0.8142) da masculina.

Page 60: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 60/108

 

Página 60 de 108

Avaliação de Testes DiagnósticosProblemaLeia atentamente o seguinte "Abstract":

Does this patient have abdominal aortic aneurysm? 

Lederle FA, Simel DL 

 J AMA 1999 J an 6;281(1):77-82 

Department of Medicine, Minneapolis Veterans Affairs Medical Center, Universityof Minnesota, 55417, USA. [email protected] 

In the physical examination of abdominal aortic aneurysm (AAA), the onlymaneuver of demonstrated value is abdominal palpation to detect abnormalwidening of the aortic pulsation. Palpation of AAA appears to be safe and has notbeen reported to precipitate rupture. The best evidence on the accuracy of abdominal palpation comes from 15 studies of patients not previously known tohave AAA who were screened with both abdominal palpation and ultrasound.When results from these studies are pooled, the sensitivity of abdominal palpationincreases significantly with AAA diameter (P<.001), ranging from 29% for AAAs of 3.0 to 3.9 cm to 50% for AAAs of 4.0 to 4.9 cm and 76% for AAAs of 5.0 cm orgreater. The positive predictive value of palpation for AAA of 3.0 cm or greater inthese studies was 43%. Limited data suggest that abdominal obesity decreasesthe sensitivity of palpation. Abdominal palpation specifically directed at measuring

aortic width has moderate sensitivity for detecting an AAA that would be largeenough to be referred for surgery but cannot be relied on to exclude AAA,especially if rupture is a possibility. 

Partindo do pressuposto de que os resultados deste trabalho são válidos e podemser aplicados à população de doentes que se apresentam no Serviço de Urgênciado HSJ , responda às seguintes questões:

1. Qual a probabilidade de um doente que aparece no SU do HSJ com

um aneurisma da aorta abdominal de 3.5 cm ter uma palpaçãoabdominal positiva?

2. Qual a probabilidade de um doente que aparece no SU do HSJ comum aneurisma da aorta abdominal de 4.5 cm ter uma palpaçãoabdominal positiva?

3. Qual a probabilidade de um doente que aparece no SU do HSJ comum aneurisma da aorta abdominal de 5.5 cm ter uma palpaçãoabdominal positiva?

4. Qual a probabilidade de um doente que aparece no SU do HSJ etem uma palpação abdominal positiva ter um aneurisma da aortaabdominal maior que 3 cm?

Page 61: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 61/108

 

Página 61 de 108

 

 Testes diagnósticos

O diagnóstico é um dos mais importantes atos em medicina. Fazer um diagnósticoé um processo probabilístico de decisão que visa classificar o doente dentro deuma determinada entidade nosológica a que corresponderá um determinadotratamento e um determinado prognóstico. Para levar a cabo um diagnósticoteremos então que utilizar métodos que permitam discriminar entre populações dedoentes e de não doentes, sendo essa a definição de teste diagnóstico. O termotestes diagnósticos, geralmente, aplica-se aos exames complementares dediagnóstico, no entanto, ele deve ser entendido num sentido mais amplo,abrangendo não só os exames complementares de diagnóstico como tambémtodos os dados provenientes da história clínica e exame físico.

A avaliação da exatidão de um qualquer teste diagnóstico está dependente dacomparação dos resultados a partir dele obtidos com o verdadeiro estado de cadaindividuo. Assim, para determinar o verdadeiro diagnóstico, é preciso que existaum teste, ou conjunto de testes, que dêem uma grande certeza sobre o mesmo.Ao teste que, em determinado momento, tem a maior exatidão na determinaçãode um diagnóstico dá-se o nome de "gold standard". No entanto, o "gold standard"raramente tem uma exatidão de 100%, tornando-se, assim, difícil utilizá-lo comopadrão para comparação com testes alternativos de que se desconhece aexatidão.

Na tabela 1 sumariza-se a relação entre o resultado de um teste diagnóstico e overdadeiro diagnóstico:

Doença

Presente Ausente

Positivo Verdadeiro Positivo Falso Positivo

 Teste

Negativo Falso Negativo Verdadeiro Negativo

 Tabela 1: Relação entre o resultado de um teste diagnóstico de o verdadeirodiagnóstico.

Os testes diagnósticos podem ser classificados em dois grandes grupos:

Page 62: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 62/108

 

Página 62 de 108

o   Testes qualitativos: o resultado do teste, positivo ou negativo, é dadotendo em conta a presença ou ausência de uma determinadacaracterística.

o   Testes quantitativos: o resultado do teste é estabelecido numaescala contínua e é classificado como positivo ou negativo tendo emconta um determinado "cutoff point" arbitrariamente selecionado.

Características dos testes diagnósticos

Doença

Presente Ausente

Positivo a b a+b  TesteNegativo c d c+d a+c  b+d 

Figura 1 - Características dos testes diagnósticos: Se - sensibilidade; Es -especificidade; VPP - valor predicativo positivo;VPN - valor predicativo negativo; P- prevalência; Ex - exatidão 

Sensibilidade: proporção de indivíduos doentes que têm um testepositivo ou a probabilidade de, estando doente, ter um teste positivo.

Especificidade: proporção de indivíduos não doentes que têm umteste negativo ou a probabilidade de, não estando doente, ter umteste negativo.

Valor preditivo positivo: proporção de indivíduos com o teste positivoque são doentes ou a probabilidade de, tendo um teste positivo,estar doente (probabilidade pós-teste).

Valor preditivo negativo: proporção de indivíduos com o testenegativo que não são doentes ou a probabilidade de, tendo um testenegativo, não estar doente.

Exatidão: proporção de indivíduos que tiveram um resultadoverdadeiro ou probabilidade de obter um resultado verdadeiro com oteste em causa.

Prevalência: proporção de indivíduos doentes ou probabilidade deestar doente, independentemente do resultado do teste(probabilidade pré-teste).

Page 63: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 63/108

 

Página 63 de 108

 Testes Sensíveis

Um teste muito sensível é aquele que, geralmente, é positivo quandoa doença está presente. Este tipo de testes são úteis nas seguintessituações:

  Quando existe uma penalização importante para a omissão dodiagnóstico;

  Em programas de rastreio;  No início da avaliação de um doente, quando estão a ser

consideradas muitas possibilidades de diagnóstico, de modo apôr de parte, com grande confiança, alguns diagnósticos, eassim, reduzir as possibilidades de diagnóstico.

Conclui-se que um teste muito sensível é mais útil quando o resultado é negativo.

 Testes Específicos

Um teste muito específico é aquele que, geralmente, é negativoquando a doença está ausente. Este tipo de testes são úteis nasseguintes situações:

  Quando se pretende confirmar um diagnóstico que é sugeridopor testes menos específicos;

  Quando a existência de um resultado falso positivo tem

importantes implicações físicas, emocionais ou financeiraspara o doente.

Conclui-se que um teste muito específico é mais útil quando o resultado é positivo.

Curvas ROC

Geralmente, a sensibilidade e a especificidade são características difíceis deconciliar, isto é, é complicado aumentar a sensibilidade e a especificidade de um

teste ao mesmo tempo. As curvas ROC (receiver operator characteristic curve)são uma forma de representar a relação, normalmente antagónica, entre asensibilidade e a especificidade de um teste diagnóstico quantitativo, ao longo deum contínuo de valores de "cutoff point".

Para construir uma curva ROC traça-se um diagrama que represente asensibilidade em função da proporção de falsos positivos (1- Especificidade) paraum conjunto de valores de "cutoff point".

Page 64: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 64/108

 

Página 64 de 108

 

Figura 3: Curvas ROC. A, B e C representam a sensibilidade em função de (1-especificidade) para três "cutoff point" diferentes. O ponto para o qual se consegueuma melhorsensibilidade e especificidade, na curva 2, é B. O teste correspondente à curva 1tem uma exatidão superior ao correspondente à curva 2.

Quando se tem uma variável contínua, resultado da aplicação de um testediagnóstico quantitativo, e se pretende transforma-la numa variável dicotômica, dotipo doente / não doente, temos que utilizar um determinado valor na escalacontínua que discrimine entre essas duas classes. A esse valor dá-se o nome de"cutoff point".

O valor escolhido como "cutoff point" vai influenciar as características do teste,como exemplificado na figura 3 (curva 2). No exemplo da figura 3, quanto maior éo "cutoff point" maior é a especificidade do teste mas menor é a sensibilidade(ponto C da curva 2); e quanto menor o "cutoff point" maior é a sensibilidade masmenor é a especificidade (ponto A da curva 2).

Page 65: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 65/108

 

Página 65 de 108

Assim, a intenção com que se utilizará o teste diagnóstico vai influenciar a escolhado "cutoff point", logo, das características do teste. No exemplo da curva 2 dafigura 3, se pretendemos um teste muito sensível e menos específico, escolhe-se

um "cutoff point" menor (ponto A), obtendo-se uma maior proporção de falsospositivos; se pretendemos um teste muito específico e menos sensível, escolhe-seum "cutoff point" maior (ponto C), obtendo-se uma menor proporção de falsosnegativos.

As curvas ROC descrevem a capacidade discriminativa de um teste diagnósticopara um determinado número de valores "cutoff point". Isto permite pôr emevidência os valores para os quais existe maior optimização da sensibilidade emfunção da especificidade. O ponto, numa curva ROC, onde isto acontece é aqueleque se encontra mais próximo do canto superior esquerdo do diagrama (ver figura3, ponto B da curva 2).

Por outro lado, as curvas ROC permitem quantificar a exatidão de um testediagnóstico, já que, esta é proporcional à área sob a curva ROC, isto é, tantomaior quanto mais a curva se aproxima do canto superior esquerdo do diagrama.Sabendo isto, a curva será útil, também, na comparação de testes diagnósticos,tendo um teste uma exatidão tanto maior, quanto maior for a área sob a curvaROC (ver figura 3).

Valores preceptivos e seus determinantes

Na clínica, e uma vez pedido um teste diagnóstico, a sensibilidade e a

especificidade do teste deixa de ser importante, passando a interessar só osvalores preditivos do teste, isto é, a probabilidade de, perante um resultadopositivo ou negativo, existir ou não doença (rever conceitos de valores preditivospositivos e negativos).

Os valores preditivos de um teste diagnóstico dependem, essencialmente, de trêsfatores: sensibilidade e especificidade do teste e a prevalência da doença. Asensibilidade e especificidade, pelo contrário, não dependem da prevalência dadoença.

Os valores preceptivos são, assim, definidos pelas seguintes formulas:

Page 66: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 66/108

 

Página 66 de 108

 

As relações entre estas variáveis são:

•  Quanto maior a sensibilidade, maior será o valor preditivo negativo, isto é,maior será a probabilidade de, perante um resultado negativo, não haverdoença.

•  Quanto maior a especificidade, maior será o valor preditivo positivo, isto é,maior será a probabilidade de, perante um resultado positivo, haver doença.

•  Quanto maior a prevalência da doença, maior será o valor preditivo positivoe menor será o valor preditivo negativo, isto é, quanto mais freqüente é umadoença mais provável é encontrar verdadeiros positivos (aumentando ovalor preditivo positivo), mas também é mais provável encontrar falsosnegativos (diminuindo o valor preditivo negativo).

Conclusão

Nesta altura o aluno deverá ter percebido que as respostas às questões doproblema apresentado no início desta aula advêm, diretamente, dos resultadosencontrados no artigo. Assim, as respostas às questões serão:

In the physical examination of abdominal aortic aneurysm (AAA), the onlymaneuver of demonstrated value is abdominal palpation to detect abnormal

widening of the aortic pulsation. Palpation of AAA appears to be safe and has notbeen reported to precipitate rupture. The best evidence on the accuracy of abdominal palpation comes from 15 studies of patients not previously known tohave AAA who were screened with both abdominal palpation and ultrasound.When results from these studies are pooled, the sensitivity of abdominal palpationincreases significantly with AAA diameter (P<.001), ranging from 29% for AAAs of 3.0 to 3.9 cm to 50% for AAAs of 4.0 to 4.9 cm and 76% for AAAs of 5.0 cm orgreater. The positive predictive value of palpation for AAA of 3.0 cm or greater inthese studies was 43%. Limited data suggest that abdominal obesity decreasesthe sensitivity of palpation. Abdominal palpation specifically directed at measuringaortic width has moderate sensitivity for detecting an AAA that would be large

Se - sensibilidade;Es - especificidadVPP - valor preditivo positivVPN - valor preditivo negativP - prevalência.

Page 67: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 67/108

 

Página 67 de 108

enough to be referred for surgery but cannot be relied on to exclude AAA,especially if rupture is a possibility. 

1. Qual a probabilidade de um doente que aparece no SU do HSJ comum aneurisma da aorta abdominal de 3.5 cm ter uma palpaçãoabdominal positiva? R: 29 %

2. Qual a probabilidade de um doente que aparece no SU do HSJ comum aneurisma da aorta abdominal de 4.5 cm ter uma palpaçãoabdominal positiva? R: 50%

3. Qual a probabilidade de um doente que aparece no SU do HSJ comum aneurisma da aorta abdominal de 5.5 cm ter uma palpaçãoabdominal positiva? R: 76%

4. Qual a probabilidade de um doente que aparece no SU do HSJ etem uma palpação abdominal positiva ter um aneurisma da aortaabdominal maior que 3 cm? R: 43%

O aluno deverá perceber, ainda, a importância de que se reveste a matériaapresentada nesta aula, em especial, na sua futura vida clínica, e saber aplicar osconhecimentos e aptidões que durante esta aula lhe foram transmitidos.

Leituras recomendadas

Cecil Textbook of Medicine. 21st edition. Recomenda-se a leitura dos capítulos 1 a4 e 22 a 25.

Harrison´s Principles of Internal Medicine. 14th edition. Capítulos 1 a 3.

Rothman KJ , Greenland S. Modern Epidemiology. 2nd edition. Philadelphia:Lippincott-Raven Publishers; 1998. Capítulos 1 e 2.

 Trochim, William M. The Research Methods Knowledge Base, 2nd Edition. InternetWWW page, at URL: http://trochim.human.cornell.edu/kb/index.htm (versioncurrent as of August 02, 2000).

Goodman, Albert. SCI 101: Introduction to Data Colection and Analysis. InternetWWW page, at URL: http://www.deakin.edu.au/~agoodman/sci101/index.html (version current as of November 07, 1999).

Bibliografia

Goldman L, Plum F, Bennett JC. Medicine as a Learned and Humane Profession.In: Cecil Textbook of Medicine. 21st edition. p 1-4.

Page 68: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 68/108

 

Página 68 de 108

 The Editors. The Practice of Medicine. In: Harrison s Principles of InternalMedicine. 14th edition. p 1-9.Rothman KJ , Greenland S. Modern Epidemiology. 2nd edition. Philadelphia:

Lippincott-Raven Publishers; 1998.Hulley SB, Cummings SR. Designing Clinical Research. Baltimore: Wlliams andWilkins; 1988.Trochim: Philosophy of Research.Kumar R. Research Methodology – A step-by-step guide for beginners. London:SAGE Publications; 1996.Fletcher SW. Clinical Decision Making: Approach to the patient. In: Cecil Textbookof Medicine. 21st edition. p 77-79.Lee TH. Interpretation of data for clinical decisions. In: Cecil Textbook of Medicine.21st edition. p 79-84.Goldman L. Quantitative aspects of clinical reasoning. In: Harrison´s Principles of Internal Medicine. 14th edition. p

Polgar S, Thomas SA. Introduction to Research in the Health Sciences. 3rd edition.Melbourne: Churchill Livingstone; 1995.Goodman, Albert. SCI 101: Introduction to Data Colection and Analysis. InternetWWW page, at URL: http://www.deakin.edu.au/~agoodman/sci101/index.html (version current as of November 07, 1999).Desenvolvimento por:

Serviço de Bioestatística e Informática MédicaFaculdade de Medicina da Universidade do Porto - Coordenador:  Altamiro daCosta Pereira , MD, PhD (1995-) Coordenador. Concepção e avaliação educacional.

.-2-- A NATUREZA DA ESTATÍSTICA

.INTRODUÇÃOESTATÍSTICA: ramo da matemática aplicada.ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos,óbitos. Faziam "estatísticas".IDADE MÉDIA: as informações eram tabuladas com finalidades tributárias ebélicas.SEC. XVI : surgem as primeiras análises sistemáticas, as primeiras tabelas e osnúmeros relativos.SEC. XVIII : a estatística com feição científica é batizada por GODOFREDOACHENWALL. As tabelas ficam mais completas, surgem as primeirasrepresentações gráficas e os cálculos de probabilidades. A estatística deixa de seruma simples tabulação de dados numéricos para se tornar " O estudo de como sechegar a conclusão sobre uma população, partindo da observação de partesdessa população (amostra)".. MÉTODO ESTATÍSTICOMÉTODO: é um meio mais eficaz para atingir determidada meta.

Page 69: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 69/108

 

Página 69 de 108

MÉTODOS CIENTÍFICOS: destacamos o método experimental e o métodoestatístico.MÉTODO EXPERIMENTAL: consiste em manter constante todas as causas,

menos uma, que é sofre variação para se observar seus efeitos, caso existam. Ex:Estudos da Química, Física, etc.MÉTODO ESTATÍSTICO: diante da impossibilidade de manter as causasconstantes(nas ciências sociais), admitem todas essas causas presentesvariando-as, registrando essas variações e procurando determinar, no resultadofinal, que influências cabem a cada uma delas. Ex: Quais as causas que definem opreço de uma mercadoria quando a sua oferta diminui?Seria impossível, no momento da pesquisa, manter constantes a uniformidade dossalários, o gosto dos consumidores, nível geral de preços de outros produtos, etc.A ESTATÍSTICAÉ uma parte da matemática aplicada que fornece métodos para coleta,

organização, descrição, análise e interpretação de dados e para a utilização dosmesmos na tomada de decisões.A coleta, a organização ,a descrição dos dados, o cáculo e a interpretação decoeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e ainterpretação dos dados, associado a uma margem de incerteza, ficam a cargo daESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida daincerteza ou métodos que se fundamentam na teoria da probabilidade.. FASES DO MÉTODO ESTATÍSTICO1º - DEFINIÇÃO DO PROBLEMA : Saber exatamente aquilo que se pretendepesquisar é o mesmo que definir corretamente o problema.

2º - PLANEJ AMENTO : Como levantar informações ? Que dados deverão serobtidos ? Qual levantamento a ser utilizado ? Censitário ? Por amostragem ? E ocronograma de atividades ? Os custos envolvidos ? etc.3º - COLETA DE DADOS : Fase operacional. É o registro sistemático de dados,com um objetivo determinado.Dados primários: quando são publicados pela própria pessoa ou organização queos haja recolhido. Ex: tabelas do censo demográfico do IBGE.Dados secundários: quando são publicados pro outra organização. Ex: quandodeterminado jornal publica estatísticas referentes ao censo demográfico extraídasdo IBGE.OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária

traz o grande risco de erros de transcrição.Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza umapesquisa para saber a preferência dos consumidores pela sua marca.A coleta direta pode ser : contínua (registros de nascimento, óbitos, casamentos,etc.), periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de dengue).Coleta Indireta: É  feita por deduções a partir dos elementos conseguidos pelacoleta direta, por analogia, por avaliação,indícios ou proporcionalização.4º - APURAÇÃO DOS DADOS : Resumo dos dados através de sua contagem eagrupamento. É a condensação e tabulação de dados.

Page 70: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 70/108

 

Página 70 de 108

5º - APRESENTAÇÃO DOS DADOS : Há duas foram de apresentação, que nãose excluem mutuamente. A apresentação tabular , ou seja é uma apresentaçãonumérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo

regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentaçãográfica dos dados numéricos constitui uma apresentação geométrica permitindouma visão rápida e clara do fenômeno.6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS : A última fase do trabalhoestatístico é a mais importante e delicada. Está ligada essencialmente ao cálculode medidas e coeficientes, cuja finalidade principal é descrever o fenômeno(estatística descritiva). Na estatística indutiva a interpretação dos dados sefundamentam na teoria da probabilidade.

DEFINIÇÕES BÁSICAS DA ESTATÍSTICA

FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujoestudo seja possível da aplicação do método estatístico. São divididos em trêsgrupos:

Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos poruma simples observação. A estatística dedica-se ao estudo desses fenômenos.Ex: A natalidade na Grande Vitória, O preço médio da cerveja no Espírito Santo,etc.

Fenômenos individuais:são aqueles que irão compor os fenômenos de massa. Ex:cada nascimento na Grande Vitória, cada preço de cerveja no Espírito Santo, etc.

Fenômenos de multidão:quando a s características observadas para a massa nãose verificam para o particular.

DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-primasobre a qual iremos aplicar os métodos estatísticos.

POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, umacaracterística comum.

AMOSTRA: é uma parcela representativa da população que é examinada com o

propósito de tirarmos conclusões sobre a essa população.

PARÂMETROS: São valores singulares que existem na população e que servempara caracterizá-la.Para definirmos um parâmetro devemos examinar toda apopulação.Ex: Os alunos do 2º ano da FACEV têm em média 1,70 metros deestatura.

ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso daamostra.

Page 71: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 71/108

 

Página 71 de 108

ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, olevantamento e os estudos necessários ao tratamento desses dados sãodesignados genericamente de estatística de atributo.

Exemplo de classificação dicotômica do atributo: A classificação dos alunos daFACEV quanto ao sexo.

atributo: sexo..........................classe: alunos da FACEV

dicotomia: duas subclasses ( masculino e feminino)

Exemplo de classificação policotômica do atributo: Alunos da FACEV quanto aoestado civil.

atributo: estado civil...............classe: alunos da FACEV

dicotomia: mais de duas subclasses ( solteiro, casado, divorciado, viúvo, etc.)

VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de umfenômeno.

VARIÁVEL QUALITATIVA: Quando seu valores são expressos por atributos: sexo,cor da pele,etc.

VARIÁVEL QUANTITATIVA: Quando os dados são de caráter nitidamentequantitativo, e o conjunto dos resultados possui uma estrutura numérica, trata-seportanto da estatística de variável e se dividem em :

VARIÁVEL DISCRETA OU DESCONTÍNUA: Seus valores são expressosgeralmente através de números inteiros não negativos. Resulta normalmente decontagens.Ex: Nº de alunos presentes às aulas de introdução à estatísticaeconômica no 1º semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.

VARIÁVEL CONTÍNUA: Resulta normalmente de uma mensuração, e a escala

numérica de seus possíveis valores corresponde ao conjunto R dos númerosReais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites.Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro demercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará portodas as temperaturas intermediárias até chegar na temperatura atual do seucorpo.

Page 72: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 72/108

 

Página 72 de 108

AMOSTRAGEM

MÉTODOS PROBABILÍSTICOS

Exige que cada elemento da população possua determinada probabilidade de serselecionado. Normalmente possuem a mesma probabilidade. Assim, se N for otamanho da população, a probabilidade de cada elemento será 1/N. trata-se dométodo que garante cientificamente a aplicação das técnicas estatísticas deinferências. Somente com base em amostragens probabilísticas é que se podemrealizar inferências ou induções sobre a população a partir do conhecimento daamostra.

É uma técnica especial para recolher amostras, que garantem, tanto quantopossível, o acaso na escolha.

AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES:

É o processo mais elementar e freqüentemente utilizado. É equivalente a umsorteio lotérico. Pode ser realizada numerando-se a população de 1 a n esorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x númerosdessa seqüência, os quais corresponderão aos elementos pertencentes àamostra.

Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa daestatura de 90 alunos de uma escola:

1º - numeramos os alunos de 1 a 90.

2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel,colocamos na urna e após mistura retiramos, um a um, nove números queformarão a amostra.

OBS: quando o número de elementos da amostra é muito grande, esse tipo desorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números

aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos aoacaso nas linhas e colunas.

.AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:

Quando a população se divide em estratos (subpopulações), convém que o sorteiodos elementos da amostra leve em consideração tais estratos, daí obtemos oselementos da amostra proporcional ao número de elementos desses estratos.

Page 73: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 73/108

 

Página 73 de 108

Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, doexemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejammeninas. São portanto dois estratos (sexo masculino e sexo feminino). Logo,

temos:

SEXO POPULACÃO 10 % AMOSTRA

MASC. 54 5,4 5

FEMIN. 36 3,6 4

 Total 90 9,0 9

Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90,meninas e procedemos o sorteio casual com urna ou tabela de números

aleatórios.. 

AMOSTRAGEM SISTEMÁTICA:

Quando os elementos da população já se acham ordenados, não há necessidadede construir o sitema de referência. São exemplos os prontuários médicos de umhospital, os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que

constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter umaamostra formada por 50 casas para uma pesquisa de opinião. Podemos, nestecaso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteiocasual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado paraa amostra; os demais elementos seriam periodicamente considerados de 18 em18. Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa,22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.

AMOSTRAGEM POR CONGLOMERADOS (OU AGRUPAMENTOS)

Algumas populações não permitem, ou tornam extremamente difícil que seidentifiquem seus elementos. Não obstante isso, pode ser relativamente fácilidentificar alguns subgrupos da população. Em tais casos, uma amostra aleatóriasimples desses subgrupos (conglomerados) pode se colhida, e uma contagemcompleta deve ser feita para o conglomerado sorteado. Agrupamentos típicos sãoquarteirões, famílias, organizações, agências, edifícios etc.

Exemplo:

Page 74: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 74/108

 

Página 74 de 108

Num levantamento da população de determinada cidade, podemos dispor domapa indicando cada quarteirão e não dispor de uma relação atualizada dos seusmoradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a

contagem completa de todos os que residem naqueles quarteirões sorteados.

MÉTODOS NÃO PROBABILÍSITCOS

São amostragens em que há uma escolha deliberada dos elementos da amostra.Não é possível generalizar os resultados das pesquisas para a população, pois asamostras não-probabilísticas não garantem a representatividade da população.

AMOSTRAGEM ACIDENTAL

 Trata-se de uma amostra formada por aqueles elementos que vão aparecendo,que são possíveis de se obter até completar o número de elementos da amostra.Geralmente utilizada em pesquisas de opinião, em que os entrevistados sãoacidentalmente escolhidos.

Exemplos: Pesquisas de opinião em praças públicas, ruas movimentadas degrandes cidades etc.

AMOSTRAGEM INTENCIONAL

De acordo com determinado critério, é escolhido intencionalmente um grupo deelementos que irão compor a amostra. O investigador se dirige intencionalmente agrupos de elementos dos quais deseja saber a opinião.

Exemplo: Numa pesquisa sobre preferência por determinado cosmético, opesquisador se dirige a um grande salão de beleza e entrevista as pessoas que alise encontram.

AMOSTRAGEM POR QUOTAS

Um dos métodos de amostragem mais comumente usados em levantamentos demercado e em prévias eleitorais. Ele abrange três fases:

1ª - classificação da população em termos de propriedades que se sabe, oupresume, serem relevantes para a característica a ser estudada;

Page 75: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 75/108

 

Página 75 de 108

2ª - determinação da proporção da população para cada característica, com basena constituição conhecida, presumida ou estimada, da população;

3ª - fixação de quotas para cada entrevistador a quem tocará a responsabilidadede selecionar entrevistados, de modo que a amostra total observada ouentrevistada contenha a proporção e cada classe tal como determinada na 2ª fase.

Exemplo: Numa pesquisa sobre o "trabalho das mulheres na atualidade".Provavelmente se terá interesse em considerar: a divisão cidade e campo, ahabitação, o número de filhos, a idade dos filhos, a renda média, as faixas etáriasetc.

A primeira tarefa é descobrir as proporções (porcentagens) dessas característicasna população. Imagina-se que haja 47% de homens e 53% de mulheres na

população. Logo, uma amostra de 50 pessoas deverá ter 23 homens e 27mulheres. Então o pesquisador receberá uma "quota" para entrevistar 27mulheres. A consideração de várias categorias exigirá uma composição amostramque atenda ao n determinado e às proporções populacionais estipuladas.

SÉRIES ESTATÍSTICAS

 TABELA: É um quadro que resume um conjunto de dados dispostos segundolinhas e colunas de maneira sistemática.

De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela

devemos colocar :

•  um traço horizontal ( - ) quando o valor é zero;•  três pontos ( ... ) quando não temos os dados;•  zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade

utilizada;•  um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de

determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamosque nestes documentos as tabelas não serão abertas devido a limitações do editor 

html". 

SÉRIE ESTATÍSTICA:

É qualquer tabela que apresenta a distribuição de um conjunto de dadosestatísticos em função da época, do local ou da espécie.

Page 76: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 76/108

 

Página 76 de 108

Séries Homógradas: são aquelas em que a variável descrita apresenta variaçãodiscreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica.

a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local ea espécie (fenômeno) são elementos fixos. Esta série também é chamada dehistórica ou evolutiva.

ABC VEÍCLULOS LTDA.

Vendas no 1º bimestre de 1996

PERÍODO UNIDADES VENDIDAS *

 J AN/96 2 0

FEV/96 1 0 TOTAL 3 0

* Em mil unidades

b) Série Geográfica: Apresenta como elemento variável o fator geográfico. Aépoca e o fato (espécie) são elementos fixos. Também é chamada de espacial,territorial ou de localização.

ABC VEÍCLULOS LTDA.

Vendas no 1º bimestre de 1996

FILIAIS UNIDADES VENDIDAS *

São Paulo 1 3

Rio de Janeiro 1 7

 TOTAL 3 0

* Em mil unidades

c) Série Específica: O caráter variável é apenas o fato ou espécie. Também échamada de série categórica.

ABC VEÍCLULOS LTDA.

Vendas no 1º bimestre de 1996

Page 77: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 77/108

 

Página 77 de 108

MARCA UNIDADES VENDIDAS *

FIAT 1 8

GM 1 2 TOTAL 3 0

* Em mil unidades

SÉRIES CONJ UGADAS: Também chamadas de tabelas de dupla entrada. Sãoapropriadas à apresentação de duas ou mais séries de maneira conjugada,havendo duas ordens de classificação: uma horizontal e outra vertical. O exemploabaixo é de uma série geográfica-temporal.

ABC VEÍCLULOS LTDA.Vendas no 1º bimestre de 1996

FILIAIS J aneiro/96 Fevereiro/96

São Paulo 1 0 3

Rio de J aneiro 1 2 5

 TOTAL 2 2 8

* Em mil unidades

Obs: as séries heterógradas serão estudas em capítulo especial ( distribuição defrequências ).

GRÁFICOS ESTATÍSTICOSGGG 

São representações visuais dos dados estatísticos que devem corresponder, masnunca substituir as tabelas estatísticas.

Características:

Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.

Gráficos de informação: São gráficos destinados principalmente ao público emgeral, objetivando proporcionar uma visualização rápida e clara. São gráficostipicamente expositivos, dispensando comentários explicativos adicionais. Aslegendas podem ser omitidas, desde que as informações desejadas estejampresentes.

Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico,fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser

Page 78: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 78/108

 

Página 78 de 108

também informativos. Os gráficos de análise freqüentemente vêm acompanhadosde uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamandoa atenção do leitor para os pontos principais revelados pelo gráfico.

Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estãosendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, deum problema de construção de escalas.

Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas eCartogramas.

1 - Diagramas:

São gráficos geométricos dispostos em duas dimensões. São os mais usados narepresentação de séries estatísticas. Eles podem ser :

1.1- Gráficos em barras horizontais.

1.2- Gráficos em barras verticais ( colunas ).

Quando as legendas não são breves usa-se de preferência os gráficos em barrashorizontais. Nesses gráficos os retângulos têm a mesma base e as alturas sãoproporcionais aos respectivos dados. A ordem a ser observada é a cronológica, sea série for histórica, e a decrescente, se for geográfica ou categórica.

1.3- Gráficos em barras compostas.

1.4- Gráficos em colunas superpostas.

Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato deapresentar cada barra ou coluna segmentada em partes componentes. Servempara representar comparativamente dois ou mais atributos.

1.5- Gráficos em linhas ou lineares.

São freqüentemente usados para representação de séries cronológicas com umgrande número de períodos de tempo. As linhas são mais eficientes do que ascolunas, quando existem intensas flutuações nas séries ou quando hánecessidade de se representarem várias séries em um mesmo gráfico.

Page 79: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 79/108

 

Página 79 de 108

Quando representamos, em um mesmo sistema de coordenadas, a variação dedois fenômenos, a parte interna da figura formada pelos gráficos desses fenômenoé denominada de área de excesso. 

1.5- Gráficos em setores.

Este gráfico é construído com base em um círculo, e é empregado sempre quedesejamos ressaltar a participação do dado no total. O total é representado pelocírculo, que fica dividido em tantos setores quantas são as partes. Os setores sãotais que suas áreas são respectivamente proporcionais aos dados da série. Ográfico em setores só deve ser empregado quando há, no máximo, sete dados.

Obs: As séries temporais geralmente não são representadas por este tipo degráfico.

.

2 - Estereogramas:

São gráficos geométricos dispostos em três dimensões, pois representam volume.São usados nas representações gráficas das tabelas de dupla entrada. Em alguns

casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisãoque oferecem.

3 - Pictogramas:

São construídos a partir de figuras representativas da intensidade do fenômeno.Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, poissua forma é atraente e sugestiva. Os símbolos deven ser auto-explicativos. Adesvantagem dos pictogramas é que apenas mostram uma visão geral do

fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo:

Page 80: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 80/108

 

Página 80 de 108

 

4- Cartogramas: São ilustrações relativas a cartas geográficas (mapas). O objetivo

desse gráfico é o de figurar os dados estatísticos diretamente relacionados comáreas geográficas ou políticas.

DISTRIBUIÇÃO DE FREQUÊNCIA

É um tipo de tabela que condensa uma coleção de dados conforme as freqüências(repetições de seus valores).

Tabela primitiva ou dados brutos:É uma tabela ou relação de elementos que nãoforam numericamente organizados. É difícil formarmos uma idéia exata docomportamento do grupo como um todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

ROL:É a tabela obtida após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuição de freqüência sem intervalos de classe:É a simples condensação dosdados conforme as repetições de seu valores. Para um ROL de tamanho razoávelesta distribuição de freqüência é inconveniente, já que exige muito espaço. Vejaexemplo abaixo:

Page 81: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 81/108

 

Página 81 de 108

Dados Freqüência

41 3

42 243 1

44 1

45 1

46 2

50 2

51 1

52 1

54 157 1

58 2

60 2

 Total 20

Distribuição de freqüência com intervalos de classe:Quando o tamanho daamostra é elevado é mais racional efetuar o agrupamento dos valores em váriosintervalos de classe.

Classes Freqüências

41 |------- 45 7

45 |------- 49 3

49 |------- 53 4

53 |------- 57 1

57 |------- 61 5

 Total 20

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (com intervalos declasse):

CLASSE: são os intervalos de variação da variável e é simbolizada por i e onúmero total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 |-------53 é a 3ª classe, onde i=3.

LIMITES DE CLASSE: são os extremos de cada classe. O menor número é olimite inferior de classe (li) e o maior número, limite superior de classe(Li). Ex: em49 |------- 53... l3= 49 e L3= 53. O símbolo |------- representa um intervalo fechado

Page 82: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 82/108

 

Página 82 de 108

à esquerda e aberto à direita. O dado 53 do ROL não pertence a classe 3 e sim aclasse 4 representada por 53 |------- 57.

AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre olimite superior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabelaanterior hi= 53 - 49 = 4. Obs: Na distribuição de freqüência c/ classe o hi será igualem todas as classes. 

AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior daúltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: natabela anterior AT = 61 - 41= 20.

AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e ovalor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA 

= 60 - 41 = 19.

Obs: AT sempre será maior que AA.

PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duaspartes iguais. .......Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou sejax3=(l3+L3)/2.

MÉTODO PRÁTICO PARA CONSTRUÇÃO DE UMA DIST. DE FREQUÊNCIASC/ CLASSE:

1º - Organize os dados brutos em um ROL.

2º - Calcule a amplitude amostral AA.

No nosso exmplo: AA =60 - 41 =19

3º - Calcule o número de classes através da "Regra de Sturges":

n i= nº de classes

3 |-----| 5 3

6 |-----| 11 412 |-----| 22 5

23 |-----| 46 6

47 |-----| 90 7

91 |-----| 181 8

182 |-----| 362 9

Page 83: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 83/108

 

Página 83 de 108

Obs: Qualquer regra para determinação do nº de classes da tabela não nos levama uma decisão final; esta vai depender, na realidade de um julgamento pessoal,que deve estar ligado à natureza dos dados.

No nosso exemplo: n = 20 dados, então ,a princípio, a regra sugere a adoção de 5classes.

4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe h >AA/i.

No nosso exemplo: AA/i = 19/5 = 3,8 . Obs:Como h > AA/i um valor ligeiramentesuperior para haver folga na última classe. Utilizaremos então h = 4

5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do

intervalo. Podemos montar a tabela, com o cuidado para não aparecer classescom freqüência = 0 (zero).

No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo a primeira classeserá representada por ...... 41 |------- 45. As classes seguintes respeitarão omesmo procedimento.

O primeiro elemento das classes seguintes sempre serão formadas pelo últimoelemento da classe anterior.

REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO

.Histograma, Polígono de freqüência e Polígono de freqüência acumulada

Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixoscoordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas)colocamos os valores da variável e na linha vertical (eixo das ordenadas), asfreqüências.

Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se

localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidamcom os pontos médios dos intervalos de classe. A área de um histograma éproporcional à soma das freqüências simples ou absolutas.

Freqüências simples ou absolutas: são os valores que realmente representam onúmero de dados de cada classe. A soma das freqüências simples é igual aonúmero total dos dados da distribuição.

Page 84: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 84/108

 

Página 84 de 108

Freqüências relativas: são os valores das razões entre as freqüências absolutasde cada classe e a freqüência total da distribuição. A soma das freqüênciasrelativas é igual a 1 (100 %).

Polígono de freqüência: é um gráfico em linha, sendo as freqüências marcadassobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dosintervalos de classe. Para realmente obtermos um polígono (linha fechada),devemos completar a figura, ligando os extremos da linha obtida aos pontosmédios da classe anterior à primeira e da posterior à última, da distribuição.

Polígono de freqüência acumulada: é traçado marcando-se as freqüênciasacumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontoscorrespondentes aos limites superiores dos intervalos de classe.

Freqüência simples acumulada de uma classe:é o total das freqüências de todosos valores inferiores ao limite superior do intervalo de uma determinada classe.

Freqüência relativa acumulada de um classe:é a freqüência acumulada da classe,dividida pela freqüência total da distribuição.

...CLASSE..  ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri..... 

50 |-------- 54 4 52 0,100 4 0,100

54 |-------- 58 9 56 0,225 13 0,325

58 |-------- 62 11 60 0,275 24 0,600

62 |-------- 66 8 64 0,200 32 0,800

66 |-------- 70 5 68 0,125 37 0,925

70 |-------- 74 3 72 0,075 40 1,000

 Total 40 1,000

Exercício: (Com base na tabela acima)

Sendo fi= freq. simples; xi= ponto médio de classe; fri= freq. simples acumulada;Fi=freq. relativa e Fri= freq. relativa acumulada. Construa o histograma, polígonode frequência e polígono de freq. acumulada:

Obs: uma distribuição de freqüência sem intervalos de classe é representadagraficamente por um diagrama onde cada valor da variável é representado por umsegmento de reta vertical e de comprimento proporcional à respectiva freqüência.

Page 85: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 85/108

 

Página 85 de 108

MEDIDAS DE POSIÇÃO

Introdução

São as estatísticas que representam uma série de dados orientando-nos quanto àposição da distribuição em relação ao eixo horizontal do gráfico da curva defreqüência.

As medidas de posições mais importantes são as medidas de tendência central oupromédias (verifica-se uma tendência dos dados observados a se agruparem emtorno dos valores centrais).

As medidas de tendência central mais utilizadas são: média aritmética, moda emediana. Outros promédios menos usados são as médias: geométrica,

harmônica, quadrática, cúbica e biquadrática.

As outras medidas de posição são as separatrizes, que englobam: a própriamediana, os decis, os quartis e os percentis.

MÉDIA ARITMÉTICA =

É igual ao quociente entre a soma dos valores do conjunto e o número total dos

valores.

......onde xi são os valores da variável e n o número de valores.

Dados não-agrupados: 

Quando desejamos conhecer a média dos dados não-agrupados em tabelas defreqüências, determinamos a média aritmética simples.

Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foide 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda média diária na semana de:

.= (10+14+13+15+16+18+12) / 7 = 14 kilos

Desvio em relação à média: é a diferença entre cada elemento de um conjunto de

valores e a média aritmética, ou seja:.. di = Xi -

Page 86: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 86/108

 

Página 86 de 108

No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 ,...d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4...e... d7 = 12 - 14 = - 2.

Propriedades da média

1ª propriedade: A soma algébrica dos desvios em relação à média é nula.

No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos osvalores de uma variável, a média do conjunto fica aumentada ( ou diminuida)dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores davariável temos:

 Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou

 Y = .+ 2 = 14 +2 = 16 kilos

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma

variável por uma constante (c), a média do conjunto fica multiplicada ( ou dividida)por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um dos valores davariável temos:

 Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou

 Y = x 3 = 14 x 3 = 42 kilos

Dados agrupados: 

Sem intervalos de classe

Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando paravariável o número de filhos do sexo masculino. Calcularemos a quantidade médiade meninos por família:

Page 87: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 87/108

 

Página 87 de 108

Nº de meninos freqüência = fi

0 2

1 62 10

3 12

4 4

total 34

Como as freqüências são números indicadores da intensidade de cada valor davariável, elas funcionam como fatores de ponderação, o que nos leva a calcular amédia aritmética ponderada, dada pela fórmula:

..xi.  ..fi. ..xi.fi .

0 2 0

1 6 6

2 10 20

3 12 36

4 4 16

total 34 78

onde 78 / 34 = 2,3 meninos por família

Com intervalos de classe

Neste caso, convencionamos que todos os valores incluídos em um determinadointervalo de classe coincidem com o seu ponto médio, e determinamos a médiaaritmética ponderada por meio da fórmula:

..onde Xi é o ponto médio da classe.

Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo.

Estaturas (cm) freqüência = fi ponto médio = xi ..xi.fi.

50 |------------ 54 4 52 208

Page 88: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 88/108

 

Página 88 de 108

54 |------------ 58 9 56 504

58 |------------ 62 11 60 660

62 |------------ 66 8 64 51266 |------------ 70 5 68 340

70 |------------ 74 3 72 216

 Total 40 2.440

Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo... = 61 cm

MODA

É o valor que ocorre com maior freqüência em uma série de valores.

Mo é o símbolo da moda.

Desse modo, o salário modal dos empregados de uma fábrica é o salário maiscomum, isto é, o salário recebido pelo maior número de empregos dessa fábrica.

A Moda quando os dados não estão agrupados

•  A moda é facilmente reconhecida: basta, de acordo com definição, procuraro valor que mais se repete.

Exemplo: Na série {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 }a moda é igual a 10.

•  Há séries nas quais não exista valor modal, isto é, nas quais nenhum valorapareça mais vezes que outros.

Exemplo: {3 , 5 , 8 , 10 , 12 }não apresenta moda. A série é amodal.

•  .Em outros casos, pode haver dois ou mais valores de concentração.

Dizemos, então, que a série tem dois ou mais valores modais.

Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 }apresenta duas modas: 4 e 7. Asérie é bimodal.

A Moda quando os dados estão agrupados

a) Sem intervalos de classe

Page 89: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 89/108

 

Página 89 de 108

Uma vez agrupados os dados, é possível determinar imediatamente a moda:basta fixar o valor da variável de maior freqüência.

Exemplo: Qual a temperatura mais comum medida no mês abaixo:

 Temperaturas Freqüência

0º C 3

1º C 9

2º C 12

3º C 6

Resp: 2º C é a temperatura modal, pois é a de maior freqüência.

b) Com intervalos de classe

A classe que apresenta a maior freqüência é denominada classe modal. Peladefinição, podemos afirmar que a moda, neste caso, é o valor dominante que estácompreendido entre os limites da classe modal. O método mais simples para ocálculo da moda consiste em tomar o ponto médio da classe modal. Damos a essevalor a denominação de moda bruta.

Mo = ( l* + L* ) / 2

onde l* = limite inferior da classe modal e L*= limite superior da classe modal.

Exemplo: Calcule a estatura modal conforme a tabela abaixo.

Classes (em cm) Freqüência

54 |------------ 58 9

58 |------------ 62 11

62 |------------ 66 866 |------------ 70 5

Resp: a classe modal é 58|-------- 62, pois é a de maior freqüência. l*=58 e L*=62

Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valorreal da moda).

Page 90: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 90/108

 

Página 90 de 108

Método mais elaborado pela fórmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h*

l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal

d1= freqüência da classe modal - freqüência da classe anterior à da classe modal

d2= freqüência da classe modal - freqüência da classe posterior à da classe modal

h*= amplitude da classe modal

Obs: A moda é utilizada quando desejamos obter uma medida rápida eaproximada de posição ou quando a medida de posição deva ser o valor maistípico da distribuição. J á a média aritmética é a medida de posição que possui amaior estabilidade.

MEDIANA

A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescenteou decrescente), é o valor situado de tal forma no conjunto que o separa em doissubconjuntos de mesmo número de elementos.

Símbolo da mediana: Md

A mediana em dados não-agrupados

Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10 }

De acordo com a definição de mediana, o primeiro passo a ser dado é o daordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15 }

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.

Método prático para o cálculo da Mediana

Se a série dada tiver número ímpar de termos:

O valor mediano será o termo de ordem dado fela fórmula :

.( n + 1 ) / 2

Exemplo: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5 }

Page 91: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 91/108

 

Página 91 de 108

1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5 }

n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da sérieordenada será a mediana

A mediana será o 5º elemento = 2

Se a série dada tiver número par de termos:

O valor mediano será o termo de ordem dado pela fórmula :.... 

.[( n/2 ) +( n/2+ 1 )] / 2

Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valorcorrespondente.

Exemplo: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2

[( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2

5º termo = 2

6º termo = 3

A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo será amédia aritmética do 5º e 6º termos da série.

Notas:

•  Quando o número de elementos da série estatística for ímpar, haverácoincidência da mediana com um dos elementos da série.•  Quando o número de elementos da série estatística for par, nunca haverá

coincidência da mediana com um dos elementos da série. A mediana serásempre a média aritmética dos 2 elementos centrais da série.

•  Em um série a mediana, a média e a moda não têm, necessariamente, omesmo valor.

•  A mediana, depende da posição e não dos valores dos elementos na sérieordenada. Essa é uma da diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

Page 92: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 92/108

 

Página 92 de 108

Em {5, 7, 10, 13, 15 }a média = 10 e a mediana = 10

Em {5, 7, 10, 13, 65 }a média = 20 e a mediana = 10

isto é, a média do segundo conjunto de valores é maior do que a do primeiro, porinfluência dos valores extremos, ao passo que a mediana permanece a mesma.

A mediana em dados agrupados

a) Sem intervalos de classe

Neste caso, é o bastante identificar a freqüência acumulada imediatamentesuperior à metade da soma das freqüências. A mediana será aquele valor davariável que corresponde a tal freqüência acumulada.

Exemplo conforme tabela abaixo:

Variável xi Freqüência fi Freqüência acumulada

0 2 2

1 6 8

2 9 17

3 13 304 5 35

total 35

Quando o somatório das freqüências for ímpar o valor mediano será o termo deordem dado pela fórmula :. 

Como o somatório das freqüências = 35 a fórmula ficará: ( 35+1 ) / 2 = 18º termo =3.. 

.. 

Quando o somatório das freqüências for par o valor mediano será o termo deordem dado pela fórmula :. 

Page 93: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 93/108

Page 94: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 94/108

 

Página 94 de 108

54 |------------ 58 9 13

58 |------------ 62 11 24

62 |------------ 66 8 3266 |------------ 70 5 37

70 |------------ 74 3 40

total 40

= 40 / 2 =.20........... logo.a classe mediana será 58 |---------- 62

l* = 58........... FAA = 13........... f* = 11........... h* = 4

Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 =58 + 28/11 = 60,54

OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição.

Emprego da Mediana

•  Quando desejamos obter o ponto que divide a distribuição em duas partesiguais.

•  Quando há valores extremos que afetam de amaneira acentuada a médiaaritmética.

•  Quando a variável em estudo é salário.

SEPARATRIZES

Além das medidas de posição que estudamos, há outras que, consideradasindividualmente, não são medidas de tendência central, mas estão ligadas àmediana relativamente à sua característica de separar a série em duas partes queapresentam o mesmo número de valores.

Essas medidas - os quartis, os decis e os percentis - são, juntamente com amediana, conhecidas pelo nome genérico de separatrizes.

QUARTIS

Denominamos quartis os valores de uma série que a dividem em quatro partesiguais.

Precisamos portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a série em quatropartes iguais.

Page 95: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 95/108

 

Página 95 de 108

Obs: O quartil 2 ( Q2 ) sempre será igual a mediana da série.

Quartis em dados não agrupados

O método mais prático é utilizar o princípio do cálculo da mediana para os 3quartis. Na realidade serão calculadas " 3 medianas " em uma mesma série.

Exemplo1: Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15 }

O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dosvalores:

{2, 5, 6, 9, 10, 13, 15 }

O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9que será = Q2.

 Temos agora {2, 5, 6 }e {10, 13, 15 }como sendo os dois grupos de valores iguaisproporcionados pela mediana ( quartil 2). Para o cáculo do quartil 1 e 3 bastacalcular as medianas das partes iguais provenientes da verdadeira Mediana dasérie (quartil 2).

Logo em {2, 5, 6 }a mediana é = 5 . Ou seja: será o quartil 1

em {10, 13, 15 }a mediana é =13 . Ou seja: será o quartil 3

Exemplo2: Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }

A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5

O quartil 1 será a mediana da série à esquerda de Md : {1, 1, 2, 3, 5, 5 }

Q1 = (2+3)/2 = 2,5

O quartil 3 será a mediana da série à direita de Md : {6, 7, 9, 9, 10, 13 }

Q3 = (9+9)/2 = 9

Quartis para dados agrupados em classes

Usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmulada mediana,

Page 96: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 96/108

 

Página 96 de 108

E fi / 2.... por ... k . E fi / 4 ... sendo k o número de ordem do quartil.

Assim, temos:

Q1 =. l* + [(E fi / 4 - FAA ) x h*] / f*

Q2 =. l* + [(2.E fi / 4 - FAA ) x h*] / f*

Q3 =. l* + [(3.E fi / 4 - FAA ) x h*] / f*

Exemplo3 - Calcule os quartis da tabela abaixo:

classes freqüência = fi Freqüência acumulada

50 |------------ 54 4 4

54 |------------ 58 9 13

58 |------------ 62 11 24

62 |------------ 66 8 32

66 |------------ 70 5 37

70 |------------ 74 3 40

total 40

O quartil 2 =Md , logo:

= 40 / 2 =.20........... logo.a classe mediana será 58 |---------- 62

l* = 58........... FAA = 13........... f* = 11........... h* = 4

Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 =58 + 28/11 = 60,54

O quartil 1 : E fi / 4 = 10

Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66

O quartil 3 : 3.E fi / 4 = 30

Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65

Page 97: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 97/108

 

Página 97 de 108

DECIS

A definição dos decis obedece ao mesmo princípio dos quartis, com a modificaçãoda porcentagem de valores que ficam aquém e além do decil que se pretendecalcular. A fórmula básica será : k .E fi / 10 onde k é o número de ordem do decil aser calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9decis para dividirmos uma série em 10 partes iguais.

De especial interesse é o quinto decil, que divide o conjunto em duas partesiguais. Assim sendo,o quinto decil é igual ao segundo quartil, que por sua vez éigual à mediana.

Para D5 temos : 5.E fi / 10 =E fi / 2

Exemplo: Calcule o 3º decil da tabela anterior com classes.

k= 3 onde 3 .E fi / 10 =3x40/10 = 12. Este resultado corresponde a 2ª classe.

D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55

PERCENTIL ou CENTIL

Denominamos percentis ou centis como sendo os noventa e nove valores queseparam uma série em 100 partes iguais. Indicamos: P1, P2, ... , P99. É evidenteque P50 = Md ; P25 = Q1 e P75 = Q3.

O cálculo de um centil segue a mesma técnica do cálculo da mediana, porém afórmula será : k .E fi / 100 onde k é o número de ordem do centil a ser calculado.

Exemplo: Calcule o 8º centil da tabela anterior com classes .

k= 8 onde 8 .E fi / 100 = 8x40/100 = 3,2. Este resultado corresponde a 1ª classe.

P8 = 50 + [ (3,2 -0) x 4] / 4 = 50 + 3,2 = 53,2

Dispersão ou Variabilidade:

É a maior ou menor diversificação dos valores de uma variável em torno de umvalor de tendência central ( média ou mediana ) tomado como ponto decomparação.

A média - ainda que considerada como um número que tem a faculdade derepresentar uma série de valores - não pode, por si mesma, destacar o grau de

Page 98: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 98/108

 

Página 98 de 108

homogeneidade ou heterogeneidade que existe entre os valores que compõem oconjunto.

Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:

X = {70, 70, 70, 70, 70 }

 Y = {68, 69, 70 ,71 ,72 }

Z = {5, 15, 50, 120, 160 }

Observamos então que os três conjuntos apresentam a mesma média aritmética =350/5 = 70

Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y eZ, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é maishomogêneo que o conjunto Z, pois há menor diversificação entre cada um de seusvalores e a média representativa.

Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Yapresenta uma dispersão menor que o conjunto Z.

MEDIDAS DE DISPERSÃO ABSOLUTA

Amplitude total : É a única medida de dispersão que não tem na média o ponto dereferência.

Quando os dados não estão agrupados a amplitude total é a diferença entre omaior e o menor valor observado: AT = X máximo - X mínimo.

Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40= 30

Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = Xmáximo - X mínimo.

Exemplo:

xi fi

0 2

1 6

3 5

4 3

Page 99: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 99/108

 

Página 99 de 108

AT = 4 - 0 = 4

Com intervalos de classe a amplitude total é a diferença entre o limite superior daúltima classe e o limite inferior da primeira classe. Então AT = L máximo - l mínimo

Exemplo: Classes fi

4 |------------- 6 6

6 |------------- 8 2

8 |------------- 10 3

AT = 10 - 4 = 6

A amplitude total tem o inconveniente e só levar em conta os dois valoresextremos da série, descuidando do conjunto de valores intermediários. Faz-se usoda amplitude total quando se quer determinar a amplitude da temperatura em umdia, no controle de qualidade ou como uma medida de cálculo rápido sem muitaexatidão.

Desvio quartil

 Também chamado de amplitude semi-interquatílica e é baseada nos quartis.

Símbolo: Dq e a Fórmula: Dq = (Q3 - Q1) / 2

Observações:

1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fácil decalcular e de interpretar. Além do mais, não é afetado pelos valores extremos,grandes ou pequenos, sendo recomendado, por conseguinte, quando entre osdados figurem valores extremos que não se consideram representativos.

2- O desvio quartil deverá ser usado preferencialmente quando a medida de

tendência central for a mediana.3- Trata-se de uma medida insensível ã distribuição dos itens menores que Q1,entre Q1 e Q3 e maiores que Q3.

Exemplo: Para os valores 40, 45, 48, 62 e 70 o desvio quartil será:

Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75

Page 100: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 100/108

 

Página 100 de 108

Desvio médio absoluto

Para dados brutos

É a média aritmética dos valores absolutos dos desvios tomados em relação auma das seguintes medidas de tendência central: média ou mediana. Símbolo =Dm

Fórmula : para a Média =E | Xi - | / n

Fórmula : para a Mediana =E | Xi - Md | / n

As barras verticais indicam que são tomados os valores absolutos, prescindindo

do sinal dos desvios.

Exemplo: Calcular o desvio médio do conjunto de números {- 4 , - 3 , - 2 , 3 , 5 }

= - 0, 2 e Md = - 2

 Tabela auxiliar para cálculo do desvio médio

Xi Xi - | Xi - | Xi - Md | Xi - Md |

- 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2

- 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1

- 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0

3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5

5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7

E = 16,8 E = 15

Pela Média : Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3

Desvio médio para Dados Tabulados

Se os valores vierem dispostos em uma tabela de freqüências, agrupados ou nãoem classes, serão usadas as seguintes fórmulas:

Cálculo pela média: Dm = (E |Xi - |. fi ) / E fi

Page 101: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 101/108

 

Página 101 de 108

Cálculo pela mediana: Dm = (E |Xi - Md |. fi ) / E fi

Exemplo de cálculo pela média:

Xi f i Xi . f i Xi - | Xi - | | Xi - | . f i

3 2 6 4,7 - 1,7 1,7 3,4

4 2 8 4,7 - 0,7 0,7 1,4

5 3 15 4,7 0,3 0,3 0,9

6 3 18 4,7 1,3 1,3 3,9

E =10 47 E = 9,6

Dm = 9,6 / 10 = 0,96

Para o cálculo do Desvio médio pela mediana segue-se o mesmo raciocínio.

Xi f i Md Xi - Md | Xi - Md | | Xi - Md | . f i

3 2 5 - 2 2 4

4 2 5 - 1 1 2

5 3 5 0 0 0

6 3 5 1 1 1

E =10 E = 7

Dm = 7 / 10 = 0,70

Obs: Apesar de o desvio médio expressar aceitavelmente a dispersão de umaamostra, não é tão freqüentemente empregado como o desvio-padrão. O desviomédio despreza o fato de alguns desvios serem negativos e outros positivos, poisessa medida os trata como se fossem todos positivos. Todavia será preferido ouso do desvio médio em lugar do desvio-padrão, quando esse for indevidamenteinfluenciado pelos desvios extremos.

DESVIO PADRÃO

É a medida de dispersão mais geralmente empregada, pois leva em consideraçãoa totalidade dos valores da variável em estudo. É um indicador de variabilidadebastante estável. O desvio padrão baseia-se nos desvios em torno da médiaaritmética e a sua fórmula básica pode ser traduzida como : a raiz quadrada damédia aritmética dos quadrados dos desvios e é representada por S .

Page 102: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 102/108

 

Página 102 de 108

 

A fórmula acima é empregada quando tratamos de uma população de dados não-agrupados.

Exemplo: Calcular o desvio padrão da população representada por - 4 , -3 , -2 , 3 ,5

Xi- 4 - 0,2 - 3,8 14,44

- 3 - 0,2 - 2,8 7,84

- 2 - 0,2 - 1,8 3,24

3 - 0,2 3,2 10,24

5 - 0,2 5,2 27,04

E =  62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56.

A raiz quadrada de 12,56 é o desvio padrão = 3,54

Obs: Quando nosso interesse não se restringe à descrição dos dados mas,partindo da amostra, visamos tirar inferências válidas para a respectiva população,convém efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar den. A fórmula ficará então:

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padrãoamostra seria a raiz quadrada de 62,8 / (5 -1) = 3,96

O desvio padrão goza de algumas propriedades, dentre as quais destacamos:

Page 103: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 103/108

 

Página 103 de 108

1ª = Somando-se (ou subtraindo-se) uma constante a todos os valores de umavariável, o desvio padrão não se altera.

2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por umaconstante (diferente de zero), o desvio padrão fica multiplicado ( ou dividido) poressa constante.

Quando os dados estão agrupados (temos a presença de freqüências) a fórmulado desvio padrão ficará :

ou quando se trata de umaamostra

Exemplo:

Calcule o desvio padrão populacional da tabela abaixo:

Xi f i Xi . f i . f i0 2 0 2,1 -2,1 4,41 8,82

1 6 6 2,1 -1,1 1,21 7,26

2 12 24 2,1 -0,1 0,01 0,12

3 7 21 2,1 0,9 0,81 5,67

4 3 12 2,1 1,9 3,61 10,83

 Total 30 63 E =  32,70

Sabemos que E fi = 30 e 32,7 / 30 = 1,09.

A raiz quadrada de 1,09 é o desvio padrão = 1,044

Se considerarmos os dados como sendo de uma amostra o desvio padrão seria :a raiz quadrada de 32,7 / (30 -1) = 1,062

Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizadaé a mesma do exemplo anterior.

Page 104: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 104/108

 

Página 104 de 108

 

VARIÂNCIA

É o desvio padrão elevado ao quadrado e é simbolizado por S2

A variância é uma medida que tem pouca utilidade como estatística descritiva,porém é extremamente importante na inferência estatística e em combinações deamostras.

MEDIDAS DE DISPERSÃO RELATIVA

CVP: Coeficiente de Variação de Pearson

Na estatística descritiva o desvio padrão por si só tem grandes limitações. Assim,um desvio padrão de 2 unidades pode ser considerado pequeno para uma sériede valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmonão pode ser dito.

Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dadoslimita o seu emprego quando desejamos comparar duas ou mais séries devalores, relativamente à sua dispersão ou variabilidade, quando expressas emunidades diferentes.

Para contornar essas dificuldades e limitações, podemos caracterizar a dispersãoou variabilidade dos dados em termos relativos a seu valor médio, medida essadenominada de CVP: Coeficiente de Variação de Pearson (é a razão entre odesvio padrão e a média referentes a dados de uma mesma série).

A fórmula do CVP = (S / ) x 100 ( o resultado neste caso é expresso empercentual, entretanto pode ser expresso também através de um fator decimal,desprezando assim o valor 100 da fórmula).

Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo deindivíduos:

Discriminação M É D I A DESVIO PADRÃO

ESTATURAS 175 cm 5,0 cm

PESOS 68 kg 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade ?

Page 105: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 105/108

 

Página 105 de 108

Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultadomenor será o de maior homogeneidade ( menor dispersão ou variabilidade).

CVPestatura = ( 5 / 175 ) x 100 = 2,85 %

CVPpeso = ( 2 / 68 ) x 100 = 2,94 %. 

Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau dedispersão que os pesos.

CVT: Coeficiente de Variação de Thorndike

É igual ao quociente entre o desvio padrão e a mediana.

CVT = S / Md ou CVT = (S / Md) x 100 quando queremos o resultado em%.

CVQ: Coeficiente Quartílico de Variação

Esse coeficiente é definido pela seguinte expressão:

CVQ = (Q3 - Q1) / (Q3 + Q1) ou [(Q3 - Q1) / (Q3 + Q1)] x 100 para resultadoem %.

Desvio quartil Reduzido: Dqr = (Q3 - Q1) / 2Md ou [(Q3 - Q1) / 2Md ] x 100 pararesultado em %.

MEDIDAS DE ASSIMETRIA

Introdução:

Uma distribuição com classes é simétrica quando : Média = Mediana = Moda

Uma distribuição com classes é :

Assimétrica à esquerda ou negativa quando : Média < Mediana < Moda

Assimétrica à direita ou positiva quando : Média > Mediana > Moda

Page 106: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 106/108

 

Página 106 de 108

PROBABILIDADE

Introdução:

O cálculo das probabilidades pertence ao campo da Matemática, entretanto amaioria dos fenômenos de que trata a Estatística são de natureza aleatória ouprobabilística. O conhecimento dos aspectos fundamentais do cálculo daprobabilidades é uma necessidade essencial para o estudo da Estatística Indutivaou Inferencial.

Experimento Aleatório

São fenômenos que, mesmo repetido várias vezes sob condições semelhantes,apresentam resultados imprevisíveis. O resultado final depende do acaso.

Exemplo:

Da afirmação "é provável que o meu time ganhe a partida hoje" pode resultar:

- que ele ganhe - que ele perca - que ele empate

Este resultado final pode ter três possibilidades.

Espaço Amostra

É o conjunto universo ou o conjunto de resultados possíveis de um experimentoaleatório.

No experimento aleatório "lançamento de uma moeda" temos o espaço amostra{cara, coroa}.

No experimento aleatório "lançamento de um dado" temos o espaço amostra {1,2, 3, 4, 5, 6}.

No experimento aleatório "dois lançamentos sucessivos de uma moeda" temos oespaço amostra :

{(ca,ca) , (co,co) , (ca,co) , (co,ca)}

Page 107: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 107/108

 

Página 107 de 108

Obs: cada elemento do espaço amostra que corresponde a um resultado recebe onome de ponto amostra. No primeiro exemplo : cara pertence ao espaço amostra{cara, coroa}.

Eventos

É qualquer subconjunto do espaço amostra de um experimento aleatório.

Se considerarmos S como espaço amostra e E como evento: Assim, qualquer queseja E, se E c S (E está contido em S), então E é um evento de S.

Se E = S , E é chamado de evento certo.

Se E c S e E é um conjunto unitário, E é chamado de evento elementar.

Se E = Ø , E é chamado de evento impossível.

Arredondamento de dados

Muitas vezes, é necessário ou conveniente suprimir unidades inferiores às dedeterminada ordem. Esta técnica é denominada arredondamento de dados.

De acordo com a resolução 886/66 do IBGE, o arredondamento é feito da seguintemaneira:

1 - Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, fica inalterado oúltimo algarismo a permanecer.

Ex: 53,24 passa a 53,2 ; 44,03 passa a 44,0

2 - Quando o primeiro algarismo a ser abandonado é 6,7,8, ou 9, aumenta-se deuma unidade o algarismo a permanecer.

Ex: 53,87 passa a 53,9 ; 44,08 passa a 44,1 ; 44,99 passa a 45,0

3 - Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:

Page 108: Noções de Epidemiologia e Bioestatística aplicada

7/28/2019 Noções de Epidemiologia e Bioestatística aplicada

http://slidepdf.com/reader/full/nocoes-de-epidemiologia-e-bioestatistica-aplicada 108/108

 

a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-seuma unidade ao algarismo a permanecer.

Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7 ; 76,250002 passa a 76,3

b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o últimoalgarismo a ser conservado só será aumentando de uma unidade se for ímpar.

Exemplos:

•  24,75 passa a 24,8•  24,65 passa a 24,6•  24,75000 passa 24,8•  24,6500 passa a 24,6

Obs: Não devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452passa a 17,3 e não para 17,35 e depois para 17,4.

Compensação

Suponhamos os dados abaixo, aos quais aplicamos as regras do arredondamento:

25,32 + 17,85 + 10,44 + 31,17 = 84,78

25,3 + 17,8 + 10,4 + 31,2 = 84,7

Verificamos que houve uma pequena discordância: a soma é exatamente 84,7quando, pelo arredondamento, deveria ser 84,8. entretanto, para a apresentaçãodos resultados, é necessário que desapareça tal diferença, o que é possível pelaprática do que denominamos compensação, conservando o mesmo número decasas decimais.