introducao a a - ulysses doria filho

73

Upload: gleciameira286

Post on 10-Jul-2015

918 views

Category:

Documents


0 download

TRANSCRIPT

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 1/79

 

Produzlr lelturo de quolidode, levondo ao leltor Informoc;Oes

e tend6ncios que ajudem a desenvolver seus conhecimentos

e percepcoes. Nossa rnissdo e apoiar os lei tores na reolizocdo

de seus objetivos pessoais e profissionais.

B o o L e itu ro l

Associacao Brasileira para

a Protecao dos Direitos

Editoriais e Autorais

RESPEITE 0 AUTOR

NAO FACA COPIA

INTRODUC;Ao A BIOESTATisTICA

ELSEVIER

Para simples mortais

v » Tiragem

ULYSSES DORIA FILHO I )

1 1 1 1 1 1 1 1208197

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 2/79

 

SUMARIO'" '" " .. " .. '" " .. '" ..

Prefacio 9

Apresenta<;:ao1 -I

PARTE 1

Estatfstica Descritiva

Introducao a Bioestatfstica

Por que a Estatistica e necessaria?

Estati stica Descritiva

Tipos de dados

Tendencia central e dispersao

Descricao de dados nominais e ordinais

Descrevendo dados continuos

Medidas de dispersao

Entendendo 0 percentil

Variancia e desvio-padrao

Desvio-padrao

Coeficiente de var iacao

Erro padrao da media

Desvio-padrao x erro padrao da media

Intervalo de confianca para medias

Entendendo intervalos de confianca

em outras situacoesDistribuicao normal

Estat is tica Z (escore Z)

Distribuicoes de frequencias

Terrnos que causarn confusao

Representacao grafica

Curvas de sobrevivencia: uma representacao

grafica nao tao intui tiva

Teste 0 seu conhecimento

Respostas dos exercicios 1 a 12

13

15

16

17

20

22

23

24

26

27

28

32

34

35

38

39

4142

44

46

49

50

56

58

61

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 3/79

 

PAW 2

EstaHstica Analftlca ( ou I nd u tl va )

lntroducao

Entendendo 0 valor de p

Entendendo a hip6tese nula (H( )

Testando hip6teses

Entendendo os er ros

Por que ocorrern erros ao testar h ip6teses?

Entendendo a var iabi lidade das arnostras

Entendendo 0 poder do estudo

Evitando erros

Distr ibuicoes de frequencias

Entendendo os testes de signi ficancia

Distribuicao t (Student)

Entendendo 0 teste t

Entendendo 0 teste de Qui-quadrado

Entendendo a escolha de urn teste de signi ficancia

(ou de hip6tese ou, a inda de regras de decisao)

Entendendo 0ernparelharnento

Nocoes de testes estatfsticos nao-pararnetricos

Testes estatfsticos para dados norninais

Testes estansticos nao-pararnetricos

para dados ordinais

Testes estatfsticos para dados contfnuos

Nocoes de anali se de var iancia

ANOVA e a estatfst ica F

Entendendo os varios t ipos de testes Anova

Correlacao e a regressao linear

Regressao ou correlacaor

Entendendo valor predict ivo,

sensibilidade e especificidade

Nocoes de regressao l inear multiple

Teste seu conhecirnentoRespostas dos exercfcios 13 a 19

(,1)

7 1

7 '2

74

7 :>

78

79

80

8182

84

87

89

91

95

99

100

101

102

105

111

114

115

119

12"1

13 0

13 4

13 6

13 8

141

Glossario

Referencias bibliograficas

fndice rernissivo

147

153

155

8

PREFAcIO:

Caro leitor, voce tern grande chance de pertencer aquele grupo

que "torceu 0 nariz" para a maternatica e, posteriormente, repetiu 0

ato com a estatfstica. Nao existe nada de errado com essasdisciplinas:

o problema e a maneira como sao veiculadas,

Deve, tambern, "ter comido gato por lebre" ao aceitar

condusoes, que careciam de fundamentacao metodol6gica e estatfstica,

de autores de artigos cientfficos. No entanto, a estatfstica nao realiza

milagres. Elaapenastraduz, emlinguagem adequada e cientffica, aquilo

que0

fenomeno que se investiga estaq uerendo dizer. Nao ha como"forc;:ar a barra". Um projeto de pesquisa mal formulado

metodologicamente nao pode ser salvo pela estatfstica.

o Departamento de Pediatria da Faculdade de Medicina da

Universidade de Sao Paulo passa, no momento, por revisao e

irnplernentacao do seu campo de pesquisa. E natural que pessoas

inteligentes e compromissadas adirarn a esseprojeto. 0 Dr. Ulysses

resolveu aceitar 0 desafio de elaborar LIm livro de estatfstica que ele

co-denominou "para simples mortals".

o seu conteudo, quanto a clareza e ao rigor, foi testado no

curso que ele realizou junto a medicos e outros profissionais dessa

instituicao. 0 resultado foi fantastico e plenamente aprovado. Agora,

ele submete este livro a sua apreciacao. meu caro leitor. Acho que

voce vai se surpreender.

Prof. Yassuhiko Okay

Professor titular

Departamento de Pediatria da FMUSP

9

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 4/79

 

______ --~~P-.'.-.. ":.

",' ~-:\'Tlct. ~~_, ___:

AP RES EN T A c ; A o.. '" . " '" " '" " '" '" " .. " ..

Lembrando das muitas dificuldades que tive, das dificeis aulas

ell' Estatis tica a que assisti e das duvidas simples que tenho ajudado a

resolver, ocorreu-rne escrever algum texto que pudesse ajudar aquele

que se inicia no campo da pesquisa e que, fatalmente, ira deparar

COIll problemas estatisticos.

Todo prof issional da saude. nao importa sua area de atuacao,

cs ta constantemente exposto ao uso da Estatistica, v isto que os textos

cientfficos raramente deixarn de citar algum de seus nurnerosos

aspectos. Por isso, e importante que ele dornine, no rninimo, os aspectos

basicos dessa ciencia, para que esteja em condicoes de julgar aquilo

que esta lendo.

A rnaior parte dos livros dessa area do conhecimento sao, para

os iniciantes, de dificil compreensao, talvez pela abordagem

excessivamente maternatica. 0 que procurei fazer, na qualidade de

medico, foi apresentar 0 tema de um modo compreensivel para nos,

que nao sornos exper t s na referida materia. Alern do que, com 0advento

dos computadores e 0 surgimento dos sof twares estatisticos, todos

passaram a ter condicoes de executar calculos estatisticos, pelos menos

aqueles mais simples, desde que dominem as nocces basicas.

Os exercicios propostos forarn escolhidos para esclarecer

melhor 0 assunto e para acrescentar conhecimentos, assim, rnesrno

que 0 leitor nao tente resolve-los, sugiro que leia as respostas.

Nao ha pretensao de esgotar 0 assunto neste livro, mas

simplesmente de auxiliar na cornpreensao dos principios basicos

11

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 5/79

 

d ( , . . , . , , , (WIll i" ( 'I1.11I1.1d" I . . , t " t i s t i ( " . ('()IIH) m (()l1ht'( iIlH'111()..,....11)

progrcssfvos e orden.ulos, l'it' <ll'V(' sor lido" part ir d( ) (.1pil ll l() i ll i ti" I.

Costaria de agrndeccr ao Professor Cl.iudio l.cone polas

val iosas sugestoes que, tenho certeza, em muito contr ibuf ram P '1 r .1 ( )

aperfeicoarncnto do texto deste livro e ao Professor Yassuhiko Okay

pelo incent ivo para transformar aqui lo que seria apenas urna aposti !a,

nesta publicacao.

Ulysses Doria Filho

E-mail: [email protected]

12

ESTATfsTICA DESCRITIVA

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 6/79

 

INTRODU(:Ao A BIOESTATfsTICA

A palavra estatfstica tern origem no latim, status (estado), e

.lbrigou, durante muito tempo, sob essa denorninacao, informacoes

rcferentes ao Estado - ha outras versoes. Numa conceituacao generica.

cia pode ser considerada como a ciencia que se preocupa com a coleta,

organizacao, descricao. analise e interpretacao de dados experimentais.

Nern sempre a Estatfstica e bern vista. Essarna fama deve-se ao

fato de ser, muitas vezes, mal aplicada ou superenfatizada, pela nao

cornpreensao do significado correto de termos, como erro, normal,

correlacao e significante, que, em Estatfstica, tern um significado proprio,

diferente do usual, e pela interface, nern sempre facil, entre ciencia e

rnaternatica.

A Estatfstica pode ser usada para simplesrnente descrever dados

(Estatfstica Descrit iva), mostrando seus subtipos, sua distr ibuicao,

f requencia, media etc., ou para comparar grupos e fazer general izacoes

a partir de resultados obtidos (Estatfstica lndutiva ou Analltica). Estao

intimamente a ela ligados, os processos de amostragem eo calculo de

probabil idades, a respeito dos quais serao tecidos breves cornentarios

considerados indispensaveis,

15

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 7/79

P OR QUE A ESTATfsTICA E NECEssARIA?. I 4 > . . . I . , " • « • to

• As pessoas sao condescendentes com os dados, especial-

mente com os pr6prios.

• As diferencas. nao rararnente, sao atribuidas a causas erradas.

• Ascoinc idencias ocorrern mais frequenternente do que seintui .

• Os cerebros hurnanos tern dificuldade para lidar com

probabilidades,

• Acrescentar polirnento as publicacoes e apresentacoes,

• Para saber 0 grau de certeza das conclusoes t iradas.

• Grande parte das publicacoes na area da Saude apresenta

problemas metodol6gicos e estatisticos.

16

ESTATfsT ICA DESCRIT IVA

Dois conceitos inicia is devern estar bern claros: 0 de popu lac ao

('0 de amostra, po is e delas que sao extrafdos osdados que dao origem

;ls diversas relacoes estatisticas, como media aritmetica, desvio-padrao

ctc.. e que, ern ult ima analise, possibilitarn descreve-las sob os rnais

d iversos aspectos.

Populacao: qualquer conjunto de inforrnacoes que tenharn en-

tre s i uma caracterfst ica com urn que deli rn ite, inequivocarnente. quais

elementos pertencem a ela. Nurna cidade, por exernplo. 0 conjunto

das esta turas de todos os seus habi tan-

tes constitui um a " po p ula ca o de esta-

turas". 0 ta rn an ho de u rn a p o pu la c ao

e habitual mente expresso pela letra N

(rnai uscu la).

Se uma pesquisa incluir

todos os membros das

populocces em estudo,

todas as diferenccs e

taxas encontradas serdo Amostras: sao subconjuntos

verdadeiras. representativos de urna dada popula-

<:;ao.A arnostra deve ser representativa

da populacao da qual foi extraida, ser

parecida com ela (qual itat iva e quanti ta tivarnente), devendo obedecer

a dois pr incfp ios basicos:

1. deve ser suficientemente grande;

2. seus constitu intes devem ter sido selecionados ao acaso.

Selecao ao acaso - random - sign i fica que cada um dos com po-

nentes da populacao estudada tern a rnesma chance de ser incluido na

17

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 8/79

.uuo ...r.l (', .11 ('11 1dis!'.o, <jIll' lo i . . ,pl (·cio l1.Hlo i l ld ( ' ll l 'IHII 'IU( '11l( '111( ' , II <jIll '

implied <jll(' .1 inclus.io dt· lIl11 partirnl.ir 11H '11111'0 11,'11) .dll·rcl d Ch.lIH·('

de inclusao cJosclemais. So isso nao ocorrer, cliz-sc qlll'.1 .u no strn (. l1.tO

randornizada ou viciada - biased.

Urna rnaneira pratica de selecionar um a arnostra randornizada epor rneio do uso de nurneros aleat6rios, que podern ser obtidos em ta-

belas a p ro p ri a da s ( en co n tr a da s em livros e softwares de estatfstica) ou

par meio de planilhas elet ronicas, como Excel, nas quais e possfvel del i-

rnitar algumas caracterfst icas desses nurneros como, por exernplo , 0 in-

tervalo de variacao desejado.

A arnostra constitui uma reducao da populacao a dimensoes

rnenores, sern perda das caracterfsticas essenciais. 0 seu tarnanho e

habitualmente expresso pela letra n (rninuscula).

A tabe!a 1 contern uma serie de nurneros aleatorios: para ut il iza-

la deve-se iniciar pelo cruzarnento entre urna linha e uma coluna qual-

quer e definir urn caminho a ser seguido, por exemplo, para a direita

ou para baixo. Caso 0 nurnero encontrado nao se aplique. ou urna

repeticao de nurnero nao seja adequada, passa-se ao seguinte.

o objetivo da esta tfstica descritiva e descrever os d ado s o btido s

nurn estudo, evidenciando seus atr ibutos, tais como media, mediana.

mo da - pouco usada , desvio padrao etc.

T ab e la 1 . E xtr ato d e ta bu a d e n um e ro s a le at6 rio s

C ol u na :: :) 1 2 3 4 5 6 7 8 9 10

Linha D

9 8 9 6 9 9 0 9 6 3

2 3 5 6 7 4 3 2 6

3 4 0 6 1 6 9 6 1 5 9

4 6 5 6 3 1 6 8 6 7 2

5 2 4 9 7 9 0 3 9 6

18

C)ll'llllin O~ d'lIlm ('~I,'o e l l ' ' ' ( 1'110., lOll( i"d, IOlllpl('ld (.

,H,,,.Hlclll11'Il!t·, pOdl'1l1 ..,('r(,Ipi., pdrd 1,1/( '" illl(·r(·IH"id", g(·IH·,..di/dl.;'-)(,s

"olm' ciSpoplIl.H./)(·S qll(~ dcr.un origom .I S . un o st r. is e st ud a da s .

I )t'V(' sc'rnpre se r lernbrado que dl fe rencas irnportantes podern

('stl lr mascaradas pela variabilidade biologlca e imprecisao experimen-

t.ll (' que (1 incl inacao natural, especial mente para com os pr6prios da-

dos. c concluir que eventuais diferencas encontradas sao reais e nao

dependentes da variabil idade das amostras.

Do ponto de vista purarnente estatfstico, as general izac;:oes se

aplicarn sornente as populacoes que forneeeram asarnostras, mas pode-

se usar 0 julgamento cientffico e 0 born senso para fazer inferencias

que vao alern da Estatfstica.

Entretanto, frequenternente, deserever uma populacao ou uma

arnostra e insufieiente, sendo neces-

sario , por exemplo, c orn pa ra r d ua s ou

rna is a rnost ra s , isto e , verif iear se elas

pertencern a rnesrna populacao ou

nao. Paratanto, deve-se usar inicial-

mente a E st at is ti ca D e sc ri ti va paradescreve-las e, entao, apl icar terra-

rnenta s da Estatfstica Anali t ica para

fazer as inferencias.

E 0 usa dessas ferramentas

que perrnite ao pesquisador ir alern

dos dados. lnferencias signif icat ivas sobre urna deterrninada popula-

<,;aodependem ern grande parte da validade e acuracia das estatisti-

cas usadas.

Dodos imprecisos, amostras

viciadas, populccces mal

definidas e cr-iterios

subjetivos levam a

resultados igualmente

imprecisos, que a estatistica

nco pode e nco deve tentar

salvor.

Apalavra "estatlstica" pode ser usada como sinonirno de qual-

quer relacao estudada e assim, a media e a mediana, sao estatisticas.

19

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 9/79

TIPOS DE DADOS

Para realizar calculos estatfsticos uma das primeiras coisas a serem

feitas e caracterizar qual t ipo de dados estasendo trabalhado, pois muitas

estat fsticas apl icaveis a um, nao sao adequadas para outros.

Os dados podem, de acordo com

o nfvel de rnensuracao e simplifi-

cadamente, ser agrupados em tres tipos

basicos: nominais, ordinais e continuos.

Dados nominais sao todos aqueles

distribufdos em categorias nominais, sem qualquer ordem. Exemplos

desta categoria incluem sexo, raca, evolucao (morte ou sobrevivencia),

via de parto, cor dos olhos etc.. Podem se codificados atraves de

nurneros, por exemplo, feminino = 1 e masculino = 2, com os quais

obviamente nao sao perrni tidos calculos como media e desvio-padrao

dentre outros. Na realidade estes dados nao sao mensurados mas

simplesmente contados - conta-se 0 nurnero de observacoes com ou

sem 0 atributo de interesse. Sao geralmente descritos em termos de

porcentagens e proporcoes e apresentados na forma de diagramas de

barras, "pizzas" e tabelas de contlngencia.

Dados ordinais sao aqueles que se distribuem por categorias

que tern uma ordem. Neste tipo de dado nao ha valores intermediaries

entre as categorias e uma mesma diferenca nurnerica nao tem sempre

o mesmo significado. Aqui se incluem escores diversos como Escala de

Apgar, de Glasgow, graus de retinopatia, CRIB, Papanicolaou etc.. A

mesma ressalva quanta a calculos feita para os dados nominais, aqui

E crucial entender os

diferentes tipos de

dados.

20

t .unbem se apl ica. Frequenternente a rnediana e usada para descreve-

los mas, tambern, proporcoes e porcentagens podem ser util izadas.

Dados continuos - r atio data - sao aqueles em que os nurneros

s:io int rinsecamente signi ficantes e asdiferencas entre eles sempre tem

.I mesma implicacao, podendo sempre existi r valores intermediar ies.

Peso, perfmetro cefalico e estatura sao bons exernplos deste tipo de

dados: urna diferenca entre as estaturas 112 cm e 105 cm tern 0

rnesrno significado que urna diferenca entre 78 cm e 71 cm, isto e , ela

C de 7 cm ern ambos os casos.

Algumas vezes fala-se em dados intervalares quando se refe-

r indo a valores obtidos mediante a aplicacao de uma unidade de rnedida

arbit raria, porern constante e onde 0 zero e relativo, como ocorre, por

exemplo, com graus Celsius. Este tipo tarnbern apresenta restricoes a

calculos. Ver exercfcio 4.

21

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 10/79

TEN DEN CIA C EN TR AL E D ISP ER SA o• .. • tI .. • .. tI .. .. "" .. ~ '" .. .. It .. • <II

A medida da tendencia central da uma ideia de onde se locali-

za 0 centro, 0 ponto medio de determinado conjunto de dados. H a

varias maneiras de expressa-la como a media e a mediana.

Urn outro conceito importante e 0 de dispersao, isto e, 0 modo

como osdados seposicionam ao redor do ponto central . Verf igura 1. Uma

populacao e di ta hornogenea quando a dispersao e pequena.

A dispersao dos dados pode ser avaliada at raves de uma serie de

medidas como 0 desvio-padrao, a variancia e a amplitude total.

Figura 1. Tendenc ia cent ral e d ispersao

T e n d e n c i a

central

-+---- D i sp e rs a o - -- _

22

DESCR Ic _::Ao DE DADOS

NOM IN AIS E O RD IN AlS

Essestipos de dados sao muito faceis de serem descritos; geral-

mente, basta apresentar 0 seu nurnero (valores absolutes) e distr ibui-

< . . : 1 0 (porcentagem por categoria).

Frequenternente, podem ser apresentados atraves de diagramas

de barras verticais (colunas) ou os chamados setoriais, como as"pizzas"

(' "roscas" - doughnuts .

Figura 2 . E x em p lo d e q r af ic o d e c ol un as ( a) e s e to ri al ( b)

D ls tr lb u ic ao p or s e x o

(a) (b )

Femin ino

57 %

23

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 11/79

DESCREVENDO DADOS CONTIN UO S

Este tipo de dado pode ser trabalhado para gerar inforrnacoes

que expressem a tendencia central e a dispersao.

As mais comuns medidas de tendencia central sao a media arit-

rnetica, a mediana e a moda. Algumas vezes, entretanto, quando se

trata de dados com distribuicao assirnetrica, e mais apropriado 0 usa

da media geornetrica.

A media aritmetlca e definida como a soma dos valores obser-

vados, dividida pelo nurnero de observacoes, E habitualmente repre-

sentada por x quando se trata de amostras e por Jl quandose t rata de

populacoes, Seu usa e adequado quando a distribuicao dos dados obe-

dece a forma de uma curva de Gauss (em sino). A medida que 0 tarna-

nho da amostra aumenta, ha maior chance de aparecer um valor

extremo e deslocar a media em sua direcao. Nao se aplica a dados

nominais.- L XX =-n-

A media geometrlca (MG) e definida como a raiz n esima do

produto dos "n" resultados obtidos. Ela e menor que a media aritrneti-

ca, na o sofre tanto a influencia de valores extremos e e particularmen-

te util quando se lida com nurneros que se distribuem em progressao

24

HC '' 'l ll l' 'l ri l' tI ( 01 1 1 " I C ' ., ,, I I. ,, I " . . ( 'x pn '! oI sm 1 1 .1 1 ( 1 11 1 1" d c · 111"1",,(In, 1 /, 1 , 1 /

I I, 1 /1 1 1 .. . ) .

1 1 .......- _

M e = ~ (X )(X )(X ) ... (X )1 l J 11

A mediana (Mel) e definiela como aquele valor que, uma vez

()lcic'l)ddos toelos os resultados, deixa igual nurnero de resultados de

( .Idol lado. Numa disrr ibuicao assimetrica ela e multo mais representa-

tiv.: el;) populacao do que a media. Eventualrnente, pode ser usada

(0111 dados ord inais.

A moda (Mo) e definida como 0 valor mais frequents e e usada

primariarnente para descrever distribuicoes bimodais.

Considere-se os seguintes resultados brutos obticJos, componen-

I('s de urna determinada arnostra:

66 66 69 71

66 66 68 72

56 63 64 65

57 64 64 65

n = 16

L x = 1.042

-= 1.042= 651x .16 '

Md -_ 66 + 65 6 *= 5,5

2

Mo = 66

MG = 16~ 56.57.63.64.64.64.65.65.66.66.66.66.68.69.71.72 = 64,9

* Neste caso, deve-se usar a media aritmet ica dos dois valores

centrais visto n ser urn nurnero par.

25

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 12/79

MEDIDAS DE DISPERSAo

A dispersao dos dados e freqLientemente charnada de variabi-

lidade. As medidas de dispersao rnais usadas sao: 0 desvio-padrao

(DP) - s tandard dev ia tio n (SO - s), a

A dispersdo dos dados

na amostra e menor que

a da populccco que Ihe

deu origem.

variancia e a amplitude total ou intervalo

de variacao - range .

A ampl itude total e a di ferenca en-

tre 0 mais alto e 0 rnais baixo valor obser-

vado; ela nao infonna como os dados sedistribuem entre esses valores e, a medida

que a arnostra cresce, ela cresce t arnbern , devido a urna rnaior chance

de aparecer um valor extremo. Ver figura 3.

Figura 3 . D is pe rs ao d e dad os n a a m os tr a e n a p opu lac ao .

D ispe rsao dos dados na

amostra

/~ '\ Dispe rsao dos dados napopulacao

\

26

ENTENDENDO 0 PERCENTIL

Suponha que urn deterrninado paciente, aos cinco anos, pese

15kg e que sedeseje saber como ele se situa dentro de sua cornunida-

de; para fazer essa anal ise pode-se usar uma distr ibuicao de porcenta-

gens acumuladas conhecida como percent il.

o percentil e obtido dividindo-se a populacao . organizada em

ordem crescente, em 100 partes iguais. Ele indica a porcentagem do

total de observacoes que sao iguais ou sesituarn abaixo de urn determi-

nado valor. No exernplo anterior, se 0 escore 15 corresponder ao posto

percentil 90, entao 90% dos habitantes da referida comunidade aos

cinco anos de idade, pesam 15 kg ou menos.

Seurn deterrninado resultado situa-se no percentil50, exatamente

50% dos resul tados sao menores ou iguais ao rnesrno e 50% sao maiores,

o que significa que 0 percentil 50 corresponde a mediana.

Quando a populacao e dividida

em dez partes iguais, fala-se em decil, e

quando e dividida em quatro partes, em

quartil. 0primeiro quartil inclui 25% clos

valores mais baixos: 0 segundo quart ilcorresponde ao percentil 50 e a media-

na, e assirn pOI'diante.

o charnado intervale interquartllico

e a distancia entre os valores do 750 e 25° percentis. A vantagern do seu

uso, em relacao ao da amplitude total, decorre do fato de nao sofrer

influencia dos valores extremes.

E errado utilizar a

expressdo "percenti I

50/0". 0 uso correto e

percentil 50 ou quinque-gesimo percentil.

27

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 13/79

VARIANCIA E DESVIO-PADRAO

Observando-se urn eonjunto de dados, com a media dos mes-

mos ja ealeulada, ver if iea-se que eles se distr ibuem ao redor desta m e -dia, para mais e para menos. Quanto mais proximos da media estiverem,

mais hornogeneo sera 0 eonjunto. Assim, ha um interesse em medir 0

quanta os valores obtidos se afastam, 0 que pode ser feito pelo desvio-

padrao e pela variancia.

Vamos supor que um pequeno vilarejo tenha somente 11 habi-

tantes e quealguern deeida avaliar a estatura desse grupo. As 11 esta-

turas afer idas representam toda a populacao de estaturas e nao somente

urna parte - arnostra e estao apresentadas no quadro 1.

Quadro 1 . E st at ur as d a pop u la ca o e e s ta tis tic as

Est atu r as d a p op ula ca o ( N = 11 )

13 5

13 6

13 8

14 1

14 3

15 2

15 2

15 2

15 7

16 3

Media (mean)= Soma / N= 1639/11 = 149= Il

Mediana (median)= 15 2

Valor maximo= 170Valor mfnimo= 135

Amplitude total (range)= 170 - 135 = 35

17 0

28

1 ' , 1 1 ' , 1 ('"lnll,1I , I V , I , .I , ~ I1 < ' I " d(,.....1 pop"I,I(.',,)o, (, IH'II,.,."llio ..,11)('1l l i c i -

,11"1('111('ll,II110 (',ul,1 r"o,lIl1.HloS(' "relSlo1d,l I1H·,diel.oI1H) ('SS('S n'Sllll,Hlos

',I' , 1 1 " . .101111,1Il11l p.lI"l 111,1is'(11110 p.lr,1 IlH'nOS,oIM'I1I-S(' r e s u l r . u l o s IJosili-

Voo,( ' lH 'gc l livos. A 1 .1 1 > 1 '1 " '2 rnostr.i a si IUt1( .; . " iode C Hid cstatu ra e m relacao a

t ' .. t.llllt'c1 1 1 1 ( ' < 1 i.1.

Tab e la 2 . E st at ur as e c al cu lo s

Estatu ras Estatu ra - M edia(ll)

13 5

13 6

13 8

14 1

14 3

15 2

15 2

15 2

15 7

16 3

17 0

135 -149 = -14

13 6 - 14 9 = -13

13 8 - 149 = -11

14 1 -1 49 = - 8

1 4 3 - 1 4 9 = - 6

15 2 -1 49 = 3

15 2 -1 49 = 3

15 2 -149 = 3

15 7 -149 = 8

16 3 -1 49 = 14

170 -149= 21

Eleva-se, entao. cada diferenca encontrada - discrepancia - ao

qu.ulmdo, sornando-se a seguir osquadrados obtidos, conforme tabela 3.

I )ell'd obter a variancia, representada por o',dessa popu lac,,:aode estatu-

leiS, { , preeiso dividir a soma dos quadrados obtida pelo seu tamanho

(N), Essea rtiffcio de elevar eada diferenca ao quadrado e usado por-

'flU', se fossem simplesmente somados os valores, aqueles posi tivos e

III 'g"tivos se anulariam e, ainda, se fossem considerados apenas os va -

loros absolutes, 0 fato de urn valor se situar para UI1l lado ou para outro

del media nao ter ia a minima importancia.

29

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 14/79

Tablla 3 . E s la lu r as e c B lc u lo s,---------===.=:....:===.:::_.::.=;==-----_ ..-~--,~

Esta tu r a - M edia (Il)staturas (Es ta tu r a - M edla )2

13 5

13 6

13 8

14 1

14 3

15 2

15 2

15 2

15 7

16 3

17 0

135 - 149 = -14

136 - 149 = -13

138 - 149 = -11

141 -149 = - 8

143 -149 = - 6

152 -149 = 3

152 -149 = 3

152 -149 = 3

157 -149 = 8

16 3 -149 = 14

170 -149= 21

(-14 )2 = 1 96

(-13 )2 = 1 69

(-11)2 = 121

(-8 )2 = 64

(-6 )2 = 36

(3)2= 9

(3)2 = 9

( 3 ) 2= 9

(8)2 = 64

(14 )2 = 1 96

(2 1) 2 = 4 41

N = 11 Soma = 1 .3 1 4

Variancia da populacao =o'= 2:(x-l-l)2 =1.314 = 11945

N 11 '

A variancia calculada dessa forma apl ica-se para populacoes, 0

desvio-padrao e a raiz quadrada da variancia. Extrai-se a raiz quadrada

para obter uma estatfs tica com a mesma unidade de medida utilizada

para os valores.

Oe sv io - pa d ri io d a p o p ul a. ;a o = cr = ~ ' = 0119 ,454 = 10,92

Se estes 11 habi tantes fossem, entretanto, uma amostra de certa

populacao, tornar-se-ia necessario fazer um ajuste rnaternatico, porque

os valores das amostras sao mais pr6ximos da media da amostra do que

realmente ocorre na populacao, isto porque a dispersao dos dados na

amostra e menor que a dispersao dos mesmos na populacao onde 0

aparecimento de valores extremos e muito mais facil de ocorrer. Como

o desvio-padrao da amostra e um estimador do desvio-padrao da

populacao e necessario corrigi-Io (aurnenta-lo) para torna-lo mais

pr6ximo do seu valor real na populacao. Diminuindo-se 1 do

denominador calcula-se um valor mais adequado do desvio-padrao e

30

dfl vMI,~n('lao nh!ll'rVoH ' IIH' , I i nf il li 'n cl ll tlt'slt' dl'cr('sl'imo IlO

denomlnador torn.i-se d(!sprC'/fwl .) llH 'd id .I q ll(, c re sc o () t.un.mho dil

.unostr.i,

2: (X-X)2

n - 1

1.314=131,40

11 - 1

Variancia da amostra =52 =V =

D es vi o -p a dr ao d a a m o st ra = 5 = OJ' = 0 L (x-x) ' = 'J 1 3 1 , 4 0 0 = 1 1 , 4 3n -1

31

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 15/79

F ig u ra 4 . D e sv os -p ac ra o e t ra co e s d a p op u la ca o i nc lu id a

-DE5YIO-PADRAO Media

Emterrnos simples, desvio-padrao (DP) -s ta nd ar d d ev ia ti on (S O ),

e urn modo de representar a dispersao dos dados

ao redor da media. Se os claclos obedecerem aEntendendo 0

lima distr ibuicao normal, toclos estarao compre-

encliclos por urna curva em forma de sino; eles se

dist ribui rao simetr icamente ao redor da media.

o quadro 2 rnostra os dados conticlos en-

tre desvios-padrao para ambos os lades cia media.

signif icado do

desvi o-pcdrco

Quad ro 2 . Par ce la e n v ol vi da d a p op u la ca o e n tr e d e sv io s- pa cr ao

Media +( ) Desvlo-padrao % d a p op u la ca o i nc lu id a Grosse i ramente

1 68,3 2/3 da popu lacao

1,96 95,0

2 95,5 9 5% da popu la cao

2,58 99,0

3 99,7 1 0 0% d a p op u la ca o

32

A flglll', I il ('on..illl' " 1 1 1 , 1 1I'lnt''''I'I1I,I!~'''o gr , ' I l i l , I d " . . , f r , I I , ( H ' ' ' ' d o l

popIII,I(,,'IO <i"(' "..,1,10 j"dllrd".., ('Illn' diVt'l'sos d('svios-p'Hlr(~H).

~~~_~~~~~_95,5°~~~_~~~~~~_~ .

99,7%

33

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 16/79

COEF IC IENTE DE VARIA~Ao

o coeficiente devorioc;:ao independe

do unidode de

medido usodo.

A magni tude do desvio-padrao depen-

de da unidade de rnedida de uma variavel par-

ticular e, assim, urn desvio-padrao medido em

dias sera numericamente multo maier do que

o mesmo desvio medido em meses. 0 cha-

made coeficiente de variacao - coeff icient of

variation, expressa 0 desvio-padrao como por-

centagem do valor da media.

Desvio-padrao

[media]oef iciente de variacao = X 100

Urn coeficiente de variacao igual a 100% indica que 0 desvio-

padrao e igual a media; quanta menor ele for , rnais hornogenea sera a

arnos t r a .

o uso deste coeficiente perrni te comparar dispersoes de dados

entre estudos onde forarn usadas unidades de medida diferentes,

polegada e centfmetro, por exemplo.

34

ERRO P AoRAo OA MED IA

A Ill(·diil calculada para uma arnostra dificilmente sera igual a

I1U"<li" (r(' ,II) elil populacao. 0 tamanho da discrepanc ia depende do

t.un.mho elil arnostra e da variabilidade dos dados: medias baseadas

"Il l grande nurnero de casos variam menos do que as baseadas em

pl'Cflwno nurnero e medias de populacoes com pequena variabilida-

c l l ' variam menos que medias de populacoes com grande variabili-

dude. Quando urna arnostra e escolhida ao acaso e e suf icientemente

K I " ' H i < ' , ( 'Ii I tern caracterfsticas que se aproximam bastante daquelas da

pClp,d,\(,Jio da qual foi extrafda. Mas, qual eo grau de certeza de que a

Ilu'dicl d, l arnostra representa a media verdadeira da populacao? Se fo-

11'111's(olhidas varias, e consequenternente diferentes. arnostras de uma

Ill l'Sl llcl populacao e calculadas asmedias de cada uma destas arnostras.

',1'1,"obticla urna serie de medias diferentes, todas elas representativas

dol 11H'Smapopulacao. Ver f igu ra 5.

F i g u ra 5 . D i sc re p a n ci a e n tr e a s m e d ia s d e d ife re n te s a m os tr as d a m e sm a populacao

Media

da

Populacao

- +. . . - - -- -- -- -- . . + i

I l.Dife ren 'ya

en t r e 0 r eal

e o a pu ra do! !

.J . .J .i, .

Media M e dia

da da

am ostra B am ostra A. .. .. .. .. .. .. .. _ _ ._ - _ _ j

35

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 17/79

V('rilk.l-s(' < I I I < ' ('sl.ls 11I('di"., 1 ( 11 1 1 1 1 1 11 0 1 di. ,l riu" i( ,.lo norm.d om

t orn o c l.t m ed ia venla deir.t c qu e 0 dosvio-padr . io <It'sld p o p , r I" < , . ·; · IO c I ( ,

medias - ch amado Erro pa dr.io da s Medias - e mellor qU~() dosvio-

pad r ao obtido a partir da s a rn os tra s iso la da s e pode ser obtido atraves

da formula:

Ele rnede a dispersa o da s medias da s diferentes arnostras de

m esrn o ta m an ho , extraidas de um a m esrna po pula ca o, em torno da

media da s medias, isto e , em torno da media verdadeira d a p o pu la c ao

estudada.

Exemplo: Suponha que se deseje calcular 0 erro-padrao da

media a partir de uma arnostra de dez pesos. Inicialmente, deve-se

ca lcular a media e 0 d es vio -p ad ra o d a a rn ostra para, em seguida, ap!i-

car a formula do EPM.

Tamanho da amostra = n = 10

Media = 36

Soma dos quadrados = 1.074

Desvio-padrao = 10,92

Observe na tabela 4 oscalculos iniciais para determinacao do des-

vio-padrao:

EPM >,_s_=IO,<J2=3,45

{11 f10

T ab e la 4 . P e so s e c al cu lo s

-

Peso P eso - M edia (P es o - M e dia )2

20 20 -3 6 =-16 25 6

23 23 - 3 6 = - 13 16 9

24 24 - 3 6 =-12 14 4

36 36 - 3 6 = 0 0

37 37 - 3 6 = 1

38 38 - 3 6 = 2 4

39 39 -3 6 = 3 9

43 43 - 36 = 7 49

45 45 - 3 6 = 9 81

5 5 5 5 - 3 6 = 19 36 1

n = 10 (x - x )2 = 1.074

3637

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 18/79

DESVIO-P ADRt\O X ERRO P ADRt\O DA M EDIA

DP mostra dispersao ou variabilidade;

EPM 0 quao bem a media e conhecida;

Se a dispersao e biol6gica (clinical mostre-a: dados reais

ou, pelo menos, 0 DP;

Se a dispersao e tecnica, preocupe-se com a media; apre-

ser ite-a juntamente com 0 EPM ou, de preferencia, com 0

intervalo de conf ianca (IC);

EPM e sempre menor, assim aparenta ser melhor!

Do exposto conclui-se que 0 usa adequado do EPM em textos

med icos e restrito.

38

INTERVALO DE CONFIAN~A PARA MEDIAS

Conforme explicado anteriormente, quando sao extraidas

.tl llo<,l r.1Sde rnesmo tamanho de uma populacao. as medias obt idas de

(,1(1.1 urna delas tern uma distribuicao normal cujo desvio-padrao

((J11<,lillii0 chamado Erro Padrao das Medias - EPM. Ver figura 6.

Figura 6 . D ia gr am a m o str an do a d is pe rs ao d as m e dia s

de am ostra s d e m e sm o tam an ho.

Med ia ( re a l)

da

populacao

Distribuicao

da popu lacaoD is tr ib u ic ao d as m e d ia s d e

a m os tr as d e m e sm o ta m an ho

e x t ra fdas da popu l acao

o d esvio p ad ra o da d is tr ib u icao das med ia s

e 0 E rr o P adr ao da s M e dias (E PM )

39

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 19/79

D ES VIO -P A DRAO X ERRO PADRAO DA MED IA

• DP rnostra dispersao ou variabilidade;

EPM 0 quao bern a media e conhec ida;

Se a dispersao e biol6gica (clinica) rnostre-a: dados reais

ou, pelo menos, 0 DP;

Se a dispersao e tecnica. preocupe-se corn a media: apre-

sente-a juntarnente corn 0 EPM ou, de preferenc ia. corn 0

intervalo de confianca (IC);

EPM e sernpre rnenor, assim aparenta ser rnelhor!

Do exposto conclui-se que 0 usa adequado do EPM ern textos

med icos e restrito.

38

INTERVALO DE CONF IANc.::A PARA MED IAS

C:onforrne explicado anteriormente, quando sao extraidas

,IIIlmtr.lS de mesmo tarnanho de urna populacao, as medias obtidas de

I"d" urna delas tern uma distribuicao normal cujo desvio-padrao

«1)ll~titlii 0 charnado Erro Padrao das Medias - EPM. Vel' figura 6.

Figura 6 . D ia gr am a m o str an do a d is pe rs ao d as m e dia s

d e am ostr as de m e sm o ta man ho .

Med ia ( re a l)

da

populacao

D is tr ib u ic ao d as m e d ia s d e

a m os tr as d e m e sm o ta m an ho

e x tr a idas da popu l acao

Distribuicao

da popu lacao

o d esvio p ad ra o da d is tr ib u i9ao das med ia s

e 0 E rr o P adr ao d as M e dia s (E PM )

39

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 20/79

Se Io rem co nsiderado s '1 ,96 [PM pa rn ca da la do da media

obtern-se um intervale de confianca de 95% que tern 0 seguinte

signif icado: se forem calculadas asmedias de 100 arnostras de mesrno

tamanho extrafdas de urna populacao, 95 delas se situarao dentro do

intervalo em questao e 5 nao. Este intervalo pode, portanto, ser obtido

apl icando-se a seguinte formula, val ida para amostras razoavelrnente

grandes (n > 60):

IIC95% = X±(1,96 EPM) Ia desvio-padrao obtido a partir de amostras pequenas pode

variar bastante e consequentemente 0 EPM e, por isso, para calcular 0

intervalo de confianca nesta clrcunstancia e preferfvel ao inves de usar

a distr ibuicao normal uti lizar outra desenvolvida para amostras menores

e conhecida como dist ribuicao t.

A formula para calcular 0 intervalo de confianca (lC) para Y%

de certeza e:

IC (Y%) = (m - (t x EPM)] a (m + (t x EPM)]

onde mea media, t (Student) e 0 valor da estatfstica "t" - obtido em

tabelas para "t", disponfveis em softwares e varies l ivros de estatfstica e

EPM e 0 erro-padrao da media.

Urn intervalo de confianca muito grande sugere que a media

da amostra encontrada e pouco representativa da media (verdadeira)

da populacao.

40

ENTENDENDO INTERVALOSDECONFIAN~A

EM OUTRAS SITUA~6ES

as estatfsticos desenvolveram me-

todos para calcular intervalos de confian-

ca para grande parte das estatfsticas, sen-

do 0 raciocfnio para sua cornpreensao sern-

pre 0 rnesrno. Por exernplo, quando sao

comparadas as medias de duas populacoes.

pode-se calcular urn intervalo de confianca

de 95% para a diferenca entre elas, isto e,

urn intervalo que, com 95% de certeza, in-

t 11I11,jl verdadeira diferenca entre as e las , Existem, assim, metodos

11.11.1.ilcular um Ie de 95% para 0 risco relativo, para um~ reta de

!I'gil 'ss ,lo, para urn valor predictivo, odds r~tio e assirn por d~ante. as

1llll'IV,lios de confianca m a r s encontrados sao de 90, 95 e 9 9 Yo .

Muitos preferem intervalos de confianca aos testes de hip6tese,

IltH!jlll' eles tornam evidente 0 alto grau de incerteza inerente aos

It'~l il l. lclos obtidos a partir de arnostras pequenas.

Quanto maiores

[or-ern as amostras

mots estreitos serdo

os rntervclos de

conficncc,

41

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 21/79

DISTRIBUI<;Ao NORMAL+ t o . . . . . .. . . . . . '" . . . . It or . . . .. . . . . . . . . . . . . . . . .. ..

Frequentemente as inferencias em pesquisas medicas estao ba-

seadas em dados cuja distr ibuicao e normal . A curva normal ou de Gauss

e s imetrica, unimodal e tem forma de sino; assume uma serie de forrnas

mais ou menos achatadas (curtose) em funcao da dispersao dos dados ao

redor do ponto central, no qual coincidem a media aritmetica, a moda.

assim como a mediana.

A descricao da curva normal pode ser

feita matematicamente por meio de dois

parametres: a media eo desvio-padrao.

A figura 7 mostra urna curva normal e a

porcentagem de casosenvolvidos a medida que

sao inclufdos urn, dois ou tres desvios-padrao

para ambos oslades da media. A curva normal

e assint6tica em relacao ao eixo horizontal , suas candas aproxirnam-se

dele mas nao 0 tocam jamais, 0 que signif ica que a variavel pode assumir

qualquer valor entre - 00 e + 00.

Conforrne foi explicado anteriormente, quando a distribuicao

dos dados e normal (simetrica), a media representa bern a populacao:

quando a dist ribuicao e assirnetr ica, a mediana e mais representativa.

Em calculos estatfsticos usa-se f reqLientemente a media para fazer cal -

culos. Oaf a importancia de que essa media represente realmente a

Uma curva simetr-ico

s6 sera chamada de

normal se possuir as

propriedades

apresentadas na

figura 7.

arnostra estudada.

42

F i g u r a 7 . M e dia e fr a~ ao da populacao i nc lu id a e n tr e 1 , 2 e 3 d es vi os -p ad ra o

..-----------------~~

Media

Mediana

Mcxla

95,5%._ . . . .-._--_._ ..... _ .. . _ . _ - _ . _ . _ . _ .. -_ .. . _ - _ ...._- .

99,7%

43

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 22/79

ESTAT fsT ICA Z (ESCORE Z)

A estatfstica Z - s ta nd ar d s co r e, baseia-

se na curva normal. Ela mede quanto um deter-

minado resultado (valor) afasta-se da media em

unidades de desvio-padrao.

A suo grande

uti lidade se deve

a facilidade de

conver'sdo para

percentil.

Pode ser observado na figura 8 que um resultado cujo valor

coincide com a media tem escore Z = 0; observa-se tarnbern que a

variacao desta estatfstica ocorre f requenternente no intervale entre -3

e +3, visto que tres desvios-padrao para mais e para menos incluern

99,7 4 % (praticarnente 100%) da arnostra estudada.

F ig ur a 8 . Escore Z e f ra go es d a pop ula ga o e n vo lv id a

-3 -2 -1 o +1 +2 +3

. . . . . . _.- _ - _ . _ . . _ .100%

E~ffiZ i- - - - . - - ~ - - - - - - - - - ~ ~ . _ . ~ . . ._ _ J

44

A 1 ~ 1 "I f . . lh,' I(I l 1 1 u l t o ,'Ilil '1 1 , ,1 1 , ,1 0 " C ' C C l l ll P o II ,I I ll v,dor('., pr()v(',

"I"IIlc'" d el difl'l'('I1I(ls (''ollldo ... Outr.t IIlili<ltl<l(' (. <ltldtl p('ltI fdl'ili<ldci('

til' " 1 1 , 1 (OIlVCOrS,IO PM,' 1>"1"( '( '111il, conlonnc pod,· S(·t «onst.rtado n o (, X( ~I1 1 -

p i ll ' IIH ' '0(' S('gll(',

S C ' 1 1 1 1 1 1 1ostudo qualquer 1 1 1 1 1 deterrninado valor se situar exata-

,,,c'll lc' " <lois dosvios-padr.io acirna da med ia, setiver um escoreZ =+2,

1 . 1 t . c",I .l I," no pcrccnt il 9B, soma da area a esquerda do 0 (zero), igual a

',(I 'X " ( 0 1 1 1 .I .irca ,1direita do 0 (zero), igual a aproximadamente 48%.

1 ' , 1 . 1 1 II() p('ru'ntil 9B significa que este valor e igual ou superior a 98%

d()', v.i loros aprcsentados pelo restante da populacao.

S(' nurna deterrninada avaliacao a media foi de 70 pontos e 0

dl'wi ()-poldr50 de cinco pontes, urn resul tado de 80 pontes seria muito

1 1 1 1 1 1 1(rlois desvios-padrao a c i r n a da media e, p o r t a n t o , igual OLisuperior

II ' 111%dos demais resultados); se, entretanto, para a mesma media 0

dl'wj()-p<ldrao obtido fosse de 20 pontos, os mesmos 80 pontos ja nao

C I I II (",ponderiarn a Lim resul tado tao bom (meio desvio-padrao acirna da

IIlI'tiid 1', portanto, igual ou superior a 69% dos dernais resultados).

T ab e la 5 . Escore Z e t racoes e n vo lv id as d a populacao

z

F ra <: ao d a p op ula ca o co ntid a e n tr e Z d es vio s-

padr ao para m ais e para m en os da m edia

0, 5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

38,29%

68,27%

86,64%

95,45%

98,76%

99,74%

99,95%

99,99%

45

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 23/79

D IS TR IB UIC ;O ES D E F RE QU EN C IA S

Uma distribuicao de frequencias e uma

organizacao dos dados brutos em urna forma

distr i~ui~oes de tabular, usando classes (ou intervalos) e frequencias.

frequencies E I . d i . Ia In rca simp esmente quantas vezes urn

determinado valor ocorreu, sendo bastante

uti lizadas, pois permitern condensar osdados de forma a tornar a analise

mais facil, sendo 6bvio que, no processo de condensacao, perdem-se

detalhes, mas estes nem sernpre sao importantes,

. Por exemplo, em urn determinado colegio deseja-se avaliar 0

rend."ll:nto de 53 alunos por meio das notas recebidas numa prova e

distribuidas conforme apresentado na tabela 6.

Entendendo as

T ab e la 6 . D is tr ib u i gao de f requenc ia

Nota N u rn e ro d e a lu n os

0 1

3

2 3

3 5

4 5

5 6

6 8

7 8

8 6

9 6

10 2

46

A d lsl r IIH lI , ;' \o d c · In'q O(illcl.I., 1 1I(l.,lr,I < 1","1 1"., V('/ ('" 1 11 11 ,1

< 1 1 ' 1 < ' ri ll 1 1 1,1 1 1.1 1 1 01 1 1 .,c ' 1 '1 '1 '1 '1 1 11 q ll,," lm ,"1I1l0S ohtivor.uu 1I1l1,1

( l tol( 'r I l lln . ld.1 .1V.l llcI ,. io. Poti(I_S(' i lgnq>oIr m ais os d ado s d is rr ib u ln do - o s

pm l '.IIl'goriils mais arnplas, obiondo-se uma distribui,:ao de frequencias

, lg ru l> i1 d ". V e r tabcla 7 .

T ab e la 7 . F r e qu e n cia ag ru pada po r ca te go ri as

Catego r ia FreqUenc ia

(n u m er o d e n otas )

0- 3

4 - 6

7 -1 0

12

19

22

Uma distr ibuicao de frequencies expressa por porcentagens as

V('/('S e mais interessante, especialmente na comparacao de estudos

('l1lr(' si. Para calcular a porcentagem, divide-se 0 nurnero de observa-

<,()('S numa dada categoria pelo nurnero total de observacoes e multi-plicd-se por 100. Ver tabela 8.

E possivel calcular tarnbern a porcentagem acumulada sornando

01', porcl 'ntagens individuais uma a uma. Considerando 0 exemplo ante-

lilli,porle-se observar na tabela 8 que, ao juntar as faixas a - 3 e 4 - 7,

ItolV('r:l a inclusao de 58,4% dos dados. Estatabela de frequencias e por-

T ab e la 8 . F r e qu e n ci es e p or ce n ta ge n s r e la ti va s e a cum u la da s

Catego r ia F r eq uenc i a Porcentagem Porcentagem

acumulada

0 -3 12 12 / 53 * 1 0 0 = 2 2,6 % 22,6%

4- 6 19 19 /53 * 1 0 0 = 3 5,8 % 58,4%

7 - 10 22 22 / 5 3 * 1 00 = 4 1 ,5 % 100%

Soma= 53 53 I 5 3 * 1 00 = 1 00 %

47

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 24/79

('(lllldg(IIlS d(,1I1ll1l1"d.1S constltui.: ".IS(' r lo rnnluxido I ) i.lgr.II11.1e I ( , P.tn'I(),

multo usado como ferrarnenta de qLJ(llidild(~.

l requenternente sao a n al is a da s v a ri a s caracterfsticas a o m esm o

tempo, sendo possivel construir tabelas b iv a ri ad a s, t ri va ri ad as etc., que

mostrarn a ocorrencia de cada situacao, como na tabela 9. Saoconhecidas

como t ab ela s d e c on ti ng en ci a e 56 contern dad os brutos - nurnero de

casas (frequencias absolutas) situados em cada condicao resultante do

cruzarnento entre colunas e linhas.

Tabelas contendo As linhas e colunas em urna tabela demedias, frocoes,

taxas e proporc;oes

nao Sao tabelas de

contingencia.

contingencia podern ter significados diferen-

tes em fun<;_:aoo desenho do experirnento. As

linhas representarn geralrnente exposicao (ou

falta de) a tratarnento ou a fatores de risco. As

colunas geralrnente rnostram categorias mutu-

amente exclusivas. As tabelas de cont ingencia rnostrarn 0 nurnero de

dados em cada categoria.

No exemplo anterior considere que se esteja querendo incluir

o sexo como uma variavel, Logo, a tabela de contingencia correspon-

dente poderia ser como a ta bela 9 .

T ab e la 9 . E xe m plo d e t ab e la d e c on tin q en cia

Sexo C a te go ria d e n ota s Total

0-3 4-6 7-10

Masculino 5 1 1 1 1 2 7

Femin ino 7 8 1 1 2 6

Total 1 2 1 9 2 2 5 3

A coluna da direita e a linha inferior mostrarn apenas totais _

charnados de marginais. Quando seesta t rabalhando corn rnais de duas

variaveis, geralmente e mais faci l construir tabelas separadas para cada

cornbinacao de valores.

48

-TERMOS QUE CAUSAM CONFUSAO

. . . . ~ .. " .. .. .. .. .. . . . . . . .. .. '" .. .. " ..

Terrnos como estimacao. est imador, estimat iva e pararnetro As

vozes causarn confusao.

Estirnacao e 0 processo; procedimento estatistlco que per-

mite prever, com certa probabilidade, 0 valor de lim

pararnetro desconhecido (populacional) com base nas in-

forrnacoes obtidas d a s a r no s tr a s.

Es t imador e a e s ta t is ti c a u s a da , par exernplo, a media c1a

arnostra e urn est irnador da media populacional. Ver figura 9

Estimativa e ur n valor particular de u rn e st imad o r , como por

exernplo: x=2,5 e uma estimative de ~.

Pararnetro e uma medida numerica usada para descrever

alguma caracteristica populacional . Por exernplo, a estatu-

ra media de urna populacao consti tui urn pararnetro.

F ig u ra 9 . E st at is tic as c omo e s tim a do re s d e p ar am e t re s p op u la ci on a is .

Amostra

(representada

por estat ist icas)

Popu lacao

(parametres

representados

p or l et ra s g r eg a s)

Med ia = xDesvio-padrao = s

Proporcao = p

~I

a

'IT

49

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 25/79

REPRESENTA~Ao CRAF ICA

Urn grafico ou diagrama e uma representacao geornetrica da

relacao entre variaveis. Ele ajuda 0 leitor a fazer urna imagern mental

dos dados apresentados e, frequenternente. fac ilita a visualizacao de

relacoes nao identif icaveis na observacao de uma tabela.

o diagrama de colunas tern particular interesse porque constitui a

base de urn t ipo de graf ico mul to usado denorninado histograrna, 0 qual

rnostra, no eixo horizontal, todos os possiveis valores ou intervalos e, no

eixo vertical, a frequencia em que cada urn deles ocorreu. No diagrama

de barras (horizontals), asvariaveis x e y mudarn de posicao. 0 histograma

das notas do exernplo anter ior esta apresentado na f igura 10.

F ig ur a 1 0 . H is tog ra ma m os tr an do u m a dis nb u ca o d e d ado s a gr up ad os p or ca te go rias .

(j)

,~ 15

~ a 3'::Jcr~ 10LL

25

50

20

5

oCategorias

( > . , h l . , t( ) H " o I I l 1 , 1 " ponu l t r -m .I I,kil ViSllolli/,"",() dc ' ( '01'00'0 ro m v.rlo-

I I' ~ 1 1 1 1 1 i to d l f( 'l '( 'l 1 t( 'S do s < 1 ( ' 1 1 1 . 1 1 ' 0 ( II I/ li t, !' " ( ' moslr.un t.unlxun S (' tI distri-

1 1 I 1 i( ., 'IO ( , sill1('tric,1 Oil d('sviiHlil para um l.rdo. bimodal, trimoclal etc. Nes-

t t' t ipo dc ' gr.Hico () l im i te - superior de um a Iaix a ou categoria nunca

', oh rc 'PCH' ( ) inferior elil seguinte.

O ulra fo rm a de ap re se n ta r a distribui<:;aode dados continuos e atra-

V{I~dos pollgonos de Irequencia, que sao construidos unindo-se os pontos

11I(,dios( la s lin h as a o topo d a s c o lu n a s do histograma, conforme a f igura '11.

F ig u ra 1 1 . Poi fg on o d e f re q u en c ia

25

C] Nota 0 - 3

OJ Nota 4 - 6

[jJ N ota 7 - 10

20

en, < : > 1uc<Q

' : : :>0

~LL

15

10

5

oCategorias

Outro tipo de representacao grafica bastante usado e 0 de tronco

(' folhas - stem-and-/eaf plot, cuja aparencia lernbra a de urn histograrna

deitado, mas que preserva uma maier quantidade de informacao. Ele

lernbra 0 histograma porque 0 comprirnento de cada linha corresponde

.10 nurnero de cases do intervalo considerado. Ver figura 12.

51

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 26/79

52

o0...',p

0...

E<lJX

L.!.J

N

r< J.. .: : : : l

eou : :

-

o. . . - -II ~o ttlo oC0"'--

~ IIo ttl"'0£

~:E:::J ttl~"'Ottl ttl....J()

II. . . .or o>o

E< Q . l. . . . . .

enoen

~L()

enttl£

ou,

oo500...--...--...--...--...--

~

ttlooooooo'-0000000 _

<~ ~ 1'-, ~ ~ co L()

::::J

0'"

~u,

( ') lI lm .. l i!, w . t i l ' r t' !, n" .I 'l ll ,I (. ,IO g !, '\ li lo i 1('111 " id o I I" oI d( )' o 1 ' . 1 1 0 1 ' ' 1 ) 1 ( ' -

' ,1 '1 1 1. 11 ' 0 0 , d o ld o " I ' 0 1 1 ,1 1 01d is !, I'r S,' l( ), S I'g lJ (' lll o Il gl lll S « xo m plo s n.is figllrols

1 . 1 1 ' 1 4 ,

>x00..';::

co ;Ru 0

fU 01

0, E

0.co(yo

coC0

U0

0.. co~ is0

'0

u EU

0o._

E0

iw ., .M

e:::

C

u : :

,~

u,0

E

I

o ®O I

0 0 1 0 0o No 0

o.coisco0..

6sU0

o

>co- o~ O)U

53

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 27/79

54

0'-'<I:l

E

$<I:l 0'-' <:J

~ 0

'-'0"> :i U0'<I:l Ec:» (j)

<I:l <I:l

C c;_<D

illj)

<D ,~

C i. z~<DT

(j)

0c;_

E<D> <w

."r

~: : : sO

u : : :

o(0

oL!)

o0..

2

N

o0..

2C)

1

C0

8- ~ -2C)

I

+I

oC')

... -_.-- _._ _ ._-- , - _ . --_._._.-o

N

+1

o

N

o0..

Ef~

oo0..

E

~

UI1l(1 representacao, a s vezes encontrada (figura 15 ) e que da urna

1111.1 idl'i<l quanta a s caracterfsticas da arnostra e charnada Box-and-whisker

I l ie I t I n.io tendo urna boa traducao para 0 portugues - caixa e fio de b igode,

F i gur a 1 5 . G ra fi co t ipo box -and-wh is ke r

17 5

P-r+

r 15 0e

s

s

a 12 5

0

S10 0

i

s

t

6 75

I

i

c50

a

25 -

O--L--------------------.J

L_ ~

----- Valor m ax im o

+-- P e rc e nti l 7 5

-4 . . . . . . P e rc e nt il 5 0

.. .. Pe rcen til 25

..... -- V alo r m in im a

1

~\

, 1 \ "

I \ ~

55

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 28/79

C UR VA S D E S OB RE VIV EN CIA:

UMA REPRESENTA~Ao CRAFICA

- -NAO TAO INTU IT IVA

Em muitos estudos clfnicos procura-se est imar 0 tempo de 50-

brevivencia dos pacientes com a finalidade de, por exemplo, comparar

a eficacia de dois tratarnentos.

A f igura 16 rnostra urna curva de sobrevivencia sin,pies. Nela, 0

tempo 0 (zero) refere-se a ocasiao em que cada paciente entrou no estudo

eo valor de y , neste tempo zero, serasempre 100%. Quando urn paciente

rnorre, ~ porcentagem de sobreviventes dirninui (degrau) e, se0 estudo se

prolongar ate a rnorte do ult imo paciente, 0 valor f inal de y sera 0 (zero).

Ha duas maneiras de criar urna curva de sobrevivencia. Em

urna delas, divide-se 0 eixo x em intervalos regulares, verificando a

sobrevivencia ao terrnino de cada perfodo (tabela de vida ou atuarial

- a ctu ar ia l m et ho d) e na outra, a sobrevivencia e recalculada a cada

vez que um paciente morre, K a pl an -M e ie r m e th o d, como ocorre no

exernp!o da figura '16 .

Urna dificuldade desse tipo de estudo ocorre em funcao da

desistencia ou desaparecimento de pac ientes, incluidos na pesquisa,

antes do terrnino dessa: sern esquecer de que a morte de determinado

paciente pode nao estar ligada ao problema estudado. Mesmo assirn,

os dados serao considerados, pois conta-se a observacao do indivfduo

56

,11(', () f im du sl'guimento, 0 que se chama de observacao censurada -

( ( , l Is o r e d ob s e rva t io n .

Tracados semelhantes podern ser feitos para outras situacoes como

tempo de rernissao de uma leucemia,

por exernplo. Assim, embora secha-

mern curvasde sobrevivencia, 0even-

to escolhido nao e necessariamente a

Dados deste tipo raramente

obedecem a uma drs+ribuicdo

Gaussiana e. por essa rczdo.

me+odos especiais precisam

ser usados para analise-los.

rnorte.

Figura 1 6. E xe m plo d e c urv a d e s o bre viv en cia

._-- -_ __.-__---_ _ _ ._----_._---_._-_ ....._ - - _ .._ - _ . _ _ ._- -_ .._ _ ._._._ .. ....-

~ ~ _ e _ m _ p _ o _ e _ m_ m _ e s _ e _ s J

ps

00r b

cr

ee

nv

t ia

v9 ee

nm

t

de

se

M o r t e

,----j-__----_ .._--__----_._-__---__-

100%

75Obse rvacao censu rada

I

25

o

o 24 362

57

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 29/79

TESTE 0 SEU CONHECIMENTO

Exerdcio 1. Urn pesquisador investigando a incidencia de doenca das

mernbranas hialinas, escolheu como amostra os primeiros 200 partos

ocorridos nas quartas-feiras. Corn base nessa amostra, determinou a inci-

dencia da referida doenca no bercario escolhido e extrapolou para a

populacao de sua cidade. 0seu procedimento merece crfticas?

Exercfcio 2. Foi feito urn estudo para determinar a estatura media dos

alunos (N=1.000) de urn colegio, que estavarn distribuidos por quatro

series consecutivas. Foi selecionada urna amostra em que foram inclui-

dos os prirneiros 100 alunos que adentrararn a escola nurn determinado

dia. Pergunta-se: a amostra esta adequada para a pesquisa em questao?

Exercfcio 3. Num estudo para avaliar a pressao em animals. foram sele-

cionados dez, ao acaso, para constituir a amostra. Nestes, mediu-se a

pressao em tres ocasi6es diferentes. 0pesquisador pode considerar, para

fazer seus calculos, que ele tern urna populacao de 30 press6es (3 x 10)?

Exerdcio 4. Suponha que urn forno x esta corn urna temperatura de 60°C

e urn outro forno y esta com 15°C. E correto afi rrnar que 0 forno x esta

quatro vezes rnais quente que 0 forno y? Se a temperatura de x fosse

60°C e a de y 0 DC, como fazer para cornparar?

Exercfcio 5. Determine 0 t ipo de dado das seguintes variaveis:

a) Marca de antiterrnico preferida

b) Grau de temperatura corp6rea

c) Grau de satisfacao corn urn hipoglicemiante oral

58

I I ) I ' n " , o . , , ) ( ) ",!tori,"

I') I\c'IHI" f.unlll.rr

o (d"" dc' d(l!1l1l1lri ,' ; I"

H ) ()II<Hic'nlt' inlf'lt'ctuoll- Q l.

h) I )oIciw, I'm uma tahe!a de contingencia

1,U'rddo 6. () nurncro de resfr iados adquiridos por oi to estudantes num

dl'll'rtllinoldo poriodo foi respectivamente 1, 2, 2, 3,4,4,6 e 8.

,I) ( ,lind(' .IS estat isticas: media, mediana. rnoda, amplitude total e des-

vio-p.idrao.

I, ) Iill nono estudante, corn deficiencia imunitaria, foi inclufdo na

.uuostr .i e apresentou 26 resfr iados no mesrno perfodo. Recalcule as

1'~t.llislicilS.

1) (.! II .l is estat isticas forarn pouco afetadas pelo acrescirno?

c il ( .ikulc 0 escore Z para 0 nurnero de resfriados adquiridos.

Iercicio 7. Considerando 0 exercicio anterior, apresente os dados por

1111'ioIt , LJmhistograma.

Ivrcicio 8. Considerando as estaturas de todos os meninos corn dez

,11111" dc' idade. de urn vilarejo, obteve-se urna estatura media de 120 ern

C ' 11111osvio-padrao de 20 em. Como se localiza dentro dessa populacao

11111.1i ill lc,;a que, aos dez anos, apresenta urna estatura de 80 cm? (Uti -

1 1 1 1' ( ) «score Z para fazer 0 raciocinio).

Iercicio 9. Considere as seguintes 19 idades: 18, 21, 22, 22, 24, 24,

" r " 2(), 30, 30, 32, 32,36, 36, 36, 36, 40, 4'1, 78. Calcule as seguintes

1",l .l lis lic:as: media, rnediana e percentis 25 e 75.

Ixercicio 10. Considerando 0 exercicio acima, apresente osdados usan-

II " 11111 grafico tipo stem & leaf e outro, tipo box-and-whisker .

I'('cicio 11. Suponha que se deseje comparar as estaturas de 2 grupos

I" 'pldilcionais. Os resultados das afericoes ern cada grupo estao

oIPII' s('ntados graficamente na figura 17. Baseado na igualdade das

11"'llI 'divas representacoes graficas e possivel afirrnar que nao exis te

dlll,rt'nc,;a entre os grupos estudados? 59

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 30/79

Figura 1 7. B ox p lo t r ep re se n ta tiv o da dls tr lb u lc ao d as e siatu rn s u fo rld as o m 2 g ru po s

populacionais.

G ru po 2

G ru po 1

I

4 0I I II I

o

Exercfcio 12. Considere a populacao de fosfatases alcalinas: 14, 21,

17,26,29,31,15,18,25,13,12 e 22. Qual 0 posto percentil ocupado

pelo valor 18?

60

I

80

RESPOSTAS DOS EX ERCfclOS 1 A 12. . . . . " " " " ..

I.;\oscolha de um dia fixo da sernana nao foi adequada para investi-

~1,oIr.lncirlencia da doenca das membranas hialinas, que e sabidamente,

n -l .ir io na da a o tipo de parto : a equipe do dia escolhido pode ser mais

nu mcnos intervencionista do que as dos outros dias, interferindo nos

1('~1I11;1CjOS. Essaescolha feriu tarnbern 0 principio de que todos os re-

( ( "Il1-nascidos do bercario em questao devem ter a mesma chance de

1.1I('r parte d a a m ostra . A ex tra po la ca o dos resultados para a comuni-

d, l( i l' t a rnbern foi inadequada, pois nem to d a p op ula c ao deve se servir

d('sse mesmo bercario.

' 1 .. ; \ arnostra dos a lu no s es ta viciada, pois ela deve ser representativa

d, I populacao qualitativa e quantitativamente, isto e. deveria ter sido

,,('I('cionado urn nurnero proporcional de alunos pertencentes a cada

:I. ;\ a feric ao da p ressa o tres vezes no mesrno animal contraria 0 princi-

PIt) da independencia, tornando a arnostra viciada. E multo diferente

Ir .l IJ,l lhar com uma arnostra de 30 animals nos quais seaferiu a pressao

11111,1 vez de que t r aba lhar com 1 0 em que a pressao foi a fe rid a tr es\,(/I'S. 0fato de se encontrar um animal hipertenso n a a r no s tr a de dez

n.io implica em que serao encontrados tres animals hipertensos na

.unostra de 30.

4. l.ste exercfcio foi proposto para que 0 leitor sinta asdif iculdades de

',(' lrabalhar com dados intervalares - que tern urn zero arbitrario. Com

( '<,11 ' tipo de dados s6 sao perrnitidas operacoes de soma e subtracao. 0

61

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 31/79

<j Il l' S (' podo dfirllldr (, qU(' () forno X ,lpr<'S('l1td 41) "( d(, dif('f"('Il<.,tl ('Ill

relacao ao forno y , mas n,\o que esta quatro V(,/('S m.iis <ill< - n u - , ( )p( 'rtl<.,(-)(< '

de rnult iplicacao e divisao na o podern ser fe itas com ('stc tipo cjp d.ulos.

5. A identificacao do tipo dos dados com que se esta trabalhando e

multo importante e referida, frequenternente, como nivel de rnensuracao

do dado.

Dado

Marca de antiterrnico preferida

Crau de temperatura corp6rea

Crau de satisfacao COIll

hipoglicemiante oral

Pressao arterial

Renda familiar

Crau de desnutricao

Q I

Dados em tabela de cont ingencia

Nlvel de mensuracao

Nominal

lntervalar

Ordinal

Continuo

Continuo

Ordinal

Ordinal

Nominal

6. Para osvalores propostos (1,2,2,3,4,4,6 e 8), obtern-se osseguintes

resultados para as estatisticas:

a) Situacao inicial:

Media = 3,7

Mediana = 3,5

Moda = 2 e 4 (bimodal)

Desvio-padrao = 2,31

Amplitude total = 7

b)Ao ser acrescentado rnais urn casu com valor 26, obtern-se osseguintes

resultados:

Media = 6,2

Mecliana = 4

Moda = 2 e 4 (bimodal)

Desvio-padrao = 7,72

Ampli tude total = 25

62

( ) ( lh.,('lv(' qU(' houve irnportante variacao da m e d i a, d o desvio-padr.io

( ' t i d .unplitude, mas que a rnediana e a mo da pouco alterararn.

ti l (',tI(,lli,lIldo 0 escore Z para os valores propostos para 0 nurnero de

n-slri.ulos, obtern-se:

N u m e r o d e r e sf ria do s ES CORE Z

2

2

3

4

4

6

8

26

-0,67591

-0,54648

-0,54648

-0,41705

-0,28762

-0,28762

-0,02876

0 ,23010

2,55983

7. No histograma apresentado a seguir, que mostra a distribuicao dos

v.ilores propostos, observe que a dis tribuicao nao e simetrica e que ha

urn valor extreme presente.

F ig u ra 1 8 , H is to gr ama mo st ra n do a Ir e qu e n cia d e e v e n to s - r e s fr iados po r fai x as ou ca te go ri as .

n:;

U

C.G

=>Cy

~tL

0,5 2,5 4,5 6,5 8,5 10,5 12,5 14,5 16,5 18,5 20,5 22,5 24,5 26,5

1,5 3,5 5,5 7,5 9,5 11,5 13,5 15,5 17,5 19,5 21,5 23,5 25,5 27,5

63

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 32/79

U. N('sl(' ('x ('rddo , () va lo r d c ' 11 0 1'111 proposlo pM.! () (,ISO ('Ill ('~Il,d()

encontra-se 4 0 em abaixo cia media de '120 ern, ('x.tI,lftH'IlI(' '2 d('svios-

padrao (2 x 20 ern) abaixo ou, a i nd a . a p re se nt a UI1l esco rc Z = -2 . Islo

significa que essa crianca encontra-se no percentil 2: ela tern urna

estatura superior ou igual a apresentada pOI' 2% das criancas de sua

comunidade, com a rnesma idade. A simples o bse rv ac ao d a fig ura 19

abaixo rnostra a faeil idade para sechegar a esta conclusao e a util idade

do escore Z.

t o , A" ItIPrt'SIII'I.'(.()II~ ~r.HI('tl '; 1)()(lc'll.lIll ~('I 0I~~c'gtlilll(''':

I I I '" ' I I I I~ " '0 1 ( I , / 1 1 1

1 1 1 1 1 1 1 « . . , do., " I I I I 1 o S

IW'I"I\II(iol IrOIHO l~ lolh.i1 ,( J( I 1 II

" , 11 0 2 ' 12144

) , I H I 2 59

'1,00 :I (J022

, I , (H I :I C J 6 ( ) G

),1)(1 4 011,(1) 1xlnmos (>=78)

l,lIHIII,1 do Ironco:10

( I ldol !(lIIl,,:! GISO

F ig ur a 1 9. D is tr ib u i9 ii. o d e d ad os p or f ai xa s d e e sc or e Z .

! omhrc-se de que, neste tipo de grafico, para restaurar 0 valor

original de ca da da do . deve-se multi-

plical' a largura do tronco pelo COITes-

pondente tronco e sornar 0 valor de

ca da fo lha : a ssim , 0 valor represen tado

na primeira l inha e (lOX 1) + 8 = '18,

5etnpre que aparecerem

resultcdos extremos,

devc-se verificar se nao

houvc erros no sua

ob t cncdo ou digitac;:ao.-1,96 -1 o 1,96

E sc or e Z

ill B o x -a nd -w hi sk er s p lo t

lIentro da caixa estao 50% dos resultados; como a mediana

,",1.1 «'ntrada na caixa, a distr ibuicao deve ser razoavelmente sirnetr ica.

1 \ . i lt u r . : c ia c ai x a r n o st ra a d ispersao de 50% dos resultados r n ai s p ro x im o s

d" ( ( ' 1111 '0. A la rgura da ca ixa na o tem nenhurn significado.. Os resultados para as e s ta t is ti c a s s o li c it a d a s e que sera o usa do s na

solucao do exercfcio 10 sao os seguintes:

Media = 32,2

Mediana = 30

Percentil 25 = 24

Percentil 75 = 36

6465

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 33/79

60 0

50 •

40 •

30 •

20 •

F i g u r a 20 . B o x p lo t r ep r es e n ta ll vo d a dlBtrlbul~ao d O B d a do !i - I d ad e d O B eluaos.

80 • Caso19

com val or

e x tr em o ( 78 )

70 •

Valor max imo

(at e 1 , 5 a lt u ra s

da ca ixa )

Pe rcen t il 7 5

P e rc en ti l 2 5

10. ~ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~ r - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~N= 19

11. Nunca se deve comparar resultados atravcs de representacoes

graficas, pois elas podern facilmente induzir ao erro. Observe na figura

18 que, com relacao ao problema proposto, as2 di ferentes distr ibuicoes

de dados podern ser representadas por diagramas identicos

66

F ig ur a 2 1 . D ia gr am a m os tr an do d is tr ib u ic oe s de d ado s dife re n te s q ue p od em g er ar

r epr esen t acoes q raf ic as i den t ic as .

( . ru p o 2 XXXX x XXXXXX x XXXX

(;rupo 1 x X X X X X XX XX X X X X XX

I I I

o

I

40

I I I

12.0 prirneiro passo para encontrar 0 posto percent il ocupado pOI'urn

deterrninado valor dentro de urn conjunto de valores e ordena-los em

ordern crescente e a s s ir n t e rn -s e :

12 13 14 15 17 18 21 22 25 26 29 31

o passe seguinte consiste ern contar quantos resultados SitU,1Il1-

se abaixo do valor escolhido (18) e que no caso e 5, corresponciente

aos valores 12,13,14,15 e 17.

A seguir aplica-se a seguinte formula:

NQde valores abaixo deX + 0,5

Nll total de valores

5 + 0.5

12Percentil = X 10 0 = X 100 = 45,83

e assirn 0 posto percent il ocupado pelo 18 e aproxirnadamente 45,83;

isto e , 18 e igual ou superior a 45,83% dos dernais valores deste conjunto.

* Os exercfcios de numero 6, 7, 9 e 10 forarn resolvidos com 0

auxil io clo software estatfstico SPSS.

I

80

I Ii

67

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 34/79

Estatfstica Analftica(au Indutiva)

  ¥ _4fM J . ,.

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 35/79

INTRODU~Ao.. • .. .. • .. • .. • .. .. .. .. .. • .. • II< .. ~ .. .. I

A Estatfstica Analitica (ou lndutiva) permite ao investigador ir alem

li d descricao dos dados e fazer inferencias sobre a populacao com base

lIdS arnostras. Essasinferencias, obviarnente, tern lim itacoes, nao se pode

I('r absoluta certeza de que estao corretas. A Estatistica Analitica emprega

.I teoria das probabi lidades que pennite ao pesquisador calcular 0 risco

qlle ele assume ao chegar a determinada conclusao.

o usa de formulas neste texto sera minimo: hoje, a maier parte

<loscalculos e feita por meio de softwares estatfsticos em cornputadores

('0 que 0 pesquisador necessita e de cornpreender os princfpios basicos

p,1I'a entrar corn os dados e, apes verificar se foram respeitadas as

«ondicoes para uti lizacao, aplicar 0 teste estatistico adequado.

A disponibilidade destes recursos eletronicos constitui urn

progresso nao isento de riscos, uma vez que seu uso pOI' pessoas sern

conheoirnentos adequados de Estatistica e do pr6prio software,

scgurarnente levara a erros grosseiros.

71

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 36/79

ENTENDENDO 0 VALOR DE P.. • .. .. .. .. .. to . .. ,. . ,. .. , .. " ~

Considere que para cornparar duas popula<;,:6esidenticas tenham

sido ext ra idas asarnostras A e B de mesmo tamanho (n = 4) apresentadas

na figura 22. Baseaclo nestas amostras pocle-se cometer urn erro tipo I,

isto e, enxergar diferenca onde de fato nao existe.

F ig ur a 2 2. A m ostr as A e B d e m e sm o tam an ho e x tr aid as de 2 po pu laco ss id en ticas .

20 20 2020 20

20 20 20 20

52020 2020

EJ0 20 20

A5 20 20 20 20

4 20 20 204

4 5 20 20 20 20

20 20 20 2020

20 20 20 20

5 2020 20 20

~

20 20 20

B5 20 20 20 20

45

20 20 204

4 20 20 20 20

o valor de pea probabilidade, que varia de ° a 1, de encontrarna pesquisa urna diferenca igual ou maier que a observada, dado que

as duas populacoes tern de fato a mesma media, isto e. a chance de,

pOI' mero acaso. dentre todas as arnostras de t a rnanho 4, sortear

justamente as arnostras A e B ou equivalentes.

72

o valor de p e uma proporcao:

Experimentos com uma diferenca tao grande quanto a observada

p=----------------------------~--~~~~--Todos os experimentos possfveis, desde que nao haja realmente diferenca

Se 0 valor de p e pequeno, a diferenca encontrada tern pouca

«h.ince de ser causada pelo acaso - var iabil idade das a rn ostra s - conclui-

',I' que as populacoes sao, corn grande probabil idade, cli ferentes.

Frequenternente interpreta-se malo valor de p. Se, por exernplo,

p= 0,05, isto significa que ha 5% de chance de se notal' urna diferenca

l.ro grande ou maier que a observada, mesmo que as duas populacoes

('slueiadas sejarn identicas.

o que se pode concluir e que se fossem escolhidas varias

.unostras dessas duas populacoes identicas, encontraria-se uma

diferenca entre duas amostras quaisquer, inferior a observada em

')5% das vezes e maior em 5% .

73

 

,

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 37/79

ENTENDENDO A H IP6TESE NULA (H, )

Hip6tese e uma conjectura,

uIIIa resposta presu IIIida e proviso-

ria que, de acordo com certos cri-

ter ios, sera ou nao rejeitada.

Chama-se hip6tese nula

aque!a que simplesrnente afirrna

que nao ha diferenca entre os gru-

pos estudados: trata-se de urna hi-

p6tese que atribui ao acaso a ocor-

rencia do fenorneno ou resul tado observado.

Um valor de p ndo significativo

nao implica em que a hip6tese

nula seja verdadeira, mas tao

somente em que as evidencics

disponfveis nao Sao suficientes

para rejeitci-Ia.

74

TESTANDO H IP 6TESES

o principal objet ivo de testar uma hip6tese e responder a seguinteIiu es ta o : d ad as d u as am os tra s, sao elas realmente d iferentes ou pertencern

.Iu ma m esrn a po pu la ca o? E m o u tra s p ala vra s. e determinar com r azo ave l

(' conhecida certeza se as diferencas encontracias entre duas ou mais

.unostras sao verdadeiras ou podern ser explicadas pelo a ca so -

variabilidade da arnostra.

Considere-se 0 seguinte exernplo: em certo estudo deseja-se

COll1pal-aras estaturas de na sc im en to d as c ria nc as naturals d a s c id a de s

de Campinas e Macei6. Suponha que a media da s estaturas de todas as

r ri an ca s n a sc id a s em Campinas no periodo de estudo seja 53 ern e que

,\ media das estaturas das criancas nascidas em Macei6, no mesrno

periodo, seja 49 ern. Conclui-se, com certeza, que as criancas

campineiras sao, em media, 4 ern mais altas que aquelas nascidas em

Macei6 durante 0 periodo de estudo. E possivel ter 100% de certeza

quanto a esta conclusao, porque seesta lidando com populacoes inteiras,

nao coni arnostras e, nessa situacao, nao e necessario nenhum calcu!o

estatistico, pois os dados e as diferencas encontradas sao reais.

Raramente, entretanto, ha a oportunidade de se lidar com

populacoes inteiras; geralmente, disp6e-se apenas de a rno stra s d as

populacoes estudadas. Nessa condicao, ja nao se pode afirmar, sem

(azer calculos estatisticos, se as diferencas encontradas sao reais ou

simplesmente devidas a variabilidade das amostras.

o processo de testar uma hip6tese consiste em seis eta pas

sequencia is:

75

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 38/79

I. (·sl.li>(·I(·u·r 11111dip(')I('s(' ('xl)('rilll('III,tI (III 1(\ ',t'. "g,1 I J ;

2. eSlabelecer LJI l lC1 hipolc's(' I1UI,1 I i U I / ! tYI)() l lw~i~J (I-III Ii•.

se: agelzero);

3. deterrninar 0 tarnanho da arnostra:

4. colher os dados:

5. realizar a analise estatfstica para deterrn inar a probabilidade

de que a hip6tese nula s ej a v e rd a de ir a :

6. rejeitar ou nao a hip6tese nula.

Nesse exemplo, a hip6tese alternativa ( H) deve ser: os recem-

nascidos de Campinas tern urna dist ribu ic;:aod iferente de estatu ras ern

relac;:ao a o s r ec em -n a sc id o s de Macei6.

Notar que a hip6tese tala em di-

ferenca e, portanto, pode ser para mais

ou para menos, bicaudal - two tai l . No

exernplo em curso, fazer urna hip6tese

unicaudal ou uni lateral corresponderia a

afirrnar que os recem-nascido, de (;:1111-

pinas tern uma estatura rnaior que aque-les de Macei6.

A hip6tese nula (Ho) cleve ser 0

oposto da hip6tese forrnulada (HI)' 0

que, no exernplo, poderia ser: nao ha diferenca reprorlutfvel entre (IS

estaturas, e qualquer d ife re nc a o bs erv ad a e devida ~ variabilidade da s

Deve-se usar umo hipo+e-

se unilateral quando as

mudcnccs s6 puderem

ocorrer em uma unicc

direc;ao ou quando

interessarem somente

rnudonccs em uma unicc

direcdo.

am ostras.

A etapa seguinte consiste em deterrninar 0 tamanho da amos-

tra, 0 que deve ser feito antes do infcio da coleta de dados, e para

deterrnina-lo e preciso estabelecer qual di ferenc;:a deve ser considera-

cia signi ficativa. No exernplo atual , quantos centimetros de diferenca

entre as medias das estaturas devem ser consideraclos para se aceitar

que ha realmente uma diferenca de estatura entre as duas populacoes,

ou seja, qual "grau de diferenca" cleve ser considerado clinicaillente

significante? Esta e UI11Cldecisao arbitrar ia do pesquisador, baseada ria

experiencia, na l iteratura e/ou na relevancia clinica.

76

Aind.: Pdl'd <i(·I('lIl1il1.tr 0t.un.mho

dd dl11OSIrd,d cv c- s« c o ns id cr ar 0 nivcl de

significc1ncia ade q uado: q ua nto de

p ro ba bilida de e a ce ita vel para que Ho seja

verdadeira. Usual mente considera-se

como a de qu ad a u ma p ro ba bilid ad e de ate

5% (p < : 0,05), mas dependendo do que

',I' ostuda. esse nfvel pode ser diferente.

Deve-se definir t ambern qual 0 erro beta aceitavel. Quando se

Quanto menor a

dif erenco a ser

detectado,

maior deverd ser 0

tamanho do cmos+ro.

,I«'it;) urn erro beta de 0,1, esta-se

.u r-it .in do u ma chance de 1 0% de deixar

tI(· recon hecer u 11 1 a d ife re n ca que

u-.ilmente existe. Finalmente, deve-se

.onsiderar 0 de sv io -p adra o esp era do .

1',10 porque, quanta maier ele for, maier

tI('ver,') ser 0 tarnanho da arnostra . A

lo rmula para calculo do tam anho da s am ostra s pClra comparar SUclS

III(-'clias leva em conta todos os elementos citados:

Quanto menor 0 nfvel de

significoncia (p),

maior deve ser 0 tamanho

da amostra.

I1I1c1e e Z representam os escores Z de uma curva normal associadaa f3 . j I

,II)Svalores de alfa e beta, (J0 desvio-padrao, e D a diferenca co ns« era c a

' ,Ignificativa. Para este calculo e interessante deixar as contas para 0

«omputador.

A etapa seguinte consiste na coleta de dados . lernbrando seillpre

< J lie rnaus dados levam igual mente a mas cond us6es.

Uma vez obtidos os dados . faz-se a analise estatistica aplicando-

',I' testes escolhidos em funcao do tipo de dados disponivel.

Urn valor de p, probabilidade de que .a diferenca encontrada

.x.orreu por acaso e que seja devida a variabilidade das amostras . deve

',('I' determinado. Para p < : 0,05 ha 1 chance em cada 20 de que 0

«-sultado obtido seja consistente COIll Ho ' ou seja, que nao haja diferenca.

77

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 39/79

ENTENDENDO OS ERROS

Os pesquisadores realizarn experimentos para testar uma hip6-

tese. Eles formulam urna hip6tese, observam, analisam e em seguida

concluern. Ap6s observar, eles descrevem e medern (ou classi ficarn),

jarnais atribuindo jufzos de valor ao que estao vendo; podern decidir

erroneamente e rejeitar a hip6tese nula, rnesrno que ela seja verdadei-

ra: porern, se ela for verdadeira, querem que a probabilidade de vir a

cometer esse erro (tipo I ) seja pequena. Esta probabilidade charna-se

nfvel de signif icancia.

Ao testar urna hip6tese qualquer pode-se incorrer nos dois ti-

pos de erros apresentados no quadro 3.

Quadro 3 . T ip os d e e rr o n o te ste d e h ip 6te se s

~

(V) (F)

Ve rdade ira Fa/sa0

Re je ita r aE rr o tip o / Acerto

hip6tese

N ao r eje ita r aAcerto E rr o tip o "

hip6tese

Tratando-se da hip6tese nula, dado que ela seja verdadeira, 0

pesquisador cornete urn erro tipo I quando a rejeita. Ele aceita como

verdadeira urna diferenca que, de fato. nao existe e que, na realidade,

se deve a variabilidade das arnostras.

Quando a hip6tese H o e falsa e 0 pesquisador nao a rejei ta, ele

comete urn erro t ipo II; isso signi fica que existia, de fato, uma diferenca

que nao foi reconhecida.

78

POR QUE OCORREM ERROS

AO TESTAR H IP 6TESES?

I'

... * It I

Os erros tipo Iocorrern principal mente por dois motives: amos-

I l o I S pcquenas e rnuitas analises.

Devido a variabil idade das arnostras, helurna chance maier de

',I'H'1ll di ferentes quanta menores elas forern e, assim, de serern obser-

v . n l . r s diferencas que se di lui riarn numa amostra maier.

Quando se fazem anal ises estat fsticas corn muita frequencia. a

1,1(1,\caso acrescentado, por exernplo, tencle-se a parar assirn que for

1'I I( '(mtrada uma diferenca estatisticamente significante. Muitas analises

nrnrrcm tarnbern quando ha rnuitas variaveis ou muitos subgrupos sen-

do «omparados entre si. (Ver Procedirnento de Bonferroni no glossario).

Os erros tipo II ocorrern em funcao de arnostras pequenas (pr in-

1'1),11causa) e de grande variabilidade das mesmas. Essesdois fatores

I)cHlem eliminar aschances maternaticas de aparecer uma significancia

1",l.ltfstica.

Algurn erro sernpre ocorre, assirn e uti l deterrninar quanto de erro

I' .ulmisslvel: para 0 erro tipo I, ou al fa, considera-se que 5% e aceitavel e1'.11.10 erro tipo I I, ou beta, cornurnente aceita-se de '10% a 20%.

79

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 40/79

ENTENDENDO A VARIAB IL IDADE

DAS AMOSTRAS

As fontes de variabilidade das arnostras poclem ser agrupadas

em tres ti pos:

1. lrnprecisao ou erro experimental: a imprecisao. multo

i rnportante em Engenharia, constitui , na Medicina, uma fonte pequena

de variabilidade.

2. Variabi lidade biol6gica: as pessoas, ascelulas e os animals

variam grandemente entre si, nao s6 pela grande diversidade naturalrnente

existente, mas tam bern pela ocorrencia de variacoes circadianas (ao lon-

go do dial , devidas a idade, a alimentacao, ao habito de fumar etc. Esta

e urna fonte multo importante r ia area biol6gica.

3. Enganos: pipetagem errada. etiquetas trocadas, picos de

corrente. alteracoes de temperatura, diluicoes inadequadas etc.,

tarnbern contr ibuern para aurnentar a dispersao dos dados. Eles podern

ser sisternaticos, sernpre se repetirern e alterar consistentemente os

resultados - b ia se d m e a su r em e nt s, podendo ser devicJos a descalibragern

de instrurnentos de medida. bugs em programas de co rnputa do r - lima

formula errada. por exernplo etc.

Todos os tres tipos sao charnados de enos, mas a Estatfstica s6

consegue lidar corn os dois prirneiros.

80

ENTENDENDO 0 PODER DO ESTUDO

Ele esta relacionado corn a capacidade clo estuclo em detectar

rli l( 'r('n\,<1s. Por exernplo, urn deterrninado estudo pode ser poderoso 0

' .Ii1icicnte para encontrar uma diferenca de 30%, m<1Snao ser capaz de

d( 'll 'C[;H urna de 20%.

o poder do estudo e calculado atraves da seguinte formula:

Poder do estudo = 1 - Erro ~

T arn bern e charnado "poder do teste", sendo usado par<1plane-

i.tr () tarnanho da arnostra e tarnbern e util ao interpretar urn experi-

111('1110 ern que <1diferenca encontrada nao foi estatisticarnente

',ignificante.

Poder do estudo e a probabilidade de corretamente rejeitar

lima hip6tese nula falsa, isto e, dar'o que realrnente exista urna dife-

1('11(;;1, qual a.probabilidade de efetivarnente encontra-la.

Quando nurn experimento a diferenca encontrada nao resultou

('~l. ll istic<1rnente significante, e interessante calcular que poder tern 0

(", ll lelO realizado par<1detecta-la. Quante maim a dispersao clos dados

( ' menor 0 tamanho das amostras, rnenor sera 0 poder do estuclo

Io.ilizado.

81

 

r

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 41/79

EVITANDO ERROS

'I, Uti lize arnostras de tarnanho adequado evitando aspeque-

nas, Para fins praticos pode-se considerar:

Arnostras grandes: n > 100

Amostras medias: n > 30

Amostras pequenas: n < 30

Arnostras multo pequenas: n < 12

2. Evite dernasiadas co rnpar acoes e subgrupos. Quando sao feitas

multiplas cornparacoes e se aceita 5% de erro ern cada urna delas, a

chance de se encontrar urna diferenca por mero acaso aurnenta

exponencialmente, por exernplo, seforern cornparadas 4 medias, duas

a duas, estarao sendo realizadas 6 cornparacoes e a chance de encontrar

uma diferenca por rnero acaso sera de 6 X 5% ou seja de 30%. Ver

f igura 23.

82

F ig u ra 2 3 . Aument o e x po nenc la l d o n um e r o d e cor npa ra co es q uando sao compar acas

var ia s m ed ia s e n tr e s i.

50N um er'o de

c om p ar a, ;;6 e s •.. ,•. ./40

30•

. . . . . . . . . . . . .

•• . . . . .-. .".• . . . .- .. -• . .- . ' - -

. - - - _ ., : : : : = : . r - - + - - + t----t-t---I

2 3 4 5 6 7 8 9 10

20

10

r " , J IJm e ro de m ad ias co r npa rad as

3. Obtenha dados com a menor dispersao possivel.

83

 

,~(' tl., n",IIIt.ltI() ...0 1 , I itl()" 1 '111 illfillit.l', ~l'lit,,,, <it' IdIH.,dIlH'l1los,

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 42/79

D ISTR IB UIC ;;6ES D E F REQUENCIA S

E rnuito importante cornpreender 0 que e probabilidade de

urn evento e como uma serie de eventos forma L1IllCl distr ibuicao de

frequencias,U rna m oeda , a pes ser jogada para cim a, p odera ca ir COIll a face

cara ou (1 face coroa exposta. Urn evento elernentar nesse experirnen-

to, sera cair cara e outro, cair coroa. Dado que a moeda e honesta, a

pro ba bilida de da ocorrencia de cada evento e igual, is to e. 50%.

Suponha urn experimento que cons ista em lancar uma rnoeda

200 vezes parCl verificar a porcentagern de earns OLi coroas que sera

obtida e considere que se repitarn infinitas series de 200 lancamentos.

COIllO 0 numero 200 e grande, na maioria dos resultados ocorrera cer-

C C I de 50% parCl cada evento, entretanto, resultados pouco esperados

tarnbern ocorrerao. ernbora menos frequenternente.

T ab e la 1 0 . F r eq u en cia d os e ve n to s " ca ra " e " co ro a" p or s er ie d e la nc ar ne n to s

S e r le d e la n ca rn e n to s % "caras" % "coroas"

49 51

2 5 1 49

3 48 52

4 5 0 50

5 50 50

6 47 53

60 .009 8 92

888.00 0 73 27

1.000.099 5 95

84

tOil It ) I'tli ('x('lllpltl .I frt'qi"liil1tid <iI' (drdS <i(' (d<id s('ril', ftlrt'l1l insor idos

Illlill gr,ililO til' tlislriIJllit.;.\o dl' frc'qCI('llci(lS (figur(l 24), SCI-,1bticla uma

rurv.: (;.IIISsitllltl COIll Illl'ditl de 50%.

Figura 2 4, D en sid ad e d e p ro ba bilid ad e p ar a 0 e v e n t o " ca r as "

....----- % d e c ar as ..~

A figura 24 e a representacao grafica da distribuicao das fre-

q ue nc ia s d a p ro b a bi li da d e, para 0 evento caras, de uma p op ula ca o in-

teira e infinita. Ela nao e urn histograma porque a populacao e infinita.

Embora asdistribuicoes de probabilidade sejarn sirnilares aos histograrnas,

os eixos y sao diferentes, pois nao podern mostrar 0 numero total de

observacoes por categorias, como ocorre num histograma. A probabili -

dade e representada pela a rm sob a curva (a area total sob <1 curva

rcpresenta 100% da populacao) eo eixo y e charnado de densidade de

probabilidade.

Tarnbern aqui os conceitos ja cliscuticlos de media e desvio-padrao

seapl icam e pode-se dizer que seforem considerados 1,96 DP para cada

lado da media, estara delimitando-se uma area que engloba 95% da po-

pulacao, conforrne rnostra a f igura 25.

85

 

¥if·'

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 43/79

86

F ig u ra 2 5 . M e dia . desvo-pauao e d en sid a oe d e

M e d i a

D

en

si

d

a

d

e

I-I

Figura 2 6 . 0 v alo r d o t e st e e sta tis tic o p ar a c ad a a m os tr a

E NTEN DE NDO O S TE STES D E SIG NIF IC AN CIA

Considere urna p op ul ac a o h or no ge ne a cia qual foram extraidas

I ll finit;1s arnostras cle urn deterrninado tarnanho. Foi escolhiclo urn teste

I',>lcllistico e calculado 0 seu valor (VTE

) para cada arnostra (figura 26).

I--------iI !

I

00

. . .

Assirn como ocorreu com 0 experimento do lancamento das

moedas, ocorrerao VTEmais frequentes, outros menos frequentes e ainda

«utros escassos, A curva representativa da distr ibuicao destes VTE

tam-

1 ) ( - ' 1 1 1 e Caussiana e aqui tarnbem se aplicam os conceitos de media e

.k-svio-padrao : em 95% das vezes 0 VTE

calculado para uma arnostra

qualquer estara entre -1,96 DP para cada lado do VTE

medic, em 2,5%

87

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 44/79

F ig u ra 2 7 . Valor do teste estat is t ico , dosvio·pndr l' lo

e dens idade de p robab i li dade. . . . . . . . . _ ...- _ • ....... . . . . _ " .

VT Er n edo

cbs vezes estara na extremidade direita e em 2,5% das vezes na extre-

midade esquerda da curva, conforrne a figura 27.

Quando se obtern 0VTE

para urna determinada amostra. 0 valor

obtido situa-se em algurn ponto da curva, que podera ou nao estar

contido na area representativa dos 95% (figura 28).

D

en

si

d

ad

e

·1,96DP +1.96DP

88

Va lo r do t est e es ta tf st ic o

F ig ur a 2 8. S itu ac ao do v alor c alc ula do : e sta in clu ido n os 9 5% o u n ao ?

p.s:O,05

i

! , : o : o d ; ps:O,025.........~ . .

(95%)

-1,96 DP

I t+1,96 DP

.. . . . ..I

o v alo r o btid o situ a- se e n tr e o s 9 5% r na is pr ov av eis?

DISTRIBUI~Ao t ( STUDENT )

Parece razoavel que, quando nao se conhece 0 desvio-padrao

dd populacao, ele possa ser substi tufdo pelo desvio-padrao cia arnos t ra .

Mas quando se trata especialrnente de arnostras pequenas, isso nao e

l ima boa ideia.

Sabedor das cli ficuldades que os pesquisadores tern para obter

.unostras grandes, 0 quimico William Sealy Cosset (1876-1936) desen-

volveu a "estatfstica til e a publicou sob 0 pseudonirno de Student. Para

ontende-la, considere 0 seguinte: se for uti lizado 0 desvio-padrao cia

.unostra no calculo de urn escore Z populacional, estara introduzinclo-

s(' incerteza ao resul tado, isto porque se0 desvio-padrao da arnostra for

menor que 0 da populacao, 0 escore Z resultante sera multo grande e

vice-versa. Assirn, quando nao se conhece 0 desvio-padrao da popula-< . < 1 0 , mas sim uma esti rnativa do mesrno com base 1 1 0 desvio-padrao da

.imostra, a distribuicao de escores Z ja nao sera mais normal e seguira

1 1 1 1 1 C 1 distribuicao conhecida como "distribuicao til, cuja forma lernbra CI

da distribuicao normal, porern com mais area IlCiS caudas.

Essadistribuicao t possui como caracteristicas: ser continua e

sirnetrica. ter media igual a 0, variacao de + 00 a - 00 e desvio-padrao

variavel com 0 tarnanho cia arnostra (n). Nao existe urna (mica distribui-

89

 • $ ,! j; P; ; i a

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 45/79

(,.Ill I , 111.t S sim lim grllpo p.I r. t c .td. t t.unanho <ll' .1111()slr.l 1'.\1'.1(' 11111.1

d istri bu i<,;2ioe luna curva especffic:a, conforrne figllrCl 2(),

F i gu r a 2 9 , D is tr ib u ic ao d e t x g ra u s d e l ib e r da de(._ .. -- _ ..__ .._----i - - - - - - - - - - - - - - - 1

i

n g r au s d e l ib e r da de I

oen

si

dade 4 g ra u s d e l ib e r da de

. . I-4 o I 1

Va lo r e s d e t

A estatistica tea adequada para pequenas amostras (n<30),

embora possa ser usada em arnostras maiores. Para seu calculo util iza-

se a seguinte formula:

x - Jl x-Jlt=

EPM s(x)--

Vn

Observar a sernelhanca com 0 escore z: em unidades de Erro

Padrao da Media, quanto a media de uma particular arnostra se afasta

da media (verdadeira) da populacao.

90

ENTENDENDO 0 TESTE t

I'

1II :I

I,jJ

Esseteste 56 e apl icado para dados do t ipo continuo e corn distr i-

hllic;:aoCaussiana. E , provavelrnente, 0 rnais usado para comparar duas

.unostras, duas colunas de dados entre si; rnesmo quando e aplicado a

lima unica arnostra , uma coluna de dados, ele compara a media da mes-

111.1com urna media hipotet ica te6r ica, extraida da l iteratura ou de outro

oxperirnento da populacao.

o teste t, conforrne citado, pode ser aplicado para verificar se

IIl11aunica arnostra provern ou nao de urna populacao cuja media e

«onhec ida: por exernplo, para testar se 0 tempo de coagulacao medic

obtido ern uma arnostra de criancas prernaturas difere ou nao do valor

padrao referido pela literatura.

o teste t para duas amostras independentes e basicarnente 0

IIlCSl1l0, mas incorpora inforrnacoes concernentes a variabilidade cbs

me di as d as d ua s a rn os tr as te st ad as .

o exernplo a seguir rnostra 0 teste aplicado para comparar duas

.unostras: urn pesquisador, testando uma nova droga. quis verif icar seela

( 'ra rnelhor para tratar cletenninacla doenca que 0 tratamento classico

vigente. Para tanto, mediu os tempos de recuperacao ern dois grupos, A

(. 11,obtendo os resultados apresentados na tabela 1".

91

 

T ab e la 1 1. T e m po d o r ec up er ac ao x trnlarnunlo () tll'llollill,lliUI' Ii"..., ,'lItilll.1 Irol(,oIo (')(l>lill1l' (I '1 "(' ~ ('

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 46/79

T e m po s d e r e cu pe r ac ao (d ia s)

T ratam en to classlco (A) Tratam en to n ovo (8 )

10 6

8 7

14 6

12 8

15 7

9 9

8 6

A prirneira vista, 0 novo tratarnento parece reduzir 0 tempo de

recuperacao. entretanto, para que haja certeza quanto a esta conclu-

sao, deve-se aplicar 0 teste t considerando a hip6tese HIIde que nao ha

diferenca entre os dois grupos.

o teste t usa a diferenca entre as medias clos dois grupos e 0

erro padrao das diferencas das medias entre os dois grupos e a seguinte

formula e usada para seu calculo:

onde EP(erro padrao) combina os desvios-padrao dos grupos e 0 nurne-

ro de dados (n) ern cada grupo. Nao e necessario dispor dos dados bru-

tos para seu calculo, podendo ser feito corn base na s medias, desvios-

padrao e t amanho de cada grupo. Para obtero valor de t e po~sivel f aze r

calculos manuals usando asformulas a seguir ou urn software estatistico.

[2 :: x/ - < Lx y/n ) + [2::xb2 - (:~:Xll/nh]

(n, - 1) + (n"- 1)

92

(CIIIV('IH()jHIIl I'holl11.11' < 1 ( , gr,l1l~ d(, li iJ(' ld"d(, (( ; li iJ) d(' (,dd" .unostr.r,

'1"( ' " , , ( 1 . , 1 11 0 1is( , '1 1 11 ' u ma ( 01 '1 1 1" d(' (.t/(·r lII11it correc.io em Iuncao do

t .uu.mho d" .uno str.i (' do numcro de cornbinacoes possiveis.

I'dI'd cakulnr 0 nurnero de graus de liberdade - degre e s o f

11I,(,(/UIII, [)F - er n clifcrentes si tuacoes. proceda da seguinte forma:

Amostra isolada: n -1

Amostras empare lhadas: ruimero de pares -1

Amos t r a s nao empare lhadas: soma dos graus de

liberdade de cada amostra isolada, por exemplo

[(na - 1) + (n,,-l)]

Tabe las de contingencia:

(n" de linhas - 1) x (n° de colunas -1)

Tabela de coeficiente de correlacao ("r"): (n° de pares -2)

Observar que quando se trabalha com pares a unidade e 0 p<lr.

Na analise dos tratamentos A e B citados 0 que se deseja e compa-

1.11'as duas arnostras ( du a s c o lu na s de d ad o s) , a p li ca r 0 teste t parClverificar

.I hip6tese nula de que nao ha diferenca entre elas e, para tanto, deve-se

Ii ro ce de r d a seguinte forma:

• verificar se a distribuicao dos dados e Caussiana:

calcular a estatistica t (to = t observado):

• cornparar 0 to com 0 te( t critico); 0 te pode ser obtido em

uma tabela de valores de t e para tanto, deve-se localizar 0a (nivel de

significancia pretendido) n a r no l du ra superior da ta bela , em se gu id a lo ca -

lilar a lin ha correspondente ao s graus de liberdade pertinente ao estuclo

om questao e ler 0 valor do te no cruzarnento. Se0 valor observado to for

maier que 0 valor critico ( to> t), significa que 0 valor observado esta

. if a st ado a l er n de 1,96 DP da media e que, portanto , tem <5% de chance

de ocorrer por acaso e 95% de chance de nao ocorrer, Ass im, deve-se

rejeitar H o e aceitar a hip6tese alternativa H I ' Se to < te, nao rejeitar H o

ovalor calculado para a estatlstica t no exernplo acima e to = 3,315.

l 'rocurando na tabela 12 0 t critico para urn a de 5% e 12 gl-aus de

lib erd ad e - d ua s a rn ostra s n ao e mp are lh ad as com n= 7 =, obtern-se 0

93

 

vdlorl,. L , 1 7 ( ) , port.mto, inferior .10 obsorvado, COl1dlll'!lc', t llt.1!), ' 1 11 ( ' 1111

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 47/79

dove ser rejei tado, ou se]a. ha uma difercnca cs ta r is t icam onte .,igl1ili(.1111(·

entre os do is tratarnentos.

T a be l a1 2 . E x tr at o d e t ab e la d e v al or e s c rf ti co s d a d is tr ib u ic ao t

V AL OR ES C R iT IC O S D Er ( Pr ob a b il id ad e b ic au d al )

G rau s de lib e rdade p=0 ,250 p=0 ,05 0 p=0 ,0 10 p = O , O O l

2 1 ,60 4 4 ,3 03 9,925

3 1,423 3 ,182 5 ,841

4 1 ,344 2 ,776 4,60 4

5 1,30 1 2 ,5 71 4,032

11 1,214 2 ,201 3 ,10 6

12 1,209 2 ,179 3,05 5

u m te ste m on ocau dal divida os valore s 2

94

31,600

12,924

8,610

6,869

4,437

4,318

ENTENDENDO 0 TESTEDEQUI-QUADRADO

Confonne foi visto, 0 teste t e urn teste de significancia aplicado

p"ril dados continuos. Para comparar dados norninais , e portanto, sern

<iislribui<;:ao normal, urn teste cornumente usado e 0 de Qui-quadrado

Chi- squar e , que constitui uma medida da discrepancia entre as fre-

(ICI('~nciasobservadas e as esperadas,

l .ernbrar que dados norninais sao aqueles separaveis em categori-

.Is, sern nenhuma ordern especial , como sexo, cor dos cabelos etc.

A base do teste e bastante simples, usando-se para 0 seu calcu-

I() tl seguinte expressao:

(observado - esperado)-X 2 = L ------. ., .-:- .- --

esperado

Para aplicar a formula e facil itar 0 raciocinio, 0 prirneiro passo e

construir uma tabela de contingencia contendo os valores observados,

Exemplificando: considere urn estudo em que se deseje anal i-

S.lr a mortalidade por urna determinada doenca apos 0 surgimento de

11111 novo tratarnento, com os resultados expressos na tabela 13.

T ab e la 1 3. E xe m plo d e tab e la de cont inqencia

Sob revivencia Morte Totais

T ra tamento classlco

T ra ta m e nto n ov o

35

70

24

21

59

91

Totais 10 5 45 15 0

95

 

l .cmbrar qllt' ,I hip6tl'S(~ nula ('.1 d( ' tllI(' n.io h.\ < l i l ( " ( " 1 < , , " ("lin'

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 48/79

os dois t r a tarnentos e, assim, para calcu lar 0 valor e sp cr .u lo d cv o-s o

proceder corno segue:

o esperado para sobrevivencia, considerando que os dois t rata-

mentes sao igualrnente eficazes, e urna proporcao de 1 05 ern cada

'ISO cases, portanto, tern-se:

Tratarnento classico: (105/150) x 59 = 41,3

Tratarnento novo: (105/150) x 91 = 63,7

Do mesmo modo. 0 esperado para 0 evento rnorte, consideran-

do a hip6tese Ho de que os dois tratarnentos nao di fe re rn entre si, e

uma proporcao de 4 5 ern cada 1 50 cases, portanto:

Tratarnento classico: (45/150) x 59 = 17,7

Tratarnento novo: (45/150) x 91 = 27,3

Para cada urna das celulas da tabela de cont ingencia. calcula-se

o q ua dra do d a dife re nca entre 0 observado e 0 esperado e divicle-se

pe!o valor esp era do . so rna nd o-se e rn se gu ld a os resultados:

(35 - 41,3)2 (24 -17,7)2 (70- 63 7)2 (21- 27,3)2X

2

= + +' + = 5,280341,3 17,7 63,7 27,3

x : (com correcao de Yates) = 4,475

Observar que, para osresul tados esperados, os

valores obtidos ndo sao

nurner-os inteiros, clem

disso os valores calculados

para p. sem que se fccc

nenhuma correcdo do X 2,

sao muito pequenos

Para contornar essesproblemas,

Yates propos urna correcao del form ula

para ser apl icada quando h<1sornente

uma ou duas categorias envolvidas.

96

(lohsl'rvado-l'slwr,ulol-(),:;)J 'I I, . ... (corn lOln'l.IU ( l' Y.ltV'» J

sperado '

_._-_ .. _ -_ .._----------------------

Ca kul.ulo () va lo r, procurd-se na t.ihel.: dl' distribuic.ro do X J 0

ro rrosponrh-ntc va lor de p ern funcao do s grews d e li bo rd ad e no ('stl'-

du l'm qllest;'to, e para encontrcl-Io utiliz,l-se c1 f6 " l lL r iCl ,d)cIlXO:

[ Gra us de liberdade (Glib )= (n° de linha s - '1) x (n° de co luna s - = - 1 )

No exernplo ern curso, tem-se ducts colunas - sobrevivoncia emorte - e duas linhas - tratarnento classico e novo e, po,'t,lIlto,1 gl-dl!

de liberdade resultante de:

I Glib = (2 - 1) x (2 - 1) = 1 x 1 = 1 I

o valor corrigido (Yates) do X 1 no exem plo ern qucst.io (, de

4 ,475 eo nurnero de graus de liberdade e 1 , que aplicados ,1ta bela 1 4

de distribuicao do X 2 a seguir, revelarn urn valor de p entre 0,0':; e

(),Ol, mostrando que heiuma chance entre I % e 5% de (I L IE ' , IS cliferr-n-

(".IS o bserva da s seja rn devida s a va ria hilida d« d.is ,1In05tr.l5.

T ab e la 1 4 . E x tr at o d e t ab e la d e d is tr ib u ic ao d e Ou i- q ua or ad o.

---------- ... -----.----.----- ._ ._-- -_ -- --

D ISTRI BU1 9A o DE QU I-QUADRADO

G raus de lib e rdade p=O,25 p=O,0 5 p=O,01 p=O,0 01------,,-_ .. ... " ... _ . __ . _ . . . __ . --

1 ,3 23 3 ,841 6 ,33 5 10 ,827

2 2,773 5 ,991 9,210 13 ,815

3 4,108 7 ,815 11 ,3 45 16 ,26 6

4 5 ,3 85 9,488 13 ,277 18 ,46 6~-~~----------

Ao se aplicar 0 teste X l pressupoe-se 0 seguillte:

1- A amostragern foi adequada: 0 suficientemente grande,

escolhida ao acaso e representativa.

2- Os dados provem de urna tabela de contingencia onde os

nurneros s50 aqueles realrnente observados - raw elata, e

nao porcentagens ou taxas, e onde as colunas 550 mutua-

mente exclusivas.

3- Os valores totals 550 superiores a 20 e os valores esperados

sao superiores a 5 ,

97

 

· . A figllr.~ .W Illostrd um.t curv.: e l l ' dislrilJlIi~';'() ! l t t qll i <jl lddrddo

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 49/79

cuja fo rm a vana em Iunca o do nurnero de gra us de liIJI'I'<I.1(I('.

F ig ur a 3 0 . D is tr ib u ig ao d e Q u i- qu ad ra do e g ra us d e lib e rd ad e

_ 0 teste de Qui-quadrado pode ser usado para testar se as pro-

porcoes encontradas no grupo estudado diferem das esperadas teorica-

mente. Vel' exercfcio 15.

98

ENTENDENDO A ESCOLHA DE UM TESTE D E

SIGN IF lcANCIA (OU DE HIP 6TESE OU, AINDA

D E R EGRA S DE D EC IS AO )

A escolha de urn teste de significancia depende de caracterist icas

do s dados coletados como:

t ipo de dados: norninais, ordinals ou continuos;

arnostras isoladas, duas arnostras ou mais de dois grupos;

ernparelharnento ou nao:

arnostras grandes ou pequenas (dados norninais):

distr ibuicao normal ou nao (dados continuos).

A prirneira etapa consiste em determinar 0 tipo de dados

disponivel, pois 0 teste a ser aplicado varia ern fun<:;:aodo mesrno.

A decisao seguinte consiste em deterrninar quantos grupos serao

romparados . Quando se trata de dois grupos de dados. 0 tes te de

significancia deterrnina a probabilidade de eles se originarem, ou nao,

da rnesma populacao, Quando sedeseja comparar mais de dois grupos,

, 'IS vezes 5, 10 ou mais, deve-se usaralguma forma de analise de variancia.

0'ernparelharnento de dados tambern e importante na escolha

do teste de significancia, pois diferentes testes podern ser usados na

dependencia de ele tel' ocorriclo ou nao - matched x u nm atched -

pa ir ed x unpa ir ed .

o tarnanho cia amostra tarnbern e deterrninante cia escolha do

tipo de teste, ass irn como a distribuicao dos valores ao redor da media

(normal ou nao).

99

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 50/79

ENTENDENDO 0 EM PARELH AM ENTO...... to , to .. II ..

Quando se extraem amostras de uma populacao, e desejave]

que a variabil idade entre elas seja minima e e por issoque, as vezes, se

fa z urn ernparelhamento. Elepode ser natural, corno 0 que ocorre entre

gerneos identicos que reduz a variabilidade ao minimo: ser artificial

quando se procura forrnar pares sernelhantes em relacao a urna serie

de ca ra cteristica s, m esm a ida de, rnesmo sexo , m esm a a ltura e peso,

furnantes ou nao etc.. ou ser urn auto-emparelhamento - se lf-pair ing,

onde cada elemento atua como seu proprio controle. Urn born exernplo

eleauto-ernparelharnento seria estudar a farrnacocinetica de uma droga

ern urn grupo de desnutridos e usar como controle 0 rnesrno grupo,apos a recuperacao do estado nutr ic ional.

o emparelhamento e definido pelo

investigador como parte do desenho d a p es qu is a

e, p orta nto , a in da n a fa se de planejarnento. Os seus

maiores beneficios sao: el irninar consideravsl

quantidade de variabilidade e, consequentemente,

poder dirninuir 0 ta ma nho da s arnostras .

Na l inguagem do dia-a-dia, 0 ernparelha-

mento e fre q ue nteme nte referido como

parearnento, pela influencia de como e denorni-

nado em ingles - paired, mas isso nao e correto.

E errado

considerar como

emparelhados dois

grupos somente

porque tem 0

mesmo n

100

No~6ES DE TESTES ESTAT fs TICOS

N;\O-PARAMETRICOS

A rnaioria dos testes de hip6tese vistos anteriorrnente necessita

I i ( ' qlle a distribuicao da populacao da qual as a rn o st ra s f o ra rn extraidas

obedeca a urna serie de requisitos. Ha,

e nt re ta n to , s it ua c o es em que tais requisitos na o

se justificarn e tambern aquelas em que a

distr ibuicao e al tarnente assirnetr ica. Por isso

Os testes nao

pcrcmetri cos

mdependem doos estatfsticos imaginar am testes que

distribui<_;:aodos

dados nos omostros independern das distribuicoes populacionais e

dos p a ram e tr es a s so c ia d o s. que sao charnados

de testes nao-pararnetricos.

Eles podem ser ut il izados como substi tutos abreviados de testes

m.iis cornplicados e tern especial valor no processarnento de da do s na o

( on t i nuos . Quando em duvida. alguns escolhem urn teste pararnetr ico

qu.mdo nao estao seguros de que a distr ibuicao Caussiana foi violada,

(' outros escolhem testes nao-parametricos porque nao estao seguros

d( ' que a distribuicao Gaussiana foi encontrada.

Os testes nao pararnetr ico s tern menos poder que os

p.irarnetricos para encontrar diferencas na populacao. pois eles deixarn

Ii(' ut il izar algumas das inforrnacoes disponfveis ao converter numeros

.mpostos - ranks, ou diferencas entre nurneros em sinais positivos e

IH'gativos simplesrnente.

. !

I

I I

101

 

1 . , . , 1 ' 1 t ' ~ I I ' ('olHlllllli um.t , 1 1 1 1 '1 1 1 , 1 1 i v ,1 1l,'I(),p.trdlll('lri(d (IIH'IHIS

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 51/79

TE STES ES TA TfsTIC O S PARA DADOS NOM IN AIS. • '" . '" . '" • '" . 1 . , . , . . . '" . , " •

Quatro testes sao usados para analisar dad os norninais, cada

urn deles com a sua apl icacao especif ica:

teste do sinal - S ig n T es t

teste de McNemar

teste exato de Fisher

teste de Qu i-q uad rado

Uma sugestao para escolha do teste a ser aplicado esta apresentada

no diagrama da figura 31; 0 pri rnei ro passo para a escolha consiste em

verif icar seos dados estao ernparelhados ou nao. Tratando-se de amostras

ernparelhadas, 0 teste a ser escolhido depende do tarnanho da arnost ra.

Se n < 25, pode ser usado 0 teste do sinal e se n ~ 25, a escolha deve

cair no teste de McNemar.

o teste do sinal recebe este nome porque a diferenca em cada

par selecionado e convertida nos sinais de +, de - ou 0 (quando nao

houver diferenca), nao importando a magnitude da diferenca. Se a

hip6tese nula e verdadeira, espera-se encontrar urna ocorrencia de n/2

sinais positivos (+) e n/2 sinais negativos H; 0 problema passa a ser,

portanto, testar a hip6tese de que a proporcao de vezes (p') em que

aparece 0 sinal de + ou de - seja igual a 0,5; valendo-se disso, e posslvelgerar urn escore Z, utilizando a formula abaixo:

/ Z = 2 (p'- O,5)Vn /,

onde n e 0 nurnero de pares ern que houve diferenca e p' e a frequencia

de sinais positivos (+) ou negativos H.

102

jl(Jti('IOSd) do I('sll' t 1 ' , 1 1 ' , 1 ,1I11()SlrolS ('Illj>.trl'lhiHI.ls.

1xcmplif lc.mdu: l'()llsidl'rl' UI11.1 silll'l(,/io em quc se deseje

1",((lllll'r «ntro dois uqulpamentos de laboratorio. A e B, capazes de

I("tli/.ll' 1 L aruilises difcrentes - tarefas, e que a rapidez de execucao

" ( ' 1 . 1 lim ponte a ser considerado. Com a finalidade de verificar se os

1'<jllip.lIllentos diferiarn entre si contou-se 0 numero de vezes que cada

I.II'I,f.I podia ser executada num determinado espaco de tempo por

( .ul.: 1 1 m deles. Os resul tados obtidos estao apresentados na tabela 15.

T ab e la 1 5 . R e su lta do s o btid os p elo s e q uip am e n to s A e B .

Tarefa N 2de e xe cu coe s (A ) N 2 de execucoes (B) Dife re nyas (A-B)

1 4 0 2 9 +

2 2 2 1 6 +

3 2 2 2 9

4 4 5 4 1 +

5 6 8 6 1 +

6 3 3 2 4 +

7 4 8 5 4

8 7 5 6 8 +

9 4 1 3 6 +

1 0 4 4 3 6 +

1 1 4 7 4 2 +

1 2 3 1 2 5 +

Observa-se que 0 sinal das diferencas s6 e negativo para astarefas

Ie 7, portanto a frequencia de sinais negativos e p'= 2/12 =1/6. Aplicando-

~(' a formula para calcular Z, tem-se: Z = 2 (1/6 - 1/2) m = -2,28. 0

valor crit ico de Z para urn alta de 5% e 1,96 (bicaudal) , logo pode-se dizer

que osequipamentos A e B diferern entre siquanta a velocidade para urn

nivel de significancia de 5%.

Observa-se que sornente 0 sinal da diferenca e considerado, 0

t .imanho nao.

o teste do sinal tambern pede ser aplicado para arnostras nao-

emparelhadas.

103

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 52/79

)e i 0 teste de McNemar, uma l11odificilc.,:;jodo 1 1 ', 1 1' I I I' (~lIi-qlltl-

drado, foi criado para acornodar arnostras ernparelh.ul.is.

Usualmente, os dados nominais provern de estucios em que ,IS

arnostras nao sao ernparelhadas. Dois testes calcularn 0 valor de p, tes-

tando a hip6tese nula de que as frequencias encontradas sao iguais: 0

teste exato de Fisher e 0 de Qui-quadrado. A opcao por um deles de-

pende da amostra ser pequena ou grande (arnostra pequena e aquela

que possui algum valor esperado inferior a 5).

o teste de Fisher e usado para asarnostras pequenas e produz

menos erros tipo I e II em relacao ao teste do Qui-quadrado. Ele calcu-

la a probabilidade de que a tabela de contingencia usada tenha sido

obtida por acaso e, para tanto, sem mudar os totals das colunas e li-

nhas, ele const r6i todas as tabelas possiveis. Os softwares estatisticos,

na sua rnaior ia sao capazes de apl ica- lo.

Figura 3 1. R ot eir o p ar a e sc olh a d o t es te p ar a d ad os n om in ai s

D A D O S

N O M I N A I S

T E S T E

D O S IN A L

T E S T E

D E F IS H E R

T ES TE D E

Q U I - Q U A D R A D O

T ES T E D E

M c N E M A R

--_-----------------------_

104

TESTES ESTATfsTICOS NAo -PARAMETRICOS

PARA DADOS ORDINAlS. " " . ; p . . . . . . . . . ~ . . " i . . " '"

Conforme discutido anteriorrnente nao sedeve calcular medias

I' multo rnenos cornpara-Ias quando se trata de dados ordinals e por

I',SO, para analisa-Io s. frequentemente sao usad os testes n50

p.rrametricos, dentre os quais os mais comumente aplicados 550:

W ilco xo n S igne d R ani< S um T est

M ann-W hitney U Test

F rie dm an T est

K r u si< a l-Wa ll is T e s t

Para selecionar 0 teste mais adequado, algumas caractertst icas

dos dados devern ser observadas:

numero de grupos: dois OLI mais

emparelhamento: presente ou ausente

A figura 32 apresenta sugest6es para a escolha de testes, baseada

n.is caracteristicas citadas,

105

 

( ) lI'slt' n.\o·p.H,"l1l\1 rim Wlkuxo l l S ig l ll 'd R a n k Sum dl'~1illd-!-.l' d

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 53/79

(j)

'r oc

E0(j)

0-0CO-0

~COo_

(f)

2 «j)

Z2 00-0 a:c o 0

.._

s: (f)

(5 0u

~j)

Q)

~ 0

c oo_

e

~a:NM

ctl

~C

u : : :

106

------------_ _ _ -- -------_"_"_"_---

80«

r--05

' < 1 : : Wza:

c t(f)

: : 2 :

0W

0. . .::J

f-a:C)

C\J (f)1\

00< 1 : :J:

'--_.J

Wa:

c t: : 2 :W

(f)

0

f :2oJ:

- ' < 1 : : _.JZWa:

c t: : 2 :

(f) W

00. . .::J -a:C)

(f)C\J

8«I

- - - _J

W

a:c t: : 2 :W

>-W

Zf-

~Z

~: : 2 :

1111111'.11'.11 dois Hnlpo~ ('ll1p.II'('lh.ul()s. Ill' (, us.ido ox.u.uncnt« na 1ll('SI1l,1

',lllld(,'.lo 1 1 " (' ( ) It'sl<~ I I'dI'd . un o st r.i s om pa rc lh ad .rs . D et al he s d ev er n ser

tll'iX,Hlos pclrcl 0 computador, mas St '0 leiter quiser Iazer ascontas:

1 - Para carla par, calcular a diferenca entre os valores: urn

dl'n{'scilllo gerara urn nurnero negativo e urn acrescimo, urn positivo.

2 - Ignorar 0 sinal ternporariamente e classificar (atribuir postos)

II', v.ilo res a bso lutes da s diferencas (a menor di ferenca recebe 0 postoI) S(' nf io existi r diferenca, considerar igual a O.

3 - Sornar todos os postos das diferencas positivas e das

11I'g.ltivas obtendo-se somas charnadas de T .

4 - Mediante tabela apropriada, encontrar os valores de p

I I i rrespondentes aos valores dos T obtidos, considerando como n 0

11I'1I11eroe pares em que houve diferenca, excluindo aqueles ern que

.Idiferenca e O.Se os dois valores estiverern bastante afastados, 0 valor

til' p sera pequeno. Algumas tabelas usam apenas 0 menor valor de T .

I !

Exemplificando: considere 0 estudo de urn farrnaco, em que os

usuarios do mesrno parecern ter 0 nurnero de certo tipo de celula

'"lIlgCifnea alterado durante 0 seu uso e que setenha obtido os resul tados

.Iiiresenta do s na tabela 1 6 :

T ab e la 1 6 . C o n ta ge m d e c elu la s n os d o is g ru p os

C on tag em do n um e ro de ce lu las

Placeb o(g rupo con trole ) Droga

1.162 890

1.095 800

1.420 1,104

1.36 1 1.00 2

1.101 1,101

999 858

1.333 988

1,235 87 5

107

 

C.dcul,IIHIO-SI' <IS difl,rt'IH:"S (' ll"SSili(.1I1t1" ,,~ «()llIo",lt' 1111t,di"I"'ll1'I1II' o,'ljll'rlor ( I , ' . .. ...1 '" pm di.1I11(' (WI' 1.11) ( ,1 , ,111) , illll('I)('I1-

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 54/79

expl icado aci rna tern-se:

T ab e la 1 7. R e su lta do p ar a g ru po -c on tr ole , g ru po d e e stu do e c alc uio s

~~-.~...

Controle Droga Dife re nca Dlte re nca classificada

1.162 89 0 -272 -2

1.095 80 0 -295 -3

1.420 1.104 -316 -4

1.361 1.002 -35 9 -6

1.101 1.101 0

999 858 -141 - 1 (a m e n or )1.333 988 -345 -5

1.235 875 -36 0 -7 (a m aior )

1.000 1.000 0

No exernplo, as diferencas forarn todas negativas ou nulas

conforme tabela 17; a soma dos postos, rank, das diferencas negativas

e (-28) (T = 28) e a soma das classificacoes das diferencas positivas e

zero ja que nao houve nenhurna. Deve-se procurar na tabela adequada

o valor de p para 0 T calculado. considerando que n = (9 - 2) = 7

(forarn exclufdos os dois pares em que nao houve di ferenca). Verif icada

a tabela, obtern-se um valor de p=O,018 (bicaudal) considerado

signi ficativo, ou seja. a droga provavelrnente altera a contagern da celula

sangulnea estudada.

o teste U de Mann-Whitney tarnbern conhecido como teste

de Wilcoxon Rank Sum - nao confundir com Signed Rank Sum citaclo

anteriorrnente - constitui a alternativa rnais cornurnente usada pClrCl0

teste t para arnost ras independentes. Nele, todos os calculos tambern

sao feitos com postos - ranks e nao com os valores reais.

Para entende-lo, considere 0 seguinte experimento: aferiu-se as

press6es arter ials de dois grupos de estudantes A e B, respectivamente, e

obteve-se os resultados expressos na tabela 18. Nao foi feito nenhum

emparelharnento, os resul tados dos dois grupos podern ser orderiados

de qualquer rnaneira e 0 que se deseja saber e se ha diferenca

estatisticamente signif icante entre as medianas dos grupos A e B.

A primeira etapa do teste U consiste em classificar os dados

atr ibuindo postos aos mesmos, 0 valor 1 para 0 rnais baixo, 2 pal'a 0

108

<1('1111'1111'1111' tlo gnlJlo " <Jilt ' JlI 'rll '11I,' ,lI11.

<)1l.IIHlo h.I ('lllJl"ll'S (valores igU,lis) , atribui-se ,lOS valores empa-

t.ulos 11111p os to ig ll ,, 1 ,'I m('did < l os po st os que se r iam ocupados se na o

iI()lIVI'SSl' cmpatc,

T ab e la 1 8 . R e su lta do d as p re ss 6e s p ar a o s g ru po s A e B e r e sp ec tiv os p os to s

Pressoe s do grupo A 110 90 10 0 85 95

P os to s d eA 5,5 2 4 1 3Pressoe s do gru po B 110 150 125 120 115

Postos de B 5,5 10 9 8 7

Na etapa seguinte SOmClI11-Ses postos dos dois grupos e assirn

t .-m-se:

Grupo A: (5,5 + 2 + 4 + 1 + 3) = 15,5

Grupo B: (5,5 + 10 + 9 + 8 + 7) = 39,5

Para testar a diferenca entre ClSsomas dos postos, calcula-se a

«srat fstica U para ambos os grupos uti lizando as seguintes formulas:

n1(n

1+ 1)

U1 = n1n2 + 2 - R l e

onde n = tamanho da arnostra menor; n, = tarnanho da arnostra maier,1 _

( ' R 1e

R 2 =soma dos postosem cada grupo.

Charna-se de U observado (Uo) 0 rnenor dos valores obtidos

para U1e U

2, 0 qual deve ser cornparado com 0 U crftico (U) obtido

em tabela especifica (tabela 19), considerando os valores de nil de alta

(' se 0 teste e uni ou bicaudal.

109

,

I'I:

II !

I I I !  ~-.,', .f P4i t. *w" ","

T ab e l a 1 9 . E x l r a l o d e l a be la d e U p ar a a p ro v a d e M a n n ·W h ll n tl y

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 55/79

P ro ba b iJ id ad es a s so c ia d as a o U d e M a nn -W h i t n ey p ar a n2I: 5

R e fe r e- se a u m a h ip 6 te se a lt er n at iv a u n ic au da l. D ob r ar a s p ro b ab il id ad e s S9 a _~ I~ ? t ese f o r b . i: ~ ~ ~a~ .

n1 =:> 2 3 4 5

U J J

°0 ,16 7 0 ,047 0,018 0,008 0 , 0 0 4

1 0,333 0,095 0,036 0,016 0 , 0 0 8

2 0 ,5 00 0 ,190 0 ,071 0 ,0 32 0 ,016

3 0 ,6 67 0,286 0,125 0 ,0 56 0 ,028

4 0 ,429 0 ,196 0 ,0 95 0 ,048

5 0 ,571 0 ,286 0,143 0,Q75

6 0,393 0 ,206 0 ,111

7 0,500 0 ,278 0 ,15 5

8 0 ,274 0,607 0 ,3 65 0 ,210

R e gr a d e decisao p ar a n2-, 8 : r e je i t ar H o q ua nd o a p ro b a bi J id a d e p a r a U

o< a l f a

Existem varias tabelas de U , cujo aspecto varia bastante em funcao

de n2ser menor que 8, estar entre 9 e 20 ou ser maior que 20, variando

tambem a regra de decisao.

Fazendo-se os calculos para0

exemplo em curso tern-se:

5(5+1)- 15,5 = 24,5, = (5x5) +

2

e

5(5+1)- 39,5 = 0,5

2= (5x5) +

2

Considerando-se que a hip6tese alternat iva seja monocaudal,

isto e. H, = a mediana das press6es do grupo B e maier que a mediana

das press6es do grupo A, e consultando-se a tabela 18, observa-se que

a probabi lidade para Uo = 0,5 situa-se entre 0,004 e 0,008 e, portanto,

rnenor que 0,05. Concluindo-se, entao. que sedeve rejeitar Ho e que a

mediana das press6es do grupo B e estatisticamente maior que a

mediana das press6es do grupo A.

110

T E S T E S E S T A T f s T IC O S P A R A D A O O S C O N T IN U O S

No campo da Medicina, lidar com daclos continuos constitui

siIUi1(,;aOomumente encontrada. Os testes de significancia aqui aplicados

t.unbem tern indicacoes espedficas apresentadas na Figura33. Ver pagina

s('guinte_

Se os dados tern uma distribuicao normal, 0 passo a seguir e

verificar se existe ou nao emparelhamento, para determinar 0 tipo do

teste t a ser aplicado. 0 teste para dados nao-ernparelhados Lisa a

dilerenca das medias das arnostras. enquanto que 0 teste t para daclos

ornparelhados usa a media das diferencas encontraclas em cada par eo

( 'ITO padrao das diferencas, conforme a seguinte formula:

~,

~

oncle d e a media das diferencas encontraclas em cada par e EPd,e 0

crro padrao das diferencas, calculado por meio da formula:

\~

\j~E P =

d

{11

onde d representa a diferenca individual de cada par.

Quando a distribuicao dos dados nao e normal (eles nao obede-

cern a urna curva de Gauss) as vezes e possivel fazer uma transformacao

aproxirnada dos mesmos para encaixa-los nurna distribuicao Caussiana.

Se isso nao for posslvel , necessi ta-se de testes nao-pararnet ricos para

analisa-los. A Figura 33 traz sugest6es para a escolha, considerando a

111

 

existencia de ernparelharnento ou nao.Nern scmpre urn d(' [( 'rmil ld<i( )ld<i( ) ( ' ( ', rwsli l s ituacao que entrarn as transformacoes dos resul tados

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 56/79

conjunto de dados satisfaz asexigencias - distr ibuicao normal, por (,X(,I11-

plo, para que urn determinado procedimento estatistico possa ser .ipli-

112

~(/) >-0 w0 z« I -

O I I1« -I- SW

0:: Z :cE. z

0 ~ «0 w ~

~ o f E ~(/)I«'Ww z ~I - « .----::

0-1 « (/)

1« « 0..0 : 0 . : : :

O~ 0 ZZ-0::650

« 0«I x 0::

C i : z . . . . J 00W r--1-0 0:: 0::

O w(/)'« « cE.

: : : : : ! zOZ ~ sQ

0:: ~ (/)

0 WLL -/)

.--- Z«

r--- 0::(/)

I -

0: : : : >

Ico

'i= 0Z 0..

-0 : : : : >

00::

~

(/)0 (/)

0C\J 0

0 0

« « W0 ____J O I I -

1« . . . . J- (/) -L--

ZW W0:: l-

cE.~W

01«0-1-«

-

: : : > ~

!f!o::0::0I - z(/)

0 (/)

0 00

0

« -«I w I. . . . J

I--I - . . . . J

W (/)W0:: w O : :

s : 1-cE.

~ ~W W

pdrd um.: csca!a diferente de medida, tentando, ao transforrna-los, cum-

prir os pre-requisrtos para aplicacao do procedirnento ern questao. A

('scolh<l rnais COIllUIll e a transforrnacao logaritmica, mas outras corno

roclproco, raiz quadrada etc., tambern podern ser tentaelas.

Quando urna t ransformacao logaritmica e aplicada. cada

resultado e substituldo pelo seu logarit rno; natural rnente e la 56 pode

ser aplicada para converter nurneros posit ivos, visto que logaritmo de

nurneros negativos nao existe. Ela tern 0 efeito ele "esticar" a parte

infer ior da escala or igina l e de cornprimir a parte super ior . Numa escala

logaritrnica a distancia entre '1e 10 e a rnesma que entre 10 e 100 e

entre 100 e 1.000, ela e sernpre de 10 vezes. A transforrnacao logaritrnica

tende a norrna lizar d is tr ibu icoes desviadas a di re ita. nao 56 rernovendo

o desvio como reduzindo a diferenca entre desvios-padrao. Logaritmos

ern qualquer base poclern ser usados. mas a base 10 e 0 logaritmo

natural sao os mais usados.

113

  ' 2 § ! j i ! 4 i ;;; j

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 57/79

Noc;6ES DE ANALISE DE VARIANCIA

Ate agora foram discutidas maneiras de cornparar dois grupos

de pacientes ou duas amos t ra s , Ha ocasioes, entretanto, em que e

necessario com parar tres ou rnais arnostras ou variaveis. Emrnuitos desses

casos, sera necessario usar urna analise de variancia cornurnente referida

como ANOVA. A Figura 34 prove urn roteiro para escolha do teste mais

indicado para cada situacao:

o teste de Kruskal-Wallis e uma alternativa p;1raa analise de

variancia one-way, conforme explicada a seguir. Ele e cornputado

exatarnente como 0Teste de Mann-Whitey, com a excecao de envolver

rnais grupos.

F i g u r a 3 4 . Rot e ir o par a e s co lha d e t e st e par a dados

con t in uo s em ma is d e doi s g rupos

D A D O S C O N T IN U O S

> 2 G R U P O S

j

E M P A R E L H A D O SN A O

E M P A R E L H A D O S

I

F R I E D M A N K R U S K A L · W A L L I S

2 ·W A Y A N O V A 1 ·W A Y A N O V A

114

ANOVA EA ESTATfsTICAF

Quando dados de varies grupos estao senclo cornbinados. a

variancia tern dois componentes. Se os grupos tern medias diferentes,

alguma variacao provem das diferencas entre asmedias dos grupos, eo

restante da variacao provern das diferencas no interior de cada grupo.

Para entender bern 0 que significa ANOVA e a estatistica F,

considere urn exernplo em que sedeseje testar quatro drogas diferentes

ao rnesrno tempo. Suponha, por exemplo, que se trate de quatro

diureticos, A, B, C e D, e que se deseje avaliar 0 efeito de cada urn por

rneio da rnedida do debito urinario, cada urn deles aplicado a urn grupo

di ferente de 16 voluntaries.

o problema esta em reconhecer se algum, ou alguns, desses

grupos sao slgnificativamente diferentes uns dos outros: se algum dos

diureticos testados tern urn efeito diuretico mais potente que os dernais.

Poderiarn ser cornpa rados osgrupos, dois a dois, por rneio de seistestes

t separados, 0 que poderia revelar urna diferenca significante entre

quaisquer duas drogas. Porern, proceder desse modo seria perda de

tempo e, alem disso, como seestariarn fazendo multiplas analises. poder-

se-ia estar incorrendo num erro tipo I, pois ao aceitar 5% de erro em

cada urna das 6 analises separadas. haveria uma chance de 30% (6 X

5%) de encontrar, pOI' rnero acaso, urna diferenca estatisticamente

significante (ver Procedimento de Bonferroni no glossario).

o uso da analise de variancia (ANOVA - Analysis of Variance)

indicara a probabilidade de que a hip6tese nula seja verdadeira, ou

seja, a probabil idade de que nenhuma diferenca existe entre quaisquer

dos grupos. Se a hip6tese H o for rejei tada, sera 0 indicio de que hA

diferenca de potencia em algum dos diureticos testados. Para localizar

o diuretico envolvido, sera necessario um teste ANOVA de comparacao

de pares.

,I

II

III

II·II15

 

()s ll'sll's AN()vA Sf' apoiam 11<1ipotcse dl' <illl' ()~ grupos S,'W

- -qlll~llt() m.iior for" l 's ldl fslicl F (r,l/,\o F), m.iior scr.i d v.lri,l(.'-;iu

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 58/79

sumelhantes, a variancia em cada urn (dentro) dos grupos e similar aquela

entre os grupos; 0que eles fazern e comparar a variabilidade das medias

de todas as arnostras com a variabilidade dentro cbs arnostras: os

conceitos de uni e bicaudal, obviarnente nao se aplicarn. pois 0 valor

de p, nesse caso, teria rnuitas caudas,

F ig u ra 2 5 . V ar ia b ili da de i nt er e i nt ra gr u po s

Va r iab il idade e n t re

Va ri ab i li dade i n tr a

Para curnprir essa analise, 0 teste precisa deterrninar a varia-

bilidade dentro de cada amostra. bern como a variabilidade que existe

entre medias das arnost ras. Quando isso e feito, e geracla urna estatfsti -«1 charnada F cuja formula e a seguinte:

Varianciada populacao estimada a partir das medias das amostrasF=~~~~--~--------~-------------------

Varianciada populacao estimada como a media das variandas das amostras

116

l'lllrp ()!-. gnqlOs em relacao a varia<:;ao dentro dos grupos e, conse-

quentemente. maior a probabilidade de rejeitar a hip6tese nula e acei tar

.1 hip6tese experimental.

A distr ibuicao de Ftern a forma de urna curva desviada a direita:

F ig u ra 2 6 . V a lo r c rit ic o e m d is tr ib u ig a o d e F

A r ea d e r ej eig a o

--.1ibre a d e

a c e i a c a o

9 9 %

I

4 53

5 , 3 1

( v a l o r c r i ti c o )

Usando-se 0 valor obtido para a estatistica Fl'O nurnero de

graus de l iberdade apropriado, obtem-se 0 correspondente valor de p

pOI' meio das tabelas de F , asquais sao oonstruidas urna para cada valor

de p e fornecem urn valor de Fem funcao dos graLis de liberdade Vel'

tabe!a 20.

o calculo dos graus de liberdade. neste caso, e urn pouco rnais

cornplicado pois ele precisa cornbinar 0 numero de graus de liberdade.

entre os grupos (numerador) com aquele intragrupos (denorninador).

(n" de grupos - 1)

[(n° de grupos) (n - 1)]

Para tornar rnais claro, consiclere 0 exemplo dos diureticos: 0

numero de graus de l iberdade entre osgrupos e igual ao n'' de grupos -1,

117

 

(;Iil) 4 -1 = J l' U I)"til' ur.urs d l~ libcrdad« illlrd-llllll)()S l'l d som.: d ( J "o !)

.

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 59/79

gralls de liberdade de cada grl lpo, Clib = (16- 'I) + (I b - 'I) + II () II

+("16-1)=60,

Suponha que se deseje verificar, par,! LJIll nivel de SigllificAIlCld

de 0,05 (p~O,05), se hi1 uma diferenca entre qu.iisquer dos .: 1 grllpu"

estudados.

Pro cura -se num a ta bela de distribuicao e l l ' F .~ t abe!a 20- 0

valor correspondente de F pctra quatro e 60 gl-(-lUSde liberdade e com-

I)()I-a-se 0 valor observado com 0 extra ido da tabela: Sl' () valor observi-

do for maim que 0 da ta be !a . diz-se. entao. que h,1 uma dilerenca

estatisticamente signif icante entre dois ou rnais gruj)os,

T ab e la 2 0 . E x tr at o d e t ab e la d e d is tr ib u ic ao d e F

D istr ib uica o de F p ar a p = 0 ,05

G lib e ntr e g ru po s =:>

G lib in tr a g ru p os J J40

60

4 5 6

2,61

2,53

2,45

2,37

2,34

2,25

Essaanalise de variancia - ANOVA - inforrna sornente se h e l OLi

nao urna diferenca estatisticarnente sigruflcante entre clois Ull m.us gll l-

pos, mas nao inforrna quais os grupos envolvirlos. [J,H,! ic lentif icar os

grupos, cleve-se real izar urna comparacao entre p ,Hes - p e li r w i st '

co mpar iso n te st - que iri1compar(lr cada grupo COI11 C\cld 11111 clos 011 -

tros. Ha pelo menos cinco testes diferentes G1pc17l'S dC' rc.iliz.ir CSSd

analise e que diferern entre si pela capacidade de reduzir tanto 0 (>1-1-0

tipo 1 quanta 0 erro t ipo II . Os estatisticos d ive rge rn quanto J escolha

do teste mais apropr iado em cada situacao: teste de Fisher - p ai r w is e,

de Duncan, de Newrnan-Keuls. de Tukeys e de Scheffel, dontre outros.

118

EN TENDENDO OS VAR IOS T IPOS

DE TE STES ANOVA

Frequenternente, os testes para analise de variancia sao referi -

dos como one-way ou two-way e com ou sern repeticao - r epea ted

measures .

o teste one-way ANOVA testa a hip6tese nula de que todas as

populacoes tern medias identicas contra a hip6tese alternativa de que

urna ou mais da s medias d a s p o p ul ac o es difere (las dem ais. H a gera

urn valor de P que responde a seguinte questao: se Ho e verdadeiro,

qual a probabilidade de que as medias das arnostras selecionadas pos-sam variar tanto ou mais quanto a variacao encontrada?

o terrno one-way significa que os dados a serern cornpa rados

forarn agrupados com base em urn unico criterio - 0 tipo de diuretico e

o termo two-way indica que os grup?s a serern cornparados forarn

obtidos mediante a aplicacao de 2 criterios, pOI' exernplo , tipo de

diuretico e sexo. 0 exernplo do estudo dosdiureticos constitui, portanto.

lim born exemplo para aplicacao de urn teste one-way ANOVA sern

repeticao.

A diferenca entre ANOVA e ANOVA com repeticao e a rnesma

que existe entre teste t e teste t com ernparelhamento. Deve-se usar

ANOVA corn repeticao em tres circunstancias:

• as rnedidas sao feitas repetidamente 110 mesmo elernento,

por exernplo: antes, durante e apos tratarnento:

• as rnedicoes sao feitas em grupos ernparelhados:

119

 

• as rnedidas sao feitas ern urn experimento de labor.uurio

~' .. .'.

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 60/79

repetido em diferentes ocasi6es.

Se nao houver certeza quanto a distr ibuicao normal das popu-

lacoes, pode-se calcular 0 valor de p usando urn teste nao-parametrico.

o teste nao-pararnetrico analogo da ANOVA one-way eo denorninado

teste de I<ruskal-Wal lis e 0 teste nao-parametrico analogo cia ANOVA

one-way corn repeticao e 0 denorninado teste de Friedman. Essestes-

tes primeiro atribuern postos aos dados e, ern seguida, analisarn a dis-

tr ibuicao dos postos entre os grupos.

120

CORRELA(Ao E A REGRESSAO LINEAR

causa ou consequencia da outra.

A correlacao e usada quando se deseja es-

o terrno correlacao significa relacao nos

dois sentidos: descreve a associacao entre duas

variaveis, nao fazendo julgarnento sobre se urna e

o fato de existi r

uma corr-elccdo

noo significa que

uma varicivel seja

causa ou~ tud ar q uao consistenternente d uas va navels m u-

consequencio dadarn ern conjunto. Quando isso ocorre, os

estatfsticos dizern que ha uma correlacao OLi uma

covariacao, cuja di recao e magni tude podern ser quanti ficadas.

Dezenas de fates estao associados e nao tern uma rela<;,:aodecausa e efeito como, por exernplo, ascorrelacoes existentes entre mor-

talidade infantil e PIB, entre escolaridade e renda per capta, entre po-

luicao arnbiental e nurnero de malforrnados, entre sanearnento basico

e rnortalidade infanti l etc.

outra.

Considere urn exernplo ern que se deseje estuclar as variaveis

peso e altura ern uma populacao de 12 hornens adultos e que essas

variaveis sejarn denorninadas respectivarnente de x e y . Para cada ele-

mente da amostra foi obtido urn par ordenado (x.y) cujos valores foram

inseridos na tabela 21.

121

 

& , JI I !H I . . ! I I.

Tab e la 2 1 . P es os e a ltu ra s d a pop ula ca o (N = 1 2 )

ssU!

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 61/79

Elemento Altura Peso

1 8 2 9 5

2 1 7 4 7 2

3 1 7 0 6 4

4 1 8 0 9 5

5 1 8 3 7 9

6 1 6 0 7 2

7 1 5 6 6 4

8 1 5 7 6 2

9 1 6 8 6 7

1 0 1 7 5 7 5

1 1 1 7 6 7 5

1 2 1 9 0 9 6

Nurn diagrama de d.spersao. as vezes e possivel visualizar urna

curva regular que se aproxima dos dados, denominada curva de

ajustamento, e quando esta lernbra urna reta e os dados parecern estar

bern pr6xirnos dela, diz-se que ha urna correlacao linear entre asvariaveis.

o diagrarna de dispersao para 0 exernplo de pesos e alturas de

lima populacao, representado na f igura 37, parece indicar a existencia

de urna correlacao l inear entre asduas variaveis: ha uma tendencia em

se obter rnaiores valores de y a medida que x aumenta. Quando isso

ocorre, diz-se que a correlacao e positiva mas, ha casos em que ocorre

o inverso - correlacao negat iva.

Considerando-se 0 diagrarna da figura 37, a correlacao linear

poderia ser representada por uma reta interpolada aos pontos (reta in-

terpolatriz) .

Para dados continuos em que ha uma corre lacao linear , pode-

se determinar 0 coef iciente de correlacao "r", cujo valor varia de -1 a

+ 1.0 sinal indica sornente seasduas variaveis variarn no rnesmo sentido

(sinal +) ou em sentidos opostos (sinal -) e se r = 0, as duas variaveis

nao variarn em conjunto.

122

0'ctl0" •

0

~ Ol

:::J

0..00..

ctl-0

in0

I•n

(j) •..

(j) 0, • coen I~I::J

C ii(1) ctl •j) :s • ~

(j) C ii •:::J

-0 (1) §0 UJ

(J)

'ctl xUJ

enill 0 •0

0..en r-,

en (j)

'60.. •

(j)

-0

ctl

E~0

ctl

i5 0

, . . . : • <0

C")

<tl. . . . •::J •u :

oo oN

o- - - r LD

oN

oco

o<0

OS8d

ooN

123

 

() coof icicnte de correlacao rnede 0 "ajusto" dol 1(,[.1 (lOS pontes No ('x ('lllplo dos pesos (' ('sIClturd\ () t.un.inho ti d p op ul.« .. io (,

12 (igual ao numero de pares) e, calculando-se r, obtern-sc 0 sl'guint('

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 62/79

q ue a d et er mi na ram , isto e , quao pr6xirnos da reta tra ca da se encontrarn

os mesmos e nao tern relacao com a inclinacao da rnesma. Urn I' = - 1

signi fica que toclos os pontes estao sobre a reta tracada (obtida) e que a

correlacao e perfeita e negativa.

Observa r nos d iag ramas cia figura 38 diferentes situacoes e os

respect ivos valores de r:

F ig u ra 3 8 . D i ag ra m a s d e d is pe r si io , r e ta s i nt er po la tr iz e s e r e sp e ct iv os r

.•

/... · .· . . .

r = 0,94 · . r = 0,24

L__ ~ _

. .

r = 0

Para se calcular 0 r deve-se aplicar a formula proposta por

Pearson, que, obviamente, leva ern conta nao 56 os valores de x e y

como tambern 0 tarnanho da amostra.

n :E xy - (:E x) ( :E y)

r = - ~ = = = = = = = = = = = = = = = = ~y

V [n:E x2 - (:E x)2][n:E y2 - (:E y )2]

124

resultado: r = 0,8257.

Nao basta, entretanto, calcular 0 valor de r, po is ell' sofre urna

grande influencia do tamanho das arnostras e da variabilidade - para

n = 2, por exernplo, sempre haveria urn ajuste perfeito, urn r maximo.

E i rnportante saber se 0 valor obtido para r resultou s implesrnente da

variabilidade das arnostras e realrnente nao ha correlacao entre as

variaveis (I' = 0), ou set de fato. ha uma correlacao (r7"'O)entre asrnesmas.

Para esse processo, aplica-se ur n teste estatistico para verificar a

hip6tese H, (r7"=O)considerando a hip6tese nula H o (r = 0) - nao ha

correlacao linear entre x e y - e obtem-se um valor de p que inforrna a

probabilidade do resultado obtido ter s ide por acaso, is to e. ser clevido

a variabi lidade da a rno stra .

Disp6e-se de tabelas de r (tabela 22) onde se pode obter 0

valor de p ern funcao dos graus de liberdade da amostra que no caso

de correlacao, deve ser considerado corno 0 numero ele pares decrescido

de 2 (Glib = n - 2).

No exemplo em curso, 0 nurnero de graus de liberdade e '\ 0

(Glib =12 - 2 = 10), e consultando-se a tabela de r (tabela 22) ver ifica-

se que 0 r obtido de 0,825 ocorre para p < 0,01, Portanto, pode-se

considerar a correlacao encontrada corno estatisticarnente significante.

Tabela 2 2. E xtr ato de tab ua de "r" aos n f v e is

d e s lq n itic an cia d e 0 ,0 5 e 0 ,0 1

Glib P = 0,05 P = 0,01

4 0 ,8114 0 ,9172

5 0 ,75 45 0 ,8745

6 0 ,70 67 0 ,8343

7 0 ,66 64 0 ,7977

8 0 ,6319 0 ,7646

9 0,6021 0,7348

10 0 ,5760 0 ,70 79

125

 

o coeficiente de corrclac.io (. urn numoro IIIIIIl, ll~.\( 1 0 pclfcl

- & WM A# -

A ss im , p od t' ~ (' in lo rm a r que 0 coeficiente de correlacao da populacao

l'st,l dontro de deterrninado intervalo de conf ianca (IC 95%).0 calculo

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 63/79

classif icar a correlacao em perfeita (=1), forte (>0,75), Ill("did (> 0,5),

fraca «0,5) e inexistente (=0) em funcao de seu afastarnento do zero,

nos dois sentidos (positive e negativo), lembrando que a natureza nfio

produz correlacoes perfeitas. Esta interpretacao varia bastante nos

d iferentes textos.

Se 0 r e di ferente de zero, ha 4 explicacoes posslveis:

1. A variavel x deterrnina os valores da variavel y .

2. A variavel y ajuda a deterrninar 0 valor da variavel x.

3. Uma outra variavel influencia arnbas, x e y .

4. x e y realmente nao se correlacionarn. 0 que se observou

ocorreu por acaso e, nessecaso, 0 p ajuda a resolver a questao,

Pode-se calcular 0 coef iciente de correlacao para qualquer con-

junto de dados, e ele consti tu i urn born descri tor. Entretanto, inferencias

56 podern ser feitas a partir de r e de p, se algumas condicoes forern

observadas:

1. A arnostra e representativa: 0 suficientemente grande e

escolhida ao acaso.

2. Cada unidade experimental e independente das dernais e

fornece ambos os valores, x e y .

3. x e y sao medidos independentemente.

4. x e y provern de populacoes que tern, pelo menus

aproximadamente, uma distribuicao Caussiana.

5. A correlacao deve ser linear para todos os valores: y deve

aumentar ou diminuir para todos os valores de x, sern

intervalos em que 0 cornportarnento seja diferente.

Algumas vezes nao se utiliza 0 r, mas sim 0 r2 - r squ ared -,

chamado de coeficiente de deterrninacao, cujo valor, obviamente,

sera sempre rnenor ou igual a 1. Eledeve ser interpretado como a frac;:ao

da variancia que e cornparti lhada entre as duas variaveis.

Os coeficientes de correlacao. tal qual rnuitas outras estatisticas,

sao mais informativos quando expressos como intervalos de conf ianca.

126

clo intervale de confianca para coeficientes de correlacao e bastante

trabalhoso. Use, de preferencia. um software estatistico para realiza-!o.

o r de Pearson s6 e usado para d ados continuos. Se d ados

ordinals estiverem envolvidos, deve-se uti lizar tecnicas estatisticas para

correlacoes nao-parametricas, calculando, por exemp!o, 0 coeficiente

de correlacao de postos de Spearman (rs) - correlacao ordinal - cujos

valores, similares aos do r, devern ser interpretados da rnesma forma

(ver exercfcio 15) e cuja formula e a seguinte:

r =1 -s

onde n e 0 nurnero de pares e D e a diferenca de postos entre as

var iaveis de urn rnesmo par.

Para investigar urna correlacao entre Apgar e peso de nascimento,

pode-se calcular 0 coeficiente de correlacao de Spearman e obter urn

valor de rs'por exernplo, rs= 0,7; nesta condicao considera-se que ha uma

correlacao positiva e verifica-se 0 nivel de significancia nurna tabela de rs'

A correlacao indica 0 grau de associacao entre duas variaveis,

ao passo que a regressao diz respeito a capacidade de prever urn

valor baseado no conhecimento do outro, de prever y dado que x

seja conhecido.

E importante, para fazer uma anal ise de regressao, deterrninar

qual a variavel dependente, aquela que flutua em funcao da variavel

independente.

Na representacao grafica e irnportante sempre colocar no eixo

das abscissas (horizontal) a variavel independente (x) e no eixo das 01'-

denadas (vertical) a variavel dependente (y).

o valor de y pode ser determinado pelo grafico ou rnaternatica-

mente, por rneio da funcao (expressao da reta) y =a+ f3 x, onde f3 e ainclinacao da reta e a e a intersecao da rnesma com 0 eixo y , conforme

figura 39.

127

 

Figura 3 9. A ju ste d a r ota d e r eq re ss ao ( 1 ( ' ():I 'Y.,). A f l H l l i t I · t o dprt'St'l1td d rdd interpol.uriz (' 0 intcrvalo de confi-

dl1(:d Ird~',HI()sPdl'd () cxernplo dos pesos e estaturas citado anteriorrnen-

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 64/79

Variavel

Dependente

............... ,", " , ,., }• (y • Y j) • residuo

. , .

• •

//\~c : : : · · · · : : · J , . , , " ". . . , . ,

a.

Var iave l l ndependen tex

Com essas informacoes e possfvel fazer predicoes quanto aos

valores de y correspondentes aos valores de x, e esse e 0 papel cia

maternatica da regressao, Assim, para fazer urna analise cle regressao, 0

primeiro passo e deterrninar a mel hor reta cle ajuste.

Para assegurar qual reta e a mel hor possfvel, aplica-se 0 rnetodo

dos minirnos quadrados - method of least squares. Nenhurna reta P(1S-

sa pOl' toclos os pontes, sernpre havera urna distancia vertical entre a

linha e a rnaioria clos pontos do diagrarna cle dispersao - resfduo . 0

metodo determina essa distancia para cada ponte e eleva 0 resultaclo

ao quadrado. A linha considerada como a que mel hor se ajusta e a que

resulta na rnenor soma dos quadrados dos afastamentos. Obtida a cur-

va, encontra-se a equacao matematica correspondente e a capacidade

de predizer urn valor de y para cada valor de x.Qual a seguran<;;ade que as predicoes sao acuradas? Do mesmo

modo que ocorre para outras estatfsticas, para carla valor de x havera

uma distr ibuicao de valores de y que compreendera 0 valor verdadeiro

128

It'; .IS l inhas rcpresentativas do intervale de confianca curvarn-se p(1ra

fora porque a distribuicao dos dados tende a ser m aier na s ex trernid ades .

~ -~~~~. . . , , - _ . . . . . .

~~~~~~

- ~ - - - ~ - - - - - ~ -~ - - - - . ~ - - - - - - - - - - ~ - - - - - - - - - - -

_ _ ~ - - - - - - - - - - - - - - - _ - a r ---- ~-,-----

- -~~- .------ -- --

100

95

90

85

80

75

70

65

60

55

175 185 19060 170 18065

129

 11)($$;;

ENTENDI NI)() «()RRLLA~:()fS 1NVUIVLN[)() IJAUU'S N( )MINAIS

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 65/79

R E G R E S s A o o u CORRELA~Ao?

Confonne foi visto anter iorrnente, a regressao l inear e a correla-

c,;aoestao relacionadas, mas sao diferentes: a regressao linear encontra

a reta que rnelhor preve y em func,;aode x, ao paSSOque a correlacao

quantifica quao bem x e y variarn em conjunto. Se houver duvida na

escolha, considere os seguintes pontos:

Sex e controlado (tempo, por exernplo), nao usecorrelacao

e sim regressao linear.

Use somente regressao linear sefor possivel detenninar com

clareza qual variavel ex equal e y , pois elas nao sao sime-

tricas e se houver inversao de eixos, obtern-se resultados

diferentes.

Sao raros os casos em que faz sentido calcular ambas.

Q UAN DO F OR< ;AR A L lN HA DE REG RES SAO

A C RUZ AR DITER MIN AD O PO NTO ?

Quando se faz urna regressao, e possivel determinar que a linha

passe sobre urn determinado ponto, usualmente a origem (X = 0, Y = 0).

Porern. esta restricao s6deve ser usada quando a literatura informal' sobre

essa conveniencia. Mas, de urn modo geral, deve-se optar pela reta que

melhor se ajuste - w i th o u t c o ns tr a in ts .

130

Quando ha interesse ern obter correlacoes entre d.ulos nomin.i is,

pode-se usar dois processos: 0 de deterrninacao do risco relative e a

ra za o da s chances - o dd s r at io .

o calculo do risco relative pede ser facilmente compreendido

por meio de urn exemplo. Considere urn estuclo ern que se deseje

verificar a eficacia do AZ T no tra tamento de pacientes por tadores do

virus HIV, pOI' meio de urn experimento (duple cego) em que se adrni-

uistre aleatoriamente placebo ou a droga aos mesmos. e que se acorn-panhe esses pacientes pOI' urn periodo de quatro anos para detectar a

p ro gr es sa o c ia d o en ca . Ver tabela 23.

Tabe la 23 . E xemp lo de t ab e l a de con ti n ge n c ia pa ra ca lcu lo de r isco r e la ti vo

F ato r d e r is co Condicao ( no e x .: proqressao da ooe n ca )

( e xpos icao ou t ra tamen t o) Prese n te Ausen te

A

C

P re se n te (A ZT )

A u se n te ( Pl ac e bo )

B

o

I Risco relativo = [A / (A + B)] / [C / (C + D)] I

o risco relative e urn nurnero puro cu]a amplitude varia entre 0

e 00. Quando igual a 1, indica, obviamente, que nao ha diferenca de

risco entre os grupos cornparados. Quando inferior a 1, ou seja, 0

denominador e maier que 0 nurnerador, ele indica que 0 fator de risco

presente, na realidade, protege 0elemento a ele exposto; nessa condicao

(protecao), asvezes e chamado de probabilidade relat iva. Elee uti lizado

em estudos epiderniol6gicos prospectivos do tipo coorte - cohor t , e

em estudos experimentais como 0 do exemplo.

Urna outra forma de estimar a diferenca entre duas proporcoes

e por rneio do chamado risco atribufvel que e igual a diferenca entre as

duas proporcoes:

I

I I

I Risco atribufvel = [A / (A + B)] - [C / (C + D)]

131

  ..,

Algumas vezcs, entret.uuo, COl))O 1111111ostudo lI·tl()·.p,·(tivo do

tipo caso-controle, 0 calcu!o do r isco relative n.io sc "plied, pois St· ust.i

","L4"

S t' . d W I II l do!> vctl()J'('s;\, 1 3 , ( : Oll I) fo r iglldl .I(), .I ('qllcl(,;i() n.io

puci(' ~"I (.dudclciCl 0, nesse caso, alguns estatisricos adicionam 0,5 a

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 66/79

lidando com 2 grupos: urn ja portador da condicao - doenca e outro

nao portador da condicao - grupo controle. Nesses estudos nao se est.i

avaliando 0 risco de urn grupo exposto a urn tater de risco vir it

desenvolver urna condicao ou doenca e sirn 0 contrario, isto e. dado

que a condicao ja esta presente, investiga-se se houve exposicao ao

fator de risco retrospectivamente. Nesses cases calcula-se a chamada

razao das chances - odds ratio.

Existe urna diferenca entre probabilidade e razao: a proba-bilidade de urn evento e fraC;ao entre 0 nurnero de ocorrencias e 0

nurnero de experimentos realizados, ao passo que razao e definida

como a probabilidade de que urn evento ocorra. dividida pe!a

possibilidade de que ele nao ocorra.

T ab e la 2 4 . M o de lo d e ta be la d e c on tin q en cia (2 x 2)

F at or d e r is co Presente Ausente

Presente

Ausente

A

C

B

D

Probabilidade de ocorrer

Probabilidade de nao ocorrer

Probabilidade de ocorrer

1- Probabilidade de ocorrerRazao =

A / (A + B )Razao (chance) da cond ic;ao nos expostos = = A / B

B / (A + B )

C / (C + 0)Razao (chance) da condicao nos nao-expostos = = C / D

0/ (C+ 0)

NBRazao das razoes (chances) ( o dd s r at io ) = --

C/O

132

todos os 4 valores.

Nao ha vantagern de secalcular a razao das chances em estuclos

prospectivos e experirnentais. 0 seu calculo e part icularrnente uti l na

anal ise de estudos retrospectivos, t ipo caso-controle, conforme citado

anteriorrne nte.

Tal qual se faz para outras estatisticas, costurna-se calcular urn

intervale de confianca de 95% ou 99%, tanto parCl0 risco relat ive como

para a razao das chances.Exem pi i ficando: suponha que urn pesqu isador d ispon ha de mil

pacientes, 160 dos quais com doenca respiratoria e 840 sern apresenta-

la. e que 0 fator de risco em estudo seja 0 habito dos pais em relacao

ao furno. Paracalcular a razao das chances deve-se montar a tabela 25.

Tabela 25 . T ab e la d e c on fin q e nc ia p ar a c alc ulo d e ODD S RATI O

F at or d e r is co Doenca respi r at 6 r ia

( pa is f uman tes ) Pre se nte Ausen te Totais

Presente 12 0 (A ) 30 (8 )15 0

Ausente 40 (C ) 810 (0 ) 8 5 0

Totais160 840 1 .000

=120/30

40/810 = 81,00NBC/ D

azao das chances (odds ratio) =

e calculando-se 0 intervale de confianca (95%) mediante urn software

estatistico, obtem-se 48,59 e 135,00.

133

  ,,

Valor predict ivo negativo = 100 x [D /(C + D) I

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 67/79

EN TEN DEN DO V AL OR PREDIC TIV O,

S E N S IB IL ID AD E E E SPE C IF IC ID AD E

Essesterrnos sao frequenternente usados e se relacionam a da-

clos norninais, nurn contexto envolvenclo urn fator de risco ou teste

laboratorial e sua relacao com urna doenca ou condicao.

o valor predictivo corneca COIll urn fator de risco ou teste

laboratorial e responde a seguinte questao: dado urn fator de risco ou

urn exarne laborator ial positivo, quais sao aschances de 0 paciente ter

a doenca? Para facilitar 0entendirnento do calculo do valor predictivo,

v ej a t ab e la 26.

T ab e la 2 6 . T ab e la d e c on t in p en c la p ar a c alc u lo d e v al or p re d ic tiv o

F at or d e r is co Doenca r e sp ir a to r i a

(pais f umantes ) Presen te Ausen te Totais

Presente 1 2 0 (A ) 30(8) 15 0

Ausente 40 (C) 8 10 (0 ) 85 0

Totais 16 0 84 0 1.000

Pode-se calcular um valor predictivo posit ivo (expresso em por-

centagern) por meio da relacao:

Valor predict ivo posit ivo = 100 x [A I(A + B)]

Quando 0 fator de risco ou teste e negativo, pode-se calcular

urn valor predictivo negative por rneio da relacao:

134

Calcular a sensibilidade implica em ter como base alguem com

uma doenca ou condlcao e deterrninar a chance dessa pessoater presente

urn tater de risco ou urn exarne ou teste laboratorial. Ver tabela 27.

I Sensibilidade = 100 x [N(A + C)] I

T ab e la 2 7 . T ab e la d e c on t in g e nc ia p ar a c al cu lo d e s e ns ib il id ad e e e s pe c if ic id ad e .

l n te c cao f u n q ic a s is te r n lc a

Hem ocu ltu ra Pre sen te Ausen te Totais

Positiva 8 4 (A ) 1 (8 ) 85

Negativa 26 (C) 18 0 (0 ) 20 6

Totais 110 18 1 29 1

No exernplo, a sensibilidade = 100 x [84/(84 + 26)J = 76 %, 0

que significa que, ernbora as hernoculturas tenharn urn elevado valor

predictivo, elas nao sao sensfveis , visto que 26 em 11 0 pacientes cominfeccao fungica sistem ica tem hernocu ltura negativa para fungos.

Especificidade e definida como a proporcao de pessoas sern a

doenca que nao tern urn teste positivo ou 0 fator de risco presente.

I Especificidade = 100 x [D I (D+ B)] I

No exernplo. a especificidade = 100 x [180/(180 -1)J = 99,45%

e elevada: 0 que s ignifica que, se 0 paciente nao possui ulna infeccao

fungica sisternica, ha uma chance elevada de que ele tenha urna

hernocultura negativa para fungos.Habi tualmente calcula-se urn intervale de conf ianca tanto para

valor predictivo corno para sensibilidade e especificidade e este sera

tanto menor quanta maier for a arnostra.

135

 

I'.Ird 0 exernplo citado ,I l'Cjutl<.:(iocI(1 rt'grl'ss(-I()lilH '.II" 11I1'tllipld .,(It I:

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 68/79

NO< ;':OES DE REGRESSAO

L INEAR MULTIPLA

Ern alguns tipos de experi rnentos ha necessidacle de se analisar

a interacao de inurneras variaveis. A regressao rnult ip la e urna maneira

de fazer isso.

A regressao multipla encontra uma equacao que permite calcu-

lar a variavel dependente (y) corn base ern duas ou rnais var iaveis inde-

pendentes (x., x2etc.). Por exernplo, seria possivel predizer qual a pressao

sangLlinea tornando como base idade, peso e sexo. Nesse tipo de estu-

do pode-se estar interessado ern qual variave] tern a maier influencia e/

ou em encontrar urna equacao que melhor determine a pressao

sanguinea valendo-se das tres variaveis. Em outros casos s6 seesta real-

mente interessado em uma das variaveis, mas a anal ise necessita fazer

ajustes para cornpensar diferencas devidas a outras variaveis: no exern-

plo em curso, a pressao entre hornens e rnulheres difere? Essaresposta

deve ser dada ap6s serern feitos ajustes para idade e peso?

A equacao generica para regressao multip!a e:

Ao inves de sornente uma interseccao - da reta com 0 eixo Y, e

urna incl inacao que ocorrern na regressao linear simples, a equacao cia

regressao linear multipla contern urna constante (Po) analoga a

interseccao, coeficientes parciais de regressao ( P " O2, 0 )1 . . . ) e urna

correcao (8) para compensar 0 erro decorrente do fato de que os pontos

nao se s ituarn todos sobre a reta de regressao.

136

Pressao arterial = 00+ 0

1* idade + 0

1* peso + ~ : * sexo /- 8

A variavel sexo seria apresentada ern c6digo, por exernplo,

masculine = 0 e ferninino = 1 e e charnada de variavel codificada -

d um m y v ar ia bl e, i nd ic at or v ar ia bl e.

Urn aspecto que ainda deve ser consiclerado e 0da multicolinea-

r idade. que diz respeito a eventual relacao das variaveis independentes

entre sie nao sornente corn a v. . , (lvel dependente. No ultimo exernplo,

o peso tende a ser rnaior com a idade e os hornens tendern a ser maispesados que as rnulheres.

Os principals usos da regressao rnult ipla sao:

• Para ajustar dados, Nesse caso, ha um interesse no efeito

de uma particular variavel X, mas deseja-se fazer ajustes

ern funcao de diferencas que ocorrern devido as dernais

variaveis independentes.

• Obter urna equacao para predizer y tendo como base inu-

rneras variaveis independentes.

• Explorar relacoes entre multiples variaveis para encontrar

quais variaveis independentes X realmente influenciarn y .

A regressao linear mul tipla e mais complicada que outros testes

estatisticos e provavelmente os "simples mortals" precisarao da ajuda

de um estatistico para realiza-la.

137

 

"" " M

Exerdcio 16. Pode-se modificar 0 nivcl til' Il1l'I1SlIr.t<,;,lo til' tI,l(lm~

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 69/79

TESTE SEU CONHECIMENTO

Exercicio 13. Um teste tern urna especificidade de 90% e Lima

sensibilidade de 98%. Calcule osvalores predictivos posi tivo e negativo

para 0 referido teste, quando aplicado a uma populacao em que 7%

dos individuos tern a doenca.

Exercfcio 14. Os dados expressos na tabela a seguir mostram a contagem

de leuc6citos em dois grupos de pacientes. urn tornando deterrninada

droga e outro tornando placebo. Compare os gl·upos usando 0 teste de

Mann-Whitney.

Placebo Droga

1.160 89 6

1.090 90 0

1.320 1.160

1.250 1 . 000

1.100 96 0

1.234 87 0

Exercfcio 15. A l iteratura inforrna que deterrninada doenca e de origem

genetica e tern carater autossom ico dorn iria nte. Espera-se. assiIll, que

os filhos de pais portadores dessa doenca sejam afetados numa

proporcao de 50%. Suponha que determinado estudo envolvendo 50

filhos de casais, em que urn dos pais e portador da doenca. s6 tenha

encontrado 12 afetados. Visto que se esperaria encontrar cerca de 25

afetados, a c I iscrepancia encontrada penl l i te contestar a I iteratu r(l?

138

Explique.

Exercfcio 17. Como proceder pClraestudar seha uma correlacao entre

grew de instrucao (classificado de 1 a 5) e QI? OS resultados obticlos

para fazer a pesquisa estao apresentados na tabela a seguir :

Nume r o do aval iado G ra u d e lns t rucao QI

1 2 11 0

2 3 12 0

3 12 5

4 5 13 0

5 4 14 0

6 5 10 0

7 3 12 0

8 2 10 0

9 10 0

10 2 11 0

Exercfcio 18. Considere dois tratarnentos, A e B, para uma determinada

doenca e que se deseje cornpara-los com relacao a SU(leficacia. tendo

como base osdados apresentados na tabela de cont ingencia a seguir:

Compare os tratarnentos usando urn teste simplificado de

Qui-quadrado.

Morte Sobrevida Totais

T ra ta m en to A 22

Tratam ento B 8

25

16

47

24

4 1 71otais 30

Exercfcio 19. Preencha os quadrados vazios propondo testes a serem

usados nas situacoes expostas no quadro a seguir :

 

. ; ; ;; ; ;o t

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 70/79

o passe seguinte consiste ern aplicar as formulas para calcular

'"<I >

os valores predict ivos e assim tern-se:00 -c

u

'" '"" , " g

.~ U) .' " t:o~

o m .c: C>-o 0 ro 0 ro

0

a. a. E"§ E-c ·u .!!! '"a. 0.-::I '"

::I a.> ::I 2.~ ~0 O J::I ro ::I ro o <I > ro

Valor pred ictivo positivo = 686/1 .616 = 42A5%, 0 queJ 00. 0= '" >; 0>.<:: o>-c

'" E '" ~U):~ 0

:0- E E 0 '" '" . ~ e n ro ~_ .< : :o 0 ' < I> < I>

'< I > ' " ro £ : ( i j " Q )significa que, quando urn habitante tem urn teste positivo::I

0_.!::o ~ a.:1- -c ~ -c -c > >~ ~ ~ ~ ro ~ ·ro :: E ~ '" o:~~ '" rl roI>

l::o. ro.<:: l:: c: l:: <I> ele tern 42,45% de chance de ter a doenca.~ E m ( j j ~.g~ ro

~ ro E ro ' " ro '" ~ >.::1 o.~ 0.0 0.0U

E E0.<1>

Eg_ EO. EO. c: <I >._ ro

Valor predict ivo negativo = 8.370/8.384 = 99,83%,0 que'" Eo ro ~ -c~<I > 00 o E 02 o 2 ::1- < I > -",

c~~ ::I

Cl Uu Uc: UI> Uo> Uo> 0.0

significa que urn habi tante corn teste negativo tern 99,83%

de chance de nao ter a doenca.

!Ii<I >

oU

'"

roc:ro·iii

'":Iro(!)

o.roC>-

s s::I

a.oa.

140

RESP OSTAS DOS EX ERCfclOS 1 3 A 1 9

13. 0 primeiro passo consiste ern imaginar urn numero de

habitantes, 10 mil pOI'exemplo, e, com base nos valores citados, construir

uma tabela de contingencia. Assirn, espera-se encontrar urn total de

700 doentes (7% de 10 mil), dos quais 686 (98%) apresentam urn teste

positivo e 14 (2%) urn teste negativo. Considerando-se 0 grupo dos

9.300 nao doentes (10.000 _ 700), espera-se encontrar 930 ('10%)

individuos com teste positivo apesar de nao apresentarern a doenca,

dado que a especificidade referida para 0 teste e 90%. A tabela de

contingencia apresentando estes dados sera:

Doenca presente Doenca ausente Totais

Tes te pos it ivo 68 6 93 0 1.616

Tes te nega ti vo 14 8 .370 8 .384

Totais 70 0 9.300 1 0 .000

141

 

14. Primeiramente, deve-se calcular as somas dos postos nos <lois

. J iMb 14

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 71/79

grupos, considerando 0valor real de cada resultado (enao 0 valor absolute):

Placebo Posto Droga Posto

1.090 6 89 6 21.160 8 90 0 3

1.320 12 1.164 91.250 11 1.000 51.100

7 96 0 41.234 10 87 0

Somados postos (R1) 5 4 Somados postos (R

2) 2 4

A etapa seguinte consiste em calcular os valores da estatistica U

pal-a os dois grupos por rneio das formulas:

U n,(nl + 1) n/n2 + 1)1= n1n2 + - R e U = n n + -----

1 2 1 2

2 2

e assim tern-se: Ul = (6x6)+ 6(6+ 1)-54=3 e U2=(6x6)+ 6(6+ 1)-24=32 2

Considere 0 rnenor valor obtido como 0 U observado logo U = 3, '() I

passando a seguir para a consulta da tabela de U apropriada para 0

tarnanho da arnostra rnaior (n2

), valor de alta e teste uni ou bicaudal.

Usando 0software SPSSpara fazer ascontas, obtem-se urn valor de

U = 3 e p= 0,016, menor que 0,05, portanto consicleraclo significativo.

15. A solucao deste problema pode ser feita pOI' meio de LJIll teste

de x 2,no qual os resultados esperados provern de inforrnacao da literatura.

Consultando uma tabela de X 2 e considerando Glib = 1 (numero

de categorias -1), verifica-se que a discrepancia encontrada e estatistica-mente significante para urn p< 0,001 e, assim, se justificaria 0 questio-

namento da literatura.

147

17. 0 coeficiente usado para avaliar correlacao entre dados

ordinals e 0 de Spearman e, para calcula-lo. cleve-se inicialmente atribuir

postos aos resultados e assim tern-se:

25

(12-25)2/25 == 6,76

(38-25)2/25 == 6,76

C om d oe n ca

Semdoenca

12

38

50 x 2 == 13,5otal 50

"

I

I6. 0 nivel de mensuracao clos dados pode ser entendido corno

uma escada onde urna vez atingido urn degrau, sup6e-se que ascaracte-

risticas dos anteriores estejam presentes. Imagine que os valores das pres-

s6es sistolicas de quatro pacientes sejarn 180, 160, 140 e 135. Como se

sabe, press6es constituem dados continuos, pertencem ao nivel racional

de rnensuracao (0 mais alto). Entretanto, nada impede que se rebaixe 0

sel l nivel para ordinal (grausde hipertensao). por exernplo. ou que seatr i-

buam postos aos resultados, tratando-os corn rnetodos nao-parametricos.

E importante notal ' que 0 rebaixarnento de nivel de mensuracao e quase

sernpre possivel, ao passo que a elevacao rararnente se consegue.

!

Nu rne ro do Graude Posto PostoGI QI Posto PostoGI I

avaliado lns t rucao (corrigido) (corrigido)

2 3 4 110 5 4, 5

2 3 6 6, 5 12 0 6 6

3 1 2 1,5 125 8 8

4 5 9 9 13 0 9 9

5 4 8 8 14 0 1010

6 5 10 10 10 0 3 2

7 3 7 6, 5 12 0 7 7

8 2 4 4 10 0 2

9 1 1,5 10 0 2 2

10 2 5 4 11 0 4 4,5

143

 

N u rn e ro d o P osto G I P os to 0 1 D lt er e nc a d e p os to (G I - 0 1 )2

avaliado (G I- 0 1) = 0

n(AD - BC)2

, orul«

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 72/79

1 4 3 -0,5 0,25

2 6, 5 6 0 ,5 0,25

3 1,5 2 -6,5 42,25

4 9 9

° °8 8 -2 4

6 10 10 -8 84

7 6, 5 7 -0,5 0,25

8 4 4 2 4

9 1,5 -0,5 0,25

10 4 5 -0,5 0,25

L (G I - 0 1) 2= 0 2 = 135,5

Quando ha postos ernpatados, obtern-se uma media dos postos.

Para 0 grau de inst rucao 1 ocorreu empate, assim usa-se corrigir 0 posto

para 0 posto medic: (1 + 2) / 2 = 1,5. Para 0 grau de instrucao 2, onde

ha urn t rip lice empate, tern-se: (3 + 4 + 5) / 2 = 4, e assim por diante.

A etapa seguinte consiste em achar a diferenca de postos CI eQI para cada avaliado, eleva-las ao quadrado e sornar os resultados:

Aplica-se, entao, a formula para 0 calculo do rs

6X135,5= 1 - = 1 - 0 82 = 0 18

10(102-1) , ,r = 1 -s

concluindo que existe uma correlacao positiva fraca entre grau de

instrucao e QI, podendo ainda, mediante a consulta a uma tabela de

rs' obter-se 0 valor do r critico para 0 nivel de signif icancia desejado e

cornpara-lo com 0 rs obtido.

18. E possivel contornar 0 trabalhoso processo de calcular as

frequencias esperadas para obter um Qui-quadrado associado a urna

tabela 2 x 2, usando a seguinte formula:

144

' X ; = (A + B)(C + D)(A + C)(B + D)

A= frequencia observada para a casela superior esquerda

B= frequencia observada para a case!a superior direi ta

C= frequencia observada para a casela inferior esquerda

D= frequencia observada para a casela inferior direita

n = total de casos

Tern-se, desse modo, para 0 problema em questao:

71[(22X16) - (25X8)F= 1,18

(22 + 25)(8 + 16)(22 + 8)(25 + 16)

levando 0 valor calculado a urna tabela de Qui-quadrado. para 1 grew de

liberdade, obtern-se urn valor de p>O,25, considerado nao-significativo.

19. Esteroteiro constitui urna sugestao de teste para ser aplicado

as diferentes situacoes, podendo exist i r outras solLI<:;6espara 0 rnesrno

problema.

14 5

 

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 73/79

I

en

eooenW

E: : : : J

(f)

-" ' "CCO

0:"01(])i

C

a tCo><o.Sd

~

CCO

ED(])

It

COu-c;

.0 >

ECO

C i1a_

E(])

Q

~__o

> =ou

o,e oC

o,e o(f)

(f)

(])

0- ,(])

0:

§oz«c-,

~wc.o

Eoo

:g :b

~

~~g - 'S-iii EC i1 : : : : J(])0c~_ eoo (])1 (1 j . ~

(f)-

(f) 0Q CO

O)CQ : : : : J

0: 0

~-----~----~----~-----4-----~-----+-----+-----+-----

146

o>

~: . c -o

o0..::I

0,

E::I

~~oenwC

Eoo

o 0

g - .!:!e n - a >

EO::I .9-~.c<II ~....0<11-0..<11

E >

o E()::I

eno0..::>

0,

.~ f /)

o 0"0"0. ... < IIm.c(ija;0 .. . . ..

E : g _o EUw

eno

en1ilO m s:

E O : ;::I @00..

en E'w w':::0. .. . '<I If:! C

m en0..0

Eo..o 2Um

. ! : ! ! en

'"0E"O::I '"o£en ~

' C l > co

~o..:: Ef:! Cl>

m en0..0

Eo..o 2Um

G L o s s A R I O

Algumas palavras do idiorna ingles, alern das introduzidas ao

longo do texto, sao comuns no dia-a-dia do estatistico e daf a razao

deste glossario:

Absolute value - valor absolute. Trata-se do valor positivo de

urn numero, representado, habitualrnente, pelo mesmo entre duas

barras verticais como, por exemplo,

1 - 2 1 .Array - distribuicao de dados onde os valores 55.0 dispostos em

orde rn cresce nte.

Bias - vicio, vies, tendenciosidade.

Binary observation - observacao binaria. Trata-se de urna

rnedida qual itativa que s6 tern duas al ternativas possiveis.

Blind study - estudo cego ou mascarado. Os ensaios clinicos

podern ser divididos ern cego, duplo cego e triplo cego, confonne res-

pectivamente os pacientes, pacientes e equipe medica, ou pacientes,

equipe medica e equipe que analisa os resultados, nao possarn identi-

ficar quais os pacientes que recebern 0 agente estudado ou placebo

(ou 0 tratarnento convencional).

Bonferroni T procedure - procedirnento de Bonferroni: baseia-

seno fato de que quando sao feitas rnult ip las cornparacoes entre medias,

a chance de se encontrar urna estatisticamente s ignificante, por rnero

acaso (erro t ipo I), aurnenta rnuito. 0 rnetodo consiste ern dividi r 0 valor

 

de alfa pelo nurnero de cornpa racoes , por excmplo: p .l I" ( i ru n ( () ll lP " - Design - modele, desenho: estrutura de investigacao de uma

pesquisa.

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 74/79

racoes, cada urna com urn alfa de 0,05, 0 valor de al f,1(l st'r cscolhic!o.

para seconsiderar urn resultado como estatisticarnente significante, devc

ser 0,05/5 = 0,0-1 - isso para reduzir a chance de erro tipo I.

Carryover - carrearnento.

Case - caso: e a unidade para a qual sao tornadas as rnedidas:

nao e obrigatoriamente urna pessoa, podendo ser, por exemplo, urn

animal ou urn material em estudo. Frequentemente e usada como si-nonimo de observacao. Nas tabelas de dad os. usualmente cada linha

mostra 0 conjunto de valores das variaveis estudadas para cada CCiSO e

constitui 0 registro do caso em questao.

Case fatality rate - coeficiente de rnortalidade especffica.

Categorical observation - var iavel caregorlca (que e distribuida

por categorias).

Central Limit Theorem - teorerna do limite central. Para amos-

tras suficienternente grandes, a distribuicao das medias das mesrnas e

aproximadarnente normal, independentemente da distr ibuicao dos va-

lores na populacao - e por isso qlle a distribuicao normal e tao impor-

tante na analise de dados ,

Chance agreement - concordancia por chance.

Clinical trial - ensaio clinico.

Cohort - coorte; conjunto de pessoas que sao acornpanhadas

prospectivamente, com base na ocorrencia de lim evento cornum a

to da s e la s.

Concurrent controls - controles simultaneos. grupo controle.

Criterion variable - variavel resultante Oll clepenclente em lima

analise de regressao.

Crossover clinical trial - ensaio clinico cruzado, em que os

participantes sao divididos, ao acaso, em do is grupos: urn de teste e 0

outro de controle, sendo que esses grupos invertern de papel apos urn

deterrninado tempo.

Diagnostic threshold - lirniar de diagn6stico.

Dot plot - d i agrarna de pontos.

Dummy variable - var iavel codificada a que seatr ibui urn numero

(por exernplo, masculine = 1 e feminino = 0); esseart if ic io e usado, por

exernplo, para que essasvariaveis possam entrar numa equacao de regres-

sao ou para simplesrnente faci litar a entrada de dados nurna tabela.

End point - resultado final.

Explanatory variable - var iavel independente ou predictiva.

Extraneus variable - variavel confundfvel, fator de confusao -

observacao de urna assoc iacao entre duas variaveis que, de fato. nao

existe e e causada por uma tercei ra variavel . Urna variavel confundfvel

geralrnente tern as seguintes caracterfsticas: C I) esta assoc iada corn a

exposicao, b) e urn fator de risco p,ua a doenca independenternente

de exposicao e c) nao existe relacao causal ent re a exposicao e a doenca.

Gold standard - teste padrao usado como referencia para a

deterrninacao das caracterlsticas operacionais de lim novo metodo ou

teste diagn6stico.

Goodness of fit test - uso de Qu i-quadrado para deterrninar se

a distr ibuicao das variaveis categoricas observadas corresponde a uma

dada distr ibuicao conhecida ou teorica.

Hazard function - funcao acidental,

Homoscedasticity - hornoscedasticidade: propriedade das

arnostras mostrarem igual variabilidade.

Interquarti le range- intervale interquarti lico: e a distancia entre

os valores dos percentis 75 e 25; a sua utilidade depreende-se do fato

de nao ser faci lrnente afetada por valores extremes.

Inter-rater reliability - concordancia entre observadores: 0

quanta concordam dois observadores executando a mesma tarefa.

Intra-rater rel iabil ity - concordancia para 0 rnesrno observador:

 

concordancia entre resul tados ou julgarnentos que OCOIH' quando urn

mesmo observador executa a rnesrna tarefa d iversas vezes.

Phi coefficient - coeficicnt« phi: lI1l1.! l11<'ti id" < I" IllI<," ti('

.issociacao entre variaveis norninais, sernelh.mtc < 1U codici<'IlI<' < i ( '

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 75/79

levene's test - teste de Levene: usado pi1ra verif icar a igualdade

de d u as v a ri a nc ia s .

likelihood ratio - fndice de probabilidade.

longitudinal study - estudo longitudinal: aquele realizado

durante urn longo perfodo de tempo.

Mantel-Haenszel chi-square test - teste de Mantel-Haenszel:

teste estatfstico para 2 ou mais tabelas de contlngencla 2 X 2 usado para

comparar distribuicoes de sobrevivencia.

McNemar test - teste de McNemar, Trata-se de urna prova de

Qui-quadrado para comparar proporcoes entre grupos ernparelhados.

Meta analysis - meta anal ise: metodo de cornbinar resul tados

de pesquisas independentes objetivando dirninuir incertezas por meio

do aumento do tarnanho da arnostra e consequente aurnento do poder

estatistico. E particularrnente util em algumas quest6es terapeuticas e

ern estuclos de doencas raras, oncle obter-se grandes casu is t icas e pra-

ticamente im possivel.

Observacional study - estuclo observacional: aquele que nao

envolve intervencao ou manipulacao.

Odds - probabil idacle cia ocorrencia cle urn evento dividida pela

probabi lidade de sua nao ocorrencia.

Outcome variable - variavel resultante.

Outlier - valor nurnerico muito acima ou abaixo da media.

Parameter - pararnetro: medida numerica usada pari1 clescrever

algurna caracteristica populacional como, por exernplo. a media de todas

asestaturas de urna populacao: e representado habitualmente por letras

gregas b,u etc.).

Percenti Ie - percentil : e um valor numa eSG11,1e la l00, abaixo

e acirna do qual cai uma certa porcentagem clos resultados obtidos,

como por exernp!o: afirrnar que lim percentil 25 e igual a 330 signlfica

dizer que 25% dos resultados obtidos sao iguais ou rnenores que 330.

1r : ;n

correlacao usado para variaveis contfnuas.

Poisson distribution =distribuicao de Poisson. Uma distribuicao

de probabilidade usada para modelar 0 nurnero de vezes que urn evento

raro ocorre.

Post hoc (analisys) - analise a posteriori: analise nao especificada

antes dos dados terern sido colhidos e que pede ser sugerida pelos

mesmos.

Protocol- protocolo: urn procedimento. uma seria de instrucoes

ou diretr izes pClrClexecutar urna tarefa. visando reduzir vieses.

Reliability - confiabilidade: (1habilidade de urna medida ou

ur n teste reproduzir os mesmos resultados quando repetido n(1Smesrnas

condicoes.

Robust - robusto: qualidade de urn rnetodo que e suficien-

temente adequado p(1r(1supor tar (1anal ise de d ados que violarn os

pressupostos de urna distribuicao normal.

ROC (receiver operating characteristic) curve - Curva ROC:

diagrarna usado p(1r(1avaliar (1Spropriedades de urn teste diagnostlco.

apresenta os verdadeiro-positivos no eixo Y e os falso-positivos no

eixo X.

S.A.S. (Statistical Analysis System) - software estatfstico

abrangente.

S.P.S.S. (Statistical Package for Social Sciences) - software

e st at is ti co a b ra n ge nt e.

Scatter plot - diagrarna pontilhado.

Scheffe's procedure - procedirnento de Scheffe: urn metodo

de cornparacoes multiplas aplicado apos a obtencao de urn teste F

signi ficante - testa 2 (12 os grupos comparados.

Scientif ic notation - notacao cientif ica: forma PC1r(1xp,'ess(1r

numeros que cornportarn muitos zeros, utilizando urn nurnero de l a

151

 

1() mult ip lic.ulo por pol['llci,lS dc doz. Exemplos:

10 = 101; 100= 10"; 100.000 = 10"; 100.000.000 = '1011

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 76/79

1 = 100; 0,1 = '10-1; 0,01 = 10-2; 333.000.000 = 3,33 X '1011

0,0000314159 = 3,14'159 X 10-5

Score - escore, resultado.

Screening - exame de deteccao.

Skewed distribution - distribuicao assimetrica.

Standard normal distribution - distribuicao normal padrao: e

aquela que tern media igual a zero e desvio-padrao igual a 1.

Standard score - escore pad rao: 0mesmo que escore Z; ele rnostra

a quantos desvios-padrao, abaixo ou acima da media, urn caso esta,

Statistician - estatistico: diz-se da pessoa que se ocupa da

Estatfstica.

Stepwise regression - regressao sequencia!

Survey - levantarnento.

Trial - urn ou urna serie de experimentos repetidos ern que se

pretends verif icar, por exemplo, a chance de sucesso em n tentativas-

tr ials.

Trimmed mean - media aparada: e calculada tal qual a media

ari trnetica, exceto que uma deterrninada porcentagem de GISOS dentre

os maiores e dentre os menores e excluida. Uma media aparada de 5%

exclui 5% dos rnaiores e 5% dos menores resultados.

Trohoc - estudo de coorte retrospectivo.

Validity - validade: 0 quanta lima medida reflete 0 verdadeiro

valor do que esta sendo medido.

Variable =variavel: cada item de inforrnacao coletado com baseem cada caso. Nas tabelas de dados usual mente cada coluna representa

uma variavel. 0 conjunto de valores que ela pode assumir chama-sa

domin ic , mas se ela puder ter apenas urn valor, charna-se constante.

Weighted mean - media ponderada.

152

REFERENCIAS B IBL lOCR;\ F ICAS

COSTA NETO, PL. O. Estatrst ica. Sao Paulo, Edgard Blicher, '1977.

COSTA, S. F. I nt ro dw; ao i lu s tr ad a a estat lst ica. 3.ed. Sao Paulo,

Harbra, 1998.

DAWSON, B; TRAPp, R.C. Basic & c l inica l b ios ta t i s ti cs . 3.ed.

New York, Lange Medical Books/McCraw-Hili, 2001.

FLETCHER, R.H; FLETCHER, S.W; WACNER, E.H. Epidemiologia

clfnica: elementos essenciais: 3.ed. Porto Alegre, Artes

Medicas, '1996.

FREUND, J.E,; SIMON, C.A. Mo de rn e le m en ta ry s ta ti st ic s. 9.ed.

Upper Saddle River, Prent ice Hall , 1997.

C LANTZ, SA Primer of bio-statistics. 4.eel. New York, McCraw-

Hil l, 1997.

CRAPHPAD SOFTWARE. A s ta tis tic al c om pa nio n C ra ph Pa d

StatMate. Versionl.0 user's guide. San Diego, 1995.

CRAPH PAD SOFTWARE. The Instat gu ide to choo sing ane !

i nt er pr e ti ng s ta ti st ic al t es ts . A manual for Craphpad Instat

version 3. San Diego, 1990-1998.

HERMANSEN, M. B i os ta ti st ic s: s om e b as ic c on ce pt s. Evansville,

Mead Johnson, 1990.

JAISINCH, L.R. S ta tis tic s fo r th e u tte rly c onfu se d. New York,

McCraw-Hi li, 2000.

153

 

J OHNSON , R .A ; BHATTACHARVYA ,G .K . S ta ti st ic s p ri nc ip le s

a nd m etho ds. 4 .ed. N ew Y ork , Jo hn W iley & So ns, 2 001 .

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 77/79

KATZ ,M .H. Mu lt iv a ri ab le a na ly si s: a p ra ti ca l g ui de f or c li ni ci an s.

C am b rid ge , C am b rid ge U niv ers ity P re ss, 1 9 99 .

K IR KW OOD, B .R . Essent ia l s o f m e di ca l s ta ti st ic s. Oxford ,

B la c k w e ll , 1 9 9 5.

L A NG, T .A ; S EC lC , M . H o w to r ep ort sta tistic s in m e dic in e:

a nn ota te d g uid eli ne s fo r a uth or s, e dito rs , a nd re vie w ers.

P hila de lp hia , P o rt C ity P re ss, 1 99 7.

LEVIN,J . Es t a ti s ti c a ap l ic ada a c ie n ci es h umana s. 2 .e d. S ao P au lo ,

H ar bra , 1 98 7.

MARclLlO, C. Dicioneno de p esq uisa c1 inica . S a lv a do r, A r te s

C ra fi ca s, 1 9 95 .

M OT ULSK Y, H . I nt ui ti ve b io st at is ti cs . N ew Y ork , Oxfo rd

U n iv er si ty P re ss , 1 9 95 .

N ORU SIS , J. M . SPSS 8.0@ gu ide to d ata a na lys is . New J er se y ,

P re nt ic e H a ll, 1 9 98 .

S P IEGEL,M . R . Estatist ica. 3 . ed. Sa o P aulo , M ak ro n B oo k s, 1 99 3.

V IEIRA , S . B io es ta ti st ic a - t6 pic os a va nc ;a do s. R io de ja neiro ,

C am p us, 2 00 3.

/

INDICE REMISSIVO. .. . . . . .. .. .. .. .. .. . . . . . . ~ '" . . . . . . . . .. " . ..

A m ostra , 1 7

ta rna nho da , 76 , 77

Am plitude , 2 6

A n alise d e variancia, 1 1 4

A N OV A, 1 15

B on ferro ni, p ro cedim ento T , 1 4 7

Coefic iente

de deterrninacao.TZf

de Pea rso n, 1 24

de Spea rm an, 1 27

de variacao, 34

Correlacao, 1 2 1

Curva

de a justa mento , 1 22

de sobrevivencia, 56

Dado s

c on tin uo s, 2 1

intervalares, 21

no m ina is, 2 0

ordinals, 20

D ec il, 2 7

D ensid ade de p ro ba bilida de, 8 5

155

 

I)('SVio-p"dr,-lo, 211,32IIip6tese

alternativa, 76Discrepancia, 29

nula,74

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 78/79

Dispersao, 22, 26Histograma, 50

Distribuicao

de frequenc ias, 46, 84 Intervalo

de Qui-quadrado, 98 de confianca, 39, 41

F , 1 "16 , 117 interquartf lico, 27

normal, 42

t, 89, 90 Media

aritmet ica, 24Emparelhamento, 100 geometr ica, 24

Erro Mediana, 25

padrao da media, 35Moda,25

tipo I, 78Nfvel de slgnlflcancia, 78

tipo II, 78Notacao cientifica, 151

Escore reduzido, 44Nurneros aleat6rios, 18

Especif icidade, 135

EstatfsticaODDS RATIO, 132

analftica, 69

descr itiva, 13 Pararnetro. 49, 150

Estimacao, 49 Pequenas arnostras. teoria. 89

Estimador, 49 Percenti l, 27, 150

Estimativa, 49 Poder do teste, 81

Polfgonos de frequencia, 51

Frequencia Populacao. -17

acumulada, 47Quartil, 27

relat ive, 46Qui-quadrado, 95

Craficos

Razao. 132bar r as , 23, 50Regressao

caixa e linha, 53linear, 127

representacao. 50 rnult ipla, 136

tronco e folhas, 51 Risco

Cre\USde l iberdade, 93 atribufvel, 131

relat ive, 13-'

157156

 

S(·Il...hilid,ld(·,II,r,

Sigll iric:l IlCitl , nfvel, 78

Student, e n

5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com

http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 79/79

Tabe las

cont ingencia, 48

de frequencia, 46, 47

Tendencia central , 22

Teorema do lirnite central, 148

Teste

de Fisher, 104

de hip6tese, 75

de Qui-quadrado, 95

de significancia. 91

do sinal, 102

Mann-Whitney U , 108

McNemars, 104

nao-pararnetricos, 101

t, 91

Wilcoxon Signed Rank Sum, 107

Valor predictivo, 134

Variabi lidade das arnostras, 80

variancia, 28

da arnostra. 30

da populacao, 28

Variave], 152

Yates, correcao de, 97

Z, escore, 44

\

Cadastre-se e receba inforrnacoes

sobre nossos lancamentos,

novidades e promocoes.

Para obter inforrnacoes sobre lancamentos e novidades

do Grupo Editorial Campus, dentro dos assuntos do seu

interesse, basta cadastrar-se no nosso site.E rapido e faci l,

Alern do catalogo completo on-line, nosso site possui avancadosistema de bus cas para consultas, por autor, ti tulo ou assunto.

Voce vai ter acesso as mais importantes publicacoes sobre

Profissional Neg6cios, Profissional Tecnologia, Universitarios,

Educacao / Referencia

e Desenvolvimento Pessoal.

Nosso site conta com modulo de seguran<;a de Ultima gera<;ao

para suas compras.

Tudo ao seu alcance, 24 horas por dia.

\ Clique www.campus.com.br e fique sempre bern informado>~ /

www.campus.com.br