introducao a a - ulysses doria filho
TRANSCRIPT
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 1/79
Produzlr lelturo de quolidode, levondo ao leltor Informoc;Oes
e tend6ncios que ajudem a desenvolver seus conhecimentos
e percepcoes. Nossa rnissdo e apoiar os lei tores na reolizocdo
de seus objetivos pessoais e profissionais.
B o o L e itu ro l
Associacao Brasileira para
a Protecao dos Direitos
Editoriais e Autorais
RESPEITE 0 AUTOR
NAO FACA COPIA
INTRODUC;Ao A BIOESTATisTICA
ELSEVIER
Para simples mortais
v » Tiragem
ULYSSES DORIA FILHO I )
1 1 1 1 1 1 1 1208197
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 2/79
SUMARIO'" '" " .. " .. '" " .. '" ..
Prefacio 9
Apresenta<;:ao1 -I
PARTE 1
Estatfstica Descritiva
Introducao a Bioestatfstica
Por que a Estatistica e necessaria?
Estati stica Descritiva
Tipos de dados
Tendencia central e dispersao
Descricao de dados nominais e ordinais
Descrevendo dados continuos
Medidas de dispersao
Entendendo 0 percentil
Variancia e desvio-padrao
Desvio-padrao
Coeficiente de var iacao
Erro padrao da media
Desvio-padrao x erro padrao da media
Intervalo de confianca para medias
Entendendo intervalos de confianca
em outras situacoesDistribuicao normal
Estat is tica Z (escore Z)
Distribuicoes de frequencias
Terrnos que causarn confusao
Representacao grafica
Curvas de sobrevivencia: uma representacao
grafica nao tao intui tiva
Teste 0 seu conhecimento
Respostas dos exercicios 1 a 12
13
15
16
17
20
22
23
24
26
27
28
32
34
35
38
39
4142
44
46
49
50
56
58
61
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 3/79
PAW 2
EstaHstica Analftlca ( ou I nd u tl va )
lntroducao
Entendendo 0 valor de p
Entendendo a hip6tese nula (H( )
Testando hip6teses
Entendendo os er ros
Por que ocorrern erros ao testar h ip6teses?
Entendendo a var iabi lidade das arnostras
Entendendo 0 poder do estudo
Evitando erros
Distr ibuicoes de frequencias
Entendendo os testes de signi ficancia
Distribuicao t (Student)
Entendendo 0 teste t
Entendendo 0 teste de Qui-quadrado
Entendendo a escolha de urn teste de signi ficancia
(ou de hip6tese ou, a inda de regras de decisao)
Entendendo 0ernparelharnento
Nocoes de testes estatfsticos nao-pararnetricos
Testes estatfsticos para dados norninais
Testes estansticos nao-pararnetricos
para dados ordinais
Testes estatfsticos para dados contfnuos
Nocoes de anali se de var iancia
ANOVA e a estatfst ica F
Entendendo os varios t ipos de testes Anova
Correlacao e a regressao linear
Regressao ou correlacaor
Entendendo valor predict ivo,
sensibilidade e especificidade
Nocoes de regressao l inear multiple
Teste seu conhecirnentoRespostas dos exercfcios 13 a 19
(,1)
7 1
7 '2
74
7 :>
78
79
80
8182
84
87
89
91
95
99
100
101
102
105
111
114
115
119
12"1
13 0
13 4
13 6
13 8
141
Glossario
Referencias bibliograficas
fndice rernissivo
147
153
155
8
PREFAcIO:
Caro leitor, voce tern grande chance de pertencer aquele grupo
que "torceu 0 nariz" para a maternatica e, posteriormente, repetiu 0
ato com a estatfstica. Nao existe nada de errado com essasdisciplinas:
o problema e a maneira como sao veiculadas,
Deve, tambern, "ter comido gato por lebre" ao aceitar
condusoes, que careciam de fundamentacao metodol6gica e estatfstica,
de autores de artigos cientfficos. No entanto, a estatfstica nao realiza
milagres. Elaapenastraduz, emlinguagem adequada e cientffica, aquilo
que0
fenomeno que se investiga estaq uerendo dizer. Nao ha como"forc;:ar a barra". Um projeto de pesquisa mal formulado
metodologicamente nao pode ser salvo pela estatfstica.
o Departamento de Pediatria da Faculdade de Medicina da
Universidade de Sao Paulo passa, no momento, por revisao e
irnplernentacao do seu campo de pesquisa. E natural que pessoas
inteligentes e compromissadas adirarn a esseprojeto. 0 Dr. Ulysses
resolveu aceitar 0 desafio de elaborar LIm livro de estatfstica que ele
co-denominou "para simples mortals".
o seu conteudo, quanto a clareza e ao rigor, foi testado no
curso que ele realizou junto a medicos e outros profissionais dessa
instituicao. 0 resultado foi fantastico e plenamente aprovado. Agora,
ele submete este livro a sua apreciacao. meu caro leitor. Acho que
voce vai se surpreender.
Prof. Yassuhiko Okay
Professor titular
Departamento de Pediatria da FMUSP
9
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 4/79
______ --~~P-.'.-.. ":.
",' ~-:\'Tlct. ~~_, ___:
AP RES EN T A c ; A o.. '" . " '" " '" " '" '" " .. " ..
Lembrando das muitas dificuldades que tive, das dificeis aulas
ell' Estatis tica a que assisti e das duvidas simples que tenho ajudado a
resolver, ocorreu-rne escrever algum texto que pudesse ajudar aquele
que se inicia no campo da pesquisa e que, fatalmente, ira deparar
COIll problemas estatisticos.
Todo prof issional da saude. nao importa sua area de atuacao,
cs ta constantemente exposto ao uso da Estatistica, v isto que os textos
cientfficos raramente deixarn de citar algum de seus nurnerosos
aspectos. Por isso, e importante que ele dornine, no rninimo, os aspectos
basicos dessa ciencia, para que esteja em condicoes de julgar aquilo
que esta lendo.
A rnaior parte dos livros dessa area do conhecimento sao, para
os iniciantes, de dificil compreensao, talvez pela abordagem
excessivamente maternatica. 0 que procurei fazer, na qualidade de
medico, foi apresentar 0 tema de um modo compreensivel para nos,
que nao sornos exper t s na referida materia. Alern do que, com 0advento
dos computadores e 0 surgimento dos sof twares estatisticos, todos
passaram a ter condicoes de executar calculos estatisticos, pelos menos
aqueles mais simples, desde que dominem as nocces basicas.
Os exercicios propostos forarn escolhidos para esclarecer
melhor 0 assunto e para acrescentar conhecimentos, assim, rnesrno
que 0 leitor nao tente resolve-los, sugiro que leia as respostas.
Nao ha pretensao de esgotar 0 assunto neste livro, mas
simplesmente de auxiliar na cornpreensao dos principios basicos
11
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 5/79
d ( , . . , . , , , (WIll i" ( 'I1.11I1.1d" I . . , t " t i s t i ( " . ('()IIH) m (()l1ht'( iIlH'111()..,....11)
progrcssfvos e orden.ulos, l'it' <ll'V(' sor lido" part ir d( ) (.1pil ll l() i ll i ti" I.
Costaria de agrndeccr ao Professor Cl.iudio l.cone polas
val iosas sugestoes que, tenho certeza, em muito contr ibuf ram P '1 r .1 ( )
aperfeicoarncnto do texto deste livro e ao Professor Yassuhiko Okay
pelo incent ivo para transformar aqui lo que seria apenas urna aposti !a,
nesta publicacao.
Ulysses Doria Filho
E-mail: [email protected]
12
ESTATfsTICA DESCRITIVA
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 6/79
INTRODU(:Ao A BIOESTATfsTICA
A palavra estatfstica tern origem no latim, status (estado), e
.lbrigou, durante muito tempo, sob essa denorninacao, informacoes
rcferentes ao Estado - ha outras versoes. Numa conceituacao generica.
cia pode ser considerada como a ciencia que se preocupa com a coleta,
organizacao, descricao. analise e interpretacao de dados experimentais.
Nern sempre a Estatfstica e bern vista. Essarna fama deve-se ao
fato de ser, muitas vezes, mal aplicada ou superenfatizada, pela nao
cornpreensao do significado correto de termos, como erro, normal,
correlacao e significante, que, em Estatfstica, tern um significado proprio,
diferente do usual, e pela interface, nern sempre facil, entre ciencia e
rnaternatica.
A Estatfstica pode ser usada para simplesrnente descrever dados
(Estatfstica Descrit iva), mostrando seus subtipos, sua distr ibuicao,
f requencia, media etc., ou para comparar grupos e fazer general izacoes
a partir de resultados obtidos (Estatfstica lndutiva ou Analltica). Estao
intimamente a ela ligados, os processos de amostragem eo calculo de
probabil idades, a respeito dos quais serao tecidos breves cornentarios
considerados indispensaveis,
15
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 7/79
P OR QUE A ESTATfsTICA E NECEssARIA?. I 4 > . . . I . , " • « • to
• As pessoas sao condescendentes com os dados, especial-
mente com os pr6prios.
• As diferencas. nao rararnente, sao atribuidas a causas erradas.
• Ascoinc idencias ocorrern mais frequenternente do que seintui .
• Os cerebros hurnanos tern dificuldade para lidar com
probabilidades,
• Acrescentar polirnento as publicacoes e apresentacoes,
• Para saber 0 grau de certeza das conclusoes t iradas.
• Grande parte das publicacoes na area da Saude apresenta
problemas metodol6gicos e estatisticos.
16
ESTATfsT ICA DESCRIT IVA
Dois conceitos inicia is devern estar bern claros: 0 de popu lac ao
('0 de amostra, po is e delas que sao extrafdos osdados que dao origem
;ls diversas relacoes estatisticas, como media aritmetica, desvio-padrao
ctc.. e que, ern ult ima analise, possibilitarn descreve-las sob os rnais
d iversos aspectos.
Populacao: qualquer conjunto de inforrnacoes que tenharn en-
tre s i uma caracterfst ica com urn que deli rn ite, inequivocarnente. quais
elementos pertencem a ela. Nurna cidade, por exernplo. 0 conjunto
das esta turas de todos os seus habi tan-
tes constitui um a " po p ula ca o de esta-
turas". 0 ta rn an ho de u rn a p o pu la c ao
e habitual mente expresso pela letra N
(rnai uscu la).
Se uma pesquisa incluir
todos os membros das
populocces em estudo,
todas as diferenccs e
taxas encontradas serdo Amostras: sao subconjuntos
verdadeiras. representativos de urna dada popula-
<:;ao.A arnostra deve ser representativa
da populacao da qual foi extraida, ser
parecida com ela (qual itat iva e quanti ta tivarnente), devendo obedecer
a dois pr incfp ios basicos:
1. deve ser suficientemente grande;
2. seus constitu intes devem ter sido selecionados ao acaso.
Selecao ao acaso - random - sign i fica que cada um dos com po-
nentes da populacao estudada tern a rnesma chance de ser incluido na
17
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 8/79
.uuo ...r.l (', .11 ('11 1dis!'.o, <jIll' lo i . . ,pl (·cio l1.Hlo i l ld ( ' ll l 'IHII 'IU( '11l( '111( ' , II <jIll '
implied <jll(' .1 inclus.io dt· lIl11 partirnl.ir 11H '11111'0 11,'11) .dll·rcl d Ch.lIH·('
de inclusao cJosclemais. So isso nao ocorrer, cliz-sc qlll'.1 .u no strn (. l1.tO
randornizada ou viciada - biased.
Urna rnaneira pratica de selecionar um a arnostra randornizada epor rneio do uso de nurneros aleat6rios, que podern ser obtidos em ta-
belas a p ro p ri a da s ( en co n tr a da s em livros e softwares de estatfstica) ou
par meio de planilhas elet ronicas, como Excel, nas quais e possfvel del i-
rnitar algumas caracterfst icas desses nurneros como, por exernplo , 0 in-
tervalo de variacao desejado.
A arnostra constitui uma reducao da populacao a dimensoes
rnenores, sern perda das caracterfsticas essenciais. 0 seu tarnanho e
habitualmente expresso pela letra n (rninuscula).
A tabe!a 1 contern uma serie de nurneros aleatorios: para ut il iza-
la deve-se iniciar pelo cruzarnento entre urna linha e uma coluna qual-
quer e definir urn caminho a ser seguido, por exemplo, para a direita
ou para baixo. Caso 0 nurnero encontrado nao se aplique. ou urna
repeticao de nurnero nao seja adequada, passa-se ao seguinte.
o objetivo da esta tfstica descritiva e descrever os d ado s o btido s
nurn estudo, evidenciando seus atr ibutos, tais como media, mediana.
mo da - pouco usada , desvio padrao etc.
T ab e la 1 . E xtr ato d e ta bu a d e n um e ro s a le at6 rio s
C ol u na :: :) 1 2 3 4 5 6 7 8 9 10
Linha D
9 8 9 6 9 9 0 9 6 3
2 3 5 6 7 4 3 2 6
3 4 0 6 1 6 9 6 1 5 9
4 6 5 6 3 1 6 8 6 7 2
5 2 4 9 7 9 0 3 9 6
18
C)ll'llllin O~ d'lIlm ('~I,'o e l l ' ' ' ( 1'110., lOll( i"d, IOlllpl('ld (.
,H,,,.Hlclll11'Il!t·, pOdl'1l1 ..,('r(,Ipi., pdrd 1,1/( '" illl(·r(·IH"id", g(·IH·,..di/dl.;'-)(,s
"olm' ciSpoplIl.H./)(·S qll(~ dcr.un origom .I S . un o st r. is e st ud a da s .
I )t'V(' sc'rnpre se r lernbrado que dl fe rencas irnportantes podern
('stl lr mascaradas pela variabilidade biologlca e imprecisao experimen-
t.ll (' que (1 incl inacao natural, especial mente para com os pr6prios da-
dos. c concluir que eventuais diferencas encontradas sao reais e nao
dependentes da variabil idade das amostras.
Do ponto de vista purarnente estatfstico, as general izac;:oes se
aplicarn sornente as populacoes que forneeeram asarnostras, mas pode-
se usar 0 julgamento cientffico e 0 born senso para fazer inferencias
que vao alern da Estatfstica.
Entretanto, frequenternente, deserever uma populacao ou uma
arnostra e insufieiente, sendo neces-
sario , por exemplo, c orn pa ra r d ua s ou
rna is a rnost ra s , isto e , verif iear se elas
pertencern a rnesrna populacao ou
nao. Paratanto, deve-se usar inicial-
mente a E st at is ti ca D e sc ri ti va paradescreve-las e, entao, apl icar terra-
rnenta s da Estatfstica Anali t ica para
fazer as inferencias.
E 0 usa dessas ferramentas
que perrnite ao pesquisador ir alern
dos dados. lnferencias signif icat ivas sobre urna deterrninada popula-
<,;aodependem ern grande parte da validade e acuracia das estatisti-
cas usadas.
Dodos imprecisos, amostras
viciadas, populccces mal
definidas e cr-iterios
subjetivos levam a
resultados igualmente
imprecisos, que a estatistica
nco pode e nco deve tentar
salvor.
Apalavra "estatlstica" pode ser usada como sinonirno de qual-
quer relacao estudada e assim, a media e a mediana, sao estatisticas.
19
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 9/79
TIPOS DE DADOS
Para realizar calculos estatfsticos uma das primeiras coisas a serem
feitas e caracterizar qual t ipo de dados estasendo trabalhado, pois muitas
estat fsticas apl icaveis a um, nao sao adequadas para outros.
Os dados podem, de acordo com
o nfvel de rnensuracao e simplifi-
cadamente, ser agrupados em tres tipos
basicos: nominais, ordinais e continuos.
Dados nominais sao todos aqueles
distribufdos em categorias nominais, sem qualquer ordem. Exemplos
desta categoria incluem sexo, raca, evolucao (morte ou sobrevivencia),
via de parto, cor dos olhos etc.. Podem se codificados atraves de
nurneros, por exemplo, feminino = 1 e masculino = 2, com os quais
obviamente nao sao perrni tidos calculos como media e desvio-padrao
dentre outros. Na realidade estes dados nao sao mensurados mas
simplesmente contados - conta-se 0 nurnero de observacoes com ou
sem 0 atributo de interesse. Sao geralmente descritos em termos de
porcentagens e proporcoes e apresentados na forma de diagramas de
barras, "pizzas" e tabelas de contlngencia.
Dados ordinais sao aqueles que se distribuem por categorias
que tern uma ordem. Neste tipo de dado nao ha valores intermediaries
entre as categorias e uma mesma diferenca nurnerica nao tem sempre
o mesmo significado. Aqui se incluem escores diversos como Escala de
Apgar, de Glasgow, graus de retinopatia, CRIB, Papanicolaou etc.. A
mesma ressalva quanta a calculos feita para os dados nominais, aqui
E crucial entender os
diferentes tipos de
dados.
20
t .unbem se apl ica. Frequenternente a rnediana e usada para descreve-
los mas, tambern, proporcoes e porcentagens podem ser util izadas.
Dados continuos - r atio data - sao aqueles em que os nurneros
s:io int rinsecamente signi ficantes e asdiferencas entre eles sempre tem
.I mesma implicacao, podendo sempre existi r valores intermediar ies.
Peso, perfmetro cefalico e estatura sao bons exernplos deste tipo de
dados: urna diferenca entre as estaturas 112 cm e 105 cm tern 0
rnesrno significado que urna diferenca entre 78 cm e 71 cm, isto e , ela
C de 7 cm ern ambos os casos.
Algumas vezes fala-se em dados intervalares quando se refe-
r indo a valores obtidos mediante a aplicacao de uma unidade de rnedida
arbit raria, porern constante e onde 0 zero e relativo, como ocorre, por
exemplo, com graus Celsius. Este tipo tarnbern apresenta restricoes a
calculos. Ver exercfcio 4.
21
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 10/79
TEN DEN CIA C EN TR AL E D ISP ER SA o• .. • tI .. • .. tI .. .. "" .. ~ '" .. .. It .. • <II
A medida da tendencia central da uma ideia de onde se locali-
za 0 centro, 0 ponto medio de determinado conjunto de dados. H a
varias maneiras de expressa-la como a media e a mediana.
Urn outro conceito importante e 0 de dispersao, isto e, 0 modo
como osdados seposicionam ao redor do ponto central . Verf igura 1. Uma
populacao e di ta hornogenea quando a dispersao e pequena.
A dispersao dos dados pode ser avaliada at raves de uma serie de
medidas como 0 desvio-padrao, a variancia e a amplitude total.
Figura 1. Tendenc ia cent ral e d ispersao
T e n d e n c i a
central
-+---- D i sp e rs a o - -- _
22
DESCR Ic _::Ao DE DADOS
NOM IN AIS E O RD IN AlS
Essestipos de dados sao muito faceis de serem descritos; geral-
mente, basta apresentar 0 seu nurnero (valores absolutes) e distr ibui-
< . . : 1 0 (porcentagem por categoria).
Frequenternente, podem ser apresentados atraves de diagramas
de barras verticais (colunas) ou os chamados setoriais, como as"pizzas"
(' "roscas" - doughnuts .
Figura 2 . E x em p lo d e q r af ic o d e c ol un as ( a) e s e to ri al ( b)
D ls tr lb u ic ao p or s e x o
(a) (b )
Femin ino
57 %
23
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 11/79
DESCREVENDO DADOS CONTIN UO S
Este tipo de dado pode ser trabalhado para gerar inforrnacoes
que expressem a tendencia central e a dispersao.
As mais comuns medidas de tendencia central sao a media arit-
rnetica, a mediana e a moda. Algumas vezes, entretanto, quando se
trata de dados com distribuicao assirnetrica, e mais apropriado 0 usa
da media geornetrica.
A media aritmetlca e definida como a soma dos valores obser-
vados, dividida pelo nurnero de observacoes, E habitualmente repre-
sentada por x quando se trata de amostras e por Jl quandose t rata de
populacoes, Seu usa e adequado quando a distribuicao dos dados obe-
dece a forma de uma curva de Gauss (em sino). A medida que 0 tarna-
nho da amostra aumenta, ha maior chance de aparecer um valor
extremo e deslocar a media em sua direcao. Nao se aplica a dados
nominais.- L XX =-n-
A media geometrlca (MG) e definida como a raiz n esima do
produto dos "n" resultados obtidos. Ela e menor que a media aritrneti-
ca, na o sofre tanto a influencia de valores extremos e e particularmen-
te util quando se lida com nurneros que se distribuem em progressao
24
HC '' 'l ll l' 'l ri l' tI ( 01 1 1 " I C ' ., ,, I I. ,, I " . . ( 'x pn '! oI sm 1 1 .1 1 ( 1 11 1 1" d c · 111"1",,(In, 1 /, 1 , 1 /
I I, 1 /1 1 1 .. . ) .
1 1 .......- _
M e = ~ (X )(X )(X ) ... (X )1 l J 11
A mediana (Mel) e definiela como aquele valor que, uma vez
()lcic'l)ddos toelos os resultados, deixa igual nurnero de resultados de
( .Idol lado. Numa disrr ibuicao assimetrica ela e multo mais representa-
tiv.: el;) populacao do que a media. Eventualrnente, pode ser usada
(0111 dados ord inais.
A moda (Mo) e definida como 0 valor mais frequents e e usada
primariarnente para descrever distribuicoes bimodais.
Considere-se os seguintes resultados brutos obticJos, componen-
I('s de urna determinada arnostra:
66 66 69 71
66 66 68 72
56 63 64 65
57 64 64 65
n = 16
L x = 1.042
-= 1.042= 651x .16 '
Md -_ 66 + 65 6 *= 5,5
2
Mo = 66
MG = 16~ 56.57.63.64.64.64.65.65.66.66.66.66.68.69.71.72 = 64,9
* Neste caso, deve-se usar a media aritmet ica dos dois valores
centrais visto n ser urn nurnero par.
25
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 12/79
MEDIDAS DE DISPERSAo
A dispersao dos dados e freqLientemente charnada de variabi-
lidade. As medidas de dispersao rnais usadas sao: 0 desvio-padrao
(DP) - s tandard dev ia tio n (SO - s), a
A dispersdo dos dados
na amostra e menor que
a da populccco que Ihe
deu origem.
variancia e a amplitude total ou intervalo
de variacao - range .
A ampl itude total e a di ferenca en-
tre 0 mais alto e 0 rnais baixo valor obser-
vado; ela nao infonna como os dados sedistribuem entre esses valores e, a medida
que a arnostra cresce, ela cresce t arnbern , devido a urna rnaior chance
de aparecer um valor extremo. Ver figura 3.
Figura 3 . D is pe rs ao d e dad os n a a m os tr a e n a p opu lac ao .
D ispe rsao dos dados na
amostra
/~ '\ Dispe rsao dos dados napopulacao
\
26
ENTENDENDO 0 PERCENTIL
Suponha que urn deterrninado paciente, aos cinco anos, pese
15kg e que sedeseje saber como ele se situa dentro de sua cornunida-
de; para fazer essa anal ise pode-se usar uma distr ibuicao de porcenta-
gens acumuladas conhecida como percent il.
o percentil e obtido dividindo-se a populacao . organizada em
ordem crescente, em 100 partes iguais. Ele indica a porcentagem do
total de observacoes que sao iguais ou sesituarn abaixo de urn determi-
nado valor. No exernplo anterior, se 0 escore 15 corresponder ao posto
percentil 90, entao 90% dos habitantes da referida comunidade aos
cinco anos de idade, pesam 15 kg ou menos.
Seurn deterrninado resultado situa-se no percentil50, exatamente
50% dos resul tados sao menores ou iguais ao rnesrno e 50% sao maiores,
o que significa que 0 percentil 50 corresponde a mediana.
Quando a populacao e dividida
em dez partes iguais, fala-se em decil, e
quando e dividida em quatro partes, em
quartil. 0primeiro quartil inclui 25% clos
valores mais baixos: 0 segundo quart ilcorresponde ao percentil 50 e a media-
na, e assirn pOI'diante.
o charnado intervale interquartllico
e a distancia entre os valores do 750 e 25° percentis. A vantagern do seu
uso, em relacao ao da amplitude total, decorre do fato de nao sofrer
influencia dos valores extremes.
E errado utilizar a
expressdo "percenti I
50/0". 0 uso correto e
percentil 50 ou quinque-gesimo percentil.
27
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 13/79
VARIANCIA E DESVIO-PADRAO
Observando-se urn eonjunto de dados, com a media dos mes-
mos ja ealeulada, ver if iea-se que eles se distr ibuem ao redor desta m e -dia, para mais e para menos. Quanto mais proximos da media estiverem,
mais hornogeneo sera 0 eonjunto. Assim, ha um interesse em medir 0
quanta os valores obtidos se afastam, 0 que pode ser feito pelo desvio-
padrao e pela variancia.
Vamos supor que um pequeno vilarejo tenha somente 11 habi-
tantes e quealguern deeida avaliar a estatura desse grupo. As 11 esta-
turas afer idas representam toda a populacao de estaturas e nao somente
urna parte - arnostra e estao apresentadas no quadro 1.
Quadro 1 . E st at ur as d a pop u la ca o e e s ta tis tic as
Est atu r as d a p op ula ca o ( N = 11 )
13 5
13 6
13 8
14 1
14 3
15 2
15 2
15 2
15 7
16 3
Media (mean)= Soma / N= 1639/11 = 149= Il
Mediana (median)= 15 2
Valor maximo= 170Valor mfnimo= 135
Amplitude total (range)= 170 - 135 = 35
17 0
28
1 ' , 1 1 ' , 1 ('"lnll,1I , I V , I , .I , ~ I1 < ' I " d(,.....1 pop"I,I(.',,)o, (, IH'II,.,."llio ..,11)('1l l i c i -
,11"1('111('ll,II110 (',ul,1 r"o,lIl1.HloS(' "relSlo1d,l I1H·,diel.oI1H) ('SS('S n'Sllll,Hlos
',I' , 1 1 " . .101111,1Il11l p.lI"l 111,1is'(11110 p.lr,1 IlH'nOS,oIM'I1I-S(' r e s u l r . u l o s IJosili-
Voo,( ' lH 'gc l livos. A 1 .1 1 > 1 '1 " '2 rnostr.i a si IUt1( .; . " iode C Hid cstatu ra e m relacao a
t ' .. t.llllt'c1 1 1 1 ( ' < 1 i.1.
Tab e la 2 . E st at ur as e c al cu lo s
Estatu ras Estatu ra - M edia(ll)
13 5
13 6
13 8
14 1
14 3
15 2
15 2
15 2
15 7
16 3
17 0
135 -149 = -14
13 6 - 14 9 = -13
13 8 - 149 = -11
14 1 -1 49 = - 8
1 4 3 - 1 4 9 = - 6
15 2 -1 49 = 3
15 2 -1 49 = 3
15 2 -149 = 3
15 7 -149 = 8
16 3 -1 49 = 14
170 -149= 21
Eleva-se, entao. cada diferenca encontrada - discrepancia - ao
qu.ulmdo, sornando-se a seguir osquadrados obtidos, conforme tabela 3.
I )ell'd obter a variancia, representada por o',dessa popu lac,,:aode estatu-
leiS, { , preeiso dividir a soma dos quadrados obtida pelo seu tamanho
(N), Essea rtiffcio de elevar eada diferenca ao quadrado e usado por-
'flU', se fossem simplesmente somados os valores, aqueles posi tivos e
III 'g"tivos se anulariam e, ainda, se fossem considerados apenas os va -
loros absolutes, 0 fato de urn valor se situar para UI1l lado ou para outro
del media nao ter ia a minima importancia.
29
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 14/79
Tablla 3 . E s la lu r as e c B lc u lo s,---------===.=:....:===.:::_.::.=;==-----_ ..-~--,~
Esta tu r a - M edia (Il)staturas (Es ta tu r a - M edla )2
13 5
13 6
13 8
14 1
14 3
15 2
15 2
15 2
15 7
16 3
17 0
135 - 149 = -14
136 - 149 = -13
138 - 149 = -11
141 -149 = - 8
143 -149 = - 6
152 -149 = 3
152 -149 = 3
152 -149 = 3
157 -149 = 8
16 3 -149 = 14
170 -149= 21
(-14 )2 = 1 96
(-13 )2 = 1 69
(-11)2 = 121
(-8 )2 = 64
(-6 )2 = 36
(3)2= 9
(3)2 = 9
( 3 ) 2= 9
(8)2 = 64
(14 )2 = 1 96
(2 1) 2 = 4 41
N = 11 Soma = 1 .3 1 4
Variancia da populacao =o'= 2:(x-l-l)2 =1.314 = 11945
N 11 '
A variancia calculada dessa forma apl ica-se para populacoes, 0
desvio-padrao e a raiz quadrada da variancia. Extrai-se a raiz quadrada
para obter uma estatfs tica com a mesma unidade de medida utilizada
para os valores.
Oe sv io - pa d ri io d a p o p ul a. ;a o = cr = ~ ' = 0119 ,454 = 10,92
Se estes 11 habi tantes fossem, entretanto, uma amostra de certa
populacao, tornar-se-ia necessario fazer um ajuste rnaternatico, porque
os valores das amostras sao mais pr6ximos da media da amostra do que
realmente ocorre na populacao, isto porque a dispersao dos dados na
amostra e menor que a dispersao dos mesmos na populacao onde 0
aparecimento de valores extremos e muito mais facil de ocorrer. Como
o desvio-padrao da amostra e um estimador do desvio-padrao da
populacao e necessario corrigi-Io (aurnenta-lo) para torna-lo mais
pr6ximo do seu valor real na populacao. Diminuindo-se 1 do
denominador calcula-se um valor mais adequado do desvio-padrao e
30
dfl vMI,~n('lao nh!ll'rVoH ' IIH' , I i nf il li 'n cl ll tlt'slt' dl'cr('sl'imo IlO
denomlnador torn.i-se d(!sprC'/fwl .) llH 'd id .I q ll(, c re sc o () t.un.mho dil
.unostr.i,
2: (X-X)2
n - 1
1.314=131,40
11 - 1
Variancia da amostra =52 =V =
D es vi o -p a dr ao d a a m o st ra = 5 = OJ' = 0 L (x-x) ' = 'J 1 3 1 , 4 0 0 = 1 1 , 4 3n -1
31
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 15/79
F ig u ra 4 . D e sv os -p ac ra o e t ra co e s d a p op u la ca o i nc lu id a
-DE5YIO-PADRAO Media
Emterrnos simples, desvio-padrao (DP) -s ta nd ar d d ev ia ti on (S O ),
e urn modo de representar a dispersao dos dados
ao redor da media. Se os claclos obedecerem aEntendendo 0
lima distr ibuicao normal, toclos estarao compre-
encliclos por urna curva em forma de sino; eles se
dist ribui rao simetr icamente ao redor da media.
o quadro 2 rnostra os dados conticlos en-
tre desvios-padrao para ambos os lades cia media.
signif icado do
desvi o-pcdrco
Quad ro 2 . Par ce la e n v ol vi da d a p op u la ca o e n tr e d e sv io s- pa cr ao
Media +( ) Desvlo-padrao % d a p op u la ca o i nc lu id a Grosse i ramente
1 68,3 2/3 da popu lacao
1,96 95,0
2 95,5 9 5% da popu la cao
2,58 99,0
3 99,7 1 0 0% d a p op u la ca o
32
A flglll', I il ('on..illl' " 1 1 1 , 1 1I'lnt''''I'I1I,I!~'''o gr , ' I l i l , I d " . . , f r , I I , ( H ' ' ' ' d o l
popIII,I(,,'IO <i"(' "..,1,10 j"dllrd".., ('Illn' diVt'l'sos d('svios-p'Hlr(~H).
~~~_~~~~~_95,5°~~~_~~~~~~_~ .
99,7%
33
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 16/79
COEF IC IENTE DE VARIA~Ao
o coeficiente devorioc;:ao independe
do unidode de
medido usodo.
A magni tude do desvio-padrao depen-
de da unidade de rnedida de uma variavel par-
ticular e, assim, urn desvio-padrao medido em
dias sera numericamente multo maier do que
o mesmo desvio medido em meses. 0 cha-
made coeficiente de variacao - coeff icient of
variation, expressa 0 desvio-padrao como por-
centagem do valor da media.
Desvio-padrao
[media]oef iciente de variacao = X 100
Urn coeficiente de variacao igual a 100% indica que 0 desvio-
padrao e igual a media; quanta menor ele for , rnais hornogenea sera a
arnos t r a .
o uso deste coeficiente perrni te comparar dispersoes de dados
entre estudos onde forarn usadas unidades de medida diferentes,
polegada e centfmetro, por exemplo.
34
ERRO P AoRAo OA MED IA
A Ill(·diil calculada para uma arnostra dificilmente sera igual a
I1U"<li" (r(' ,II) elil populacao. 0 tamanho da discrepanc ia depende do
t.un.mho elil arnostra e da variabilidade dos dados: medias baseadas
"Il l grande nurnero de casos variam menos do que as baseadas em
pl'Cflwno nurnero e medias de populacoes com pequena variabilida-
c l l ' variam menos que medias de populacoes com grande variabili-
dude. Quando urna arnostra e escolhida ao acaso e e suf icientemente
K I " ' H i < ' , ( 'Ii I tern caracterfsticas que se aproximam bastante daquelas da
pClp,d,\(,Jio da qual foi extrafda. Mas, qual eo grau de certeza de que a
Ilu'dicl d, l arnostra representa a media verdadeira da populacao? Se fo-
11'111's(olhidas varias, e consequenternente diferentes. arnostras de uma
Ill l'Sl llcl populacao e calculadas asmedias de cada uma destas arnostras.
',1'1,"obticla urna serie de medias diferentes, todas elas representativas
dol 11H'Smapopulacao. Ver f igu ra 5.
F i g u ra 5 . D i sc re p a n ci a e n tr e a s m e d ia s d e d ife re n te s a m os tr as d a m e sm a populacao
Media
da
Populacao
- +. . . - - -- -- -- -- . . + i
I l.Dife ren 'ya
en t r e 0 r eal
e o a pu ra do! !
.J . .J .i, .
Media M e dia
da da
am ostra B am ostra A. .. .. .. .. .. .. .. _ _ ._ - _ _ j
35
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 17/79
V('rilk.l-s(' < I I I < ' ('sl.ls 11I('di"., 1 ( 11 1 1 1 1 1 11 0 1 di. ,l riu" i( ,.lo norm.d om
t orn o c l.t m ed ia venla deir.t c qu e 0 dosvio-padr . io <It'sld p o p , r I" < , . ·; · IO c I ( ,
medias - ch amado Erro pa dr.io da s Medias - e mellor qU~() dosvio-
pad r ao obtido a partir da s a rn os tra s iso la da s e pode ser obtido atraves
da formula:
Ele rnede a dispersa o da s medias da s diferentes arnostras de
m esrn o ta m an ho , extraidas de um a m esrna po pula ca o, em torno da
media da s medias, isto e , em torno da media verdadeira d a p o pu la c ao
estudada.
Exemplo: Suponha que se deseje calcular 0 erro-padrao da
media a partir de uma arnostra de dez pesos. Inicialmente, deve-se
ca lcular a media e 0 d es vio -p ad ra o d a a rn ostra para, em seguida, ap!i-
car a formula do EPM.
Tamanho da amostra = n = 10
Media = 36
Soma dos quadrados = 1.074
Desvio-padrao = 10,92
Observe na tabela 4 oscalculos iniciais para determinacao do des-
vio-padrao:
EPM >,_s_=IO,<J2=3,45
{11 f10
T ab e la 4 . P e so s e c al cu lo s
-
Peso P eso - M edia (P es o - M e dia )2
20 20 -3 6 =-16 25 6
23 23 - 3 6 = - 13 16 9
24 24 - 3 6 =-12 14 4
36 36 - 3 6 = 0 0
37 37 - 3 6 = 1
38 38 - 3 6 = 2 4
39 39 -3 6 = 3 9
43 43 - 36 = 7 49
45 45 - 3 6 = 9 81
5 5 5 5 - 3 6 = 19 36 1
n = 10 (x - x )2 = 1.074
3637
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 18/79
DESVIO-P ADRt\O X ERRO P ADRt\O DA M EDIA
•
DP mostra dispersao ou variabilidade;
EPM 0 quao bem a media e conhecida;
Se a dispersao e biol6gica (clinical mostre-a: dados reais
ou, pelo menos, 0 DP;
Se a dispersao e tecnica, preocupe-se com a media; apre-
ser ite-a juntamente com 0 EPM ou, de preferencia, com 0
intervalo de conf ianca (IC);
EPM e sempre menor, assim aparenta ser melhor!
•
Do exposto conclui-se que 0 usa adequado do EPM em textos
med icos e restrito.
38
INTERVALO DE CONFIAN~A PARA MEDIAS
Conforme explicado anteriormente, quando sao extraidas
.tl llo<,l r.1Sde rnesmo tamanho de uma populacao. as medias obt idas de
(,1(1.1 urna delas tern uma distribuicao normal cujo desvio-padrao
((J11<,lillii0 chamado Erro Padrao das Medias - EPM. Ver figura 6.
Figura 6 . D ia gr am a m o str an do a d is pe rs ao d as m e dia s
de am ostra s d e m e sm o tam an ho.
Med ia ( re a l)
da
populacao
Distribuicao
da popu lacaoD is tr ib u ic ao d as m e d ia s d e
a m os tr as d e m e sm o ta m an ho
e x t ra fdas da popu l acao
o d esvio p ad ra o da d is tr ib u icao das med ia s
e 0 E rr o P adr ao da s M e dias (E PM )
39
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 19/79
D ES VIO -P A DRAO X ERRO PADRAO DA MED IA
• DP rnostra dispersao ou variabilidade;
EPM 0 quao bern a media e conhec ida;
Se a dispersao e biol6gica (clinica) rnostre-a: dados reais
ou, pelo menos, 0 DP;
Se a dispersao e tecnica. preocupe-se corn a media: apre-
sente-a juntarnente corn 0 EPM ou, de preferenc ia. corn 0
intervalo de confianca (IC);
EPM e sernpre rnenor, assim aparenta ser rnelhor!
•
•
•
Do exposto conclui-se que 0 usa adequado do EPM ern textos
med icos e restrito.
38
INTERVALO DE CONF IANc.::A PARA MED IAS
C:onforrne explicado anteriormente, quando sao extraidas
,IIIlmtr.lS de mesmo tarnanho de urna populacao, as medias obtidas de
I"d" urna delas tern uma distribuicao normal cujo desvio-padrao
«1)ll~titlii 0 charnado Erro Padrao das Medias - EPM. Vel' figura 6.
Figura 6 . D ia gr am a m o str an do a d is pe rs ao d as m e dia s
d e am ostr as de m e sm o ta man ho .
Med ia ( re a l)
da
populacao
D is tr ib u ic ao d as m e d ia s d e
a m os tr as d e m e sm o ta m an ho
e x tr a idas da popu l acao
Distribuicao
da popu lacao
o d esvio p ad ra o da d is tr ib u i9ao das med ia s
e 0 E rr o P adr ao d as M e dia s (E PM )
39
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 20/79
Se Io rem co nsiderado s '1 ,96 [PM pa rn ca da la do da media
obtern-se um intervale de confianca de 95% que tern 0 seguinte
signif icado: se forem calculadas asmedias de 100 arnostras de mesrno
tamanho extrafdas de urna populacao, 95 delas se situarao dentro do
intervalo em questao e 5 nao. Este intervalo pode, portanto, ser obtido
apl icando-se a seguinte formula, val ida para amostras razoavelrnente
grandes (n > 60):
IIC95% = X±(1,96 EPM) Ia desvio-padrao obtido a partir de amostras pequenas pode
variar bastante e consequentemente 0 EPM e, por isso, para calcular 0
intervalo de confianca nesta clrcunstancia e preferfvel ao inves de usar
a distr ibuicao normal uti lizar outra desenvolvida para amostras menores
e conhecida como dist ribuicao t.
A formula para calcular 0 intervalo de confianca (lC) para Y%
de certeza e:
IC (Y%) = (m - (t x EPM)] a (m + (t x EPM)]
onde mea media, t (Student) e 0 valor da estatfstica "t" - obtido em
tabelas para "t", disponfveis em softwares e varies l ivros de estatfstica e
EPM e 0 erro-padrao da media.
Urn intervalo de confianca muito grande sugere que a media
da amostra encontrada e pouco representativa da media (verdadeira)
da populacao.
40
ENTENDENDO INTERVALOSDECONFIAN~A
EM OUTRAS SITUA~6ES
as estatfsticos desenvolveram me-
todos para calcular intervalos de confian-
ca para grande parte das estatfsticas, sen-
do 0 raciocfnio para sua cornpreensao sern-
pre 0 rnesrno. Por exernplo, quando sao
comparadas as medias de duas populacoes.
pode-se calcular urn intervalo de confianca
de 95% para a diferenca entre elas, isto e,
urn intervalo que, com 95% de certeza, in-
t 11I11,jl verdadeira diferenca entre as e las , Existem, assim, metodos
11.11.1.ilcular um Ie de 95% para 0 risco relativo, para um~ reta de
!I'gil 'ss ,lo, para urn valor predictivo, odds r~tio e assirn por d~ante. as
1llll'IV,lios de confianca m a r s encontrados sao de 90, 95 e 9 9 Yo .
Muitos preferem intervalos de confianca aos testes de hip6tese,
IltH!jlll' eles tornam evidente 0 alto grau de incerteza inerente aos
It'~l il l. lclos obtidos a partir de arnostras pequenas.
Quanto maiores
[or-ern as amostras
mots estreitos serdo
os rntervclos de
conficncc,
41
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 21/79
DISTRIBUI<;Ao NORMAL+ t o . . . . . .. . . . . . '" . . . . It or . . . .. . . . . . . . . . . . . . . . .. ..
Frequentemente as inferencias em pesquisas medicas estao ba-
seadas em dados cuja distr ibuicao e normal . A curva normal ou de Gauss
e s imetrica, unimodal e tem forma de sino; assume uma serie de forrnas
mais ou menos achatadas (curtose) em funcao da dispersao dos dados ao
redor do ponto central, no qual coincidem a media aritmetica, a moda.
assim como a mediana.
A descricao da curva normal pode ser
feita matematicamente por meio de dois
parametres: a media eo desvio-padrao.
A figura 7 mostra urna curva normal e a
porcentagem de casosenvolvidos a medida que
sao inclufdos urn, dois ou tres desvios-padrao
para ambos oslades da media. A curva normal
e assint6tica em relacao ao eixo horizontal , suas candas aproxirnam-se
dele mas nao 0 tocam jamais, 0 que signif ica que a variavel pode assumir
qualquer valor entre - 00 e + 00.
Conforrne foi explicado anteriormente, quando a distribuicao
dos dados e normal (simetrica), a media representa bern a populacao:
quando a dist ribuicao e assirnetr ica, a mediana e mais representativa.
Em calculos estatfsticos usa-se f reqLientemente a media para fazer cal -
culos. Oaf a importancia de que essa media represente realmente a
Uma curva simetr-ico
s6 sera chamada de
normal se possuir as
propriedades
apresentadas na
figura 7.
arnostra estudada.
42
F i g u r a 7 . M e dia e fr a~ ao da populacao i nc lu id a e n tr e 1 , 2 e 3 d es vi os -p ad ra o
..-----------------~~
Media
Mediana
Mcxla
95,5%._ . . . .-._--_._ ..... _ .. . _ . _ - _ . _ . _ . _ .. -_ .. . _ - _ ...._- .
99,7%
43
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 22/79
ESTAT fsT ICA Z (ESCORE Z)
A estatfstica Z - s ta nd ar d s co r e, baseia-
se na curva normal. Ela mede quanto um deter-
minado resultado (valor) afasta-se da media em
unidades de desvio-padrao.
A suo grande
uti lidade se deve
a facilidade de
conver'sdo para
percentil.
Pode ser observado na figura 8 que um resultado cujo valor
coincide com a media tem escore Z = 0; observa-se tarnbern que a
variacao desta estatfstica ocorre f requenternente no intervale entre -3
e +3, visto que tres desvios-padrao para mais e para menos incluern
99,7 4 % (praticarnente 100%) da arnostra estudada.
F ig ur a 8 . Escore Z e f ra go es d a pop ula ga o e n vo lv id a
-3 -2 -1 o +1 +2 +3
. . . . . . _.- _ - _ . _ . . _ .100%
E~ffiZ i- - - - . - - ~ - - - - - - - - - ~ ~ . _ . ~ . . ._ _ J
44
A 1 ~ 1 "I f . . lh,' I(I l 1 1 u l t o ,'Ilil '1 1 , ,1 1 , ,1 0 " C ' C C l l ll P o II ,I I ll v,dor('., pr()v(',
"I"IIlc'" d el difl'l'('I1I(ls (''ollldo ... Outr.t IIlili<ltl<l(' (. <ltldtl p('ltI fdl'ili<ldci('
til' " 1 1 , 1 (OIlVCOrS,IO PM,' 1>"1"( '( '111il, conlonnc pod,· S(·t «onst.rtado n o (, X( ~I1 1 -
p i ll ' IIH ' '0(' S('gll(',
S C ' 1 1 1 1 1 1 1ostudo qualquer 1 1 1 1 1 deterrninado valor se situar exata-
,,,c'll lc' " <lois dosvios-padr.io acirna da med ia, setiver um escoreZ =+2,
1 . 1 t . c",I .l I," no pcrccnt il 9B, soma da area a esquerda do 0 (zero), igual a
',(I 'X " ( 0 1 1 1 .I .irca ,1direita do 0 (zero), igual a aproximadamente 48%.
1 ' , 1 . 1 1 II() p('ru'ntil 9B significa que este valor e igual ou superior a 98%
d()', v.i loros aprcsentados pelo restante da populacao.
S(' nurna deterrninada avaliacao a media foi de 70 pontos e 0
dl'wi ()-poldr50 de cinco pontes, urn resul tado de 80 pontes seria muito
1 1 1 1 1 1 1(rlois desvios-padrao a c i r n a da media e, p o r t a n t o , igual OLisuperior
II ' 111%dos demais resultados); se, entretanto, para a mesma media 0
dl'wj()-p<ldrao obtido fosse de 20 pontos, os mesmos 80 pontos ja nao
C I I II (",ponderiarn a Lim resul tado tao bom (meio desvio-padrao acirna da
IIlI'tiid 1', portanto, igual ou superior a 69% dos dernais resultados).
T ab e la 5 . Escore Z e t racoes e n vo lv id as d a populacao
z
F ra <: ao d a p op ula ca o co ntid a e n tr e Z d es vio s-
padr ao para m ais e para m en os da m edia
0, 5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
38,29%
68,27%
86,64%
95,45%
98,76%
99,74%
99,95%
99,99%
45
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 23/79
D IS TR IB UIC ;O ES D E F RE QU EN C IA S
Uma distribuicao de frequencias e uma
organizacao dos dados brutos em urna forma
distr i~ui~oes de tabular, usando classes (ou intervalos) e frequencias.
frequencies E I . d i . Ia In rca simp esmente quantas vezes urn
determinado valor ocorreu, sendo bastante
uti lizadas, pois permitern condensar osdados de forma a tornar a analise
mais facil, sendo 6bvio que, no processo de condensacao, perdem-se
detalhes, mas estes nem sernpre sao importantes,
. Por exemplo, em urn determinado colegio deseja-se avaliar 0
rend."ll:nto de 53 alunos por meio das notas recebidas numa prova e
distribuidas conforme apresentado na tabela 6.
Entendendo as
T ab e la 6 . D is tr ib u i gao de f requenc ia
Nota N u rn e ro d e a lu n os
0 1
3
2 3
3 5
4 5
5 6
6 8
7 8
8 6
9 6
10 2
46
A d lsl r IIH lI , ;' \o d c · In'q O(illcl.I., 1 1I(l.,lr,I < 1","1 1"., V('/ ('" 1 11 11 ,1
< 1 1 ' 1 < ' ri ll 1 1 1,1 1 1.1 1 1 01 1 1 .,c ' 1 '1 '1 '1 '1 1 11 q ll,," lm ,"1I1l0S ohtivor.uu 1I1l1,1
( l tol( 'r I l lln . ld.1 .1V.l llcI ,. io. Poti(I_S(' i lgnq>oIr m ais os d ado s d is rr ib u ln do - o s
pm l '.IIl'goriils mais arnplas, obiondo-se uma distribui,:ao de frequencias
, lg ru l> i1 d ". V e r tabcla 7 .
T ab e la 7 . F r e qu e n cia ag ru pada po r ca te go ri as
Catego r ia FreqUenc ia
(n u m er o d e n otas )
0- 3
4 - 6
7 -1 0
12
19
22
Uma distr ibuicao de frequencies expressa por porcentagens as
V('/('S e mais interessante, especialmente na comparacao de estudos
('l1lr(' si. Para calcular a porcentagem, divide-se 0 nurnero de observa-
<,()('S numa dada categoria pelo nurnero total de observacoes e multi-plicd-se por 100. Ver tabela 8.
E possivel calcular tarnbern a porcentagem acumulada sornando
01', porcl 'ntagens individuais uma a uma. Considerando 0 exemplo ante-
lilli,porle-se observar na tabela 8 que, ao juntar as faixas a - 3 e 4 - 7,
ItolV('r:l a inclusao de 58,4% dos dados. Estatabela de frequencias e por-
T ab e la 8 . F r e qu e n ci es e p or ce n ta ge n s r e la ti va s e a cum u la da s
Catego r ia F r eq uenc i a Porcentagem Porcentagem
acumulada
0 -3 12 12 / 53 * 1 0 0 = 2 2,6 % 22,6%
4- 6 19 19 /53 * 1 0 0 = 3 5,8 % 58,4%
7 - 10 22 22 / 5 3 * 1 00 = 4 1 ,5 % 100%
Soma= 53 53 I 5 3 * 1 00 = 1 00 %
47
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 24/79
('(lllldg(IIlS d(,1I1ll1l1"d.1S constltui.: ".IS(' r lo rnnluxido I ) i.lgr.II11.1e I ( , P.tn'I(),
multo usado como ferrarnenta de qLJ(llidild(~.
l requenternente sao a n al is a da s v a ri a s caracterfsticas a o m esm o
tempo, sendo possivel construir tabelas b iv a ri ad a s, t ri va ri ad as etc., que
mostrarn a ocorrencia de cada situacao, como na tabela 9. Saoconhecidas
como t ab ela s d e c on ti ng en ci a e 56 contern dad os brutos - nurnero de
casas (frequencias absolutas) situados em cada condicao resultante do
cruzarnento entre colunas e linhas.
Tabelas contendo As linhas e colunas em urna tabela demedias, frocoes,
taxas e proporc;oes
nao Sao tabelas de
contingencia.
contingencia podern ter significados diferen-
tes em fun<;_:aoo desenho do experirnento. As
linhas representarn geralrnente exposicao (ou
falta de) a tratarnento ou a fatores de risco. As
colunas geralrnente rnostram categorias mutu-
amente exclusivas. As tabelas de cont ingencia rnostrarn 0 nurnero de
dados em cada categoria.
No exemplo anterior considere que se esteja querendo incluir
o sexo como uma variavel, Logo, a tabela de contingencia correspon-
dente poderia ser como a ta bela 9 .
T ab e la 9 . E xe m plo d e t ab e la d e c on tin q en cia
Sexo C a te go ria d e n ota s Total
0-3 4-6 7-10
Masculino 5 1 1 1 1 2 7
Femin ino 7 8 1 1 2 6
Total 1 2 1 9 2 2 5 3
A coluna da direita e a linha inferior mostrarn apenas totais _
charnados de marginais. Quando seesta t rabalhando corn rnais de duas
variaveis, geralmente e mais faci l construir tabelas separadas para cada
cornbinacao de valores.
48
-TERMOS QUE CAUSAM CONFUSAO
. . . . ~ .. " .. .. .. .. .. . . . . . . .. .. '" .. .. " ..
Terrnos como estimacao. est imador, estimat iva e pararnetro As
vozes causarn confusao.
Estirnacao e 0 processo; procedimento estatistlco que per-
mite prever, com certa probabilidade, 0 valor de lim
pararnetro desconhecido (populacional) com base nas in-
forrnacoes obtidas d a s a r no s tr a s.
Es t imador e a e s ta t is ti c a u s a da , par exernplo, a media c1a
arnostra e urn est irnador da media populacional. Ver figura 9
Estimativa e ur n valor particular de u rn e st imad o r , como por
exernplo: x=2,5 e uma estimative de ~.
Pararnetro e uma medida numerica usada para descrever
alguma caracteristica populacional . Por exernplo, a estatu-
ra media de urna populacao consti tui urn pararnetro.
F ig u ra 9 . E st at is tic as c omo e s tim a do re s d e p ar am e t re s p op u la ci on a is .
•
•
•
•
Amostra
(representada
por estat ist icas)
Popu lacao
(parametres
representados
p or l et ra s g r eg a s)
Med ia = xDesvio-padrao = s
Proporcao = p
~I
a
'IT
49
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 25/79
REPRESENTA~Ao CRAF ICA
Urn grafico ou diagrama e uma representacao geornetrica da
relacao entre variaveis. Ele ajuda 0 leitor a fazer urna imagern mental
dos dados apresentados e, frequenternente. fac ilita a visualizacao de
relacoes nao identif icaveis na observacao de uma tabela.
o diagrama de colunas tern particular interesse porque constitui a
base de urn t ipo de graf ico mul to usado denorninado histograrna, 0 qual
rnostra, no eixo horizontal, todos os possiveis valores ou intervalos e, no
eixo vertical, a frequencia em que cada urn deles ocorreu. No diagrama
de barras (horizontals), asvariaveis x e y mudarn de posicao. 0 histograma
das notas do exernplo anter ior esta apresentado na f igura 10.
F ig ur a 1 0 . H is tog ra ma m os tr an do u m a dis nb u ca o d e d ado s a gr up ad os p or ca te go rias .
(j)
,~ 15
~ a 3'::Jcr~ 10LL
25
50
20
5
oCategorias
( > . , h l . , t( ) H " o I I l 1 , 1 " ponu l t r -m .I I,kil ViSllolli/,"",() dc ' ( '01'00'0 ro m v.rlo-
I I' ~ 1 1 1 1 1 i to d l f( 'l '( 'l 1 t( 'S do s < 1 ( ' 1 1 1 . 1 1 ' 0 ( II I/ li t, !' " ( ' moslr.un t.unlxun S (' tI distri-
1 1 I 1 i( ., 'IO ( , sill1('tric,1 Oil d('sviiHlil para um l.rdo. bimodal, trimoclal etc. Nes-
t t' t ipo dc ' gr.Hico () l im i te - superior de um a Iaix a ou categoria nunca
', oh rc 'PCH' ( ) inferior elil seguinte.
O ulra fo rm a de ap re se n ta r a distribui<:;aode dados continuos e atra-
V{I~dos pollgonos de Irequencia, que sao construidos unindo-se os pontos
11I(,dios( la s lin h as a o topo d a s c o lu n a s do histograma, conforme a f igura '11.
F ig u ra 1 1 . Poi fg on o d e f re q u en c ia
25
C] Nota 0 - 3
OJ Nota 4 - 6
[jJ N ota 7 - 10
20
en, < : > 1uc<Q
' : : :>0
~LL
15
10
5
oCategorias
Outro tipo de representacao grafica bastante usado e 0 de tronco
(' folhas - stem-and-/eaf plot, cuja aparencia lernbra a de urn histograrna
deitado, mas que preserva uma maier quantidade de informacao. Ele
lernbra 0 histograma porque 0 comprirnento de cada linha corresponde
.10 nurnero de cases do intervalo considerado. Ver figura 12.
51
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 26/79
52
o0...',p
0...
E<lJX
L.!.J
N
r< J.. .: : : : l
eou : :
-
o. . . - -II ~o ttlo oC0"'--
~ IIo ttl"'0£
~:E:::J ttl~"'Ottl ttl....J()
II. . . .or o>o
E< Q . l. . . . . .
enoen
~L()
enttl£
ou,
oo500...--...--...--...--...--
~
ttlooooooo'-0000000 _
<~ ~ 1'-, ~ ~ co L()
::::J
0'"
~u,
( ') lI lm .. l i!, w . t i l ' r t' !, n" .I 'l ll ,I (. ,IO g !, '\ li lo i 1('111 " id o I I" oI d( )' o 1 ' . 1 1 0 1 ' ' 1 ) 1 ( ' -
' ,1 '1 1 1. 11 ' 0 0 , d o ld o " I ' 0 1 1 ,1 1 01d is !, I'r S,' l( ), S I'g lJ (' lll o Il gl lll S « xo m plo s n.is figllrols
1 . 1 1 ' 1 4 ,
>x00..';::
co ;Ru 0
fU 01
0, E
0.co(yo
coC0
U0
0.. co~ is0
'0
u EU
0o._
E0
iw ., .M
e:::
C
u : :
,~
u,0
E
I
o ®O I
0 0 1 0 0o No 0
o.coisco0..
6sU0
o
>co- o~ O)U
53
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 27/79
54
0'-'<I:l
E
$<I:l 0'-' <:J
~ 0
'-'0"> :i U0'<I:l Ec:» (j)
<I:l <I:l
C c;_<D
illj)
<D ,~
C i. z~<DT
(j)
0c;_
E<D> <w
."r
~: : : sO
u : : :
o(0
oL!)
o0..
2
N
o0..
2C)
1
C0
8- ~ -2C)
I
+I
oC')
... -_.-- _._ _ ._-- , - _ . --_._._.-o
N
+1
o
N
o0..
Ef~
oo0..
E
~
UI1l(1 representacao, a s vezes encontrada (figura 15 ) e que da urna
1111.1 idl'i<l quanta a s caracterfsticas da arnostra e charnada Box-and-whisker
I l ie I t I n.io tendo urna boa traducao para 0 portugues - caixa e fio de b igode,
F i gur a 1 5 . G ra fi co t ipo box -and-wh is ke r
17 5
P-r+
r 15 0e
s
s
a 12 5
0
S10 0
i
s
t
6 75
I
i
c50
a
25 -
O--L--------------------.J
L_ ~
----- Valor m ax im o
+-- P e rc e nti l 7 5
-4 . . . . . . P e rc e nt il 5 0
.. .. Pe rcen til 25
..... -- V alo r m in im a
1
~\
, 1 \ "
I \ ~
55
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 28/79
C UR VA S D E S OB RE VIV EN CIA:
UMA REPRESENTA~Ao CRAFICA
- -NAO TAO INTU IT IVA
Em muitos estudos clfnicos procura-se est imar 0 tempo de 50-
brevivencia dos pacientes com a finalidade de, por exemplo, comparar
a eficacia de dois tratarnentos.
A f igura 16 rnostra urna curva de sobrevivencia sin,pies. Nela, 0
tempo 0 (zero) refere-se a ocasiao em que cada paciente entrou no estudo
eo valor de y , neste tempo zero, serasempre 100%. Quando urn paciente
rnorre, ~ porcentagem de sobreviventes dirninui (degrau) e, se0 estudo se
prolongar ate a rnorte do ult imo paciente, 0 valor f inal de y sera 0 (zero).
Ha duas maneiras de criar urna curva de sobrevivencia. Em
urna delas, divide-se 0 eixo x em intervalos regulares, verificando a
sobrevivencia ao terrnino de cada perfodo (tabela de vida ou atuarial
- a ctu ar ia l m et ho d) e na outra, a sobrevivencia e recalculada a cada
vez que um paciente morre, K a pl an -M e ie r m e th o d, como ocorre no
exernp!o da figura '16 .
Urna dificuldade desse tipo de estudo ocorre em funcao da
desistencia ou desaparecimento de pac ientes, incluidos na pesquisa,
antes do terrnino dessa: sern esquecer de que a morte de determinado
paciente pode nao estar ligada ao problema estudado. Mesmo assirn,
os dados serao considerados, pois conta-se a observacao do indivfduo
56
,11(', () f im du sl'guimento, 0 que se chama de observacao censurada -
( ( , l Is o r e d ob s e rva t io n .
Tracados semelhantes podern ser feitos para outras situacoes como
tempo de rernissao de uma leucemia,
por exernplo. Assim, embora secha-
mern curvasde sobrevivencia, 0even-
to escolhido nao e necessariamente a
Dados deste tipo raramente
obedecem a uma drs+ribuicdo
Gaussiana e. por essa rczdo.
me+odos especiais precisam
ser usados para analise-los.
rnorte.
Figura 1 6. E xe m plo d e c urv a d e s o bre viv en cia
._-- -_ __.-__---_ _ _ ._----_._---_._-_ ....._ - - _ .._ - _ . _ _ ._- -_ .._ _ ._._._ .. ....-
~ ~ _ e _ m _ p _ o _ e _ m_ m _ e s _ e _ s J
ps
00r b
cr
ee
nv
t ia
v9 ee
nm
t
de
se
M o r t e
,----j-__----_ .._--__----_._-__---__-
100%
75Obse rvacao censu rada
I
25
o
o 24 362
57
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 29/79
TESTE 0 SEU CONHECIMENTO
Exerdcio 1. Urn pesquisador investigando a incidencia de doenca das
mernbranas hialinas, escolheu como amostra os primeiros 200 partos
ocorridos nas quartas-feiras. Corn base nessa amostra, determinou a inci-
dencia da referida doenca no bercario escolhido e extrapolou para a
populacao de sua cidade. 0seu procedimento merece crfticas?
Exercfcio 2. Foi feito urn estudo para determinar a estatura media dos
alunos (N=1.000) de urn colegio, que estavarn distribuidos por quatro
series consecutivas. Foi selecionada urna amostra em que foram inclui-
dos os prirneiros 100 alunos que adentrararn a escola nurn determinado
dia. Pergunta-se: a amostra esta adequada para a pesquisa em questao?
Exercfcio 3. Num estudo para avaliar a pressao em animals. foram sele-
cionados dez, ao acaso, para constituir a amostra. Nestes, mediu-se a
pressao em tres ocasi6es diferentes. 0pesquisador pode considerar, para
fazer seus calculos, que ele tern urna populacao de 30 press6es (3 x 10)?
Exerdcio 4. Suponha que urn forno x esta corn urna temperatura de 60°C
e urn outro forno y esta com 15°C. E correto afi rrnar que 0 forno x esta
quatro vezes rnais quente que 0 forno y? Se a temperatura de x fosse
60°C e a de y 0 DC, como fazer para cornparar?
Exercfcio 5. Determine 0 t ipo de dado das seguintes variaveis:
a) Marca de antiterrnico preferida
b) Grau de temperatura corp6rea
c) Grau de satisfacao corn urn hipoglicemiante oral
58
I I ) I ' n " , o . , , ) ( ) ",!tori,"
I') I\c'IHI" f.unlll.rr
o (d"" dc' d(l!1l1l1lri ,' ; I"
H ) ()II<Hic'nlt' inlf'lt'ctuoll- Q l.
h) I )oIciw, I'm uma tahe!a de contingencia
1,U'rddo 6. () nurncro de resfr iados adquiridos por oi to estudantes num
dl'll'rtllinoldo poriodo foi respectivamente 1, 2, 2, 3,4,4,6 e 8.
,I) ( ,lind(' .IS estat isticas: media, mediana. rnoda, amplitude total e des-
vio-p.idrao.
I, ) Iill nono estudante, corn deficiencia imunitaria, foi inclufdo na
.uuostr .i e apresentou 26 resfr iados no mesrno perfodo. Recalcule as
1'~t.llislicilS.
1) (.! II .l is estat isticas forarn pouco afetadas pelo acrescirno?
c il ( .ikulc 0 escore Z para 0 nurnero de resfriados adquiridos.
Iercicio 7. Considerando 0 exercicio anterior, apresente os dados por
1111'ioIt , LJmhistograma.
Ivrcicio 8. Considerando as estaturas de todos os meninos corn dez
,11111" dc' idade. de urn vilarejo, obteve-se urna estatura media de 120 ern
C ' 11111osvio-padrao de 20 em. Como se localiza dentro dessa populacao
11111.1i ill lc,;a que, aos dez anos, apresenta urna estatura de 80 cm? (Uti -
1 1 1 1' ( ) «score Z para fazer 0 raciocinio).
Iercicio 9. Considere as seguintes 19 idades: 18, 21, 22, 22, 24, 24,
" r " 2(), 30, 30, 32, 32,36, 36, 36, 36, 40, 4'1, 78. Calcule as seguintes
1",l .l lis lic:as: media, rnediana e percentis 25 e 75.
Ixercicio 10. Considerando 0 exercicio acima, apresente osdados usan-
II " 11111 grafico tipo stem & leaf e outro, tipo box-and-whisker .
I'('cicio 11. Suponha que se deseje comparar as estaturas de 2 grupos
I" 'pldilcionais. Os resultados das afericoes ern cada grupo estao
oIPII' s('ntados graficamente na figura 17. Baseado na igualdade das
11"'llI 'divas representacoes graficas e possivel afirrnar que nao exis te
dlll,rt'nc,;a entre os grupos estudados? 59
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 30/79
Figura 1 7. B ox p lo t r ep re se n ta tiv o da dls tr lb u lc ao d as e siatu rn s u fo rld as o m 2 g ru po s
populacionais.
G ru po 2
G ru po 1
I
4 0I I II I
o
Exercfcio 12. Considere a populacao de fosfatases alcalinas: 14, 21,
17,26,29,31,15,18,25,13,12 e 22. Qual 0 posto percentil ocupado
pelo valor 18?
60
I
80
RESPOSTAS DOS EX ERCfclOS 1 A 12. . . . . " " " " ..
I.;\oscolha de um dia fixo da sernana nao foi adequada para investi-
~1,oIr.lncirlencia da doenca das membranas hialinas, que e sabidamente,
n -l .ir io na da a o tipo de parto : a equipe do dia escolhido pode ser mais
nu mcnos intervencionista do que as dos outros dias, interferindo nos
1('~1I11;1CjOS. Essaescolha feriu tarnbern 0 principio de que todos os re-
( ( "Il1-nascidos do bercario em questao devem ter a mesma chance de
1.1I('r parte d a a m ostra . A ex tra po la ca o dos resultados para a comuni-
d, l( i l' t a rnbern foi inadequada, pois nem to d a p op ula c ao deve se servir
d('sse mesmo bercario.
' 1 .. ; \ arnostra dos a lu no s es ta viciada, pois ela deve ser representativa
d, I populacao qualitativa e quantitativamente, isto e. deveria ter sido
,,('I('cionado urn nurnero proporcional de alunos pertencentes a cada
:I. ;\ a feric ao da p ressa o tres vezes no mesrno animal contraria 0 princi-
PIt) da independencia, tornando a arnostra viciada. E multo diferente
Ir .l IJ,l lhar com uma arnostra de 30 animals nos quais seaferiu a pressao
11111,1 vez de que t r aba lhar com 1 0 em que a pressao foi a fe rid a tr es\,(/I'S. 0fato de se encontrar um animal hipertenso n a a r no s tr a de dez
n.io implica em que serao encontrados tres animals hipertensos na
.unostra de 30.
4. l.ste exercfcio foi proposto para que 0 leitor sinta asdif iculdades de
',(' lrabalhar com dados intervalares - que tern urn zero arbitrario. Com
( '<,11 ' tipo de dados s6 sao perrnitidas operacoes de soma e subtracao. 0
61
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 31/79
<j Il l' S (' podo dfirllldr (, qU(' () forno X ,lpr<'S('l1td 41) "( d(, dif('f"('Il<.,tl ('Ill
relacao ao forno y , mas n,\o que esta quatro V(,/('S m.iis <ill< - n u - , ( )p( 'rtl<.,(-)(< '
de rnult iplicacao e divisao na o podern ser fe itas com ('stc tipo cjp d.ulos.
5. A identificacao do tipo dos dados com que se esta trabalhando e
multo importante e referida, frequenternente, como nivel de rnensuracao
do dado.
Dado
Marca de antiterrnico preferida
Crau de temperatura corp6rea
Crau de satisfacao COIll
hipoglicemiante oral
Pressao arterial
Renda familiar
Crau de desnutricao
Q I
Dados em tabela de cont ingencia
Nlvel de mensuracao
Nominal
lntervalar
Ordinal
Continuo
Continuo
Ordinal
Ordinal
Nominal
6. Para osvalores propostos (1,2,2,3,4,4,6 e 8), obtern-se osseguintes
resultados para as estatisticas:
a) Situacao inicial:
Media = 3,7
Mediana = 3,5
Moda = 2 e 4 (bimodal)
Desvio-padrao = 2,31
Amplitude total = 7
b)Ao ser acrescentado rnais urn casu com valor 26, obtern-se osseguintes
resultados:
Media = 6,2
Mecliana = 4
Moda = 2 e 4 (bimodal)
Desvio-padrao = 7,72
Ampli tude total = 25
62
( ) ( lh.,('lv(' qU(' houve irnportante variacao da m e d i a, d o desvio-padr.io
( ' t i d .unplitude, mas que a rnediana e a mo da pouco alterararn.
ti l (',tI(,lli,lIldo 0 escore Z para os valores propostos para 0 nurnero de
n-slri.ulos, obtern-se:
N u m e r o d e r e sf ria do s ES CORE Z
2
2
3
4
4
6
8
26
-0,67591
-0,54648
-0,54648
-0,41705
-0,28762
-0,28762
-0,02876
0 ,23010
2,55983
7. No histograma apresentado a seguir, que mostra a distribuicao dos
v.ilores propostos, observe que a dis tribuicao nao e simetrica e que ha
urn valor extreme presente.
F ig u ra 1 8 , H is to gr ama mo st ra n do a Ir e qu e n cia d e e v e n to s - r e s fr iados po r fai x as ou ca te go ri as .
n:;
U
C.G
=>Cy
~tL
0,5 2,5 4,5 6,5 8,5 10,5 12,5 14,5 16,5 18,5 20,5 22,5 24,5 26,5
1,5 3,5 5,5 7,5 9,5 11,5 13,5 15,5 17,5 19,5 21,5 23,5 25,5 27,5
63
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 32/79
U. N('sl(' ('x ('rddo , () va lo r d c ' 11 0 1'111 proposlo pM.! () (,ISO ('Ill ('~Il,d()
encontra-se 4 0 em abaixo cia media de '120 ern, ('x.tI,lftH'IlI(' '2 d('svios-
padrao (2 x 20 ern) abaixo ou, a i nd a . a p re se nt a UI1l esco rc Z = -2 . Islo
significa que essa crianca encontra-se no percentil 2: ela tern urna
estatura superior ou igual a apresentada pOI' 2% das criancas de sua
comunidade, com a rnesma idade. A simples o bse rv ac ao d a fig ura 19
abaixo rnostra a faeil idade para sechegar a esta conclusao e a util idade
do escore Z.
t o , A" ItIPrt'SIII'I.'(.()II~ ~r.HI('tl '; 1)()(lc'll.lIll ~('I 0I~~c'gtlilll(''':
I I I '" ' I I I I~ " '0 1 ( I , / 1 1 1
1 1 1 1 1 1 1 « . . , do., " I I I I 1 o S
IW'I"I\II(iol IrOIHO l~ lolh.i1 ,( J( I 1 II
" , 11 0 2 ' 12144
) , I H I 2 59
'1,00 :I (J022
, I , (H I :I C J 6 ( ) G
),1)(1 4 011,(1) 1xlnmos (>=78)
l,lIHIII,1 do Ironco:10
( I ldol !(lIIl,,:! GISO
F ig ur a 1 9. D is tr ib u i9 ii. o d e d ad os p or f ai xa s d e e sc or e Z .
! omhrc-se de que, neste tipo de grafico, para restaurar 0 valor
original de ca da da do . deve-se multi-
plical' a largura do tronco pelo COITes-
pondente tronco e sornar 0 valor de
ca da fo lha : a ssim , 0 valor represen tado
na primeira l inha e (lOX 1) + 8 = '18,
5etnpre que aparecerem
resultcdos extremos,
devc-se verificar se nao
houvc erros no sua
ob t cncdo ou digitac;:ao.-1,96 -1 o 1,96
E sc or e Z
ill B o x -a nd -w hi sk er s p lo t
lIentro da caixa estao 50% dos resultados; como a mediana
,",1.1 «'ntrada na caixa, a distr ibuicao deve ser razoavelmente sirnetr ica.
1 \ . i lt u r . : c ia c ai x a r n o st ra a d ispersao de 50% dos resultados r n ai s p ro x im o s
d" ( ( ' 1111 '0. A la rgura da ca ixa na o tem nenhurn significado.. Os resultados para as e s ta t is ti c a s s o li c it a d a s e que sera o usa do s na
solucao do exercfcio 10 sao os seguintes:
Media = 32,2
Mediana = 30
Percentil 25 = 24
Percentil 75 = 36
6465
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 33/79
60 0
50 •
40 •
30 •
20 •
F i g u r a 20 . B o x p lo t r ep r es e n ta ll vo d a dlBtrlbul~ao d O B d a do !i - I d ad e d O B eluaos.
80 • Caso19
com val or
e x tr em o ( 78 )
70 •
Valor max imo
(at e 1 , 5 a lt u ra s
da ca ixa )
Pe rcen t il 7 5
P e rc en ti l 2 5
10. ~ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~ r - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~N= 19
11. Nunca se deve comparar resultados atravcs de representacoes
graficas, pois elas podern facilmente induzir ao erro. Observe na figura
18 que, com relacao ao problema proposto, as2 di ferentes distr ibuicoes
de dados podern ser representadas por diagramas identicos
66
F ig ur a 2 1 . D ia gr am a m os tr an do d is tr ib u ic oe s de d ado s dife re n te s q ue p od em g er ar
r epr esen t acoes q raf ic as i den t ic as .
( . ru p o 2 XXXX x XXXXXX x XXXX
(;rupo 1 x X X X X X XX XX X X X X XX
I I I
o
I
40
I I I
12.0 prirneiro passo para encontrar 0 posto percent il ocupado pOI'urn
deterrninado valor dentro de urn conjunto de valores e ordena-los em
ordern crescente e a s s ir n t e rn -s e :
12 13 14 15 17 18 21 22 25 26 29 31
o passe seguinte consiste ern contar quantos resultados SitU,1Il1-
se abaixo do valor escolhido (18) e que no caso e 5, corresponciente
aos valores 12,13,14,15 e 17.
A seguir aplica-se a seguinte formula:
NQde valores abaixo deX + 0,5
Nll total de valores
5 + 0.5
12Percentil = X 10 0 = X 100 = 45,83
e assirn 0 posto percent il ocupado pelo 18 e aproxirnadamente 45,83;
isto e , 18 e igual ou superior a 45,83% dos dernais valores deste conjunto.
* Os exercfcios de numero 6, 7, 9 e 10 forarn resolvidos com 0
auxil io clo software estatfstico SPSS.
I
80
I Ii
67
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 34/79
Estatfstica Analftica(au Indutiva)
¥ _4fM J . ,.
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 35/79
INTRODU~Ao.. • .. .. • .. • .. • .. .. .. .. .. • .. • II< .. ~ .. .. I
A Estatfstica Analitica (ou lndutiva) permite ao investigador ir alem
li d descricao dos dados e fazer inferencias sobre a populacao com base
lIdS arnostras. Essasinferencias, obviarnente, tern lim itacoes, nao se pode
I('r absoluta certeza de que estao corretas. A Estatistica Analitica emprega
.I teoria das probabi lidades que pennite ao pesquisador calcular 0 risco
qlle ele assume ao chegar a determinada conclusao.
o usa de formulas neste texto sera minimo: hoje, a maier parte
<loscalculos e feita por meio de softwares estatfsticos em cornputadores
('0 que 0 pesquisador necessita e de cornpreender os princfpios basicos
p,1I'a entrar corn os dados e, apes verificar se foram respeitadas as
«ondicoes para uti lizacao, aplicar 0 teste estatistico adequado.
A disponibilidade destes recursos eletronicos constitui urn
progresso nao isento de riscos, uma vez que seu uso pOI' pessoas sern
conheoirnentos adequados de Estatistica e do pr6prio software,
scgurarnente levara a erros grosseiros.
71
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 36/79
ENTENDENDO 0 VALOR DE P.. • .. .. .. .. .. to . .. ,. . ,. .. , .. " ~
Considere que para cornparar duas popula<;,:6esidenticas tenham
sido ext ra idas asarnostras A e B de mesmo tamanho (n = 4) apresentadas
na figura 22. Baseaclo nestas amostras pocle-se cometer urn erro tipo I,
isto e, enxergar diferenca onde de fato nao existe.
F ig ur a 2 2. A m ostr as A e B d e m e sm o tam an ho e x tr aid as de 2 po pu laco ss id en ticas .
20 20 2020 20
20 20 20 20
52020 2020
EJ0 20 20
A5 20 20 20 20
4 20 20 204
4 5 20 20 20 20
20 20 20 2020
20 20 20 20
5 2020 20 20
~
20 20 20
B5 20 20 20 20
45
20 20 204
4 20 20 20 20
o valor de pea probabilidade, que varia de ° a 1, de encontrarna pesquisa urna diferenca igual ou maier que a observada, dado que
as duas populacoes tern de fato a mesma media, isto e. a chance de,
pOI' mero acaso. dentre todas as arnostras de t a rnanho 4, sortear
justamente as arnostras A e B ou equivalentes.
72
o valor de p e uma proporcao:
Experimentos com uma diferenca tao grande quanto a observada
p=----------------------------~--~~~~--Todos os experimentos possfveis, desde que nao haja realmente diferenca
Se 0 valor de p e pequeno, a diferenca encontrada tern pouca
«h.ince de ser causada pelo acaso - var iabil idade das a rn ostra s - conclui-
',I' que as populacoes sao, corn grande probabil idade, cli ferentes.
Frequenternente interpreta-se malo valor de p. Se, por exernplo,
p= 0,05, isto significa que ha 5% de chance de se notal' urna diferenca
l.ro grande ou maier que a observada, mesmo que as duas populacoes
('slueiadas sejarn identicas.
o que se pode concluir e que se fossem escolhidas varias
.unostras dessas duas populacoes identicas, encontraria-se uma
diferenca entre duas amostras quaisquer, inferior a observada em
')5% das vezes e maior em 5% .
73
,
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 37/79
ENTENDENDO A H IP6TESE NULA (H, )
Hip6tese e uma conjectura,
uIIIa resposta presu IIIida e proviso-
ria que, de acordo com certos cri-
ter ios, sera ou nao rejeitada.
Chama-se hip6tese nula
aque!a que simplesrnente afirrna
que nao ha diferenca entre os gru-
pos estudados: trata-se de urna hi-
p6tese que atribui ao acaso a ocor-
rencia do fenorneno ou resul tado observado.
Um valor de p ndo significativo
nao implica em que a hip6tese
nula seja verdadeira, mas tao
somente em que as evidencics
disponfveis nao Sao suficientes
para rejeitci-Ia.
74
TESTANDO H IP 6TESES
o principal objet ivo de testar uma hip6tese e responder a seguinteIiu es ta o : d ad as d u as am os tra s, sao elas realmente d iferentes ou pertencern
.Iu ma m esrn a po pu la ca o? E m o u tra s p ala vra s. e determinar com r azo ave l
(' conhecida certeza se as diferencas encontracias entre duas ou mais
.unostras sao verdadeiras ou podern ser explicadas pelo a ca so -
variabilidade da arnostra.
Considere-se 0 seguinte exernplo: em certo estudo deseja-se
COll1pal-aras estaturas de na sc im en to d as c ria nc as naturals d a s c id a de s
de Campinas e Macei6. Suponha que a media da s estaturas de todas as
r ri an ca s n a sc id a s em Campinas no periodo de estudo seja 53 ern e que
,\ media das estaturas das criancas nascidas em Macei6, no mesrno
periodo, seja 49 ern. Conclui-se, com certeza, que as criancas
campineiras sao, em media, 4 ern mais altas que aquelas nascidas em
Macei6 durante 0 periodo de estudo. E possivel ter 100% de certeza
quanto a esta conclusao, porque seesta lidando com populacoes inteiras,
nao coni arnostras e, nessa situacao, nao e necessario nenhum calcu!o
estatistico, pois os dados e as diferencas encontradas sao reais.
Raramente, entretanto, ha a oportunidade de se lidar com
populacoes inteiras; geralmente, disp6e-se apenas de a rno stra s d as
populacoes estudadas. Nessa condicao, ja nao se pode afirmar, sem
(azer calculos estatisticos, se as diferencas encontradas sao reais ou
simplesmente devidas a variabilidade das amostras.
o processo de testar uma hip6tese consiste em seis eta pas
sequencia is:
75
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 38/79
I. (·sl.li>(·I(·u·r 11111dip(')I('s(' ('xl)('rilll('III,tI (III 1(\ ',t'. "g,1 I J ;
2. eSlabelecer LJI l lC1 hipolc's(' I1UI,1 I i U I / ! tYI)() l lw~i~J (I-III Ii•.
se: agelzero);
3. deterrninar 0 tarnanho da arnostra:
4. colher os dados:
5. realizar a analise estatfstica para deterrn inar a probabilidade
de que a hip6tese nula s ej a v e rd a de ir a :
6. rejeitar ou nao a hip6tese nula.
Nesse exemplo, a hip6tese alternativa ( H) deve ser: os recem-
nascidos de Campinas tern urna dist ribu ic;:aod iferente de estatu ras ern
relac;:ao a o s r ec em -n a sc id o s de Macei6.
Notar que a hip6tese tala em di-
ferenca e, portanto, pode ser para mais
ou para menos, bicaudal - two tai l . No
exernplo em curso, fazer urna hip6tese
unicaudal ou uni lateral corresponderia a
afirrnar que os recem-nascido, de (;:1111-
pinas tern uma estatura rnaior que aque-les de Macei6.
A hip6tese nula (Ho) cleve ser 0
oposto da hip6tese forrnulada (HI)' 0
que, no exernplo, poderia ser: nao ha diferenca reprorlutfvel entre (IS
estaturas, e qualquer d ife re nc a o bs erv ad a e devida ~ variabilidade da s
Deve-se usar umo hipo+e-
se unilateral quando as
mudcnccs s6 puderem
ocorrer em uma unicc
direc;ao ou quando
interessarem somente
rnudonccs em uma unicc
direcdo.
am ostras.
A etapa seguinte consiste em deterrninar 0 tamanho da amos-
tra, 0 que deve ser feito antes do infcio da coleta de dados, e para
deterrnina-lo e preciso estabelecer qual di ferenc;:a deve ser considera-
cia signi ficativa. No exernplo atual , quantos centimetros de diferenca
entre as medias das estaturas devem ser consideraclos para se aceitar
que ha realmente uma diferenca de estatura entre as duas populacoes,
ou seja, qual "grau de diferenca" cleve ser considerado clinicaillente
significante? Esta e UI11Cldecisao arbitrar ia do pesquisador, baseada ria
experiencia, na l iteratura e/ou na relevancia clinica.
76
Aind.: Pdl'd <i(·I('lIl1il1.tr 0t.un.mho
dd dl11OSIrd,d cv c- s« c o ns id cr ar 0 nivcl de
significc1ncia ade q uado: q ua nto de
p ro ba bilida de e a ce ita vel para que Ho seja
verdadeira. Usual mente considera-se
como a de qu ad a u ma p ro ba bilid ad e de ate
5% (p < : 0,05), mas dependendo do que
',I' ostuda. esse nfvel pode ser diferente.
Deve-se definir t ambern qual 0 erro beta aceitavel. Quando se
Quanto menor a
dif erenco a ser
detectado,
maior deverd ser 0
tamanho do cmos+ro.
,I«'it;) urn erro beta de 0,1, esta-se
.u r-it .in do u ma chance de 1 0% de deixar
tI(· recon hecer u 11 1 a d ife re n ca que
u-.ilmente existe. Finalmente, deve-se
.onsiderar 0 de sv io -p adra o esp era do .
1',10 porque, quanta maier ele for, maier
tI('ver,') ser 0 tarnanho da arnostra . A
lo rmula para calculo do tam anho da s am ostra s pClra comparar SUclS
III(-'clias leva em conta todos os elementos citados:
Quanto menor 0 nfvel de
significoncia (p),
maior deve ser 0 tamanho
da amostra.
I1I1c1e e Z representam os escores Z de uma curva normal associadaa f3 . j I
,II)Svalores de alfa e beta, (J0 desvio-padrao, e D a diferenca co ns« era c a
' ,Ignificativa. Para este calculo e interessante deixar as contas para 0
«omputador.
A etapa seguinte consiste na coleta de dados . lernbrando seillpre
< J lie rnaus dados levam igual mente a mas cond us6es.
Uma vez obtidos os dados . faz-se a analise estatistica aplicando-
',I' testes escolhidos em funcao do tipo de dados disponivel.
Urn valor de p, probabilidade de que .a diferenca encontrada
.x.orreu por acaso e que seja devida a variabilidade das amostras . deve
',('I' determinado. Para p < : 0,05 ha 1 chance em cada 20 de que 0
«-sultado obtido seja consistente COIll Ho ' ou seja, que nao haja diferenca.
77
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 39/79
ENTENDENDO OS ERROS
Os pesquisadores realizarn experimentos para testar uma hip6-
tese. Eles formulam urna hip6tese, observam, analisam e em seguida
concluern. Ap6s observar, eles descrevem e medern (ou classi ficarn),
jarnais atribuindo jufzos de valor ao que estao vendo; podern decidir
erroneamente e rejeitar a hip6tese nula, rnesrno que ela seja verdadei-
ra: porern, se ela for verdadeira, querem que a probabilidade de vir a
cometer esse erro (tipo I ) seja pequena. Esta probabilidade charna-se
nfvel de signif icancia.
Ao testar urna hip6tese qualquer pode-se incorrer nos dois ti-
pos de erros apresentados no quadro 3.
Quadro 3 . T ip os d e e rr o n o te ste d e h ip 6te se s
~
(V) (F)
Ve rdade ira Fa/sa0
Re je ita r aE rr o tip o / Acerto
hip6tese
N ao r eje ita r aAcerto E rr o tip o "
hip6tese
Tratando-se da hip6tese nula, dado que ela seja verdadeira, 0
pesquisador cornete urn erro tipo I quando a rejeita. Ele aceita como
verdadeira urna diferenca que, de fato. nao existe e que, na realidade,
se deve a variabilidade das arnostras.
Quando a hip6tese H o e falsa e 0 pesquisador nao a rejei ta, ele
comete urn erro t ipo II; isso signi fica que existia, de fato, uma diferenca
que nao foi reconhecida.
78
POR QUE OCORREM ERROS
AO TESTAR H IP 6TESES?
I'
... * It I
Os erros tipo Iocorrern principal mente por dois motives: amos-
I l o I S pcquenas e rnuitas analises.
Devido a variabil idade das arnostras, helurna chance maier de
',I'H'1ll di ferentes quanta menores elas forern e, assim, de serern obser-
v . n l . r s diferencas que se di lui riarn numa amostra maier.
Quando se fazem anal ises estat fsticas corn muita frequencia. a
1,1(1,\caso acrescentado, por exernplo, tencle-se a parar assirn que for
1'I I( '(mtrada uma diferenca estatisticamente significante. Muitas analises
nrnrrcm tarnbern quando ha rnuitas variaveis ou muitos subgrupos sen-
do «omparados entre si. (Ver Procedirnento de Bonferroni no glossario).
Os erros tipo II ocorrern em funcao de arnostras pequenas (pr in-
1'1),11causa) e de grande variabilidade das mesmas. Essesdois fatores
I)cHlem eliminar aschances maternaticas de aparecer uma significancia
1",l.ltfstica.
Algurn erro sernpre ocorre, assirn e uti l deterrninar quanto de erro
I' .ulmisslvel: para 0 erro tipo I, ou al fa, considera-se que 5% e aceitavel e1'.11.10 erro tipo I I, ou beta, cornurnente aceita-se de '10% a 20%.
79
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 40/79
ENTENDENDO A VARIAB IL IDADE
DAS AMOSTRAS
As fontes de variabilidade das arnostras poclem ser agrupadas
em tres ti pos:
1. lrnprecisao ou erro experimental: a imprecisao. multo
i rnportante em Engenharia, constitui , na Medicina, uma fonte pequena
de variabilidade.
2. Variabi lidade biol6gica: as pessoas, ascelulas e os animals
variam grandemente entre si, nao s6 pela grande diversidade naturalrnente
existente, mas tam bern pela ocorrencia de variacoes circadianas (ao lon-
go do dial , devidas a idade, a alimentacao, ao habito de fumar etc. Esta
e urna fonte multo importante r ia area biol6gica.
3. Enganos: pipetagem errada. etiquetas trocadas, picos de
corrente. alteracoes de temperatura, diluicoes inadequadas etc.,
tarnbern contr ibuern para aurnentar a dispersao dos dados. Eles podern
ser sisternaticos, sernpre se repetirern e alterar consistentemente os
resultados - b ia se d m e a su r em e nt s, podendo ser devicJos a descalibragern
de instrurnentos de medida. bugs em programas de co rnputa do r - lima
formula errada. por exernplo etc.
Todos os tres tipos sao charnados de enos, mas a Estatfstica s6
consegue lidar corn os dois prirneiros.
80
ENTENDENDO 0 PODER DO ESTUDO
Ele esta relacionado corn a capacidade clo estuclo em detectar
rli l( 'r('n\,<1s. Por exernplo, urn deterrninado estudo pode ser poderoso 0
' .Ii1icicnte para encontrar uma diferenca de 30%, m<1Snao ser capaz de
d( 'll 'C[;H urna de 20%.
o poder do estudo e calculado atraves da seguinte formula:
Poder do estudo = 1 - Erro ~
T arn bern e charnado "poder do teste", sendo usado par<1plane-
i.tr () tarnanho da arnostra e tarnbern e util ao interpretar urn experi-
111('1110 ern que <1diferenca encontrada nao foi estatisticarnente
',ignificante.
Poder do estudo e a probabilidade de corretamente rejeitar
lima hip6tese nula falsa, isto e, dar'o que realrnente exista urna dife-
1('11(;;1, qual a.probabilidade de efetivarnente encontra-la.
Quando nurn experimento a diferenca encontrada nao resultou
('~l. ll istic<1rnente significante, e interessante calcular que poder tern 0
(", ll lelO realizado par<1detecta-la. Quante maim a dispersao clos dados
( ' menor 0 tamanho das amostras, rnenor sera 0 poder do estuclo
Io.ilizado.
81
r
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 41/79
EVITANDO ERROS
'I, Uti lize arnostras de tarnanho adequado evitando aspeque-
nas, Para fins praticos pode-se considerar:
Arnostras grandes: n > 100
Amostras medias: n > 30
Amostras pequenas: n < 30
Arnostras multo pequenas: n < 12
2. Evite dernasiadas co rnpar acoes e subgrupos. Quando sao feitas
multiplas cornparacoes e se aceita 5% de erro ern cada urna delas, a
chance de se encontrar urna diferenca por mero acaso aurnenta
exponencialmente, por exernplo, seforern cornparadas 4 medias, duas
a duas, estarao sendo realizadas 6 cornparacoes e a chance de encontrar
uma diferenca por rnero acaso sera de 6 X 5% ou seja de 30%. Ver
f igura 23.
82
F ig u ra 2 3 . Aument o e x po nenc la l d o n um e r o d e cor npa ra co es q uando sao compar acas
var ia s m ed ia s e n tr e s i.
50N um er'o de
c om p ar a, ;;6 e s •.. ,•. ./40
30•
. . . . . . . . . . . . .
•• . . . . .-. .".• . . . .- .. -• . .- . ' - -
. - - - _ ., : : : : = : . r - - + - - + t----t-t---I
2 3 4 5 6 7 8 9 10
20
10
r " , J IJm e ro de m ad ias co r npa rad as
3. Obtenha dados com a menor dispersao possivel.
83
,~(' tl., n",IIIt.ltI() ...0 1 , I itl()" 1 '111 illfillit.l', ~l'lit,,,, <it' IdIH.,dIlH'l1los,
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 42/79
D ISTR IB UIC ;;6ES D E F REQUENCIA S
E rnuito importante cornpreender 0 que e probabilidade de
urn evento e como uma serie de eventos forma L1IllCl distr ibuicao de
frequencias,U rna m oeda , a pes ser jogada para cim a, p odera ca ir COIll a face
cara ou (1 face coroa exposta. Urn evento elernentar nesse experirnen-
to, sera cair cara e outro, cair coroa. Dado que a moeda e honesta, a
pro ba bilida de da ocorrencia de cada evento e igual, is to e. 50%.
Suponha urn experimento que cons ista em lancar uma rnoeda
200 vezes parCl verificar a porcentagern de earns OLi coroas que sera
obtida e considere que se repitarn infinitas series de 200 lancamentos.
COIllO 0 numero 200 e grande, na maioria dos resultados ocorrera cer-
C C I de 50% parCl cada evento, entretanto, resultados pouco esperados
tarnbern ocorrerao. ernbora menos frequenternente.
T ab e la 1 0 . F r eq u en cia d os e ve n to s " ca ra " e " co ro a" p or s er ie d e la nc ar ne n to s
S e r le d e la n ca rn e n to s % "caras" % "coroas"
49 51
2 5 1 49
3 48 52
4 5 0 50
5 50 50
6 47 53
60 .009 8 92
888.00 0 73 27
1.000.099 5 95
84
tOil It ) I'tli ('x('lllpltl .I frt'qi"liil1tid <iI' (drdS <i(' (d<id s('ril', ftlrt'l1l insor idos
Illlill gr,ililO til' tlislriIJllit.;.\o dl' frc'qCI('llci(lS (figur(l 24), SCI-,1bticla uma
rurv.: (;.IIISsitllltl COIll Illl'ditl de 50%.
Figura 2 4, D en sid ad e d e p ro ba bilid ad e p ar a 0 e v e n t o " ca r as "
....----- % d e c ar as ..~
A figura 24 e a representacao grafica da distribuicao das fre-
q ue nc ia s d a p ro b a bi li da d e, para 0 evento caras, de uma p op ula ca o in-
teira e infinita. Ela nao e urn histograma porque a populacao e infinita.
Embora asdistribuicoes de probabilidade sejarn sirnilares aos histograrnas,
os eixos y sao diferentes, pois nao podern mostrar 0 numero total de
observacoes por categorias, como ocorre num histograma. A probabili -
dade e representada pela a rm sob a curva (a area total sob <1 curva
rcpresenta 100% da populacao) eo eixo y e charnado de densidade de
probabilidade.
Tarnbern aqui os conceitos ja cliscuticlos de media e desvio-padrao
seapl icam e pode-se dizer que seforem considerados 1,96 DP para cada
lado da media, estara delimitando-se uma area que engloba 95% da po-
pulacao, conforrne rnostra a f igura 25.
85
¥if·'
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 43/79
86
F ig u ra 2 5 . M e dia . desvo-pauao e d en sid a oe d e
M e d i a
D
en
si
d
a
d
e
I-I
Figura 2 6 . 0 v alo r d o t e st e e sta tis tic o p ar a c ad a a m os tr a
E NTEN DE NDO O S TE STES D E SIG NIF IC AN CIA
Considere urna p op ul ac a o h or no ge ne a cia qual foram extraidas
I ll finit;1s arnostras cle urn deterrninado tarnanho. Foi escolhiclo urn teste
I',>lcllistico e calculado 0 seu valor (VTE
) para cada arnostra (figura 26).
I--------iI !
I
00
. . .
Assirn como ocorreu com 0 experimento do lancamento das
moedas, ocorrerao VTEmais frequentes, outros menos frequentes e ainda
«utros escassos, A curva representativa da distr ibuicao destes VTE
tam-
1 ) ( - ' 1 1 1 e Caussiana e aqui tarnbem se aplicam os conceitos de media e
.k-svio-padrao : em 95% das vezes 0 VTE
calculado para uma arnostra
qualquer estara entre -1,96 DP para cada lado do VTE
medic, em 2,5%
87
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 44/79
F ig u ra 2 7 . Valor do teste estat is t ico , dosvio·pndr l' lo
e dens idade de p robab i li dade. . . . . . . . . _ ...- _ • ....... . . . . _ " .
VT Er n edo
cbs vezes estara na extremidade direita e em 2,5% das vezes na extre-
midade esquerda da curva, conforrne a figura 27.
Quando se obtern 0VTE
para urna determinada amostra. 0 valor
obtido situa-se em algurn ponto da curva, que podera ou nao estar
contido na area representativa dos 95% (figura 28).
D
en
si
d
ad
e
·1,96DP +1.96DP
88
Va lo r do t est e es ta tf st ic o
F ig ur a 2 8. S itu ac ao do v alor c alc ula do : e sta in clu ido n os 9 5% o u n ao ?
p.s:O,05
i
! , : o : o d ; ps:O,025.........~ . .
(95%)
-1,96 DP
I t+1,96 DP
.. . . . ..I
o v alo r o btid o situ a- se e n tr e o s 9 5% r na is pr ov av eis?
DISTRIBUI~Ao t ( STUDENT )
Parece razoavel que, quando nao se conhece 0 desvio-padrao
dd populacao, ele possa ser substi tufdo pelo desvio-padrao cia arnos t ra .
Mas quando se trata especialrnente de arnostras pequenas, isso nao e
l ima boa ideia.
Sabedor das cli ficuldades que os pesquisadores tern para obter
.unostras grandes, 0 quimico William Sealy Cosset (1876-1936) desen-
volveu a "estatfstica til e a publicou sob 0 pseudonirno de Student. Para
ontende-la, considere 0 seguinte: se for uti lizado 0 desvio-padrao cia
.unostra no calculo de urn escore Z populacional, estara introduzinclo-
s(' incerteza ao resul tado, isto porque se0 desvio-padrao da arnostra for
menor que 0 da populacao, 0 escore Z resultante sera multo grande e
vice-versa. Assirn, quando nao se conhece 0 desvio-padrao da popula-< . < 1 0 , mas sim uma esti rnativa do mesrno com base 1 1 0 desvio-padrao da
.imostra, a distribuicao de escores Z ja nao sera mais normal e seguira
1 1 1 1 1 C 1 distribuicao conhecida como "distribuicao til, cuja forma lernbra CI
da distribuicao normal, porern com mais area IlCiS caudas.
Essadistribuicao t possui como caracteristicas: ser continua e
sirnetrica. ter media igual a 0, variacao de + 00 a - 00 e desvio-padrao
variavel com 0 tarnanho cia arnostra (n). Nao existe urna (mica distribui-
89
• $ ,! j; P; ; i a
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 45/79
(,.Ill I , 111.t S sim lim grllpo p.I r. t c .td. t t.unanho <ll' .1111()slr.l 1'.\1'.1(' 11111.1
d istri bu i<,;2ioe luna curva especffic:a, conforrne figllrCl 2(),
F i gu r a 2 9 , D is tr ib u ic ao d e t x g ra u s d e l ib e r da de(._ .. -- _ ..__ .._----i - - - - - - - - - - - - - - - 1
i
n g r au s d e l ib e r da de I
oen
si
dade 4 g ra u s d e l ib e r da de
. . I-4 o I 1
Va lo r e s d e t
A estatistica tea adequada para pequenas amostras (n<30),
embora possa ser usada em arnostras maiores. Para seu calculo util iza-
se a seguinte formula:
x - Jl x-Jlt=
EPM s(x)--
Vn
Observar a sernelhanca com 0 escore z: em unidades de Erro
Padrao da Media, quanto a media de uma particular arnostra se afasta
da media (verdadeira) da populacao.
90
ENTENDENDO 0 TESTE t
I'
1II :I
I,jJ
Esseteste 56 e apl icado para dados do t ipo continuo e corn distr i-
hllic;:aoCaussiana. E , provavelrnente, 0 rnais usado para comparar duas
.unostras, duas colunas de dados entre si; rnesmo quando e aplicado a
lima unica arnostra , uma coluna de dados, ele compara a media da mes-
111.1com urna media hipotet ica te6r ica, extraida da l iteratura ou de outro
oxperirnento da populacao.
o teste t, conforrne citado, pode ser aplicado para verificar se
IIl11aunica arnostra provern ou nao de urna populacao cuja media e
«onhec ida: por exernplo, para testar se 0 tempo de coagulacao medic
obtido ern uma arnostra de criancas prernaturas difere ou nao do valor
padrao referido pela literatura.
o teste t para duas amostras independentes e basicarnente 0
IIlCSl1l0, mas incorpora inforrnacoes concernentes a variabilidade cbs
me di as d as d ua s a rn os tr as te st ad as .
o exernplo a seguir rnostra 0 teste aplicado para comparar duas
.unostras: urn pesquisador, testando uma nova droga. quis verif icar seela
( 'ra rnelhor para tratar cletenninacla doenca que 0 tratamento classico
vigente. Para tanto, mediu os tempos de recuperacao ern dois grupos, A
(. 11,obtendo os resultados apresentados na tabela 1".
91
T ab e la 1 1. T e m po d o r ec up er ac ao x trnlarnunlo () tll'llollill,lliUI' Ii"..., ,'lItilll.1 Irol(,oIo (')(l>lill1l' (I '1 "(' ~ ('
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 46/79
T e m po s d e r e cu pe r ac ao (d ia s)
T ratam en to classlco (A) Tratam en to n ovo (8 )
10 6
8 7
14 6
12 8
15 7
9 9
8 6
A prirneira vista, 0 novo tratarnento parece reduzir 0 tempo de
recuperacao. entretanto, para que haja certeza quanto a esta conclu-
sao, deve-se aplicar 0 teste t considerando a hip6tese HIIde que nao ha
diferenca entre os dois grupos.
o teste t usa a diferenca entre as medias clos dois grupos e 0
erro padrao das diferencas das medias entre os dois grupos e a seguinte
formula e usada para seu calculo:
onde EP(erro padrao) combina os desvios-padrao dos grupos e 0 nurne-
ro de dados (n) ern cada grupo. Nao e necessario dispor dos dados bru-
tos para seu calculo, podendo ser feito corn base na s medias, desvios-
padrao e t amanho de cada grupo. Para obtero valor de t e po~sivel f aze r
calculos manuals usando asformulas a seguir ou urn software estatistico.
[2 :: x/ - < Lx y/n ) + [2::xb2 - (:~:Xll/nh]
(n, - 1) + (n"- 1)
92
(CIIIV('IH()jHIIl I'holl11.11' < 1 ( , gr,l1l~ d(, li iJ(' ld"d(, (( ; li iJ) d(' (,dd" .unostr.r,
'1"( ' " , , ( 1 . , 1 11 0 1is( , '1 1 11 ' u ma ( 01 '1 1 1" d(' (.t/(·r lII11it correc.io em Iuncao do
t .uu.mho d" .uno str.i (' do numcro de cornbinacoes possiveis.
I'dI'd cakulnr 0 nurnero de graus de liberdade - degre e s o f
11I,(,(/UIII, [)F - er n clifcrentes si tuacoes. proceda da seguinte forma:
Amostra isolada: n -1
Amostras empare lhadas: ruimero de pares -1
Amos t r a s nao empare lhadas: soma dos graus de
liberdade de cada amostra isolada, por exemplo
[(na - 1) + (n,,-l)]
Tabe las de contingencia:
(n" de linhas - 1) x (n° de colunas -1)
Tabela de coeficiente de correlacao ("r"): (n° de pares -2)
Observar que quando se trabalha com pares a unidade e 0 p<lr.
Na analise dos tratamentos A e B citados 0 que se deseja e compa-
1.11'as duas arnostras ( du a s c o lu na s de d ad o s) , a p li ca r 0 teste t parClverificar
.I hip6tese nula de que nao ha diferenca entre elas e, para tanto, deve-se
Ii ro ce de r d a seguinte forma:
• verificar se a distribuicao dos dados e Caussiana:
calcular a estatistica t (to = t observado):
• cornparar 0 to com 0 te( t critico); 0 te pode ser obtido em
uma tabela de valores de t e para tanto, deve-se localizar 0a (nivel de
significancia pretendido) n a r no l du ra superior da ta bela , em se gu id a lo ca -
lilar a lin ha correspondente ao s graus de liberdade pertinente ao estuclo
om questao e ler 0 valor do te no cruzarnento. Se0 valor observado to for
maier que 0 valor critico ( to> t), significa que 0 valor observado esta
. if a st ado a l er n de 1,96 DP da media e que, portanto , tem <5% de chance
de ocorrer por acaso e 95% de chance de nao ocorrer, Ass im, deve-se
rejeitar H o e aceitar a hip6tese alternativa H I ' Se to < te, nao rejeitar H o
ovalor calculado para a estatlstica t no exernplo acima e to = 3,315.
l 'rocurando na tabela 12 0 t critico para urn a de 5% e 12 gl-aus de
lib erd ad e - d ua s a rn ostra s n ao e mp are lh ad as com n= 7 =, obtern-se 0
93
vdlorl,. L , 1 7 ( ) , port.mto, inferior .10 obsorvado, COl1dlll'!lc', t llt.1!), ' 1 11 ( ' 1111
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 47/79
dove ser rejei tado, ou se]a. ha uma difercnca cs ta r is t icam onte .,igl1ili(.1111(·
entre os do is tratarnentos.
T a be l a1 2 . E x tr at o d e t ab e la d e v al or e s c rf ti co s d a d is tr ib u ic ao t
V AL OR ES C R iT IC O S D Er ( Pr ob a b il id ad e b ic au d al )
G rau s de lib e rdade p=0 ,250 p=0 ,05 0 p=0 ,0 10 p = O , O O l
2 1 ,60 4 4 ,3 03 9,925
3 1,423 3 ,182 5 ,841
4 1 ,344 2 ,776 4,60 4
5 1,30 1 2 ,5 71 4,032
11 1,214 2 ,201 3 ,10 6
12 1,209 2 ,179 3,05 5
u m te ste m on ocau dal divida os valore s 2
94
31,600
12,924
8,610
6,869
4,437
4,318
ENTENDENDO 0 TESTEDEQUI-QUADRADO
Confonne foi visto, 0 teste t e urn teste de significancia aplicado
p"ril dados continuos. Para comparar dados norninais , e portanto, sern
<iislribui<;:ao normal, urn teste cornumente usado e 0 de Qui-quadrado
Chi- squar e , que constitui uma medida da discrepancia entre as fre-
(ICI('~nciasobservadas e as esperadas,
l .ernbrar que dados norninais sao aqueles separaveis em categori-
.Is, sern nenhuma ordern especial , como sexo, cor dos cabelos etc.
A base do teste e bastante simples, usando-se para 0 seu calcu-
I() tl seguinte expressao:
(observado - esperado)-X 2 = L ------. ., .-:- .- --
esperado
Para aplicar a formula e facil itar 0 raciocinio, 0 prirneiro passo e
construir uma tabela de contingencia contendo os valores observados,
Exemplificando: considere urn estudo em que se deseje anal i-
S.lr a mortalidade por urna determinada doenca apos 0 surgimento de
11111 novo tratarnento, com os resultados expressos na tabela 13.
T ab e la 1 3. E xe m plo d e tab e la de cont inqencia
Sob revivencia Morte Totais
T ra tamento classlco
T ra ta m e nto n ov o
35
70
24
21
59
91
Totais 10 5 45 15 0
95
l .cmbrar qllt' ,I hip6tl'S(~ nula ('.1 d( ' tllI(' n.io h.\ < l i l ( " ( " 1 < , , " ("lin'
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 48/79
os dois t r a tarnentos e, assim, para calcu lar 0 valor e sp cr .u lo d cv o-s o
proceder corno segue:
o esperado para sobrevivencia, considerando que os dois t rata-
mentes sao igualrnente eficazes, e urna proporcao de 1 05 ern cada
'ISO cases, portanto, tern-se:
Tratarnento classico: (105/150) x 59 = 41,3
Tratarnento novo: (105/150) x 91 = 63,7
Do mesmo modo. 0 esperado para 0 evento rnorte, consideran-
do a hip6tese Ho de que os dois tratarnentos nao di fe re rn entre si, e
uma proporcao de 4 5 ern cada 1 50 cases, portanto:
Tratarnento classico: (45/150) x 59 = 17,7
Tratarnento novo: (45/150) x 91 = 27,3
Para cada urna das celulas da tabela de cont ingencia. calcula-se
o q ua dra do d a dife re nca entre 0 observado e 0 esperado e divicle-se
pe!o valor esp era do . so rna nd o-se e rn se gu ld a os resultados:
(35 - 41,3)2 (24 -17,7)2 (70- 63 7)2 (21- 27,3)2X
2
= + +' + = 5,280341,3 17,7 63,7 27,3
x : (com correcao de Yates) = 4,475
Observar que, para osresul tados esperados, os
valores obtidos ndo sao
nurner-os inteiros, clem
disso os valores calculados
para p. sem que se fccc
nenhuma correcdo do X 2,
sao muito pequenos
Para contornar essesproblemas,
Yates propos urna correcao del form ula
para ser apl icada quando h<1sornente
uma ou duas categorias envolvidas.
96
(lohsl'rvado-l'slwr,ulol-(),:;)J 'I I, . ... (corn lOln'l.IU ( l' Y.ltV'» J
sperado '
_._-_ .. _ -_ .._----------------------
Ca kul.ulo () va lo r, procurd-se na t.ihel.: dl' distribuic.ro do X J 0
ro rrosponrh-ntc va lor de p ern funcao do s grews d e li bo rd ad e no ('stl'-
du l'm qllest;'to, e para encontrcl-Io utiliz,l-se c1 f6 " l lL r iCl ,d)cIlXO:
[ Gra us de liberdade (Glib )= (n° de linha s - '1) x (n° de co luna s - = - 1 )
No exernplo ern curso, tem-se ducts colunas - sobrevivoncia emorte - e duas linhas - tratarnento classico e novo e, po,'t,lIlto,1 gl-dl!
de liberdade resultante de:
I Glib = (2 - 1) x (2 - 1) = 1 x 1 = 1 I
o valor corrigido (Yates) do X 1 no exem plo ern qucst.io (, de
4 ,475 eo nurnero de graus de liberdade e 1 , que aplicados ,1ta bela 1 4
de distribuicao do X 2 a seguir, revelarn urn valor de p entre 0,0':; e
(),Ol, mostrando que heiuma chance entre I % e 5% de (I L IE ' , IS cliferr-n-
(".IS o bserva da s seja rn devida s a va ria hilida d« d.is ,1In05tr.l5.
T ab e la 1 4 . E x tr at o d e t ab e la d e d is tr ib u ic ao d e Ou i- q ua or ad o.
---------- ... -----.----.----- ._ ._-- -_ -- --
D ISTRI BU1 9A o DE QU I-QUADRADO
G raus de lib e rdade p=O,25 p=O,0 5 p=O,01 p=O,0 01------,,-_ .. ... " ... _ . __ . _ . . . __ . --
1 ,3 23 3 ,841 6 ,33 5 10 ,827
2 2,773 5 ,991 9,210 13 ,815
3 4,108 7 ,815 11 ,3 45 16 ,26 6
4 5 ,3 85 9,488 13 ,277 18 ,46 6~-~~----------
Ao se aplicar 0 teste X l pressupoe-se 0 seguillte:
1- A amostragern foi adequada: 0 suficientemente grande,
escolhida ao acaso e representativa.
2- Os dados provem de urna tabela de contingencia onde os
nurneros s50 aqueles realrnente observados - raw elata, e
nao porcentagens ou taxas, e onde as colunas 550 mutua-
mente exclusivas.
3- Os valores totals 550 superiores a 20 e os valores esperados
sao superiores a 5 ,
97
· . A figllr.~ .W Illostrd um.t curv.: e l l ' dislrilJlIi~';'() ! l t t qll i <jl lddrddo
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 49/79
cuja fo rm a vana em Iunca o do nurnero de gra us de liIJI'I'<I.1(I('.
F ig ur a 3 0 . D is tr ib u ig ao d e Q u i- qu ad ra do e g ra us d e lib e rd ad e
_ 0 teste de Qui-quadrado pode ser usado para testar se as pro-
porcoes encontradas no grupo estudado diferem das esperadas teorica-
mente. Vel' exercfcio 15.
98
ENTENDENDO A ESCOLHA DE UM TESTE D E
SIGN IF lcANCIA (OU DE HIP 6TESE OU, AINDA
D E R EGRA S DE D EC IS AO )
A escolha de urn teste de significancia depende de caracterist icas
do s dados coletados como:
t ipo de dados: norninais, ordinals ou continuos;
arnostras isoladas, duas arnostras ou mais de dois grupos;
ernparelharnento ou nao:
arnostras grandes ou pequenas (dados norninais):
distr ibuicao normal ou nao (dados continuos).
A prirneira etapa consiste em determinar 0 tipo de dados
disponivel, pois 0 teste a ser aplicado varia ern fun<:;:aodo mesrno.
A decisao seguinte consiste em deterrninar quantos grupos serao
romparados . Quando se trata de dois grupos de dados. 0 tes te de
significancia deterrnina a probabilidade de eles se originarem, ou nao,
da rnesma populacao, Quando sedeseja comparar mais de dois grupos,
, 'IS vezes 5, 10 ou mais, deve-se usaralguma forma de analise de variancia.
0'ernparelharnento de dados tambern e importante na escolha
do teste de significancia, pois diferentes testes podern ser usados na
dependencia de ele tel' ocorriclo ou nao - matched x u nm atched -
pa ir ed x unpa ir ed .
o tarnanho cia amostra tarnbern e deterrninante cia escolha do
tipo de teste, ass irn como a distribuicao dos valores ao redor da media
(normal ou nao).
99
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 50/79
ENTENDENDO 0 EM PARELH AM ENTO...... to , to .. II ..
Quando se extraem amostras de uma populacao, e desejave]
que a variabil idade entre elas seja minima e e por issoque, as vezes, se
fa z urn ernparelhamento. Elepode ser natural, corno 0 que ocorre entre
gerneos identicos que reduz a variabilidade ao minimo: ser artificial
quando se procura forrnar pares sernelhantes em relacao a urna serie
de ca ra cteristica s, m esm a ida de, rnesmo sexo , m esm a a ltura e peso,
furnantes ou nao etc.. ou ser urn auto-emparelhamento - se lf-pair ing,
onde cada elemento atua como seu proprio controle. Urn born exernplo
eleauto-ernparelharnento seria estudar a farrnacocinetica de uma droga
ern urn grupo de desnutridos e usar como controle 0 rnesrno grupo,apos a recuperacao do estado nutr ic ional.
o emparelhamento e definido pelo
investigador como parte do desenho d a p es qu is a
e, p orta nto , a in da n a fa se de planejarnento. Os seus
maiores beneficios sao: el irninar consideravsl
quantidade de variabilidade e, consequentemente,
poder dirninuir 0 ta ma nho da s arnostras .
Na l inguagem do dia-a-dia, 0 ernparelha-
mento e fre q ue nteme nte referido como
parearnento, pela influencia de como e denorni-
nado em ingles - paired, mas isso nao e correto.
E errado
considerar como
emparelhados dois
grupos somente
porque tem 0
mesmo n
100
No~6ES DE TESTES ESTAT fs TICOS
N;\O-PARAMETRICOS
A rnaioria dos testes de hip6tese vistos anteriorrnente necessita
I i ( ' qlle a distribuicao da populacao da qual as a rn o st ra s f o ra rn extraidas
obedeca a urna serie de requisitos. Ha,
e nt re ta n to , s it ua c o es em que tais requisitos na o
se justificarn e tambern aquelas em que a
distr ibuicao e al tarnente assirnetr ica. Por isso
Os testes nao
pcrcmetri cos
mdependem doos estatfsticos imaginar am testes que
distribui<_;:aodos
dados nos omostros independern das distribuicoes populacionais e
dos p a ram e tr es a s so c ia d o s. que sao charnados
de testes nao-pararnetricos.
Eles podem ser ut il izados como substi tutos abreviados de testes
m.iis cornplicados e tern especial valor no processarnento de da do s na o
( on t i nuos . Quando em duvida. alguns escolhem urn teste pararnetr ico
qu.mdo nao estao seguros de que a distr ibuicao Caussiana foi violada,
(' outros escolhem testes nao-parametricos porque nao estao seguros
d( ' que a distribuicao Gaussiana foi encontrada.
Os testes nao pararnetr ico s tern menos poder que os
p.irarnetricos para encontrar diferencas na populacao. pois eles deixarn
Ii(' ut il izar algumas das inforrnacoes disponfveis ao converter numeros
.mpostos - ranks, ou diferencas entre nurneros em sinais positivos e
IH'gativos simplesrnente.
. !
I
I I
101
1 . , . , 1 ' 1 t ' ~ I I ' ('olHlllllli um.t , 1 1 1 1 '1 1 1 , 1 1 i v ,1 1l,'I(),p.trdlll('lri(d (IIH'IHIS
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 51/79
TE STES ES TA TfsTIC O S PARA DADOS NOM IN AIS. • '" . '" . '" • '" . 1 . , . , . . . '" . , " •
Quatro testes sao usados para analisar dad os norninais, cada
urn deles com a sua apl icacao especif ica:
teste do sinal - S ig n T es t
teste de McNemar
teste exato de Fisher
teste de Qu i-q uad rado
Uma sugestao para escolha do teste a ser aplicado esta apresentada
no diagrama da figura 31; 0 pri rnei ro passo para a escolha consiste em
verif icar seos dados estao ernparelhados ou nao. Tratando-se de amostras
ernparelhadas, 0 teste a ser escolhido depende do tarnanho da arnost ra.
Se n < 25, pode ser usado 0 teste do sinal e se n ~ 25, a escolha deve
cair no teste de McNemar.
o teste do sinal recebe este nome porque a diferenca em cada
par selecionado e convertida nos sinais de +, de - ou 0 (quando nao
houver diferenca), nao importando a magnitude da diferenca. Se a
hip6tese nula e verdadeira, espera-se encontrar urna ocorrencia de n/2
sinais positivos (+) e n/2 sinais negativos H; 0 problema passa a ser,
portanto, testar a hip6tese de que a proporcao de vezes (p') em que
aparece 0 sinal de + ou de - seja igual a 0,5; valendo-se disso, e posslvelgerar urn escore Z, utilizando a formula abaixo:
/ Z = 2 (p'- O,5)Vn /,
onde n e 0 nurnero de pares ern que houve diferenca e p' e a frequencia
de sinais positivos (+) ou negativos H.
102
jl(Jti('IOSd) do I('sll' t 1 ' , 1 1 ' , 1 ,1I11()SlrolS ('Illj>.trl'lhiHI.ls.
1xcmplif lc.mdu: l'()llsidl'rl' UI11.1 silll'l(,/io em quc se deseje
1",((lllll'r «ntro dois uqulpamentos de laboratorio. A e B, capazes de
I("tli/.ll' 1 L aruilises difcrentes - tarefas, e que a rapidez de execucao
" ( ' 1 . 1 lim ponte a ser considerado. Com a finalidade de verificar se os
1'<jllip.lIllentos diferiarn entre si contou-se 0 numero de vezes que cada
I.II'I,f.I podia ser executada num determinado espaco de tempo por
( .ul.: 1 1 m deles. Os resul tados obtidos estao apresentados na tabela 15.
T ab e la 1 5 . R e su lta do s o btid os p elo s e q uip am e n to s A e B .
Tarefa N 2de e xe cu coe s (A ) N 2 de execucoes (B) Dife re nyas (A-B)
1 4 0 2 9 +
2 2 2 1 6 +
3 2 2 2 9
4 4 5 4 1 +
5 6 8 6 1 +
6 3 3 2 4 +
7 4 8 5 4
8 7 5 6 8 +
9 4 1 3 6 +
1 0 4 4 3 6 +
1 1 4 7 4 2 +
1 2 3 1 2 5 +
Observa-se que 0 sinal das diferencas s6 e negativo para astarefas
Ie 7, portanto a frequencia de sinais negativos e p'= 2/12 =1/6. Aplicando-
~(' a formula para calcular Z, tem-se: Z = 2 (1/6 - 1/2) m = -2,28. 0
valor crit ico de Z para urn alta de 5% e 1,96 (bicaudal) , logo pode-se dizer
que osequipamentos A e B diferern entre siquanta a velocidade para urn
nivel de significancia de 5%.
Observa-se que sornente 0 sinal da diferenca e considerado, 0
t .imanho nao.
o teste do sinal tambern pede ser aplicado para arnostras nao-
emparelhadas.
103
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 52/79
)e i 0 teste de McNemar, uma l11odificilc.,:;jodo 1 1 ', 1 1' I I I' (~lIi-qlltl-
drado, foi criado para acornodar arnostras ernparelh.ul.is.
Usualmente, os dados nominais provern de estucios em que ,IS
arnostras nao sao ernparelhadas. Dois testes calcularn 0 valor de p, tes-
tando a hip6tese nula de que as frequencias encontradas sao iguais: 0
teste exato de Fisher e 0 de Qui-quadrado. A opcao por um deles de-
pende da amostra ser pequena ou grande (arnostra pequena e aquela
que possui algum valor esperado inferior a 5).
o teste de Fisher e usado para asarnostras pequenas e produz
menos erros tipo I e II em relacao ao teste do Qui-quadrado. Ele calcu-
la a probabilidade de que a tabela de contingencia usada tenha sido
obtida por acaso e, para tanto, sem mudar os totals das colunas e li-
nhas, ele const r6i todas as tabelas possiveis. Os softwares estatisticos,
na sua rnaior ia sao capazes de apl ica- lo.
Figura 3 1. R ot eir o p ar a e sc olh a d o t es te p ar a d ad os n om in ai s
D A D O S
N O M I N A I S
T E S T E
D O S IN A L
T E S T E
D E F IS H E R
T ES TE D E
Q U I - Q U A D R A D O
T ES T E D E
M c N E M A R
--_-----------------------_
104
TESTES ESTATfsTICOS NAo -PARAMETRICOS
PARA DADOS ORDINAlS. " " . ; p . . . . . . . . . ~ . . " i . . " '"
Conforme discutido anteriorrnente nao sedeve calcular medias
I' multo rnenos cornpara-Ias quando se trata de dados ordinals e por
I',SO, para analisa-Io s. frequentemente sao usad os testes n50
p.rrametricos, dentre os quais os mais comumente aplicados 550:
W ilco xo n S igne d R ani< S um T est
M ann-W hitney U Test
F rie dm an T est
K r u si< a l-Wa ll is T e s t
Para selecionar 0 teste mais adequado, algumas caractertst icas
dos dados devern ser observadas:
numero de grupos: dois OLI mais
emparelhamento: presente ou ausente
A figura 32 apresenta sugest6es para a escolha de testes, baseada
n.is caracteristicas citadas,
105
( ) lI'slt' n.\o·p.H,"l1l\1 rim Wlkuxo l l S ig l ll 'd R a n k Sum dl'~1illd-!-.l' d
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 53/79
(j)
'r oc
E0(j)
0-0CO-0
~COo_
(f)
2 «j)
Z2 00-0 a:c o 0
.._
s: (f)
(5 0u
~j)
Q)
~ 0
c oo_
e
~a:NM
ctl
~C
u : : :
106
------------_ _ _ -- -------_"_"_"_---
80«
r--05
' < 1 : : Wza:
c t(f)
: : 2 :
0W
0. . .::J
f-a:C)
C\J (f)1\
00< 1 : :J:
'--_.J
Wa:
c t: : 2 :W
(f)
0
f :2oJ:
- ' < 1 : : _.JZWa:
c t: : 2 :
(f) W
00. . .::J -a:C)
(f)C\J
8«I
- - - _J
W
a:c t: : 2 :W
>-W
Zf-
~Z
~: : 2 :
1111111'.11'.11 dois Hnlpo~ ('ll1p.II'('lh.ul()s. Ill' (, us.ido ox.u.uncnt« na 1ll('SI1l,1
',lllld(,'.lo 1 1 " (' ( ) It'sl<~ I I'dI'd . un o st r.i s om pa rc lh ad .rs . D et al he s d ev er n ser
tll'iX,Hlos pclrcl 0 computador, mas St '0 leiter quiser Iazer ascontas:
1 - Para carla par, calcular a diferenca entre os valores: urn
dl'n{'scilllo gerara urn nurnero negativo e urn acrescimo, urn positivo.
2 - Ignorar 0 sinal ternporariamente e classificar (atribuir postos)
II', v.ilo res a bso lutes da s diferencas (a menor di ferenca recebe 0 postoI) S(' nf io existi r diferenca, considerar igual a O.
3 - Sornar todos os postos das diferencas positivas e das
11I'g.ltivas obtendo-se somas charnadas de T .
4 - Mediante tabela apropriada, encontrar os valores de p
I I i rrespondentes aos valores dos T obtidos, considerando como n 0
11I'1I11eroe pares em que houve diferenca, excluindo aqueles ern que
.Idiferenca e O.Se os dois valores estiverern bastante afastados, 0 valor
til' p sera pequeno. Algumas tabelas usam apenas 0 menor valor de T .
I !
Exemplificando: considere 0 estudo de urn farrnaco, em que os
usuarios do mesrno parecern ter 0 nurnero de certo tipo de celula
'"lIlgCifnea alterado durante 0 seu uso e que setenha obtido os resul tados
.Iiiresenta do s na tabela 1 6 :
T ab e la 1 6 . C o n ta ge m d e c elu la s n os d o is g ru p os
C on tag em do n um e ro de ce lu las
Placeb o(g rupo con trole ) Droga
1.162 890
1.095 800
1.420 1,104
1.36 1 1.00 2
1.101 1,101
999 858
1.333 988
1,235 87 5
107
C.dcul,IIHIO-SI' <IS difl,rt'IH:"S (' ll"SSili(.1I1t1" ,,~ «()llIo",lt' 1111t,di"I"'ll1'I1II' o,'ljll'rlor ( I , ' . .. ...1 '" pm di.1I11(' (WI' 1.11) ( ,1 , ,111) , illll('I)('I1-
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 54/79
expl icado aci rna tern-se:
T ab e la 1 7. R e su lta do p ar a g ru po -c on tr ole , g ru po d e e stu do e c alc uio s
~~-.~...
Controle Droga Dife re nca Dlte re nca classificada
1.162 89 0 -272 -2
1.095 80 0 -295 -3
1.420 1.104 -316 -4
1.361 1.002 -35 9 -6
1.101 1.101 0
999 858 -141 - 1 (a m e n or )1.333 988 -345 -5
1.235 875 -36 0 -7 (a m aior )
1.000 1.000 0
No exernplo, as diferencas forarn todas negativas ou nulas
conforme tabela 17; a soma dos postos, rank, das diferencas negativas
e (-28) (T = 28) e a soma das classificacoes das diferencas positivas e
zero ja que nao houve nenhurna. Deve-se procurar na tabela adequada
o valor de p para 0 T calculado. considerando que n = (9 - 2) = 7
(forarn exclufdos os dois pares em que nao houve di ferenca). Verif icada
a tabela, obtern-se um valor de p=O,018 (bicaudal) considerado
signi ficativo, ou seja. a droga provavelrnente altera a contagern da celula
sangulnea estudada.
o teste U de Mann-Whitney tarnbern conhecido como teste
de Wilcoxon Rank Sum - nao confundir com Signed Rank Sum citaclo
anteriorrnente - constitui a alternativa rnais cornurnente usada pClrCl0
teste t para arnost ras independentes. Nele, todos os calculos tambern
sao feitos com postos - ranks e nao com os valores reais.
Para entende-lo, considere 0 seguinte experimento: aferiu-se as
press6es arter ials de dois grupos de estudantes A e B, respectivamente, e
obteve-se os resultados expressos na tabela 18. Nao foi feito nenhum
emparelharnento, os resul tados dos dois grupos podern ser orderiados
de qualquer rnaneira e 0 que se deseja saber e se ha diferenca
estatisticamente signif icante entre as medianas dos grupos A e B.
A primeira etapa do teste U consiste em classificar os dados
atr ibuindo postos aos mesmos, 0 valor 1 para 0 rnais baixo, 2 pal'a 0
108
<1('1111'1111'1111' tlo gnlJlo " <Jilt ' JlI 'rll '11I,' ,lI11.
<)1l.IIHlo h.I ('lllJl"ll'S (valores igU,lis) , atribui-se ,lOS valores empa-
t.ulos 11111p os to ig ll ,, 1 ,'I m('did < l os po st os que se r iam ocupados se na o
iI()lIVI'SSl' cmpatc,
T ab e la 1 8 . R e su lta do d as p re ss 6e s p ar a o s g ru po s A e B e r e sp ec tiv os p os to s
Pressoe s do grupo A 110 90 10 0 85 95
P os to s d eA 5,5 2 4 1 3Pressoe s do gru po B 110 150 125 120 115
Postos de B 5,5 10 9 8 7
Na etapa seguinte SOmClI11-Ses postos dos dois grupos e assirn
t .-m-se:
Grupo A: (5,5 + 2 + 4 + 1 + 3) = 15,5
Grupo B: (5,5 + 10 + 9 + 8 + 7) = 39,5
Para testar a diferenca entre ClSsomas dos postos, calcula-se a
«srat fstica U para ambos os grupos uti lizando as seguintes formulas:
n1(n
1+ 1)
U1 = n1n2 + 2 - R l e
onde n = tamanho da arnostra menor; n, = tarnanho da arnostra maier,1 _
( ' R 1e
R 2 =soma dos postosem cada grupo.
Charna-se de U observado (Uo) 0 rnenor dos valores obtidos
para U1e U
2, 0 qual deve ser cornparado com 0 U crftico (U) obtido
em tabela especifica (tabela 19), considerando os valores de nil de alta
(' se 0 teste e uni ou bicaudal.
109
,
I'I:
II !
I I I ! ~-.,', .f P4i t. *w" ","
T ab e l a 1 9 . E x l r a l o d e l a be la d e U p ar a a p ro v a d e M a n n ·W h ll n tl y
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 55/79
P ro ba b iJ id ad es a s so c ia d as a o U d e M a nn -W h i t n ey p ar a n2I: 5
R e fe r e- se a u m a h ip 6 te se a lt er n at iv a u n ic au da l. D ob r ar a s p ro b ab il id ad e s S9 a _~ I~ ? t ese f o r b . i: ~ ~ ~a~ .
n1 =:> 2 3 4 5
U J J
°0 ,16 7 0 ,047 0,018 0,008 0 , 0 0 4
1 0,333 0,095 0,036 0,016 0 , 0 0 8
2 0 ,5 00 0 ,190 0 ,071 0 ,0 32 0 ,016
3 0 ,6 67 0,286 0,125 0 ,0 56 0 ,028
4 0 ,429 0 ,196 0 ,0 95 0 ,048
5 0 ,571 0 ,286 0,143 0,Q75
6 0,393 0 ,206 0 ,111
7 0,500 0 ,278 0 ,15 5
8 0 ,274 0,607 0 ,3 65 0 ,210
R e gr a d e decisao p ar a n2-, 8 : r e je i t ar H o q ua nd o a p ro b a bi J id a d e p a r a U
o< a l f a
Existem varias tabelas de U , cujo aspecto varia bastante em funcao
de n2ser menor que 8, estar entre 9 e 20 ou ser maior que 20, variando
tambem a regra de decisao.
Fazendo-se os calculos para0
exemplo em curso tern-se:
5(5+1)- 15,5 = 24,5, = (5x5) +
2
e
5(5+1)- 39,5 = 0,5
2= (5x5) +
2
Considerando-se que a hip6tese alternat iva seja monocaudal,
isto e. H, = a mediana das press6es do grupo B e maier que a mediana
das press6es do grupo A, e consultando-se a tabela 18, observa-se que
a probabi lidade para Uo = 0,5 situa-se entre 0,004 e 0,008 e, portanto,
rnenor que 0,05. Concluindo-se, entao. que sedeve rejeitar Ho e que a
mediana das press6es do grupo B e estatisticamente maior que a
mediana das press6es do grupo A.
110
T E S T E S E S T A T f s T IC O S P A R A D A O O S C O N T IN U O S
No campo da Medicina, lidar com daclos continuos constitui
siIUi1(,;aOomumente encontrada. Os testes de significancia aqui aplicados
t.unbem tern indicacoes espedficas apresentadas na Figura33. Ver pagina
s('guinte_
Se os dados tern uma distribuicao normal, 0 passo a seguir e
verificar se existe ou nao emparelhamento, para determinar 0 tipo do
teste t a ser aplicado. 0 teste para dados nao-ernparelhados Lisa a
dilerenca das medias das arnostras. enquanto que 0 teste t para daclos
ornparelhados usa a media das diferencas encontraclas em cada par eo
( 'ITO padrao das diferencas, conforme a seguinte formula:
~,
~
oncle d e a media das diferencas encontraclas em cada par e EPd,e 0
crro padrao das diferencas, calculado por meio da formula:
\~
\j~E P =
d
{11
onde d representa a diferenca individual de cada par.
Quando a distribuicao dos dados nao e normal (eles nao obede-
cern a urna curva de Gauss) as vezes e possivel fazer uma transformacao
aproxirnada dos mesmos para encaixa-los nurna distribuicao Caussiana.
Se isso nao for posslvel , necessi ta-se de testes nao-pararnet ricos para
analisa-los. A Figura 33 traz sugest6es para a escolha, considerando a
111
existencia de ernparelharnento ou nao.Nern scmpre urn d(' [( 'rmil ld<i( )ld<i( ) ( ' ( ', rwsli l s ituacao que entrarn as transformacoes dos resul tados
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 56/79
conjunto de dados satisfaz asexigencias - distr ibuicao normal, por (,X(,I11-
plo, para que urn determinado procedimento estatistico possa ser .ipli-
112
~(/) >-0 w0 z« I -
O I I1« -I- SW
0:: Z :cE. z
0 ~ «0 w ~
~ o f E ~(/)I«'Ww z ~I - « .----::
0-1 « (/)
1« « 0..0 : 0 . : : :
O~ 0 ZZ-0::650
« 0«I x 0::
C i : z . . . . J 00W r--1-0 0:: 0::
O w(/)'« « cE.
: : : : : ! zOZ ~ sQ
0:: ~ (/)
0 WLL -/)
.--- Z«
r--- 0::(/)
I -
0: : : : >
Ico
'i= 0Z 0..
-0 : : : : >
00::
~
(/)0 (/)
0C\J 0
0 0
« « W0 ____J O I I -
1« . . . . J- (/) -L--
ZW W0:: l-
cE.~W
01«0-1-«
-
: : : > ~
!f!o::0::0I - z(/)
0 (/)
0 00
0
« -«I w I. . . . J
I--I - . . . . J
W (/)W0:: w O : :
s : 1-cE.
~ ~W W
pdrd um.: csca!a diferente de medida, tentando, ao transforrna-los, cum-
prir os pre-requisrtos para aplicacao do procedirnento ern questao. A
('scolh<l rnais COIllUIll e a transforrnacao logaritmica, mas outras corno
roclproco, raiz quadrada etc., tambern podern ser tentaelas.
Quando urna t ransformacao logaritmica e aplicada. cada
resultado e substituldo pelo seu logarit rno; natural rnente e la 56 pode
ser aplicada para converter nurneros posit ivos, visto que logaritmo de
nurneros negativos nao existe. Ela tern 0 efeito ele "esticar" a parte
infer ior da escala or igina l e de cornprimir a parte super ior . Numa escala
logaritrnica a distancia entre '1e 10 e a rnesma que entre 10 e 100 e
entre 100 e 1.000, ela e sernpre de 10 vezes. A transforrnacao logaritrnica
tende a norrna lizar d is tr ibu icoes desviadas a di re ita. nao 56 rernovendo
o desvio como reduzindo a diferenca entre desvios-padrao. Logaritmos
ern qualquer base poclern ser usados. mas a base 10 e 0 logaritmo
natural sao os mais usados.
113
' 2 § ! j i ! 4 i ;;; j
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 57/79
Noc;6ES DE ANALISE DE VARIANCIA
Ate agora foram discutidas maneiras de cornparar dois grupos
de pacientes ou duas amos t ra s , Ha ocasioes, entretanto, em que e
necessario com parar tres ou rnais arnostras ou variaveis. Emrnuitos desses
casos, sera necessario usar urna analise de variancia cornurnente referida
como ANOVA. A Figura 34 prove urn roteiro para escolha do teste mais
indicado para cada situacao:
o teste de Kruskal-Wallis e uma alternativa p;1raa analise de
variancia one-way, conforme explicada a seguir. Ele e cornputado
exatarnente como 0Teste de Mann-Whitey, com a excecao de envolver
rnais grupos.
F i g u r a 3 4 . Rot e ir o par a e s co lha d e t e st e par a dados
con t in uo s em ma is d e doi s g rupos
D A D O S C O N T IN U O S
> 2 G R U P O S
j
E M P A R E L H A D O SN A O
E M P A R E L H A D O S
I
F R I E D M A N K R U S K A L · W A L L I S
2 ·W A Y A N O V A 1 ·W A Y A N O V A
114
ANOVA EA ESTATfsTICAF
Quando dados de varies grupos estao senclo cornbinados. a
variancia tern dois componentes. Se os grupos tern medias diferentes,
alguma variacao provem das diferencas entre asmedias dos grupos, eo
restante da variacao provern das diferencas no interior de cada grupo.
Para entender bern 0 que significa ANOVA e a estatistica F,
considere urn exernplo em que sedeseje testar quatro drogas diferentes
ao rnesrno tempo. Suponha, por exemplo, que se trate de quatro
diureticos, A, B, C e D, e que se deseje avaliar 0 efeito de cada urn por
rneio da rnedida do debito urinario, cada urn deles aplicado a urn grupo
di ferente de 16 voluntaries.
o problema esta em reconhecer se algum, ou alguns, desses
grupos sao slgnificativamente diferentes uns dos outros: se algum dos
diureticos testados tern urn efeito diuretico mais potente que os dernais.
Poderiarn ser cornpa rados osgrupos, dois a dois, por rneio de seistestes
t separados, 0 que poderia revelar urna diferenca significante entre
quaisquer duas drogas. Porern, proceder desse modo seria perda de
tempo e, alem disso, como seestariarn fazendo multiplas analises. poder-
se-ia estar incorrendo num erro tipo I, pois ao aceitar 5% de erro em
cada urna das 6 analises separadas. haveria uma chance de 30% (6 X
5%) de encontrar, pOI' rnero acaso, urna diferenca estatisticamente
significante (ver Procedimento de Bonferroni no glossario).
o uso da analise de variancia (ANOVA - Analysis of Variance)
indicara a probabilidade de que a hip6tese nula seja verdadeira, ou
seja, a probabil idade de que nenhuma diferenca existe entre quaisquer
dos grupos. Se a hip6tese H o for rejei tada, sera 0 indicio de que hA
diferenca de potencia em algum dos diureticos testados. Para localizar
o diuretico envolvido, sera necessario um teste ANOVA de comparacao
de pares.
,I
II
III
II·II15
()s ll'sll's AN()vA Sf' apoiam 11<1ipotcse dl' <illl' ()~ grupos S,'W
- -qlll~llt() m.iior for" l 's ldl fslicl F (r,l/,\o F), m.iior scr.i d v.lri,l(.'-;iu
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 58/79
sumelhantes, a variancia em cada urn (dentro) dos grupos e similar aquela
entre os grupos; 0que eles fazern e comparar a variabilidade das medias
de todas as arnostras com a variabilidade dentro cbs arnostras: os
conceitos de uni e bicaudal, obviarnente nao se aplicarn. pois 0 valor
de p, nesse caso, teria rnuitas caudas,
F ig u ra 2 5 . V ar ia b ili da de i nt er e i nt ra gr u po s
Va r iab il idade e n t re
Va ri ab i li dade i n tr a
Para curnprir essa analise, 0 teste precisa deterrninar a varia-
bilidade dentro de cada amostra. bern como a variabilidade que existe
entre medias das arnost ras. Quando isso e feito, e geracla urna estatfsti -«1 charnada F cuja formula e a seguinte:
Varianciada populacao estimada a partir das medias das amostrasF=~~~~--~--------~-------------------
Varianciada populacao estimada como a media das variandas das amostras
116
l'lllrp ()!-. gnqlOs em relacao a varia<:;ao dentro dos grupos e, conse-
quentemente. maior a probabilidade de rejeitar a hip6tese nula e acei tar
.1 hip6tese experimental.
A distr ibuicao de Ftern a forma de urna curva desviada a direita:
F ig u ra 2 6 . V a lo r c rit ic o e m d is tr ib u ig a o d e F
A r ea d e r ej eig a o
--.1ibre a d e
a c e i a c a o
9 9 %
I
4 53
5 , 3 1
( v a l o r c r i ti c o )
Usando-se 0 valor obtido para a estatistica Fl'O nurnero de
graus de l iberdade apropriado, obtem-se 0 correspondente valor de p
pOI' meio das tabelas de F , asquais sao oonstruidas urna para cada valor
de p e fornecem urn valor de Fem funcao dos graLis de liberdade Vel'
tabe!a 20.
o calculo dos graus de liberdade. neste caso, e urn pouco rnais
cornplicado pois ele precisa cornbinar 0 numero de graus de liberdade.
entre os grupos (numerador) com aquele intragrupos (denorninador).
(n" de grupos - 1)
[(n° de grupos) (n - 1)]
Para tornar rnais claro, consiclere 0 exemplo dos diureticos: 0
numero de graus de l iberdade entre osgrupos e igual ao n'' de grupos -1,
117
(;Iil) 4 -1 = J l' U I)"til' ur.urs d l~ libcrdad« illlrd-llllll)()S l'l d som.: d ( J "o !)
.
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 59/79
gralls de liberdade de cada grl lpo, Clib = (16- 'I) + (I b - 'I) + II () II
+("16-1)=60,
Suponha que se deseje verificar, par,! LJIll nivel de SigllificAIlCld
de 0,05 (p~O,05), se hi1 uma diferenca entre qu.iisquer dos .: 1 grllpu"
estudados.
Pro cura -se num a ta bela de distribuicao e l l ' F .~ t abe!a 20- 0
valor correspondente de F pctra quatro e 60 gl-(-lUSde liberdade e com-
I)()I-a-se 0 valor observado com 0 extra ido da tabela: Sl' () valor observi-
do for maim que 0 da ta be !a . diz-se. entao. que h,1 uma dilerenca
estatisticamente signif icante entre dois ou rnais gruj)os,
T ab e la 2 0 . E x tr at o d e t ab e la d e d is tr ib u ic ao d e F
D istr ib uica o de F p ar a p = 0 ,05
G lib e ntr e g ru po s =:>
G lib in tr a g ru p os J J40
60
4 5 6
2,61
2,53
2,45
2,37
2,34
2,25
Essaanalise de variancia - ANOVA - inforrna sornente se h e l OLi
nao urna diferenca estatisticarnente sigruflcante entre clois Ull m.us gll l-
pos, mas nao inforrna quais os grupos envolvirlos. [J,H,! ic lentif icar os
grupos, cleve-se real izar urna comparacao entre p ,Hes - p e li r w i st '
co mpar iso n te st - que iri1compar(lr cada grupo COI11 C\cld 11111 clos 011 -
tros. Ha pelo menos cinco testes diferentes G1pc17l'S dC' rc.iliz.ir CSSd
analise e que diferern entre si pela capacidade de reduzir tanto 0 (>1-1-0
tipo 1 quanta 0 erro t ipo II . Os estatisticos d ive rge rn quanto J escolha
do teste mais apropr iado em cada situacao: teste de Fisher - p ai r w is e,
de Duncan, de Newrnan-Keuls. de Tukeys e de Scheffel, dontre outros.
118
EN TENDENDO OS VAR IOS T IPOS
DE TE STES ANOVA
Frequenternente, os testes para analise de variancia sao referi -
dos como one-way ou two-way e com ou sern repeticao - r epea ted
measures .
o teste one-way ANOVA testa a hip6tese nula de que todas as
populacoes tern medias identicas contra a hip6tese alternativa de que
urna ou mais da s medias d a s p o p ul ac o es difere (las dem ais. H a gera
urn valor de P que responde a seguinte questao: se Ho e verdadeiro,
qual a probabilidade de que as medias das arnostras selecionadas pos-sam variar tanto ou mais quanto a variacao encontrada?
o terrno one-way significa que os dados a serern cornpa rados
forarn agrupados com base em urn unico criterio - 0 tipo de diuretico e
o termo two-way indica que os grup?s a serern cornparados forarn
obtidos mediante a aplicacao de 2 criterios, pOI' exernplo , tipo de
diuretico e sexo. 0 exernplo do estudo dosdiureticos constitui, portanto.
lim born exemplo para aplicacao de urn teste one-way ANOVA sern
repeticao.
A diferenca entre ANOVA e ANOVA com repeticao e a rnesma
que existe entre teste t e teste t com ernparelhamento. Deve-se usar
ANOVA corn repeticao em tres circunstancias:
• as rnedidas sao feitas repetidamente 110 mesmo elernento,
por exernplo: antes, durante e apos tratarnento:
• as rnedicoes sao feitas em grupos ernparelhados:
119
• as rnedidas sao feitas ern urn experimento de labor.uurio
~' .. .'.
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 60/79
repetido em diferentes ocasi6es.
Se nao houver certeza quanto a distr ibuicao normal das popu-
lacoes, pode-se calcular 0 valor de p usando urn teste nao-parametrico.
o teste nao-pararnetrico analogo da ANOVA one-way eo denorninado
teste de I<ruskal-Wal lis e 0 teste nao-parametrico analogo cia ANOVA
one-way corn repeticao e 0 denorninado teste de Friedman. Essestes-
tes primeiro atribuern postos aos dados e, ern seguida, analisarn a dis-
tr ibuicao dos postos entre os grupos.
120
CORRELA(Ao E A REGRESSAO LINEAR
causa ou consequencia da outra.
A correlacao e usada quando se deseja es-
o terrno correlacao significa relacao nos
dois sentidos: descreve a associacao entre duas
variaveis, nao fazendo julgarnento sobre se urna e
o fato de existi r
uma corr-elccdo
noo significa que
uma varicivel seja
causa ou~ tud ar q uao consistenternente d uas va navels m u-
consequencio dadarn ern conjunto. Quando isso ocorre, os
estatfsticos dizern que ha uma correlacao OLi uma
covariacao, cuja di recao e magni tude podern ser quanti ficadas.
Dezenas de fates estao associados e nao tern uma rela<;,:aodecausa e efeito como, por exernplo, ascorrelacoes existentes entre mor-
talidade infantil e PIB, entre escolaridade e renda per capta, entre po-
luicao arnbiental e nurnero de malforrnados, entre sanearnento basico
e rnortalidade infanti l etc.
outra.
Considere urn exernplo ern que se deseje estuclar as variaveis
peso e altura ern uma populacao de 12 hornens adultos e que essas
variaveis sejarn denorninadas respectivarnente de x e y . Para cada ele-
mente da amostra foi obtido urn par ordenado (x.y) cujos valores foram
inseridos na tabela 21.
121
& , JI I !H I . . ! I I.
Tab e la 2 1 . P es os e a ltu ra s d a pop ula ca o (N = 1 2 )
ssU!
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 61/79
Elemento Altura Peso
1 8 2 9 5
2 1 7 4 7 2
3 1 7 0 6 4
4 1 8 0 9 5
5 1 8 3 7 9
6 1 6 0 7 2
7 1 5 6 6 4
8 1 5 7 6 2
9 1 6 8 6 7
1 0 1 7 5 7 5
1 1 1 7 6 7 5
1 2 1 9 0 9 6
Nurn diagrama de d.spersao. as vezes e possivel visualizar urna
curva regular que se aproxima dos dados, denominada curva de
ajustamento, e quando esta lernbra urna reta e os dados parecern estar
bern pr6xirnos dela, diz-se que ha urna correlacao linear entre asvariaveis.
o diagrarna de dispersao para 0 exernplo de pesos e alturas de
lima populacao, representado na f igura 37, parece indicar a existencia
de urna correlacao l inear entre asduas variaveis: ha uma tendencia em
se obter rnaiores valores de y a medida que x aumenta. Quando isso
ocorre, diz-se que a correlacao e positiva mas, ha casos em que ocorre
o inverso - correlacao negat iva.
Considerando-se 0 diagrarna da figura 37, a correlacao linear
poderia ser representada por uma reta interpolada aos pontos (reta in-
terpolatriz) .
Para dados continuos em que ha uma corre lacao linear , pode-
se determinar 0 coef iciente de correlacao "r", cujo valor varia de -1 a
+ 1.0 sinal indica sornente seasduas variaveis variarn no rnesmo sentido
(sinal +) ou em sentidos opostos (sinal -) e se r = 0, as duas variaveis
nao variarn em conjunto.
122
0'ctl0" •
0
~ Ol
:::J
0..00..
ctl-0
in0
I•n
(j) •..
(j) 0, • coen I~I::J
C ii(1) ctl •j) :s • ~
(j) C ii •:::J
-0 (1) §0 UJ
(J)
'ctl xUJ
enill 0 •0
0..en r-,
en (j)
'60.. •
(j)
-0
ctl
E~0
ctl
i5 0
, . . . : • <0
C")
<tl. . . . •::J •u :
oo oN
o- - - r LD
oN
oco
o<0
OS8d
ooN
123
() coof icicnte de correlacao rnede 0 "ajusto" dol 1(,[.1 (lOS pontes No ('x ('lllplo dos pesos (' ('sIClturd\ () t.un.inho ti d p op ul.« .. io (,
12 (igual ao numero de pares) e, calculando-se r, obtern-sc 0 sl'guint('
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 62/79
q ue a d et er mi na ram , isto e , quao pr6xirnos da reta tra ca da se encontrarn
os mesmos e nao tern relacao com a inclinacao da rnesma. Urn I' = - 1
signi fica que toclos os pontes estao sobre a reta tracada (obtida) e que a
correlacao e perfeita e negativa.
Observa r nos d iag ramas cia figura 38 diferentes situacoes e os
respect ivos valores de r:
F ig u ra 3 8 . D i ag ra m a s d e d is pe r si io , r e ta s i nt er po la tr iz e s e r e sp e ct iv os r
.•
/... · .· . . .
r = 0,94 · . r = 0,24
L__ ~ _
. .
r = 0
Para se calcular 0 r deve-se aplicar a formula proposta por
Pearson, que, obviamente, leva ern conta nao 56 os valores de x e y
como tambern 0 tarnanho da amostra.
n :E xy - (:E x) ( :E y)
r = - ~ = = = = = = = = = = = = = = = = ~y
V [n:E x2 - (:E x)2][n:E y2 - (:E y )2]
124
resultado: r = 0,8257.
Nao basta, entretanto, calcular 0 valor de r, po is ell' sofre urna
grande influencia do tamanho das arnostras e da variabilidade - para
n = 2, por exernplo, sempre haveria urn ajuste perfeito, urn r maximo.
E i rnportante saber se 0 valor obtido para r resultou s implesrnente da
variabilidade das arnostras e realrnente nao ha correlacao entre as
variaveis (I' = 0), ou set de fato. ha uma correlacao (r7"'O)entre asrnesmas.
Para esse processo, aplica-se ur n teste estatistico para verificar a
hip6tese H, (r7"=O)considerando a hip6tese nula H o (r = 0) - nao ha
correlacao linear entre x e y - e obtem-se um valor de p que inforrna a
probabilidade do resultado obtido ter s ide por acaso, is to e. ser clevido
a variabi lidade da a rno stra .
Disp6e-se de tabelas de r (tabela 22) onde se pode obter 0
valor de p ern funcao dos graus de liberdade da amostra que no caso
de correlacao, deve ser considerado corno 0 numero ele pares decrescido
de 2 (Glib = n - 2).
No exemplo em curso, 0 nurnero de graus de liberdade e '\ 0
(Glib =12 - 2 = 10), e consultando-se a tabela de r (tabela 22) ver ifica-
se que 0 r obtido de 0,825 ocorre para p < 0,01, Portanto, pode-se
considerar a correlacao encontrada corno estatisticarnente significante.
Tabela 2 2. E xtr ato de tab ua de "r" aos n f v e is
d e s lq n itic an cia d e 0 ,0 5 e 0 ,0 1
Glib P = 0,05 P = 0,01
4 0 ,8114 0 ,9172
5 0 ,75 45 0 ,8745
6 0 ,70 67 0 ,8343
7 0 ,66 64 0 ,7977
8 0 ,6319 0 ,7646
9 0,6021 0,7348
10 0 ,5760 0 ,70 79
125
o coeficiente de corrclac.io (. urn numoro IIIIIIl, ll~.\( 1 0 pclfcl
- & WM A# -
A ss im , p od t' ~ (' in lo rm a r que 0 coeficiente de correlacao da populacao
l'st,l dontro de deterrninado intervalo de conf ianca (IC 95%).0 calculo
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 63/79
classif icar a correlacao em perfeita (=1), forte (>0,75), Ill("did (> 0,5),
fraca «0,5) e inexistente (=0) em funcao de seu afastarnento do zero,
nos dois sentidos (positive e negativo), lembrando que a natureza nfio
produz correlacoes perfeitas. Esta interpretacao varia bastante nos
d iferentes textos.
Se 0 r e di ferente de zero, ha 4 explicacoes posslveis:
1. A variavel x deterrnina os valores da variavel y .
2. A variavel y ajuda a deterrninar 0 valor da variavel x.
3. Uma outra variavel influencia arnbas, x e y .
4. x e y realmente nao se correlacionarn. 0 que se observou
ocorreu por acaso e, nessecaso, 0 p ajuda a resolver a questao,
Pode-se calcular 0 coef iciente de correlacao para qualquer con-
junto de dados, e ele consti tu i urn born descri tor. Entretanto, inferencias
56 podern ser feitas a partir de r e de p, se algumas condicoes forern
observadas:
1. A arnostra e representativa: 0 suficientemente grande e
escolhida ao acaso.
2. Cada unidade experimental e independente das dernais e
fornece ambos os valores, x e y .
3. x e y sao medidos independentemente.
4. x e y provern de populacoes que tern, pelo menus
aproximadamente, uma distribuicao Caussiana.
5. A correlacao deve ser linear para todos os valores: y deve
aumentar ou diminuir para todos os valores de x, sern
intervalos em que 0 cornportarnento seja diferente.
Algumas vezes nao se utiliza 0 r, mas sim 0 r2 - r squ ared -,
chamado de coeficiente de deterrninacao, cujo valor, obviamente,
sera sempre rnenor ou igual a 1. Eledeve ser interpretado como a frac;:ao
da variancia que e cornparti lhada entre as duas variaveis.
Os coeficientes de correlacao. tal qual rnuitas outras estatisticas,
sao mais informativos quando expressos como intervalos de conf ianca.
126
clo intervale de confianca para coeficientes de correlacao e bastante
trabalhoso. Use, de preferencia. um software estatistico para realiza-!o.
o r de Pearson s6 e usado para d ados continuos. Se d ados
ordinals estiverem envolvidos, deve-se uti lizar tecnicas estatisticas para
correlacoes nao-parametricas, calculando, por exemp!o, 0 coeficiente
de correlacao de postos de Spearman (rs) - correlacao ordinal - cujos
valores, similares aos do r, devern ser interpretados da rnesma forma
(ver exercfcio 15) e cuja formula e a seguinte:
r =1 -s
onde n e 0 nurnero de pares e D e a diferenca de postos entre as
var iaveis de urn rnesmo par.
Para investigar urna correlacao entre Apgar e peso de nascimento,
pode-se calcular 0 coeficiente de correlacao de Spearman e obter urn
valor de rs'por exernplo, rs= 0,7; nesta condicao considera-se que ha uma
correlacao positiva e verifica-se 0 nivel de significancia nurna tabela de rs'
A correlacao indica 0 grau de associacao entre duas variaveis,
ao passo que a regressao diz respeito a capacidade de prever urn
valor baseado no conhecimento do outro, de prever y dado que x
seja conhecido.
E importante, para fazer uma anal ise de regressao, deterrninar
qual a variavel dependente, aquela que flutua em funcao da variavel
independente.
Na representacao grafica e irnportante sempre colocar no eixo
das abscissas (horizontal) a variavel independente (x) e no eixo das 01'-
denadas (vertical) a variavel dependente (y).
o valor de y pode ser determinado pelo grafico ou rnaternatica-
mente, por rneio da funcao (expressao da reta) y =a+ f3 x, onde f3 e ainclinacao da reta e a e a intersecao da rnesma com 0 eixo y , conforme
figura 39.
127
Figura 3 9. A ju ste d a r ota d e r eq re ss ao ( 1 ( ' ():I 'Y.,). A f l H l l i t I · t o dprt'St'l1td d rdd interpol.uriz (' 0 intcrvalo de confi-
dl1(:d Ird~',HI()sPdl'd () cxernplo dos pesos e estaturas citado anteriorrnen-
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 64/79
Variavel
Dependente
............... ,", " , ,., }• (y • Y j) • residuo
. , .
•
• •
//\~c : : : · · · · : : · J , . , , " ". . . , . ,
a.
Var iave l l ndependen tex
Com essas informacoes e possfvel fazer predicoes quanto aos
valores de y correspondentes aos valores de x, e esse e 0 papel cia
maternatica da regressao, Assim, para fazer urna analise cle regressao, 0
primeiro passo e deterrninar a mel hor reta cle ajuste.
Para assegurar qual reta e a mel hor possfvel, aplica-se 0 rnetodo
dos minirnos quadrados - method of least squares. Nenhurna reta P(1S-
sa pOl' toclos os pontes, sernpre havera urna distancia vertical entre a
linha e a rnaioria clos pontos do diagrarna cle dispersao - resfduo . 0
metodo determina essa distancia para cada ponte e eleva 0 resultaclo
ao quadrado. A linha considerada como a que mel hor se ajusta e a que
resulta na rnenor soma dos quadrados dos afastamentos. Obtida a cur-
va, encontra-se a equacao matematica correspondente e a capacidade
de predizer urn valor de y para cada valor de x.Qual a seguran<;;ade que as predicoes sao acuradas? Do mesmo
modo que ocorre para outras estatfsticas, para carla valor de x havera
uma distr ibuicao de valores de y que compreendera 0 valor verdadeiro
128
It'; .IS l inhas rcpresentativas do intervale de confianca curvarn-se p(1ra
fora porque a distribuicao dos dados tende a ser m aier na s ex trernid ades .
~ -~~~~. . . , , - _ . . . . . .
~~~~~~
- ~ - - - ~ - - - - - ~ -~ - - - - . ~ - - - - - - - - - - ~ - - - - - - - - - - -
_ _ ~ - - - - - - - - - - - - - - - _ - a r ---- ~-,-----
- -~~- .------ -- --
100
95
90
85
80
75
70
65
60
55
175 185 19060 170 18065
129
11)($$;;
ENTENDI NI)() «()RRLLA~:()fS 1NVUIVLN[)() IJAUU'S N( )MINAIS
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 65/79
R E G R E S s A o o u CORRELA~Ao?
Confonne foi visto anter iorrnente, a regressao l inear e a correla-
c,;aoestao relacionadas, mas sao diferentes: a regressao linear encontra
a reta que rnelhor preve y em func,;aode x, ao paSSOque a correlacao
quantifica quao bem x e y variarn em conjunto. Se houver duvida na
escolha, considere os seguintes pontos:
Sex e controlado (tempo, por exernplo), nao usecorrelacao
e sim regressao linear.
Use somente regressao linear sefor possivel detenninar com
clareza qual variavel ex equal e y , pois elas nao sao sime-
tricas e se houver inversao de eixos, obtern-se resultados
diferentes.
Sao raros os casos em que faz sentido calcular ambas.
Q UAN DO F OR< ;AR A L lN HA DE REG RES SAO
A C RUZ AR DITER MIN AD O PO NTO ?
Quando se faz urna regressao, e possivel determinar que a linha
passe sobre urn determinado ponto, usualmente a origem (X = 0, Y = 0).
Porern. esta restricao s6deve ser usada quando a literatura informal' sobre
essa conveniencia. Mas, de urn modo geral, deve-se optar pela reta que
melhor se ajuste - w i th o u t c o ns tr a in ts .
130
Quando ha interesse ern obter correlacoes entre d.ulos nomin.i is,
pode-se usar dois processos: 0 de deterrninacao do risco relative e a
ra za o da s chances - o dd s r at io .
o calculo do risco relative pede ser facilmente compreendido
por meio de urn exemplo. Considere urn estuclo ern que se deseje
verificar a eficacia do AZ T no tra tamento de pacientes por tadores do
virus HIV, pOI' meio de urn experimento (duple cego) em que se adrni-
uistre aleatoriamente placebo ou a droga aos mesmos. e que se acorn-panhe esses pacientes pOI' urn periodo de quatro anos para detectar a
p ro gr es sa o c ia d o en ca . Ver tabela 23.
Tabe la 23 . E xemp lo de t ab e l a de con ti n ge n c ia pa ra ca lcu lo de r isco r e la ti vo
F ato r d e r is co Condicao ( no e x .: proqressao da ooe n ca )
( e xpos icao ou t ra tamen t o) Prese n te Ausen te
A
C
P re se n te (A ZT )
A u se n te ( Pl ac e bo )
B
o
I Risco relativo = [A / (A + B)] / [C / (C + D)] I
o risco relative e urn nurnero puro cu]a amplitude varia entre 0
e 00. Quando igual a 1, indica, obviamente, que nao ha diferenca de
risco entre os grupos cornparados. Quando inferior a 1, ou seja, 0
denominador e maier que 0 nurnerador, ele indica que 0 fator de risco
presente, na realidade, protege 0elemento a ele exposto; nessa condicao
(protecao), asvezes e chamado de probabilidade relat iva. Elee uti lizado
em estudos epiderniol6gicos prospectivos do tipo coorte - cohor t , e
em estudos experimentais como 0 do exemplo.
Urna outra forma de estimar a diferenca entre duas proporcoes
e por rneio do chamado risco atribufvel que e igual a diferenca entre as
duas proporcoes:
I
I I
I Risco atribufvel = [A / (A + B)] - [C / (C + D)]
131
..,
Algumas vezcs, entret.uuo, COl))O 1111111ostudo lI·tl()·.p,·(tivo do
tipo caso-controle, 0 calcu!o do r isco relative n.io sc "plied, pois St· ust.i
","L4"
S t' . d W I II l do!> vctl()J'('s;\, 1 3 , ( : Oll I) fo r iglldl .I(), .I ('qllcl(,;i() n.io
puci(' ~"I (.dudclciCl 0, nesse caso, alguns estatisricos adicionam 0,5 a
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 66/79
lidando com 2 grupos: urn ja portador da condicao - doenca e outro
nao portador da condicao - grupo controle. Nesses estudos nao se est.i
avaliando 0 risco de urn grupo exposto a urn tater de risco vir it
desenvolver urna condicao ou doenca e sirn 0 contrario, isto e. dado
que a condicao ja esta presente, investiga-se se houve exposicao ao
fator de risco retrospectivamente. Nesses cases calcula-se a chamada
razao das chances - odds ratio.
Existe urna diferenca entre probabilidade e razao: a proba-bilidade de urn evento e fraC;ao entre 0 nurnero de ocorrencias e 0
nurnero de experimentos realizados, ao passo que razao e definida
como a probabilidade de que urn evento ocorra. dividida pe!a
possibilidade de que ele nao ocorra.
T ab e la 2 4 . M o de lo d e ta be la d e c on tin q en cia (2 x 2)
F at or d e r is co Presente Ausente
Presente
Ausente
A
C
B
D
Probabilidade de ocorrer
Probabilidade de nao ocorrer
Probabilidade de ocorrer
1- Probabilidade de ocorrerRazao =
A / (A + B )Razao (chance) da cond ic;ao nos expostos = = A / B
B / (A + B )
C / (C + 0)Razao (chance) da condicao nos nao-expostos = = C / D
0/ (C+ 0)
NBRazao das razoes (chances) ( o dd s r at io ) = --
C/O
132
todos os 4 valores.
Nao ha vantagern de secalcular a razao das chances em estuclos
prospectivos e experirnentais. 0 seu calculo e part icularrnente uti l na
anal ise de estudos retrospectivos, t ipo caso-controle, conforme citado
anteriorrne nte.
Tal qual se faz para outras estatisticas, costurna-se calcular urn
intervale de confianca de 95% ou 99%, tanto parCl0 risco relat ive como
para a razao das chances.Exem pi i ficando: suponha que urn pesqu isador d ispon ha de mil
pacientes, 160 dos quais com doenca respiratoria e 840 sern apresenta-
la. e que 0 fator de risco em estudo seja 0 habito dos pais em relacao
ao furno. Paracalcular a razao das chances deve-se montar a tabela 25.
Tabela 25 . T ab e la d e c on fin q e nc ia p ar a c alc ulo d e ODD S RATI O
F at or d e r is co Doenca respi r at 6 r ia
( pa is f uman tes ) Pre se nte Ausen te Totais
Presente 12 0 (A ) 30 (8 )15 0
Ausente 40 (C ) 810 (0 ) 8 5 0
Totais160 840 1 .000
=120/30
40/810 = 81,00NBC/ D
azao das chances (odds ratio) =
e calculando-se 0 intervale de confianca (95%) mediante urn software
estatistico, obtem-se 48,59 e 135,00.
133
,,
Valor predict ivo negativo = 100 x [D /(C + D) I
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 67/79
EN TEN DEN DO V AL OR PREDIC TIV O,
S E N S IB IL ID AD E E E SPE C IF IC ID AD E
Essesterrnos sao frequenternente usados e se relacionam a da-
clos norninais, nurn contexto envolvenclo urn fator de risco ou teste
laboratorial e sua relacao com urna doenca ou condicao.
o valor predictivo corneca COIll urn fator de risco ou teste
laboratorial e responde a seguinte questao: dado urn fator de risco ou
urn exarne laborator ial positivo, quais sao aschances de 0 paciente ter
a doenca? Para facilitar 0entendirnento do calculo do valor predictivo,
v ej a t ab e la 26.
T ab e la 2 6 . T ab e la d e c on t in p en c la p ar a c alc u lo d e v al or p re d ic tiv o
F at or d e r is co Doenca r e sp ir a to r i a
(pais f umantes ) Presen te Ausen te Totais
Presente 1 2 0 (A ) 30(8) 15 0
Ausente 40 (C) 8 10 (0 ) 85 0
Totais 16 0 84 0 1.000
Pode-se calcular um valor predictivo posit ivo (expresso em por-
centagern) por meio da relacao:
Valor predict ivo posit ivo = 100 x [A I(A + B)]
Quando 0 fator de risco ou teste e negativo, pode-se calcular
urn valor predictivo negative por rneio da relacao:
134
Calcular a sensibilidade implica em ter como base alguem com
uma doenca ou condlcao e deterrninar a chance dessa pessoater presente
urn tater de risco ou urn exarne ou teste laboratorial. Ver tabela 27.
I Sensibilidade = 100 x [N(A + C)] I
T ab e la 2 7 . T ab e la d e c on t in g e nc ia p ar a c al cu lo d e s e ns ib il id ad e e e s pe c if ic id ad e .
l n te c cao f u n q ic a s is te r n lc a
Hem ocu ltu ra Pre sen te Ausen te Totais
Positiva 8 4 (A ) 1 (8 ) 85
Negativa 26 (C) 18 0 (0 ) 20 6
Totais 110 18 1 29 1
No exernplo, a sensibilidade = 100 x [84/(84 + 26)J = 76 %, 0
que significa que, ernbora as hernoculturas tenharn urn elevado valor
predictivo, elas nao sao sensfveis , visto que 26 em 11 0 pacientes cominfeccao fungica sistem ica tem hernocu ltura negativa para fungos.
Especificidade e definida como a proporcao de pessoas sern a
doenca que nao tern urn teste positivo ou 0 fator de risco presente.
I Especificidade = 100 x [D I (D+ B)] I
No exernplo. a especificidade = 100 x [180/(180 -1)J = 99,45%
e elevada: 0 que s ignifica que, se 0 paciente nao possui ulna infeccao
fungica sisternica, ha uma chance elevada de que ele tenha urna
hernocultura negativa para fungos.Habi tualmente calcula-se urn intervale de conf ianca tanto para
valor predictivo corno para sensibilidade e especificidade e este sera
tanto menor quanta maier for a arnostra.
135
I'.Ird 0 exernplo citado ,I l'Cjutl<.:(iocI(1 rt'grl'ss(-I()lilH '.II" 11I1'tllipld .,(It I:
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 68/79
NO< ;':OES DE REGRESSAO
L INEAR MULTIPLA
Ern alguns tipos de experi rnentos ha necessidacle de se analisar
a interacao de inurneras variaveis. A regressao rnult ip la e urna maneira
de fazer isso.
A regressao multipla encontra uma equacao que permite calcu-
lar a variavel dependente (y) corn base ern duas ou rnais var iaveis inde-
pendentes (x., x2etc.). Por exernplo, seria possivel predizer qual a pressao
sangLlinea tornando como base idade, peso e sexo. Nesse tipo de estu-
do pode-se estar interessado ern qual variave] tern a maier influencia e/
ou em encontrar urna equacao que melhor determine a pressao
sanguinea valendo-se das tres variaveis. Em outros casos s6 seesta real-
mente interessado em uma das variaveis, mas a anal ise necessita fazer
ajustes para cornpensar diferencas devidas a outras variaveis: no exern-
plo em curso, a pressao entre hornens e rnulheres difere? Essaresposta
deve ser dada ap6s serern feitos ajustes para idade e peso?
A equacao generica para regressao multip!a e:
Ao inves de sornente uma interseccao - da reta com 0 eixo Y, e
urna incl inacao que ocorrern na regressao linear simples, a equacao cia
regressao linear multipla contern urna constante (Po) analoga a
interseccao, coeficientes parciais de regressao ( P " O2, 0 )1 . . . ) e urna
correcao (8) para compensar 0 erro decorrente do fato de que os pontos
nao se s ituarn todos sobre a reta de regressao.
136
Pressao arterial = 00+ 0
1* idade + 0
1* peso + ~ : * sexo /- 8
A variavel sexo seria apresentada ern c6digo, por exernplo,
masculine = 0 e ferninino = 1 e e charnada de variavel codificada -
d um m y v ar ia bl e, i nd ic at or v ar ia bl e.
Urn aspecto que ainda deve ser consiclerado e 0da multicolinea-
r idade. que diz respeito a eventual relacao das variaveis independentes
entre sie nao sornente corn a v. . , (lvel dependente. No ultimo exernplo,
o peso tende a ser rnaior com a idade e os hornens tendern a ser maispesados que as rnulheres.
Os principals usos da regressao rnult ipla sao:
• Para ajustar dados, Nesse caso, ha um interesse no efeito
de uma particular variavel X, mas deseja-se fazer ajustes
ern funcao de diferencas que ocorrern devido as dernais
variaveis independentes.
• Obter urna equacao para predizer y tendo como base inu-
rneras variaveis independentes.
• Explorar relacoes entre multiples variaveis para encontrar
quais variaveis independentes X realmente influenciarn y .
A regressao linear mul tipla e mais complicada que outros testes
estatisticos e provavelmente os "simples mortals" precisarao da ajuda
de um estatistico para realiza-la.
137
"" " M
Exerdcio 16. Pode-se modificar 0 nivcl til' Il1l'I1SlIr.t<,;,lo til' tI,l(lm~
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 69/79
TESTE SEU CONHECIMENTO
Exercicio 13. Um teste tern urna especificidade de 90% e Lima
sensibilidade de 98%. Calcule osvalores predictivos posi tivo e negativo
para 0 referido teste, quando aplicado a uma populacao em que 7%
dos individuos tern a doenca.
Exercfcio 14. Os dados expressos na tabela a seguir mostram a contagem
de leuc6citos em dois grupos de pacientes. urn tornando deterrninada
droga e outro tornando placebo. Compare os gl·upos usando 0 teste de
Mann-Whitney.
Placebo Droga
1.160 89 6
1.090 90 0
1.320 1.160
1.250 1 . 000
1.100 96 0
1.234 87 0
Exercfcio 15. A l iteratura inforrna que deterrninada doenca e de origem
genetica e tern carater autossom ico dorn iria nte. Espera-se. assiIll, que
os filhos de pais portadores dessa doenca sejam afetados numa
proporcao de 50%. Suponha que determinado estudo envolvendo 50
filhos de casais, em que urn dos pais e portador da doenca. s6 tenha
encontrado 12 afetados. Visto que se esperaria encontrar cerca de 25
afetados, a c I iscrepancia encontrada penl l i te contestar a I iteratu r(l?
138
Explique.
Exercfcio 17. Como proceder pClraestudar seha uma correlacao entre
grew de instrucao (classificado de 1 a 5) e QI? OS resultados obticlos
para fazer a pesquisa estao apresentados na tabela a seguir :
Nume r o do aval iado G ra u d e lns t rucao QI
1 2 11 0
2 3 12 0
3 12 5
4 5 13 0
5 4 14 0
6 5 10 0
7 3 12 0
8 2 10 0
9 10 0
10 2 11 0
Exercfcio 18. Considere dois tratarnentos, A e B, para uma determinada
doenca e que se deseje cornpara-los com relacao a SU(leficacia. tendo
como base osdados apresentados na tabela de cont ingencia a seguir:
Compare os tratarnentos usando urn teste simplificado de
Qui-quadrado.
Morte Sobrevida Totais
T ra ta m en to A 22
Tratam ento B 8
25
16
47
24
4 1 71otais 30
Exercfcio 19. Preencha os quadrados vazios propondo testes a serem
usados nas situacoes expostas no quadro a seguir :
. ; ; ;; ; ;o t
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 70/79
o passe seguinte consiste ern aplicar as formulas para calcular
'"<I >
os valores predict ivos e assim tern-se:00 -c
u
'" '"" , " g
.~ U) .' " t:o~
o m .c: C>-o 0 ro 0 ro
0
a. a. E"§ E-c ·u .!!! '"a. 0.-::I '"
::I a.> ::I 2.~ ~0 O J::I ro ::I ro o <I > ro
Valor pred ictivo positivo = 686/1 .616 = 42A5%, 0 queJ 00. 0= '" >; 0>.<:: o>-c
'" E '" ~U):~ 0
:0- E E 0 '" '" . ~ e n ro ~_ .< : :o 0 ' < I> < I>
'< I > ' " ro £ : ( i j " Q )significa que, quando urn habitante tem urn teste positivo::I
0_.!::o ~ a.:1- -c ~ -c -c > >~ ~ ~ ~ ro ~ ·ro :: E ~ '" o:~~ '" rl roI>
l::o. ro.<:: l:: c: l:: <I> ele tern 42,45% de chance de ter a doenca.~ E m ( j j ~.g~ ro
~ ro E ro ' " ro '" ~ >.::1 o.~ 0.0 0.0U
E E0.<1>
Eg_ EO. EO. c: <I >._ ro
Valor predict ivo negativo = 8.370/8.384 = 99,83%,0 que'" Eo ro ~ -c~<I > 00 o E 02 o 2 ::1- < I > -",
c~~ ::I
Cl Uu Uc: UI> Uo> Uo> 0.0
significa que urn habi tante corn teste negativo tern 99,83%
de chance de nao ter a doenca.
!Ii<I >
oU
'"
roc:ro·iii
'":Iro(!)
o.roC>-
s s::I
a.oa.
140
RESP OSTAS DOS EX ERCfclOS 1 3 A 1 9
13. 0 primeiro passo consiste ern imaginar urn numero de
habitantes, 10 mil pOI'exemplo, e, com base nos valores citados, construir
uma tabela de contingencia. Assirn, espera-se encontrar urn total de
700 doentes (7% de 10 mil), dos quais 686 (98%) apresentam urn teste
positivo e 14 (2%) urn teste negativo. Considerando-se 0 grupo dos
9.300 nao doentes (10.000 _ 700), espera-se encontrar 930 ('10%)
individuos com teste positivo apesar de nao apresentarern a doenca,
dado que a especificidade referida para 0 teste e 90%. A tabela de
contingencia apresentando estes dados sera:
Doenca presente Doenca ausente Totais
Tes te pos it ivo 68 6 93 0 1.616
Tes te nega ti vo 14 8 .370 8 .384
Totais 70 0 9.300 1 0 .000
141
14. Primeiramente, deve-se calcular as somas dos postos nos <lois
. J iMb 14
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 71/79
grupos, considerando 0valor real de cada resultado (enao 0 valor absolute):
Placebo Posto Droga Posto
1.090 6 89 6 21.160 8 90 0 3
1.320 12 1.164 91.250 11 1.000 51.100
7 96 0 41.234 10 87 0
Somados postos (R1) 5 4 Somados postos (R
2) 2 4
A etapa seguinte consiste em calcular os valores da estatistica U
pal-a os dois grupos por rneio das formulas:
U n,(nl + 1) n/n2 + 1)1= n1n2 + - R e U = n n + -----
1 2 1 2
2 2
e assim tern-se: Ul = (6x6)+ 6(6+ 1)-54=3 e U2=(6x6)+ 6(6+ 1)-24=32 2
Considere 0 rnenor valor obtido como 0 U observado logo U = 3, '() I
passando a seguir para a consulta da tabela de U apropriada para 0
tarnanho da arnostra rnaior (n2
), valor de alta e teste uni ou bicaudal.
Usando 0software SPSSpara fazer ascontas, obtem-se urn valor de
U = 3 e p= 0,016, menor que 0,05, portanto consicleraclo significativo.
15. A solucao deste problema pode ser feita pOI' meio de LJIll teste
de x 2,no qual os resultados esperados provern de inforrnacao da literatura.
Consultando uma tabela de X 2 e considerando Glib = 1 (numero
de categorias -1), verifica-se que a discrepancia encontrada e estatistica-mente significante para urn p< 0,001 e, assim, se justificaria 0 questio-
namento da literatura.
147
17. 0 coeficiente usado para avaliar correlacao entre dados
ordinals e 0 de Spearman e, para calcula-lo. cleve-se inicialmente atribuir
postos aos resultados e assim tern-se:
25
(12-25)2/25 == 6,76
(38-25)2/25 == 6,76
C om d oe n ca
Semdoenca
12
38
50 x 2 == 13,5otal 50
"
I
I6. 0 nivel de mensuracao clos dados pode ser entendido corno
uma escada onde urna vez atingido urn degrau, sup6e-se que ascaracte-
risticas dos anteriores estejam presentes. Imagine que os valores das pres-
s6es sistolicas de quatro pacientes sejarn 180, 160, 140 e 135. Como se
sabe, press6es constituem dados continuos, pertencem ao nivel racional
de rnensuracao (0 mais alto). Entretanto, nada impede que se rebaixe 0
sel l nivel para ordinal (grausde hipertensao). por exernplo. ou que seatr i-
buam postos aos resultados, tratando-os corn rnetodos nao-parametricos.
E importante notal ' que 0 rebaixarnento de nivel de mensuracao e quase
sernpre possivel, ao passo que a elevacao rararnente se consegue.
!
Nu rne ro do Graude Posto PostoGI QI Posto PostoGI I
avaliado lns t rucao (corrigido) (corrigido)
2 3 4 110 5 4, 5
2 3 6 6, 5 12 0 6 6
3 1 2 1,5 125 8 8
4 5 9 9 13 0 9 9
5 4 8 8 14 0 1010
6 5 10 10 10 0 3 2
7 3 7 6, 5 12 0 7 7
8 2 4 4 10 0 2
9 1 1,5 10 0 2 2
10 2 5 4 11 0 4 4,5
143
N u rn e ro d o P osto G I P os to 0 1 D lt er e nc a d e p os to (G I - 0 1 )2
avaliado (G I- 0 1) = 0
n(AD - BC)2
, orul«
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 72/79
1 4 3 -0,5 0,25
2 6, 5 6 0 ,5 0,25
3 1,5 2 -6,5 42,25
4 9 9
° °8 8 -2 4
6 10 10 -8 84
7 6, 5 7 -0,5 0,25
8 4 4 2 4
9 1,5 -0,5 0,25
10 4 5 -0,5 0,25
L (G I - 0 1) 2= 0 2 = 135,5
Quando ha postos ernpatados, obtern-se uma media dos postos.
Para 0 grau de inst rucao 1 ocorreu empate, assim usa-se corrigir 0 posto
para 0 posto medic: (1 + 2) / 2 = 1,5. Para 0 grau de instrucao 2, onde
ha urn t rip lice empate, tern-se: (3 + 4 + 5) / 2 = 4, e assim por diante.
A etapa seguinte consiste em achar a diferenca de postos CI eQI para cada avaliado, eleva-las ao quadrado e sornar os resultados:
Aplica-se, entao, a formula para 0 calculo do rs
6X135,5= 1 - = 1 - 0 82 = 0 18
10(102-1) , ,r = 1 -s
concluindo que existe uma correlacao positiva fraca entre grau de
instrucao e QI, podendo ainda, mediante a consulta a uma tabela de
rs' obter-se 0 valor do r critico para 0 nivel de signif icancia desejado e
cornpara-lo com 0 rs obtido.
18. E possivel contornar 0 trabalhoso processo de calcular as
frequencias esperadas para obter um Qui-quadrado associado a urna
tabela 2 x 2, usando a seguinte formula:
144
' X ; = (A + B)(C + D)(A + C)(B + D)
A= frequencia observada para a casela superior esquerda
B= frequencia observada para a case!a superior direi ta
C= frequencia observada para a casela inferior esquerda
D= frequencia observada para a casela inferior direita
n = total de casos
Tern-se, desse modo, para 0 problema em questao:
71[(22X16) - (25X8)F= 1,18
(22 + 25)(8 + 16)(22 + 8)(25 + 16)
levando 0 valor calculado a urna tabela de Qui-quadrado. para 1 grew de
liberdade, obtern-se urn valor de p>O,25, considerado nao-significativo.
19. Esteroteiro constitui urna sugestao de teste para ser aplicado
as diferentes situacoes, podendo exist i r outras solLI<:;6espara 0 rnesrno
problema.
14 5
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 73/79
I
en
eooenW
E: : : : J
(f)
-" ' "CCO
0:"01(])i
C
a tCo><o.Sd
~
CCO
ED(])
It
COu-c;
.0 >
ECO
C i1a_
E(])
Q
~__o
> =ou
o,e oC
o,e o(f)
(f)
(])
0- ,(])
0:
§oz«c-,
~wc.o
Eoo
:g :b
~
~~g - 'S-iii EC i1 : : : : J(])0c~_ eoo (])1 (1 j . ~
(f)-
(f) 0Q CO
O)CQ : : : : J
0: 0
~-----~----~----~-----4-----~-----+-----+-----+-----
146
o>
~: . c -o
o0..::I
0,
E::I
~~oenwC
Eoo
o 0
g - .!:!e n - a >
EO::I .9-~.c<II ~....0<11-0..<11
E >
o E()::I
eno0..::>
0,
.~ f /)
o 0"0"0. ... < IIm.c(ija;0 .. . . ..
E : g _o EUw
eno
en1ilO m s:
E O : ;::I @00..
en E'w w':::0. .. . '<I If:! C
m en0..0
Eo..o 2Um
. ! : ! ! en
'"0E"O::I '"o£en ~
' C l > co
~o..:: Ef:! Cl>
m en0..0
Eo..o 2Um
G L o s s A R I O
Algumas palavras do idiorna ingles, alern das introduzidas ao
longo do texto, sao comuns no dia-a-dia do estatistico e daf a razao
deste glossario:
Absolute value - valor absolute. Trata-se do valor positivo de
urn numero, representado, habitualrnente, pelo mesmo entre duas
barras verticais como, por exemplo,
1 - 2 1 .Array - distribuicao de dados onde os valores 55.0 dispostos em
orde rn cresce nte.
Bias - vicio, vies, tendenciosidade.
Binary observation - observacao binaria. Trata-se de urna
rnedida qual itativa que s6 tern duas al ternativas possiveis.
Blind study - estudo cego ou mascarado. Os ensaios clinicos
podern ser divididos ern cego, duplo cego e triplo cego, confonne res-
pectivamente os pacientes, pacientes e equipe medica, ou pacientes,
equipe medica e equipe que analisa os resultados, nao possarn identi-
ficar quais os pacientes que recebern 0 agente estudado ou placebo
(ou 0 tratarnento convencional).
Bonferroni T procedure - procedirnento de Bonferroni: baseia-
seno fato de que quando sao feitas rnult ip las cornparacoes entre medias,
a chance de se encontrar urna estatisticamente s ignificante, por rnero
acaso (erro t ipo I), aurnenta rnuito. 0 rnetodo consiste ern dividi r 0 valor
de alfa pelo nurnero de cornpa racoes , por excmplo: p .l I" ( i ru n ( () ll lP " - Design - modele, desenho: estrutura de investigacao de uma
pesquisa.
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 74/79
racoes, cada urna com urn alfa de 0,05, 0 valor de al f,1(l st'r cscolhic!o.
para seconsiderar urn resultado como estatisticarnente significante, devc
ser 0,05/5 = 0,0-1 - isso para reduzir a chance de erro tipo I.
Carryover - carrearnento.
Case - caso: e a unidade para a qual sao tornadas as rnedidas:
nao e obrigatoriamente urna pessoa, podendo ser, por exemplo, urn
animal ou urn material em estudo. Frequentemente e usada como si-nonimo de observacao. Nas tabelas de dad os. usualmente cada linha
mostra 0 conjunto de valores das variaveis estudadas para cada CCiSO e
constitui 0 registro do caso em questao.
Case fatality rate - coeficiente de rnortalidade especffica.
Categorical observation - var iavel caregorlca (que e distribuida
por categorias).
Central Limit Theorem - teorerna do limite central. Para amos-
tras suficienternente grandes, a distribuicao das medias das mesrnas e
aproximadarnente normal, independentemente da distr ibuicao dos va-
lores na populacao - e por isso qlle a distribuicao normal e tao impor-
tante na analise de dados ,
Chance agreement - concordancia por chance.
Clinical trial - ensaio clinico.
Cohort - coorte; conjunto de pessoas que sao acornpanhadas
prospectivamente, com base na ocorrencia de lim evento cornum a
to da s e la s.
Concurrent controls - controles simultaneos. grupo controle.
Criterion variable - variavel resultante Oll clepenclente em lima
analise de regressao.
Crossover clinical trial - ensaio clinico cruzado, em que os
participantes sao divididos, ao acaso, em do is grupos: urn de teste e 0
outro de controle, sendo que esses grupos invertern de papel apos urn
deterrninado tempo.
Diagnostic threshold - lirniar de diagn6stico.
Dot plot - d i agrarna de pontos.
Dummy variable - var iavel codificada a que seatr ibui urn numero
(por exernplo, masculine = 1 e feminino = 0); esseart if ic io e usado, por
exernplo, para que essasvariaveis possam entrar numa equacao de regres-
sao ou para simplesrnente faci litar a entrada de dados nurna tabela.
End point - resultado final.
Explanatory variable - var iavel independente ou predictiva.
Extraneus variable - variavel confundfvel, fator de confusao -
observacao de urna assoc iacao entre duas variaveis que, de fato. nao
existe e e causada por uma tercei ra variavel . Urna variavel confundfvel
geralrnente tern as seguintes caracterfsticas: C I) esta assoc iada corn a
exposicao, b) e urn fator de risco p,ua a doenca independenternente
de exposicao e c) nao existe relacao causal ent re a exposicao e a doenca.
Gold standard - teste padrao usado como referencia para a
deterrninacao das caracterlsticas operacionais de lim novo metodo ou
teste diagn6stico.
Goodness of fit test - uso de Qu i-quadrado para deterrninar se
a distr ibuicao das variaveis categoricas observadas corresponde a uma
dada distr ibuicao conhecida ou teorica.
Hazard function - funcao acidental,
Homoscedasticity - hornoscedasticidade: propriedade das
arnostras mostrarem igual variabilidade.
Interquarti le range- intervale interquarti lico: e a distancia entre
os valores dos percentis 75 e 25; a sua utilidade depreende-se do fato
de nao ser faci lrnente afetada por valores extremes.
Inter-rater reliability - concordancia entre observadores: 0
quanta concordam dois observadores executando a mesma tarefa.
Intra-rater rel iabil ity - concordancia para 0 rnesrno observador:
concordancia entre resul tados ou julgarnentos que OCOIH' quando urn
mesmo observador executa a rnesrna tarefa d iversas vezes.
Phi coefficient - coeficicnt« phi: lI1l1.! l11<'ti id" < I" IllI<," ti('
.issociacao entre variaveis norninais, sernelh.mtc < 1U codici<'IlI<' < i ( '
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 75/79
levene's test - teste de Levene: usado pi1ra verif icar a igualdade
de d u as v a ri a nc ia s .
likelihood ratio - fndice de probabilidade.
longitudinal study - estudo longitudinal: aquele realizado
durante urn longo perfodo de tempo.
Mantel-Haenszel chi-square test - teste de Mantel-Haenszel:
teste estatfstico para 2 ou mais tabelas de contlngencla 2 X 2 usado para
comparar distribuicoes de sobrevivencia.
McNemar test - teste de McNemar, Trata-se de urna prova de
Qui-quadrado para comparar proporcoes entre grupos ernparelhados.
Meta analysis - meta anal ise: metodo de cornbinar resul tados
de pesquisas independentes objetivando dirninuir incertezas por meio
do aumento do tarnanho da arnostra e consequente aurnento do poder
estatistico. E particularrnente util em algumas quest6es terapeuticas e
ern estuclos de doencas raras, oncle obter-se grandes casu is t icas e pra-
ticamente im possivel.
Observacional study - estuclo observacional: aquele que nao
envolve intervencao ou manipulacao.
Odds - probabil idacle cia ocorrencia cle urn evento dividida pela
probabi lidade de sua nao ocorrencia.
Outcome variable - variavel resultante.
Outlier - valor nurnerico muito acima ou abaixo da media.
Parameter - pararnetro: medida numerica usada pari1 clescrever
algurna caracteristica populacional como, por exernplo. a media de todas
asestaturas de urna populacao: e representado habitualmente por letras
gregas b,u etc.).
Percenti Ie - percentil : e um valor numa eSG11,1e la l00, abaixo
e acirna do qual cai uma certa porcentagem clos resultados obtidos,
como por exernp!o: afirrnar que lim percentil 25 e igual a 330 signlfica
dizer que 25% dos resultados obtidos sao iguais ou rnenores que 330.
1r : ;n
correlacao usado para variaveis contfnuas.
Poisson distribution =distribuicao de Poisson. Uma distribuicao
de probabilidade usada para modelar 0 nurnero de vezes que urn evento
raro ocorre.
Post hoc (analisys) - analise a posteriori: analise nao especificada
antes dos dados terern sido colhidos e que pede ser sugerida pelos
mesmos.
Protocol- protocolo: urn procedimento. uma seria de instrucoes
ou diretr izes pClrClexecutar urna tarefa. visando reduzir vieses.
Reliability - confiabilidade: (1habilidade de urna medida ou
ur n teste reproduzir os mesmos resultados quando repetido n(1Smesrnas
condicoes.
Robust - robusto: qualidade de urn rnetodo que e suficien-
temente adequado p(1r(1supor tar (1anal ise de d ados que violarn os
pressupostos de urna distribuicao normal.
ROC (receiver operating characteristic) curve - Curva ROC:
diagrarna usado p(1r(1avaliar (1Spropriedades de urn teste diagnostlco.
apresenta os verdadeiro-positivos no eixo Y e os falso-positivos no
eixo X.
S.A.S. (Statistical Analysis System) - software estatfstico
abrangente.
S.P.S.S. (Statistical Package for Social Sciences) - software
e st at is ti co a b ra n ge nt e.
Scatter plot - diagrarna pontilhado.
Scheffe's procedure - procedirnento de Scheffe: urn metodo
de cornparacoes multiplas aplicado apos a obtencao de urn teste F
signi ficante - testa 2 (12 os grupos comparados.
Scientif ic notation - notacao cientif ica: forma PC1r(1xp,'ess(1r
numeros que cornportarn muitos zeros, utilizando urn nurnero de l a
151
1() mult ip lic.ulo por pol['llci,lS dc doz. Exemplos:
10 = 101; 100= 10"; 100.000 = 10"; 100.000.000 = '1011
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 76/79
1 = 100; 0,1 = '10-1; 0,01 = 10-2; 333.000.000 = 3,33 X '1011
0,0000314159 = 3,14'159 X 10-5
Score - escore, resultado.
Screening - exame de deteccao.
Skewed distribution - distribuicao assimetrica.
Standard normal distribution - distribuicao normal padrao: e
aquela que tern media igual a zero e desvio-padrao igual a 1.
Standard score - escore pad rao: 0mesmo que escore Z; ele rnostra
a quantos desvios-padrao, abaixo ou acima da media, urn caso esta,
Statistician - estatistico: diz-se da pessoa que se ocupa da
Estatfstica.
Stepwise regression - regressao sequencia!
Survey - levantarnento.
Trial - urn ou urna serie de experimentos repetidos ern que se
pretends verif icar, por exemplo, a chance de sucesso em n tentativas-
tr ials.
Trimmed mean - media aparada: e calculada tal qual a media
ari trnetica, exceto que uma deterrninada porcentagem de GISOS dentre
os maiores e dentre os menores e excluida. Uma media aparada de 5%
exclui 5% dos rnaiores e 5% dos menores resultados.
Trohoc - estudo de coorte retrospectivo.
Validity - validade: 0 quanta lima medida reflete 0 verdadeiro
valor do que esta sendo medido.
Variable =variavel: cada item de inforrnacao coletado com baseem cada caso. Nas tabelas de dados usual mente cada coluna representa
uma variavel. 0 conjunto de valores que ela pode assumir chama-sa
domin ic , mas se ela puder ter apenas urn valor, charna-se constante.
Weighted mean - media ponderada.
152
REFERENCIAS B IBL lOCR;\ F ICAS
COSTA NETO, PL. O. Estatrst ica. Sao Paulo, Edgard Blicher, '1977.
COSTA, S. F. I nt ro dw; ao i lu s tr ad a a estat lst ica. 3.ed. Sao Paulo,
Harbra, 1998.
DAWSON, B; TRAPp, R.C. Basic & c l inica l b ios ta t i s ti cs . 3.ed.
New York, Lange Medical Books/McCraw-Hili, 2001.
FLETCHER, R.H; FLETCHER, S.W; WACNER, E.H. Epidemiologia
clfnica: elementos essenciais: 3.ed. Porto Alegre, Artes
Medicas, '1996.
FREUND, J.E,; SIMON, C.A. Mo de rn e le m en ta ry s ta ti st ic s. 9.ed.
Upper Saddle River, Prent ice Hall , 1997.
C LANTZ, SA Primer of bio-statistics. 4.eel. New York, McCraw-
Hil l, 1997.
CRAPHPAD SOFTWARE. A s ta tis tic al c om pa nio n C ra ph Pa d
StatMate. Versionl.0 user's guide. San Diego, 1995.
CRAPH PAD SOFTWARE. The Instat gu ide to choo sing ane !
i nt er pr e ti ng s ta ti st ic al t es ts . A manual for Craphpad Instat
version 3. San Diego, 1990-1998.
HERMANSEN, M. B i os ta ti st ic s: s om e b as ic c on ce pt s. Evansville,
Mead Johnson, 1990.
JAISINCH, L.R. S ta tis tic s fo r th e u tte rly c onfu se d. New York,
McCraw-Hi li, 2000.
153
J OHNSON , R .A ; BHATTACHARVYA ,G .K . S ta ti st ic s p ri nc ip le s
a nd m etho ds. 4 .ed. N ew Y ork , Jo hn W iley & So ns, 2 001 .
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 77/79
KATZ ,M .H. Mu lt iv a ri ab le a na ly si s: a p ra ti ca l g ui de f or c li ni ci an s.
C am b rid ge , C am b rid ge U niv ers ity P re ss, 1 9 99 .
K IR KW OOD, B .R . Essent ia l s o f m e di ca l s ta ti st ic s. Oxford ,
B la c k w e ll , 1 9 9 5.
L A NG, T .A ; S EC lC , M . H o w to r ep ort sta tistic s in m e dic in e:
a nn ota te d g uid eli ne s fo r a uth or s, e dito rs , a nd re vie w ers.
P hila de lp hia , P o rt C ity P re ss, 1 99 7.
LEVIN,J . Es t a ti s ti c a ap l ic ada a c ie n ci es h umana s. 2 .e d. S ao P au lo ,
H ar bra , 1 98 7.
MARclLlO, C. Dicioneno de p esq uisa c1 inica . S a lv a do r, A r te s
C ra fi ca s, 1 9 95 .
M OT ULSK Y, H . I nt ui ti ve b io st at is ti cs . N ew Y ork , Oxfo rd
U n iv er si ty P re ss , 1 9 95 .
N ORU SIS , J. M . SPSS 8.0@ gu ide to d ata a na lys is . New J er se y ,
P re nt ic e H a ll, 1 9 98 .
S P IEGEL,M . R . Estatist ica. 3 . ed. Sa o P aulo , M ak ro n B oo k s, 1 99 3.
V IEIRA , S . B io es ta ti st ic a - t6 pic os a va nc ;a do s. R io de ja neiro ,
C am p us, 2 00 3.
/
INDICE REMISSIVO. .. . . . . .. .. .. .. .. .. . . . . . . ~ '" . . . . . . . . .. " . ..
A m ostra , 1 7
ta rna nho da , 76 , 77
Am plitude , 2 6
A n alise d e variancia, 1 1 4
A N OV A, 1 15
B on ferro ni, p ro cedim ento T , 1 4 7
Coefic iente
de deterrninacao.TZf
de Pea rso n, 1 24
de Spea rm an, 1 27
de variacao, 34
Correlacao, 1 2 1
Curva
de a justa mento , 1 22
de sobrevivencia, 56
Dado s
c on tin uo s, 2 1
intervalares, 21
no m ina is, 2 0
ordinals, 20
D ec il, 2 7
D ensid ade de p ro ba bilida de, 8 5
155
I)('SVio-p"dr,-lo, 211,32IIip6tese
alternativa, 76Discrepancia, 29
nula,74
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 78/79
Dispersao, 22, 26Histograma, 50
Distribuicao
de frequenc ias, 46, 84 Intervalo
de Qui-quadrado, 98 de confianca, 39, 41
F , 1 "16 , 117 interquartf lico, 27
normal, 42
t, 89, 90 Media
aritmet ica, 24Emparelhamento, 100 geometr ica, 24
Erro Mediana, 25
padrao da media, 35Moda,25
tipo I, 78Nfvel de slgnlflcancia, 78
tipo II, 78Notacao cientifica, 151
Escore reduzido, 44Nurneros aleat6rios, 18
Especif icidade, 135
EstatfsticaODDS RATIO, 132
analftica, 69
descr itiva, 13 Pararnetro. 49, 150
Estimacao, 49 Pequenas arnostras. teoria. 89
Estimador, 49 Percenti l, 27, 150
Estimativa, 49 Poder do teste, 81
Polfgonos de frequencia, 51
Frequencia Populacao. -17
acumulada, 47Quartil, 27
relat ive, 46Qui-quadrado, 95
Craficos
Razao. 132bar r as , 23, 50Regressao
caixa e linha, 53linear, 127
representacao. 50 rnult ipla, 136
tronco e folhas, 51 Risco
Cre\USde l iberdade, 93 atribufvel, 131
relat ive, 13-'
157156
S(·Il...hilid,ld(·,II,r,
Sigll iric:l IlCitl , nfvel, 78
Student, e n
5/11/2018 Introducao a a - Ulysses Doria Filho - slidepdf.com
http://slidepdf.com/reader/full/introducao-a-a-ulysses-doria-filho 79/79
Tabe las
cont ingencia, 48
de frequencia, 46, 47
Tendencia central , 22
Teorema do lirnite central, 148
Teste
de Fisher, 104
de hip6tese, 75
de Qui-quadrado, 95
de significancia. 91
do sinal, 102
Mann-Whitney U , 108
McNemars, 104
nao-pararnetricos, 101
t, 91
Wilcoxon Signed Rank Sum, 107
Valor predictivo, 134
Variabi lidade das arnostras, 80
variancia, 28
da arnostra. 30
da populacao, 28
Variave], 152
Yates, correcao de, 97
Z, escore, 44
\
Cadastre-se e receba inforrnacoes
sobre nossos lancamentos,
novidades e promocoes.
Para obter inforrnacoes sobre lancamentos e novidades
do Grupo Editorial Campus, dentro dos assuntos do seu
interesse, basta cadastrar-se no nosso site.E rapido e faci l,
Alern do catalogo completo on-line, nosso site possui avancadosistema de bus cas para consultas, por autor, ti tulo ou assunto.
Voce vai ter acesso as mais importantes publicacoes sobre
Profissional Neg6cios, Profissional Tecnologia, Universitarios,
Educacao / Referencia
e Desenvolvimento Pessoal.
Nosso site conta com modulo de seguran<;a de Ultima gera<;ao
para suas compras.
Tudo ao seu alcance, 24 horas por dia.
\ Clique www.campus.com.br e fique sempre bern informado>~ /
www.campus.com.br