apostilabioestatstica 140309201230 phpapp01 (1)

104
Apostila Bioestatística - MTM 363 Clandio Marques e Rodrigo Fioravanti

Upload: alexandrecpc

Post on 24-Nov-2015

301 views

Category:

Documents


35 download

TRANSCRIPT

  • ApostilaBioestatstica - MTM 363

    Clandio Marques e Rodrigo Fioravanti

  • Contedo

    1 Princpios 41.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 O Mtodo Cientfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Definio de Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Fases do Mtodo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    1.4.1 Coleta dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.4.2 Crtica dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4.3 Apurao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4.4 Exposio ou Apresentao dos Dados . . . . . . . . . . . . . . . . . . . . . . 81.4.5 Anlise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    1.5 Leitura Complementar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    2 Conceitos Bsicos 102.1 Populao e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.2 Variveis Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    3 Apresentao Tabular e Distribuio de Frequncias 133.1 Dados Absolutos e Dados Relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Distribuio de Frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.3 Exerccios no Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183.4 Grficos de Colunas e Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.5 A Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.6 Distribuio de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    4 Medidas de Posio 254.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.2 Mdia Aritmtica (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.3 Moda (Mo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284.4 Mediana (Md) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    5 Separatrizes 335.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335.2 Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    6 Medidas de Disperso 356.1 Disperso ou Variabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356.2 Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366.4 Coeficiente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    1

  • CONTEDO CONTEDO

    7 Outros Grficos 407.1 Grfico de Pizza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407.2 Box Plots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417.3 Trabalho 02 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    I Teoria da Amostragemcom Bioestat 44

    8 Amostragem 458.1 Amostragem vs Censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458.2 Amostragem Probabilstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478.3 Amostragem Aleatria Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478.4 Amostragem Aleatria Estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . . 488.5 Amostragem Aleatria Sistemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498.6 Amostragem Aleatria por Conglomerados . . . . . . . . . . . . . . . . . . . . . . . . 508.7 Amostragem No-Probabilstica: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528.9 Tamanho Mnimo da Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548.10 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 588.11 Leitura Complementar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 588.12 Trabalho 03 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    II Estatstica Inferencialcom Bioestat 61

    9 Probabilidade 639.1 Interpretaes da Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649.2 A Interpretao da Probabilidade Segundo o Jogador . . . . . . . . . . . . . . . . . . 659.3 Probabilidade de Ocorrncia de Um Evento . . . . . . . . . . . . . . . . . . . . . . . 659.4 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 659.5 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 669.6 Nvel de Confiana e de Significncia . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    10 Estimao de Parmetros 6810.1 Estimativas pontuais e intervalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6810.2 Intervalo de Confiana para Mdia Populacional quando a Varincia Conhecida . . 6810.3 Intervalo de Confiana para Proporo . . . . . . . . . . . . . . . . . . . . . . . . . . 7010.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    11 Testes de Hipteses 7411.1 A Hiptese Nula e a Hiptese Alternativa . . . . . . . . . . . . . . . . . . . . . . . . 7411.2 Erro Tipo 1 e Tipo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7511.3 Uso dos Testes de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7711.4 Classificao dos Testes de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    11.4.1 Testes uni e bilateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7811.4.2 Testes Paramtricos e No-Paramtricos . . . . . . . . . . . . . . . . . . . . . 80

    12 Testes Paramtricos 8112.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8112.2 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

    2

  • CONTEDO CONTEDO

    13 Teste No Paramtricos 8713.1 Vantagens e Desvantagens dos Testes No Paramtricos . . . . . . . . . . . . . . . . 8713.2 Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

    13.2.1 Aplicao do Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . 8813.2.2 Cuidados com o Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . 89

    13.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8913.4 Trabalho 04 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9013.5 Teste Exato de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9113.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9213.7 Teste de Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9213.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9313.9 Trabalho 05 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

    14 Correlao Linear 9614.1 Diagrama de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9614.2 Coeficiente de Correlao Linear - r . . . . . . . . . . . . . . . . . . . . . . . . . . . 9814.3 Regresso Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10014.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

    3

  • Captulo 1

    Princpios

    1.1 IntroduoPor Sidia C. Jaques

    Na literatura cientfica, consultada por profissionais das reas biolgica e da sade, encontramosexpresses como "diferena estatisticamente significativa", "teste qui-quadrado de associao"e "P< 0,01", que refletem a importncia, cada vez maior, dada pelos pesquisadores ao tratamento esta-tstico de seus dados. Quais sero as razes para o emprego de mtodos estatsticos nos trabalhoscientficos?

    Em primeiro lugar, a estatstica, longe de ser mais uma complicao matemtica, tem se mos-trado um instrumento extremamente til na organizao e na interpretao dos dados. Em segundolugar, esta cincia propicia uma avaliao adequada da variabilidade observada nos processos bio-lgicos. sabido que existem diferenas entre os indivduos e que eles reagem de forma diferente aestmulos idnticos; por outro lado, o mesmo indivduo apresenta variaes de um momento paraoutro. Em vista disto, o pesquisador consciencioso deseja saber qual o grau de confiabilidade deseus resultados. Ele se pergunta, por exemplo, se os resultados poderiam ter sido obtidos por acaso,se o novo tratamento proposto foi realmente mais eficiente, se a associao observada entre as va-riveis real, se o mtodo de seleo de indivduos foi adequado, se a anlise dos dados empregouos mtodos adequados s variveis estudadas. Todas essas questes podem ser respondidas com oauxlio da estatstica.

    O papel da estatstica na investigao cientfica vai alm de indicar a sequncia de clculosa serem realizados com os dados obtidos. No planejamento, ela auxilia na escolha das situaesexperimentais e na determinao da quantidade de indivduos a serem examinados. Na anlisedos dados, indica tcnicas para resumir e apresentar as informaes, bem como para comparar assituaes experimentais. Na elaborao das concluses, os vrios mtodos estatsticos permitemgeneralizar a partir dos resultados obtidos. De um modo geral, no existe certeza sobre a correodas concluses cientficas; no entanto, os mtodos estatsticos permitem determinar a margem deerro associada s concluses, com base no conhecimento da variabilidade observada nos resultados.

    Inicialmente, a estatstica ocupava-se em descrever quantitativamente os vrios aspectos dosassuntos de um governo ou estado1 , remontando poca em que surgiram as primeiras cidades.Comeava, ento, a necessidade de se enumerarem coisas e pessoas para a avaliao das riquezas epara o cadastramento das propriedades. Os censos2 j eram realizados anualmente em Atenas e, acada quadrinio, em Roma, nas festas de purificao da comunidade, quando era necessrio saberse todos estavam presentes ou representados.

    1O termo estatstica surge da expresso em latim statisticum collegium palestra sobre os assuntos do Estado, deonde surgiu a palavra em lngua italiana statista, que significa "homem de estado", ou poltico, e a palavra alemStatistik, designando a anlise de dados sobre o Estado. A palavra foi proposta pela primeira vez no sculo XVII,em latim, por Schmeitzel na Universidade de Jena e adotada pelo acadmico alemo Godofredo Achenwall. Aparececomo vocabulrio na Enciclopdia Britnica em 1797, e adquiriu um significado de coleta e classificao de dados, noincio do sculo XIX.

    2Ela vem do Latim CENSUS, lista de nomes e propriedades dos cidados romanos

    4

  • 1.2. O MTODO CIENTFICO CAPTULO 1. PRINCPIOS

    Um dos primeiros censos de que se tem notcia escrita foi o ordenado pelo imperador romanoCsar Augusto, realizado na Palestina, por volta do ano zero da era crist. Outro recenseamentofamoso foi o realizado, na Inglaterra, por Guilherme I, duque normando que havia derrotado osingleses. O cadastro geral das coisas inglesas com fins de tributao, feito em 1085-1086, foi chamadopelos ingleses de "Domesday (ou Doomsday) Book", o livro do juzo final, nome que bem revela asexpectativas da populao quanta carga tributria por vir.

    Por muito tempo, o aspecto descritivo da estatstica manteve-se como a nica faceta desta ci-ncia. As coisas comearam a mudar no sculo XVII, com as primeiras interpretaes de dados.Em 1693, foram publicados, em Londres, os primeiros totais anuais de falecimentos, discriminadospor sexo. Eram o resultado de levantamentos iniciados em 1517, quando a peste atacava periodi-camente a Europa. Christian Huygens (1629-1695), fsico e astrnomo holands, construiu depoisuma curva de mortalidade a partir dos dados publicados.

    O estudo formal da teoria de probabilidades, iniciado por Blaise Pascal (1623-1662) e Pierre deFermat (1601-1665), constitui-se em importante marco no desenvolvimento da estatstica. Graasa esses conceitos, a estatstica comeou a ser estruturada de modo a poder desempenhar seu papelmais nobre, o de auxiliar na tomada de decises cientficas.

    Estudiosos de diferentes campos do conhecimento fizeram a ligao entre os aspectos tericos deprobabilidade e estatstica e a prtica. Lambert Adolphe Jacques Quetelet (1796-1874), astrnomoe matemtico belga, foi o primeiro a usar a curva normal fora do contexto da distribuio dos errose aplicou conhecimentos estatsticos na soluo de problemas de biologia, medicina e sociologia.Francis Galton (1822-1911) , por sua vez, empregou a estatstica no estudo da variao biolgicae tentou, sem sucesso, resolver problemas de hereditariedade. Karl Pearson (1857-1936) tambminteressou-se pela aplicao dos mtodos estatsticos biologia, em especial, a estudos sobre aseleo natural. Alm de ser o pai do teste qui-quadrado, a ele se devem inmeros estudos e medidasde correlao entre variveis. Um aluno de Pearson, William S. Gosset (1876-1937), dedicou-se asolucionar problemas prticos com amostras pequenas. Um dos resultados de seus estudos adistribuio t, de ampla aplicao em vrios campos da cincia.

    Uma das figuras modernas mais importantes da bioestatstica (e da estatstica em geral, jque desenvolveu mtodos para solucionar vrios tipos de problemas) foi, sem dvida, Fisher , queassentou as bases para a experimentao estatisticamente controlada. Vrios modos de analisar osdados de amostras pequenas foram propostos por Fisher, que tambm tem importantes contribui-es na anlise simultnea de muitas variveis, dando considervel impulso ao uso da estatsticaem inmeras reas do conhecimento, particularmente na agronomia, na biologia e na gentica.

    Figura 1.1: Sir Ronald Aylmer Fisher (1890-1962)

    1.2 O Mtodo CientficoMuitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por neces-sidades prticas, sem aplicao de um mtodo.

    5

  • 1.3. DEFINIO DE ESTATSTICA CAPTULO 1. PRINCPIOS

    Atualmente, quase todo acrscimo de conhecimento resulta da observao e do estudo. Mesmoque muitos desses conhecimentos possam ter sido observados inicialmente por acaso, a verdade que desenvolvemos processos cientficos para seu estudo.

    Mtodo um conjunto de meios dispostos convenientemente para se chegar a um fim que sedeseja.

    Mtodo Experimental

    Mtodo experimental consiste em manter constantes todas as causas (fatores), menos uma, e variaresta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.

    o mtodo preferido no estudo da Fsica, da Qumica etc.

    Mtodo Estatstico

    Muitas vezes temos necessidade de descobrir fatos em um campo em que o mtodo experimentalno se explica (nas cincias sociais, humanas ou da sade, por exemplo), j que os vrios fatoresque afetam o fenmeno em estudo no podem permanecer constantes enquanto fazemos variar acausa que, naquele momento, nos interessa.

    Quando no possvel fixar variveis, lanamos mo de outro mtodo, embora mais difcil emenos preciso, o denominamos de mtodo estatstico.

    Mtodo estatstico, diante da impossibilidade de manter as causas constantes, admite todas essascausas presentes variando-as, registrando essas variaes e procurando determinar, no resultadofinal, que influncias cabem a cada uma delas.

    1.3 Definio de EstatsticaPara Magalhes3 estatstica a cincia que utiliza-se das teorias probabilsticas para explicar afrequncia da ocorrncia de eventos, tanto em estudos observacionais quanto em experimentos quevisam a modelar a aleatoriedade e a incerteza de forma a estimar valores nesses eventos.

    claro que nem todas as pessoas tm formao para entender os clculos feitos por quemtrabalha na rea, mas todos devem compreender as informaes passadas por eles, pois lidamoscom estatstica o tempo todo, afirmou Magalhes. A compreenso se daria a partir do momento emque os professores desmistificam a matemtica, fazendo isso, principalmente, com a alfabetizaoestatstica, isto , fazer os estudantes entender grficos e diagramas encontrados no cotidiano daspessoas, de modo a contextualizar a importncia do que est sendo dito (Magalhes).

    A palavra estatstica de do latim STATUS que significa ESTADO. Em suma, a Estatstica acincia que aplica processos prprios para coletar, apresentar e interpretar adequadamente os dados,sendo numricos ou no. Tem como objetivo apresentar informaes sobre dados em anlises paraque se tenha maior compreenso dos fatos que os mesmos representam.

    considerada um mtodo cientfico pois resulta de um conjunto de regras e princpios queproduzem resultados controlados ou previsveis a partir de dados aleatrios levando a umobjetivo almejado.

    H trs ramos da estatstica: descritiva, probabilstica e inferencial.

    Estatstica Descritiva:

    Como o prprio nome diz, descreve, ou seja, organiza, sumariza e descreve um conjunto de dados,atravs da construo de grficos, tabelas, e com clculo de medidas com base em uma coleo dedados numricos. Ou seja, tenta tornar os dados mais fceis de ler, interpretar e discuti-los.

    A estatstica descritiva, descreve os dados de trs maneiras:Tabela: um quadro que resume um conjunto de observaes.

    3Marcos Magalhes, do Departamento de Estatstica (MAE) do Instituto de Matemtica e Estatstica da Univer-sidade de So Paulo (IME-USP)

    6

  • 1.4. FASES DO MTODO ESTATSTICO CAPTULO 1. PRINCPIOS

    Grficos: so formas didticas udios-visuais de apresentar os dados, com o objetivo de pro-duzir uma impresso mais rpida dos dados ou fenmenos.

    Medidas descritivas: so formulaes matemticas usadas para interpretar grandes quanti-dades de dados agrupados.

    Estatstica Probabilstica:

    onde estuda-se o acaso, ou seja, atravs de clculos matemticos, pretende-se prever a ocorrnciade dados aleatrios.

    Estatstica Inferencial:

    Destina-se anlise e interpretao de dados amostrais, ou seja, consiste em efetuar determinadamensurao sobre uma parcela pequena, mas tpica, de determinada populao e utilizar essainformao para fazer inferncias sobre a populao toda. A exemplo: colocar a ponta do p nagua para avaliar a temperatura desta na piscina.

    1.4 Fases do Mtodo EstatsticoOs dados estatsticos lidam com nmeros, ou seja, envolvem a anlise e interpretao de nmeros.

    Para interpretar estes nmeros faz-se necessria uma organizao racional dos dados, portanto,inicia-se determinando a diferena entre dados e informao.

    Dados so nmeros ou valores coletados primariamente, e quase sempre no tem sentido. Ja informao compreende o processamento dos dados, reduzindo a quantidade de detalhes e facili-tando o encontro de relaes. Portanto os dados, quando coletados, so reunidos atravs de tcnicasestatsticas e posteriormente apresentados na forma de TABELAS ou GRFICOS; isto faz comque sejam eliminados detalhes no importantes e enfatizados os aspectos cruciais dos dados.

    Estes dados estatsticos so obtidos atravs de um processo que envolve a observao; e os itensobservados so chamados de variveis. Variveis so valores que tendem a exibir certo grau devariabilidade quando se fazem mensuraes sucessivas.

    1.4.1 Coleta dos DadosAps o cuidadoso planejamento e a devida determinao das caractersticas mensurveis do fen-meno coletivamente tpico que se quer pesquisar, damos incio coleta de dados numricos neces-srios a sua descrio.

    A coleta pode ser direta ou indireta.A coleta direta quando feita sobre elementos informativos de registro obrigatrio (nascimento,

    casamento e bitos, importao e exportao de mercadorias), elementos pertinentes aos prontu-rios dos alunos de uma escola ou, ainda, quando os dados so coletados pelo prprio pesquisadoratravs de inquritos e questionamentos, como e o caso das notas de verificao e de exames, docenso demogrfico, etc..

    A coleta direta de dados pode ser classificada relativamente ao fator tempo em:Contnua (registro) quando feita continuamente, tal como a de nascimento e bitos e a de

    frequncia dos alunos nas aulas;Peridica quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos)

    e as avaliaes mensais dos alunos;Ocasional quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma

    emergncia, como no caso de epidemias.A coleta se diz indireta quando inferida de elementos conhecidos (coleta direta) e/ou do co-

    nhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemoscitar a pesquisa sobre a mortalidade infantil, que e feita atravs de dados colhidos por uma coletadireta.

    Mas se levarmos em considerao a natureza dos dados estes podem ser:

    7

  • 1.5. LEITURA COMPLEMENTAR CAPTULO 1. PRINCPIOS

    Contnuos: trata-se de dados quantitativos em que as variveis podem assumir virtualmentequalquer valor num intervalo de valores, ou quando feita continuamente.

    Exemplo: altura, peso, comprimento, espessura, velocidade, etc.Discretos: tambm so dados quantitativos que s podem assumir valores inteiros. Os dados

    discretos surgem na contagem do nmero de itens com determinada caracterstica.Exemplo: nmero dirio de clientes, alunos numa sala, nmero de acidentes dirios numa fbrica

    e outros.Nominais: so dados qualitativos e caracterizam-se pela denominao de categorias ou nomes,

    geralmente compreendem variveis que no relacionam-se a priori com nmeros.Exemplo: sexo, cor dos olhos, campo de estudo, desempenho no trabalho, etc.Por Posto: apesar de lidarem com nmeros, so considerados dados de natureza qualitativa, pois

    se referem a avaliaes subjetivas; quando se dispem os itens segundo preferncia ou desempenho.So valores relativos atribudos para denotar ordem.

    Exemplo: primeiro, segundo, terceiro ...

    1.4.2 Crtica dos DadosObtidos os dados, eles devem ser cuidadosamente criticados a procura de possveis falhas e im-perfeies, a fim de no incorrermos em erros grosseiros ou de certo vulto, que possam influirsensivelmente nos resultados.

    A crtica externa quando visa as causas dos erros por parte do informante, por distrao oum interpretao das perguntas que lhe foram feitas; e interna, quando visa observar os elementosoriginais dos dados da coleta.

    1.4.3 Apurao dos DadosNada mais do que a soma e o processamento dos dados obtidos e a disposio mediante critriosde classificao. Pode ser manual, eletromecnica ou eletrnica.

    1.4.4 Exposio ou Apresentao dos DadosPor mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sobforma adequada (tabela ou grfico), tornando mais fcil o exame daquilo que est sendo objeto detratamento estatstico e ulterior obteno de medidas tpicas.

    1.4.5 Anlise dos ResultadosO objetivo da Estatstica e tirar concluses sobre o todo (populao) a partir de informaes forne-cidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (EstatsticaDescritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos da Estatstica Indu-tiva ou Inferencial e tiramos desses resultados as concluses e previses.

    1.5 Leitura ComplementarINFORMAO EM SADE

    Arlinda B. MorenoClaudia Medina Coeli

    Sergio Munck

    GNESE DO CONCEITO E DESENVOLVIMENTO HISTRICO

    Para refletir sobre a expresso Informao em Sade podemos nos remeter necessidade exis-tente, desde a antiguidade, do ser humano comunicar algo a algum (ou a alguma coletividade)

    8

  • 1.5. LEITURA COMPLEMENTAR CAPTULO 1. PRINCPIOS

    sobre sua prpria sade ou sobre a sade de algum (ou de algum grupo de pessoas) a ele relacio-nado. Ou seja, preliminarmente, a Informao em Sade pode ser pensada como um compsito detransmisso e/ou recepo de eventos relacionados ao cuidado em sade.

    Assim sendo, podemos inferir que no tarefa fcil demarcar o incio do uso dessa terminologiano campo da sade. Mas, certamente, a partir do sculo XIX, perodo que marca o recrudesci-mento dos estudos em epidemiologia, que a necessidade de comunicar questes relacionadas sadedas populaes se torna a grande alavanca para a disseminao das Informaes em Sade. Quaseque concomitantemente, a estatstica do final desse sculo XIX e incio do sculo XX, inspiradorade estudiosos como Benthan, Price, Laplace, Galton (Rosen, 1994) pode ser vista, tambm, comoum ponto de partida importante para a gerao de Informaes em Sade de forma agregada epreditiva. Da, pode-se partir, sem muito pecado, para as primeiras peas da Informao em Sade,compostas pelas Estatsticas Vitais, pelas Tbuas de Sobrevida, enfim, por instrumentos de predi-o e inferncia de estados de sade a partir do status atual de um grupo de pessoas em determinadocontexto de sade. E, no correr da histria, numerosos desdobramentos para a expresso Informa-o em Sade transformaram-se, praticamente, em subreas distintas e dirigidas, principalmente,a subsidiar, no apenas a populao em geral, mas tambm gestores da rea sade: sobre: perfilda populao (de que adoece e morre, dados demogrficos e socioeconmicos); servios prestados;materiais e medicamentos consumidos; fora de trabalho envolvida; para conhecer: necessidadesda populao atendida; uso potencial e real da rede instalada; investimentos necessrios; a fim deplanejar, controlar e avaliar as aes e servios de sade (EPSJV, 2005).

    Como marcos histricos para tanto, tem-se, no sculo XVII, na Alemanha, o surgimento dachamada topografia poltica ou uma descrio das condies atuais do pas, proposta por Leibniz,em cuja descrio deveriam constar: o nmero de cidades (maiores e menores) e de aldeias; apopulao total e a rea do pas em acres; a enumerao de soldados, mercadores, artesos ediaristas; as informaes sobre as relaes entre os ofcios; o nmero de mortes e das causas demorte (Rosen, 1980). Em decorrncia dessa e de outras aes semelhantes, surgiram os inquritosde morbidade e as estatsticas dos servios de sade. Na gnese da vigilncia epidemiolgica, inegvel a influncia de Farr, que realizou atividades de coleta, processamento e anlise de dados esua divulgao para as autoridades sanitrias. Quando observamos o clebre estudo sobre o clerarealizado por Snow, impossvel negar o uso das Informaes em Sade constantes dos mapas deponto e do raciocnio epidemiolgico no controle desta doena, j no sculo XIX.

    A essa altura , tambm, de suma importncia destacar o papel fundamental do desenvolvimentodas cincias da computao, no sculo XX, e, portanto, da informtica como instrumental necessrioe multiplicador tanto das metodologias estatsticas quanto das Informaes em Sade. Ressalte-se,tambm, que esse desenvolvimento tecnolgico tem papel crucial em inovaes intrnsecas rea dasade, tais como: a) a disseminao e facilitao da acessibilidade s bases de dados em sade; b) osurgimento e a propagao da informtica mdica; c) a concepo e a implementao do pronturioeletrnico do paciente, entre outros.

    9

  • Captulo 2

    Conceitos Bsicos

    2.1 Populao e AmostraPopulao o conjunto de entes portadores de, pelo menos, uma caracterstica comum. Ex. fazeruma pesquisa entre os alunos das escolas de Ensino Fundamental: precisamos definir quais so osalunos que formam o universo, ou seja, os que atualmente esto no colgio ou devemos incluir os quej passaram pela escola? A soluo do problema depende de cada caso em particular. Na maioriadas vezes, por impossibilidade ou inviabilidade econmica ou temporal, limitamos a pesquisa aapenas uma parte da populao. A essa parte proveniente da populao em estudo denominamosamostra.

    Exemplo: O nmero de enfermeiros de um hospital 233. Uma pesquisa sobre opo dehorrio de trabalho pode ser feita com apenas 20 enfermeiros tomados ao acaso.

    Tabela 2.1: Exemplos de Populao e AmostraVarivel de Interesse Populao Amostra

    1 Insalubridade Todos os enfermeiros do hospital 20 enfermeiros do hospital2 Tipo Sanguneo Total de enfermeiros do hospital enfermeiros do bloco cirrgico3 Tipo Sanguneo Sangue num indivduo de 70kg 3 gotas de sangue4 Salrio Enfermeiros no territrio brasileiro Alguns enfermeiros de cada estado5 Anos de Trabalho Total de enfermeiros do hospital enfermeiros do pronto socorro6 Nmero de Filhos Total de enfermeiros do hospital enfermeiros da pediatria

    2.2 Variveis EstatsticasQualquer atributo medido numa pesquisa: renda familiar, nmero de indivduos de uma famlia,etc.

    Variveis Qualitativas: expressam qualidade. Representadas por palavras.Exemplo: sexo (masculino ou feminino), grau de instruo (fundamental, mdio ou superior),estado civil (solteiro, casado, ...).

    10

  • 2.3. EXERCCIOS CAPTULO 2. CONCEITOS BSICOS

    Nominal: Os indivduos so classificados em categorias segundo uma caracterstica.Exemplo: hbito de fumar (fumante, no fumante), sobrepeso (sim, no).No existe ordem entre as categorias e suas representaes, se numricas, so destitudasde significado numrico.Exemplo: sexo masculino = 1, sexo feminino = 2. Os valores 1 e 2 so apenas rtulos.Exemplo: Voc tem diabetes? Sim. No. No sei.Voc fumante? Sim. No. J fui.Exemplo: Qual o seu tipo de sangue? A. B. AB. O. No sei.

    Ordinal: Os indivduos so classificados em categorias que possuem algum tipo inerentede ordem. Neste caso, uma categoria pode ser "maior"ou "menor"do que outra.Exemplo: nvel scio-econmico (A, B, C e D; onde A representa maior poder aquisi-tivo); nvel de retinol srico (alto, aceitvel, baixo, deficiente) onde alto: maior ou iguala 50,0 g/dl; aceitvel: 20,0 a 49,9 g/dl, baixo: 10,0 a 19,9 g/dl e deficiente: menorou igual a 10,0 g/dl. Estes critrios so do Commitee on Nutrition for National DefenseICNND/USA, 1963 (in Prado MS et al , 1995).

    Variveis Quantitativas: expressam quantidade. Representadas por nmeros.

    Discretas: o resultado numrico da mensurao um valor inteiro.Exemplo: nmero de refeies em um dia (nenhuma, uma, duas, trs, quatro, ...),frequncia de consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4vezes, 5 vezes, 6 vezes, 7 vezes), nmero de filhos.

    Contnuas: podem assumir qualquer valor do intervalo.Exemplo: estatura, salrio, nvel de retinol srico (g/dl), circunferncia da cintura(cm).

    Observao: incorreto fazer a simplificao "se tem nmero quantitativo", pois muitasvezes, os nmeros podem ser meros rtulos, tal como o nmero na camisa de um jogador.

    Exerccio: Preencha o quadro abaixo VQO(varivel qualitativa ordinal), VQN(varivel quali-tativa nominal), VQTD(varivel quantitativa discreta), VQTC(varivel quantitativa contnua)

    2.3 Exerccios1. Foi encomendado um estudo para avaliao de uma entidade de ensino superior. Para isso, aplicou-se

    um questionrio e obtiveram-se respostas de 110 alunos. Indique:

    (a) a varivel em estudo;(b) a populao em estudo;(c) a amostra escolhida.

    2. Os dados abaixo referem-se a medidas de prostaglandina (pg/ml) e clcio (ml/dl) em pacientes comcncer apresentando ou no hipercalcemia. Classifique as variveis envolvidas no estudo, o tamanhoamostral e as populaes de interesse.

    3. Classifique as seguintes variveis em: Quantitativas (Discretas ou Contnuas) ou Qualitativas (Nomi-nais ou Ordinais).

    (a) A cor da pele de pessoas (ex.: branca, negra, amarela). Varivel do tipo e.

    (b) O nmero de consultas mdicas feitas por ano por um associado de certo plano de sade. Variveldo tipo e .

    (c) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianas de 1 a 3 anos de idade.(Ex: 23,4 g) Varivel do tipo e .

    11

  • 2.3. EXERCCIOS CAPTULO 2. CONCEITOS BSICOS

    Tabela 2.2: Tipos de variveis

    Populao Varivel Opo para a varivel ClassificaoEnfermeiros Salrio bruto R$ 2003,52do Brasil mensal

    Odontlogos de Anos de 1,5/2/4uma clnica trabalho

    Professores do Produo 0, 1, 2, 3,...curso de Farmcia cientfica

    Funcionrios Tipo A, B, AB, Ode um hospital sanguneoEnfermeiros Insalubridade Recebe, no recebe

    de um hospitalCandidatos ao Sexo M, F

    curso de NutrioProfessores Nmero de 0, 1, 2, 3, ...UNIFRA nutricionistasProfessores Nvel de stress Alto, mdio, baixode um curso

    Tabela 2.3: Prostaglandina e clcio em pacientes com cncer.IPGE Calcium status500.00 13.30 hyper301.00 13.40 hyper254.00 10.10 nonhyper150.00 8.60 nonhyper100.00 9.70 nonhyper

    (d) O tipo de droga que os participantes de certo estudo tomaram, registrados como: Droga A,Droga B e placebo. Varivel do tipo e .

    (e) A presso intra-ocular, medida emmmHg, em pessoas. Varivel do tipo e .(f) O nmero de filhos das pacientes participantes de certo estudo. Varivel do tipo e

    .

    12

  • Captulo 3

    Apresentao Tabular e Distribuiode Frequncias

    Um dos objetivos da Estatstica sintetizar os valores que uma ou mais variveis podem assumir,para que tenhamos uma viso global da variao desta ou destas variveis. E isso ela consegue,inicialmente, apresentando esses valores em tabelas e grficos, que iro nos fornecer rpidas eseguras informaes a respeito das variveis em estudo.

    Tabela um quadro que resume um conjunto de observaes.As tabelas devem obedecer ao seguinte postulado:

    "Obter um mximo de esclarecimentos com um mnimo de espao e tempo."

    Exemplos:

    Tabela 3.1: Taxa de Colesterol (mg/dl) em 30 pacientes.248 157 124 124 215 312 254 156 132 145214 256 258 298 189 178 186 231 301 265298 178 196 152 144 185 132 289 264 256

    Tabela 3.2: Distribuio de idade dos pacientes portadores de mieloma mltiplo.Idade (anos) Frequncia Absoluta Frequncia Relativa

    10 - 19 57 18,5420 - 29 113 37,4230 - 39 57 18,8740 - 49 32 10,6250 - 59 19 6,2960 - 69 7 2,29> 70 2 0,67

    Indeterminada 13 4,3Total 302 100

    Tabela 3.3: Pacientes portadores de mieloma mltiplo.Ano do Diagnstico Sexo Total

    Masculino Feminino1998 50 44 941999 54 46 1002000 59 49 108Total 163 139 302

    13

  • CAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Uma tabela e mesmo um grfico podem ser decompostos em partes: Cabealho, Corpo e Ro-dap.

    Figura 3.1: Partes de uma tabela.

    Cabealho - O cabealho, que a apresentao do que a tabela est procurando representar,deve conter o suficiente para que sejam respondidas as seguintes questes: O QU? (referente aofato), ONDE? (relativo ao lugar), QUANDO? (correspondente ao tempo).

    Exemplo: Acidentes de trabalho ocorridos no Hospital X em 2006.O qu? - (fato): Acidentes de trabalho.Onde? - (lugar): Hospital X.Quando? - (tempo): 2006.

    Corpo - O corpo de uma tabela representado por uma srie de colunas e subcolunas, dentrodas quais so colocados os dados apurados.

    Segundo o corpo, as tabelas podem ser: de Entradas Simples, de Dupla Entrada e de MltiplaEntrada.

    Rodap - No rodap de uma tabela devemos colocar a legenda e todas as observaes que venhama esclarecer a interpretao da tabela Geralmente tambm no rodap que se coloca a fonte dosdados embora em alguns casos ela possa ser colocada tambm no cabealho. A fonte serve paradar maior autenticidade tabela.

    CONSIDERAES

    O ttulo da tabela deve indicar a natureza e a abrangncia geogrfica e/ou temporal dosdados. colocado na parte superior, precedido da palavra Tabela e de seu nmero de ordemseguido de travesso.

    As tabelas so numeradas consecutivamente e independentemente das ilustraes, em alga-rismos arbicos.

    A tabela no deve ser fechada lateralmente. No h obrigatoriedade de linha vertical entre as colunas, mas esta pode ser utilizada desdeque seja necessrio, o que ocorre quando a tabela apresenta muita informao (muitas colunase/ou muitas linhas).

    No devem ser utilizados traos horizontais separando as linhas com exceo do cabealho eda ltima linha.

    As linhas pontilhadas facilitam a leitura, mas no so obrigatrias.

    14

  • 3.1. DADOS ABSOLUTOS E DADOS RELATIVOSCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Nenhuma clula deve ficar em branco; a ausncia do dado expressa por um trao (-) e a faltade conhecimento deste (dado ignorado) expressa por trs pontos (...). Quando h dvidaquanto a um fato numrico, pode-se ainda segui-lo de um ponto de interrogao (?).

    Notas so utilizadas para clarificar os dados. As notas fornecem informaes de naturezageral, destinadas a explicitar ou a esclarecer o contedo da tabela ou a indicar a metodologiaadotada no levantamento de dados e so colocadas no rodap da tabela, abaixo da fonte,sendo listadas assim: 1, 2, 3 etc.

    A fonte da tabela deve ser citada aps a linha de fechamento da mesma. Recomenda-se acitao da fonte quando reproduzidas de outros documentos. A prvia autorizao do autorse faz necessria, no sendo mencionada na mesma. Quando os dados apresentados na tabelaforam levantados pelo autor do trabalho por meio de uma pesquisa de campo (questionrios,formulrios, entrevistas), pode-se utilizar como fonte as expresses o autor ou pesquisa decampo.

    As tabelas devem estar centralizadas em relao s margens esquerda e direita.

    3.1 Dados Absolutos e Dados RelativosOs dados estatsticos resultantes da coleta direta da fonte, sem outra manipulao seno a contagemou medida, so chamados dados absolutos. A leitura dos dados absolutos sempre enfadonha einexpressiva; embora esses dados traduzam um resultado exato e fiel, no tem a virtude de ressaltarde imediato as suas concluses numricas.

    Dados relativos so o resultado de comparaes por quociente (razes) que se estabelecementre dados absolutos e tem por finalidade realar ou facilitar as comparaes entre quantidades.Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices, coeficientes e taxas.

    Exemplo: A tabela abaixo apresenta o nmero de irmos relatados por 115 estudantes univer-sitrios da UFRGS (dados obtidos entre 1986 e 1992)

    Tabela 3.4: Quantidade de irmos de alunos da UFRGS.No de irmos Frequncia

    0 81 202 403 264 95 76 47 08 09 1

    Total

    Determine o percentual de estudantes que tm 3 irmos.

    3.2 Distribuio de Frequncias uma srie estatstica especfica, onde os dados encontram-se dispostos em classes ou categoriasjuntamente com as frequncias correspondentes. Desta forma, podemos dividir as distribuies de

    15

  • 3.2. DISTRIBUIO DE FREQUNCIASCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    frequncias em dois tipos:

    Tipo A ou Tipo I: Dados No Agrupados

    Usada para variveis qualitativas ou ento quantitativas discretas com poucos valores diferentes.

    Tabela 3.5: Nmero de mdicos na populao, pases selecionados, 1984.Pas Habitantes por MdicoChile 1.230Brasil 1.080Frana 320EUA 470

    Argentina 370

    Exemplo: nmero de cries dos alunos do 1o ano do Colgio X; quantidade de livros debioestatstica na biblioteca da UNIFRA.

    Eis um exemplo de distribuio de frequncias para varivel discreta (tipo A):

    Tabela 3.6: Nmero de cries por aluno em uma escola X da cidade (Santa Maria/2008).Nmero de Cries (Xi) Nmero de Alunos (fi)

    0 351 202 133 64 4

    5 ou mais 2Total 80

    Tipo B ou Tipo II: Dados Agrupados

    Usada para variveis quantitativas contnuas ou discretas com muitos valores diferentes. No possvel enumerar todos os valores. Geralmente esta varivel provm de medies.

    Exemplo: peso dos alunos de uma turma; presso arterial; nota de aproveitamento dos alunos.Exemplo:

    Tabela 3.7: Notas finais de 50 estudantes da disciplina de bioestatstica.22 46 9 40 57 22 22 13 50 4235 2 15 41 34 52 32 75 69 4426 42 60 56 30 3 17 79 45 370 12 62 50 45 41 59 11 66 3943 33 70 50 47 20 36 40 67 29

    Ento a distribuio de frequncia ser expressa pela tabela:Onde fi a frequncia absoluta das classes.Para explicar a colocao das notas dos alunos, segundo uma distribuio do tipo B, necessitar

    de algumas definies.Assim:

    1. Dados Brutos: Aqueles que no foram numericamente organizados, como o caso das 50notas dos alunos.

    2. Rol: o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente. Portanto,teramos:

    16

  • 3.2. DISTRIBUIO DE FREQUNCIASCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Tabela 3.8: Notas finais de estudantes da disciplina de bioestatstica.Notas fi0710 410 720 520 730 630 740 840 750 1250 760 760 770 570 780 3Total 50

    0 2 3 9 11 12 13 15 17 2022 22 22 26 29 30 32 33 34 3536 37 39 40 40 41 41 42 42 4344 45 45 46 47 50 50 50 52 5657 59 60 62 66 67 69 70 75 79

    3. Intervalo de Classe: Existem vrias maneiras de apresentarmos o intervalo de classes:iguais ou diferentes entre si. Porm, sempre que possvel, deveremos optar por intervalosiguais, o que facilitar os clculos posteriores.Mas mesmo com intervalos iguais, as distribuies podero apresentar-se da seguinte forma:0 10: compreende todos os valores entre 0 e 10, exclusive os extremos.0 `a 10: compreende todos os valores entre 0 e 10, inclusive os extremos.0 a 10: compreende todos os valores entre 0 e 10, inclusive o 10 e exclusive o 0.0 710 (ou 0 ` 10): compreende todos os valores entre 0 e 10, inclusive o 0 e exclusive o 10.Como optaremos por este ltimo tipo (0 7 10), poderemos definir como intervalo de classea diferena entre o limite superior e o limite inferior da classe. Portanto, no exemplo, 10 0= 10 o intervalo ou amplitude da classe.

    4. Amplitude Total ou "Range": a diferena entre o maior e o menor dado. Em nossocaso, a nota maior 79 a menor 0; logo, nossa amplitude total 79 0 = 79. Cumpreobservar que, quando no dispusermos dos dados, o clculo da amplitude se far levando-seem considerao a diferena entre o limite superior da ltima classe e o limite inferior daprimeira classe.

    5. Nmero de Classes (K): quantas classes sero necessrias para representar o fato? Existemvrios critrios que podem ser utilizados a fim de possuirmos uma idia do melhor nmerode classes, porm tais critrios serviro apenas como indicao e nunca como regra fixa, poiscaber sempre ao pesquisador estabelecer o melhor nmero, levando-se em conta o intervalode classe e a facilidade para os posteriores clculos numricos.

    6. Amplitude ou Intervalo de Classes (h):

    h = amplitude totalnmero de classes

    Teramos no exemplo: 797 = 12

    Dessa forma, o pesquisador, usando o bom-senso e a sua experincia, verificar que seria maisconveniente a utilizao de um intervalo de classe igual a 10 e de um nmero de classes iguala 8, para que facilite as operaes posteriores. Assim sendo:

    17

  • 3.3. EXERCCIOS NO EXCELCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Tabela 3.9: Exemplo de intervalos de classe.Classe (i) Notas (ci) Freq. (fi)

    1 0 7 10 42 10 7 20 53 20 7 30 64 30 7 40 85 40 7 50 126 50 7 60 77 60 7 70 58 70 7 80 3

    Total 50

    Observao: O nmero de classes e a amplitude so usados como base para a montagem deuma tabela. Podemos aumentar ou diminuir o nmero de classes e arredondar uma amplitudedecimal. Use o bom senso.

    7. Frequncia Relativa da ClasseCorresponde ao quociente entre a frequncia absoluta da classe e o total de elementos.

    No exemplo, a frequncia relativa da 7a classe : fr7 =550 = 0, 1 = 10%

    Resumindo, teramos:

    Tabela 3.10: Exemplo de intervalos de classe.Classe (i) Notas (ci) Freq. (fi) F.Rel.(f(ri))

    1 0 7 10 42 10 7 20 53 20 7 30 64 30 7 40 85 40 7 50 126 50 7 60 77 60 7 70 58 70 7 80 3

    Total 50

    3.3 Exerccios no Excel1. Os pesos dos 40 alunos de uma classe esto abaixo descritos:

    Tabela 3.11: Pesos de 40 alunos.69 57 72 54 93 68 72 58 64 62 65 76 60 49 7459 66 83 70 45 60 81 71 67 63 64 53 73 81 5067 68 53 75 65 58 80 60 63 53

    Construir a distribuio de frequncia simples da tabela 3.11.

    2. Organizar os dados da tabela 3.12 em uma tabela de frequncia simples e relativa.

    3. Os dados da tabela 3.13 se referem taxa de creatinina na urina de 24 horas (mg/100 ml), emuma amostra de 36 homens normais. Represente a frequncia e a frequncia relativa simples.

    4. Os dados da tabela 3.14 mostram o peso (kg) de 80 mulheres. Apresente-os em uma tabelade frequncia.

    18

  • 3.4. GRFICOS DE COLUNAS E HISTOGRAMASCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Tabela 3.12: Dados brutos.154 160 164 166 170 155 160 164 166 170 156160 164 166 171 157 161 164 167 172 158 161164 167 172 158 161 165 168 173 159 162 165168 173 159 162 165 168 174 159 162 165 169176 159 164 165 169 177

    Tabela 3.13: Nvel de creatinina na urina (24h)1,51 1,61 1,69 1,49 1,67 2,18 1,46 1,89 1,76 1,081,66 1,52 1,40 1,22 1,46 1,43 1,49 1,54 1,38 1,471,73 1,60 1,43 1,58 1,66 1,26 1,59 1,40 1,44 1,521,37 1,86 2,02 1,75 1,83 1,66

    5. Substituir por uma nica tabela o trecho do relatrio a seguir: Assim sendo, podemosconcluir que este banco, em 1995, contou com a colaborao de 345 funcionrios, distribudospelas nossas 5 agncias, a saber: Niteri, 43; Rio de Janeiro, 102; So Paulo, 98; BeloHorizonte, 75; Vitria, 27. Em Niteri, 38 eram do sexo masculino e no Rio de Janeiro,87. Apenas em Vitria no existiam funcionrias, mas em So Paulo trabalharam 11 delas,enquanto que em Belo Horizonte, apenas 3.

    6. A taxa de mortalidade infantil corresponde ao nmero mdio de mortes, dentre 1000 crianasnascidas vivas, antes de completarem um ano de vida. Os dados da tabela 3.15 representama Taxa de mortalidade infantil dos municpios da Microrregio Oeste Catarinense (1982) eforam extrados da publicao Municpios Catarinenses - Dados Bsicos, 1987, GAPLAN -SC, que utiliza dados levantados pelo IBGE.Agrupe convenientemente os dados da tabela 3.15 em classes (Distribuio de frequncias).

    3.4 Grficos de Colunas e HistogramasHistograma uma representao grfica da distribuio de frequncias, normalmente um grfico debarras verticais. um grfico composto por retngulos justapostos onde a base de cada um delescorresponde ao intervalo de classe e a sua altura respectiva frequncia.

    Exemplo: Construa o histograma da distribuio de frequncia abaixo:

    Presso arterial sistlica de 96 recm-nacidos.PAS(mmHg) f

    55 ` 59 359 ` 63 563 ` 67 4067 ` 71 2471 ` 75 1575 ` 79 879 ` 83 1

    Copie a tabela para o grid do Excel:

    19

  • 3.4. GRFICOS DE COLUNAS E HISTOGRAMASCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Tabela 3.14: Pesos de 80 mulheres.

    Tabela 3.15: Taxa de mortalidade infantil da microrregio.32,3 62,2 10,3 22,0 13,1 9,9 18,3 33,0 20,022,7 27,2 11,9 36,4 23,5 18,0 22,6 20,3 38,332,9 29,9 29,7 39,2 25,4 19,6 28,9 18,4 27,321,7 23,7 13,9 23,8 15,7 17,0 36,3

    Selecione toda a tabela e clique sobre inserir > colunas > colunas 2D (primeira opo)

    Voc vai obter o seguinte grfico de colunas:

    20

  • 3.5. A DISTRIBUIO NORMALCAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Agora basta transformar este grfico de colunas num histograma, para isto, clique com o botodireito sobre qualquer uma das colunas e selecione Formatar Sries de Dados. Na janela que seabre, defina Largura do Espaamento como 0% e clique sobre "fechar". Voc obter o histogramaabaixo.

    A construo de histogramas tem carter preliminar em qualquer estudo e um importanteindicador da distribuio de dados. Podem indicar se uma distribuio aproxima-se de uma funonormal, como pode indicar mistura de populaes quando se apresentam bimodais.

    3.5 A Distribuio NormalSuponha que voc faa um grfico das probabilidades dos nmeros de caras esperados em 15 jogadassucessivas de uma moeda (figura 3.2 ou suponha 1.000 pessoas na rua, escolhidas aleatoriamente,para cujas alturas voc faz um diagrama de frequncia (figura 3.3.

    Esses dois grficos so semelhantes. Essa curva em forma de sino, chamada curva normal, a curva mais importante da estatstica. H inmeros exemplos de grandezas que se distribuemsegundo a curva normal:

    a altura, o peso, ou o QI de uma populao; os resultados da medida de uma grandeza fsica, como o peso molecular de um compostoqumico;

    o total que aparece quando vrios dados so jogados simultaneamente; o nmero de clientes semanais em muitos negcios.

    21

  • 3.6. DISTRIBUIO DE PROBABILIDADECAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Figura 3.2: Distribuio de probabilidade.

    Figura 3.3: Histograma

    A distribuio normal se aplica frequentemente em situaes em que valores extremos so menospovveis do que valores moderados.

    3.6 Distribuio de ProbabilidadeA frequncia relativa de um valor estima a probabilidade de ocorrncia deste valor.

    Exemplo: A tabela 3.16 tem sua representao grfica dada pela figura 3.4.A frequncia relativa associada a x = 2 irmos de 0,35 na amostra estudada. Estima-se,

    ento, que 35% dos universitrios tem 2 irmos. Isto equivale a dizer que se estima em 0,35 aprobabilidade de que um universitrio, selecionado ao acaso desta populao, tenha dois irmos.No grfico de bastes, a probabilidade estimada para cada valor a altura do basto.

    Exemplo: A figura 3.5 traz o histograma da tabela 3.17.No histograma da figura 3.17, a rea do retngulo referente ao intervalo 45 7 50 corresponde

    a 14% da rea de todo o histograma (100%). Portanto, a rea deste retngulo a representaogeomtrica da probabilidade estimada de se encontrar valores entre 45 e 50 na populao.

    22

  • 3.6. DISTRIBUIO DE PROBABILIDADECAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Tabela 3.16: Nmero de irmos relatados por 115 estudantes da UFRGS entre 1986 e 1992.No de irmos f fr Fr

    0 8 0,07 0,071 20 0,17 0,242 40 0,35 0,593 26 0,23 0,824 9 0,08 0,905 7 0,06 0,966 4 0,03 0,997 0 0,00 0,998 0 0,00 0,999 1 0,01 1,00

    Figura 3.4: Grfico de colunas relativo tabela 3.16

    Tabela 3.17: Pesos (kg) de 256 alunas da UFRGS.Peso (kg) f fr40 7 45 9 0,03545 7 50 36 0,14150 7 55 78 0,30455 7 60 55 0,21560 7 65 53 0,20765 7 70 11 0,04370 7 75 7 0,02775 7 80 5 0,02080 7 85 1 0,00485 7 90 1 0,004 256 1,000

    23

  • 3.6. DISTRIBUIO DE PROBABILIDADECAPTULO 3. APRESENTAO TABULAR E DISTRIBUIO DE FREQUNCIAS

    Figura 3.5: Histograma relativo tabela 3.17

    24

  • Captulo 4

    Medidas de Posio

    4.1 IntroduoO estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos descrever, de modogeral, os grupos dos valores que uma varivel pode assumir. Dessa forma, podemos localizar amaior concentrao de valores de uma dada distribuio, isto , se ela se localiza no incio, no meioou no final, ou ainda, se h uma distribuio por igual.

    Porm, para ressaltar as tendncias caractersticas de cada distribuio, isoladamente, ou emconfronto com outras, necessitamos introduzir conceitos que se expressem atravs de nmeros, quenos permitam traduzir essas tendncias. Esses conceitos so denominados elementos tpicos dadistribuio e so as:

    a. medidas de posio;b. medidas de variabilidade ou disperso;c. medidas de assimetria;d. medidas de curtose.Dentre os elementos tpicos, destacamos, nesta unidade, as medidas de posio: estatsticas que

    representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixohorizontal (eixo das abscissas).

    As medidas de posio mais importantes so as medidas de tendncia central, que recebemtal denominao pelo fato de os dados observados tenderem, em geral, a se agrupar em tornodos valores centrais. Dentre as medidas de tendncia central, destacamos: a mdia aritmtica; amediana e a moda.

    As outras medidas de posio so as separatrizes, que englobam a prpria mediana; os quartise os percentis.

    4.2 Mdia Aritmtica (x)Existem vrios tipos de mdia (aritmtica, ponderada, geomtrica, harmnica, etc.), mas estuda-remos apenas a mdia aritmtica.

    Mdia aritmtica o quociente da diviso da soma dos valores da varivel pela quantidade deles:

    x =xin

    onde, x a mdia aritmtica, xi so os valores da varivel e n a quantidade de valores.

    Dados No-agrupados

    Quando desejamos conhecer a mdia dos dados no-agrupados, determinamos a mdia aritm-tica simples.

    25

  • 4.2. MDIA ARITMTICA (X) CAPTULO 4. MEDIDAS DE POSIO

    Exemplo: Sabendo-se que a produo leiteira diria da vaca A, durante uma semana, foi de10, 14, 13, 15, 16, 18 e 12 litros, temos, para produo mdia da semana:

    x = 10 + 14 + 13 + 15 + 16 + 18 + 127 =987 = 14

    Logo, a mdia da produo de leite foi de 14 litros por dia.s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados que ela representa.

    o que acontece quando temos os valores 2, 4, 8 e 9, para os quais a mdia 5. Esse ser o nmerorepresentativo dessa srie de valores, embora no esteja nos dados originais. Neste caso, diz-se quea mdia no tem existncia concreta.

    Exemplo: Determine a mdia dos volumes respiratrios forados em um segundo para 10adolescentes que sofrem de asma, representados na tabela 4.1:

    Tabela 4.1: Volumes respiratrios por indivduo.Indivduo FEV(litros)

    1 2,302 2,153 3,504 2,605 2,756 2,827 4,058 2,259 2,6810 3,00 =

    Resp.: 2,81 litros

    Consideremos a distribuio relativa a 34 famlias de 4 filhos, tomando para varivel o nmerode filhos do sexo masculino (tabela 4.2:

    Tabela 4.2: Nmero de filhos por famlia.Nmero de meninos fi

    0 21 62 103 124 4 = 34

    Neste caso, como as frequncias so nmeros indicadores da intensidade de cada valor da va-rivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmticaponderada, dada pela frmula:

    x =xi fifi

    Um modo prtico de obteno da mdia ponderada abrir, na tabela, uma coluna correspondenteaos produtos xi fi. Assim, temos:

    Observao: O valor mdio obtido acima de 2,3 meninos sugere, neste caso, que o maior n-mero de famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral uma leve superioridadenumrica em relao ao nmero de meninos.

    26

  • 4.2. MDIA ARITMTICA (X) CAPTULO 4. MEDIDAS DE POSIO

    Tabela 4.3: Nmero de filhos por famlia.Nmero de meninos fi xi fi

    0 21 62 103 124 4

    TOTAL 34

    Com Intervalos de Classes

    Neste caso, convencionamos que todos os valores includos em um determinado intervalo declasse coincidem com o seu ponto mdio, e determinamos a sua mdia aritmtica ponderada pormeio da frmula que j conhecemos: x =

    xififi

    , porm, agora, xi o ponto mdio de cada classe.Exemplo (tabela 4.4:

    Tabela 4.4: Altura de 40 alunos da escola X - Santa Maria - 2007.i Estaturas (cm) fi1 150 ` 154 42 154 ` 158 93 158 ` 162 114 162 ` 166 85 166 ` 170 56 170 ` 174 3

    TOTAL 40

    Primeiro vamos abrir uma coluna para os pontos mdios e outra para os produtos xi fi (tabela4.5.

    Tabela 4.5: Altura de 40 alunos da escola X - Santa Maria - 2007.i Estaturas (cm) fi xi xi fi1 150 ` 154 42 154 ` 158 93 158 ` 162 114 162 ` 166 85 166 ` 170 56 170 ` 174 3

    TOTAL 40

    Resp.: 161cmExerccio:Determine a mdia de nveis sricos de colesterol entre os homens indicados na tabela 4.6.

    Resp.: 199,34

    Vantagens e desvantagens da mdia aritmticaPor ser muito influenciada por valores extremos da srie, a mdia aritmtica no representa

    bem as distribuies em que existem valores extremos em relao aos demais, como, por exemplo,a srie cujos elementos so os seguintes: 18, 20, 22, 24 e 850 (onde a mdia aritmtica igual a186,8, resultado que foi muito influenciado pelo elemento 850).

    27

  • 4.3. MODA (MO) CAPTULO 4. MEDIDAS DE POSIO

    Tabela 4.6: Frequncia absoluta de nveis sricos de colesterol para homens de Santa Maria comidades entre 25 e 34 anos.

    Nvel de colesterol(mg/10ml) fi xi xi fi80 ` 120 13120 ` 160 150160 ` 200 442200 ` 240 299240 ` 280 115280 ` 320 34320 ` 360 9360 ` 400 5TOTAL 1067

    1) Apesar de a mdia aritmtica situar-se entre o menor e o maior resultado da distribuiode frequncias, ela no tem, necessariamente, a existncia real. Podemos obter, por exemplo, umamdia do tamanho de famlia de 4,5 pessoas, que um valor inexistente.

    2) Pode ser calculada para distribuies com classes, mas os seus resultados no so consideradosreais.

    3) Pode ser calculada diretamente usando qualquer calculadora eletrnica.4) Depende de todos os valores da distribuio.5) Evidencia bastante estabilidade de amostra para amostra, ou seja, se pesquisarmos numerosas

    amostras extradas de uma mesma populao, os valores das mdias obtidas tendem a variar pouco(pouca variabilidade com amostras da mesma populao).

    4.3 Moda (Mo)Denominamos moda o valor que ocorre com maior frequncia em uma srie de valores.

    Dados No-agrupados

    Quando lidamos com valores no-agrupados, a moda facilmente reconhecida: basta procuraro valor que mais se repete.

    28

  • 4.4. MEDIANA (MD) CAPTULO 4. MEDIDAS DE POSIO

    Exemplo: A srie de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 tem moda igual a 10.Podemos, entretanto, encontrar sries nas quais no exista valor modal, isto , nas quais nenhum

    valor aparea mais vezes que outros. o caso da srie: 3, 5, 8, 10, 12, 13, que no apresenta moda (amodal).Em outros casos, ao contrrio, pode haver dois ou mais valores de concentrao.Dizemos, ento, que a srie tem dois ou mais valores modais. Na srie: 2, 3, 4, 4, 4, 5, 6, 7, 7,

    7, 8, 9 temos duas modas: 4 e 7 (bimodal).A moda utilizada:quando desejamos obter uma medida rpida e aproximada de posio;quando a medida de posio deve ser o valor mais tpico da distribuio.

    4.4 Mediana (Md)A mediana outra medida de posio, definida como o nmero que se encontra no centro de umasrie de nmeros, estando estes dispostos segundo uma ordem (em Rol). Em outras palavras, amediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, o valor situadode tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos.

    Exemplo: Seja a seguinte srie de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9. O primeiro passo ordenar os nmeros (ordem crescente ou decrescente): 2, 5, 6, 9, 10, 13, 15, 16, 18.

    Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de elementos direitae esquerda. Em nosso exemplo, esse valor o 10, j que, h quatro elementos acima dele e quatroabaixo.

    Temos, ento: Md = 10

    Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por definio, qualquerdos nmeros compreendidos entre os dois valores centrais da srie. Convencionou-se utilizar o pontomdio. Assim, a srie de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para mediana a mdia aritmticaentre 10 e 12.

    Md =10 + 12

    2 = 11

    Verificamos que, estando ordenados os valores de uma srie e sendo n o nmero de elementosda srie, o valor mediano ser:

    o termo de ordem n+12 , se n for mpar;a mdia aritmtica dos termos de ordem n2 e

    n2 + 1 , se n for par.

    A mediana utilizada:quando desejamos obter o ponto que divide a distribuio em partes iguais;quando h valores extremos que afetam de uma maneira acentuada a mdia.

    Observao: No clculo da mdia, todos os valores da amostra so levados em conta, ao passoque no caso da mediana isto no acontece. Por esta razo, valores muito grandes ou muito pequenos,comparados aos demais valores da amostra, causam grandes variaes na mdia, o que em geralno ocorre com a mediana. Por isso, dizemos que a mediana robusta, isto , ela resistente avalores atpicos.

    4.5 Exerccios1. A tabela 4.7 lista as duraes das terapias para dez pacientes inscritos em um estudo que

    investiga os efeitos da interrupo das transfuses de sangue. Determine a mdia dessesvalores.

    Resp.: 8,6 anos

    2. Na sequncia temos a massa (peso) em gramas, de ratos da raa Wistar com 30 dias de idade.(Fonte: Vieira, S., 1980). Calcule a mdia aritmtica.

    29

  • 4.5. EXERCCIOS CAPTULO 4. MEDIDAS DE POSIO

    Tabela 4.7: Durao da terapia de transfuso para 10 pacientes com doenas falciformes.Indivduo Durao

    1 122 113 124 65 116 117 88 59 510 5

    TOTAL

    50 62 70 86 66 55 60 77 82 64 58 74

    Resp.: 67

    3. Os tempos de reao de um indivduo a determinados estmulos foram medidos por um psi-cologista como sendo 0,53; 0,46; 0,50; 0,49; 0,52; 0,53; 0,44 e 0,55 segundos, respectivamente.Determinar: os tempos mdio, modal e mediano de reao do indivduo a esses estmulos.

    Resp.: 0,50; 0,53; 0,51

    4. Calcule a mdia dos nmeros de dentes perdidos ou danificados em uma amostra de 50 pessoastratadas em determinada clnica dentria (Tabela 4.8) (Fonte: Callegari- Jacques, S. 2003).

    Tabela 4.8: Dentes perdidos ou danificados.Nmero de dentes (x) Nmero de pessoas (fi) x fi

    0 91 52 63 74 95 56 47 38 2

    TOTAL 50

    Resp.: 3,2 dentes

    5. Calcule o nmero mdio de dentes cariados, para cada sexo, a partir dos dados apresentadosna tabela 4.9:

    6. Quinze indivduos foram sujeitos recolha de urina em dois momentos, antes da toma de umdiurtico e aps a tomada desse diurtico, tendo-se obtido os valores em litros/dia mostradosna tabela 4.10:a) Determine as medidas de localizao central da urina sem diurtico.

    Resp.: x = 1, 25; Md = 1, 2 e Mo = 1, 2.b) Determine as medidas de tendncia central da urina com diurtico.

    Resp.: x = 1, 41; Md = 1, 4 e Mo = 1, 4.

    30

  • 4.5. EXERCCIOS CAPTULO 4. MEDIDAS DE POSIO

    Tabela 4.9: Nmero de dentes cariados das pessoas tratadas em uma clnica dentria SantaMaria/RS.

    Nmero de Sexodentes cariados Masculino Feminino

    0 16 141 2 62 3 73 2 84 2 5

    Total 163 139

    Tabela 4.10: Coleta de urina.Indiv. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Sem 1,2 1,2 1,2 1,2 1,1 1,3 1,8 1,2 1,1 1,4 1,1 1,3 1,1 1,2 1,3Com 1,4 1,3 1,5 1,4 1,3 1,6 2,1 1,4 1,3 1,5 1,2 1,4 1,2 1,2 1,3

    7. Durante uma epidemia de escarlatina, recolheu-se um certo nmero de mortos, em 40 cidadesde um pas, obtendo-se os dados da tabela 4.11.(DIAZ e LOPEZ, 2007)a) Calcule as medidas de posio central. Resp.: x = 1, 98; Md = 2 e Mo = 1.b) Calcule a porcentagem de cidades com pelo menos dois mortos. Resp.: 55%c) Calcule a porcentagem de cidades com no mximo 2 mortos. Resp.: 70%d) Calcule a porcentagem de cidades com no mnimo 3 mortos. Resp.: 30%

    8. A tabela 4.12 mostra a composio por idade e sexo de um grupo de trabalhadores, comtuberculose pulmonar, numa determinada cidade.Pede-se:Qual a mdia de idade dos trabalhadores do sexo masculino e feminino com tuberculosepulmonar.

    Resp.: F: 30,38 anos; M: 32,23 anos

    31

  • 4.5. EXERCCIOS CAPTULO 4. MEDIDAS DE POSIO

    Tabela 4.11: Quantidade de mortos devido escarlatina.Mortos(nmero) 0 1 2 3 4 5 6 7

    Cidades 7 11 10 7 1 2 1 1

    Tabela 4.12: Distribuio da tuberculose por sexo.Idade(anos) Homem Mulher Total

    14 ` 19 2 2 419 ` 24 10 5 1524 ` 29 33 9 4229 ` 34 45 12 5734 ` 39 39 8 4739 ` 44 21 4 25Total

    32

  • Captulo 5

    Separatrizes

    Como vimos, a mediana separa uma srie de valores em dois grupos que apresentam a mesmaquantidade de elementos.

    Assim, alm das medidas de posio que estudamos, h outras que, consideradas individual-mente, no so medidas de tendncia central, j que se baseiam em sua posio na srie. Essasmedidas os quartis, os percentis e os decis so, juntamente com a mediana, conhecidas pelonome genrico de separatrizes.

    5.1 QuartisDenominamos quartis os valores de uma srie que a dividem em quatro partes iguais. H, portanto,trs quartis:

    a) O primeiro quartil (Q1): valor situado de tal modo na srie que uma quarta parte (25%) dosdados menor que ele e as trs quartas partes restantes (75%) so maiores.

    b) O segundo quartil (Q2): evidentemente, coincide com a mediana (Q2 = Md).c) O terceiro quartil (Q3) valor situado de tal modo que as trs quartas partes (75%) dos

    termos so menores que ele e uma quarta parte (25%) maior.

    5.2 PercentisDenominamos percentis os noventa e nove valores que separam uma srie em 100 partes iguais.Indicamos por P1, P2, P3, , P32, , P99.

    P50 = Md , P25 = Q1 e P75 = Q3

    5.3 Exerccios1. Com o objetivo de estudar a eficcia de um regime alimentar para tratamento de diabetes

    foram recolhidas 12 amostras de sangue em diabticos e analisada a quantidade de acar.Obtiveram-se os resultados mostrados na tabela ?? :

    33

  • 5.3. EXERCCIOS CAPTULO 5. SEPARATRIZES

    Tabela 5.1: Glicose de amostras sanguneas (mg/100ml)187.45 187.57 187.37 187.49 187.58 187.37187.46 187.62 187.47 187.53 187.39 187.46

    a) Determine a mdia, moda e mediana. Resp.: x = 187.48 ; Mo = 187.37; Md = 187.465b) Determine os quartis Q1 e Q3. Resp.: Q1 = 187.39 ; Q3 = 187.53

    2. Os dados referentes ao nmero de dentes cariados, perdidos ou obturados em uma amostrade 20 pessoas tratadas em uma determinada clnica dentria esto apresentados na tabela5.2. Considerando dados brutos, pede-se:

    Tabela 5.2: Dentes cariados, perdidos ou obturados.6 4 1 0 2 3 0 5 0 44 6 0 1 3 5 8 3 2 7

    Primeiro quartil, terceiro quartil e nonagsimo percentil. Interprete os resultados.Resp.: Q1 = 1 (25% do total tem 0 ou 1 crie); 3 104 = 15 (15o elemento) Q3 = 3;

    90 20100 = 18 (18o elemento) P90 = 63. Um laboratrio resolveu divulgar, alm do valor da dosagem , a ordem do percentil para

    pessoas sadias a ela associada. Interprete os seguintes resultados de uma pessoa que fezexames neste laboratrio:Albumina 5,3 g/dl percentil 95.Colesterol 180 mg/dl percentil 5.

    4. Considerando 12 observaes (ordenadas) do tempo de internao (dias) de acidentados notrabalho, em um certo hospital: 1, 4, 7, 9, 10, 13, 15, 17, 17, 18, 19, 21. Obtenha os quartise interprete estes valores.

    34

  • Captulo 6

    Medidas de Disperso

    6.1 Disperso ou VariabilidadeVimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por meiode procedimentos matemticos, em poucos valores representativos mdia aritmtica, medianae moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento doconjunto.

    No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j convenien-temente simplificados, necessrio ter-se uma idia retrospectiva de como se apresentavam essesmesmos dados nas tabelas.

    Assim, no o bastante dar uma das medidas de posio para caracterizar perfeitamente umconjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura mdia de duas cidades a mesma, e igual a 24C, ainda assim somos levados a pensar a respeito do clima dessas cidades.Em uma delas poder a temperatura variar entre limites de muito calor e de muito frio e haver,ainda, uma temperatura mdia de 24C. A outra poder ter uma variao pequena de temperaturae possuir, portanto, no que se refere temperatura, um clima mais favorvel.

    Vemos, ento, que a mdia ainda que considerada como um nmero que tem a faculdade derepresentar uma srie de valores no pode, por si mesma, destacar o grau de homogeneidade ouheterogeneidade que existe entre os valores que compem o conjunto.

    Exemplo: Consideremos os seguintes conjuntos de valores das variveis x, y e z:X: 70, 70, 70, 70, 70.Y: 68, 69, 70, 71, 72.Z: 5, 15, 50, 120, 160.Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:

    X = 3505 = 70 , Y =3505 = 70 e Z =

    3505 = 70.

    Vemos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70.Entretanto, fcil notar que o conjunto X mais homognea que os conjuntos Y e Z, j que

    todos os valores so iguais mdia.O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao

    entre cada um de seus valores e a mdia representativa.Chamando de disperso ou variabilidade a maior ou menor diversificao dos valores de uma

    varivel em torno de um valor de tendncia central tomado como ponto de comparao, podemosdizer que o conjunto X apresenta disperso ou variabilidade nula e que o conjunto Y apresenta umadisperso ou variabilidade menor que o conjunto Z.

    Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor disper-so ou variabilidade entre esses valores e a sua medida de posio, a Estatstica recorre s medidasde disperso ou de variabilidade.

    Dessas medidas, estudaremos a amplitude total, a varincia, o desvio padro e o coeficiente devariao.

    35

  • 6.2. VARINCIA E DESVIO PADRO CAPTULO 6. MEDIDAS DE DISPERSO

    Exemplo: Consideremos quatro grupos de alunos cujas notas so:Grupo A 7, 5, 6, 9 e 8;Grupo B 9, 10, 4, 1, 8 e 10;Grupo C 5, 7, 7, 7,7, 7, 7, 7, 7 e 9;Grupo D 7, 7, 7 e 7.Com base na amplitude ou intervalo total, qual o mais homogneo?Resp.: Grupo B, Grupos A e C (empatados) e Grupo D.Comentrio: Vimos acima que os grupos A e C so considerados igualmente homogneos por

    terem o mesmo intervalo total. No entanto, um simples exame visual das notas respectivas nos levaa concluir que certamente o grupo C o mais homogneo, uma vez que d para perceber que osseus elementos esto mais prximos entre si que os elementos do grupo A.

    O que de fato ocorre que, infelizmente, o intervalo total no uma medida capaz de quantificarde modo eficiente a disperso de uma srie, uma vez que no seu clculo interferem apenas oselementos extremos (mximo e mnimo) da srie, no avaliando o comportamento dos demaiselementos. Utilizamos, assim, o intervalo total apenas para ter uma primeira informao sobre adisperso da srie, visando quase que somente a identificar o campo de variao dos seus elementos.

    6.2 Varincia e Desvio PadroComo vimos, a amplitude total instvel, por se deixar influenciar pelos valores extremos, que so,na sua maioria, devidos ao acaso.

    A varincia e o desvio padro so medidas que fogem a essa falha, pois levam em consideraoa totalidade dos valores da varivel em estudo, o que faz delas ndices de variabilidade bastanteestveis e, por isso mesmo, os mais geralmente empregados.

    A varincia baseia-se nos desvios em torno da mdia aritmtica, porm determinando a mdiaaritmtica dos quadrados dos desvios. Assim, representando a varincia por S2, temos:

    S2 = (xi x)2

    fi

    Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidadequadrada em relao varivel em questo, o que, sob o ponto de vista prtico, um inconveniente.

    Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretaes prticas,denominada desvio padro, definida como a raiz quadrada da varincia e representada por s. Assim:

    S =S2

    Observaes: Tanto o desvio padro como a varincia so usados como medidas de dispersoou variabilidade. O uso de uma ou de outra depender da finalidade que se tenha em vista.

    A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extre-mamente importante na inferncia estatstica e em combinaes de amostras.

    6.3 Exerccios1. Quatorze indivduos que deram entrada no servio de urgncia de um Hospital apresentavam

    as seguintes presses arteriais sistlicas:Ind. 1 2 3 4 5 6 7 8 9 10 11 12 13 14PAS 115 125 128 135 126 124 112 125 127 133 119 127 121 120

    a) Determine as medidas de tendncia central da PAS e comente os resultados.Resp.: x = 124, 07, Me = 125, Mo = 125e127

    b) Determine o desvio padro. Resp.: 6,08c) Determine os quartis. Resp.: Q1 = 120 Q2 = 125 Q3 = 127

    36

  • 6.4. COEFICIENTE DE VARIAO CAPTULO 6. MEDIDAS DE DISPERSO

    2. Foram analisados os nveis de concentrao de albumina em dez adultos tendo-se obtido osseguintes resultados (g/l):

    Indivduo 1 2 3 4 5 6 7 8 9 10Albumina 19,7 19,9 20,9 20,7 20,9 20,8 20,9 21 19,5 19,4

    a) Determine as medidas de localizao de tendncia central que conhece.Resp.: x = 20, 37 Me = 20, 75 Mo = 20, 9

    b) Determine o desvio padro. Resp.: 0,62

    6.4 Coeficiente de VariaoO desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de duas unidadespode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se amdia for igual a 20, o mesmo no pode ser dito.

    Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seuemprego quando desejamos comparar duas ou mais sries de valores, relativamente sua dispersoou variabilidade, quando expressas em unidades diferentes.

    Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidadedos dados em termos relativos a seu valor mdio, medida essa denominada coeficiente de variao(CV).

    CV = Sx 100

    Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupode indivduos:

    x SEstaturas 175 cm 5 cmPesos 68 kg 2 kg

    CVE =5

    175 100 = 2, 85% CVP =268 100 = 2, 94%

    Conclui-se que neste grupo de indivduos, os pesos apresentam maior grau de disperso que asestaturas.

    Exemplo: Admitamos, por exemplo, ser do nosso interesse comparar entre si, tendo em vistaa homogeneidade, as sries relacionadas a seguir, juntamente com suas mdias aritmticas e seusdesvios padres:

    Srie Mdia Aritmtica Desvio PadroA(t) 80,8 t 10,0 t cmB(cm) 450,0 cm 10,0 cmC(oC) 32,6 oC 4,2 oCD(oC) 30,0 oC 2,6 oCE(oC) 8200,0 t 700,0 t

    Vamos calcular o coeficiente de variao para cada uma das sries do exemplo acima:

    srie A: V = 100 X 10,0/80,8 = 12,4% srie D: V = 100 X 2,6/30,0 = 8,7% srie B : V = 100 X 10,0/450,0 = 2,2% srie E: V = 100 X 700,0/8 200,0 = 8,5 srie C : V = 100 X 4,2/32,6 = 12,9%

    37

  • 6.5. EXERCCIOS CAPTULO 6. MEDIDAS DE DISPERSO

    Podemos, assim, por possuir o menor coeficiente de variao, afirmar que: a srie B mais homognea que a srie A; a srie D mais homognea que a srie C; a srie E mais homognea que a srie A.Listando as sries em questo, em ordem crescente de homogeneidade ou decrescente de dis-

    perso, quantificada pela medida mais conveniente no caso, que o coeficiente de variao, temos:srie C, srie A, srie D, srie E e srie B.

    Conforme acabamos de ver, alm de ter o seu uso recomendado para a anlise da disperso desries heterogneas (unidades de medidas diferentes: metros, toneladas, litros etc.), o coeficientede variao serve ainda para compararmos sries que apresentam ordens de grandeza diferenciadasdos seus elementos (unidades, dezenas etc.). Como desvantagens, podemos citar a impossibilidadede usarmos o coeficiente de variao para sries com mdias aritmticas nulas e sua inconveninciade uso (como toda percentagem que se preza) no caso de termos sries com mdias aritmticasmuito pequenas (ou prximas de zero) que, ao sofrerem uma reduzida alterao, normalmenteprovocam grandes variaes no coeficiente de variao.

    6.5 Exerccios1. Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o

    desvio padro, 0,80. Em Estatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro,0,76. Em que disciplina foi maior a disperso? Resp.: Estatstica

    2. Medidas as estaturas de 1.017 indivduos, obtivemos x = 162,2 cm e S = 8,01 cm. O pesomdio desses mesmos indivduos 52 kg, com um desvio padro de 2,3 kg. Esses indivduosapresentam maior variabilidade em estatura ou em peso? Resp.: Estatura

    3. Um grupo de 85 moas tem estatura mdia de 160,6 cm, com um desvio padro igual a 5,97cm. Outro grupo de 125 moas tem uma estatura mdia de 161,9 cm, sendo o desvio padroigual a 6,01 cm. Qual o coeficiente de variao de cada um dos grupos? Qual o grupo maishomogneo?

    Resp.: 3,72 e 3,71, respectivamente; o segundo grupo

    4. Um estudo foi realizado por um professor em trs turmas, obtendo a mdia e o desvio pa-dro das notas de sua disciplina, conforme abaixo. Qual a turma com menor variabilidade?Justifique adequadamente.

    Turma A B CMdia 6,5 8,0 cm 8,0

    Desvio Padro 2,2 cm 1,7 2,0

    Resp.: Turma B

    5. So fornecidos valores de nvel de triglicrides (mg/dL) de 9 pessoas:

    166 158 202 162 135 82 150 86 121

    Calcule, apresentando o desenvolvimento da frmula:a) o nvel mdio de triglicrides; Resp.: 140,22b) o nvel mediano de triglicrides; Resp.: 150c) o desvio padro do nvel de triglicrides; Resp.: 36,66d) o coeficiente de variao do nvel de triglicrides. Resp.: 26,14%

    38

  • 6.5. EXERCCIOS CAPTULO 6. MEDIDAS DE DISPERSO

    6. Considere as seguintes medidas descritivas das notas finais dos alunos de trs turmas deBioestatstica. Com base nesses dados, considere as seguintes afirmativas:

    Turma N. alunos Mdia Desvio PadroA 15 6 1,31B 15 6 3,51C 14 6 2,61

    1. Apesar de as mdias serem iguais nas trs turmas, as notas dos alunos da turma B foramas que se apresentaram mais heterogneas.2. As trs turmas tiveram a mesma mdia, mas com variao diferente.3. As notas da turma A se apresentaram mais dispersas em torno da mdia.Assinale a alternativa correta:a) Somente a afirmativa 3 verdadeira.b) Somente a afirmativa 2 verdadeira.c) Somente as afirmativas 2 e 3 so verdadeiras.d) Somente as afirmativas 1 e 2 so verdadeiras.e) Somente as afirmativas 1 e 3 so verdadeiras.

    Resp.: d

    39

  • Captulo 7

    Outros Grficos

    7.1 Grfico de PizzaUm grfico de setores (pizza) apresenta uma circunferncia onde as "fatias"tm tamanhos propor-cionais s frequncias da distribuio considerada.

    Para o exemplo da presso arterial visto acima, criamos um grfico de pizza selecionando: inserir> pizza > pizza 2D (primeira opo), obtendo a figura abaixo:

    40

  • 7.2. BOX PLOTS CAPTULO 7. OUTROS GRFICOS

    7.2 Box PlotsO boxplot (grfico de caixa) um grfico utilizado para avaliar a distribuio do dados. O boxplot formado pelo primeiro e terceiro quartil e pela mediana.

    As linhas que se projetam para fora da caixa em ambos os lados estendem-se para valoresadjacentes do grfico. Os valores adjacentes so as observaes mais extremas no conjunto dedados que no esto a mais de 1,5 vez a altura da caixa alm dos quartis. Todos os pontos fora dointervalo dos dados adjacentes so repesentados por crculos. Essas observaes so consideradasfora do padro e so chamadas de valores extremos.

    Exemplo: A tabela abaixo categoriza 10614 visitas ao consultrio de especialistas de doenascardiovasculares por durao de cada visita. Uma durao de 0 minuto implica que o paciente noteve contato direto com o especialista.

    Durao Visitas(min) (milhares)0 390

    1 a 5 2276 a 10 102311 a 15 339016 a 30 443131 a 60 968

    mais de 61 185

    No Bioestat:

    Grficos > Box-Plot: mediana e quartis

    Obs: O Bioestat no mostra os valores extremos para o grfico Box-Plot: mediana e quartis.Para saber quais so os valores mostrados no grfico preciso fazer a estatstica descritiva:

    Estatsticas > Estatstica Descritiva

    41

  • 7.3. TRABALHO 02 CAPTULO 7. OUTROS GRFICOS

    7.3 Trabalho 02Instrues:

    As questes devero ser respondidas no Excel; Cada planilha deve conter uma questo. O nome da planilha deve indicar o nmero daquesto, por exemplo: Questo 1.

    As perguntas e os comentrios das respostas devem estar em caixas de texto dentro da res-pectiva planilha.

    O nome do arquivo deve conter o seu nome e o nome do curso, por exemplo: RodrigoMate-matica;

    O arquivo deve ser enviado para o e-mail [email protected] O assunto do email ser Trabalho 02. Utilize o seu email da Unifra (acesse-o atravs do Alunonet).

    1. Os dados abaixo representam as alturas de 60 indivduos. Calcule a estatstica descritiva(mdia, mediana, desvio padro, Q1, Q3 e o coeficiente de variao).

    159 159 159 160 160 160 161 161 162 162 162 163 163 163 164164 164 165 165 165 166 166 166 167 167 167 168 168 169 169169 170 170 170 171 171 171 172 172 172 173 173 173 174 174174 175 175 176 176 176 177 177 177 178 178 178 179 179 179

    Responda:

    42

  • 7.3. TRABALHO 02 CAPTULO 7. OUTROS GRFICOS

    (a) Por que o CV deu um resultado to baixo?(b) Explique o valor da mediana?(c) Explique o valor do Q3?(d) Construa um histograma para esta distribuio no Excel e responda se uma distribuio

    normal ou no.

    2. As amostras de exames bioqumicos de sangue de 3 diferentes laboratrios apresentaram osnveis de creatinina mostrados no quadro:

    Exame 1 2 3 4 5 6 7Laboratrio A 0,6 0,4 0,5 0,8 0,2 0,8 -Laboratrio B 0,7 0,8 0,6 0,9 0,5 1,1 0,3Laboratrio C 0,6 0,7 2,0 0,5 0,8 0,9 0,9

    a) Calcule a mdia das creatininas de cada um dos laboratrios.b) Qual dos 3 laboratrios teve a menor disperso? Qual das medidas estatsticas explica atua resposta?

    43

  • Parte I

    Teoria da Amostragemcom Bioestat

    44

  • Captulo 8

    Amostragem

    De uma forma geral, as populaes ou universos nos quais o pesquisador est interessado sograndes demais para serem estudados na sua totalidade. O tempo necessrio para estudar toda apopulao, as despesas e o nmero de pessoas envolvidas so de tal monta que tornam o estudoproibitivo. Por isso, o mais comum se estudarem amostras retiradas da populao de interesse.

    Para que os resultados obtidos em uma amostra possam ser generalizados para a populao, isto, para que se possam realizar inferncias vlidas, a amostra deve ser representativa da populao.A melhor maneira de se obter uma amostra representativa empregar um procedimento aleatriopara a seleo dos indivduos.

    Uma vantagem de se usarem amostras aleatrias que, para este tipo de amostras, existeminmeros mtodos estatsticos que podero auxiliar o pesquisador. Alm disto, tal tipo de amostra-gem no d oportunidade ao pesquisador de escolher, mesmo de forma inconsciente, uma amostraque favorea a hiptese que ele gostaria de ver confirmada.

    8.1 Amostragem vs CensoQuando estudamos todos os elementos de uma populao, estamos realizando o que denominamoscenso. O IBGE, por exemplo, realiza periodicamente (de dez em dez anos) o censo relativo ainmeras caractersticas do Brasil; obtm dados a respeito da sade, ensino, habitao, produovegetal e animal, prestao de servios, etc., em todo o territrio nacional, pesquisando todos oselementos da populao.

    O censo, porm, nem sempre pode ou deve ser utilizado, devido impossibilidade de estudar apopulao, por apresentar pouca preciso e em razo de seu custo econmico.

    Custo ReduzidoSendo os dados obtidos apenas de uma frao da populao, as despesas so menores do que as

    oriundas de um censo. Tratando-se de grandes populaes, pode-se obter resultados suficientementeprecisos, para serem teis, de amostras que representam apenas uma pequena frao da populao.Segundo COCHRAN (1977), nos Estados Unidos, os mais importantes levantamentos peridicos,realizados pelo governo, usavam amostras de cerca de 100.000 pessoas, ou, aproximadamente umapessoa em cada 1800.

    Maior RapidezOs dados podem ser apurados e sintetizados mais rapidamente em uma amostragem do que

    em uma contagem completa. Este um fator primordial, quando se necessita urgentemente dasinformaes. O objetivo de uma investigao o de conhecer a situao de um determinadofenmeno, no momento da coleta da informao, para que de acordo com a informao obtida, sepossam tomar as medidas possveis para resolver algum problema. Se o resultado dessa pesquisafor conhecido muito tempo depois, bem possvel que a situao que se pretendia resolver, sejanesse momento, completamente diferente da que existia no momento da coleta dos dados.

    45

  • 8.1. AMOSTRAGEM VS CENSO CAPTULO 8. AMOSTRAGEM

    Maior Amplitude e FlexibilidadeEm certos tipos de investigao, tem-se que utilizar pessoal bem treinado e equipamento alta-

    mente especializado, cuja disponibilidade limitada para a obteno de dados. O censo completotorna-se impraticvel e resta a escolha entre obter as informaes por meio de uma amostra, ouno consegui-las de todo. Dessa forma, os levantamentos que se fundamentam na amostragem temmaior amplitude e flexibilidade.

    Maior ExatidoEm virtude de se poder empregar pessoal de melhor qualidade e intensivamente treinado, e

    por se tornar exeqvel a superviso mais cuidadosa do campo de trabalho e do processamentode dados, dada a reduo no volume de trabalho, portanto, uma amostragem pode, na realidade,proporcionar resultados mais exatos que o censo.

    No Destruio da PopulaoPode ser impraticvel investigar toda a populao em determinados procedimentos de controle

    de qualidade. Por exemplo, se quisermos verificar a qualidade de uma marca de fsforos, necessi-taremos risc-los a fim de verificar o seu funcionamento. Se inspecionarmos toda a populao defsforos, riscando-os, acabaremos com a populao, pois o processo de aferio da qualidade dofsforo o destri. Novamente, o estudo da populao torna-se impraticvel.

    Representatividade da AmostraPara que as concluses da teoria de amostragem sejam vlidas, as amostras devem ser escolhidas

    de modo a serem representativas da populao. Isso significa que a amostra deve possuir as mesmascaractersticas bsicas da populao, no que diz respeito a (s) varivel (eis) que desejamos estudar.Um plano de amostragem deve ser formulado para garantir a representatividade.

    Alguns procedimentos bsicos para a obteno de amostras aleatrias so apresentados a seguir:

    46

  • 8.2. AMOSTRAGEM PROBABILSTICA CAPTULO 8. AMOSTRAGEM

    8.2 Amostragem ProbabilsticaNote-se bem que o termo probabilstico se aplica a amostra escolhida de forma aleatria. Porenvolver o sorteio, a seleo independe do pesquisador e elimina-se a possvel tendenciosidade domesmo. As amostragens probabilsticas geram amostras probabilsticas e os resultados podem serprojetveis para a populao total

    8.3 Amostragem Aleatria SimplesUma amostra aleatria simples aquela obtida de tal modo que todos os indivduos da populaotm igual probabilidade de serem selecionados.

    Para se obter uma amostra aleatria simples, atribui-se, inicialmente, um nmero a cada ele-mento da populao. A seguir, por meio de um dispositivo aleatrio qualquer (sorteio), seleciona-sea quantidade desejada de indivduos. Um procedimento aleatrio a ser utilizado pode ser colocarem uma urna todos os nmeros que sero submetidos ao sorteio, retirando depois alguns s cegas.Pode-se ainda usar os nmeros de loteria sorteados nos ltimos anos, ou uma tabela de nmerosaleatrios, ou ainda programas de computador para selecionar aleatoriamente os componentes daamostra.

    Um ponto importante a salientar que, usando este procedimento, nenhum indivduo, por teresta ou aquela caracterstica, ter oportunidade maior de ser escolhido, pois a escolha independeda vontade do selecionador da amostra.

    Podemos realizar uma amostragem aleatria simples atravs do programa Bioestat, vejamos umexemplo:

    Exemplo: Um hospital precisa selecionar uma amostra contendo 5 de seus enfermeiros. Osnomes de todos os enfermeiros do hospital mostrada a seguir:

    Populao: Lista dos enfermeiros do hospital.Aristteles Anastcia Arnaldo Bartolomeu Bernardino Cardoso CarlitoCludio Ermlio Erclio Ernestino Endevaldo Francisco FelcioFabrcio Geraldo Gabriel Getlio Hiraldo Joo JoanaJoaquim Jos Josefina Mauro Paula Paulo

    Primeiro precisamos associar cada elemento da populao a um nmero. Por simplicidade,consideraremos nmeros inteiros sucessivos, com a mesma quantidade de algarismos, iniciando-sepor 1 (um).

    Numerao dos elementos da populao:

    Populao: Lista dos enfermeiros do hospital.01.Aristteles 02.Anastcia 03.Arnaldo 04.Bartolomeu 05.Bernardino 06.Cardoso07.Carlito 08.Cludio 09.Ermlio 10.Erclio 11.Ernestino 12.Endevaldo13.Francisco 14.Felcio 15.Fabrcio 16.Geraldo 17.Gabriel 18.Getlio19.Hiraldo 20.Joo 21.Joana 22.Joaquim 23.Jos 24.Josefina25.Mauro 26.Paula 27.Paulo

    Para extrairmos uma amostra aleatria simples de tamanho n = 5, precisamos sortear 5 nmerosdentre os N = 27 disponveis.

    No Bioestat: Estatsticas > Amostragem > Aleatria > Sem ReposioCom isto obtemos a janela abaixo, onde inserimos os valores N = 27 e n = 5:

    47

  • 8.4. AMOSTRAGEM ALEATRIA ESTRATIFICADA CAPTULO 8. AMOSTRAGEM

    Em seguida, clicamos em "Executar"e teremos uma janela semelhante a esta:

    Os nmeros sorteados pelo Bioestat foram: 1-2-10-11-24Estes nmeros correspondem aos enfermeiros: Aristteles - Anastcia - Erclio - Ernestino -

    Josefina, que so os 5 enfermeiros que iro compor a amostra.

    8.4 Amostragem Aleatria Estratificadas vezes, a populao constituda de subpopulaes ou estratos e pode ser razovel supor quea varivel de interesse apresenta comportamento diferente em cada estrato. Neste caso, para queuma amostra seja representativa, ela deve apresentar a mesma estratificao do universo de origem.Para garantir que o procedimento aleatrio produza uma amostra estratificada adequada, devemos:

    1. Verificar quais os estratos presentes na populao.

    2. Calcular seus tamanhos relativos (propores).

    3. Determinar o tamanho dos estratos na amostra, observando estas mesmas propores.

    4. Obter aleatoriamente os elementos para cada estrato, ou sorteando dentro de cada estrato,ou sorteando dentro da populao e preenchendo os espaos reservados para cada estrato.

    Exemplo: Deseja-se avaliar o nmero mdio de