bioestatistica_i

Upload: vanderlan-sousa

Post on 07-Apr-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/6/2019 bioestatistica_I

    1/50

    BIOESTATSTICA I

    Departamento de Bioestatstica

    Profa Ldia Raquel de Carvalho

    Prof. Luciano Barbosa

    UNESP - BOTUCATU

  • 8/6/2019 bioestatistica_I

    2/50

    1

    1 - Populao e Amostra

    Populao o conjunto de indivduos ou objetos ou que tm pelo menosuma varivel comum observvel.

    Ex: Conjunto de pacientes de um hospital

    Conjunto de alunos da UNESPConjunto de animaisConjunto de rvores

    Amostra qualquer subconjunto da populao.

    Varivel qualquer quantidade ou caracterstica que pode assumirdiferentes valores numricos.

    Nveis de mensurao

    Ao realizarmos um levantamento de dados necessrio saber o nvelde mensurao das informaes a serem levantadas, da a necessidade dese conhecer as escalas de medida.

    1) Escala Nominal

    Quando classes ou smbolos so usados para identificar os grupos aque vrios objetos pertencem, essas classes ou smbolos, no ordenados,constituem uma escala nominal. Por exemplo, ao classificarmos um indivduo

    numa populao de acordo com uma caracterstica como, por exemplo, sexo,ou cor dos olhos, ou estado civil, estamos usando uma escala nominal. Nestecaso as categorias se expressam nominalmente e devem ser exaustivas (nosentido de que dem conta de todos os indivduos da populao) emutuamente exclusivas (no sentido de que um mesmo indivduo da populaono possa possuir simultaneamente duas categorias).

    2) Escala Ordinal

    Quando, alm de classificar as unidades de acordo com as classes, amensurao permite ordenar essas classes relativamente ao grau de

    classificao da varivel, atinge-se o nvel seguinte de mensuraodenominado de escala ordinal.Por exemplo, quando se fala em estgios de uma doena: primrio,

    moderado, avanado; h uma certa ordem de gravidade, porm essaordenao no fornece informao sobre a magnitude das diferenas entre oselementos da escala. Neste caso a escala ordinal. Um outro exemplo seria onvel de escolaridade.

  • 8/6/2019 bioestatistica_I

    3/50

    2

    3) Escala de Razes

    A escala de mensurao mais elevada, com origem (zero) no arbitrriae onde possvel a realizao de todas as operaes aritmticas denominada de escala de razes. A razo entre dois valores quaisquer daescala independente da unidade de mensurao. Por exemplo, um indivduoque tem 40 anos tem o dobro da idade do que tem 20 anos.

    comum denominar varivel qualitativa s caractersticas medidas emescala nominal ou ordinal e varivel quantitativa referindo-se s caractersticasmedidas em escalas intervalar ou da razo.

    A varivel quantitativa pode ser contnua ou discreta. Quando a varivelpuder assumir qualquer valor numrico num determinado intervalo de variaoela ser uma varivel contnua. Como exemplo temos as medies de peso,altura, dosagem de hemoglobina no sangue, taxa de glicose, etc. Por outrolado, a varivel quantitativa discreta s poder assumir valores pertencentes aum conjunto enumervel. Ex: Nmero de filhos por casal, nmero deradiografias tiradas no setor de radiologia de um hospital, nmero de leitos,etc.

  • 8/6/2019 bioestatistica_I

    4/50

    3

    2 - ESTATSTICA DESCRITIVA

    2.1 - Apresentao Tabular dos Dados

    As informaes obtidas baseadas nos elementos que constituem apopulao ou a amostra so denominadas tecnicamente de dados.

    Os dados relativos a indivduos podem ser coletados tanto diretamentepelo pesquisador, como atravs de declaraes feitas pelos prpriosindivduos. Para se obter essas informaes o pesquisador pode fazerquestionrios com perguntas para serem respondidas por escrito, ou fazerentrevistas. Assim, por exemplo, os dados a respeito do estado de sade deum indivduo podem ser obtidos tanto mediante exame fsico como atravs dedeclaraes prestadas pelo prprio indivduo (anamnese).

    Um mesmo elemento pode fornecer diversos dados. Assim, por

    exemplo, os pacientes de uma clnica fornecem dados relativos a sexo, idade,profisso, etc., alm de dados relativos ao diagnstico e ao tratamento.Depois de se fazer levantamento de dados, isto , aps a operao de

    coleta do material bsico para descrio e posterior anlise dascaractersticas de uma populao, h necessidade de os dados e osresultados obtidos serem dispostos de uma forma ordenada e resumida, a fimde auxiliar o pesquisador na anlise dos mesmos. Os dados e os resultadospodem ser apresentados na forma de tabelas. Existem normas nacionais paraa apresentao de tabelas.

    Uma tabela possui elementos essenciais e complementares. Oselementos essenciais so: o ttulo, o corpo, o cabealho e a coluna indicadora.

    O ttulo deve preceder a tabela e designar a natureza do fato estudado,as variveis escolhidas na anlise do fato, o local e a poca em que o mesmofoi observado.

    O corpo formado pelo conjunto de linhas e colunas onde os dadosesto colocados.

    O cabealho deve especificar o contedo das colunas.Coluna indicadora a parte em que designada a natureza (as

    categorias, as modalidades da varivel) do contedo de cada linha.Casela o cruzamento de uma linha com uma coluna, onde se tem a

    freqncia com que a categoria aparece.

    Os elementos complementares so: a fonte, as notas e chamadas.Fonte o indicativo, no rodap da tabela, da entidade responsvel pela

    sua organizao ou fornecedora dos dados primrios.

    Notas so colocadas no rodap para esclarecimento de ordem geral.

    Chamadas, tambm colocadas no rodap, servem para esclarecermincias em relao s casas, colunas ou linhas. So numeradas geralmenteem algarismos arbicos.

  • 8/6/2019 bioestatistica_I

    5/50

    4

    As tabelas devem ser fechadas no alto e embaixo por linhas horizontais.No devem ser fechadas direita e esquerda.

    Nenhuma casela da tabela deve ficar em branco, apresentando sempreum nmero ou sinal, a saber:

    - (hfen), quando o valor numrico nulo;

    .. quando no se aplica dado numrico;... (reticncia), quando no se dispe de dado;? (interrogao), quando h dvidas quanto exatido do valor numrico;0; 0,0; 0,00 (zero), quando o valor numrico muito pequeno para serexpresso pela unidade utilizada.

    x (letra x), quando o dado for omitido a fim de evitar individualizao dainformao.

    2.2 - Distribuio de freqncias

    Chama-se distribuio de freqncias a correspondncia entrecategorias ou valores possveis de uma varivel e as freqncias respectivas,como aparecem na tabela 2.1.

    Tabela 2.1 Nmero de bitos, segundo o sexo, de residentes no municpio de So Pauloem 1970.

    Sexo Nmero de bitosMasculino 25 754Feminino 19 300Total 45 054Fonte: So Paulo (Estado) Secretaria de Economia e Planejamento, Departamento deEstatstica, 1974.

    Esta tabela se refere a apenas uma varivel (sexo). Vejamos umexemplo com duas variveis.

    Tabela 2.2 Nmero e percentagem de mulheres segundo a religio e uso de mtodosanticoncepcionais (MAC), distrito de So Paulo, 1966.

    USO DE MAC

    Alguma vez Nunca Total

    Religio NO % NO % NO %CatlicaPraticante

    746 74,2 260 25,8 1006 100

    Catlica noPraticante

    1149 77,2 339 22,8 1488 100

    No catlicaPraticante

    176 78,6 48 21,4 224 100

    No catlica Nopraticante

    91 75,8 29 24,2 120 100

    Total 2162 76,2 676 23,8 2838 100Fonte: Berqu, E. et al., A Fecundidade em So Paulo - Caractersticas demogrficas,biolgicas e scio-econmicas, CEBRAP, Editora Brasileira de Cincias, So Paulo, 1977.

  • 8/6/2019 bioestatistica_I

    6/50

    5

    Algumas vezes os dados relativos a uma varivel contnua tm precisomaior do que aquela que o pesquisador pretende utilizar. Nesses casos razovel apresentar os dados por faixas, de acordo com a preciso necessria.Ento, construmos uma tabela de distribuio de freqncias. Seja porexemplo a varivel idade.

    Em primeiro lugar, definimos as faixas etrias que recebem

    tecnicamente o nome de classes. Ex.:01010202030para significar que o intervalo compreende os valores da varivel de zero(inclusive) at dez (exclusive) e assim por diante.

    til que as classes tenham a mesma amplitude, mas h situaes quenem sempre possvel.

    Definida uma classe, podemos calcular o seu ponto mdio, que dadopela mdia aritmtica dos extremos da classe. Assim, o ponto mdio da classe0 10 (0 + 10)/2 = 5. O ponto mdio ser usado para construo de umgrfico que veremos depois, e para calcular algumas medidas.

    Exemplo:

    Tabela 2.3 Distribuio de freqncias de alcolatras crnicos segundo a idade na ocasiodo incio do hbito ingerir bebidas alcolicas.

    Idade Ponto mdio No de indivduos510 7,5 2

    1015 12,5 91520 17,5 342025 22,5 282530 27,5 123035 32,5 93540 37,5 2

    4045 42,5 4Fonte: Dantas (1979)

    Quando fazemos uma pesquisa e obtemos os dados, se quisermosorganizar uma tabela como esta, ser necessrio calcular:

    a) Amplitude total (R) o maior valor menos o menor valor e aparece no conjunto de dados.R = Xmx - Xmn

    b) Nmero de classes (K)No existem critrios rgidos para se estabelecer o nmero ideal de

    classes, podendo-se sugerir de 8 a 20 como um nmero razovel.c) Amplitude de classe(H)

    H = R/K

    d) Limites de classeLimite inferior - o limite inferior da 1a. classe deve ser menor ou igual ao

    menor valor. Os demais limites inferiores so obtidos por: li = li-1 + hLimite superior: Li = li + h

  • 8/6/2019 bioestatistica_I

    7/50

    6

    Seja o exemplo:

    Tabela 2.4 Medidas de capacidade vital pulmonar em litros, de 50 adultos do sexo masculino,de 18 a 27 anos, da Santa Casa de So Paulo, 1974.

    4,08 4,55 5,03 5,70 6,034,12 4,68 5,22 5,75 6,07

    4,23 4,82 5,33 5,76 6,084,25 4,83 5,37 5,76 6,084,27 4,85 5,53 5,78 6,304,34 4,92 5,56 5,82 6,724,48 4,96 5,61 5,83 6,924,49 4,97 5,63 5,90 7,044,52 4,98 5,66 5,95 7,284,55 5,00 5,66 6,00 7,51Fonte:Santa Casa de So Paulo, 1974.

    Vejamos o procedimento para agrupar os dados em classes:

    a) Amplitude total (R) R = Xmx - X mn

    r = 7,51 - 4,08 = 3,43b) Nmero de classes (K)

    Faamos k = 8

    c) Amplitude de classe (H) H = R/Kh = 3,43/8 = 0,42 0,5

    d) Limitesl 1 = 4,0l 2 = 4,0 + 0,5 = 4,5l 3 = 4,5 + 0,5 = 5,0

    Portanto, l 4 = 5,5, l 5 = 6,0, l 6 = 6,5, l 7 = 7,0, l 8 = 7,5L1 = 4,0 + 0,5 = 4,5L2 = 4,5 + 0,5 = 5,0L3 = 5,0 + 0,5 = 5,5Portanto, L4= 6,0 , L5 = 6,5, L6 = 7,0, L7 = 7,5, L8 = 8,0

    Tabela 2.5 Distribuio de freqncias de medidas de capacidade vital pulmonar, em litros, de50 adultos do sexo masculino, de 18 a 27 anos, da Santa Casa de So Paulo, 1974.

    Capacidade Vital Nmero de adultos Porcentagem4,0 4,5 8 16,04,5 5,0 11 22,05,0 5,5 5 10,05,5 6,0 15 30,06,0 6,5 6 12,06,5 7,0 2 4,07,0 7,5 2 4,07,5 8,0 1 2,0Fonte: Santa Casa de So Paulo, 1974.

  • 8/6/2019 bioestatistica_I

    8/50

    7

    2.3 - APRESENTAO GRFICA

    A apresentao grfica de dados pode ser usada para aumentar alegibilidade de resultados de pesquisas. Os grficos devem ser auto-explicativos e de fcil compreenso. Devem sempre ter um ttulo e devem serconstrudos em uma escala que no desfigure os fatos ou as relaes que se

    deseja destacar. (A altura deve ter de 60% a 80% da largura). Deve sercolocada tambm a fonte de obteno dos dados.

    Representao grfica de varivel qualitativa

    Quando trabalhamos com variveis qualitativas os grficos mais usadosso: grfico de colunas, de barras, de setores, de crculos, de linhas.

    Exemplo:

    Tabela 2.6 Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de1951 a 1955.Grupos de causas PercentuaisCausas congnitas 21,92Causas gastro-intestinais 39,96Causas respiratrias 17,50Causas infecciosas 7,68Outras causas 9,56Causas no especificadas 3,38Total 100,00Fonte: Sounis, Emilio - Bioestatstica (1979)

    Grfico de colunas - a representao em que, sobre o eixo horizontal, emintervalos apropriados, constroem-se retngulos cujas reas so proporcionaiss freqncias das categorias da varivel em estudo. Se usarmos a mesmabase para os diversos retngulos bastar construir retngulos cujas alturassejam proporcionais s freqncias.

    0

    5

    10

    15

    20

    25

    30

    35

    40

    co n g n ita s g a st ro -in t e s t i n a i s

    re sp i ra t ria s in fe c c io sa s O u tra s n oe sp e c i f i ca d a s

    C a u s a s

    P e r c e n t u a i s

    Figura 1 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951

    a 1955.Fonte: Sounis, Emilio - Bioestatstica (1979)

  • 8/6/2019 bioestatistica_I

    9/50

    8

    Grfico de barras - semelhante ao grfico de colunas, porm os retngulosso dispostos horizontalmente.

    0 5 10 15 20 25 30 35 40

    congnitas

    gastro-intestinais

    respiratrias

    infecciosas

    Outras

    no especificadas

    Causas

    Percentuais

    Figura 2 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951

    a 1955.Fonte: Sounis, Emilio - Bioestatstica (1979)

  • 8/6/2019 bioestatistica_I

    10/50

    9

    Grfico de crculos - alm do retngulo, uma outra figura geomtrica utilizada o crculo ou conjunto de crculos. Sabemos que a rea do crculo o produtodo nmero irracional (3,1416) pelo quadrado do raio (r),ou seja,

    c r= . 2 , e desde que as reas dos diversos crculos devem serproporcionais s magnitudes das freqncias, isto , c f= . , onde fatorde proporcionalidade, segue-se que:

    . .f r= 2 e r f=

    .

    Se chamarmos

    de ' , tem-se que r f= ' . Assim, os raios dos

    crculos devem se proporcionais raiz quadrada das freqncias dasmodalidades da varivel. Portanto, para o nosso exemplo, os raios dos crculosdevero ser proporcionais, respectivamente, a:

    ' ,39 96 ' ,2192 ' ,17 50 ' ,9 56 ' ,7 68 ' ,3 38 fazendo ' = 0,4 , teremos0,4 . 6,32 = 2,530,4 . 4,68 = 1,870,4 . 4,18 = 1,670,4 . 3,09 = 1,240,4 . 2,77 = 1,110,4 . 1,84 = 0,73

    Gastro-intestinais Congnitas Respiratrias Outras Infecciosas No especificadas

    Figura 3 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951a 1955.

    Fonte: Sounis, Emilio - Bioestatstica (1979)

  • 8/6/2019 bioestatistica_I

    11/50

    10

    Grfico de setores - neste tipo de grfico, divide-se a rea total de um crculoem subreas (setores) proporcionais s freqncias.

    Essa diviso pode ser obtida atravs da regra de trs:

    total - 360parte - x

    100% - 3603,38% - x x = 12,17

    100% - 3607,68% - x x = 27,65

    100% - 3609,56% - x x = 34,42

    Para as demais freqncias teremos 63, 78,91 e 143,85.

    congnitas

    gastro-intestinais

    respiratrias

    infecciosas

    Outras

    no especificadas

    Figura 4 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951a 1955.

    Fonte: Sounis, Emilio - Bioestatstica (1979)

  • 8/6/2019 bioestatistica_I

    12/50

    11

    Grfico linear - Neste tipo de grfico unem-se as extremidades das retas,tendo-se ento o grfico linear.

    Exemplo:Tabela 2.7 Nmero de casos da molstia X, na rea Z, 1970/1974.

    Anos Nmero de casos1970 8 0001971 7 6001972 7 2001973 7 3001974 7 000Total 37 100

    6600

    6800

    7000

    7200

    7400

    7600

    7800

    8000

    1970 1971 1972 1973 1974

    Figura 5 - Nmero de casos da molstia X, na rea Z, 1970/1974.

  • 8/6/2019 bioestatistica_I

    13/50

    12

    Distribuies de duas ou mais variveis qualitativas

    Quando se passa das distribuies de uma varivel para duas variveis,em lugar de retngulos construdos sobre bases de mesmo comprimento,

    necessitamos paraleleppedos de mesma rea e, finalmente, em lugar de exigirque as reas dos retngulos sejam proporcionais s freqncias exigimos queos volumes sejam proporcionais. Com isto os grficos devem ser construdosem perspectiva, o que fica mais difcil. Ex.:

    Tabela 2.8 Populao da Capital de So Paulo (em milhares), segundo o sexo e trs gruposetrios, 1950.

    Grupos etriosSexo I1 I2 I3 TotalMasculino 325 638 127 1090Feminino 318 669 133 1120Total 643 1307 260 2210Fonte: IBGE, Censo demogrfico - 1950.

    I1 I2 I30

    100

    200

    300

    400

    500

    600

    700

    Poulao(emm

    ilhares)

    I1 I2 I3

    Idade

    MasFem

    Figura 6 - Populao da Capital de So Paulo (em milhares), segundo o sexo e trs gruposetrios, 1950.

    Fonte: IBGE Censo demogrfico - 1950.

  • 8/6/2019 bioestatistica_I

    14/50

    13

    Uma outra opo que facilita bem representar as modalidades dadistribuio de uma das variveis, para cada um dos valores da outra varivel;assim o grfico fica reduzido a um grfico de colunas ou de barras.

    0

    100

    200

    300

    400

    500

    600

    700

    I1 I2 I3

    Faixa etria

    Populao

    Masc

    Fem

    Figura 7 - Populao da Capital de So Paulo (em milhares), segundo o sexo e trs gruposetrios, 1950.

    Fonte: IBGE Censo demogrfico - 1950.

    Representao grfica de variveis quantitativas

    Nas distribuies de freqncias de uma varivel quantitativa, necessrio distinguir quando esta discreta ou contnua.

    Nas distribuies discretas, o grfico mais usado o de ordenadas.

    Nas distribuies contnuas, os grficos mais usados so: o polgono defreqncias e o histograma.

  • 8/6/2019 bioestatistica_I

    15/50

    14

    Polgono de freqncias

    Para construir o polgono de freqncias, admite-se que as freqnciasdas classes esto concentradas nos pontos mdios dos intervalos que asdefinem. Locados os pontos, estes so ligados entre si por meio de retas,sendo que, via de regra, o primeiro e o ltimo deles so ligados ao eixo dasabscissas na metade de classes hipotticas, imediatamente anterior primeirae posterior ltima; este procedimento leva ao trmino da construo dopolgono e determina que a rea total delimitada pelo polgono e o eixo dasabscissas seja proporcional freqncia total da distribuio, ou seja, 100%,havendo tambm proporcionalidade entre reas parciais, delimitadas porintervalos definidos no eixo das abscissas.

    Exemplo:

    Tabela 2.9 Distribuio de frequncias de pesos (em onas1) de tumores malignos removidosde abdomens de 57 indivduos.

    Classes Ponto mdio Nde indivduos1120 15,5 52029 24,5 19

    2938 33,5 83847 42,5 114756 51,5 75665 60,5 26574 69,5 37483 78,5 2Total 57Fonte: Daniel, W.W Bioestatistics: A foundation for analysis in the health sciences(1) 1 ona = 28,691 g

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    20

    0 6,5 15,5 24,5 33,5 42,5 51,5 60,5 69,5 78,5 87,5

    Peso do tumor

    Nmero de indivduos

    Figura - 8 Distribuio de frequncias de pesos (em onas1) de tumores malignos removidos de

    abdomens de 57 indivduos.Fonte: Daniel, W.W Bioestatistics: A foundation for analysis in the health sciences(1) 1 ona = 28,691 g

  • 8/6/2019 bioestatistica_I

    16/50

    15

    Histograma

    O histograma um grfico cujas colunas so justapostas. Lembrandoque as reas das colunas devem ser proporcionais s freqncias, no casode intervalos de classes iguais, as bases dos retngulos so sempre de

    mesma amplitude, bastando construir os retngulos com alturasproporcionais s freqncias das classes.

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    20

    15,5 24,5 33,5 42,5 51,5 60,5 69,5 78,5

    Peso do tumor

    Nmero de indivduos

    Figura 9 - Distribuio de freqncias de pesos (em onas1) de tumores malignos removidos de

    abdomens de 57 indivduos.Fonte: Daniel, W.W Bioestatistics: A foundation for analysis in the health sciences(1) 1 ona = 28,691 g

    Forma de uma distribuio de freqncias

    Os processos grficos podem ajudar-nos a visualizar a imensavariedade de figuras e formatos que as distribuies de freqncia assumem.Algumas distribuies so simtricas: dobrando-se a curva ao meio as duasmetades coincidem. Outras distribuies, denominadas assimtricas,apresentam maior quantidade de dados extremos numa das caudas.

    As distribuies simtricas apresentam considervel variao. Elaspodem diferir em termos de alongamento (ou curtose). Podem ser:

  • 8/6/2019 bioestatistica_I

    17/50

    16

    (a) leptocrticas (bastante pontiagudas ou altas);(b) platicrticas (quando so achatadas);(c) mesocrticas ( nem muito pontiagudas nem muito achatadas)

    (a) (b) (c)

    Quanto assimetria uma distribuio pode ser:

    (a) assimtrica positiva(b) assimtrica negativa

    (a) (b)

    Representao grfica com amplitudes de classes diferentes

    Quando a representao grfica for de uma distribuio de freqnciasde uma varivel contnua apresentada em classes com intervalos com

    amplitudes diferentes, h necessidade do ajuste das freqncias, pois, casocontrrio, a magnitude da figura geomtrica no ser proporcional freqnciacom que ocorre a varivel. O ajuste feito dividindo-se o nmero de casos decada classe pela amplitude da respectiva classe, obtendo-se como resultado onmero de casos por unidade de intervalo.

    Vejamos o exemplo da tabela 2.10, onde construiremos o polgono defreqncias e o histograma.

  • 8/6/2019 bioestatistica_I

    18/50

    17

    Tabela 2.10 Nmero de casos registrados de linfomas, sexo feminino, segundo a idade (anos),Brasil, 1975.

    Idade Nde casos Amplitude do intervalo casos/ano05 15 5 15:5 = 3,0520 63 15 63:15 = 4,2

    2050 151 30 151:30 = 5,05065 79 15 79:15 = 5,3

    65100 54 35 54:35 = 1,5Total 362*Nota: Excludos casos com idade ignoradaFonte: Brasil (Ministrio da Sade), Registro Nacional de Tumores, Diviso de doenascrnico-degenerativas. RJ,1978.

    0

    1

    2

    3

    4

    5

    6

    2,5 12,5 35 57,5 82,5 132,5

    Idade

    Casos/ano

    Figura 10 - Nmero de casos registrados de linfomas, sexo feminino, segundo a idade (anos),

    Brasil, 1975.

    Nota: Excludos casos com idade ignoradaFonte: Brasil (Ministrio da Sade), Registro Nacional de Tumores, Diviso de doenascrnico-degenerativas. RJ,1978.

  • 8/6/2019 bioestatistica_I

    19/50

    18

    0

    1

    2

    3

    4

    5

    6

    Anos

    Casos /ano

    Figura 11 - Nmero de casos registrados de linfomas, sexo feminino, segundo a idade (anos),Brasil, 1975.

    Nota: Excludos casos com idade ignoradaFonte: Brasil (Ministrio da Sade), Registro Nacional de Tumores, Diviso de doenas crnico-degenerativas. RJ,1978.

    Grfico de freqncias acumuladas

    um outro tipo de grfico que serve para representar varivelquantitativa. Neste caso o interesse no simplesmente a freqncia de umdeterminado valor ou classes de valores de uma varivel, mas sim oconhecimento da freqncia total dos valores inferiores a um fixado. O grfico construdo a partir dos pontos representativos dos valores das freqnciasacumuladas no eixo das ordenadas e o valor superior de cada intervalo declasse, respectivamente, nas abscissas. Demarcados os pontos, estes so

    ligados entre si, sendo que o primeiro unido ao eixo das abscissas noextremo inferior da primeira classe e o ltimo ponto ao extremo superior daltima classe, formando-se neste ltimo segmento, perpendicular ao eixo dasabscissas, uma nova escala, que poder ser em termos de porcentagem,graduada de 0 a 100%.

  • 8/6/2019 bioestatistica_I

    20/50

    19

    Tabela 2.11 Distribuio de freqncias de pesos (em onas) de tumores malignos removidosde abdomens de 57 indivduos.

    Peso no de indivduos freqncia relativa (%) nde indivduos com pe-so de tumores abaixo de

    11 20 5 5/57x 100 = 8,77 52029 19 33,33 5+19=24

    2938 8 14,04 24+8=323847 11 19,30 32+11=434756 7 12,28 43+7=505665 2 3,51 50+2=526574 3 5,26 52+3=557483 2 3,51 55+2=57Total 57Fonte: Daniel, W.W Bioestatistics

    0

    10

    20

    30

    40

    50

    60

    0 11 20 29 38 47 56 65 74 83

    Peso

    Nmero de indivduos compeso abaixo de

    Figura 12 - Distribuio de freqncias de pesos (em onas) de tumores malignos removidos

    de abdomens de 57 indivduos.

    Fonte: Daniel, W.W Bioestatistics

    O grfico utilizado para se conhecer a freqncia, em porcentagem, devalores inferiores a um valor determinado. Por exemplo: qual a porcentagemde indivduos com peso de tumor at 29 onas. A resposta 42,10%. Ou, aporcentagem de indivduos que tm tumor com peso at 20 onas de 8,77%.

  • 8/6/2019 bioestatistica_I

    21/50

    20

    Serve tambm para dizer qual o valor que define uma dada freqnciarelativa(%). Por ex.: qual o peso abaixo do qual se tem 50% dos tumores dosindivduos? Usando as propriedades de tringulos semelhantes podemoscalcular.

    'C'B

    BC

    'B'A

    AB=

    9

    29

    14 04

    7 9x =

    ,

    ,

    x =29 5 064,

    x = 34 06,

    Logo, o valor abaixo do qual se tem 50% dos pesos dos tumores 34,06onas.

    Grfico Polar

    Quando as categorias da varivel em estudo se repetem aps um

    perodo, como no caso dos dias da semana, os meses do ano, as horas do dia,etc. pode haver interesse em verificar se o conjunto de freqncias destascategorias apresentam algum padro de acordo com a ordenao dascategorias; em Epidemiologia seria caso do estudo do fenmeno chamadoestacionalidade ou sazonalidade. O grfico recomendado o grfico polar, queconsiste em um crculo com tantos raios quantas forem as categorias davarivel; cada raio ter uma escala de freqncias com origem no centro docrculo. Locadas as freqncias observadas para cada raio, unem-se ospontos e da tem-se o grfico polar.

    Ex.:

    Tabela 2.12 Nmero de bitos mensais na UTI do HC de Botucatu, segundo o sexo, nosmeses de janeiro a outubro de 1990.

    MesesSexo Jan Fev Mar Abr Mai Jun Jul Ago Set Out TotalMasc 1 2 1 2 2 2 1 2 1 2 16Fem 2 3 2 - 2 3 6 2 4 2 26Total 3 5 3 2 4 5 7 4 5 4 42Fonte: trabalho realizado por alunos da UNESP na UTI do HC de Botucatu, 1990.

  • 8/6/2019 bioestatistica_I

    22/50

    21

    0

    1

    2

    3

    4

    5

    6Ja n

    F ev

    M ar

    Ab r

    M ai

    Ju n

    Ju l

    Ag o

    Se t

    O ut

    MascFe m

    Figura 13 - Nmero de bitos mensais na UTI do HC de Botucatu, segundo o sexo, nosmeses de janeiro a outubro de 1990.

    Fonte: trabalho realizado por alunos da UNESP na UTI do HC de Botucatu, 1990.

  • 8/6/2019 bioestatistica_I

    23/50

    22

    3 - MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL

    Uma forma til de descrever um grupo como um todo consiste emencontrar um nico nmero que represente o que mdio ou tpico naqueleconjunto particular de dados. Esse valor conhecido por medida de tendncia

    central ou de posio ou mdia, uma vez que ele geralmente se localiza emtorno do meio ou centro de uma distribuio, onde a maior parte dos dadostende a se concentrar.

    So medidas de tendncia central:

    Mdia aritmtica, mediana e moda.

    Mdia aritmtica - Dados no agrupados

    Se x1, x2,...,xn so n valores distintos da varivel X, a mdia aritmticasimples de X representada por X :

    XX

    ni

    i

    n

    ==

    1, ou simplesmente X

    X

    n= , onde n o nmero de elementos

    do conjunto.

    XX X X

    nn=

    + + +1 2 .. .

    Exemplo: Calcular a mdia aritmtica de radiografias tiradas em uma semanaem determinado hospital.

    x = (9 + 12 + 8 + 6 + 14 + 11 + 5)/7 = 9,28 radiografias

    Mdia aritmtica - dados em distribuio de freqncias ou agrupados

    Se tivermos k observaes da varivel X, das quais f1 so iguais a x1 , f2

    iguais a x2 , ..., fk iguais a xk , ou quando os dados estiverem agrupados emclasses, usaremos a mdia aritmtica dos valores x1 , x2 , ..., xk , ponderadospelas respectivas freqncias.

    XX f

    ni i

    i

    k

    ==

    1

    onde n fii

    k

    ==

    1

  • 8/6/2019 bioestatistica_I

    24/50

    23

    1) Por exemplo, seja a tabela abaixo:

    Tabela 2.13 Pacientes com hipertenso, segundo a idade.

    Idade(em anos completos)(Xi) N

    o

    de indivduos (fi) Xifi22 1 2227 1 2730 1 3031 1 3134 1 3435 3 10536 5 18040 1 4042 1 4243 1 4344 2 8845 1 4546 2 92

    47 1 4748 1 4850 2 10053 3 15956 1 5658 1 5859 2 11860 1 6061 1 6163 1 6365 3 19567 2 134

    TotalFonte: Montenegro, M.R.G. (1962)

    x =+ + +

    = =221 271 67 2

    40

    1878

    404695

    . . ... ., anos

    x = 46 anos e 11 meses, ou seja, a idade mdia dos hipertensos igual a 46anos (completos)

    2) Se os dados estiverem agrupados em classes, preciso, antes de calcular amdia, determinar os pontos mdios das classes.

    XX f

    ni i

    i

    k

    ==

    1

    onde Xi o ponto mdio de cada classe. Ex.:

  • 8/6/2019 bioestatistica_I

    25/50

    24

    Tabela 2.14 Pacientes com hipertenso segundo a idade.Idade Ponto mdio n de indivduos(fi) xifi20 25 22,5 1 22,525 30 27,5 1 27,530 35 32,5 3 97,535 40 37,5 8 300,040 45 42,5 5 212,545 50 47,5 5 237,550 55 52,5 5 262,555 60 57,5 4 230,060 65 62,5 3 187,565 70 67,5 5 337,8

    Total 40 1915,0Fonte: Montenegro, M.R.G.x= 1915,0/40 = 47,875 = 47 anos e 10 meses ou 47 anos completos.

    Mediana

    a realizao que ocupa a posio central da srie de observaesquando estas esto ordenadas segundo suas grandezas (em ordem crescenteou decrescente). Precisamos considerar:

    a) Se o nmero de observaes (n) mpar a mediana ser o valor da varivelque ocupa o posto de ordem (n + 1)/2.

    Seja o exemplo do nmero de radiografias tiradas em uma semana emdeterminado hospital.

    2a feira - 9 3a feira - 12 4a feira - 8 5a feira - 66a feira - 14 sbado - 11 domingo 5

    Colocando em ordem crescente, teremos:5, 6, 8, 9, 11, 12, 14

    Logo, a mediana ser:md = 9 que o valor que ocupa o posto (7 + 1)/2 = 4o, na ordem.

    b) Se n par, ento no existe um valor que ocupe o centro. Da convencionou

    -se que a mediana ser a mdia aritmtica dos valores que ocupam os postosn/2 e n/2 + 1.

    No exemplo das radiografias, se no considerssemos o domingo, teramos:6, 8, 9, 11, 12, 14

    e a mediana seria md = (9 + 11)/2 = 10.

  • 8/6/2019 bioestatistica_I

    26/50

    25

    Alm da mediana que, por definio, divide um conjunto ordenado devalores em duas partes iguais, existem outras medidas que dividem o conjuntode valores em 4, 10 e 100 partes iguais.

    Quartis

    Os quartis dividem um conjunto de dados em quatro partes iguais.Assim:

    Q1 Q2 Q3

    25% dos valores so menores do que o primeiro quartil (Q1)50% dos valores caem abaixo do segundo quartil (Q2 ou mediana)75% dos valores so menores que o terceiro quartil (Q3).

    Para se calcular os quartis, procedemos semelhantemente como no

    caso do clculo da mediana.

    Decis so valores que dividem o conjunto ordenado de dados em 10partes iguais, isto , 10% das observaes caem abaixo do 1o decil, 20%abaixo do 2o, e assim por diante.

    Percentis so valores que dividem o conjunto de dados em 100 partesiguais.

    MODA

    o valor mais freqente da distribuio. Por exemplo para a distribuio:

    xi 18 21 32 27 45fi 2 5 8 7 4

    a moda 32. Indica-se m = 32. Esse nmero o mais comum nestadistribuio (aparece mais vezes).

    Se os pesos de 8 pessoas (em kg) so: 65, 87, 49, 58, 67, 83, 79, 69,estas medidas no definem uma moda. J os pesos:

    65, 87, 49, 58, 65, 65, 67, 83, 87, 79,87 apresentam duas modas: m = 65 kg em = 87 kg. Nesse caso a distribuio diz-se bimodal. Ser unimodal seapresentar uma s moda e multimodal se apresentar vrias modas.

    A moda pode ser usada tambm no caso de a varivel ser qualitativa.Por exemplo, quando se diz que as doenas cardacas foram a causa principalde mortalidade em certo ano, isto significa que na distribuio dos bitossegundo a causa mortis, s doenas cardacas correspondeu um maiornmero de bitos, ou seja, a rubrica "doenas cardacas" a moda dadistribuio.

  • 8/6/2019 bioestatistica_I

    27/50

    26

    4 - MEDIDAS DE VARIABILIDADE OU DE DISPERSO

    A sumarizao de um conjunto de dados, atravs de uma nica medidarepresentativa de posio central, esconde toda a informao sobre avariabilidade do conjunto de valores. Sejam, por exemplo, as amostras A e Bque representam dois grupos de pessoas cujas presses sangneas

    sistlicas (mm) acusaram os seguintes valores:

    amostra A10 10 11 12 12 13 14 14 14 15 x=12,5 md = 12,5

    amostra B7 7 8 9 12 13 13 16 17 23 x=12,5 md = 12,5

    Observamos que essas sries no so homogneas, apesar de terem omesmo valor para a mdia e mediana em ambas. preciso calcular asconstantes de disperso que medem os afastamentos dos valores dessassries em torno do valor central.

    Entre as medidas de disperso mais usadas, veremos:

    a) Amplitude Totalb) Amplitude interquartlicac) Varinciad) Desvio-padroe) Coeficiente de variao

    a) Amplitude total - a diferena entre o maior e o menor valor de um

    conjunto de dados.R= Xmx - XmnPara a srie A r = 5Para a srie B r = 16

    A utilizao da amplitude total como medida de disperso muitolimitada, pois sendo uma medida que depende apenas dos valores externos, instvel, no sendo afetada pela disperso dos valores internos.

    b) Amplitude interquartlica - a diferena entre o 3o e o 1o quartil.A = Q

    3- Q

    1

    Para a srie A a = 14 - 11 = 3Para a srie B a = 16 - 8 = 8Examinando os resultados podemos concluir que a srie B tem dispersomaior que a A.

  • 8/6/2019 bioestatistica_I

    28/50

    27

    c) Varincia

    Considerando o nosso propsito de medir a disperso dos valores emtorno da mdia, interessante estudarmos o comportamento dos desvios decada valor em relao mdia, isto , x xi . Observem que, na determinao

    de cada desvio d x xi i= , estaremos medindo a disperso entre cada xi e amdia x . Porm, se somarmos todos os desvios, teremos d i

    i

    n

    = =

    1

    0 ou

    ( )x xii

    n

    = =

    1

    0. Para contornar o problema, resolveu-se considerar o quadrado

    de cada desvio ( )x xi 2 , evitando-se com isso que d i

    i

    n

    = =

    1

    0. Assim, definiu-

    se a varincia como:

    2

    2

    1

    2

    1=

    == = ( )x

    N

    d

    N

    i

    i

    N

    i

    i

    N

    se os dados no so agrupados e

    2

    2

    1

    2

    1=

    == = ( )x f

    N

    d f

    N

    i ii

    K

    i ii

    K

    para os dados agrupados.

    Trata-se da mdia aritmtica dos quadrados dos desvios.

    Observao: 2 indica a varincia da populao e l-se sigma ao quadrado, a mdia da populao e N o tamanho da populao. Para o caso do clculoda varincia de valores amostrais conveniente usarmos a frmula:

    S

    x x

    n

    ii

    n

    2

    2

    1

    1=

    =

    ( )se os dados no so agrupados e

    S

    x x f

    n

    i ii

    k

    2

    2

    1

    1=

    =

    ( )para os dados agrupados onde x no caso, a mdia da

    amostra e n o tamanho amostral.

    A seguir esto outras frmulas que podem ser usadas para o clculo davarincia populacional e amostral.

    2 21

    2

    11= =

    =

    NX

    X

    Nii

    N ii

    N

    [

    ( )

    ] varincia populacional para dados no agrupados

    2 21

    2

    11= =

    =

    NX f

    X f

    Ni ii

    K i ii

    K

    [

    ( )

    ] varincia populacional para dados agrupados

  • 8/6/2019 bioestatistica_I

    29/50

    28

    Sn

    X

    X

    nii

    n ii

    n

    2 2

    1

    2

    11

    1=

    =

    =

    [

    ( )

    ] varincia amostral para dados no agrupados

    Sn

    X f

    X f

    ni ii

    k i ii

    k

    2 2

    1

    2

    111

    =

    =

    =

    [

    ( )

    ] varincia amostral para dados agrupados.

    Estas frmulas so obtidas atravs de transformaes nas respectivasfrmulas originais.

    Clculo da varincia amostral para as sries A e B

    Sn

    X

    X

    nii

    n ii

    n

    2 2

    1

    2

    11

    1=

    =

    =

    [

    ( )

    ]

    s mmA2

    221

    9 1591125

    10 3167= =[( )

    ] ,

    s mmB22

    21

    91799

    125

    1026 278= =[

    ( )] ,

    d) Desvio-padro

    Observando-se a frmula para o clculo da varincia, vemos que se tratade uma soma de quadrados. Assim, se a unidade da varivel for, por exemplo,mm, teremos como resultado mm2.

    Para voltarmos varivel original, necessitamos definir outra medida de

    disperso, que a raiz quadrada da varincia, o desvio-padro. Assim: = 2 o desvio-padro populacional

    S S= 2 o desvio-padro amostral

    Portanto, para o exemplo das sries teremos:s mmA = =3 167 1 780, , s mmB = =26 278 5 126, ,

    Vejamos o exemplo da tabela 2.14 (pacientes com hipertenso segundo aidade), para dados agrupados:

    Sn

    X fX f

    ni ii

    k i ii

    k

    2 2

    1

    211

    1=

    =

    = [( )

    ]

    s anos22

    21

    3997500

    1915

    40149 21= =[

    ( )] ,

    portanto, a varincia da idade dos pacientes com hipertenso igual a 149,21anos2 , sendo que o desvio padro 12,22 anos.

  • 8/6/2019 bioestatistica_I

    30/50

    29

    e) Coeficiente de variao

    Trata-se de uma medida relativa da disperso, til para a comparaoem termos relativos do grau de concentrao em torno da mdia de conjuntosde dados distintos. dado por:

    CV =

    .100% ou CVS

    X= .100%

    Vamos supor, para exemplificar, que temos dois grupos de indivduos,cujas idades esto apresentadas na tabela abaixo:

    Tabela 2.16 Idades de indivduos, segundo o grupoGrupo

    I II3 55

    1 575 53

    Temos que a idade mdia no Grupo I 3 e no grupo II, 55. A dispersoem torno da mdia a mesma para os dois grupos, pois tm varincias s2 = 4anos2 e desvio-padro s = 2 anos. Entretanto, as diferenas de dois anos, naidade dos indivduos do grupo I, so muito importantes porque determinamgrandes modificaes tanto no aspecto fsico como no comportamento dessesindivduos. Isso j no acontece com os indivduos do grupo II. Ento, h ointeresse em estabelecer relao entre o desvio-padro, que mede a dispersodos dados, e a mdia, que mede a tendncia central.

    Assim, o coeficiente de variao ser:cvA = 2/3 . 100% = 66,67%cvB = 2/55 . 100% = 3,64%

    Vejamos os valores dos coeficientes de variao para as sries A e B:cvA = 1,780/12,5 . 100% = 14,24%cvB = 5,126/12,5 . 100% = 41,10%

    Vemos, portanto, que h maior variao na srie B que na A, pois o cvna srie B foi bem maior que na srie A.

  • 8/6/2019 bioestatistica_I

    31/50

    30

    5 - NOES DE PROBABILIDADEConceitos fundamentais

    Qual a probabilidade de ocorrer determinado fenmeno?

    pergunta-se quo provvel esse fenmeno.

    quer-se quantificar a possibilidade de ocorrncia desse fenmeno.

    Probabilidade uma medida de incerteza.

    Fenmeno aleatrio ou probabilstico: aquele cuja ocorrncia no se pode

    prever com certeza.

    a cura de um doente aps ser submetido a um transplante.

    sair a face cara no lanamento de uma moeda.

    a durao de uma lmpada ser igual a 100 horas.

    chover amanh.

    o primeiro filho de um casal ser do sexo masculino.

    etc.

    Fenmeno determinstico: aquele cuja ocorrncia pode ser prevista com certeza.

    a velocidade atingida por um objeto em queda livre.

    etc.

    Blaise Pascal

    (1601 1665)&

    Pierre Fermat(1623 1662)

    deram origem

    Teoria das Probabilidades

  • 8/6/2019 bioestatistica_I

    32/50

    31

    CONCEITOS FUNDAMENTAIS

    Experimento

    um procedimento realizado sob determinadas condies e que pode ser

    repetido um nmero qualquer de vezes sob condies idnticas.

    Experimento Determinstico

    So aqueles em que as condies em que o experimento realizado

    determinam completamente seu resultado.

    Experimento Aleatrio ou Probabilstico

    So aqueles cujo resultado no se pode prever com certeza.

    realizao de um experimento aleatrio

    diversos resultados possveis

    Exemplos:

    Experimento: plantar uma semente e observar o resultado:

    Resultados possveis: germinou, no germinou.

    Experimento: observar o sexo de um recm-nascido:

    Resultados possveis: masculino; feminino.

    Experimento: observar o peso de um recm-nascido, em quilos:

    Resultados possveis:...; 2,2; ...; 2,5; ...; 3,0; ... etc.

    causas mltiplas que no podem ser controladas: ACASO

  • 8/6/2019 bioestatistica_I

    33/50

    32

    Espao Amostral

    o conjunto de todos os possveis resultados de um experimento aleatrio.

    representado pela letra S.

    EventoDado um experimento aleatrio, evento qualquer subconjunto de seu espao

    amostral.

    Os eventos constitudos por apenas um elemento do espao amostralso chamados eventos simples.

    O espao amostral chamado evento certo.

    O conjunto vazio chamado evento impossvel.

    Exemplos:

    Experimento: plantar uma semente e verificar o resultado:

    S = { germinou; no germinou}

    Experimento: observar o sexo de um recm-nascido:

    S = { feminino; masculino }

    Experimento: observar o peso de um recm-nascido, em quilos:S = {...; 2,2; ...; 2,5; ...; 3,0; ... }

    um experimento aleatrio repetido vrias vezes

    sob mesmas condies

    padro regular na freqncia dos

    diferentes resultados que podem ocorrer

    efeito aleatrio

  • 8/6/2019 bioestatistica_I

    34/50

    33

    Neste contexto,

    a probabilidade de ocorrncia de determinado resultado na realizao

    de um experimento aleatrio

    pode ser estimada pela

    razo entre o nmero de vezes em que este resultado foi observadoem uma srie de repeties do experimento e

    o nmero total de vezes em que o experimento foi repetido.

    Notao: Seja o evento A pertencente ao espao amostral de determinado

    experimento aleatrio. A probabilidade de A ocorrer em uma realizao deste

    experimento representada por P(A).

    Interseo de Eventos

    Dado um experimento aleatrio, a ocorrncia simultnea dos eventos A e B de

    seu espao amostral chamada evento interseo e representada

    por A B.

    A BS

  • 8/6/2019 bioestatistica_I

    35/50

    34

    Unio de eventos

    Dado um experimento aleatrio e dois eventos A e B de seu espao amostral,

    a ocorrncia de A, de B ou de ambos chamada evento unio e

    representada por A B.

    Eventos Mutuamente Exclusivos

    Dado um experimento aleatrio, dois eventos A e B de seu espao amostral

    so mutuamente exclusivos se nunca ocorrem simultaneamente.

    Ou seja, a ocorrncia de A exclui a ocorrncia de B e vice-versa.

    A e B mutuamente exclusivos P(A B) = 0.

    Eventos Independentes

    Dado um experimento aleatrio, dois eventos A e B de seu espao amostral

    so independentes se a ocorrncia de A no afeta a ocorrncia de B e vice-

    versa, ou seja, a probabilidade de ocorrncia de B independe de A ter ou

    no ocorrido e vice-versa.

    A probabilidade de A dado que B ocorreu chamada probabilidade

    condicional de A dado Be denotada por P(A | B).

    A BS

  • 8/6/2019 bioestatistica_I

    36/50

    35

    Exemplo

    Num estudo sobre a ocorrncia de problemas cardacos em pessoas acima de

    40 anos de determinado municpio, um pesquisador coletou dados de peso

    corporal e presso arterial de uma amostra aleatria de 1660 pessoas dessa

    populao:

    Peso

    PressoExcessivo Normal Baixo

    Arterial (A) (B) (C) Total

    Elevada (E) 166 132 35 333

    Normal (N) 249 747 331 1327

    Total 415 879 366 1660

    Considere o experimento aleatrio:

    Selecionar aleatoriamente uma pessoa da populao amostrada e observar

    sua presso arterial e seu peso corporal (de acordo com a classificao

    adotada pelo pesquisador para as variveis peso e presso arterial).

    Com base nos dados obtidos pelo pesquisador, ou seja, com base na amostra

    observada, podemos responder, por exemplo, s seguintes perguntas:

    1. Qual a probabilidade de a pessoa selecionada ter presso arterial

    elevada?

    A e B independentes

    P(A | B) = P(A )

    P(B | A) = P(B )

  • 8/6/2019 bioestatistica_I

    37/50

    36

    2. Qual a probabilidadede a pessoa selecionada ter peso excessivo?

    3. Qual a probabilidade de a pessoa selecionada ter presso arterial

    elevadaepeso excessivo?

    4. Qual a probabilidade de a pessoa selecionada ter presso arterial

    elevadaoupeso baixo?

    O espao amostral correspondente ao experimento aleatrio considerado :

    S = {EA, EB, EC, NA, NB, NC}

    Podemos definir vrios eventos em S. Sejam, por exemplo, os eventos:

    H : apresentar presso arterial elevada H = {EA, EB, EC}.

    I : apresentar peso normal I = { EB, NB }.

    Considerando-se o conceito de probabilidade como o limite de uma freqncia

    relativa, podemos facilmente calcular:

    1. Qual a probabilidade do evento H ocorrer neste experimento aleatrio?

    2. Qual a chance do evento I ocorrer?

    3. Qual a probabilidade dos eventos H e I ocorrerem simultaneamente?

    P( H )333

    16600,2006= =

    0,52951660

    879)IP( ==

    P( H I )132

    16600,0795 = =

  • 8/6/2019 bioestatistica_I

    38/50

    37

    4. Qual a chance de ocorrer o evento H ou o evento I?

    5. Se foi observado que a pessoa selecionada apresenta peso excessivo, qual

    probabilidade dessa pessoa apresentar presso arterial elevada?

    H : apresentar presso arterial elevada H = {EA, EB, EC}.

    I : apresentar peso normal I = { EB, NB }.

    J : apresentar peso excessivo J = { EA, NA }.

    6. Dado que a pessoa selecionada apresenta peso normal, qual a

    probabilidade dessa pessoa apresentar presso arterial elevada?

    P( H I )333

    16600,6506 = + =

    879

    1660

    132

    1660

    P( H | J )166

    4150,4000= =

    P( H )333

    16600,2006= =

    P( H | I )132879

    0,1502= =

    P( H | J )P( H J )

    P( J )

    166

    4150,4000=

    = = =

    1661660415

    1660

    P( H | I )P( H I )

    P( I )

    132

    8790,1502=

    = = =

    13216608791660

  • 8/6/2019 bioestatistica_I

    39/50

    38

    TEOREMA DA SOMA

    Dados dois eventos A e B do espao amostral de um experimento aleatrio,

    ento a probabilidade de ocorrncia de A ou de B na realizao desse

    experimento aleatrio dada por:

    TEOREMA DO PRODUTO

    Dados dois eventos A e B do espao amostral de um experimento aleatrio,

    ento a probabilidade de ocorrncia simultnea de A e de B na realizao

    desse experimento aleatrio dada por:

    P( A B ) P( A ) P( B | A) =

    P( A B ) P( B ) P( A | B) =

    ou

    P( A | B )P( A B )

    P( B )=

    P( B | A )

    P( A B )

    P( A )=

    P( A B ) = P( A ) + P( B ) - P( A B )

  • 8/6/2019 bioestatistica_I

    40/50

    39

    6 - EXPERIMENTOS ALEATRIOS

    Existe grande importncia nos experimentos feitos na cincia. Umprincpio fundamental que se efetuamos tais experimentos repetidas vezes,

    sob condies praticamente idnticas, obtemos resultados que soessencialmente os mesmos. H, entretanto, experimentos em que osresultados no so essencialmente os mesmos, ainda que as condies derealizao se mantenham praticamente as mesmas. Tais experimentoschamam-se experimentos aleatrios.

    ESPAO AMOSTRAL

    Um conjunto S, que consiste de todos os resultados possveis de umexperimento aleatrio chamado espao amostral; cada resultado um ponto

    amostral. comum haver mais de um espao amostral para descrever osresultados de determinado experimento, mas em geral apenas um dessesespaos nos d o mximo possvel de informaes.

    EVENTO

    Um evento um subconjunto do espao amostral.

    PROBABILIDADES

    Em qualquer experimento aleatrio, h sempre uma incerteza quanto ocorrncia, ou no, de determinado evento. A fim de obtermos uma medida dechance, ou probabilidade, com que podemos esperar a ocorrncia dedeterminado evento, conveniente atribuirmos um nmero entre 0 e 1.

    Exemplo 1) De um grupo de duas mulheres (M) e trs homens (H), umapessoa ser sorteada para ser representante do Conselho de Classe no IB.Observamos que

    a) s existem duas possibilidades: ou a pessoa sorteada do sexo feminino(M) ou do sexo masculino (H);b) supondo que o sorteio seja honesto e que cada pessoa tenha a mesma

    chance de ser sorteada; teremos o seguinte modelo de probabilidades parao experimento:

    SexoMasculino Feminino Total

    Freq. terica 3/5 2/5 1

  • 8/6/2019 bioestatistica_I

    41/50

    40

    Todo experimento ou fenmeno que envolva um elemento casual terseu modelo probabilstico especificado no momento que estabelecemos:

    1o) um espao amostral, S, que consiste, no caso discreto, na enumerao detodos os possveis resultados do experimento em questo: S = {w1 ,w2 ,...}. Oselementos w so os pontos amostrais.

    No exemplo acima S = {M,H}.

    2o) uma probabilidade , P(w), para cada ponto amostral, de tal sorte que serpossvel encontrar a P(A) de qualquer subconjunto A de S, isto , aprobabilidade da ocorrncia de um evento.

    Exemplo 2) Lanamos uma moeda duas vezes. Se C indica cara e R indicaCoroa, ento, um espao amostral ser S = {w1 , w2 , w3 , w4 } ou seja,S = {(C,C); (C,R); (R,C); (R,R)}. Se a moeda perfeitamente simtrica ehomognea razovel supor que cada ponto w tem probabilidade 1/4.

    Se A o evento que consiste na obteno de faces iguais nos doislanamentos, entoP(A) = P(w1 ,w4 ) = 1/4 + 1/4 = 1/2

    De um modo geral, se A um evento, ento, P(A) = (wj), onde a soma estendida a todos os wj A.

    Para um mesmo experimento podemos ter vrios espaos amostrais,dependendo do objetivo do problema que se quer estudar.

    Exemplo 3) Considere o experimento que consiste em retirar um medicamentode um lote de medicamentos e medir a sua validade. Um espao amostralconveniente :

    S={t : t 0}

    Se A indica o evento: "o tempo de validade do medicamento inferior a 3anos", ento A = {t : 0 t< 3}. Este um exemplo de um espao amostralcontnuo, ao contrrio dos exemplos anteriores, que so discretos.

    Algumas Propriedades

    Sendo o modelo probabilstico um modelo terico para as freqnciasrelativas, das propriedades destas podemos verificar algumas daspropriedades que veremos a seguir.

    Como toda freqncia relativa um nmero entre 0 e 1, temos que:0 P(A) 1 para qualquer evento A.

    Considerando o espao todo S e o conjunto vazio como eventos, temos:P(S) = 1P() = 0

    onde o primeiro denominado evento certo e o segundo, evento impossvel.

  • 8/6/2019 bioestatistica_I

    42/50

    41

    Varivel aleatria discreta (v.a.d.)

    Uma funo X, definida sobre o espao amostral S e assumindo valoresnum conjunto enumervel de pontos do conjunto real, dita uma varivelaleatria discreta.

    w1 w2 w3 w4 w5 w6 S

    x1 x2 x3 x4

    Exemplos:X: n. de sobreviventes aps determinada operao

    X: n. de pessoas portadoras de 1 determinado baciloX: n. de amostras de fezes com ovos detectadosX: n. de bitos do sexo masculino

    Chama-se de funo de probabilidade (f.p.) da varivel aleatria discretaX, que assume os valores x1 , x2 , ... , xn , a funo p(xi ), que a cada valor xiassocia sua probabilidade de ocorrncia, isto ,

    p(xi ) = P(X = xi) = pi

    Valor esperado de uma varivel aleatria discreta

    Dada a varivel aleatria discreta X, assumindo os valores x1 , x2 , ... xn,chamamos valor mdio ou esperana matemtica de X ao valor

    E(X) = x pii

    n

    i=

    1

    Varincia de X

    Var(X) = = ==

    =n

    1i

    n

    1i

    2iii

    2ii

    2n

    1ii )]x(px[)x(pxp)]X(Ex[

    Desvio-padro de XDP(X) = Var X( )

    Exemplo: Seja X o nmero de pontos marcados na face superior deum dado:x 1 2 3 4 5 6 Totalp(x) 1/6 1/6 1/6 1/6 1/6 1/6 1,0

  • 8/6/2019 bioestatistica_I

    43/50

    42

    E(X) = 1.1/6 + 2.1/6 + 3.1/6 + 4.1/6 + 5.1/6 + 6.1/6 = 21/6 = 3,5

    Var(X) = (1-21/6)2 .1/6 + (2-21/6)2 .1/6 + (3-21/6)2 .1/6 + (4-21/6)2 .1/6 ++(5-21/6)2 .1/6 + (6-21/6)2 .1/6 = 35/12 = 2,917.

    DP(X) = 708,112/35 =

    Distribuio de Bernoulli

    Muitos experimentos so tais que os resultados possveis apresentam ouno determinada caracterstica.(1) Uma pessoa escolhida, ao acaso, dentre 1000 pessoas, ou no do sexofeminino;(2) Uma pessoa escolhida, ao acaso, entre os moradores de uma cidade epergunta-se se ela diz sim ou no a um projeto governamental;(3) Uma moeda lanada: o resultado ou "cara", ou no ;(4) Um dado lanado: ou ocorre face 5, ou no.

    Em todos esses casos, estamos interessados na ocorrncia de umsucesso (ser do sexo feminino, dizer sim a um projeto, sair cara, ocorrer face5) ou fracasso (no ser do sexo feminino, dizer no a um projeto, sair coroa,no ocorrer face 5). A definio do que sucesso ou fracasso depende doobjetivo do estudo.

    Para cada experimento acima, podemos definir uma varivel X queassume apenas dois valores: o valor 1, se ocorre sucesso, e o valor 0, seocorre fracasso. Indicaremos por p a probabilidade de sucesso e q = 1-p aprobabilidade de fracasso.

    A varivel aleatria X, que assume apenas os valores 0 e 1 com afuno de probabilidade,x 0 1 Totalp(x) 1-p p 1

    chamada varivel aleatria de Bernoulli.E(X) = 0.(1-p) + 1.p = pVar(X) = p - p2 = p(1-p) = pq

    Distribuio Binomial

    Imagine que repetimos um ensaio de Bernoulli n vezes, ou como se diztambm, obtemos uma amostra de tamanho n de uma distribuio deBernoulli. Suponha ainda que as repeties sejam independentes, isto , oresultado de um ensaio no tem influncia nenhuma no resultado de qualqueroutro ensaio.

    A varivel aleatria X, correspondente ao nmero de sucessos numexperimento binomial b(n,p), tem funo de probabilidade:

  • 8/6/2019 bioestatistica_I

    44/50

    43

    P X kn

    kp qk n k( )= =

    onde

    )!kn(!k

    !n

    k

    n

    =

    Numa distribuio binomialE(X) = npVar(X) = npq

    Exemplo 1: Qual a proporo esperada de famlias com 2 filhas e 3 filhos,supondo mesma chance de nascimento para cada sexo?

    Definindo X como n. de meninas

    P(X = 2) = ?

    P(X = 2) = 532 5,0.!3!2

    !55,0.5,0

    2

    5=

    P(X = 2) = 10.0,03125 = 0,3125 = 31,25%

    Exemplo 2: Sabe-se que a proporo de sucesso de um tratamento de 0,80.Qual a probabilidade de que em 10 indivduos, 6 obtenham sucesso?

    P(X = 6) =10

    60 80 0 20

    10!

    6!40 80 0 206 4 6 4

    =, . ,

    !. , . ,

    P(X=6) = 210 . 0,2621 . 0,0016 = 0,0881 = 8,81%

    Variveis aleatrias contnuas (v.a.c.)

    Exemplo: O ponteiro dos segundos de um relgio mecnico pode parar aqualquer instante por defeito tcnico. Vamos indicar por X o ngulo que esteponteiro forma com o eixo imaginrio, passando pelo centro do relgio e pelo

    nmero XII. 0oxii

    270o IX III - 90o

    VI180o

  • 8/6/2019 bioestatistica_I

    45/50

    44

    Lembrando que:a) o ponteiro deve dar 60 "saltos" (ele d um salto em cada segundo) paracompletar uma volta;b) acreditando que o ponteiro tenha probabilidade igual de parar em qualquerponto, a varivel X tem distribuio uniforme discreta, cuja funo deprobabilidade :

    x 0 6 12 18 ... 348 354p(x) 1/60 1/60 1/60 1/60 1/60 1/60

    com a seguinte representao grfica:

    p(x)

    1/60

    6o 12o 18o 348o 354o x (em graus)

    Transferindo o mesmo problema para um relgio eltrico, onde oponteiro dos segundos move-se continuamente, necessitamos um outromodelo para representar a varivel aleatria X. Primeiro observamos que oconjunto dos possveis valores de X no mais um conjunto enumervel devalores, pois X pode assumir qualquer valor do intervalo [0,360[ = {x R 0 x< 360}. Neste caso faz sentido determinar a probabilidade de o ngulo X estarcompreendido entre dois valores quaisquer. Por exemplo, a probabilidade de oponteiro parar no intervalo compreendido entre os nmeros XII e III 1/4, poiseste intervalo corresponde a 1/4 do intervalo total. Ento, podemos escrever:

    P(0 X 90) = 1/4

    Do mesmo modo, a probabilidade de o ponteiro parar entre os nmerosIV e V igual a 1/12, isto ,P(120 X 150) = 1/12

    Portanto, a probabilidade de X [a,b[

    P(a x < b) =b a

    360

    f(x)

    1/360

    a b c d 360 x (em graus)

  • 8/6/2019 bioestatistica_I

    46/50

    45

    O histograma anterior corresponde seguinte funo:

    f x( ) =<

    <

    0, se x 0

    1 / 360, se 0 x 360

    0, se x 360

    A rea correspondente ao intervalo [a,b[ deve indicar a probabilidade davarivel estar entre a e b. Matematicamente, isso expresso atravs daintegrao da funo entre a e b.

    P(a X < b) = f x dx dxb a

    a

    b

    a

    b( ) =

    =

    1360 360

    pois a integral de uma funo entre dois pontos determina a rea sob a curvacompreendida entre esses dois pontos.

    A funo f(x) chamada funo densidade de probabilidade (f.d.p.).

    Valor esperado de uma varivel aleatria contnua

    Qualquer funo (f.d.p) no negativa tal que

    = 1dx)x(f , define uma

    varivel aleatria contnua X. Isto cria um modelo terico para as freqnciasrelativas de uma varivel quantitativa contnua. A rea compreendida entredois valores, a e b, da abscissa x e da curva f(x), d a probabilidade (proporoterica esperada) da varivel pertencer ao intervalo limitado pelos dois pontos.Assim, temos:

    P(a x < b) = f x dxa

    b( )

    A mdia, esperana matemtica ou valor esperado de uma v.a.c. podeser escrita como:

    E(X) = x f x dx. ( )

    e a varincia

    Var(X) = ( ( )) . ( )x E X f x dx

    2

    sendo que o desvio-padro DP(X) = )X(Var

  • 8/6/2019 bioestatistica_I

    47/50

    46

    Modelo Normal ou Distribuio Normal

    Dizemos que uma v.a. X tem distribuio normal com parmetros,mdia igual a e varincia igual a 2 , - < < + , 0 < 2 < + , se a suafuno densidade de probabilidade (f.d.p) dada por:

    f x e x( ) ( ) /= 1

    2

    2 22

    < < +x

    Grfico

    f ( X )

    - + 0

    Temos que:a) E(X) = b) Var(X) = 2c) f(x) 0 quando xd) - e + so pontos de inflexo de f(x);

    e) x = ponto de mximo de f(x), e o valor mximo 1 2

    f) f(x) simtrica ao redor de x = , isto , f(x + ) = f(x - ), para todo < < +x

    Como calcular P(a < X < b) = ?

    P(a < X < b) = dxe2

    1ba

    2/)x( 22

    f(x)

    f

    a b

  • 8/6/2019 bioestatistica_I

    48/50

    47

    A integral no pode ser calculada exatamente, e a probabilidadeindicada s pode ser obtida aproximadamente, por mtodos numricos. Noentanto, para cada valor de e cada valor de , teramos que obter P(a < X 180) = P(Z >2) = 1 - P(Z < 2)

    = 1 - 0,9772 = 0,0228 = 2,28%

    f) P(X > 165) = ?z = (165 - 170)/5 = -1P(X > 165) = P(Z > -1) = 1 - P(Z < -1)

    = 1 - 0,1587 = 0,8413 = 84,13%

    Como so 10000 alunos teremos

    10000 x 0,8413 = 8413 alunosque o nmero esperado de alunos com altura superior a 165 cm.

  • 8/6/2019 bioestatistica_I

    50/50

    49

    7 - BIBLIOGRAFIA

    BERQU, E.S.; SOUZA, J.M.P. de; GOTLIEB, S.L.D. Bioestatstica. SoPaulo, EPU, 1980. 325p.

    BUSSAB, W.O. & MORETTIN, P.O. Estatstica Bsica: MtodosQuantitativos. 4.ed. So Paulo, Atual Editora, 1987. 321p.

    CAMPBELL, M.J. & MACHIN, D. Medical Statistics: A CommonsenseApproach. 2nd ed. Chichester, John Wiley & Sons, 1993. 189p.

    SOARES, J.F. & SIQUEIRA, A.L.Introduo Estatstica Mdica. 1.ed.

    Belo Horizonte, UFMG, 1999. 300p.

    VIEIRA, S. Introduo Bioestatstica. 2.ed. Rio de Janeiro, EditoraCampus, 1991. 203p.