90270606 67773826 apostila de bioestatistica

58
Bioestatística Prof a Claudia M. G. G. Franchi 1 APOSTILA DE BIOESTATÍSTICA Curso: Tecnologia em Radiologia Médica Profa. Claudia Franchi

Upload: pedro-henrique-veloso

Post on 02-Dec-2015

400 views

Category:

Documents


13 download

TRANSCRIPT

Bioestatística Profa Claudia M. G. G. Franchi

1

APOSTILA

DE

BIOESTATÍSTICA

Curso: Tecnologia em Radiologia Médica

Profa. Claudia Franchi

Bioestatística Profa Claudia M. G. G. Franchi

2

Sumário

1. Capítulo 1 – Noções Básicas ........................................................................................... 5 1.1. Variáveis ...................................................................................................................... 5

1.2. Apuração de Dados ..................................................................................................... 5

1.3. População e Amostra .................................................................................................. 6

1.4. Técnicas de Amostragem ............................................................................................ 6

1.4.1. Amostra Casual Simples ......................................................................................... 6

1.4.2. Amostra Sistemática ................................................................................................ 7

1.4.3. Amostra Estratificada .............................................................................................. 7

1.4.4. Amostra de Conveniência ........................................................................................ 8

1.5. Exercícios – Capítulo 1 ................................................................................................ 8

2. Capítulo 2 - Apresentação de Dados em Tabelas ....................................................... 10

2.1. Componentes das Tabelas ........................................................................................ 10

2.2. Tabelas de Contingência ........................................................................................... 11

2.3. Exercícios – Capítulo 2 .............................................................................................. 12

3. Capitulo 3 - Tabelas de Distribuição de Frequências ................................................... 13

3.1. Tabela primitiva ou dados brutos: .............................................................................. 13

3.1.1. ROL ....................................................................................................................... 13

3.2. Distribuição de frequência sem intervalos de classe .................................................. 13

3.3. Distribuição de frequência com intervalos de classe .................................................. 13

3.4. Exercícios – Capítulo 3 .............................................................................................. 17

4. Elementos de uma distribuição de frequência (com intervalos de classe) ................ 20

4.1. Classe ....................................................................................................................... 20

4.2. Limite superior e limite inferior da classe ................................................................... 20

4.3. Amplitude de classe ................................................................................................... 20

4.4. Amplitude total da distribuição ................................................................................... 20

4.5. Amplitude total da amostra (ROL) .............................................................................. 21

4.6. Ponto Médio de classe............................................................................................... 21

4.7. Exercícios – Capítulo 4 .............................................................................................. 21

5. GRÁFICOS ESTATÍSTICOS ............................................................................................ 24 5.1. Gráfico de Barras ....................................................................................................... 24

5.2. Gráfico de Colunas .................................................................................................... 25

5.3. Gráfico de Setores ..................................................................................................... 25

5.4. Gráfico de Linhas....................................................................................................... 26

5.5. Exercícios – Capítulo 5 .............................................................................................. 27

6. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO ............................................... 28

6.1. Histograma ................................................................................................................ 28

6.2. Polígono de Frequências ........................................................................................... 28

6.3. Exercícios – Capítulo 6 .............................................................................................. 29

Bioestatística Profa Claudia M. G. G. Franchi

3

7. MEDIDAS DE POSIÇÃO .................................................................................................. 30

7.1. Introdução.................................................................................................................. 30

7.2. Média Aritmética: ................................................................................................... 30

7.2.1. Dados não agrupados ........................................................................................... 30

7.2.2. Desvio em relação à média: .................................................................................. 30

7.2.3. Propriedades da média aritmética ......................................................................... 31

7.2.4. Dados agrupados sem intervalo de classe ............................................................ 31

7.3. Exercícios – Capítulo 7 .............................................................................................. 32

7.3.1. Dados agrupados com intervalo de classe ............................................................ 33

7.4. Exercícios: ................................................................................................................. 34

7.5. MODA - Mo .............................................................................................................. 35

7.5.1. Dados não agrupados ........................................................................................... 35

7.5.2. Dados agrupados sem intervalo de classe ............................................................ 35

7.5.3. Dados agrupados com intervalo de classe ............................................................ 36

7.5.4. Cálculo da Moda: Método mais elaborado pela fórmula de CZUBER: ................... 36

7.6. Exercícios: ................................................................................................................. 37

7.7. MEDIANA ............................................................................................................ 38

7.7.1. Dados não agrupados ........................................................................................... 38

7.7.2. Dados agrupados .................................................................................................. 39

7.7.3. Dados Agrupados sem intervalo de classe ............................................................ 39

7.8. Exercícios: ................................................................................................................. 39

7.8.1. Dados Agrupados com intervalos de classe .......................................................... 41

7.9. Resolva: .................................................................................................................... 42

7.10. Exercícios – Capítulo 7 .............................................................................................. 43

8. Medidas de Dispersão ou de Variabilidade ................................................................... 47

8.1. Dispersão ou variabilidade ......................................................................................... 47

8.2. Amplitude Total .......................................................................................................... 48

8.2.1. Dados não agrupados ........................................................................................... 48

8.2.2. Dados agrupados sem intervalo de classe ............................................................ 48

8.2.3. Dados agrupados com intervalo de classe ............................................................ 49

8.3. Variância / Desvio padrão ...................................................................................... 49

8.3.1. Dados não agrupados ........................................................................................... 51

8.4. Resolva: .................................................................................................................... 51

8.4.1. Dados Agrupados sem intervalo de classe ............................................................ 52

8.5. Exercícios: ................................................................................................................. 53

8.5.1. Dados Agrupados com intervalo de classe ............................................................ 54

8.6. Exercícios: ................................................................................................................. 54

8.7. Coeficiente de Variação ............................................................................................. 55

8.8. Exercícios – Capítulo 8 .............................................................................................. 56

Bioestatística Profa Claudia M. G. G. Franchi

4

9. Bibliografia ...................................................................................................................... 58

Bioestatística Profa Claudia M. G. G. Franchi

5

1. CAPÍTULO 1 – NOÇÕES BÁSICAS

Nas áreas médicas, biológicas e engenharias, coletam-se dados de pessoas, de animais

experimentais e de fenômenos físicos e químicos. Interessam aos pesquisadores dessas áreas, dados

sobre mortalidade infantil, eficiência de medicamentos, incidência de doenças, causa de morte, etc. Os

dados referem-se a variáveis que são classificadas em Estatística, como qualitativas, ordinais e

quantitativas.

1.1. Variáveis

Em estatística, uma variável é um atributo mensurável que tipicamente varia entre indivíduos. As

variáveis são divididas em qualitativas e quantitativas.

Variável Quantitativa - São aquelas que são numericamente mensuráveis, por exemplo, a idade, a

altura, o peso. Estas ainda se subdividem em:

Variável Quantitativa Contínua: São aquelas que assumem valores dentro de um conjunto

contínuo, tipicamente os números reais. São exemplos, o peso ou a altura de uma pessoa.

Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito

ou enumerável, tipicamente números inteiros. Um exemplo é o número de filhos de uma pessoa.

Variável Qualitativa - São aquelas que se baseiam em qualidades e não podem ser mensuráveis

numericamente. Estas ainda se subdividem em:

Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem, por exemplo, a

classe social (A,B,C,D, ou E) e a variável "Peso" medida em 3 níveis (pouco pesados, pesados,

muito pesados). São variáveis qualitativas ordinais também, grau de instrução, status social,

estágio da doença.

Variável Qualitativa Nominal: São aquelas que não podem ser hierarquizadas ou ordenadas,

como a cor dos olhos, o local de nascimento, peso, altura.

1.2. Apuração de Dados

Os dados são registrados em fichas, com várias outras informações. Para obter apenas os

dados é preciso fazer uma apuração. Se a variável é qualitativa ou ordinal, a apuração resume-se a

simples contagem. Por exemplo, para obter o número de nascidos vivos de cada sexo, é preciso tomar

os prontuários e escrever numa folha de papel:

Feminino

Masculino

Depois, é preciso examinar os prontuários e fazer um traço, na linha correspondente a um dos

sexos, toda vez que o prontuário registrar que o nascido vivo é desse sexo. No exemplo, cada traço

representa um nascido vivo e cada quadrado, cortado pela diagonal, representa cinco nascidos vivos.

O total é dado pelo número de traços de cada linha.

Feminino - = 52

Masculino - = 48

Bioestatística Profa Claudia M. G. G. Franchi

6

Se a variável é quantitativa, a apuração consiste em anotar cada valor observado. Por exemplo,

para apurar dados de peso ao nascer, basta escrever os pesos, uma folha de papel. O número do

prontuário, escrito ao lado do peso ao nascer, facilita a posterior verificação da apuração. Veja o

exemplo:

Número do Prontuário Peso ao nascer

10.525 3,25

10.526 2,00

..... .....

..... .....

..... .....

10.624 3,20

1.3. População e Amostra

Entende-se por população, o conjunto de elementos que têm em comum, determinada

característica. Todo subconjunto não vazio e com menor numero de elementos do que a população

constitui uma amostra dessa população. As populações podem ser finitas, como o conjunto de alunos

de uma escola em determinado ano ou, infinitas, como o número de vezes que se pode jogar um dado.

Para certas finalidades, as populações finitas muito grandes são consideradas infinitas. Como

exemplo, considere as pessoas do sexo masculino com mais de 35 anos de idade, residentes na cidade

de São Paulo. O número dessas pessoas é matematicamente finito, mas tão grande que um registrador

ao analisar uma amostra de 500 pessoas, pode considerar a população como infinita. Os pesquisadores

trabalham com amostras, por vários motivos. Primeiro, é fato que as populações finitas só podem ser

estudadas através de amostras. Por exemplo, por maior que seja o número de vezes que uma pessoa

possa pesar um corpo sólido, o resultado será sempre uma amostra por que, teoricamente, todo corpo

pode ser pesado um número infinito de vezes.

Depois, as populações finitas muito grandes só podem ser estudadas através de amostras. Por

exemplo, o número de cobaias existentes no mundo em determinado período é, matematicamente,

finito, mas as pesquisas que usam cobaias só podem ser feitas com amostras, por que nenhum

pesquisador dispõe de todas as cobaias do mundo para o seu trabalho.

Finalmente, o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo

sumário de toda a população. Por exemplo, para estudar o efeito do flúor sobre a prevenção de cáries

em crianças, é melhor submeter uma amostra de crianças a exames periódicos minuciosos, do que

examinar rapidamente todas as crianças antes, e determinado tempo após o uso do flúor.

1.4. Técnicas de Amostragem

Definida a população, é preciso estabelecer a técnica de amostragem, isto é, o procedimento

que será adotado para escolher os elementos que irão compor a amostra. Conforme a técnica utilizada,

tem-se um tipo de amostra.

1.4.1. Amostra Casual Simples

A amostra casual simples é composta por elementos retirados ao acaso da população. Então

todo elemento da população tem igual probabilidade de ser escolhido para a mostra. Um exemplo ajuda

a entender essa técnica de amostragem.

Bioestatística Profa Claudia M. G. G. Franchi

7

Imagine que um professor quer obter uma mostra casual simples dos alunos de sua escola.

Para isso, pode organizar um sorteio com fichas numeradas, de zero a nove. Para fazer o sorteio, o

professor retira uma ficha de uma urna e anota o número. Esse número será o primeiro dígito do

número do aluno que será sorteado para a amostra. Feito isso, o professor recoloca a ficha na urna,

mistura, retira outra ficha e anota o número, que será o segundo dígito do número do aluno que será

sorteado para a amostra. Esse procedimento deve ser repetido até que sejam retirados todos os dígitos

do número do aluno sorteado.

Se a escola tem, por exemplo, 832 alunos, os números dos alunos têm três dígitos. Para sortear

um aluno, é preciso retirar três fichas da urna, uma de cada vez, sempre lembrando que a ficha retirada

deve ser recolocada na urna antes de nova retirada. O número de um dos alunos sorteados poderia

ser, por exemplo, 377 assim obtido:

Primeira ficha: 3

Segunda ficha: 7

Terceira ficha: 7

É claro que devem ser desprezados números maiores do que 832 (se a escola tem 832 alunos,

nenhum aluno recebeu número maior do que 832), números que já foram sorteados e o número 000. O

professor sorteia tantos números quantos são os alunos que ele quer na amostra.

1.4.2. Amostra Sistemática

Na amostra sistemática, os elementos são escolhidos não por acaso, mas por um sistema. No

exemplo, o professor terá organizado uma amostra sistemática se, em lugar de sortear os alunos,

chamar para a amostra todo aluno com número terminado em determinado dígito. Veja o esquema

dado em seguida. O professor chamou, para a amostra, todos os alunos com números terminados em

zero, assinalados no esquema com asteriscos. Então organizou uma amostra sistemática.

No Nome N

o Nome N

o Nome

1 21 41

. . .

. . .

*10 *30 *50

. . .

. . .

*20 *40 *60

Quando a população está organizada, é mais fácil obter uma amostra sistemática do que uma

amostra casual simples. Por exemplo, para obter uma amostra de 2% dos prontuários dos pacientes de

uma clínica, é mais fácil pegar o último de cada 50 prontuários do que fazer um sorteio até conseguir

2% do total de prontuários.

As amostras sistemáticas são muito usadas, mas exigem especial preocupação com o sistema

de seleção. Por exemplo, se os elementos da população estão em fila, não se devem selecionar os

“primeiros”, ou os “últimos”, nem mesmo “os do meio”, é preciso percorrer toda a fila e escolher, por

exemplo, o décimo de cada grupo de dez.

1.4.3. Amostra Estratificada

A amostra estratificada é composta por elementos provenientes de todos os estratos da

população. No exemplo, se o professor considera que os alunos de diferentes séries apresentam reais

Bioestatística Profa Claudia M. G. G. Franchi

8

diferenças, cada série é um estrato. O professor deve então, obter uma amostra de cada série (estrato)

e depois reunir todas as amostras, em uma só. Essa amostra final é estratificada.

Devem ser obtidas amostras estratificadas sempre que a população for constituída por

diferentes estratos. Por exemplo, se as pessoas que residem nos vários bairros de uma cidade são

diferentes, cada bairro é um estrato. Para obter uma amostra de pessoas dessa cidade, seria razoável

obter uma amostra de cada bairro e depois reunir todas as informações numa amostra estratificada.

1.4.4. Amostra de Conveniência

A amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente

por que dispunha deles. Então, se o professor tomar os alunos de sua classe como amostra de toda a

escola, estará usando uma amostra de conveniência.

Os estatísticos têm muitas restrições ao uso de amostras de conveniência. Mesmo assim, as

amostras de conveniência são comuns na área de saúde, onde se fazem pesquisas com pacientes de

uma só clínica ou de um só hospital. Mais ainda, as amostras de conveniência constituem muitas vezes

a única maneira de estudar determinado problema.

De qualquer forma, o pesquisador que utiliza amostras de conveniência precisa de muito sendo

crítico. Os dados podem ser tendenciosos. Por exemplo, para estimar a probabilidade de morte por

desidratação não se deve recorrer aos dados de um hospital. Como só são internados os casos graves,

é possível que a mortalidade entre pacientes internados seja muito maior do que entre pacientes não

internados. Consequentemente, a amostra de conveniência – constituída, neste exemplo, por pacientes

internados no hospital – seria tendenciosa.

Finalmente, o pesquisador que trabalha com amostras sempre pretende fazer inferência, isto é,

estender os resultados da amostra para toda a população. Então é muito importante caracterizar bem a

amostra e estender os resultados obtidos na amostra apenas para a população de onde a amostra

proveio.

1.5. Exercícios – Capítulo 1

1. Os prontuários dos pacientes de um hospital estão organizados em um arquivo, por ordem

alfabética. Qual é a maneira mais rápida de amostrar 1/3 do total dos prontuários?

2. Um pesquisador trem dez gaiolas que contém cada uma, seis ratos. Como o pesquisador

pode solucionar dez ratos para a mostra?

3. Para levantar dados sobre o número de filhos por casal, em uma comunidade, um

pesquisador organizou um questionário que enviou, pelo correio, a todas as residências. A resposta ao

questionário era facultativa, pois o pesquisador não tinha condições de exigir a resposta. Nesse

questionário perguntava-se o número de filhos por casal morador na residência. Você acha que os

dados assim obtidos têm algum tipo de tendenciosidade?

4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio usando

a técnica de amostragem sistemática. Para isso, o pesquisador visitará cada domicílio selecionado. Se

nenhuma pessoa estiver presente na ocasião da visita, o pesquisador excluirá o domicílio da amostra.

Esta última determinação introduz tendenciosidade? Por quê?

5. Muitas pessoas acreditam que as famílias se tornaram menores. Suponha que, para estudar

essa questão, foi selecionada uma amostra de 2.000 casais e perguntou-se quantos filhos eles tinham,

quantos filhos tinham seus pais e quantos filhos tinham seus avós. O procedimento introduz

tendenciosidade nos dados? Por quê?

Bioestatística Profa Claudia M. G. G. Franchi

9

6. Dada uma população de 4 indivíduos, X, W, Y, Z, quantas amostras casuais simples de

tamanho 2 podem ser obtidas? Quais são essas amostras?

7. Dada uma população de 8 elementos, A, B, C, D, E, F, G, e H, descreva três formas

diferentes de obter uma amostra sistemática de 4 elementos.

8. Dada uma população de 40 alunos, descreva uma forma de obter uma amostra casual

simples de 6 alunos.

9. Organize uma lista com 10 nomes de pessoas em ordem alfabética. Depois escreva uma

forma de obter uma amostra sistemática de 5 indivíduos.

10. Em uma pesquisa de mercado para serviços odontológicos tomou-se a lista telefônica, onde

os nomes dos assinantes estão organizados em ordem alfabética do último sobrenome, e se amostrou

o décimo de cada 10 assinantes. Critique esse procedimento.

11. Classifique as variáveis em qualitativa (nominal ou ordinal) e quantitativa (discreta ou

contínua) e dê exemplo de um valor (numérico ou não numérico) para cada item.

a) Estado civil de uma pessoa: b) Marcas de carros em um estacionamento: c) Salário de um funcionário de uma empresa: d) Número de acidentes de trabalho em uma empresa: e) Cor dos cabelos das modelos de uma agencia de modelos: f) Cor dos olhos: g) Grau de instrução: h) Número de filhos de um casal: i) Peso e altura dos alunos de uma escola:

Bioestatística Profa Claudia M. G. G. Franchi

10

2. CAPÍTULO 2 - APRESENTAÇÃO DE DADOS EM TABELAS

Os dados devem ser apresentados em tabelas construídas de acordo com as normas técnicas

ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE.

2.1. Componentes das Tabelas

As tabelas têm título, corpo, cabeçalho e coluna indicadora. O título explica o que a tabela

contém. O corpo é formado pelas linhas e colunas de dados. O cabeçalho especifica conteúdo das

colunas, e a coluna indicadora especifica o conteúdo das linhas. Como exemplo, veja a tabela a seguir:

População brasileira residente, com 15 anos e mais,

segundo a alfabetização, de acordo com o senso demográfico de 1980

Alfabetização Frequência

Sabem ler e escrever 54.793.268

Não sabem ler e escrever 18.716.847

Sem declaração 31.828

Fonte: IBGE (1988)

Na tabela acima, observe o título:

População brasileira residente, com 15 anos e mais,

segundo a alfabetização, de acordo com o senso demográfico de 1980

O cabeçalho é constituído pelas palavras:

Alfabetização Frequência

A coluna indicadora é constituída pelas especificações:

Sabem ler e escrever

Não sabem ler e escrever

Sem declaração

O corpo da tabela é formado pelos números:

54.793.268

18.716.847

31.828

As tabelas podem apresentar, além das frequências, as frequências relativas e o total. Para

obter a frequência relativa de uma dada categoria, divide-se a frequência dessa categoria pela soma

das frequências. O resultado, multiplicado por 100, é uma porcentagem. O total da coluna é escrito

entre dois traços horizontais.

Bioestatística Profa Claudia M. G. G. Franchi

11

População brasileira residente, com 15 anos e mais,

segundo a alfabetização, de acordo com o senso demográfico de 1980

Alfabetização Frequência Frequência

Relativa

Sabem ler e escrever 54.793.268 74,51

Não sabem ler e escrever 18.716.847 25,45

Sem declaração 31.828 0,04

Total....................................................... 73.541.943 100,00

Fonte: IBGE (1988)

As tabelas podem conter fonte ou notas. A fonte dá indicação da entidade, ou do pesquisador,

ou dos pesquisadores que publicaram ou forneceram os dados. Como exemplo na tabela citada como

exemplo, a fonte é o IBGE, pois foi essa fundação que publicou os dados.

As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apuração.

Observe a tabela abaixo. A nota informa que só foram apurados nascimentos ocorridos no ano de

registro.

Nascidos vivos registrados segundo o ano do registro

Ano do Registro Frequência

1984 2.559.038

1985 2.619.604

1986 2.779.253

Fonte: IBGE (1988)

Nota: Nascimentos ocorridos no ano de registro

2.2. Tabelas de Contingência

Muitas vezes os elementos da amostra ou da população são classificados de acordo com dois

fatores. Os dados devem então ser apresentados em tabelas de contingência, isto é, em tabelas de

dupla entrada, cada entrada relativa a um dos fatores. Como exemplo, veja a tabela abaixo que

representa o número de nascidos vivos registrados. Note que eles estão classificados segundo dois

fatores: o ano de registro e o sexo.

Nascidos vivos registrados segundo o ano de registro e o sexo

Ano de

Registro

Sexo

Total

Masculino Feminino

1984 1.307.758 1.251.280 2.559.038

1985 1.339.059 1.280.545 2.619.604

1986 1.418.050 1.361.203 2.779.253

Fonte: IBGE (1988)

Nota: Nascimentos ocorridos no ano de registro

As tabelas de contingência podem apresentar frequências relativas, além de frequências

simples. As frequências relativas dão estimativas de riscos, isto é, dão estimativas de probabilidades de

dano. Veja o exemplo abaixo:

Bioestatística Profa Claudia M. G. G. Franchi

12

Recém-nascidos Segundo a Época do Ataque de Rubéola na Gestante e a

Condição de Normal ou Defeituoso

Época do ataque

Condição

Total

Frequência

Relativa de

defeituosos

Normal Defeituoso

Até o 3º mês 36 14 50 28,0%

Depois do 3º

mês

51 3 54 5,6%

Fonte: HILL et all. (1958)

As frequências relativas apresentadas na tabela acima estimam o risco de um recém-nascido

ser defeituoso em função da época em que a gestante foi atacada de rubéola. Note que a frequência

relativa de defeituosos (risco) é maior quando a gestante foi atacada de rubéola no primeiro trimestre da

gestação. Diz-se então que a época do ataque de rubéola é um fator de risco na ocorrência de recém-

nascidos defeituosos.

2.3. Exercícios – Capítulo 2

1. Faça uma pesquisa sobre os dados dos seus colegas de sala e monte tabelas com as seguintes

variáveis:

a. Idade

b. Sexo

c. Cidade de Residência

d. Idade

e. Número de Filhos

f. Estado Civil

g. Número de Irmãos

Bioestatística Profa Claudia M. G. G. Franchi

13

3. CAPITULO 3 - TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições

de seus valores).

3.1. Tabela primitiva ou dados brutos:

É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil

formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não

ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

3.1.1. ROL

É a tabela obtida após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

3.2. Distribuição de frequência sem intervalos de classe

É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de

tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja

exemplo abaixo:

Dados Frequência

41 3

42 2

43 1

44 1

45 1

46 2

50 2

51 1

52 1

54 1

57 1

58 2

60 2

Total 20

3.3. Distribuição de frequência com intervalos de classe

Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores

em vários intervalos de classe.

Bioestatística Profa Claudia M. G. G. Franchi

14

Classes Frequências

41 45 7

45 49 3

49 53 4

53 57 1

57 61 5

Total 20

As tabelas com grande número de dados são cansativas e não dão ao leitor visão rápida e

global do fenômeno. Para isso, é preciso que os dados estejam organizados em uma tabela de

distribuição de frequências. A partir de agora, explicaremos passo a passo, a construção desse tipo

de tabela usando, como exemplo os dados na tabela Peso ao nascer de nascidos vivos em

quilogramas.

Imagine que, para dar uma ideia sobre o peso ao nascer de nascidos vivos, o pesquisador irá

apresentar não os pesos observados, mas o número de nascidos vivos por faixas de peso. Deve,

então, construir uma tabela de distribuição de frequências.

Peso ao nascer de nascidos vivos, em quilogramas

2.522 3.200 1.900 4.100 4.600 3.400

2.720 3.720 3.600 2.400 1.720 3.400

3.125 2.800 3.200 2.700 2.750 1.570

2.250 2.900 3.300 2.450 4.200 3.800

3.220 2.950 2.900 3.400 2.100 2.700

3.000 2.480 2.500 2.400 4.450 2.900

3.725 3.800 3.600 3.120 2.900 3.700

2.890 2.500 2.500 3.400 2.920 2.120

3.110 3.550 2.300 3.200 2.720 3.150

3.520 3.000 2.950 2.700 2.900 2.400

3.100 4.100 3.000 3.150 2.000 3.450

3.200 3.200 3.750 2.800 2.720 3.120

2.780 3.450 3.150 2.700 2.480 2.120

3.155 3.100 3.200 3.300 3.900 2.450

2.150 3.150 2.500 3.200 2.500 2.700

3.300 2.800 2.900 3.200 2.480 .......

3.250 2.900 3.200 2.800 2.450 .......

Primeiro, é preciso definir as faixas de peso que recebem tecnicamente o nome de classes.

Observe os dados apresentados na tabela acima. O menor valor é de 1.570 Kg e o maior é de 4.600

Kg. Podem então ser definidas classes de 1,5 a 2,0 Kg, de 2,0 a 2,5 Kg, e assim por diante, como

mostra o esquema dado a seguir:

1,5 2,0

Bioestatística Profa Claudia M. G. G. Franchi

15

2,0 2,5

2,5 3,0

3,0 3,5

3,5 4,0

4,0 4,5

4,5 5,0

Na classe de 1,5 a menos de 2,0 Kg são colocados desde nascidos com 1,5 Kg até os que

nasceram com 1.999 Kg; na classe de 2,0 a menos de 2,5 Kg, são colocados desde nascidos com 2,0

Kg até os que nasceram com 2,499 Kg, e assim por diante. Logo, cada classe cobre um intervalo de 0,5

Kg, ou seja, cada intervalo de classe é de 0,5 Kg. É mais fácil trabalhar com intervalos de classe

iguais. As distribuições das frequências, obtidas a partir da tabela do Peso ao nascer de nascidos vivos,

em quilogramas, é dada a seguir:

Classe Frequência

1,5 2,0 = 3

2,0 2,5 = 16

2,5 3,0 = 31

3,0 3,5 = 34

3,5 4,0 = 11

4,0 4,5 = 4

4,5 5,0 = 1

Denominam-se extremos de classe os limites dos intervalos de classe. Deve ficar muito claro se os

valores iguais aos extremos devem ou não ser incluídos na classe. Recomenda-se adotar a notação 1,5

2,0, 2,0 2,5 etc. Isto significa que o intervalo „e fechado à esquerda, isto é, pertencem à classe os

valores iguais ao extremo inferior (por exemplo, 1,5 na primeira classe). Também significa que o

intervalo é fechado à direita, isto é, não pertencem à classe os valores iguais ao extremo superior (por

exemplo, 2,0 na primeira classe).

Bioestatística Profa Claudia M. G. G. Franchi

16

Numa tabela de distribuição de frequências também podem ser apresentados os pontos médios

da classe. O ponto médio é dado pela soma dos extremos da classe, dividia por 2. Para a classe 1,5

2,0, o ponto médio é:

Uma tabela típica de distribuição de frequências tem então, três colunas: a da esquerda, onde

estão escritas as classes; a do meio, onde estão escritos os pontos médios; e a da direita, onde estão

escritas as frequências, isto é, o numero de elementos de cada classe. Veja a tabela a seguir:

Nascidos vivos segundo o peso ao nascer, em quilogramas

Classe Ponto Médio Frequência

1,5 2,0 1,75 3

2,0 2,5 2,25 16

2,5 3,0 2,75 31

3,0 3,5 3,25 34

3,5 4,0 3,75 11

4,0 4,5 4,25 4

4,5 5,0 4,75 1

Nem sempre estarão definidos o extremo inferior da primeira classe ou o extremo superior da

última classe. Observa a tabela abaixo. O extremo superior da última classe não esta definido. Esta

tabela também exemplifica o uso de intervalos de classe diferentes.

Mulheres com 30 anos de Idade Segundo a Pressão Sanguínea

Sistólica, em Milímetros de Mercúrio

Classe Ponto Médio Frequência

90 100 95 6

100 105 102,5 11

105 110 107,5 12

110 115 112,5 17

115 120 117,5 18

120 125 122,5 11

125 130 127,5 9

130 135 132,5 6

135 140 137,5 4

Bioestatística Profa Claudia M. G. G. Franchi

17

140 150 145 4

150 160 155 1

160 e mais ... 1

As tabelas de distribuição de frequências mostram a distribuição da variável, mas perdem em

exatidão. Isso porque todos os dados passam a ser representados pelo ponto médio da classe a que

pertencem. Por exemplo, a tabela acima mostra que seis mulheres apresentaram pressão sanguínea

sistólica com o ponto médio igual a 95, mas não d‟a informação exata sobre a pressão de cada uma

delas.

O numero de classes deve ser escolhido pelo pesquisador, em função do que ele quer mostrar.

Em geral, convém estabelecer de 5 a 20 classes. Se o numero de classes for demasiado pequeno (por

exemplo, 3) perde-se muita informação. Se o numero de classes for grande (por exemplo, 30) tem-se

pormenores desnecessários. Mas não existe um numero “ideal” de classes, embora existam até

formulas para estabelecer quantas classes devem ser construídas. Uma dessas fórmulas „e a seguinte:

Onde n é o número de dados. O número de classes é um inteiro próximo de k. Para entender

como se aplica esta fórmula, veja a tabela peso ao nascer dos nascidos vivos, como n=100, tem-se que:

ou seja, deveriam ter sido construídas 7 ou 8 classes.

É importante deixar claro, aqui, que o resultado obtido por esta formula pode ser usado como

referencia, mas cabe ao pesquisador determinar o numero de classes que pretende organizar.

Finalmente, quando se constrói uma tabela de distribuição de frequências, é melhor usar, como

extremos de classes, números fáceis de trabalhar. No caso do peso ao nascer dos nascidos vivos,

foram definidas 7 classes e foram estabelecidos extremos com valores fáceis, como 1,5 e 2,0.

3.4. Exercícios – Capítulo 3

1. De acordo com o IBGE (1988), a distribuição dos suicídios ocorridos no Brasil em 1986,

segundo a causa atribuída foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por

doença mental, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas.

Apresente essa distribuição em uma tabela.

2. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela

abaixo, apresente também as frequências relativas:

Pressão arterial, em milímetros de mercúrio, de cães adultos

anestesiados e após laparotomia

130,0 105,0 120,0 111,5 99,0 116,0 82,5

107,5 125,0 100,0 107,5 120,0 143,0 115,0

135,0 130,0 135,0 127,5 90,5 104,5 136,5

100,0 145,0 125,0 104,5 101,5 102,5 101,5

134,5 158,5 110,0 102,5 90,5 107,5 124,0

Bioestatística Profa Claudia M. G. G. Franchi

18

121,5 135,0 102,0 119,5 115,5 125,5 117,5

107,5 140,0 121,5 107,5 113,0 93,0 103,5

3. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de Trânsito, 27.306 casos

de vitimas fatais, assim distribuídos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faça

uma tabela para apresentar esses dados. Apresente também as frequências relativas e o total.

4. De posse da tabela abaixo, calcule as frequências relativas de não sobreviventes.

Pacientes com câncer de mama segundo a faixa de idade por ocasião

Do diagnostico e sobrevivência por três anos

Sobrevivência

Faixa de idade Sim Não

Menor de 50 anos 11 6

De 50 a 70 anos 18 8

Mais de 70 anos 15 9

Fonte: MORRISON (1973)

5. De posse da tabela abaixo, calcule as frequências relativas em cada linha, isto „e, calcule a

proporção de estabelecimentos de saúde, públicos e particulares, de cada espécie.

Estabelecimentos de saúde, públicos e particulares

Por espécie. Brasil, 1985.

Estabelecimentos

Faixa de idade Públicos Particulares

Hospital 1.002 5.132

Pronto-socorro 150 156

Policlínicas 1.531 6.136

Outros 14.393 472

Fonte: IBGE (1988)

6. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela

abaixo usando intervalos de classes iguais. Depois faça outra tabela, com os seguintes intervalos: 1 dia,

2 ou 3 dias, de 4 a 7 dias, de 8 a 14 dias, mais de 14 dias.

Tempo de internação, em dias, de pacientes acidentados

no trabalho, em um dado hospital

7 8 1 7 13 6

12 12 3 17 4 2

4 15 2 14 3 5

10 8 9 8 5 3

2 7 14 12 10 8

1 6 4 7 7 11

7. Ao nascer, os bebês são pesados e medidos, para saber se estão dentro das tabelas de peso

e altura esperados. Estas duas variáveis são:

a) qualitativas

b) ambas discretas

Bioestatística Profa Claudia M. G. G. Franchi

19

c) ambas contínuas

d) contínuas e discretas

e) discreta e contínua

8. A parcela da população convenientemente escolhida para representa-la é chamada de:

a) variável

b) rol

c) amostra

d) dados brutos

e) nada podemos afirmar, porque a informação é incompleta

9. Um conjunto de 100 notas de matemática, de alunos do sexo masculino, tiradas dos arquivos

da secretaria da escola, constitui:

a) um rol

b) uma tabela

c) uma relação de dados brutos

d) uma distribuição de frequência

10. Por definição, rol é qualquer série ordenada de valores referentes a uma mesma

variável. Então, dadas as séries da mesma variável x:

I. –2, 4, 5, 6, 7

II. 1, 3, 3, 6, 7

III. 8, 7, 5, 2, 1

IV. 5, 4, 4, -1

Podemos afirmar que:

a) todas elas constituem róis

b) só a série I constitui um rol

c) a série II não é um rol, mas as outras sim

d) apenas as séries I e IV não são róis

e) somente a série III é um rol, as demais não

Bioestatística Profa Claudia M. G. G. Franchi

20

4. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (COM INTERVALOS

DE CLASSE)

Classe Ponto Médio Frequência

1,5 2,0 1,75 3

2,0 2,5 2,25 16

2,5 3,0 2,75 31

3,0 3,5 3,25 34

3,5 4,0 3,75 11

4,0 4,5 4,25 4

4,5 5,0 4,75 1

4.1. Classe

São os intervalos de variação da variável e é simbolizada por i e o número total de classes

simbolizada por k. Exemplo, na tabela acima, K=7 e 2,5 3,0 é a terceira classe, onde i=3.

4.2. Limite superior e limite inferior da classe

São os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior

número é o limite superior ( Li ) da classe. Exemplo, em 2,5 3,0 l3=2,5 e L3=3,0. O símbolo

representa um intervalo fechado à esquerda e aberto à direita. O dado 3,0 do ROL não pertence à

classe 3 e sim a classe 4 representada por 3,0 3,5.

4.3. Amplitude de classe

É obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por

. Exemplo, na tabela acima, na classe k=1, hi = 2,0 - 1,5 = 0,5.

4.4. Amplitude total da distribuição

É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT =

L(max) - l(min). Ex: na tabela anterior AT = 5,0–1,5 = 3,5.

Bioestatística Profa Claudia M. G. G. Franchi

21

4.5. Amplitude total da amostra (ROL)

É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin.

Em nosso exemplo AA = 4.600–1.570 = 3.030. (AT sempre será maior que AA).

4.6. Ponto Médio de classe

É o ponto que divide o intervalo de classe em duas partes iguais. Exemplo, em 2,0 2,5, o

ponto médio x3= (2,0+2,5)/2= 2,25.

4.7. Exercícios – Capítulo 4

1. A tabela abaixo apresenta a distribuição de frequência dos salários mensais em reais, de 65

empregados da companhia P & R.

1 5.000 ⊢ 6.000 8

2 6.000 ⊢ 7.000 10

3 7.000 ⊢ 8.000 16

4 8.000 ⊢ 9.000 14

5 9.000 ⊢ 10.000 10

6 10.000 ⊢ 11.000 5

7 11.000 ⊢ 12.000 2

Total ............................................ 65

Determinar:

a) A amplitude Total;

b) O limite superior da quinta classe

c) O limite inferior da sexta classe;

d) A amplitude do quinto intervalo de classe;

e) A classe do 40º empregado;

f) A percentagem de empregados cuja renda ultrapassa R$10.000,00 por mês;

g) A percentagem de empregados que ganham menos de R$8.000,00 por mês;

h) A percentagem de empregados que ganham menos de R$10.000,00 e pelo menos R$6.000,00

por mês;

2. A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:

Áreas (m

2)

300

400

500

600

700

800

900

1000

1100

1200

No

de Lotes

14 46 58 76 68 62 48 22 6

Com referência a essa tabela, determine:

a) A amplitude total.

Bioestatística Profa Claudia M. G. G. Franchi

22

b) O limite superior da quinta classe.

c) O limite inferior da oitava classe.

d) O ponto médio da sétima classe.

e) A amplitude do intervalo da segunda classe.

f) A frequência da quarta classe.

g) A frequência relativa da sexta classe.

h) A frequência acumulada da quinta classe.

i) O número de lotes cuja área não atinge 700m2.

j) O número de lotes cuja área atinge e ultrapassa 800m2.

k) A percentagem dos lotes cuja área não atinge 600m2.

l) A percentagem dos lotes cuja área seja maior ou igual a 900m2.

m) A percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1000m2.

n) A classe do 72º lote.

o) Até que classe estão incluídos 60% os lotes.

3. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa

de ônibus.

N

o de

Acidentes 0 1 2 3 4 5 6 7

No de

Motoristas 20 10 16 9 6 5 3 1

Determine:

a) O número de e a percentagem de motoristas que não sofreram nenhum acidente.

b) O número e a percentagem de motoristas que sofreram pelo menos 4 acidentes.

c) O número e a percentagem de motoristas que sofreram menos de 3 acidentes

d) O número e a percentagem de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes.

e) A percentagem dos motoristas que sofreram no máximo 2 acidentes.

4. Complete a tabela abaixo:

i Classes fi fr f% F

1 0 ⊢ 8

2 8 ⊢ 16

3 16 ⊢ 24

4 24 ⊢ 32

5 32 ⊢ 40

4

10

14

9

3

= 40 = 1,00

5. Complete os dados que faltam na distribuição de frequência:

i xi fi fri Fi

1 0 1 0,05

2 1 0,15 4

3 2 4

Bioestatística Profa Claudia M. G. G. Franchi

23

4 3 0,25 13

5 4 3 0,15

6 5 2 18

7 6 19

8 7

6. Complete os dados que faltam na distribuição de frequência:

i Classes xi fi Fi

1 0⊢ 2 1 4

2 2⊢ 4 8

3 4⊢ 6 5 30

4 7 27

5 8⊢ 10 15 72

6 10⊢ 12 83

7 13 10 93

8 14⊢ 16

100

7. Considerando as notas de um teste de inteligência aplicado a 100 alunos:

64 78 66 82 74 103 78 86 103 87

73 95 82 89 73 92 85 80 81 90

78 86 78 101 85 98 75 73 90 86

86 84 86 76 76 83 103 86 84 85

76 80 92 102 73 87 70 85 79 93

82 90 83 81 85 72 81 96 81 85

68 96 86 70 72 74 84 99 81 89

71 73 63 105 74 98 78 78 83 96

95 94 88 62 91 83 98 93 83 76

94 75 67 95 108 98 71 92 72 73

Forme uma distribuição de frequência.

Bioestatística Profa Claudia M. G. G. Franchi

24

5. GRÁFICOS ESTATÍSTICOS

São representações visuais dos dados estatísticos que devem corresponder, mas nunca

substituir as tabelas estatísticas.

Os gráficos são de extrema importância na visualização e interpretação de informações e dados

acerca de temas de aspectos naturais, sociais e econômicos.

Os gráficos são representações bastante difundidas em diferentes tipos de informativos, dentre

eles, os principais estão em livros, revistas, jornais impressos, além da televisão e a internet, que fazem

o uso continuamente para apresentar informações à população em geral ou grupos específicos de

pesquisas.

Diante dessas afirmações os gráficos consistem em uma representação constituída por formas

geométricas elaboradas de maneira precisa, oriundas de dados numéricos resultados de pesquisas e

organizadas em uma tabela. Os gráficos são classificados segundo sua forma e podem ser de colunas,

de linhas e circulares.

Existem normas adicionais para a construção de gráficos, ditadas pela fundação IBGE. Assim,

todo gráfico deve apresentar título e escala. O título pode ser colocado tanto acima como abaixo do

gráfico. As escalas devem crescer da esquerda para a direita, e de baixo para cima. As legendas

explicativas devem ser colocadas de preferência, à direita do gráfico.

Observe os tipos de gráficos a partir do exemplo da tabela com os dados da população brasileira

residente, com 15 anos e mais segundo o estado conjugal.

População Brasileira residente, com 15 anos e mais, segundo o estado

conjugal, de acordo com o censo demográfico de 1980

Estado conjugal Frequência Percentual

Solteiros (1) 25.146.484 34,18

Casados (2) 41.974.865 57,06

Separados 1.816.046 2,47

Viúvos 3.616.046 4,92

Sem declaração 1.005.234 1,37

Fonte: IBGE

Nota: Estão computados, como separados, os separados, os desquitados e os divorciados

(1) Exclusive as pessoas solteiras, vivendo em união consensual estável

(2) Inclusive 4.939.528 pessoas vivendo em união consensual estável

5.1. Gráfico de Barras

O gráfico de barras é usado para apresentar variáveis qualitativas ou ordinais. Para fazer um

gráfico de barras, primeiro se traça o sistema de eixos cartesianos. Depois se colocam, no eixo das

abscissas, as categorias da variável em estudo. Em seguida constroem-se barras retangulares, com

base no eixo das abscissas e altura igual à frequência, ou à frequência relativa, da respectiva categoria.

As barras devem ser desenhadas separadas para ficar claro que a variável é qualitativa ou ordinal.

Bioestatística Profa Claudia M. G. G. Franchi

25

Figura 1: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.

5.2. Gráfico de Colunas

Figura 2: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.

5.3. Gráfico de Setores

O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais. Para

fazer um gráfico de setores, primeiro se traça uma circunferência que, como se sabe, tem 360º. Essa

circunferência representa o total, ou seja, 100%. Dentro dessa circunferência devem ser representadas

as categorias da variável em estudo. Para isso, toma-se a frequência relativa de cada categoria e

calcula-se o ângulo central, da seguinte maneira: se 100% correspondem a 360º, uma categoria com

frequência relativa de f% terá um ângulo central x, tal que:

Logo, valor do ângulo central x será:

Bioestatística Profa Claudia M. G. G. Franchi

26

Os ângulos centrais das demais categorias são obtidos da mesma maneira. Para fazer o gráfico

de setores marcam-se, na circunferência, os ângulos calculados, separando-os com o traçado dos

raios. Observe o gráfico de setores apresentado abaixo:

5.4. Gráfico de Linhas

Gráfico de Linhas: É um gráfico que apresenta os dados por meio de linhas, sempre que as

categorias utilizadas representarem um intervalo de tempo.

Bioestatística Profa Claudia M. G. G. Franchi

27

5.5. Exercícios – Capítulo 5

1. Faça um gráfico de barras e um gráfico de setores para apresentar os dados da tabela a

seguir:

Suicidas segundo o sexo. Brasil, 1986

Sexo Frequência Percentual

Masculino ............. 3.562 74,93

Feminino .............. 1.192 25,07

Fonte: IBGE: 1988

2. Utilizando o gráfico em colunas, represente a tabela:

3. Utilizando o gráfico em linhas, represente a tabela:

Bioestatística Profa Claudia M. G. G. Franchi

28

6. REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO

6.1. Histograma

Os dados apresentados em tabelas de distribuição de frequências são apresentados

graficamente em histogramas. Para construir um histograma, primeiro se traça o sistema de eixos

cartesianos. Depois, se os intervalos de classe são iguais, traçam-se barras retangulares com bases

iguais, correspondendo aos intervalos de classe, e com alturas determinadas pelas respectivas

frequências.

Quando os intervalos de classe são diferentes, para construir um histograma é preciso calcular

as densidades de frequência relativa. Entende-se por densidade de frequência relativa o quociente

entre a frequência relativa e o intervalo de classe, isto é:

6.2. Polígono de Frequências

Os dados apresentados na tabela de distribuição de frequências também podem ser

apresentados em gráficos denominados polígonos de frequências. Para fazer esse tipo de gráfico,

primeiro se traça o sistema de eixos cartesianos. Depois, se os intervalos de classe são iguais,

marcam-se pontos com abscissas iguais aos pontos médios de classes e ordenadas iguais às

respectivas frequências. Se os intervalos de classe são diferentes, marcam-se pontos com abscissas

iguais aos pontos médios de classes e ordenadas iguais às respectivas densidades de frequência

relativas.

Para fechar o polígono, unem-se os extremos da figura com o eixo horizontal, nos pontos de

abscissas iguais aos pontos médios de uma classe imediatamente inferior à primeira, e de uma classe

imediatamente superior à última.

Bioestatística Profa Claudia M. G. G. Franchi

29

6.3. Exercícios – Capítulo 6

1. Consideremos os dados da Tabela a seguir.

Preço médio da gasolina comum para áreas selecionadas

dos Estados Unidos, março de 1975, em centavos de dólar.

Área Preço por galão Área Preço por galão

Atlanta

Baltimore

Boston

Buffalo

Chicago

Cincinnati

Cleveland

Dallas

Detroit

Houston

Kansas City

53.4

55.1

53.9

53.4

54.8

53.3

53.9

49.1

53.7

47.9

49.6

Los Angeles

Milwaukee

Minneapolis

New York

Philadelphia

Pittsburgh

St. Louis

San Diego

San Francisco

Seattle

Washington

53.5

50.1

50.3

55.2

52.9

53.4

52.3

55.3

56.8

52.7

55.2

Vamos supor que quiséssemos organizar aqueles preços em uma distribuição de frequências com cerca de 5 classes. Determinar a amplitude conveniente de cada intervalo, de tal forma que todos os intervalos de classe tenham iguais amplitudes, e construir a tabela de frequências fixando o limite inferior da primeira classe em 47.0. Construir o histograma e o polígono de frequência da distribuição.

2. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe.

162 163 148 166 169 154 170 166

164 165 159 175 155 163 171 172

170 157 176 157 157 165 158 158

160 158 163 165 164 178 150 168

166 169 152 170 172 165 162 164

a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe? c) Construir uma tabela de frequências simples absoluta e relativa das alturas dos alunos admitindo

que o limite inferior da 1a classe seja 148 cm. d) Determinar os pontos médios das classes.

3. Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinados municípios do Estado:

144 152 159 160 160 151 157 146 154 145

141 150 142 146 142 141 141 150 143 158

Construir a tabela de frequências simples e acumuladas (“abaixo de” e “acima de”) tanto absolutas quanto relativas.

Bioestatística Profa Claudia M. G. G. Franchi

30

7. MEDIDAS DE POSIÇÃO

7.1. Introdução

São as estatísticas que representam uma série de dados orientando-nos quanto à posição da

distribuição em relação ao eixo horizontal do gráfico da curva de frequência.

As medidas de posições mais importantes são as medidas de tendência central ou promédias

(verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais).

As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.

Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e

biquadrática.

As outras medidas de posição são as separatrizes,que englobam: a própria mediana, os decis,

os quartis e os percentis.

.

7.2. Média Aritmética:

É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.

onde xi são os valores da variável e n o número de valores.

7.2.1. Dados não agrupados

Quando desejamos conhecer a média dos dados não agrupados em tabelas de frequências,

determinamos a média aritmética simples.

Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15,

16, 18 e 12 quilos, temos, para venda média diária na semana de:

7.2.2. Desvio em relação à média:

É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:

Bioestatística Profa Claudia M. G. G. Franchi

31

Designando o desvio por , temos:

d1 = 10 - 14 = - 4 , ...

d2 = 14 - 14 = 0 ,

d3 = 13 - 14 = - 1 , ...

d4 = 15 - 14 = 1 ,...

d5 = 16 - 14 = 2 ,...

d6 = 18 - 14 = 4 ...e. ..

d7 = 12 - 14 = - 2.

.

7.2.3. Propriedades da média aritmética

1ª Propriedade:

A soma algébrica dos desvios em relação à média é nula.

No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

2ª propriedade:

Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média

do conjunto fica aumentada (ou diminuída) dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos:

Y = 12+16+15+17+18+20+14 / 7 = 16 quilos ou

Y = .+ 2 = 14 +2 = 16 quilos

3ª propriedade:

Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a

média do conjunto fica multiplicada (ou dividida) por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos:

Y = 30+42+39+45+48+54+36 / 7 = 42 quilos ou

7.2.4. Dados agrupados sem intervalo de classe

Bioestatística Profa Claudia M. G. G. Franchi

32

Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o

número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família:

Nº de meninos frequência = fi

0 2

1 6

2 10

3 12

4 4

34

Como as frequências são números indicadores da intensidade de cada valor da variável, elas

funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada,

dada pela fórmula:

..xi. ..fi. ..xi.fi .

0 2 0

1 6 6

2 10 20

3 12 36

4 4 16

34 78

Onde temos:

7.3. Exercícios – Capítulo 7

1. Complete o esquema para cálculo da média aritmética da distribuição:

xi 1 2 3 4 5 6

fi 2 4 6 8 3 1

Temos:

1 2 2

2 3

3 6

4 8

Bioestatística Profa Claudia M. G. G. Franchi

33

5 3

6 1

7.3.1. Dados agrupados com intervalo de classe

Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo

de classe coincidem com o seu ponto médio e determinamos a média aritmética ponderada por meio

da fórmula:

Onde, é o ponto médio da classe:

Consideremos a distribuição:

I Estaturas (cm) fi

1 150 |----- 154 4

2 154 |----- 158 9

3 158 |----- 162 11

4 162 |----- 166 8

5 166 |----- 170 5

6 170 |----- 174 3

40

Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos

médios e outras para os produtos xi.fi.

i Estaturas (cm) fi xi xi.fi

1 150 |----- 154 4 152 608

2 154 |----- 158 9 156 1404

3 158 |----- 162 11 160 1760

4 162 |----- 166 8 164 1312

5 166 |----- 170 5 168 840

6 170 |----- 174 3 172 516

Bioestatística Profa Claudia M. G. G. Franchi

34

40

6440

Como, neste caso:

7.4. Exercícios:

1. Complete o esquema para cálculo da média aritmética da distribuição de frequência:

Custo (R$)

450 550 650 750 850 950 1050 1150

8 10 11 16 13 5 1

Temos:

1 500 8 4.000

2 10

3 11

4 16

5 13

6 5

7 1.100 1

Logo,

Bioestatística Profa Claudia M. G. G. Franchi

35

7.5. MODA - Mo

É o valor que ocorre com maior frequência em uma série de valores.

Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o

salário recebido pelo maior número de empregados dessa fábrica.

.

7.5.1. Dados não agrupados

A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se

repete.

Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes

que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

.Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a

série tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é

bimodal.

7.5.2. Dados agrupados sem intervalo de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor

da variável de maior frequência.

Ex: Qual a temperatura mais comum medida no mês abaixo:

Temperaturas Frequência

0º C 3

1º C 9

2º C 12

3º C 6

Bioestatística Profa Claudia M. G. G. Franchi

36

Resposta: 2º C é a temperatura modal, pois é a de maior frequência.

7.5.3. Dados agrupados com intervalo de classe

A classe que apresenta a maior frequência é denominada classe modal. Pela definição,

podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os

limites da classe modal.

O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe

modal. Damos a esse valor a denominação de moda bruta.

Onde:

l* = limite inferior da classe modal e

L* = limite superior da classe modal

Assim, para a distribuição:

I Estaturas (cm) fi

1 150 |----- 154 4

2 154 |----- 158 9

3 158 |----- 162 11

4 162 |----- 166 8

5 166 |----- 170 5

6 170 |----- 174 3

40

Temos que a classe modal é i = 3, l* = 158 e L* = 152.

Como,

Vem:

7.5.4. Cálculo da Moda: Método mais elaborado pela fórmula de

CZUBER:

Bioestatística Profa Claudia M. G. G. Franchi

37

na qual:

= limite inferior da classe modal.....

= amplitude da classe modal

= ;

= ;

sendo:

a frequência simples da classe modal;

a frequência simples da classe anterior à classe modal

a freqüência simples da classe posterior à classe modal

Assim, para a distribuição da tabela das estaturas, temos:

Onde,

7.6. Exercícios:

1. Complete o esquema para o cálculo da moda da distribuição de frequência:

Custo

(R$) 450 550 650 750 850 950 1050

1150

fi 8 10 11 16 13 5 1

A classe modal é da ordem...

Logo:

Temos, pois:

Bioestatística Profa Claudia M. G. G. Franchi

38

7.7. MEDIANA

A mediana é outra medida de posição definida como o número que se encontra no centro de

uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a medida de

um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no

conjunto que o separa em dois subconjuntos de mesmo número de elementos.

7.7.1. Dados não agrupados

Dada uma série de valores como, por exemplo:

5, 13, 10, 2, 18, 15, 6, 16, 9

de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou

decrescente) dos valores:

2, 5, 6, 9, 10, 13, 15, 16, 18

Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à

direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos

acima dele e quatro abaixo.

Md = 10

Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer

dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto

médio.

Assim, a série de valores:

1, 6, 7, 10, 12, 13, 18, 21

tem para a mediana a média aritmética entre 10 e 12.

Logo:

Md=11

Bioestatística Profa Claudia M. G. G. Franchi

39

7.7.2. Dados agrupados

Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa

de modo muito semelhante àquele dos dados não agrupados, implicando, porém a determinação prévia

das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição

em dois grupos que contenham o mesmo número de elementos.

Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos é dada

por:

7.7.3. Dados Agrupados sem intervalo de classe

Nesse caso, é o bastante identificar a frequência acumulada imediatamente superior à metade

da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência

acumulada.

Tomemos a distribuição relativa à tabela abaixo correspondente à frequência acumulada:

Númerode

meninos

0 2 2

1 6 8

2 10 18

3 12 30

4 4 34

35

Sendo:

A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da

variável, sendo este o valor mediano. Logo:

Md = 2 meninos

7.8. Exercícios:

1. Complete o esquema para o cálculo da mediana das distribuições:

a)

2 4 6 8 10

3 7 12 8 4

Bioestatística Profa Claudia M. G. G. Franchi

40

2

4 10

6

8 30

10

Como:

Temos que:

Md = ___________

b)

0 1 2 3 4 5

2 5 9 7 6 3

0 2 2

1

2 9

3

4

5

Como:

Temos que:

Md = ___________

Bioestatística Profa Claudia M. G. G. Franchi

41

7.8.1. Dados Agrupados com intervalos de classe

Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida

a mediana.

Para tanto, temos inicialmente que determinar a classe na qual se encontra a mediana – classe

mediana. Tal classe será evidentemente, aquela correspondente à frequência acumulada

imediatamente superior a .

Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores

se distribuam uniformemente em todo o intervalo de classe.

Assim, considerando a distribuição da tabela a seguir:

i Estaturas (cm) fi Fi

1 150 |----- 154 4 4

2 154 |----- 158 9 13

3 158 |----- 162 11 24

4 162 |----- 166 8 32

5 166 |----- 170 5 37

6 170 |----- 174 3 40

40

A 3ª Classe é a classe mediana.

Temos:

Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos

determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar

localizado na terceira classe (i = 3), supondo que as frequências dessas classes estejam uniformemente

distribuídas.

Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar a partir

do limite inferior a distancia:

e a mediana será dada por:

Logo:

Na prática, executamos os seguintes passos:

Bioestatística Profa Claudia M. G. G. Franchi

42

1º) Determinamos as frequências acumuladas.

2º) Calculamos

3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à

- e em seguida, empregamos a fórmula:

na qual:

é o limite inferior da classe mediana

é a frequência acumulada da classe anterior à classe mediana

é a frequência simples da classe mediana

é a amplitude do intervalo da classe mediana

Tomando como exemplo, a distribuição anterior, temos:

Logo, a classe mediana é a de ordem 3. Então:

Substituindo esses valores na fórmula, obtemos:

isto é:

Md = 160,5 cm

7.9. Resolva:

1) Calcule a mediana da distribuição de frequência:

Custo

(R$) 450 550 650 750 850 950 1050

1150

fi 8 10 11 16 13 5 1

Temos:

Bioestatística Profa Claudia M. G. G. Franchi

43

1

450 550 8 8

2 550 650

10 18

3 650 750

11

4 750 850

16

5 850 950

13

6 950 1050

5

7 1050 1150

1

Substituindo esses valores na fórmula, obtemos:

Logo,

7.10. Exercícios – Capítulo 7

1. Considerando os conjuntos de dados:

a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6.

b) 20, 9, 7, 2, 12, 7, 20, 15, 7.

c) 51,6; 48,7; 50,3; 49,5; 48,9;

d) 15, 18, 20, 13, 10, 16, 14.

Calcule:

I. a média;

II. a mediana;

Bioestatística Profa Claudia M. G. G. Franchi

44

III. a moda;

2. Os salários-hora de cinco funcionários de uma companhia são:

R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88.

Determine:

a) a média dos salários-hora;

b) o salário-hora mediano;

3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2.

Determine:

a) a nota média;

b) a nota mediana;

c) a nota modal

4. Considerando a distribuição abaixo:

3 4 5 6 7 8

4 8 11 10 8 3

Determine:

a) a média;

b) a mediana;

c) a moda;

5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:

2 3 4 5 6 7 8 9 10

1 3 6 10 13 8 5 3 1

Calcule:

a) a nota média;

b) a nota mediana;

c) a nota modal.

6. Determine a média aritmética de:

a)

50 60 80 90

8 5 4 3

b)

50 58 66

20 50 30

Bioestatística Profa Claudia M. G. G. Franchi

45

7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual

é a soma dos desvios?

8. Calcule a média aritmética, a mediana e a moda das distribuições de frequência abaixo:

a)

5

8

14

10

7

44

b)

5

12

18

27

8

70

c)

18

Bioestatística Profa Claudia M. G. G. Franchi

46

31

15

3

1

1

1

70

d)

10

9

8

6

3

3

1

40

Bioestatística Profa Claudia M. G. G. Franchi

47

8. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

8.1. Dispersão ou variabilidade

Vimos anteriormente que um conjuntos de valores pode ser convenientemente sintetizado por

meio de procedimentos matemáticos, em poucos valores representativos – média aritmética, mediana

e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do

conjunto.

No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já

convenientemente simplificados, é necessário ter-se uma ideia retrospectiva de como se apresentavam

esses dados nas tabelas.

Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um

conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a

mesma, e igual a 24 oC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em

uma delas poderá a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma

temperatura média de 24 oC, A outra poderá ter uma variação pequena de temperatura e possuir,

portanto, no que se refere à temperatura, um clima mais favorável.

Vemos então, que a média – ainda que considerada como um número que tem a faculdade de

representar uma série de valores – não pode por si mesma, destacar o grau de homogeneidade ou

heterogeneidade que existe entre os valores que compõe o conjunto.

Consideremos os seguintes conjuntos de valores das variáveis x, y e z:

X: 70, 70, 70, 70, 70

Y: 68, 69, 70, 71, 72

Z: 5, 15, 50, 120, 160

Calculando a média aritmética de cada um desses conjuntos, obtemos:

Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto é

fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são

iguais à média.

O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação

entre cada um de seus valores e a média representativa.

Chamado de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma

variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer

Bioestatística Profa Claudia M. G. G. Franchi

48

que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma

dispersão ou variabilidade menor que o conjunto Z.

Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor

dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às

medidas de dispersão ou de variabilidade.

Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente

de variação.

8.2. Amplitude Total

8.2.1. Dados não agrupados

A Amplitude Total é a diferença entre o maior e o menor valor observado:

Exemplo: para os valores:

40, 45, 48, 52, 54, 62 e 70

Temos:

Quando dizemos que a amplitude total dos valore é 30, estamos afirmando alguma coisa do

grau de sua concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou

variabilidade dos valores da variável.

Relativamente aos três conjuntos de valores mencionados no início desse capítulo, temos:

ATx = 70 – 70 = 0 (dispersão nula)

ATy = 72 – 68 = 4

ATz = 160 – 5 = 155

8.2.2. Dados agrupados sem intervalo de classe

Nesse caso, ainda temos:

Exemplo: Considerando a tabela abaixo:

Bioestatística Profa Claudia M. G. G. Franchi

49

0 1 2 3 4

2 6 12 7 3

Temos:

8.2.3. Dados agrupados com intervalo de classe

Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite

inferior da primeira classe:

Exemplo: Considerando a distribuição abaixo:

i Estaturas (cm) fi

1 150 |----- 154 4

2 154 |----- 158 9

3 158 |----- 162 11

4 162 |----- 166 8

5 166 |----- 170 5

6 170 |----- 174 3

40

Temos:

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série,

descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do

resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.

Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia

ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão

popular é mais importante que a exatidão e a estabilidade.

8.3. Variância / Desvio padrão

Como vimos, a amplitude total é instável por se deixar influenciar pelos valores extremos, que

são, na sua maioria, devidos ao acaso.

Bioestatística Profa Claudia M. G. G. Franchi

50

A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em

consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade

bastante estáveis e, por isso mesmo, os mais geralmente empregados.

A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média

aritmética dos quadrados dos desvios. Assim, representando a variância por , temos:

Ou, lembrando que

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade

quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente.

Por isso mesmo, imaginou-se uma nova medida que têm utilidade e interpretação práticas,

denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:

Assim,

Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua

compreensão, ela não é uma boa fórmula para fins de computação, pois em geral, a média aritmética ,

é um número fracionário, o que torna pouco prático o cálculo das quantidades .

Podemos simplificar escrevendo a fórmula do seguinte modo:

Bioestatística Profa Claudia M. G. G. Franchi

51

Não apenas este método é usualmente mais prático, como também mais preciso. Quando a

média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a

esse arredondamento.

Para o cálculo do desvio padrão, consideremos os seguintes casos:

8.3.1. Dados não agrupados

Tomemos como exemplo, o conjunto de valores da variável x:

40, 45, 48, 52, 54, 62, 70

O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma

para e outra para . Assim:

40 1600

45 2025

48 2304

52 2704

54 2916

62 3844

70 4900

371 20.293

Como n = 7, temos:

Logo,

8.4. Resolva:

1. Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10,

11, 15, 16, 18

Temos:

Bioestatística Profa Claudia M. G. G. Franchi

52

8 64

n=

Logo,

Isto é,

8.4.1. Dados Agrupados sem intervalo de classe

Como, neste caso, temos a presença de frequências, devemos levá-las em consideração,

resultando a fórmula:

Consideremos como exemplo a distribuição na tabela abaixo:

0 1 2 3 4

2 6 12 7 3

Bioestatística Profa Claudia M. G. G. Franchi

53

O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os

produtos e outra para , lembrando que para obter basta multiplicar cada pelo

seu respectivo , assim:

0 2 0 0

1 6 6 6

2 12 24 48

3 7 21 63

4 3 12 48

Logo:

8.5. Exercícios:

1. Complete o esquema paras o cálculo do desvio padrão na distribuição:

1 2 3 4 5 6

2 5 8 6 3 1

Temos:

1 2 2 2

2

3

4

5

6

Bioestatística Profa Claudia M. G. G. Franchi

54

Logo:

8.5.1. Dados Agrupados com intervalo de classe

Tomemos como exemplo, a distribuição abaixo.

Começamos por abrir as colunas (ponto médio), para e para .

i Estaturas (cm)

1 150 |----- 154 4 152 608 92.416

2 154 |----- 158 9 156 1.404 219.024

3 158 |----- 162 11 160 1.760 281.600

4 162 |----- 166 8 164 1.312 215.168

5 166 |----- 170 5 168 840 141.120

6 170 |----- 174 3 172 516 88.752

40

6.440 1.038.080

Logo:

8.6. Exercícios:

1. Complete o esquema par o cálculo do desvio padrão da distribuição:

Bioestatística Profa Claudia M. G. G. Franchi

55

Custo

(R$) 30 50 70 90 110 130

2 8 12 10 5

Temos:

i

1 40 2

2

3

4

5

8.7. Coeficiente de Variação

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades

pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a

média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso

na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries

de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.

Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou

variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada Coeficiente

de Variação (CV):

Bioestatística Profa Claudia M. G. G. Franchi

56

Exemplo:

Tomemos os resultados das medidas das estaturas e dos presos de um grupo de indivíduos:

Estaturas 175 cm 5,0 cm

Pesos 68 Kg 2,0 Kg

Temos:

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as

estaturas.

8.8. Exercícios – Capítulo 8

1. Calcule a amplitude total dos conjuntos de dados:

a) 1, 3, 5, 9

b) 20, 14, 15, 19, 21, 22, 20

c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2;

d) -10, -6, 2, 3, 7, 9, 10

2. Calcule a amplitude total das distribuições:

Xi 2 3 4 5 6 7 8

fi 1 3 5 8 5 4 2

Classes 1,5 1,6 1,7 1,8 1,9 2,0 2,1

2,2

Fi 4 8 12 15 12 8 4

3. Calcule os desvios padrões dos conjuntos de dados do exercício 1.

4. Calcule os desvios padrões dos conjuntos de dados do exercício 2.

Bioestatística Profa Claudia M. G. G. Franchi

57

5. Dada a distribuição de cem lançamentos de cinco moedas simultaneamente:

Número de

caras

0 11 12 13 14 5

Número de

coroas

4 14 34 29 16 3

Calcule o desvio padrão:

6. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão

respectivamente, 18,3 e 1,47, calcule o coeficiente de variação:

7. Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi de 7,8 e o

desvio padrão, 0,80. Em estatística, entretanto, o grau médio foi de 7,3 e o desvio padrão, 0,76. Em

que disciplina foi maior a dispersão?

8. Medidas as estaturas de 1.017 indivíduos, obtivemos . O peso

médio desses indivíduos é 52 Kg, com um desvio padrão de 2,3 Kg. Esses indivíduos apresentam maior

variabilidade em estatura ou em peso?

9. Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97

cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm. Qual é o coeficiente de variação

de cada um dos grupos? Qual o grupo mais homogêneo?

10. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de

variação de 3,3%. Qual o desvio padrão desse grupo?

11. Uma distribuição apresenta as seguintes estatísticas: s=1,5 e VC=2,9%. Determine a média

da distribuição

Bioestatística Profa Claudia M. G. G. Franchi

58

9. BIBLIOGRAFIA

1. CRESPO, Antônio A., Estatística Fácil, 19ª ed. atual. – São Paulo, Ed. Saraiva, 2009.

2. DORIA FILHO, Ulysses, Introdução à Bioestatística: para simples mortais, 14ª reimpressão –

São Paulo, Ed. Elsevier, 1999.

3. GUEDES, Marilda Laurenti da silva, José da Silva, Bioestatística, Rio de Janeiro, CNPQ, 1988.

4. JAQUES, Sidia M. Callegari, Bioestatística – Princípios e Aplicações, São Paulo, Ed. Artmed

2003 – reimpressão: 2008.

5. VIEIRA, Sonia, Introdução à Bioestatística, Rio de Janeiro, Ed. Campus, 1997 – 5ª reimpressão.