aula 15 - rnp

36
15 Aprendendo sobre medidas de dispersão Paulo Roberto Rufino Pereira Frederico Tassi de Souza Silva

Upload: others

Post on 16-Oct-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aula 15 - RNP

15Aprendendo sobre medidas de dispersão

Paul

o Ro

berto

Rufi

no P

erei

raFr

eder

ico

Tass

i de

Souz

a Si

lva

Page 2: Aula 15 - RNP

413

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

412

e-Tec Brasil – Estatística Aplicada

Apresentar as medidas de dispersão.

Após o estudo desta aula, você deverá ser capaz de:

1. calcular a variância de dados não agrupados;

2. calcular a variância de dados agrupados;

3. calcular o desvio padrão;

4. calcular o coeficiente de variação.

Para esta aula, é importante que você tenha em mente o cálculo de potência e raiz quadrada, assuntos tratados nas Aulas 3 e 4, respectivamente. Também é importante rever o conceito de média aritmética apresentado na Aula 13, bem como o conceito de porcentagem, visto na Aula 5. Além disso, tenha à mão uma calculadora, para fazer as atividades propostas.

META

OBJETIVOS

PRÉ-REQUISITOS

Page 3: Aula 15 - RNP

413

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

412

e-Tec Brasil – Estatística Aplicada

ENTENDENDO TODO O CONJUNTO

Nas Aulas 13 e 14 você aprendeu sobre as medidas de tendência

central. Aprendeu a calcular a média aritmética simples e ponderada, a

mediana e a moda. Todas essas medidas são valores que representam, de

forma resumida (em um único valor), todo um conjunto de dados.

No entanto, tais medidas oferecem pouca informação a respeito

da forma como os outros valores estão espalhados pelo conjunto. Quer

dizer, os outros valores do conjunto são próximos ou distantes do valor

central?

Por isso, fez-se importante pensar em outras medidas que fossem

capazes de complementar as informações das medidas de tendência

central. Assim, nasceram as medidas de dispersão.

Essas medidas, assim como as de tendência central, são medidas de

posição. Elas determinam o quanto os outros dados do conjunto estão

perto, ou não, da média aritmética.

Page 4: Aula 15 - RNP

414

e-Tec Brasil – Estatística Aplicada

415

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Nesta aula, você aprenderá a calcular a variância, o desvio padrão

e o coeficiente de variação, que são medidas de dispersão. Vamos lá?

MEDIDAS DE DISPERSÃO: QUANTO MAIS PERTO MELHOR!

A média aritmética de uma série de dados, embora seja muito

utilizada para representá-la, não pode mostrar a HOMOGENEIDADE ou

HETEROGENEIDADE que há entre os valores que compõem o conjunto.

Isso acontece porque a média é um valor que representa um conjunto

de dados, mas podem existir valores dentro do conjunto que estejam

bastante distantes da maioria dos números que o compõem. Quando

isso acontece, a média acaba sendo um valor bem diferente da maioria

dos dados do conjunto.

Como vimos na Aula 13, esses valores distantes interferem no

resultado, fazendo com que a média se distancie dos valores mais

centrais do conjunto. O mesmo raciocínio vale para as outras medidas

de tendência central.

MEDIDAS DE POSIÇÃO

MEDIDAS DE DISPERSÃO

MEDIANA MODA VARIÂNCIA DESVIO PADRÃO

COEFICIENTE DE

VARIAÇÃO

MÉDIA ARITMÉTICA

MEDIDAS DE TENDÊNCIA

CENTRAL

Figura 15.1: Existem dois grupos de medidas de posição: as medidas de tendência central e as medidas de dispersão. As principais medidas de tendência central são a média aritmética, mediana e moda. As principais medidas de dispersão são a variância, o desvio padrão e o coeficiente de variação.

HOMOGENEIDADE

Característica, qualidade do que é homogêneo. Homogêneo é o que possui igual natureza e/ou apresenta semelhança de estrutura, função, distribuição etc. Um conjunto homogêneo, por exemplo, apresenta grande unidade, adesão, uniformidade entre seus elementos.

Fonte: Dicionário Houaiss de Língua Portuguesa

HETEROGENEIDADE

Característica, qualidade do que é heterogêneo. Heterogêneo é o que possui natureza desigual e/ou apresenta diferença de estrutura, função, distribuição etc. Um conjunto heterogêneo é aquele que não possui unidade ou uniformidade. Heterogêneo é o antônimo (oposto) de homogêneo.

Fonte: Dicionário Houaiss de Língua Portuguesa

Page 5: Aula 15 - RNP

414

e-Tec Brasil – Estatística Aplicada

415

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Observe, agora, os conjuntos A, B e C:

A: 69, 70, 70, 70, 71.

B: 58, 66, 72, 76, 78.

C: 6, 14, 49, 121, 160.

Ao calcular a média aritmética simples de cada um desses conjuntos,

encontramos:

Fonte: www.sxc.hu

Figura 15.2: A medidas de dispersão nos informam o quanto os valores de um conjunto de dados estão muito ou pouco espalhados em torno da média aritmética.

ATENÇÃO!

A média aritmética simples é calculada somando-se os valores dos

elementos do conjunto e dividindo o resultado pelo número de ele-

mentos do conjunto.

Você percebeu que os três conjuntos apresentam a mesma média

aritmética? Em todos os conjuntos a média é setenta. Mas, olhando

atentamente para cada um deles, você diria que são parecidos?

Page 6: Aula 15 - RNP

416

e-Tec Brasil – Estatística Aplicada

417

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Notamos, com facilidade, que o conjunto A é o mais homogêneo

dos três, pois os valores se distanciam pouco da média aritmética, que

é setenta. Quer dizer, a maioria dos números do conjunto tem valores

próximos ao valor da média. Dizemos, neste caso, que os dados desse

conjunto se dispersam pouco em torno da média.

Já o conjunto C é mais heterogêneo, já que seus valores são distantes

do valor da média encontrada. Os dados desse conjunto se dispersam

muito em torno da média.

Assim, concluímos que o conjunto A apresenta dispersão (ou

variabilidade) menor do que os conjuntos B e C. Também podemos

acreditar que, para o conjunto A, a média é uma boa medida para

representá-lo.

A fim de avaliar os valores de uma variável (valores dentro de um

conjunto de dados), mostrando seu grau de dispersão (ou variabilidade)

em torno de sua média aritmética, a Estatística recorre às medidas de

dispersão. As medidas de dispersão mais comuns são:

• variância;

• desvio padrão;

• coeficiente de variação; e

• amplitude total.

Page 7: Aula 15 - RNP

416

e-Tec Brasil – Estatística Aplicada

417

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

VARIÂNCIA

A variância é uma medida de dispersão que tem como objetivo

a avaliação de um conjunto de dados, analisando o quanto eles estão

dispersos. Para isso, tomamos como referência a média aritmética do

conjunto. Ou seja, podemos definir variância como uma medida que

representa o quanto os dados estão dispersos (afastados) em relação à

média aritmética.

Vamos aprender mais sobre essa medida utilizando um exemplo:

Para preencher uma vaga de Técnico em Segurança no Trabalho,

o departamento de pessoal de uma indústria química realizou testes

com vários candidatos. Vera e Paulo foram os candidatos que obtiveram

as melhores notas. A tabela a seguir mostra o desempenho dos dois

candidatos nas provas a que se submeteram:

Tabela 15.1: Notas que Vera e Paulo tiraram em cada uma das cinco provas que fizeram e a média aritmética das notas de cada um deles.

CandidatoAssunto

Vera Paulo

Conhecimentos de Informática 8,5 9,5

Língua Portuguesa 9,5 9,0

Inglês 8,0 8,5

Matemática 7,0 8,0

Conhecimento Específico 7,0 5,0

Média = 8,0 Média = 8,0

Observe que a média

aritmética das notas das provas

dos dois candidatos é igual.

As duas médias são iguais a oito.

Page 8: Aula 15 - RNP

418

e-Tec Brasil – Estatística Aplicada

419

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

No caso de Paulo e Vera, a amostra de notas menos dispersa em

relação à média aritmética corresponderá ao melhor desempenho e,

portanto, ao merecedor da vaga. Portanto, vamos calcular a variância

como critério de desempate.

A variância é representada pelo símbolo s². É preciso seguir alguns

passos para encontrá-la. Veja a seguir:

• 1º passo: calcule a diferença entre cada nota e a média

aritmética de todas as notas. Faça isso para cada candidato,

separadamente.

Cálculo da Vera Cálculo do Paulo

8,5 - 8,0 = 0,5 9,5 - 8,0 = 1,5

9,5 - 8,0 = 1,5 9,0 - 8,0 = 1,0

8,0 - 8,0 = 0,0 8,5 - 8,0 = 0,5

7,0 - 8,0 = -1,0 8,0 - 8,0 = 0,0

7,0 - 8,0 = -1,0 5,0 - 8,0 = -3,0

• 2º passo: calcule o quadrado de cada valor encontrado no

passo anterior (você aprendeu a calcular potência na Aula 3,

lembra?).

Cálculo da Vera Cálculo do Paulo

(0,5)2 = 0,25 (1,5)2 = 2,25

(1,5)2 = 2,25 (1,0)2 = 1,0

(0,0)2 = 0,0 (0,5)2 = 0,25

(-1,0)2 = 1,0 (0,0)2 = 0,0

(-1,0)2 = 1,0 (-3,0)2 = 9,0

• 3º passo: calcule a média aritmética dos valores encontrados

no passo anterior.

2

2

0 25 2 25 0 0 1 0 1 05

0 9

2 25 1 0 0 25 0 0

s

s

Vera

Paulo

=+ + + +

=

=+ + +

, , , , ,,

, , , , ++=

9 05

2 5,

,

Page 9: Aula 15 - RNP

418

e-Tec Brasil – Estatística Aplicada

419

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Os resultados encontrados no terceiro passo são as variâncias

de cada um dos conjuntos de notas. Veja que a variância das notas de

Vera (0,9) é menor que a de Paulo (2,5), o que significa que as notas

de Vera estão mais próximas da média (menos dispersas) do que as de

Paulo, ou seja, seu desempenho nas provas foi mais regular e, portanto,

Vera deverá ficar com a vaga.

Fonte: www.sxc.hu

Figura 15.3: Para determinar se algo está longe ou perto precisamos de uma referência. No caso das medidas de dispersão essa referência é a média aritmética de um conjunto de dados.

Calculando a variância de um jeito diferente

O que você achou do cálculo da variância? Difícil? Complicado?

Bem. Existe uma outra opção para fazer esse cálculo. A segunda maneira

de encontrar o valor da variância é chamada de Processo Breve. Vamos

aproveitar o exemplo das notas da Vera e do Paulo para calcular a

variância por esse outro caminho.

Page 10: Aula 15 - RNP

420

e-Tec Brasil – Estatística Aplicada

421

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

O primeiro passo é montar uma tabela para cada candidato,

colocando na primeira coluna as notas e na segunda coluna o quadrado

do valor dessas notas. No fim da tabela, coloca-se a soma dos valores

de cada coluna. Veja a seguir:

Tabela com as notas da Vera Tabela com as notas do Paulo

Notas Quadrados das notas Notas Quadrados das notas

8,5 72,25 9,5 90,25

9,5 90,25 9,0 81,0

8,0 64,0 8,5 72,25

7,0 49,0 8,0 64,0

7,0 49,0 5,0 25,0

Total: 40 Total: 324,5 Total: 40 Total: 332,5

O próximo passo é diminuir a razão entre o total da segunda coluna

e o número de notas, do quadrado da razão entre o total da primeira

coluna e o número de notas.

Fonte: www.sxc.hu

Figura 15.4: Existe mais de uma maneira de encontrar a variância de um conjunto de dados. Escolha o caminho que achar mais fácil.

Svile

n M

ushk

atov

Page 11: Aula 15 - RNP

420

e-Tec Brasil – Estatística Aplicada

421

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Vamos montar a equação devagar, usando as notas da Vera para

entender:

• Razão, na linguagem matemática, significa fração. Ou seja, no

caso do exemplo das notas da Vera, a razão entre o total da

segunda coluna (324,5) e o número de notas (5) é:

324 55

,

• O quadrado (potência de 2) da razão entre o total da primeira

coluna (40) e o número de notas (5) é:

2

405

• Então, diminuir a razão entre o total da segunda coluna e o

número de notas, do quadrado da razão entre o total da primeira

coluna e o número de notas; quer dizer:

324 55

2

405

,−

• A variância das notas de Vera é:

2

2

2324 55

64 9 64 9 64 0 9405

8s = − = − = − =

,, , ,

Page 12: Aula 15 - RNP

422

e-Tec Brasil – Estatística Aplicada

423

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

A variância das notas de Vera é 0,9, o mesmo valor encontrado

na seção sobre variância.

Agora é a sua vez. Utilize o espaço a seguir para calcular a variância

das notas do Paulo. Aproveite que a tabela com o quadrado das notas

já está montada. O resultado você já sabe: é o mesmo da seção anterior.

Mas não deixe de tentar encontrá-lo aqui, calculando da maneira que

acabou de aprender.

Fonte: www.sxc.hu

Kris

s Sz

kirla

tow

ski

Até aqui você aprendeu a calcular a variância de duas maneiras

diferentes. Usando qualquer uma delas você chegará ao mesmo resultado.

No entanto, os cálculos foram feitos para um conjunto de dados não

agrupados. Na próxima seção, você verá como é feito o cálculo da

variância quando os dados estão agrupados.

Fonte: www.sxc.hu

Ad

am C

iesi

elsk

i

Page 13: Aula 15 - RNP

422

e-Tec Brasil – Estatística Aplicada

423

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Variância de dados agrupados

A esta altura do nosso curso, você já deve ter percebido que quando

os dados se apresentam agrupados (em freqüências ou em classes), a

forma de encontrar qualquer uma das medidas de posição é diferente do

cálculo para dados não agrupados, não é mesmo? Nesta seção, veremos

como encontrar a variância para dados que estão agrupados.

Variância de dados agrupados sem intervalos de classe

Dados agrupados sem intervalos de classe são os dados que en-

contramos agrupados em freqüências, ou seja, eles estão agrupados pelo

número de vezes que se repetem dentro do conjunto. A melhor forma

de aprender a calcular a variância de dados agrupados é a partir de um

exemplo. Então, vamos lá!

Atende ao Objetivo 1

Um grupo de amigos da mesma turma do curso de Segurança no Trabalho estava reunido

estudando para uma prova quando surgiu uma dúvida: qual o número de equipamentos de

segurança que devem ser utilizados por um trabalhador da indústria do setor alimentício?

Ninguém se entendeu e cada um deu uma resposta diferente. As respostas que surgiram foram:

8, 10, 11, 15, 16, 18.

Um dos amigos teve uma idéia e disse: vamos aproveitar esses números e estudar para a prova

de estatística? Que tal se nós calcularmos a variância desses valores?

Todos concordaram e resolveram calcular. Que valor eles encontraram?

Lembre-se de que existem duas maneiras de calcular o valor. Você pode escolher qual delas

usar, mas seria interessante que tentasse fazer dos dois jeitos, assim testaria se aprendeu o

cálculo de ambos.

ATIVIDADE 1

Page 14: Aula 15 - RNP

424

e-Tec Brasil – Estatística Aplicada

425

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Observe a Tabela 15.2. Ela foi montada a partir de um levantamento

feito pela secretaria municipal de obras de Engenhópolis. A intenção da

pesquisa era verificar a quantidade de multas que as trinta empresas de

construção civil desse município receberam, no mês de janeiro, devido a

problemas com as condições de trabalho dos empregados.

Tabela 15.2: Distribuição de freqüência relativa à quantidade de multas que 30 empresas do município de Engenhópolis receberam no mês de janeiro. A segunda coluna apresenta a quantidade de empresas que receberam a quantidade de multas relacionadas na primeira coluna.

Empresas multadas no mês de janeiro

Número de multas Quantidade de empresas(freqüência)

0 2

1 6

2 12

3 7

4 3

Total 30

Fonte: www.sxc.hu

Figura 15.5: As empresas, inclusive aquelas do ramo da construção civil, são multadas pelo Ministério do Trabalho quando descumprem a legislação referente à segurança no trabalho.

Keith

Syv

insk

i

Page 15: Aula 15 - RNP

424

e-Tec Brasil – Estatística Aplicada

425

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Para calcular a variância dos valores encontrados na Tabela 15.2

é preciso levar em consideração o fato de que eles estão agrupados em

freqüências.

Para facilitar a organização dos cálculos é importante montar uma

tabela auxiliar. Para isso, basta criar mais duas colunas na tabela anterior.

A terceira coluna será o resultado da multiplicação da primeira coluna

pela segunda. A quarta coluna é o resultado da multiplicação do quadrado

da primeira coluna pela segunda coluna. Veja como fica a nova tabela.

A última linha da tabela apresenta a soma de cada coluna.

Tabela 15.3: Auxiliar para cálculo da variância. Foram inseridas mais duas colunas na Tabela 15.2. A terceira coluna é o resultado da primeira multiplicada pela segunda. A quarta coluna é o resultado do quadrado da primeira multiplicado pela segunda.

Empresas multadas no mês de janeiro

Multas FreqüênciaMultas x

Freqüência(Multas)² x Freqüência

0 2 0 0

1 6 6 6

2 12 24 48

3 7 21 63

4 3 12 48

Total 30 63 165

Para encontrar a variância (s²), você tem que calcular a diferença

entre a razão do total da quarta coluna pelo total da segunda coluna e o

quadrado da razão entre o total da terceira coluna pelo total da segunda

coluna. Não é difícil. Veja como fica a equação:

2

2

42

32

scolunacoluna

a

a

coluna

coluna

a

a= −

Substituindo a fórmula pelos valores da tabela, temos:

s

s

s

s

²

².

² , ,

² ,

= −

= −

= −=

16530

6330

16530

3 969900

5 5 4 41

1 09

2

Page 16: Aula 15 - RNP

426

e-Tec Brasil – Estatística Aplicada

427

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Esse resultado significa que a variância dos valores (as multas

recebidas pelas trinta empresas) da Tabela 15.2 é 1,09.

Variância de dados agrupados em intervalos de classe

O cálculo da variância com intervalos de classe é parecido com o

anterior (agrupados em freqüências), mas possui algumas particularidades.

Veja o exemplo adiante e compare as diferenças com a seção anterior.

A partir das estaturas (alturas) de quarenta alunos de uma das

turmas de um curso preparatório para concursos, foi montada a seguinte

tabela:

Tabela 15.4: Estatura, em centímetros, dos quarenta alunos do curso. As estaturas estão agrupadas em seis classes. A terceira coluna apresenta a quantidade de alunos com alturas encontradas dentro do referido intervalo de classe (segunda coluna).

Estatura dos alunos da turma

ClassesEstatura em centímetros

(intervalo de classes)Número de alunos

(freqüência)

1 150 154 4

2 154 158 9

3 158 162 11

4 162 166 8

5 166 170 5

6 170 174 3

Total 40

A partir da Tabela 15.4 é possível montar outra tabela para facilitar

o cálculo da variância.

Fonte: www.sxc.hu

Figura 15.6: Quando os dados de um conjunto se encontram agrupados, fica um pouco mais trabalhoso achar a variância.

Sanj

a G

jene

ro

Page 17: Aula 15 - RNP

426

e-Tec Brasil – Estatística Aplicada

427

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

A nova tabela deverá possuir mais três colunas. A quarta coluna

deve apresentar o ponto médio de cada intervalo de classe (média

aritmética entre o limite inferior e o limite superior de cada intervalo

de classe). A quinta coluna é o resultado da multiplicação da terceira

coluna (freqüência) pela quarta coluna (ponto médio). Já a sexta coluna

vem com o resultado da multiplicação da terceira coluna pelo quadrado

da quarta. A última linha da tabela apresenta a soma (total) da terceira,

quinta e sexta colunas.

Veja, a seguir, como fica a nova tabela:

Tabela 15.5: Auxiliar para cálculo da variância de dados agrupados em intervalos de classes. A Tabela 15.4 foi acrescida de três colunas. A quarta coluna é o ponto médio dos intervalos de classes. A quinta coluna é o resultado da terceira coluna multiplicada pela quarta. A sexta coluna é o resultado da terceira coluna multiplicada pelo quadrado da quarta.

Estatura dos alunos da turma

ClasseIntervalos de

classesN° alunos

(freqüência)Ponto médio

Freqüência × Ponto médio

Freqüência × (Ponto médio)²

1 150 154 4 152 608 92.416

2 154 158 9 156 1.404 219.024

3 158 162 11 160 1.760 281.600

4 162 166 8 164 1.312 215.168

5 166 170 5 168 840 141.120

6 170 174 3 172 516 88.752

Total 40 6.440 1.038.080

Para calcular a variância, é preciso diminuir a razão entre a soma

da sexta coluna pela soma da terceira coluna do quadrado da razão entre

a soma da quinta coluna pela soma da terceira coluna. Ou seja:

2

2

63

53

scolunacoluna

a

a

coluna

coluna

a

a= −

Page 18: Aula 15 - RNP

428

e-Tec Brasil – Estatística Aplicada

429

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Substituindo a fórmula pelos valores da tabela, temos:

s

s

². . .

². . . .

.

= −

= −

1 038 08040

6 44040

1 038 08040

41 473 6001 60

2

00

25 952 25 921

31

s

s

² . .

²

= −=

Quer dizer, então, que a variância das alturas dos alunos daquela

turma é 31.

Você deve ter percebido que no cálculo da variância alguns números

são elevados ao quadrado, não é mesmo? Esse recurso, utilizado para

fazer o cálculo, gera um problema se os dados analisados se apresentarem

em unidades de medidas. Isso acontece porque unidades de medida

podem ser elevadas à potência, e isso modifica o resultado – metro (m)

é diferente de metro quadrado (m2), que por sua vez é diferente de metro

cúbico (m3).

Por exemplo: imagine que você está calculando a variância do

conjunto das estaturas (alturas) dos seus melhores amigos. A unidade

usada para medir estaturas é o centímetro. Assim como é feito para

calcular a variância – elevar os valores ao quadrado –, a unidade de

medida também será elevada ao quadrado. E, como você já deve saber,

centímetro é diferente de centímetro quadrado.

Para resolver esse problema e deixar o cálculo na mesma unidade

dos dados, é só tirar a raiz quadrada da variância (operação inversa da

potência de dois; lembra-se da Aula 4?). Só que o resultado encontrado

não é mais a variância. Ele agora é chamado de desvio padrão. O desvio

padrão é o nosso próximo assunto desta aula.

Page 19: Aula 15 - RNP

428

e-Tec Brasil – Estatística Aplicada

429

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

MULTIMÍDIA

Você já imaginou um mundo sem as unidades de medidas? Como

iríamos comprar o sal, o açúcar, o leite e tantos outros alimentos que

fazem parte das refeições “nossas de cada dia”? Como medir com

precisão se as medidas tivessem de ser feitas com polegadas, braçadas

ou pés? Cada pessoa tem um polegar, um braço ou pé diferente, ou seja,

as medidas poderiam ser de qualquer tamanho, não é verdade? Para

resolver esses problemas, foi criado o Sistema Internacional de Medidas,

que regulamentou e unificou as medições. Se você quiser se informar

mais sobre o assunto, vá até o endereço http://www.inmetro.gov.br/

consumidor/unidLegaisMed.asp. É uma página do site do INMETRO

(Instituto Nacional de Metrologia, Normalização e Qualidade Industrial).

Nela você encontrará um link para o Sistema Internacional de Unidades

de Medidas, com o histórico de sua criação e a explicação sobre todas

as unidades e grandezas.

Fonte: www.sxc.hu

Sanj

a G

jene

ro

Atende ao Objetivo 2

Em determinado setor de uma siderúrgica, existem seis equipamentos de grande porte. Nesse

setor trabalham vinte e cinco operários em turnos variados. Para evitar que mais de um

empregado precisasse utilizar uma máquina no mesmo horário, o chefe do setor montou uma

tabela de utilização desses equipamentos. Veja:

ATIVIDADE 2

Page 20: Aula 15 - RNP

430

e-Tec Brasil – Estatística Aplicada

431

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

DESVIO PADRÃO

O desvio padrão também é uma medida de dispersão. Assim como

a variância, ele dá a noção de como os valores de determinado conjunto

estão dispersos em relação a sua média aritmética. Quer dizer, o desvio

padrão nos informa a distância média em que os valores de determinado

conjunto de dados estão em relação à média desse conjunto.

Quantidade de trabalhadores que utilizam cada equipamento

EquipamentoNúmero de trabalhadores que

utilizam o equipamento (freqüência)

1 2

2 5

3 8

4 6

5 3

6 1

Total 25

Utilizando a tabela anterior, calcule a variância dos dados. Para ajudar nos cálculos, preencha

a tabela auxiliar a seguir.

Equipamento Freqüência 1ª coluna x 2ª

coluna(1ª coluna)2 x 2ª

coluna

1 2 2 2

2

3

4

5

6

Total 25

Page 21: Aula 15 - RNP

430

e-Tec Brasil – Estatística Aplicada

431

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Quanto maior o valor do desvio padrão, maior é a dispersão dos

dados de um conjunto em relação a sua média aritmética. Quando o

valor do desvio padrão é igual a zero, significa dizer que os valores do

conjunto são iguais à média.

O desvio padrão é representado pela letra grega σ (sigma). Ele é

a raiz quadrada da variância. Portanto, você já pode calcular o desvio

padrão sem problemas, tanto para dados agrupados quanto para não

agrupados, porque já sabe calcular a variância.

Lembra-se do Paulo e da Vera, que foram apresentados na seção

sobre variância? Naquele exemplo, foi calculada a variância das notas

das provas de cada um deles. A variância das notas de Vera era 0,9,

enquanto a variância das notas do Paulo foi 2,5.

Se o desvio padrão é a raiz quadrada da variância, temos:

s

s

_ , ,

_ , ,

Vera

Paulo

= ≅

= ≅

0 9 0 949

2 5 1 58

Observe que, pelo cálculo do desvio padrão, Vera continua com

desempenho melhor que o de Paulo, pois seu desvio padrão é menor

que o dele. Esse resultado significa que as notas de Vera têm uma

distância média, em relação à média

aritmética de todas as notas (que era

oito, lembra?), de 0,9. Essa distância é

menor que a encontrada para as notas

de Paulo, ou seja, as notas dela são

mais homogêneas do que as dele.

Figura 15.7: O desvio padrão é a medida da distância média entre os dados de um conjunto e sua média aritmética.

Page 22: Aula 15 - RNP

432

e-Tec Brasil – Estatística Aplicada

433

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Agora, vamos a um exemplo com dados agrupados para que você

veja como é fácil!

Imagine que um grupo de jovens futuros administradores de

empresas realizou uma pesquisa com sessenta e quatro funcionários do

setor financeiro de uma grande indústria farmacêutica. Na entrevista,

eles perguntaram o valor atual do salário de cada um dos entrevistados.

O grupo de alunos, que já teve aulas de estatística, organizou os dados

em uma tabela de distribuição de freqüência. Veja como ficou:

Tabela 15.6: Salários dos funcionários do setor financeiro. Os salários, em reais, estão agrupados em classes. A coluna da direita apresenta o número de funcionários com salários encontrados dentro do intervalo de classes correspondente.

Salário dos funcionários do setor financeiro

Classe Salário em reais (intervalo de classes)

Número de funcionários com salário nesse intervalo

(freqüência)

1 450,00 550,00 8

2 550,00 650,00 10

3 650,00 750,00 11

4 750,00 850,00 16

5 850,00 950,00 13

6 950,00 1.050,00 5

7 1.050,00 1.150,00 1

Total 64

Vamos aproveitar a tabela que os alunos montaram e calcular o

desvio padrão desses dados em relação a sua média?

Primeiro, devemos calcular a variância; para isso, como você já

aprendeu, devemos acrescentar, na Tabela 15.6, três colunas:

• uma coluna para os valores do ponto médio de cada intervalo

de classe;

• outra coluna com o resultado da multiplicação da freqüência

pelo ponto médio; e

• a última coluna com a multiplicação da freqüência pelo

quadrado do ponto médio.

Page 23: Aula 15 - RNP

432

e-Tec Brasil – Estatística Aplicada

433

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

É importante colocar, na última linha da nova tabela, a soma dos

valores da terceira, da quinta e da sexta colunas. Agora, temos a Tabela

15.7.

Tabela 15.7: Auxiliar com o salário dos funcionários do setor financeiro. Foram acrescentadas à Tabela 15.6 mais três colunas. A quarta coluna é o ponto médio de cada intervalo de classe (média aritmética entre os limites do intervalo). A quinta coluna é o resultado das freqüências vezes os pontos médios. A sexta coluna é o resultado das freqüências vezes os quadrados dos pontos médios.

Salário dos funcionários do setor financeiro

ClasseSalário em reais

(intervalo de classes)Freqüência

Ponto médio

Freqüência × Ponto médio

Freqüência × (Ponto médio)²

1 450,00 550,00 8 500 4.000 2.000.000

2 550,00 650,00 10 600 6.000 3.600.000

3 650,00 750,00 11 700 7.700 5.390.000

4 750,00 850,00 16 800 12.800 10.240.000

5 850,00 950,00 13 900 11.700 10.530.000

6 950,00 1.050,00 5 1.000 5.000 5.000.000

7 1.050,00 1.150,00 1 1.100 1.100 1.210.000

Total 64 48.300 37.970.000

A variância é calculada pela seguinte fórmula:

2

2

63

53

scolunacoluna

a

a

coluna

coluna

a

a= −

Page 24: Aula 15 - RNP

434

e-Tec Brasil – Estatística Aplicada

435

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Agora é só substituir os valores da tabela na fórmula. Assim,

temos:

s

s

². . .

². . .

= −

= −

37 970 00064

48 30064

37 970 00064

48 30064

2

= −= −=

2

593 281 25 754 6875

593 281 25 569 553 22

2

s

s

s

² . , ( , )²

² . , . ,

² 33 728 03. ,

A variância dos salários vale, portanto, 23.728,03.

Como foi dito anteriormente, o desvio padrão é a raiz quadrada

da variância. Então:

Fonte: www.sxc.hu

Figura 15.8: O valor do desvio padrão terá sempre a mesma unidade dos dados do conjunto analisado.

Pont

us E

nden

berg

Vin

ce V

arga

Prze

mys

law

Szc

zepa

nski

Jay

Sim

mon

s

σ

σσ

O desvio padrão dos salários vale R$ 154,00.

s

s

s

=

==

. ,23 728 03

154

Page 25: Aula 15 - RNP

434

e-Tec Brasil – Estatística Aplicada

435

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Digamos que você queira comparar o desvio padrão encontrado

no exemplo da Vera e do Paulo da seção sobre variância com o desvio

padrão encontrado no exemplo anterior (dos salários). Você acha que

seria possível?

É difícil imaginar que possamos comparar notas de provas com

dinheiro, não é verdade? E como foi explicado, o resultado do desvio

padrão sai com a mesma unidade dos dados analisados. Por isso, houve

a necessidade de se criar uma medida de dispersão que possibilitasse a

comparação de conjuntos de dados diferentes. Essa medida é chamada

de coeficiente de variação e será apresentada na próxima seção.

Atende ao Objetivo 3

Uma turma de trinta e sete alunos realizou prova de Português e Literatura. Cada prova era

composta por 130 questões. A professora da disciplina montou uma tabela de distribuição

de freqüência de dados agrupados em intervalos de classe, com o número de questões corretas

de cada aluno. Veja:

Notas da prova de Português e Literatura

ClasseQuestões corretas

(intervalo de classe)Número de alunos

(freqüência)

1 30 50 2

2 50 70 8

3 70 90 12

4 90 110 10

5 110 130 5

Total 37

ATIVIDADE 3

Page 26: Aula 15 - RNP

436

e-Tec Brasil – Estatística Aplicada

437

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

COEFICIENTE DE VARIAÇÃO

Como você pode conferir na seção anterior, o desvio padrão e a

variância são expressos com as mesmas unidades dos dados sobre os

quais foram calculados. Por exemplo, o cálculo do desvio padrão no

exemplo do salário dos funcionários foi dado em reais, pois os dados

estavam em reais.

O problema é que não podemos comparar o valor encontrado no

caso dos salários (σ = R$ 154,00), por exemplo, com o desvio padrão

calculado sobre dados que estão em centímetros. Anteriormente,

calculamos a variância das estaturas dos alunos de uma turma (s2 =

31), lembra? O desvio padrão do valor encontrado é a raiz quadrada

desse valor, ou seja, σ = 5,57 cm. Não é possível dizer que R$ 154,00 é

maior que 5,57 cm, porque os valores estão em unidades diferentes (reais

e centímetros).

Com base na tabela montada pela professora, calcule o desvio padrão do número de questões

que cada aluno acertou. Aproveite a tabela a seguir para ajudar no cálculo.

Classe Questões corretas

(intervalo de classe)

N° de alunos (Freqüência)

Ponto médio

Freqüência × Ponto médio

Freqüência × (Ponto médio)²

1 30 50 2

2 50 70 8

3 70 90 12

4 90 110 10

5 110 130 5

Total 37

Page 27: Aula 15 - RNP

436

e-Tec Brasil – Estatística Aplicada

437

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

É para driblar essa limitação que surgiu outro tipo de variável,

chamada de coeficiente de variação. O coeficiente de variação mostra a

dispersão dos dados em relação à média de um conjunto, assim como

a variância e o desvio padrão. A grande diferença é que o valor do

coeficiente de variação é representado em porcentagem e, portanto, pode

ser comparado (lembra-se da Aula 5?).

Então, sempre que quiser comparar conjuntos diferentes, mesmo

representados em unidades diferentes, você deverá utilizar essa medida

de dispersão.

O coeficiente de variação é a razão entre o desvio padrão e a

média aritmética do conjunto. Ao multiplicarmos esse resultado por 100,

encontramos o valor em porcentagem.

Vamos entender, na prática, o que foi explicado? Volte ao exemplo

das alturas dos alunos da turma do curso preparatório para concursos,

apresentado anteriormente. A seguir, você encontrará a tabela auxiliar

que foi montada.

Figura 15.9: Não é possível comparar dados que não estejam representados na mesma unidade.

Page 28: Aula 15 - RNP

438

e-Tec Brasil – Estatística Aplicada

439

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

ESTATURA DOS ALUNOS DA TURMA

ClasseIntervalos de

classesN° alunos

(freqüência)Ponto médio

Freqüência × Ponto médio

Freqüência × (Ponto médio)²

1 150 154 4 152 608 92.416

2 154 158 9 156 1.404 219.024

3 158 162 11 160 1.760 281.600

4 162 166 8 164 1.312 215.168

5 166 170 5 168 840 141.120

6 170 174 3 172 516 88.752

Total 40 6.440 1.038.080

O primeiro passo é calcular a média aritmética das estaturas, que

você aprendeu na Aula 13. Como os dados estão agrupados em intervalos

de classe, a média será encontrada ao multiplicarmos cada ponto médio

por sua respectiva freqüência. Somamos esses valores e dividimos pela

soma de todas as freqüências, como na equação:

x = × + × + × + × + × + ×+ + +

( ) ( ) ( ) ( ) ( ) ( )4 152 9 156 11 160 8 164 5 168 3 1724 9 11 8 ++ +

= + + + + +

=

=

5 3

608 1 404 1 760 1 312 840 51640

6 44040

161

x

x

x

. . .

.

O desvio padrão já foi calculado, lembra? Ele é igual a 5,57 cm.

Sabendo os valores da média aritmética e do desvio padrão fica

fácil calcular o coeficiente de variação, que representaremos por CV:

CVX

CV

CV

CV

= ×

= ×

= ×=

s100

5 57161

100

0 03459 100

3 459

,

,

,

Page 29: Aula 15 - RNP

438

e-Tec Brasil – Estatística Aplicada

439

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Quer dizer, então, que o coeficiente de variação das estaturas dos

alunos é 3,5% (valor aproximado).

Se você calcular o valor da média aritmética dos salários dos

funcionários do exemplo da seção sobre variância, verá que ela é igual

a 182,8. Já sabemos que o desvio padrão é R$ 154,00. Vamos, agora,

calcular o coeficiente de variação:

CVX

CV

CV

CV

= ×

= ×

= ×

=

s100

154182 8

100

0 8424 100

84 2

,

,

,

Neste caso, o coeficiente de variação dos salários dos funcionários

é 84% (valor aproximado).

Com esses resultados, podemos, então, comparar a dispersão

dos dados em relação à média, nas diferentes situações apresentadas.

A dispersão dos valores dos salários em relação ao salário médio é de 84%,

enquanto a dispersão das estaturas é de 3,5%. Ou seja, podemos afirmar

que os dados do conjunto das estaturas dos alunos são mais homogêneos

(menos dispersos) do que o conjunto com os valores dos salários.

SAIBA MAIS...SAIBA MAIS...

A amplitude da dispersão

Fonte: www.sxc.hu

Luís

Fra

ncis

co C

orde

ro

Page 30: Aula 15 - RNP

440

e-Tec Brasil – Estatística Aplicada

441

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Além das medidas de dispersão que você aprendeu nesta aula, existe outra medida chamada

de amplitude total. Você deve se lembrar do conceito de amplitude total que foi apresentado

na Aula 7.

Para encontrar a amplitude total, você deve calcular a diferença entre o maior e o menor valor

de um conjunto de dados. Assim, quanto maior a amplitude total, maior será a dispersão dos

dados do conjunto.

É uma medida bem simples, você não acha? A amplitude total, assim como a variância, o

desvio padrão e o coeficiente de variação, indica, de maneira aproximada, a dispersão ou

variabilidade dos dados em um conjunto.

No entanto, a amplitude total não é uma medida de dispersão muito utilizada. Isto porque

ela só leva em consideração os valores extremos do conjunto (o maior e o menor), e ignora

os valores intermediários. Imagine um conjunto com os seguintes valores: 2, 57, 57, 57, 58,

59, 60, 60, 62, 63, 63, 63, 100. A amplitude total desse conjunto é noventa e oito (100 – 2

= 98). Se você observar, verá que apenas os dois valores extremos do conjunto são distantes

dos outros dados. Na verdade, a maioria dos dados do conjunto (os outros onze valores)

se concentra entre valores que vão de 57 a 63, ou seja, não estão muito dispersos, não

é mesmo?

Atende ao Objetivo 4

Atende ao Objetivo 4

Na disciplina Biossegurança do curso Segurança no Trabalho, a média aritmética das notas de

todas as provas do primeiro semestre foi de 7,8 pontos e o desvio padrão foi igual a 0,80.

Já na disciplina Psicologia do Trabalho do mesmo curso, a média aritmética de todas as notas

foi igual a 7,3, enquanto o desvio padrão foi de 0,76.

Em qual das duas disciplinas houve maior grau de dispersão?

ATIVIDADE 4

Page 31: Aula 15 - RNP

440

e-Tec Brasil – Estatística Aplicada

441

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

Atende ao Objetivo 4

Na tabela a seguir, você encontra a média aritmética e o desvio padrão das estaturas dos alunos

de turmas do curso de Engenharia. Analisando os valores apresentados na tabela, diga qual das

duas turmas (Mecânica ou Eletrotécnica) é mais homogênea em relação à altura dos alunos?

TurmasNúmero de

alunosMédia da altura dos

alunos da classeDesvio padrão

Mecânica 85 160,6 cm 5,97 cm

Eletrotécnica 125 161,9 cm 6,01 cm

ATIVIDADE 5

RESUMINDO...

• As medidas de dispersão são utilizadas para determinar a homogeneidade ou hete-rogeneidade dos dados de determinado conjunto. Ou seja, elas demonstram o quanto os valores estão espalhados em torno da média aritmética.

• As medidas de dispersão mais comuns são: a variância, o desvio padrão, o coeficiente de variação e a amplitude total.

• A variância é uma medida que representa o quanto os dados de determinado conjunto estão dispersos (afastados) em relação à média aritmética.

• O desvio padrão nos informa a distância média em que os valores de determinado conjunto de dados estão em relação à média. O desvio padrão é a raiz quadrada da variância.

• O coeficiente de variação mostra a dispersão dos dados em relação ao termo médio de um conjunto: o coeficiente de variação é representado em % e, portanto, pode ser comparado com outros coeficientes de situações distintas.

Page 32: Aula 15 - RNP

442

e-Tec Brasil – Estatística Aplicada

443

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

ATIVIDADE 1

Vamos resolver passo a passo:

1º passo – Calcular a média aritmética dos valores:

8 10 11 15 16 186

786

13+ + + + + = =

2º passo – Calcular a dispersão (diferença) dos elementos (valores) em relação à média:

1º elemento: 8-13=-5

2º elemento: 10-13=-3

3º elemento: 11-13=-2

4º elemento: 15-13=2

5º elemento: 16-13=3

6º elemento: 18-13=5

3º passo – Calcular a soma dos quadrados dos valores encontrados anteriormente:

(-5)2+(-3)2+(-2)2+22+32+52 = 25+9+4+4+9+25=76

4º passo – Dividir o valor encontrado no passo anterior pelo número de elementos do

conjunto (que é 6): 76÷6=12,67

Assim, a variância desse conjunto de dados vale 12,67.

Vejamos outra forma de calcular a variância de dados não agrupados com o uso do Pro-

cesso Breve:

Monte a seguinte tabela:

Valores dos elementosQuadrados dos valores

dos elementos

8 64

10 100

11 121

15 225

16 256

18 324

Total: 78 Total: 1.090

RESPOSTAS DAS ATIVIDADES

Page 33: Aula 15 - RNP

442

e-Tec Brasil – Estatística Aplicada

443

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

A variância é a diferença entre a razão do total da segunda coluna e o número de elementos

e o quadrado da razão da primeira coluna e o número de elementos. Ou seja:

s

s

s

s

².

². .

². .

²

= −

= −

= −

=

1 0906

786

1 0906

6 08436

6 540 6 08436

45

2

6636

12 67s² ,=

ATIVIDADE 2

Preenchendo a tabela auxiliar, temos:

Equipamento Freqüência 1ª coluna x 2ª

coluna(1ª coluna)2 x 2ª

coluna

1 2 2 2

2 5 10 20

3 8 24 72

4 6 24 96

5 3 15 75

6 1 6 36

Total 25 81 301

Para calcular a variância de dados agrupados sem intervalo de classes, usamos a seguinte

fórmula:

2

2

42

32

scolunacoluna

a

a

coluna

coluna

a

a= −

s

s

s

s

²

².

² , ,

² ,

= −

= −

= −

=

30125

8125

30125

6 561625

12 04 10 50

1 54

2

A variância vale 1,54.

Page 34: Aula 15 - RNP

444

e-Tec Brasil – Estatística Aplicada

445

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

s

s

s

=

==

2

479 33

21 89

s,

,

ATIVIDADE 3

Preenchendo a tabela auxiliar, encontramos:

Classe

Questões corretas

(intervalo de classe)

N° de alunos (freqüência)

Ponto médio

Freqüência × Ponto médio

Freqüência × Ponto médio²

1 30 50 2 40 80 3.200

2 50 70 8 60 480 28.800

3 70 90 12 80 960 76.800

4 90 110 10 100 1.000 100.000

5 110 130 5 120 600 72.000

Total 37 400 3.120 280.800

Para encontrar o desvio padrão, primeiro temos que calcular a variância. Para calcular a

variância de dados agrupados em intervalo de classes, usamos a seguinte fórmula:

2

2

63

53

scolunacoluna

a

a

coluna

coluna

a

a= −

s². .

= −

280 80037

3 12037

2

s2= 7.589,19-(84,32) 2

s2= 7.589,19-7.109,86

s2= 479,33

Portanto, o desvio padrão é:

σ

σσ

Page 35: Aula 15 - RNP

444

e-Tec Brasil – Estatística Aplicada

445

Au

la 15 • Ap

ren

de

nd

o so

bre

me

did

as de

disp

ersão

ATIVIDADE 4

Como foram dados os valores da média e do desvio padrão, podemos calcular o coeficiente

de variação em cada caso e comparar os valores. Quanto maior o coeficiente de variação,

mais disperso é o conjunto em relação à média.

Coeficiente de variação (CV) da disciplina Biossegurança:

CVdesvio

CV

CV

= ×

= ×

=

_

,,

, %

100

0 807 8

100

10 2

Coeficiente de variação (CV) da disciplina Psicologia do Trabalho:

CVdesvio

CV

CV

= ×

= ×

=

_

,,

, %

100

0 767 3

100

10 4

A disciplina que apresentou a maior dispersão foi aquela com o maior coeficiente de

variação: Psicologia do Trabalho.

ATIVIDADE 5

O grupo mais homogêneo é o que apresenta os dados menos dispersos em relação à média;

portanto, é o que apresenta o menor coeficiente de variação.

Coeficiente de variação (CV) da turma de Mecânica:

CVdesvio

CV

CV

CV

= ×

= ×

=

=

_

,,

,

, %

100

5 97160 6

100

0 0372

3 72

padrãomédia

padrãomédia

padrãomédia

Page 36: Aula 15 - RNP

446

e-Tec Brasil – Estatística Aplicada

Coeficiente de variação (CV) da turma de Eletrotécnica:

CVdesvio

CV

CV

CV

= ×

= ×

=

=

_

,,

,

, %

100

6 01161 9

100

0 0371

3 71

A turma mais homogênea, ou seja, que apresentou a menor dispersão, foi aquela com o

menor coeficiente de variação: Eletrotécnica.

padrãomédia

REFERÊNCIAS BIBLIOGRÁFICAS

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 5. ed.

São Paulo: Saraiva, 2003.

MAGALHÃES, Marcos N.; LIMA, Antonio C. P. Noções de probabilidade

e estatística. 6. ed. São Paulo: EDUSP, 2005.

MARTINS, Gilberto A. Estatística geral e aplicada. 3. ed. São Paulo:

Atlas, 2005.

MILONE, Giuseppe. Estatística geral e aplicada. São Paulo: Thomson

Learning, 2003.