medidas de dispersão

6

Click here to load reader

Upload: gustavo-soutinho

Post on 08-Jul-2015

834 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Medidas de Dispersão

Medidas de Dispersão

MEDIDAS DE DISPERSÃO

Por vezes, há distribuições que apesar de terem a mesma média, constata-se que os

respectivos dados não estão distribuídos de forma igual em torno da média.

Assim, para uma informação mais completa acerca da “forma” da distribuição, surgiram as

medidas de dispersão: amplitude, variância e desvio padrão.

Por exemplo, considere-se os seguintes gráficos, onde são apresentadas as frequências de

duas distribuições de dados, relativamente a uma mesma variável estatística.

Exercício 1 (Medidas de dispersão – dados simples)

Num concurso de patinagem 3 patinadoras obtiveram os seguintes resultados:

TotalA 8,5 8 9 8,5 10 44B 8,5 9,5 9,5 7 9,5 44C 9,5 9,5 8,5 8 8,5 44

a) Qual é a média dos resultados de cada uma das patinadoras?

As três patinadoras têm a mesma média 8,8.

b) Qual é a amplitude (h) dos resultados de cada uma das patinadoras?

A amplitude de um conjunto de dados x1, x2, …, xn, é obtida pela diferença entre o maior e o

menor destes valores.

Se os dados estão agrupados em classes, a amplitude é a diferença entre o limite superior da

última classe e o limite inferior da primeira classe.

Page 2: Medidas de Dispersão

Medidas de Dispersão

5,185,9

5,275,9

2810

=−==−=

=−=

C

B

A

h

h

h

Pode concluir-se que a patinadora C é a que tem as notas mais próximas.

c) Qual é a variância?

A variância, que se representa por V ou 2σ , é dada pela seguinte fórmula, para os casos em

se tem dados simples:

N

xx

N

xxxxxxV iN ∑ −

=−++−+−

=222

22

1)()(...)()(

Assim, para cada um dos patinadores, tem-se:

Patinador A:

46,05

)8,810()8,85,8()8,89()8,88()8,85,8( 22222

≈−+−+−+−+−=AV

Patinador B:

96,05

)8,85,9()8,87()8,85,9()8,85,9()8,85,8( 22222

≈−+−+−+−+−=BV

Patinador C:

36,05

)8,85,8()8,88()8,85,8()8,85,9()8,85,9( 22222

≈−+−+−+−+−=CV

Portanto, pode concluir-se que o patinador C teve resultados com menor variância, e

consequentemente mais próximos da média.

Page 3: Medidas de Dispersão

Medidas de Dispersão

Nota:

A interpretação do significado de variância, em situações concretas, levanta problemas. Por

exemplo, se se estiver a estudar a altura de um grupo de pessoas em cm, a altura média ainda

se exprime em cm, mas a Variância exprime-se em cm2.

Logo, seria vantajoso ter-se uma medida de dispersão que se exprimisse na mesma unidade

de medida em que se exprimem os dados.

O desvio padrão é a medida de dispersão que responde a essa exigência.

d) Qual é o desvio padrão de cada um dos dados?

60,036,0

98,096,0

68,046,0

≈==

≈==

≈==

V

V

V

C

B

A

σ

σ

σ

O desvio padrão é a medida de dispersão mais usada.

Nota:

Utilizando algumas propriedades dos somatórios, pode-se passar a fórmula do desvio padrão

para uma outra:

N

xxi∑ −=

2)(σ

ou

22

xN

xi −= ∑σ

Page 4: Medidas de Dispersão

Medidas de Dispersão

Exercício 2 (Medidas de dispersão – dados agrupados)

A tabela seguinte refere-se ao tempo de música que 20 cd’s têm:

a) Qual é a média?

4720

25,5735,5285,4755,4225,37 ≈×+×+×+×+×== ∑N

fxx ii

b) Qual é o desvio padrão?

Uma vez que os dados estão agrupados, a fórmula que permite calcular o desvio padrão é:

5,575,29)( 2

≈≈−

= ∑N

xxf iiσ

A outra fórmula, da mesma forma que ocorreu no caso anterior:

22

xN

xf ii −= ∑σ

Page 5: Medidas de Dispersão

Medidas de Dispersão

Interpretação do desvio padrão

Quanto maior for o desvio padrão, maior será a dispersão dos valores relativamente à média.

Combinando o conhecimento da média e do desvio padrão, pode-se, em muitas situações,

caracterizar a localização e a dispersão dos valores.

Quando a distribuição é normal (sob a forma da denominada Curva de Gauss), cuja média,

mediana e moda coincidem, tem-se aproximadamente:

No intervalo ] [σσ +− xx , , 68,3 % das observações;

No intervalo ] [σσ 2,2 +− xx , 95,5 % das observações;

No intervalo ] [σσ 3,3 +− xx , 99,7 % das observações;

Na prática, a maioria das distribuições apresenta este comportamento. Assim, por exemplo, se

numa distribuição se tem média 30 e desvio padrão 4, pode-se esperar que cerca de:

2/3 dos valores estejam entre 26 e 34;

95 % dos valores estejam entre 22 e 38;

99 % dos valores estejam entre 18 e 42.

Page 6: Medidas de Dispersão

Medidas de Dispersão

Analisando a curva de Gauss (Curva normal), esta tem as seguintes características:

Tem a forma de um sino;

É simétrica em relação à média;

A média corresponde ao máximo da curva;

Nas distribuições normais, o desvio padrão tem grande influência na forma do sino:

Se o desvio padrão é grande, os valores da variável estão mais dispersos em torno da

média:

Se o desvio padrão é pequeno, os valores estão mais concentrados em torno da

média.

Prof Gustavo Soutinho2012