medidas de dispersão
TRANSCRIPT
Medidas de Dispersão
MEDIDAS DE DISPERSÃO
Por vezes, há distribuições que apesar de terem a mesma média, constata-se que os
respectivos dados não estão distribuídos de forma igual em torno da média.
Assim, para uma informação mais completa acerca da “forma” da distribuição, surgiram as
medidas de dispersão: amplitude, variância e desvio padrão.
Por exemplo, considere-se os seguintes gráficos, onde são apresentadas as frequências de
duas distribuições de dados, relativamente a uma mesma variável estatística.
Exercício 1 (Medidas de dispersão – dados simples)
Num concurso de patinagem 3 patinadoras obtiveram os seguintes resultados:
TotalA 8,5 8 9 8,5 10 44B 8,5 9,5 9,5 7 9,5 44C 9,5 9,5 8,5 8 8,5 44
a) Qual é a média dos resultados de cada uma das patinadoras?
As três patinadoras têm a mesma média 8,8.
b) Qual é a amplitude (h) dos resultados de cada uma das patinadoras?
A amplitude de um conjunto de dados x1, x2, …, xn, é obtida pela diferença entre o maior e o
menor destes valores.
Se os dados estão agrupados em classes, a amplitude é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe.
Medidas de Dispersão
5,185,9
5,275,9
2810
=−==−=
=−=
C
B
A
h
h
h
Pode concluir-se que a patinadora C é a que tem as notas mais próximas.
c) Qual é a variância?
A variância, que se representa por V ou 2σ , é dada pela seguinte fórmula, para os casos em
se tem dados simples:
N
xx
N
xxxxxxV iN ∑ −
=−++−+−
=222
22
1)()(...)()(
Assim, para cada um dos patinadores, tem-se:
Patinador A:
46,05
)8,810()8,85,8()8,89()8,88()8,85,8( 22222
≈−+−+−+−+−=AV
Patinador B:
96,05
)8,85,9()8,87()8,85,9()8,85,9()8,85,8( 22222
≈−+−+−+−+−=BV
Patinador C:
36,05
)8,85,8()8,88()8,85,8()8,85,9()8,85,9( 22222
≈−+−+−+−+−=CV
Portanto, pode concluir-se que o patinador C teve resultados com menor variância, e
consequentemente mais próximos da média.
Medidas de Dispersão
Nota:
A interpretação do significado de variância, em situações concretas, levanta problemas. Por
exemplo, se se estiver a estudar a altura de um grupo de pessoas em cm, a altura média ainda
se exprime em cm, mas a Variância exprime-se em cm2.
Logo, seria vantajoso ter-se uma medida de dispersão que se exprimisse na mesma unidade
de medida em que se exprimem os dados.
O desvio padrão é a medida de dispersão que responde a essa exigência.
d) Qual é o desvio padrão de cada um dos dados?
60,036,0
98,096,0
68,046,0
≈==
≈==
≈==
V
V
V
C
B
A
σ
σ
σ
O desvio padrão é a medida de dispersão mais usada.
Nota:
Utilizando algumas propriedades dos somatórios, pode-se passar a fórmula do desvio padrão
para uma outra:
N
xxi∑ −=
2)(σ
ou
22
xN
xi −= ∑σ
Medidas de Dispersão
Exercício 2 (Medidas de dispersão – dados agrupados)
A tabela seguinte refere-se ao tempo de música que 20 cd’s têm:
a) Qual é a média?
4720
25,5735,5285,4755,4225,37 ≈×+×+×+×+×== ∑N
fxx ii
b) Qual é o desvio padrão?
Uma vez que os dados estão agrupados, a fórmula que permite calcular o desvio padrão é:
5,575,29)( 2
≈≈−
= ∑N
xxf iiσ
A outra fórmula, da mesma forma que ocorreu no caso anterior:
22
xN
xf ii −= ∑σ
Medidas de Dispersão
Interpretação do desvio padrão
Quanto maior for o desvio padrão, maior será a dispersão dos valores relativamente à média.
Combinando o conhecimento da média e do desvio padrão, pode-se, em muitas situações,
caracterizar a localização e a dispersão dos valores.
Quando a distribuição é normal (sob a forma da denominada Curva de Gauss), cuja média,
mediana e moda coincidem, tem-se aproximadamente:
No intervalo ] [σσ +− xx , , 68,3 % das observações;
No intervalo ] [σσ 2,2 +− xx , 95,5 % das observações;
No intervalo ] [σσ 3,3 +− xx , 99,7 % das observações;
Na prática, a maioria das distribuições apresenta este comportamento. Assim, por exemplo, se
numa distribuição se tem média 30 e desvio padrão 4, pode-se esperar que cerca de:
2/3 dos valores estejam entre 26 e 34;
95 % dos valores estejam entre 22 e 38;
99 % dos valores estejam entre 18 e 42.
Medidas de Dispersão
Analisando a curva de Gauss (Curva normal), esta tem as seguintes características:
Tem a forma de um sino;
É simétrica em relação à média;
A média corresponde ao máximo da curva;
Nas distribuições normais, o desvio padrão tem grande influência na forma do sino:
Se o desvio padrão é grande, os valores da variável estão mais dispersos em torno da
média:
Se o desvio padrão é pequeno, os valores estão mais concentrados em torno da
média.
Prof Gustavo Soutinho2012