Download - Medidas de Posição e de Variabilidade
André Jalles
Departamento de Estatística e Matemática Aplicada
Sumarização de dadosMedidas Proporção: medida que proporciona a comparação entre
distribuições de frequência com tamanhos amostraisdiferentes.
Pessoas de 18 a 24 anos de idade, por nível de instrução,segundo a situação do domicílio e gênero, Estado do ceará 2010
Nível de instrução Urbana Rural
Homens Percentual Mulheres Percentual Homens Percentual Mulheres Percentual
Sem instrução e fundamental incompleto 118.425 28,0% 89.497 20,2% 63.520 45,1% 41.168 32,4%
Fundamental completo e médio incompleto 119.796 28,3% 118.500 26,7% 45.235 32,1% 41.829 32,9%
Médio completo e superior incompleto 176.907 41,8% 221.604 50,0% 31.550 22,4% 43.070 33,9%
Superior completo 7.744 1,8% 13.780 3,1% 421 0,3% 1.035 0,8%
Total 422.872 100% 443.381 100% 140.726 100% 127.102 100%
Fonte: SIDRA/IBGE, Censo 2010
Sumarização de dadosMedidas Razão: medida que proporciona a comparação de algum fenômeno
entre categorias distintas.
Pessoas de 18 anos ou mais de idade que costumam consumir bebidaalcoólica uma vez ou mais por mês, por gênero e UF-NE, ano 2013.
UF Masculino Feminino total Razão
Alagoas 354 122 476 2,90
Bahia 2.247 1.004 3251 2,24
Ceará 1.062 306 1368 3,47
Maranhão 750 258 1008 2,91
Paraíba 357 127 484 2,81
Pernambuco 1.145 444 1589 2,58
Piauí 431 154 585 2,80
Rio Grande do Norte 435 129 564 3,37
Sergipe 309 98 407 3,15
Fonte: SIDRA/IBGE
Sumarização de dadosMedidasVariável quantitativa
{x1,x2,x3,...,xn}, Amostra com nobservações de uma variávelquantitativa.
Medidas de posição (localização)
Média aritmética: localiza o “centro degravidade” dos dados
Fórmula: (x1+x2+x3+...+xn)/n
Exemplo: (1+2+3+5+9)/5 = 4
Deficiência: sensível a valoresextremos.
Medidas de posição (localização)
Média Geométrica: localiza o “centro”
de dados geométricos.
Fórmula: (x1×x2×x3×... ×xn)1/n
Exemplo: (2×4x8x32x512)1/5
= 16
Deve ser utilizada para dados
geométricos (Exemplo: inflação)
Medidas de posição (localização)Mediana: localiza o valor que divide osdados em dois grupos de tamanhos“iguais”.
Exemplo: {1,2,3,5,9}, Mediana = 3
Fórmula:
n ímpar: x(n+1)/2
n par: (xn/2+xn/2+1)/2Geral: x(n+1)/2
Medidas de posição: Quartis
Q1- primeiro quartil: divide os dadosem duas partes, uma com 25% e outracom 75% das observações.
Q2- segundo quartil: Mediana
Q3- terceiro quartil: divide os dados emduas partes, uma com 75% e outra com25% das observações.
Medidas de posição: QuartisExemplo: {1,2,3,5,9}
Q1=2
Q3=5
Medidas de posição (localização)Moda: valor mais frequente. Valor quemais se repete. Valor que representa olocal de maior densidade dos dados,cuja vizinhança é mais “povoada” comdados.
Exemplo: {1,2,3,5,9}, Moda = 2
Medidas de posição (localização)Exemplo: {1,2,3,5,9}
0 1 2 3 4 5 6 7 8 9
Moda Média
Mediana
Variável quantitativa {x1,x2,x3,...,xn}, Amostra com n observações de uma variávelquantitativa.
Uma medida do centro isolada não é adequada para descreverdados numericamente para uma variável quantitativa. Eladescreve um valor típico, mas não a dispersão dos dados em tornodo valor típico. (Agreste,A e Finlay,B. Métodos Est. Para as C. Sociais)
A dispersão de conjunto de dados é a variabilidade que os dadosapresentam entre si. Se todos os valores forem iguais, não hádispersão; se os dados não são iguais, existe dispersão entre osdados. A dispersão é pequena quando os valores são próximos unsdos outros. Se os valores são muito diferentes entre si, a dispersãoé grande, assim, as medidas de dispersão apresentam o grau deagregação dos dados. (Waldir Medri, ANÁLISE EXPLORATÓRIA DE DADOS )
Medidas de dispersão (variabilidade)
Medida possível de variabilidade dos
dados
Amplitude dos dados: Máximo - Mínimo
Exemplo: {1,2,3,5,9}
9 – 1 = 8
Medidas de dispersão (variabilidade)
Medida possível de variabilidade dos
dados
Distância interquartílica: Q3 – Q1
Exemplo: {1,2,3,5,9}
5 – 2 = 3
Medidas de dispersão (variabilidade)
Média aritmética: localiza o “centro de
gravidade” dos dados. Qual é a sua
representatividade?
Medida possível do “custo”: Distância
quadrática média dos dados à média
Variância: Fórmula (m=média aritmética)
((x1-m)2+(x2-m)
2+...+(xn-m)
2)/(n-1)
Exemplo
((1-4)2+(2-4)
2+(3-4)
2+(5-4)
2+(9-4)
2)/4 = 10
Menor soma quadrática
n
xn
x
n
x
mm
n
xnxxm
mfa
acbbx
xfcbxaxxf
nmxmxmxmf
i
ii
iii
iii
2
2
2
2
2
2
''
2
442'
:se ,0)'( modo, desse ,2
4'
:se 0,)'( .)(
2)(
21
22
2
2
222
Medidas de dispersão (variabilidade)
Problemas da variância: unidade de
medida quadrática
Desvio-Padrão: raiz da Variância
Exemplo
raiz((1-4)2+(2-4)
2+(3-4)
2+(5-4)
2+(9-4)
2)/4
= raiz(10) 3,16
O que o Desvio Padrão representa
Medidas de dispersão (variabilidade)
Mediana: localiza o valor que divide os
dados em dois grupos de tamanhos
“iguais”.
Desvio Médio: Distância linear média
entre as observações e a mediana
Exemplo
(|1-3|+|2-3|+|3-3|+|5-3|+|9-3|)/5=11/5=2,2
Mínima soma linear
Medidas de dispersão (variabilidade)
Problemas do desvio-padrão: a
unidade de medida influencia o valor
Coeficiente de variação: S/média
Adimensional
Exemplo: 3,16/ 4 0,7906
Medidas de assimetria
Medida de afastamento da simetria dos
dados, ou grau de deformação da
distribuição dos dados
Comparação entre medidas de tendência
central
Coeficiente de Pearson:
Sk = 3(média-mediana)/S
= 3(4-3)/3,16 0,9487
Medidas de assimetria
Medida de afastamento da simetria dos
dados, ou grau de deformação da
distribuição dos dados
Comparação entre medidas de tendência
central
Coeficiente quartil de assimetria
eQ = ((Q3-Q2)-(Q2-Q1))/(Q3-Q1)
=((5-3)-(3-2))/(5-2) 0,3333