aula 5 medidas descritivas - ppec.ufba.br 5 medidas descritivas.pdf · variÂncia e desvio padrÃo...
TRANSCRIPT
UNIVERSIDADE FEDERAL DA BAHIA
ESCOLA POLITÉCNICA
MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA
ENG C 18 Métodos de Pesquisa Quantitativos e Qualitativos
AULA 5 – MEDIDAS
DESCRITIVAS
DOCENTE: CIRA SOUZA PITOMBO
O que vimos até aqui? • Análise exploratória de dados:
• Qualitativos
• Quantitativos
• Nas aulas anteriores – organização de dados
em distribuição de freqüências
MEDIDAS DESCRITIVAS
• VARIÁVEIS QUANTITATIVAS
• Conhecer o peso típico de recém-nascidos numa
comunidade
• Média ou Mediana
• Para se ter idéia da magnitude de
variação do peso das crianças
• Desvio Padrão
• Nesta aula iremos calcular e interpretar
certas medidas que descrevem
informações específicas de um conjunto
de valores
MÉDIA E DESVIO PADRÃO
MÉDIA ARITMÉTICA
• Soma dos valores dividida pelos valores
observados
• De modo geral, dado um conjunto de n valores
observados de uma certa variável X, podemos
definir a média aritmética por:
n
XX
XIndica a soma dos valores observados
da variável X
MÉDIA E DESVIO PADRÃO
MÉDIA ARITMÉTICA
Turma Notas Média
A 4 5 5 6 6 7 7 8 6,0
B 1 2 4 6 6 9 10 10 6,0
C 0 6 7 7 7 7,5 7,5 6,0
0 1 2 3 4 5 6 7 8 9 10
Turma A
Turma B
Turma C
Diferentes formas de dispersão dos dados
VARIÂNCIA E DESVIO PADRÃO • Tanto a variância quanto o desvio padrão são
medidas que fornecem informações
complementares à informação contida na
média aritmética
• Tais medidas avaliam a dispersão do conjunto
de valores em análise
• Para calcularmos a variância ou o desvio
padrão, devemos considerar os desvios de
cada valor em relação à média aritmética.
• Depois construímos uma espécie de média
desses desvios.
VARIÂNCIA E DESVIO PADRÃO
Valores (notas dos alunos) X 4 5 5 6 6 7 7 8
Média X 6
Desvios XX -2 -1 -1 0 0 1 1 2
Desvios quadráticos 2)( XX 4 1 1 0 0 1 1 4
Variância
1
)( 2
2
n
XXS
Desvio padrão
1
)( 2
n
XXS
O Desvio padrão será sempre não negativo e será tão
maior quanto mais dispersos forem os valores em análise
MÉDIA E DESVIO PADRÃO
MÉDIA ARITMÉTICA
Turma Notas Média
A 4 5 5 6 6 7 7 8 6,0
B 1 2 4 6 6 9 10 10 6,0
C 0 6 7 7 7 7,5 7,5 6,0
0 1 2 3 4 5 6 7 8 9 10
Turma A
Turma B
Turma C
Diferentes formas de dispersão dos dados
Desvio Padrão
1,31
3,51
2,69
Fórmulas para Média e Desvio
padrão Ao calcular o desvio padrão nos casos em que a média
acusar um valor fracionário, os desvios, , acumularão erros
de arredondamento, que poderão comprometer o resultado final.
X
XX
1
22
n
nXXS 2X Soma dos valores quadráticos
2
X Média elevada ao quadrado
n = número de valores
EXERCÍCIO 1
Calcule a Média, Desvio Padrão e Variância dos dados
acima
MÉDIA PONDERADA
O Cálculo da média e do desvio padrão por ponderação é feito
sempre que precisamos dar mais importância a um caso do que
outro
82.09
39.7
n
XX Média Simples
855,0709941
73.607500)(
POP
IDHxPOPX p
Média Ponderada
EXERCÍCIO 1
Calcule a Média, Desvio Padrão e Variância dos dados
acima
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
Statistics
20 20
0 0
2.60 1315.00
1.231 897.086
1.516 804763.2
Valid
Missing
N
Mean
Std. Dev iation
Variance
Números de
moradores
no domicílio
Renda
Familiar
A MEDIANA A mediana avalia o centro de um conjunto de valores, sob o critério de
ser o valor que divide a distribuição ao meio, deixando os 50%
menores valores de um lado e os 50% maiores valores do outro lado.
{2, 3, 4, 5, 8}
Dado um conjunto de n valores, definimos mediana como o valor, Md, que
ocupa a posição n+1/2, considerando os dados ordenados crescente ou
decrescentemente. Se n+1/2 for fracionário, toma-se como mediana a média dos
dois valores de posições mais próximas a n+1/2
{0; 6; 7; 7; 7; 7,5; 7,5 }
Posição: 42
17
2
1
n
EXERCÍCIO 2 Determine a mediana para os exemplos abaixo
{5,3,2,8,4}
{3,5,6,7,10,11}
EXERCÍCIO 3 Determine a mediana para as variáveis numéricas para o caso abaixo
COMPARAÇÃO ENTRE MÉDIA E
MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central
mais adequada, quando se supõe que estes valores tenham uma distribuição
razoavelmente simétrica, enquanto que a mediana surge como uma alternativa
para representar a posição central em distribuições muito assimétricas
Muitas vezes, calculam-se ambas as medidas para avaliar a posição central sob
dois enfoques diferentes.
50% 50%
Média = mediana
COMPARAÇÃO ENTRE MÉDIA E
MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central
mais adequada, quando se supõe que estes valores tenham uma distribuição
razoavelmente simétrica, enquanto que a mediana surge como uma alternativa
para representar a posição central em distribuições muito assimétricas
Muitas vezes, calculam-se ambas as medidas para avaliar a posição central sob
dois enfoques diferentes.
50% 50%
COMPARAÇÃO ENTRE MÉDIA E
MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central
mais adequada, quando se supõe que estes valores tenham uma distribuição
razoavelmente simétrica, enquanto que a mediana surge como uma alternativa
para representar a posição central em distribuições muito assimétricas
Muitas vezes, calculam-se ambas as medidas para avaliar a posição central sob
dois enfoques diferentes.
50% 50%
EXERCÍCIO 3 Determine a mediana para as variáveis numéricas para o caso abaixo
Statistics
20 20
0 0
3.00 1000.00
Valid
Missing
N
Median
Números de
moradores
no domicílio
Renda
Familiar
EXERCÍCIO 3
QUARTIS E EXTREMOS Chamamos de extremo inferior, Ei, ao menor valor dos dados em análise.
Chamamos de extremo superior, Es, ao maior valor dos dados em análise.
{5,3,6,11,7}
Chamamos de Primeiro Quartil ou Quartil inferior, Qi, ao valor que delimita os
25% menores valores.
Chamamos de Terceiro Quartil ou Quartil superior, Qs, ao valor que delimita os
25% maiores valores.
Chamamos de Segundo Quartil ou Quartil do meio, Mediana,
ao valor que separa os 50% menores valores dos 50% maiores
valores.
QUARTIS E EXTREMOS
{2,0,5,7,9,1,3,4,6,8}
Ordenando : 0 1 2 3 4 5 6 7 8 9
Posição: 5,52
110
2
1
n
Média entre a 5ª e 6ª posições = 4,5 - Mediana
0 1 2 3 4 4,5 5 6 7 8 9
Posição: 32
15
2
1
n
0 1 2 3 4 4,5 5 6 7 8 9
Qi=2
Posição: 32
15
2
1
n
Qs=7
EXERCÍCIO 4 Determine os extremos e quartis para as variáveis numéricas abaixo
EXERCÍCIO 4
EXERCÍCIO 4
EXERCÍCIO 4
Statistics
20 20
0 0
1.25 562.50
3.00 1000.00
3.75 2000.00
Valid
Missing
N
25
50
75
Percentiles
Números de
moradores
no domicílio
Renda
Familiar
DIAGRAMA EM CAIXAS Box-plot
Representação pictória da distribuição dos dados
Os limites superior e inferior da caixa marcam os quartis
superior e inferior da distribuição dos dados
O comprimento da caixa é a distância entre o 25º percentil e
o 75º percentil, de forma que a caixa contém 50% dos
valores centrais dos dados
Quanto maior a caixa, maior a dispersão das observações
As linhas que se estendem de cada caixa
(chamadas de whiskers) representam a
distância à menor e à maior observação que
estão a menos de um quartil da caixa
DIAGRAMA EM CAIXAS O boxplot é um gráfico que possibilita representar a distribuição de um conjunto de
dados com base em alguns de seus parâmetros descritivos, quais sejam: a mediana
(q2), o quartil inferior (q1), o quartil superior (q3) e do intervalo interquartil (IQR = q3 -
q1).
DIAGRAMA EM CAIXAS
O boxplot permite avaliar a simetria dos dados, sua dispersão e a existência ou
não de outliers nos mesmos, sendo especialmente adequado para a comparação
de dois ou mais conjuntos de dados correspondentes às categorias de uma
variável qualitativa.
DIAGRAMA EM CAIXAS
O gráfico acima apresenta a distribuição da variável ilc segundo
as categorias da variável situação. Observando o gráfico, verifica-
se que as empresas classificadas como solventes possuem
índices de liquidez corrente em geral maiores que os índices das
empresas classificadas como insolventes.
EXERCÍCIO 5
Faça diagramas de caixa fazendo o cruzamento entre a variável
qualitativa região e as numéricas
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5