introduÇÃo À estatÍstica - centro de pesquisas ... · medidas de dispersão variância (s2):...
TRANSCRIPT
INTRODUÇÃO À ESTATÍSTICA: Medidas de Tendência Central
e
Medidas de Dispersão
Prof. Dr. Guanis de Barros Vilela Junior
Relembrando !!!
•Não é uma CIÊNCIA EXATA!!!
•É UMA CIÊNCIA PROBABILÍSTICA !!!!!!!
•Serve para “apoiar” um pressuposto teórico
•Associa probabilisticamente variáveis
•Não estabelece, via de regra, RELAÇÃO CAUSAL!
•Pode ser manipulada!(como qualquer conhecimento)
Objetivos
• Descrever as características de uma amostra;
•Identificar as operações matemáticas que podem
ser empregadas na análise de dados de acordo
com a escala de medida das variáveis;
•Selecionar procedimentos adequados à análise
descritiva de variáveis qualitativas e quantitativas;
•Interpretar as estatísticas utilizadas para
representar a tendência central e a dispersão
Distribuição de Frequências A tabela abaixo mostra o gasto (em Reais) mensal
em Energia Elétrica de 15 empresas
1 3200
2 1910
3 2204
4 2435
5 2759
6 3000
7 3004
8 2805
9 1900
10 1999
11 2960
12 3232
13 2759
14 2328
15 2524
Sujeito Gasto
9 1900
2 1910
10 1999
3 2204
14 2328
4 2435
15 2524
5 2759
13 2759
8 2805
11 2960
6 3000
7 3004
1 3200
12 3232
Sujeito Gasto
Tabela
Primitiva
Rol
Crescente
Passo 1: ordenar do menor
para o maior gasto.
Passo 2: Calcule a Amplitude
(diferença entre o maior e o
menor)
A = 3232 – 1900 = 1332
Medidas de Posição
Medidas de Posição
Medidas de
Tendência Central
Medidas Separatrizes
ou de Dispersão
Medidas de Tendência Central
Média Aritmética – é a soma das medidas dividida pelo
número de casos, representando-se a média da população por m
e a da amostra por x.
É uma das medidas mais usadas, entretanto, possui como
desvantagem o fato de sofrer grande influência de valores extremos.
Na tabela do gasto mensal apresentado anteriormente a média é:
S Pi X =
n = (39019) / 15 = 2601,26 Reais
Medidas de Tendência Central
Mediana: é o valor que se encontra na posição central
da série de dados.
É empregada quando há valores extremos que podem
afetar, de maneira acentuada, a média.
No rol crescente do gasto
mensal, qual é a mediana?
9 1900
2 1910
10 1999
3 2204
14 2328
4 2435
15 2524
5 2759
13 2759
8 2805
11 2960
6 3000
7 3004
1 3200
12 3232
2759
Medidas de Tendência Central
Moda: é o valor mais frequente da série de dados.
É empregada em pesquisas cujas informações são de
natureza qualitativa (escala nominal ou ordinal).
9 1900
2 1910
10 1999
3 2204
14 2328
4 2435
15 2524
5 2759
13 2759
8 2805
11 2960
6 3000
7 3004
1 3200
12 3232
Qual é a moda?
2759
Medidas de Tendência Central
Quartis: são representados por Q1, Q2, Q3,
sendo chamados de primeiro, segundo e terceiro
quartil respectivamente.
Q1: é um valor que representa que abaixo
existem 25% dos casos.
Q2: é um valor que representa que abaixo
existem 50% dos casos.
Q3: é um valor que representa que abaixo
existem 75% dos casos.
Medidas de Tendência Central
Decis: São representados por D1, D2, D3, ... , D9, sendo
chamados, respectivamente, de primeiro, segundo, terceiro, ... ,
nono decil.
D1: é o valor que representa que abaixo existem 10% dos casos
D2: é o valor que representa que abaixo existem 20% dos casos
D3: é o valor que representa que abaixo existem 30% dos casos
..... ...... ..... ...... ....... ....... ....... ....... ........ ........ ...... ..
D9: é o valor que representa que abaixo existem 90% dos casos
Medidas de Tendência Central
Percentis: São representados por P1, P2, P3, ... , P99,
sendo chamados, respectivamente, de primeiro, segundo, terceiro, ... ,
nonagésimo nono percentil.
P1: é o valor que representa que abaixo existem 10% dos casos
P2: é o valor que representa que abaixo existem 20% dos casos
P3: é o valor que representa que abaixo existem 30% dos casos
..... ...... ..... ...... ....... ....... ....... ....... ........ ........ ...... ..
P99: é o valor que representa que abaixo existem 99% dos casos
Tabelas de percentis são muito utilizadas em todas as áreas,
especialmente para avaliação do crescimento e desenvolvimento de
qualquer variável (ex: de crianças; de vendas; de reclamações, etc.)
Medidas de Dispersão
A população de duas cidades A e B possuem renda média
de R$ 5000,00. Sabemos que esta medida de tendência
central informa muito pouco sobre a distribuição da renda
nas duas cidades, ou seja, não sabemos da proporção de
ricos e pobres.
Uma das cidades pode apresentar, ao mesmo tempo, uma
esmagadora maioria muito pobre e algumas poucas famílias
muito ricas, possuindo mesmo assim uma renda média de
R$ 5000,00.
A outra cidade pode apresentar uma distribuição de renda
mais igualitária, tendo uma renda média de R$ 5000,00.
Por isto saber da dispersão da renda para estas cidades
aponta
Distribuição Normal (ou Gaussiana)
Média
+DP - DP +2DP -2DP
Distribuição Normal (ou Gaussiana)
68,3%
95,3%
99,7%
Medidas de Dispersão
Amplitude
É a diferença entre o maior e o menor valor do
conjunto de dados.
A = 3232 – 1900 = 1332
Na tabela de gasto mensal:
Medidas de Dispersão
Variância (s2):
Desvio: É a diferença entre a média e cada um
dos valores no conjunto de dados.
Pode ser negativo.
É a média aritmética dos
quadrados dos desvios.
S2 = S(x - m)2
N
Ou seja:
Medidas de Dispersão
Desvio Padrão (SD ou DP):
É a raiza quadrada da variância
Ou seja:
DP = S(x - m)2
N
Medidas de Dispersão
Erro padrão (EP):
Ou seja: EP =
DP
N
É muito importante para a construção de intervalos de confiança
É a razão entre o DP e a raiz
quadrada do tamanho da amostra
Medidas de Dispersão
Erro padrão (EP): EP = S
N
Média da
população
Média da amostra A Média da amostra B
Diferença entre o
real e o esperado
Coeficiente de Variação
Medidas de Dispersão
Expressa o Desvio Padrão
como porcentagem do
valor da média.
CV = DP média
Ou seja:
Quanto menor o CV mais homogênea será a amostra
Medidas de Dispersão
Escore Z Mede quanto um valor específico
afasta-se da média em unidades
de desvio – padrão.
Z = X - X
DP
Escore Z
+ 1 - 2 - 1 + 2 + 3 - 3 0
Medidas de Dispersão
Escore Z
Z = X - X
DP
É muito útil para comparar valores
provenientes de diferentes estudos
É de fácil conversão para percentil
Exemplo: Admitamos que para um valor específico
o escore Z = +2, então:
Medidas de Dispersão
+2
50% 48%
50+48= 98%
Percentil 98: este valor é igual ou superior a 98% dos
valores presentes no restante da população
Exercício Considerando as estaturas de todos os meninos com
10 anos de idade de um vilarejo, obteve-se uma
estatura média de 120 cm e um Desvio Padrão de 20 cm.
Como se localiza dentro desta população, uma
criança, que aos 10 anos de idade, apresenta estatura
de 80 cm?
Z = X - X
DP
80 - 120
20 = = - 2
Esta criança está no percentil 2, ou seja, ela tem uma
estatura superior ou igual à apresentada por 2% das
crianças de sua comunidade. ENTÃO ?!?!?!?!...
Então....
•Esta criança precisa de atenção imediata!
•PODE ser multifatorial (alimentação ruim, sedentarismo, doenças, genética, condições ambientais, sociais, psiquismo, etc).
•OBRIGADO PELA ATENÇÃO !!!!!