análise descritiva de dados - fgv -...
TRANSCRIPT
1
Análise Descritiva
de Dados
2
Estatística
estatísticadescritiva
estatísticainferencial
3
Estatística descritiva
Envolve técnicas que permitem
representar, mensurar e analisar um conjunto de dados
4
Estatística inferencial
Envolve técnicas que permitem utilizar dados de uma amostra para
generalizações sobre a população
5
definições e conceitos básicos
conjunto de todos os elementos que constituem a abrangência do estudo
� população
� amostra
um subconjunto da população
6
definições e conceitos básicos
�unidade observávela portadora da característica ou propriedade que se deseja investigar
representação simbólica da característica ou propriedade que se deseja investigar
�variável
7
definições e conceitos básicos
são os parâmetros que representam as características estudadas da população ou amostra em questão
�medidas estatísticas
processo de generalizar para a população os resultados obtidos em uma amostra
� inferência
8
população
conjunto constituído pelos alunos deste curso
9
unidades observáveis
aluno 1 – unidade observável 1
aluno 2 – unidade observável 2
aluno 3 – unidade observável 3
aluno n – unidade observável n
cada aluno deste curso
10
amostra
alunos do estado do Rio de Janeiro
11
variável
masculino
masculino
feminino
gênero dos alunos
12
medidas estatísticas
33,3% dos alunos são mulheres
Percentagem de mulheres
13
Inferência (pontual)
como a turma do RJ tem 33,3 % de mulheres, então 33,3 % do total de alunos deste curso são mulheres
14
Inferência (por intervalo)
como a turma do RJ tem 33,3 % de mulheres, há uma probabilidade de 90% que a porcentagem de mulheres do curso esteja entre 28,3% e 38,3%
15
Medidas e Níveis de Mensuração
16
Níveis de Mensuração
tipos de variáveis
qualitativas quantitativas
nominal ordinal intervalar razão
17
Variáveis Qualitativas
� escala nominal� ex: estado civil� sexo
� escala ordinal� ex: nível de instrução� nível salarial
18
Variáveis Quantitativas
� escala intervalarex: QI
temperatura em graus centígrados
� escala de razãoex: salário
comprimento
19
Representando Dados
20
representando dados
setores(pizza)
dados
barras
quantitativosqualitativos
tabela defreqüên-cias
métodostabulares
histograma classes de freqüên-cias
linhas
métodosgráficos
métodosgráficos
métodostabulares
21
Representando dados qualitativos
22
Representando dados qualitativos
métodos gráficos
setores
dados qualitativos
barras tabela de freqüências
métodos tabulares
absoluta
relativa
simples
acumulada
23
10040Total
3514D
156C
3012B
208A
Percentual (%)
(freq. relativa)
Votos
(freq. absoluta)Plano
Preferência dos Vendedores pelos Planos de Incentivo
24
Representando Dados Qualitativos
métodos gráficos
setores
dados qualitativos
barras tabela de freqüências
métodos tabulares
absoluta
relativa
simples
acumulada
25
�Estamos bem acima dos nossos competidores!
30%30% 32%32% 34%34% 36%36%
NósNós
YY
XX
Representação Gráfica
26
Forma Correta de Representação Gráfica
32%
33%
35%
0% 10% 20% 30% 40%
NÓS
Y
X
27
Outra Forma de Representação Gráfica
32%
33%
NÓS35%
X
Y
28
Gráfico de Barras
29
0
2
4
6
8
10
12
14
Voto
s
A B C D
Plano
Preferência dos vendedores pelos planos de incentivo
30
0
2
4
6
8
10
12
14
Voto
s
A B C D
Plano
Altura mostra freqüência ou %
Zero Espaçamento
Largura da base igual
Preferência dos vendedores pelos planos de incentivo
31
32
Gráfico de Setores
33
D35
C15
A20
B30
Preferência dos vendedores pelos planos de incentivo (%)
34
35
36
37
38
Séries Geográficas
� representadas por barras ou setores
� permite identificar as localizações onde o
fenômeno atua com mais intensidade
39
40
Representando Dados Quantitativos
41
Representando Dados Quantitativos
Quantitativos
DadosQuantitativos
MétodosGráficos
Métodos Tabulares
Histogramas Classes de Freqüências
Linhas
42
Gráfico de Linhas
43
Séries Temporais
� Representadas por Gráficos de Linhas
� Permite visualizar a tendência do fenômeno
no tempo
44
45
46
Histograma
47
� Representa uma tabela de Distribuição de
Freqüências por classes de valores.
� Condensa dados agrupando valores em classes.
� Alturas das barras refletem freqüências absolutas
ou relativas (percentuais).
Histograma
48
� Determinar o menor (x) e o maior (X) valores
observados
� Determinar o # de classes (k = √n) – entre 5 e 15
� Calcular a amplitude das classes
� (h = (X-x)/k)
� Estabelecer os limites das classes
� Alocar o # de obs a cada uma das classes
Histograma - Procedimentos
49
Histograma - ExemploDados: 22, 26, 24, 17, 27, 27, 30, 44, 32, 38
Dados Ordenados: 17, 22, 24, 26, 27, 27, 30, 32, 38, 44
h = 44-17
3
Limites
Classes Pt Médios Freqüência
15 ≤ X < 25 20 3
25 ≤ X < 35 30 5
35 ≤ X < 45 40 2
Abs. %
30
50
20
(lim superior + lim inferior)
2
k =√10 ≈ 3
50
0
1
2
3
4
5
Histograma
0 15 25 35 45 55
Freq
Classes Freq.
15 ≤≤≤≤ X < 25 325 ≤≤≤≤ X < 35 535 ≤≤≤≤ X < 45 2