análise exploratória de dados no spss

43
Análise Exploratória de Dados no SPSS Gráficos e Estatísticas Descritivas Vitor Vieira Vasconcelos BH1350 – Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2016

Upload: vitor-vieira-vasconcelos

Post on 12-Apr-2017

430 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Análise exploratória de dados no SPSS

Análise Exploratóriade Dados no SPSSGráficos e Estatísticas Descritivas

Vitor Vieira Vasconcelos

BH1350 – Métodos e Técnicas de Análise da Informação para o Planejamento

Junho de 2016

Page 2: Análise exploratória de dados no SPSS

O que nós vimos na aula passada

Distribuição Amostral

Erro padrão da Média

Intervalos de Confiança

Distribuição t

Comparação de Intervalos de Confiança (SPSS)

Page 3: Análise exploratória de dados no SPSS

Conteúdo

Inferência estatística

Normalidade de dados

Gráficos de caixas e bigodes (boxplot)

Valores discrepantes (outliers)

Gráficos Q-Q

Transformações de dados

Page 4: Análise exploratória de dados no SPSS
Page 5: Análise exploratória de dados no SPSS

Leitura de Referência

Capítulo 1 – p. 47-59

Capítulo 3

Explorando Dados

(p. 85 – 124)

Page 6: Análise exploratória de dados no SPSS

Comparando médias e erros padrão Gráficos-> Caixas de diálogo legadas -> Barras

Page 7: Análise exploratória de dados no SPSS

Comparando médias e erros padrão

Page 8: Análise exploratória de dados no SPSS

Comparando médias e erros padrão

Page 9: Análise exploratória de dados no SPSS

Método científico para tirar conclusões sobre osparâmetros da população a partir da coleta,

tratamento e análise dos dados de uma amostrarecolhida dessa população.

Inferência Estatística

Page 10: Análise exploratória de dados no SPSS

Inferência Estatística

Page 11: Análise exploratória de dados no SPSS

PARAMÉTRICA: Admite que a distribuição da população tem uma forma matemáticaconhecida, embora contendo um ou maisparâmetros desconhecidos.

NÃO-PARAMÉTRICA: Pretende-se conhecer a forma da distribuição

Inferência Estatística

Page 12: Análise exploratória de dados no SPSS

PARAMÉTRICA: Admite que a distribuição da população tem uma forma matemáticaconhecida, embora contendo um ou maisparâmetros desconhecidos.

Inferência Estatística

Em muitos casos, uma distribuição normal.

Page 13: Análise exploratória de dados no SPSS

Normalidade dos Dados

Assume-se que os dados foram obtidos de uma oumais populações normais.

Pesquisadores verificam suas amostras(histograma e outros testes) e se a amostraassemelha-se a uma normal, assume-se que a população também o é.

Page 14: Análise exploratória de dados no SPSS

Explorando Dados no SPSS

1. Distribuição dos Escores e Valores Atípicos(verificação da normalidade dos dados)

2. Corrigindo problemas nos dados

3. Transformando dados

Page 15: Análise exploratória de dados no SPSS

Explorando Dados Abra o arquivo “Agua2010_SNIS.sav”

Analisar> Estatísticas Descritivas > Explorar > Estatísticas… > Gráficos…

Page 16: Análise exploratória de dados no SPSS

Explorando Dados

Positivamente assimétricaLeptocúrtica

A Distribuição é Normal?

Converter assimetria e curtose emescores-z

Uma distribuição normal deverá terassimetria e curtose nulas. Será possível que a distribuição

da população assemelhe-se a uma normal?

Page 17: Análise exploratória de dados no SPSS

Explorando Dados

Positivamente assimétricaLeptocúrtica

A Distribuição é Normal?

zs=(1.532-0)/0.037=41.4

zk=(7.097-0)/0.074=95.9

Curtose e Assimetria

Significativa

Converter assimetria e curtose emescores-z

Uma distribuição normal deverá terassimetria e curtose nulas. Será possível que a distribuição

da população assemelhe-se a uma normal?

Page 18: Análise exploratória de dados no SPSS

Histograma - Outliers

Valores atípicos (outliers)Distorcem a média e

inflacionam o desvio padrão

Importante para a detecçãode erros, valores atípicos e

observação da forma da distribuição dos dados

Page 19: Análise exploratória de dados no SPSS

Diagrama de Caixas e Bigodes(boxplot)

Page 20: Análise exploratória de dados no SPSS

Explorando Dados – Box Plot

Boxplot

• Gráficos-> Caixas de Diálogo Legadas-> Boxplot

• Resumo de variáveis separadas -> Consumo de Água Percapita – População Total

Page 21: Análise exploratória de dados no SPSS

Explorando Dados – Box Plot

Boxplot

Page 22: Análise exploratória de dados no SPSS
Page 23: Análise exploratória de dados no SPSS

Outliers – Valores Discrepantes

Page 24: Análise exploratória de dados no SPSS

Explorando Dados – Q-Q Plot(quantil-quantil plot)

Valores Observados na Amostra

Valores esperadoscaso a variável

tenha umadistribuição

normal

Page 25: Análise exploratória de dados no SPSS

Explorando Dados por Regiões Gráficos> Histograma

Page 26: Análise exploratória de dados no SPSS

Histograma por Regiões

Page 27: Análise exploratória de dados no SPSS

Estatísticas por Regiões Analisar> Estatísticas Descritivas> Explorar

Page 28: Análise exploratória de dados no SPSS

z=.294/.168= 1.75

z=-.077/.334= 0.23

Z=1.339/.063=21.25

z=-5.378/.127=42.35

Z=1.225/.067=18.3

z=-6.499/.135=48.1

!!!

Page 29: Análise exploratória de dados no SPSS

z=2.671/.076=35.1

z=18.517/.153= 121

z=2.315/.126=18.4

z=14.757/.252= 58.6

No histograma parece simétrica, mas nas estatísticas não. Pq?

Page 30: Análise exploratória de dados no SPSS

Boxplot (Caixa e Bigodes)

Discrepantes!!!

Poucosoutliers

Page 31: Análise exploratória de dados no SPSS

Q-Q Plots

Page 32: Análise exploratória de dados no SPSS

CORRIGINDO PROBLEMAS NOS DADOS

Page 33: Análise exploratória de dados no SPSS

Observou algum erro de digitação que gostaria de corrigir?

Vá para o editor de dados, em “ir para o caso”

Edite o valor desejado

Page 34: Análise exploratória de dados no SPSS

Reduzindo o Impacto de Outliers

1. Remover o caso

Só deve ser feito se tiver uma boa razão para acreditar que esse valor não érepresentante da população.

2. Transformar os dados

Deverá ser feito no caso de termos uma distribuição não normal. Costumamreduzir o impacto de outliers.

3. Substituir o valor

O próximo escore mais alto adicionado de 1

Inverter o valor do escore-z (adicionar o triplo do desvio padrão à média e substituir o valor atípico por esse)

A média mais dois desvios padrão (variação do método acima)

Page 35: Análise exploratória de dados no SPSS

Transformação dos DadosPara corrigir problemas relacionados à não-normalidade da distribuição ou valores atípicos (outliers)

a. Transformação logaritmica (log(Xi))

Tomar o logaritmo de um conjunto de números “esmaga” a cauda direita da distribuição. É uma boa maneira de reduzir uma assimetria positiva.

Atenção: Não podemos obter logaritmo de zero ou valores negativos. Se tiverzero nos dados, faça log(Xi+1)

Page 36: Análise exploratória de dados no SPSS

Transformação dos DadosPara corrigir problemas relacionados à não-normalidade da distribuição ou valores atípicos (outliers)

b. Transformação por radiciação (sqr(Xi))

Tomar a raiz quadrada de valores grandes tem efeito maior do que extrair a raiz de efeitos pequenos. Útil para dados com assimetria positiva.

Problemas com números negativos.

Somar um valor aos elementos (X + a) para não ter mais números negativos.

c. Transformação recíproca (1/Xi)

Dividir 1 por cada escore reduz o impacto dos grandes valores. A variáveltransformada terá um limite inferior de zero (grandes valores ficarãopróximos de zero.

Atenção: Este tipo de transformação reverte os escores (valores grandes se tornarão pequenos e vice-versa)

Para desinverter, utilizar a fómula: 1/(Xmáximo – X)

Page 37: Análise exploratória de dados no SPSS

Transformando Dados no SPSS

Transformar > Calcular Variável

Page 38: Análise exploratória de dados no SPSS

Transformando Dados no SPSSCONSUMO LOG(CONSUMO + 1)

Page 39: Análise exploratória de dados no SPSS

Transformando Dados no SPSS

Transformar> Calcular variável

Page 40: Análise exploratória de dados no SPSS

Transformando Dados no SPSS

CONSUMO SQRT(CONSUMO)

Page 41: Análise exploratória de dados no SPSS

Transformando Dados no SPSS

Vocês podem usar o comando “Transformar > Calcular Variável” para realizar as mais diversas transformações nos dados!

Por exemplo: Normalizar os dados, calcular taxas e proporções, etc.

Page 42: Análise exploratória de dados no SPSS

PARTE II

Realizar análises exploratórias sobre os dados do trabalho do curso!!!

Para importar um arquivo .csv ou .dbf para o SPSS, vá em:

Arquivo> Abrir> Dados…

DICA: Vocês podem importar o arquivo .dbf que compõe o arquivo vetorial (shapefile)

Page 43: Análise exploratória de dados no SPSS

AtividadeA ser entregue em duas aulas daqui (Pode ser realizado em grupo)

Utilizando os dados que pretende usar no trabalho final da disciplina:

a. Calcule as estatísticas descritivas de uma variável de sua escolha. Explique cada uma delas.

b. Apresente o histograma, box-plot e Q-Q Plot. Explique.

c. Realize alguma(s) transformação(ões) em uma ou mais variáveisselecionadas (ex: log, raiz quadrada…). Explique.

d. Se houver grupos distintos (bairros, distritos), repita os itens (a) e (b) para cada grupo. Compare intervalos de confiança da médiade uma variável de interesse. Há sobreposições? O que issosignifica? Interprete!

CAPRICHE NAS ANÁLISES!!!

Já estamos elaborando o trabalho final da disciplina!!!