estatística aplicada · identificação de valores discrepantes (atípicos) o critério usado para...
TRANSCRIPT
www.acasadoconcurseiro.com.br
Estatística Aplicada
Gráficos e Análise Exploratória de Dados
Professor Lucas Schmidt
www.acasadoconcurseiro.com.br 3
Estatística Aplicada
ANÁLISE EXPLORATÓRIA DE DADOS E GRÁFICOS
Tratamento e apresentação de dados
Incapacidade humana de sumarizar e resumir dados.
As análises serão diferenciadas recorrente da natureza dos dados, no que tange a:
• Estatísticas (medidas descritivas) • Gráficos • Tabelas
Banco de dados: dados coletados e organizados com maior detalhamento possível.
Tabela: dados sumarizados visando organizar e resumir um conjunto de observações. Forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central.
Gráficos: Forma ilustrada de apresentar dados estatísticos com a finalidade de proporcionar uma impressão mais rápida e de maior facilidade de compreensão do comportamento da variável.
Gráficos de Variáveis QuaLitativas:
Variáveis qualitativas (categóricas) serão descritas de acordo com suas frequências (absolutas ou relativas). Dessa forma, os gráficos adequados são:
• Gráfico de setores (pizza ou rosca); • Gráficos de barras e colunas (indicando frequências ou proporções); • Gráfico de linhas.
www.acasadoconcurseiro.com.br4
Gráfico de setores
Gráfico de Pareto
Estatística Aplicada – Gráficos e Análise Exploratória de Dados – Prof. Lucas Schmidt
www.acasadoconcurseiro.com.br 5
Gráfico de colunas
• Marcas esportivas preferidas
Gráfico de barras
• Intenção de compra
www.acasadoconcurseiro.com.br6
Gráfico de linha
Gráficos de Variáveis QuanTitativas:
Variáveis quantitativas (numéricas) são descritas de acordo com as quantidades mensuradas considerando ou não as frequências. Dessa forma, os gráficos adequados são:
• Gráficos de barras e colunas (consumo de energia); • Gráficos de linha(s); • Histograma.
Estatística Aplicada – Gráficos e Análise Exploratória de Dados – Prof. Lucas Schmidt
www.acasadoconcurseiro.com.br 7
Gráfico de linha
Histograma
61,4%
www.acasadoconcurseiro.com.br8
Quartis (Qi) – Medidas separatrizes
São três medidas que dividem um conjunto de dados ordenado em quatro partes iguais.
Interpretação:
• Primeiro quartil (Q1): 25% dos valores estão abaixo dele e 75% acima. • Segundo quartil (Q2): 50% dos valores estão abaixo dele e 50% acima. • Terceiro quartil (Q3): 75% dos valores estão abaixo dele e 25% acima.
Quartis (Qi)
Para obter os quartis:
• Ordenar os dados. • Calcular a posição (p) de cada quartil. • Identificar o valor da posição.
Dois casos:
• Se p não for inteiro, o valor do quartil será a média dos valores mais próximos.
Estatística Aplicada – Gráficos e Análise Exploratória de Dados – Prof. Lucas Schmidt
www.acasadoconcurseiro.com.br 9
Construção do Boxplot
Identificação de valores discrepantes (atípicos)
O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:
www.acasadoconcurseiro.com.br10
Exemplo
Faça o boxplot dos dados a seguir (já ordenados), que constituem o peso ao nascer (em kg) de 61 bovinos machos da raça Ibagé.
16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20,21, 21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23,23, 25, 25, 25, 25, 25, 25, 26, 26, 27, 27, 27,27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30,
30, 30, 31, 32, 33, 33, 33, 34, 34, 35, 36, 39, 45
Solução
www.acasadoconcurseiro.com.br 11
Questões
1. O gráfico box-plot foi preparado para comparar todos os salários dos funcionários do sexo masculino (Grupo I) com todos os salários dos funcionários do sexo feminino (Grupo II) lotados em uma empresa.
Pela interpretação do gráfico, assinale a(s) alternativa(s) correta(s):
a) embora as medianas dos grupos sejam diferentes, os intervalos interquartílicos são iguais.b) o número de elementos do Grupo I é superior ao número de elementos do Grupo II.c) a distribuição dos salários do Grupo 1 é assimétrico positiva.d) metade dos elementos do Grupo II possui salário igual/inferior a R$ 9.000,00 e igual/supe-
rior a R$ 4.000,00.e) o valor do menor salário do Grupo II corresponde a 37,5% do valor da mediana do Grupo I.
Gabarito: 1. a) correta b) errada c)errada d) correta e) correta