estatística aplicada · identificação de valores discrepantes (atípicos) o critério usado para...

12
www.acasadoconcurseiro.com.br Estatística Aplicada Gráficos e Análise Exploratória de Dados Professor Lucas Schmidt

Upload: others

Post on 21-Apr-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br

Estatística Aplicada

Gráficos e Análise Exploratória de Dados

Professor Lucas Schmidt

Page 2: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:
Page 3: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br 3

Estatística Aplicada

ANÁLISE EXPLORATÓRIA DE DADOS E GRÁFICOS

Tratamento e apresentação de dados

Incapacidade humana de sumarizar e resumir dados.

As análises serão diferenciadas recorrente da natureza dos dados, no que tange a:

• Estatísticas (medidas descritivas) • Gráficos • Tabelas

Banco de dados: dados coletados e organizados com maior detalhamento possível.

Tabela: dados sumarizados visando organizar e resumir um conjunto de observações. Forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central.

Gráficos: Forma ilustrada de apresentar dados estatísticos com a finalidade de proporcionar uma impressão mais rápida e de maior facilidade de compreensão do comportamento da variável.

Gráficos de Variáveis QuaLitativas:

Variáveis qualitativas (categóricas) serão descritas de acordo com suas frequências (absolutas ou relativas). Dessa forma, os gráficos adequados são:

• Gráfico de setores (pizza ou rosca); • Gráficos de barras e colunas (indicando frequências ou proporções); • Gráfico de linhas.

Page 4: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br4

Gráfico de setores

Gráfico de Pareto

Page 5: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

Estatística Aplicada – Gráficos e Análise Exploratória de Dados – Prof. Lucas Schmidt

www.acasadoconcurseiro.com.br 5

Gráfico de colunas

• Marcas esportivas preferidas

Gráfico de barras

• Intenção de compra

Page 6: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br6

Gráfico de linha

Gráficos de Variáveis QuanTitativas:

Variáveis quantitativas (numéricas) são descritas de acordo com as quantidades mensuradas considerando ou não as frequências. Dessa forma, os gráficos adequados são:

• Gráficos de barras e colunas (consumo de energia); • Gráficos de linha(s); • Histograma.

Page 7: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

Estatística Aplicada – Gráficos e Análise Exploratória de Dados – Prof. Lucas Schmidt

www.acasadoconcurseiro.com.br 7

Gráfico de linha

Histograma

61,4%

Page 8: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br8

Quartis (Qi) – Medidas separatrizes

São três medidas que dividem um conjunto de dados ordenado em quatro partes iguais.

Interpretação:

• Primeiro quartil (Q1): 25% dos valores estão abaixo dele e 75% acima. • Segundo quartil (Q2): 50% dos valores estão abaixo dele e 50% acima. • Terceiro quartil (Q3): 75% dos valores estão abaixo dele e 25% acima.

Quartis (Qi)

Para obter os quartis:

• Ordenar os dados. • Calcular a posição (p) de cada quartil. • Identificar o valor da posição.

Dois casos:

• Se p não for inteiro, o valor do quartil será a média dos valores mais próximos.

Page 9: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

Estatística Aplicada – Gráficos e Análise Exploratória de Dados – Prof. Lucas Schmidt

www.acasadoconcurseiro.com.br 9

Construção do Boxplot

Identificação de valores discrepantes (atípicos)

O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

Page 10: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br10

Exemplo

Faça o boxplot dos dados a seguir (já ordenados), que constituem o peso ao nascer (em kg) de 61 bovinos machos da raça Ibagé.

16, 17, 17, 18, 18, 18, 19, 20, 20, 20, 20, 20,21, 21, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23,23, 25, 25, 25, 25, 25, 25, 26, 26, 27, 27, 27,27, 28, 28, 28, 29, 29, 29, 30, 30, 30, 30, 30,

  30, 30, 31, 32, 33, 33, 33, 34, 34, 35, 36, 39, 45

Solução

  

Page 11: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas:

www.acasadoconcurseiro.com.br 11

Questões

1. O gráfico box-plot foi preparado para comparar todos os salários dos funcionários do sexo masculino (Grupo I) com todos os salários dos funcionários do sexo feminino (Grupo II) lotados em uma empresa.

Pela interpretação do gráfico, assinale a(s) alternativa(s) correta(s):

a) embora as medianas dos grupos sejam diferentes, os intervalos interquartílicos são iguais.b) o número de elementos do Grupo I é superior ao número de elementos do Grupo II.c) a distribuição dos salários do Grupo 1 é assimétrico positiva.d) metade dos elementos do Grupo II possui salário igual/inferior a R$ 9.000,00 e igual/supe-

rior a R$ 4.000,00.e) o valor do menor salário do Grupo II corresponde a 37,5% do valor da mediana do Grupo I.

Gabarito: 1. a) correta b) errada c)errada d) correta e) correta

Page 12: Estatística Aplicada · Identificação de valores discrepantes (atípicos) O critério usado para identificar valores discrepantes em um conjunto de dados é baseado em duas medidas: