passos para construção de um histograma · objetivos do trabalho. • k = número de classes; •...

71
Representação de dados

Upload: lykhanh

Post on 03-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Representação de dados

Page 2: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Passos para construção de um Histograma

• Passo 1: ordenar o conjunto de dados, ou seja colocar os dados em ordem crescente de grandeza;

• Passo 2: Determinar o número de classes da tabela. De modo geral não deverá ser inferior a 5 e nem superior a 15, orientada para os objetivos do trabalho.

• k = número de classes; • n = número de observações; • log = logaritmo de base 10.

Page 3: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Passos para construção de um Histograma

• Passo 3: determinar a amplitude do intervalo i: Es – Ei = extremo superior – extremo inferior Arredondar o número de classes (k) ou da

amplitude do intervalo (i) sempre para cima.

Page 4: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Passos para construção de um Histograma

• Passo 4: Construir os intervalos de classe. O limite inferior de primeira classe será sempre o menor valor do conjunto de dados (Ei) e o limite superior será o limite inferior acrescido do valor da amplitude do intervalo de classe (i). Na sequência, o limite inferior da segunda classe será o limite superior da primeira classe e o limite superior da segunda classe será este acrescido da amplitude do intervalo. E assim sucessivamente.

Obs: os intervalos são inclusivos à esquerda.

Page 5: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Passos para construção de um Histograma

Obs: os intervalos são inclusivos à esquerda.

Page 6: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Histograma de uma distribuição Normal contínua

0

20

40

60

80

100

120

Classes de valores

Freq

uênc

ia d

e va

lore

s nas

cla

sses

Page 7: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Histograma de uma distribuição Normal contínua com suavização de linhas

Page 8: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Histograma de uma distribuição Normal

Podemos verificar que, para uma distribuição normal:

• 1 s para cima e para baixo corresponde aproximadamente a 68% das amostras.

• E 2s para cima e para baixo a aproximadamente 95% das amostras.

Page 9: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Histograma de múltiplas distribuições

Page 10: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Tipos de variáveis

Até agora tratamos de distribuições de probabilidade de variáveis contínuas. Caso de uma medição, onde a variável pode assumir infinitos valores. Podemos ter outros tipos de variáveis, tais como categóricas e variáveis numéricas discretas.

Page 11: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Variáveis categóricas

Para melhor entender o que é uma variável categórica, nada melhor que um exemplo:

Suponhamos que desejamos ter uma avaliação da disciplina de Metrologia, para isto estabelecemos 4 conceitos; ruim, médio, bom e ótimo.

Uma vez estabelecidos os conceitos vamos fazer a pesquisa entre 60 alunos: 12 responderam ruim; 27 médio; 15 bom e 6 ótimo.

Page 12: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Variáveis categóricas Classe Freq da classe Freq Acum Prop classe Prop Acum

Ruim 12 12 0,2 0,2

Médio 27 39 0,45 0,65

Bom 15 54 0,25 0,9

Ótimo 6 60 0,1 1

Total 60 1

0

5

10

15

20

25

30

Ruim Médio Bom Ótimo

Page 13: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Variáveis numéricas discretas

Para melhor entender o que é uma variável numérica discreta:

Consideremos agora que a variável em estudo seja o número de animais portadores de brucelose em 350 propriedades rurais.

Page 14: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Variáveis numéricas discretas

Temos os seguintes dados: Número de animais com brucelose por propriedade

j Classe Freq da classe Freq Acum Perc da Classe

Perc Acumulado

1 0 55 55 0,157142857 0,157142857

2 1 60 115 0,171428571 0,328571429

3 2 112 227 0,32 0,648571429

4 3 82 309 0,234285714 0,882857143

5 4 31 340 0,088571429 0,971428571

6 5 8 348 0,022857143 0,994285714

7 6 2 350 0,005714286 1

350 1

Page 15: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Variáveis numéricas discretas Número de animais com brucelose por propriedade

j Classe Freq da classe Freq Acum Perc da Classe Perc Acumulado

1 0 55 55 0,157142857 0,157142857

2 1 60 115 0,171428571 0,328571429

3 2 112 227 0,32 0,648571429

4 3 82 309 0,234285714 0,882857143

5 4 31 340 0,088571429 0,971428571

6 5 8 348 0,022857143 0,994285714

7 6 2 350 0,005714286 1

350 1

0

20

40

60

80

100

120

0 1 2 3 4 5 6

Número de animais com brucelose por propriedade

0

0,2

0,4

0,6

0,8

1

1,2

0 1 2 3 4 5 6

Frequência Acumulada de animais infectados por proprieda

Page 16: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas descritivas

As medidas descritivas têm o objetivo de reduzir um conjunto de dados observados (numéricos) a um pequeno grupo de valores que deve fornecer toda a informação relevante a respeito desses dados. Estas medidas são funções dos valores observados e podem ser classificadas em quatro grupos:

Page 17: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas descritivas - Medidas de localização, também denominadas medidas de tendência central ou medidas de posição: indicam um ponto central onde, em muitas situações importantes, está localizada a maioria das observações; - Medidas separatrizes: indicam limites para proporções de observações em um conjunto, podendo ser utilizadas para construir medidas de dispersão;

Page 18: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas descritivas - Medidas de variação também denominadas medidas de dispersão: informam sobre a variabilidade dos dados; - Medidas de formato: informam sobre o modo como os valores se distribuem. Compreendem as medidas de assimetria, que indicam que a maior proporção de valores está no centro ou nas extremidades, e as medidas de curtose, que descrevem grau de achatamento da distribuição.

Page 19: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de localização Medidas de localização: Já falamos sobre a média Devemos ter cuidado com a média, principalmente quando temos valores extremos ou outliers Em estatística, outlier, valor atípico, valor aberrante, é uma observação que apresenta um grande afastamento das demais da série (que esta "fora" dela), ou que é inconsistente.

𝑥𝑥 =∑ 𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖=1𝑛𝑛

Page 20: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de localização Moda: a moda corresponde ao dado que tem maior frequência, ou seja, que mais ocorre. Se existirem dois valores com igual número de ocorrência, diz-se que a distribuição é bimodal, para mais de dois valores, tem-se uma distribuição multimodal.

Page 21: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de localização

Mediana: é o ponto que divide a amostra em duas metades. Por exemplo, tendo-se um conjunto de observações, tal qual: 10, 50, 25, 60 e 45, a mediana é igual a 45, depois de rearranjar em ordem crescente os dados. O número 45 divide ao meio a amostra.

Page 22: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de localização

𝑥𝑥 =∑ 𝑥𝑥𝑖𝑖𝑛𝑛𝑖𝑖=1𝑛𝑛

Page 23: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de localização

Page 24: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de localização

Page 25: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas separatrizes

As medidas separatrizes delimitam proporções de observações de uma variável ordinal. Como a mediana divide o conjunto em duas metades, é razoável pensar numa medida separatriz que efetue uma divisão adicional: dividir cada metade em duas metades. Essas medidas separatrizes são denominadas quartis.

Page 26: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas separatrizes

De modo semelhante, é possível encontrar valores que delimitem porções expressas em percentagem de dados em um conjunto ordenado. Esses valores são denominados percentis. Entretanto, de todas essas medidas separatrizes, teremos interesse particular na mediana, e nos quartis.

Page 27: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Quartis

Os quartis dividem um conjunto de dados ordenado em quatro partes iguais. São elas: -Primeiro quartil Q1: 25% dos valores ficam abaixo e 75% ficam acima desta medida. - Segundo quartil Q2: 50% dos valores ficam abaixo e 50% ficam acima desta medida, corresponde à mediana (Q2=Md). - Terceiro quartil Q3: 75% dos valores ficam abaixo e 25% ficam acima desta medida.

Page 28: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Quartis

Observa-se facilmente que o primeiro quartil é o percentil 0,25, a mediana é o percentil 0,5 e o terceiro quartil é o percentil 0,75.

Page 29: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Quartis Para determinar os quartis: 1º caso: quanto n é impar

Page 30: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exemplo Quartil n impar

10

Page 31: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Quartis no Minitab O Minitab calcula os valores dos quartis de forma um pouco diferente, dependendo da situação isto pode levar a resultados distintos.

Page 32: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Quartis no Minitab

Page 33: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Quartis no Minitab

Para obtermos os quartis acima como o Minitab calcula, usamos a fórmula 𝑄𝑄𝑖𝑖 = 𝑖𝑖4

(𝑁𝑁 +1). 𝑄𝑄1 = 1

410 + 1 = 2,75, o valor 2,75 está entre 9 e 16, pega-se a parte fracionária do

2,75 (0,75) e multiplica-se pelo intervalo entre 9 e 16 (7), e soma-se ao 9, assim, (16-9)=7x0,75=5,25+9=14,25. Da mesma forma obtemos 𝑄𝑄2 𝑒𝑒 𝑄𝑄3. 𝑄𝑄2 = 2

410 + 1 = 5,5 o valor 5,5 está entre 39 e 45; (45-39)=6x0,5=3+39=42.

𝑄𝑄3 = 34

10 + 1 = 8,25 o valor 8,25 está entre 46 e 48; (48-46)=2x0,25=0,5+46=46,5. A amplitude interquatílica é dada pela diferença (46,50-14,25)=32,25.

Page 34: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de variação ou dispersão

As medidas de variação ou dispersão complementam as medidas de localização ou tendência central, indicando quanto as observações diferem entre si ou o grau de afastamento das observações em relação à média.

Page 35: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de variação ou dispersão

As medidas de variação mais utilizadas são: a amplitude total, a variância, o desvio padrão e o coeficiente de variação. Desvio padrão: Coeficiente de variação: Amplitude total:

𝜎𝜎𝑥𝑥 = �∑ (𝑥𝑥𝑖𝑖 − 𝑥𝑥)2𝑛𝑛𝑖𝑖=1𝑛𝑛 − 1

𝐶𝐶𝐶𝐶 = (𝑆𝑆 𝑥𝑥⁄ ). 100

𝑎𝑎𝑡𝑡 = 𝐸𝐸𝑆𝑆 − 𝐸𝐸𝐼𝐼

𝐸𝐸𝑆𝑆 = 𝑒𝑒𝑥𝑥𝑡𝑡𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑠𝑠𝑠𝑠𝑠𝑠𝑒𝑒𝑒𝑒𝑖𝑖𝑒𝑒𝑒𝑒 𝑑𝑑𝑒𝑒 𝑐𝑐𝑒𝑒𝑛𝑛𝑐𝑐𝑠𝑠𝑛𝑛𝑡𝑡𝑒𝑒 𝑑𝑑𝑒𝑒 𝑑𝑑𝑎𝑎𝑑𝑑𝑒𝑒𝑠𝑠 𝑒𝑒𝑒𝑒𝑑𝑑𝑒𝑒𝑛𝑛𝑎𝑎𝑑𝑑𝑒𝑒; 𝐸𝐸𝐼𝐼 = 𝑒𝑒𝑥𝑥𝑡𝑡𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑖𝑖𝑛𝑛𝑖𝑖𝑒𝑒𝑒𝑒𝑖𝑖𝑒𝑒𝑒𝑒 𝑑𝑑𝑒𝑒 𝑐𝑐𝑒𝑒𝑛𝑛𝑐𝑐𝑠𝑠𝑛𝑛𝑡𝑡𝑒𝑒 𝑑𝑑𝑒𝑒 𝑑𝑑𝑎𝑎𝑑𝑑𝑒𝑒𝑠𝑠 𝑒𝑒𝑒𝑒𝑑𝑑𝑒𝑒𝑛𝑛𝑎𝑎𝑑𝑑𝑒𝑒;

Page 36: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de formato

As medidas de formato são um aspecto importante de uma distribuição. Embora mudanças em uma medida de variação também provoquem alterações no aspecto visual, o formato de uma distribuição se relaciona com as ideias de simetria e curtose.

Page 37: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Medidas de formato

Momentos denotados por mr, são medidas calculadas com o propósito de estudar a distribuição. O momento de ordem r centrado num valor a é dado por : Quando , temos os momentos de ordem r centrados na média e apresentados por . Assim temos

𝑒𝑒𝑒𝑒 =∑(𝑥𝑥𝑖𝑖 − 𝑎𝑎)𝑒𝑒

𝑛𝑛

𝑎𝑎 = �̅�𝑥

𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 =∑(𝑥𝑥𝑖𝑖 − �̅�𝑥)𝑒𝑒

𝑛𝑛

𝑠𝑠𝑎𝑎𝑒𝑒𝑎𝑎 𝑒𝑒 = 1, 𝑡𝑡𝑒𝑒𝑒𝑒𝑒𝑒𝑠𝑠: 𝑒𝑒1 =∑(𝑥𝑥𝑖𝑖 − �̅�𝑥)

𝑛𝑛 𝑠𝑠𝑎𝑎𝑒𝑒𝑎𝑎 𝑒𝑒 = 2, 𝑡𝑡𝑒𝑒𝑒𝑒𝑒𝑒𝑠𝑠: 𝑒𝑒2 =

∑(𝑥𝑥𝑖𝑖 − �̅�𝑥)2

𝑛𝑛

𝑠𝑠𝑎𝑎𝑒𝑒𝑎𝑎 𝑒𝑒 = 3, 𝑡𝑡𝑒𝑒𝑒𝑒𝑒𝑒𝑠𝑠: 𝑒𝑒3 =∑(𝑥𝑥𝑖𝑖 − �̅�𝑥)3

𝑛𝑛 𝑠𝑠𝑎𝑎𝑒𝑒𝑎𝑎 𝑒𝑒 = 4, 𝑡𝑡𝑒𝑒𝑒𝑒𝑒𝑒𝑠𝑠: 𝑒𝑒4 =

∑(𝑥𝑥𝑖𝑖 − �̅�𝑥)4

𝑛𝑛

Page 38: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de assimetria

Entre as várias medidas de assimetria que devem informar se a maioria dos valores se localiza à esquerda, ou à direita, ou se estão uniformemente distribuídos em torno da média aritmética, temos o coeficiente de assimetria, denotado por .

𝑎𝑎3

𝑎𝑎3 =𝑒𝑒3

𝑒𝑒2√𝑒𝑒2

Page 39: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de assimetria

- Se , a distribuição é classificada como assimétrica negativa, indicando que a maioria dos valores são maiores ou se localizam à direita da média aritmética. - Se , a distribuição é classificada como simétrica, indicando que a maioria dos valores estão uniformemente distribuídos em torno da média aritmética.

𝑎𝑎3 < 0

𝑎𝑎3 = 0

Page 40: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de assimetria

Se , a distribuição é classificada como assimétrica positiva, indicando que a maioria dos valores são menores ou se localizam à esquerda da média aritmética.

𝑎𝑎3 > 0

Page 41: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de assimetria

Page 42: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de curtose

As medidas de curtose indicam o grau de achatamento de uma distribuição. O coeficiente de curtose, denotado por , é calculado a partir de:

𝑎𝑎4

𝑎𝑎4 =𝑒𝑒4

𝑒𝑒22

Page 43: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de curtose

- Se , a distribuição é classificada como platicúrtica, indicando que ocorre baixa concentração de valores no centro, tornando a distribuição mais achatada que a distribuição normal. - Se , a distribuição é classificada como mesocúrtica, indicando que a concentração das observações ocorre de forma semelhante à distribuição normal.

𝑎𝑎4 < 3

𝑎𝑎4 = 3

Page 44: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de curtose

- Se , a distribuição é classificada como leptocúrtica, indicando que ocorre alta concentração de valores no centro, o que provoca um pico maior que o da distribuição normal.

𝑎𝑎4 > 3

Page 45: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Coeficiente de curtose

Page 46: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Resumo de cinco números

O resumo de cinco números descreve o conjunto de dados através de cinco valores: a mediana (Md), os quartis, primeiro (Q1) e terceiro (Q3), e os extremos, inferior (Ei) e superior (Es). A partir desses valores, podemos calcular: a amplitude interquartílica (aq), obtida pela diferença entre os quartis;

Page 47: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Resumo de cinco números

a dispersão inferior (Di), obtida pela diferença entre a mediana e o extremo inferior; e a dispersão superior (Ds), diferença entre o extremo superior e a mediana. 𝑎𝑎𝑞𝑞 = 𝑄𝑄3 −𝑄𝑄1 𝐷𝐷𝐼𝐼 = 𝑀𝑀𝑑𝑑 − 𝐸𝐸𝐼𝐼 𝐷𝐷𝑆𝑆 = 𝐸𝐸𝑠𝑠 − 𝑀𝑀𝑑𝑑

Page 48: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Resumo de cinco números

Para uma distribuição ser considerada simétrica temos que ter as duas condições:

𝑎𝑎𝑞𝑞 = 𝑄𝑄3 −𝑄𝑄1 𝐷𝐷𝐼𝐼 = 𝑀𝑀𝑑𝑑 − 𝐸𝐸𝐼𝐼 𝐷𝐷𝑆𝑆 = 𝐸𝐸𝑠𝑠 − 𝑀𝑀𝑑𝑑

(𝑄𝑄1 − 𝐸𝐸𝐼𝐼 ≅ 𝐸𝐸𝑆𝑆 − 𝑄𝑄3)

(𝑀𝑀𝑑𝑑 − 𝑄𝑄1 ≅ 𝑄𝑄3 −𝑀𝑀𝑑𝑑 )

Page 49: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Resumo de cinco números

Se uma dessas duas condições não for atendida, então, a distribuição será assimétrica. (𝑄𝑄1 − 𝐸𝐸𝐼𝐼 ≅ 𝐸𝐸𝑆𝑆 − 𝑄𝑄3) (𝑀𝑀𝑑𝑑 − 𝑄𝑄1 ≅ 𝑄𝑄3 −𝑀𝑀𝑑𝑑 )

Page 50: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Identificação de valores discrepantes

Um critério objetivo para identificação de valores discrepantes num conjunto de dados utiliza medidas denominadas cerca inferior (Ci) e cerca superior (Cs). Calcula-se pelas seguintes fórmulas: São considerados discrepantes os valores que estiverem fora do seguinte intervalo:

𝐶𝐶𝐼𝐼 = 𝑄𝑄1 − 1,5𝑎𝑎𝑞𝑞 𝑒𝑒 𝐶𝐶𝑆𝑆 = 𝑄𝑄3 + 1,5𝑎𝑎𝑞𝑞

�𝑄𝑄1 − 1,5𝑎𝑎𝑞𝑞 ;𝑄𝑄3 + 1,5𝑎𝑎𝑞𝑞�

Page 51: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Identificação de valores discrepantes

Os valores menores que a cerca inferior são denominados discrepantes inferiores e os valores maiores que a cerca superior são denominados discrepantes superiores.

𝐶𝐶𝐼𝐼 = 𝑄𝑄1 − 1,5𝑎𝑎𝑞𝑞 𝑒𝑒 𝐶𝐶𝑆𝑆 = 𝑄𝑄3 + 1,5𝑎𝑎𝑞𝑞

�𝑄𝑄1 − 1,5𝑎𝑎𝑞𝑞 ;𝑄𝑄3 + 1,5𝑎𝑎𝑞𝑞�

Page 52: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot)

A informação dada pelo resumo de cinco números pode ser apresentada em forma de um gráfico em caixa, que agrega uma série de informações a respeito da distribuição, tais como localização, dispersão, assimetria, caudas e dados discrepantes.

Page 53: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot)

Antes de construir o gráfico precisamos definir o que são valores adjacentes. São adjacentes o menor e o maior valores não discrepantes de um conjunto de dados, ou seja, o maior valor que não ultrapassa a cerca superior e o menor valor que não ultrapassa a cerca inferior. Se num conjunto de dados nenhum valor é considerado discrepante, os valores adjacentes são os próprios extremos.

Page 54: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) Para construir o box plot, consideramos um retângulo onde estarão representados os quartis e a mediana.

Page 55: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) A partir do retângulo, para cima e para baixo, seguem linhas, denominadas bigodes, que vão até os valores adjacentes. Os valores discrepantes recebem uma representação individual através de uma letra ou símbolo.

Page 56: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot)

A posição central dos valores é dada pela mediana e a dispersão pela amplitude interquartílica (aq). As posições relativas da mediana e dos quartis e o formato dos bigodes dão uma noção da simetria e do tamanho das caudas da distribuição.

Page 57: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot)

Vale lembrar que quando encontramos um valor discrepante num conjunto de dados, a sua origem deve ser investigada. Muitas vezes, os valores discrepantes, de fato, fazem parte do conjunto de dados, reforçando a característica assimétrica da distribuição.

Page 58: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot)

Mas, eventualmente, estes valores podem ser oriundos de erros na aferição ou no registro dos dados. Em geral, distribuições com caudas longas (indicadas por bigodes longos no gráfico), característica comum de distribuições assimétricas, apresentam uma tendência maior de produzir valores discrepantes. Bigodes de diferentes tamanhos indicam distribuições assimétricas.

Page 59: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot)

Page 60: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) - Outliers

Inst Inox OEGase OEProl Latex OEProl Silicone OECateter OE

500

400

300

200

100

0

PPM

de

OE

Boxplot comparação de diversos materiais quanto a resíduos de OE - Com Outliers

Page 61: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) - Outliers Gráfico com as médias considerando todos os pontos

Page 62: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) - Outliers

Inst Inox OEGase OEProl Latex OEProl Silicone OECateter OE

50

40

30

20

10

0

PPM

de

OE

Boxplot comparação de diversos materiais quanto a resíduos de OE - Sem Outliers

Page 63: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) - Outliers

Page 64: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) - Outliers Análise dos dados com os outliers

Page 65: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Gráfico em caixa (box plot) - Outliers Análise dos dados sem os outliers

Page 66: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exercício Utilize o software Minitab para as análises.

Page 67: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exercício Utilize o software Minitab para as análises.

Page 68: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exercício Utilize o software Minitab para as análises.

Page 69: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exercício Utilize o software Minitab para as análises.

Page 70: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exercício Utilize o software Minitab para as análises.

Page 71: Passos para construção de um Histograma · objetivos do trabalho. • k = número de classes; • n = número de observações; • log = logaritmo de base 10. Passos para construção

Exercício Utilize o software Minitab para as análises.