estatÍstica descritiva

29
Aula 07 – Estatística Descritiva ESTATÍSTICA DESCRITIVA 2

Upload: others

Post on 18-Nov-2021

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

ESTATÍSTICA DESCRITIVA

2

Page 2: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Estatística Descritiva

O que fazer com as observações que coletamos?

Resumo dos dados: organizar, descrever e resumir os dados coletados ⇒ Estatística descritiva

Primeira etapa da análise:

5

Page 3: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

QUALITATIVA

QUANTITATIVA

NOMINAL

ORDINAL

CONTÍNUA

DISCRETA

tempo, distância, salário

número de clientes, número de caminhões

origem de um pedido (capital ou interior)

porte de uma empresa (pequena, média, grande)

Variável: Qualquer característica associada a uma população.

Classificação das variáveis

Page 4: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação

MEDIDAS DE DISPERSÃO:

Mínimo, Máximo, Moda, Média, Média Aparada, Mediana, Percentis

MEDIDAS DE POSIÇÃO:

Variáveis Quantitativas

Page 5: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

• Mínimo (min): o menor valor observado • Máximo (max): o maior valor observado• Moda (mo): é o valor (ou atributo) que ocorre com maior frequência,

Medidas de Posição

Page 6: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

n

x

nxxxxx

n

ii

n∑==

++++= 1321 ...

• Média

Medidas de Posição

• Mediana

A mediana é o valor da variável que ocupa a posiçãocentral de um conjunto de n dados ordenados,

Page 7: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

O percentil de ordem p ×100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável tal que p ×100 das observações do conjunto dos ndados ordenados são inferiores ou iguais a ele.

• Percentil p

percentil 50 = mediana ou segundo quartil (Md)percentil 25 = primeiro quartil (Q1)percentil 75 = terceiro quartil (Q3)

Casos particulares

Medidas de Posição

Page 8: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Finalidade: encontrar um valor que resuma avariabilidade de um conjunto de dados

• Amplitude (A)

A = máx - min

Medidas de Dispersão

• Intervalo-Interquartil É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1.

Page 9: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

∑= −

−=

−−++−

==n

i

in

nxx

nxxxxsVariância

1

22212

1)(

1)(...)(

VariânciasPadrãoDesvio ==

• Variância

• Desvio padrão

Medidas de Dispersão

Page 10: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

- é uma medida de dispersão relativa- elimina o efeito da magnitude dos dados- exprime a variabilidade em relação à média

%100×=xsCV

• Coeficiente de Variação (CV)

Medidas de Dispersão

Page 11: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Idade 27,47 anos 1,88 anos 6,8%Renda 3763,7 reais 594,7reais 15,8%

Média DesvioPadrão

Coef, de Variação

Conclusão: Os indivíduos são, aproximadamente, duas vezes mais dispersos quanto à renda do que quanto à idade

Idade e renda de indivíduosExemplo 1 :

Medidas de Dispersão

Page 12: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Conclusão: Em relação às médias, os atrasos de ambas as companhias apresentam variabilidade quase iguais.

Desviopadrão

Coef. devariaçãoMédia

Cia. A 50 6 12%Cia. B 160 16 10%

Número de atrasos de vôos de uma amostra da Cia. A e de uma amostra de Cia. B

Exemplo 2:

Medidas de Dispersão

Page 13: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Representa os dados através de umretângulo construído com os quartis efornece informações sobre os valoresextremos.

Gráfico Boxplot

GRÁFICOS

Page 14: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

“Máximo”

Q3Mediana

Q1

“Mínimo”

25%

50%75%

LS = Q3+1,5(Q3-Q1)

LI = Q1-1,5(Q3-Q1)

“Máximo” é o maior valor menor que LS; “Mínimo” é o menor valor maior que LI.

Boxplot

Page 15: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

md = 41,5 Q1 = 30,25 Q3 = 49,5

*

*

120

100

80

60

40

20

Dados ordenados (n=36)

18 21 21 23 23 25

27 29 30 31 32 32

32 34 35 36 38 41

42 42 43 44 45 46

46 47 48 50 54 56

57 58 60 61 98 116

LI = Q1 - 1,5(Q3 - Q1) =1,38

LS = Q3 + 1,5(Q3 - Q1) =78,38

Observações discrepantes

Vida útil de máquinas (dias)Exemplo 3:

Boxplot

Page 16: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Os dados também podem ser resumidos construindo-se uma tabela de distribuição de frequências .

Distribuição de frequências de uma variávelé uma lista dos valores individuais ou deintervalos de valores que a variável podeassumir, com as respectivas frequências deocorrência.

Page 17: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Dados do Tempo de duração de 187 viagens (em horas)

Tempo Frequência (ni) Tempo Frequência (ni)0 55 30 2

2 1 35 2

4 1 40 1

5 59 44 1

6 2 50 1

7 3 57 1

8 2 60 1

9 1 70 2

10 28 75 2

13 2 95 1

15 10 660 1

20 6 1245 1

28 1

N = 187

Exemplo 4: Distribuição de frequências

Page 18: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Com a simples tabulação dos dados detectou-se:

• em 55 viagens encontra-se registrado o tempo zero, que é um valor claramente impossível;

• percebe-se a existência de um número excessivo de viagens com tempo de duração múltiplo de 5: 5, 10, 15 horas, etc. Existe uma tendência observada na população em geral em arredondar valores numéricos para múltiplos de 5;

• dois valores apresentam-se muito superiores aos demais (660 e 1245).

Exemplo 4 (continuação):

Distribuição de frequências

Page 19: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Medidas descritivas para a variável Tempo de duração de viagens

Medida Descritiva Amostra Completa Excluindo o valor 1245

Excluindo os valores 1245 e 660

Média 27,5 18,2 13,3

Mediana 7,5 7,0 7,0

Desvio-padrão 121,8 58,8 16,4

Q1 5,0 5,0 5,0

Q3 14,5 13,0 13,0

n 132 131 130

Exemplo 4 (cont.): Retirando os “zero’s”

Distribuição de frequências

Page 20: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Variável: distância contínua Construir intervalos de classeClasses de distâncias ni fri

0,0 |- 10,010,0 |- 20,020,0 |- 30,030,0 |- 40,040,0 |- 50,050,0 |- 60,060,0 |- 70,070,0 |- 80,080,0 |- 90,090,0 |- 100,0

Total

6940

74221401

130

0,5310,3080,0540,0310,0150,0150,0080,0310,0000,0081,000

Distribuição de frequências para a variável Tempo de duração de viagens

Exemplo 4 (cont.): Retirando o “zero”

Distribuição de frequências

Page 21: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

• Bases iguais ou diferentes• Construir um retângulo para cada classe, com baseigual ao tamanho da classe e área do retângulo iguala frequência relativa da classe (fr).• A altura será dada porh = fr/tamanho da base (densidade de frequência).

Dados agrupados em intervalos de classes (distribuição de frequências)

Gráfico histograma

Page 22: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Classes (meses) ni fri hi

0 |- 3 140 0,28 0,093

3 |- 12 100 0,20 0,022

12 |-24 80 0,16 0,013

24 |-60 180 0,36 0,010

Total 500 1,000 3 12 24 60

h0,10

0,02

0,04

0,06

0,08

Exemplo 5: Vida útil de lâmpadas

Histograma

Page 23: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Exemplo 6: Tempo de duração de viagens

Histograma

Page 24: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Sobre um eixo, são representados retângulos, um para cada categoria da variável.

A altura do retângulo é proporcional à frequência da categoria.

⇒Adequado para variáveis qualitativas

Gráfico de Barras

Page 25: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Exemplo 7:

3210

60

50

40

30

20

10

0

Activity

Coun

t of A

ctiv

ity

Variável Activity : atividade de armazéns (nenhuma – 0; leve – 1; moderada – 2; intensa –3)

Gráfico de barras

⇒ Variável qualitativa ordinal

Page 26: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Porcentagem acumulada

Exemplo 8: Considere a variável “Número de funcionários” de empresas pequenas de logística.

Um levantamento de 20 empresas forneceu os seguintes dados (já ordenados):5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 15, 20, 20, 20, 25.

Page 27: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Dados: 5, 5, 5, 5, 10, 10, 10, 10, 10, 15, 15, 15, 15, 15, 15, 15, 20, 20, 20, 25

Porcentagem acumulada

Distribuição de  frequências do no. de funcion.No.de filhos ni fi fi(%) Ni Fi Fi (%)

5 4 0,20 20 4 0,20 2010 5 0,25 25 9 0,45 4515 7 0,35 35 .16 0,80 8020 3 0,15 15 19 0,95 9525 1 0,05 5 20 1,00 100Total n=20 1,00 100,0

Considerando os distintos valores da variável ordenados, temosNi: frequencia absoluta acumulada no valor xi da variável;Fi: frequencia relativa acumulada no valor xi;Fi (%) : frequencia relativa acumulada no valor xi, em %

Exemplo 8 (cont):

Page 28: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Porcentagem acumulada

Distribuição de  frequências do número de funcionáriosno.de func. ni fi fi(%) Ni Fi Fi (%)

5 4 0,20 20 4 0,20 2010 5 0,25 25 9 0,45 4515 7 0,35 35 16 0,80 8020 3 0,15 15 19 0,95 9525 1 0,05 5 20 1,00 100Total n=20 1,00 100,0

• 25 % das empresas tem 10 funcion.; (5 empresas das 20)• 45 % tem até 10 funcion.; (que são 9 das 20 empresas)• 7 empresas tem 15 funcion;• 19 empresas tem até 20 funcion. (ou 95% dos empresas tem 20 funcion. ou menos); etc...

Exemplo 8 (cont.): Interpretação

Page 29: ESTATÍSTICA DESCRITIVA

Aula 07 – Estatística Descritiva

Forma da Distribuição