medidas descritivas medidas de dispersão para amostras a amplitude (r) a amplitude é a diferença...

21
Medidas descritivas Medidas de dispersão para amostras A amplitude ( R ) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados. Ex. dois alunos fizeram, cada um, quatro provas e obtiveram as notas apresentadas na tabela abaixo. É fácil ver que as notas obtidas pelo primeiro aluno são mais próximas entre si do que as notas obtidas pelo segundo aluno. 06/24/22 11:25 Prof. Alexandre José de Oliveira 1 Aluno Notas Pedro Paulo 4 9 6 1 4 5 6 5

Upload: zilda-cunha-mirandela

Post on 07-Apr-2016

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA amplitude (R)A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados.Ex. dois alunos fizeram, cada um, quatro provas e obtiveram as notas apresentadas na tabela abaixo.

É fácil ver que as notas obtidas pelo primeiro aluno são mais próximas entre si do que as notas obtidas pelo segundo aluno.04/27/23 02:05 Prof. Alexandre José de Oliveira 1

Aluno NotasPedroPaulo

49

61

45

65

Page 2: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasAmplitudeEntão, as notas obtidas pelo primeiro aluno têm menor dispersão.Dentre as formas existentes para medir a dispersão de dados numéricos a amplitude é a mais fácil de calcular.Entretanto ela poderá não medir bem a dispersão. Dois conjuntos de números podem ter dispersão diferentes e apresentar a mesma amplitude. Ver tabela abaixo:

A amplitude das notas é a mesma para os dois alunos, mas as notas de José têm maior dispersão.04/27/23 02:05 Prof. Alexandre José de Oliveira 2

Aluno NotasPauloJosé

99

11

51

59

Page 3: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variânciaPor definição, o desvio em relação à média é a diferença entre o valor observado e a média do conjunto.Para medir o grau de dispersão de um conjunto de dados, é preciso considerar todos os desvios. Mas não se pode usar a soma dos desvios como medida de dispersão porque esta soma é sempre igual a zero. Como exemplo, observe os dados apresentados na tabela abaixo – notas do aluno Carlos, em quatro provas:

04/27/23 02:05 Prof. Alexandre José de Oliveira 3

Prova Notas1ª2ª3ª4ª

9128

Page 4: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variânciaOs desvios das notas em relação à média são:

Qualquer que seja o conjunto de dados, a soma dos desvios em relação a média é sempre igual a zero porque valores positivos e negativos se anulam. Por esta razão, não tem sentido propor a média dos desvios com medida de dispersão. No entanto, se os sinais forem eliminados, os desvios podem ser usados para construir uma medida de dispersão.04/27/23 02:05 Prof. Alexandre José de Oliveira 4

9-5= 4

1-5= -4

2-5= -3

8-5= 3

Page 5: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variância

Para eliminar os sinais negativos, eleva-se cada desvio ao quadrado. Depois, somam-se os quadrados. Como os quadrados de números negativos são positivos, toda soma de quadrados é positiva ou, no mínimo, nula (quando todos os desvios são iguais a zero).Entretanto, como a soma de quadrados dos desvios aumenta quando aumenta o número de dados – mesmo que a dispersão se mantenha constante – por uma razão óbvia: o número de parcelas somadas aumenta.

04/27/23 02:05 Prof. Alexandre José de Oliveira 5

Page 6: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variânciaPara medir a dispersão dos dados em torno da média usa-se, então, a variância, que leva em consideração o número de dados. A variância pode ser definida como a soma dos quadrados dos desvios, dividida por n. Indica-se a variância obtida dessa forma por (lê-se sigma estimado ao quadrado), isto é:

Então, a variância é definida pela soma de quadrados dos desvios, dividida pelo número de dados menos 1, isto é, por n – 1 . Os estatísticos chamam o valor n – 1 de número de graus de liberdade. A variância, obtida por essa nova definição, é indicada por S2.

04/27/23 02:05 Prof. Alexandre José de Oliveira 6

Page 7: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variância

Escreve-se:

ou,

Embora pareça mais complicado, essa segunda fórmula permite que o cálculo da variância seja feito com menor número de operações aritméticas.

04/27/23 02:05 Prof. Alexandre José de Oliveira 7

Page 8: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variânciaExemplo. São dados os valores 0, 1, 2, 3 e 4. Para calcular a variância, aplicando a primeira fórmula, é preciso obter a média dos dados:xbarra= (0+1+2+3+4)/5= 2Em seguida calcula-se

Agora, fica fácil obter:S2=∑(x-xbarra)2/n-1 = 10/4 = 2,504/27/23 02:05 Prof. Alexandre José de Oliveira 8

x x - xbarra (x-xbarra)2

01234

0-2=-21-2=-12-2=03-2=14-2=2

41014

10 0 10

Page 9: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasA variânciaPara calcular a variância dos mesmos dados usando a segunda fórmula, são necessários apenas os cálculos intermediários apresentados na tabela abaixo

A variância é:S2=∑ x2-((∑x)2/n)/n-1 = (30-((10)2/5))/4 = 2,5

04/27/23 02:05 Prof. Alexandre José de Oliveira 9

x x2

01234

014916

10 30

Page 10: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasO desvio padrãoComo medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Qualquer que seja a unidade de medida dos dados originais, a variância os expressará elevado ao quadrado. Isso acontece porque a variância é obtida a partir de uma soma de quadrados dos desvios.Foi então proposta uma medida de dispersão associada a variância, mas com a mesma unidade de medida dos dados. É o desvio padrão. Por definição, o desvio padrão é a raiz quadrada da variância, com sinal positivo. Representa-se por s.

04/27/23 02:05 Prof. Alexandre José de Oliveira 10

Page 11: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasO desvio padrãoPara os dados do último exemplo, ou seja: 0, 1, 2, 3, 4, obteve-se a variância de S2=2,5. Para esses dados, o desvio padrão é igual a:s=√2,5 = 1,58Como o que nos interessa são as medidas de dispersão, o desvio padrão mede bem a dispersão e apresenta os resultados na mesma unidade de medida do conjunto dos dados. De outra forma, quando há maior dispersão em um conjunto de dados, maior será o valor do desvio padrão e vice-versa. Ainda, o desvio padrão não reflete a magnitude dos dados amostrais, reflete apenas a dispersão em torno da média.

04/27/23 02:05 Prof. Alexandre José de Oliveira 11

Page 12: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasO desvio padrão

Ex.

a)As notas de Pedro têm menor dispersão e o menor desvio padrãob)As notas de Paulo têm dispersão maior do que as notas de Pedro; o desvio padrão de Paulo é maior do que o desvio padrão de Pedroc)As notas de Carlos têm a maior dispersão e o maior desvio padrão04/27/23 02:05 Prof. Alexandre José de Oliveira 12

Page 13: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasO desvio padrão

Outra forma de calcular o desvio padrão, desde que a variável tenha distribuição normal, é por meio da seguinte fórmula

onde R é a amplitude e o valor de d2, que depende do tamanho da amostra, é encontrado na Tabela 2 do apêndice. Este método de calcular o desvio padrão fornece boas estimativas para amostras de pequeno tamanho (n = 4, 5 ou 6), mas perde a eficiência se n > 10.

04/27/23 02:05 Prof. Alexandre José de Oliveira 13

Page 14: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasO desvio padrão

A utilização da amplitude para estimar σ data dos primeiros dias do controle estatístico da qualidade e era popular por sua facilidade de cálculo. Com o advento dos computadores e calculadoras, esta não é mais uma consideração importante. Em geral o “estimador quadrático” baseado em S é preferível. No entanto se o tamanho de n da amostra é relativamente pequeno, o método da amplitude funciona bastante bem. A eficiência relativa do método da amplitude comparada com S é exibida a seguir para diferentes tamanhos de amostra:

04/27/23 02:05 Prof. Alexandre José de Oliveira 14

Page 15: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasO desvio padrão

Para valores moderados de n – digamos, n ≥ 10 – o método da amplitude perde eficiência rapidamente, uma vez que ele ignora toda a informação da amostra compreendida entre os dois valores extremos.

04/27/23 02:05 Prof. Alexandre José de Oliveira 15

Tamanho da Amostra n

Eficiência relativa

2 1,0003 0,9924 0,9755 0,9556 0,93010 0,850

Page 16: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostras

Erro padrão da médiaPor definição, erro padrão da média é a raiz quadrada, com sinal positivo, de s2xbarra, isto é:

O erro padrão da média é igual ao desvio padrão dividido pela raiz quadrada do tamanho da amostra.O erro padrão da média é uma medida de dispersão das médias de todas as amostras possíveis (que, na prática, são desconhecidas) em torno da média da população (que, na prática, também é desconhecida).

04/27/23 02:05 Prof. Alexandre José de Oliveira 16

Page 17: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasExercícioVocê foi contratado para gerenciar a produção em uma indústria de biscoitos. Como você ainda não conhece bem o processo, e o produto, você realizou testes sobre quantidade de açúcar (em grs./100 grs. no produto final) em três marcas diferentes de biscoitos concorrentes, marcas A, B e C (ver dados na Tabela).

04/27/23 02:05 Prof. Alexandre José de Oliveira 17

A B C23 11 2422 7 2619 43 2721 8 2520 48 2517 14 2627 45 28

Page 18: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasExercícioCalcule:a) a média e a variância de cada marcab) a média das médias e a média das variânciasc)a média e a variância de todos os dadosd) compare as respostas dadas em b e em c.e) Baseado nos dados e sabendo que um dos atributos que o consumidor estabelece para a compra de biscoitos é a presença de açúcar, como você avalia a qualidade dessas três marcas? Discuta os dados e que decisões você pretende tomar.

04/27/23 02:05 Prof. Alexandre José de Oliveira 18

Page 19: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasExercícioCalcule:a) a média e a variância de cada marcaA 21,29 e 10,24; B 25,14 e 364; C 25,86 e 1,81.b) a média das médias e a média das variâncias24,10 e S2 = 125c)a média e a variância de todos os dados24,10 e S2= -3674. A média geral é igual a média das médias.d) compare as respostas dadas em b e em c. A variância geral mede a variabilidade dos dados em torno da média geral, enquanto as variâncias das amostras medem a variabilidade dos dados em torno da respectiva média.

04/27/23 02:05 Prof. Alexandre José de Oliveira 19

Page 20: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Medidas descritivasMedidas de dispersão para amostrasExercícioCalcule:e) Baseado nos dados e sabendo que um dos atributos que o consumidor estabelece para a compra de biscoitos é a presença de açúcar, como você avalia a qualidade dessas três marcas? Discuta os dados e que decisões você pretende tomar.

04/27/23 02:05 Prof. Alexandre José de Oliveira 20

Page 21: Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados

Por hoje é só,

Boa noite a todos

FIM

04/27/23 02:05 Prof. Alexandre José de Oliveira 21

Disciplina Engenharia da Qualidade IIDisciplina Engenharia da Qualidade II