estatística amintas paiva afonso. notaÇÃo característicaamostra população somatório de um...

35
Estatística amintas paiva afonso

Upload: internet

Post on 16-Apr-2015

115 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Estatísticaamintas paiva

afonso

Page 2: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

NOTAÇÃO

Característica amostra população

Somatório de um conjunto de valores

Valores individuais dos dados x i x i

Número de valores (tamanho do conjunto) n N

Média aritmética

Desvio padrão s

2s 2Variância

Range (amplitude) R -

x

Notações Estatísticas

Page 3: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Achatamento - curtoseAssimetria - coeficiente de assimetria

-Média aritm.-Mediana-Moda-Quartis-Percentis

-Amplitude-Variância-Desvio padrão-Coeficiente de Variação-Desvio médio

MEDIDAS ESTATÍSTICAS DISPERSÃO

POSIÇÃO tendência central

FORMAUnidade 4 Unidade 5

Não será abordado

Sínteses Numéricas

Page 4: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

= x N

Média de todos os valores de uma população.

= x n

_Média de um conjunto de valores

amostrais.

Obs.: A média nos dá uma idéia de onde os valores do meu conjunto de dados tende a se concentrar.

Corresponde ao somatório de um conjunto de valores dividido pelo número destes valores.

Média = x n

n = número de valores

Medidas de Posição – Tendência Central

Média aritmética

Page 5: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Média aritmética

Exercício : Um estudante fez quatro provas e obteve as notas 89, 94, 95 e 86, a sua nota média é:

5,894

86959489

x

notação

n

xxxx n...21

n

x

n

xn

ii 1

Medidas de Posição – Tendência Central

Page 6: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

É a mais importante das medidas de tendência central;

A média de um conjunto de números pode ser sempre calculada;

Para um dado conjunto de números, a média é única;

É sensível (ou afetada) a todos os valores do conjunto. Assim se um valor se modifica, a média também se modifica;

Somando-se ou reduzindo-se uma constante a cada valor do conjunto, a média ficará aumentada ou reduzida dessa constante: µ(x ± k) = µ (x) ± k;

Multiplicando-se ou dividindo-se cada valor do conjunto por uma constante, a média ficará multiplicada ou reduzida por essa constante: µ(x .\ k) = µ (x) .\ k

Média aritmética

Medidas de Posição – Tendência Central

Page 7: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Foi introduzida recentemente nos estudos estatísticos;

Se obtém eliminando do conjunto de dados os “m” maiores e os “m” menores valores;

Média aparada

No conjunto de dados abaixo, calcular a média aparada, com m =2

1, 2, 6, 7, 6, 8, 10, 8, 12, 23, 25, 8, 9, 7, 11, 12, 13, 10, 8, 9, 7, 12, 12, 10, 9, 11,7, 8, 6, 8, 9, 10, 11, 8, 7, 11, 12, 6, 10, 9, 7, 8, 10, 6, 7, 12, 8, 9, 10,

Normalmente m correspondente: 2,5% a 5% dos valores observados;

Na verdade o que se está fazendo é eliminando os valores extremos superiores e inferiores (valores discrepantes - outliers);

Medidas de Posição – Tendência Central

Page 8: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Média aparada

0

5

10

15

20

25

30

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

A média aparada exclui valores discrepantes

A média aritmética de todos os valores é = 9,29Excluindo os dois menores e dois maiores valores (1, 2, 23 e 25), a média aparada é = 8,98

Medidas de Posição – Tendência Central

Page 9: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Cada elemento do conjunto pode ter importância diferente (peso). Neste caso o cálculo da média deve levar em conta os pesos desiguais de cada elemento.

Exercício : O colégio definiu que as provas mensais teriam peso de 30% e a prova final teria peso de 40% no cálculo dos rendimentos dos alunos. Veja o quadro abaixo e calcule a média do aluno.

Média ponderada

800,30

0,30

Mês 2 9096

exame nota pesoMês 1

Final 0,40

=0,3*80 + 0,3*90 + 0,4*96

0,3 + 0,3 + 0,489,4px

Medidas de Posição – Tendência Central

Page 10: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Média ponderada

Notação

n

nnp ppp

pxpxpxx

...

...

21

2211p1, p2....pn são os pesos

n

ii

i

n

ii

p

p

pxx

1

1

Medidas de Posição – Tendência Central

Page 11: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

A Mediana de um conjunto de valores é o valor do meio desse conjunto, quando estes estão em ordem crescente.

Divide um conjunto de dados ordenados em dois grupos iguais.

3, 7, 5, 5, 1, 9, 15, 13, 17, 13, 17Dado o conjunto de 11 dados:Calcule a mediana.

Exercício

5 dados

11, 13, 13, 15, 179,Conjunto dados ordenados

5 dados

1, 3, 5, 5, 7,

Valor central = mediana

Mediana x~

Medidas de Posição – Tendência Central

Page 12: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Mediana x~

Conjunto de valores pares ( n = par)

+ = valorn/2 (n / 2) + 1

valor )( / 2x~

Conjunto de valores impares (n = impar)

= valor(n+ 1) / 2

x~

5,82/)107(2/)32(~ posiçãovalorposiçãovalorx

5, 7, 10, 11, 14 n = 5

10=3=~ posiçãovalorx

exemplo

= valor (5+1)/2 = valor 3x~

x~= (valor 4/2 + valor (4/2 + 1))/2

5, 7, 10, 11 n = 4 exemplo

Medidas de Posição – Tendência Central

Page 13: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Exercício: Calcular a mediana das medidas de um conjunto de eixo:

(3,0 ; 2,8 ; 2,9 ; 3,3 ; 3,5 ; 3,1 ; 3,2 ; 3,0 ; 3,4 ; 2,7)

(2,7 ; 2,8 ; 2,9 ; 3,0 ; 3,0 ; 3,1 ; 3,2 ; 3,3 ; 3,4 ; 3,5)

Resolução:

Mediana = x~ 3,0 + 3,1 2

= = 3,05

Interpretação do resultado: 50% dos dados brutos são valores menores ou iguais a 3,05 e 50% desses são valores maiores ou iguais a 3,05.

Medidas de Posição – Tendência Central

Mediana x~

Page 14: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Média aritmética MedianaX

Salário dos funcionários de um restaurante

200, 250, 250, 300, 450, 460, 510 7,3457

510460450300250250200

x

A média de 345,7 sintetiza razoavelmente o conjunto de dados (salários)

Salário dos funcionários incluindo o gerente

200, 250, 250, 300, 450, 460, 2300 4,601=7

2300+460+450+300+250+250+200=x

A média de 601,4 não sintetiza razoavelmente o conjunto de dados

Nos dois casos a mediana é 300. Para o segundo caso a mediana representa melhor o conjunto de dados.

Num conjunto de dados fortemente desviado, a mediana é uma medida mais representativa (distribuição de rendas, folha de pagamentos)

Medidas de Posição – Tendência Central

Page 15: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Moda - MO

A Moda de um conjunto de valores é o valor que apresenta maior freqüência em um conjunto de observações.

É o valor ou classe de maior freqüência num conjunto de dados.

- pode não existir

- pode não ser única

Exercício : Dado o conjunto de dados 10, 10, 11, 14, 15, 16, 17, 18, 18. Calcule a moda.A moda é constituída de dois valores: MO = 10 e 18 (duas vezes cada)

Medidas de Posição – Tendência Central

Page 16: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

medida definição quão

freqüente

existência considera todos

valores?

afetada pelos

valores extremos

vantagens e desvantagens

média “média” mais familiar

existe sempre

sim sim muito utilizada em estatística

mediana Valor

médio

usada existe sempre

não não costuma ser boa escolha se há valores extremos

moda valor mais freqüente

usada às vezes

pode não existir; pode ter mais de uma moda

não não apropriada para dados ao nível nominal

x = xn

COMPARAÇÃO

Medidas de Posição – Tendência Central

Page 17: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Exercício:

Inspecionaram-se quinze rádios antes da remessa e os números de defeito por unidade são apresentados no quadro abaixo:

1 4 0 2 10 2 3 0 03 1 1 1 1

Números de defeito por rádio

Encontre a média, a mediana e a moda do número de defeitos.

Resposta: (média = 1,33) (mediana = 1) (moda =1).

Medidas de Posição – Tendência Central

Page 18: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

A dispersão mede quão próximo uns dos outros estão os valores do grupo

pequena dispersão

grande dispersão

3131

46,39,30,23,1737,34,31,28,25

BA xx

BA

A variabilidade de B é maior que de A

Uma medida de posição

(quase sempre a média)

Uma boa representação de dados

Uma medida de dispersão

(quase sempre o

desvio padrão)

= +

Medidas de Dispersão

Page 19: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Amplitude, range ou intervalo

É expresso pela diferença entre o maior e o menor valor num grupo, ou pela identificação desses dois números.

númerosintervalo

diferença do menor ao maior(1 ; 5 ; 7 ; 13)

(14 ; 3 ; 17 ; 4 ; 8 ; 73 ; 36 ; 48)

(3,2 ; 4,7 ; 5,6 ; 2,1 ; 1,9 ; 10,3)

13 – 1 = 12

73 – 3 = 70

10,3 – 1,9 = 8,4

de 1 a 13

de 3 a 73

de 1,9 a 10,3

Medidas de Dispersão

Page 20: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Amplitude, range ou intervalo

••••

•••

LIMITAÇÃO: só leva em conta os dois valores extremos do conjunto, nada informando sobre os outros valores.

•• •• •• • •• •

• ••••

• •••• ••

intervalo

1

2

3

distribuição uniforme – o intervalo é uma boa medida

é uma medida apenas razoável

é uma medida ruim da dispersão

Medidas de Dispersão

Page 21: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Desvio médio absoluto

DMA =

| x i – x |n

DMA é fácil de entender e calcular

mas é pouco usado como medida de dispersão

outras medidas apresentam propriedades matemáticas mais interessantes

Medidas de Dispersão

Page 22: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Exercício: Calcule o DMA do conjunto de dados 2, 4, 6, 8, 10. Calcular o desvio médio.

X = (2 +4 +6 +8 +10) / 5 = 6

Desvio médio absoluto

Xi - X

2 – 6 = - 4 4 – 6 = - 2

6 – 6 = 0

8 – 6 = 2

10 – 6 = 4

0soma

DMA = (4 +2 +0 +2 + 4 ) / 5 = 2,4

DMA = | x i – x |

n

Medidas de Dispersão

Page 23: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Variância

A Variância é uma medida de dispersão muito utilizada.

S x2 = n - 1

(x i - x )2

n – 1 amostran população

ATENÇÃO

S x2 =

n - 1

( x i )2 / n x i2 -

OU

Medidas de Dispersão

Page 24: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Variância

Exercício: Calcule a variância da amostra 2, 4, 6, 8, 10.

A média desse conjunto é 6.

6

6 + 2

4

4

x i x x i - x (x i - x ) 2

2468

10

6

6

- 46- 2

0

+ 4

0

16

16

somas 0 40

40S x2 = n - 1

(x i - x )2

=5 - 1

= 10

Se esses valores representassem toda a população, a variância seria 40/5 = 8.

Medidas de Dispersão

Page 25: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Desvio padrão

O desvio padrão é mais comumente usado porque se apresenta na mesma unidade da variável em análise. Assim, se a unidade da variável for mm, o desvio padrão também será mm.

Isso não acontece com a variância.

S x = n - 1 (x i - x )2

S x = n - 1

( x i )2 / n x i2 -

n – 1 amostra

n população

só raiz positiva da variância

É a raiz quadrada da variância.

Medidas de Dispersão

Page 26: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Desvio padrão

O desvio padrão é a medida de dispersão mais usada. Quanto maior é o desvio padrão maior é a dispersão dos dados em torno da média.

s = 3

1 2 3 4 5 6 7

s = 1,0

1 2 3 4 5 6 7

s = 0,8

1 2 3 4 5 6 71 2 3 4 5 6 7

freq

üênc

ia

s = 076543210

O desvio-padrão cresce quando a dispersão dos dados aumenta

4

7

Xmédiacom

medidastemoscasosostodosem

Medidas de Dispersão

Page 27: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Coeficiente de variação

É a relação entre o desvio padrão e a média do conjunto de dados.

Nos dá a idéia do tamanho do desvio padrão em relação à média.

Uma pequena dispersão absoluta pode ser na verdade considerável quando comparada com os valores da variável

CV (%) = S x

x. 100

Conjunto de dado com s = 15 e média 100

CV = 15%

Conjunto de dado com s = 20 e média 1000

CV = 2%

σCV(%) =

µ. 100ou

amostra população

Medidas de Dispersão

Page 28: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Exemplo: Calcular o desvio-padrão da amostra representada por: 1, 2, 4, 5, 7.

i Xi (Xi - X ) (Xi - X )2 1 1 (1 – 3,8) = -2,8 (-2,8)2 = 7,84 2 2 (2 – 3,8) = -1,8 (-1,8)2 = 3,24 3 4 (4 – 3,8) = 0,2 (0,2)2 = 0,04 4 5 (5 – 3,8) = 1,2 (1,2)2 = 1,44 5 7 (7 – 3,8) = 3,2 (3,2)2 = 10,24 X = 3,8 8,22

5

1

2 XX i

Médias e Desvio-padrão - Exemplos

Page 29: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

39,24

8,228,22.

15

1.

1

12

n

ii XX

nS

Logo :

i Xi (Xi - X ) (Xi - X )2 1 1 (1 – 3,8) = -2,8 (-2,8)2 = 7,84 2 2 (2 – 3,8) = -1,8 (-1,8)2 = 3,24 3 4 (4 – 3,8) = 0,2 (0,2)2 = 0,04 4 5 (5 – 3,8) = 1,2 (1,2)2 = 1,44 5 7 (7 – 3,8) = 3,2 (3,2)2 = 10,24 X = 3,8 8,22

5

1

2 XX i

Médias e Desvio-padrão - Exemplos

Page 30: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Exercício 1: Vamos supor que eu quero comprar uma lâmpada para a minha casa e quero que ela dure pelo menos 700 h. Eu solicito a dois fabricantes o tempo de vida útil de suas lâmpadas e eles me fornecem os seguintes dados:

Fabricante A (h) Fabricante B (h) 730 1000 710 687 705 700 720 850 765 587 750 710

Supondo que as duas lâmpadas custam o mesmo valor, qual delas eu deveria comprar?

Médias e Desvio-padrão - Exercícios

Page 31: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Para chegarmos à uma conclusão é necessário calcularmos o tempo de vida útil médio para cada fabricante e saber qual é variabilidade dos dados.

hX A 730 hX B 67,755SA = 23,45 h

SB = 146,25 h

Critério de escolha: tempo de vida útil = média desvio-padrão

Fabricante A (h) Fabricante B (h) 730 1000 710 687 705 700 720 850 765 587 750 710

Médias e Desvio-padrão - Exercícios

Page 32: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Fabricante A : 730 ± 23,45 h

hX A 730hSX AA 45,23730 hSX AA 45,23730

Fabricante A:[706,55 – 753,45= -46,9]

Fabricante B : 755,67 ± 146,25 h

hSX BB 25,14667,755 hSX BB 25,14667,755 hX B 67,755

Fabricante B : [609,42 – 901,92= -292,5]

Conclusão : Escolheria o fabricante A.

Médias e Desvio-padrão - Exercícios

Page 33: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Exercício 2: Um comerciante está interessado em comprar 100 garrafas de cachaça para o seu estabelecimento. No entanto, como é de preferência de sua clientela, é necessário que a cachaça escolhida apresente um teor alcoólico de no mínimo 33% em volume. Ele consultou alguns fornecedores e obteve as seguintes informações:

Teor alcoólico de três tipos de aguardente pesquisadas. Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)

38,7 35,7 38,7 33,5 36,4 33,5 32,5 35,9 34,5 31,2 33,2 34,2 35,9 34,1 35,9

Na sua opinião, qual deveria ser a marca escolhida pelo comerciante?

Médias e Desvio-padrão - Exercícios

Page 34: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

Marca A: 34,36 ± 2,97 [31,39–37,33=-5,94]

Marca B: 35,06 ± 1,35 [33,71–36,41=-2,7]

Marca C:35,36 ± 2,06 [33,3–37,42=-4,12]

As marcas B e C atendem ao requisito (>33%),no entanto escolheria a marca C pelo preço. Assim, teria um economia de R$ 45,00!

Teor alcoólico de três tipos de aguardente pesquisadas. Marca A (R$ 3,50/l) Marca B (R$ 4,10/l) Marca C (R$ 3,65/l)

38,7 35,7 38,7 33,5 36,4 33,5 32,5 35,9 34,5 31,2 33,2 34,2 35,9 34,1 35,9

Médias e Desvio-padrão - Exercícios

Page 35: Estatística amintas paiva afonso. NOTAÇÃO Característicaamostra população Somatório de um conjunto de valores Valores individuais dos dadosx i Número

www.matematiques.com.bramintas paiva

afonso