estimação de parâmetros - cpgccmarcelo.menezes.reis/aula07cpgcc2019.pdfestimação de uma...

35
1 ESTIMAÇÃO DE PARÂMETROS

Upload: others

Post on 05-Dec-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

1

ESTIMAÇÃO DE PARÂMETROS

Page 2: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

2

universo do estudo (população)

O raciocínio indutivo da estimação de parâmetros

dados observados

Estimação de Parâmetros

Page 3: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

3

Estimação de Parâmetros

População

p

2

(parâmetros: números

reais desconhecidos)

Amostra

S 2

X

(estatísticas / estimadores:

variáveis aleatórias)

p

Page 4: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

4

Propriedades Desejáveis de um Estimador

Não-tendenciosidade: um estimador é não tendencioso (não viesado; não viciado) se sua média (ou valor esperado) for o próprio parâmetro que se pretende estimar.

Page 5: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

5

Não Tendenciosidade

E( ) = X X

= X Xi

n =

Não-tendencioso

Não-tendencioso

Número de ocorrências

(binomial)

n

Xp ˆ

pnpn

XEn

pE .1

)(1

)ˆ(

Page 6: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

6

Não Tendenciosidade

n

xxi

2

2)(

22 1

)ˆ( n

nE

1

)( 2

2

n

xxs

i

Não-tendencioso

Tendencioso

22)( sE

Page 7: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

7

Eficiência

Um estimador (T1) é mais eficiente que outro (T2) na estimação de um parâmetro se E{(T1 – )2} < E{(T2 – )2}

Se T1 e T2 forem não tendenciosos, T1 é mais

eficiente que T2 se Var(T1) < Var (T2)

Page 8: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

8

Não tendenciosidade e Eficiência

x x x

x x x

x x x

x x x x x x

x x x

x x x x

x x x

x x

x x x x

x x x x x

x x x

x x x x

x x

x x x

x x x

x x x x

x x

x x x

x x x

x x x

x x x x x x

x x x

x x x x

x x x

x x

x x x x

x x x x x

x x x

x x x x

x x

x x x

x x x

x x x x

x x

x x x

x x x

x x x

x x x

x x x x

x x x

x x x

x x

x x x

x x x

x x x x

x x

x x x

x x x

x x x

x x x x

x x

x x x

x x x

x x x

x x x

x x x

x x x x

x x

x x x

x x x

x x x x

x x x

x x

x x x

x x x

x x x

x x x

x x x

x x x

x x x

x x x

x x x

Não-tendenciosos

T1 T2 T3

Tendencioso

T1 é mais eficiente que T2

Page 9: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

9

Construção de estimadores

Estimador de mínimos quadrados: função que

minimiza o quadrado dos erros na amostra.

Ex. Dada uma amostra de medidas: X1, X2, ..., Xn,

supondo o modelo Xi = + ei

onde:

= medida verdadeira,

ei = erro associado à i-ésima medida, i = 1, 2, ...,n

Page 10: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

10

Construção de estimadores

Estimador de máxima verossimilhança (EMV): supondo que os dados provém de um certo modelo probabilístico, o EMV de um parâmetro é a estatística T = T(X1, X2, ..., Xn) que produz um valor, o qual torna a amostra observada mais verossímil possível.

Ex. Expto: 3 lançamentos de uma moeda;

Modelo: P(cara) = p;

P(coroa) = 1 - p

Amostra: {cara, cara, coroa}

Page 11: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

11

Estimador de máxima verossimilhança

(EMV) Ex. Expto: 3 lançamentos de uma moeda;

Modelo: P(cara) = p;

P(coroa) = 1 - p

Amostra: {cara, cara, coroa}

EMV: Valor de p que maximiza a função de verossimilhança L(p) = p 2.(1- p)

3

2ˆ0)( ppL

dp

d(proporção amostral)

Page 12: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

12

Estimador de máxima verossimilhança

(EMV) Em geral, numa distribuição binomial, o EMV de p é a

proporção amostral

Numa distribuição normal, os EMV de e são, respectivamente:

n

Xp ˆ

n

X

X i

i

n

XXi

i

2

2

Page 13: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

13

Estimação de Parâmetros

Por ponto: estima-se apenas um valor para o parâmetro pp ˆ

Por intervalo: estima-se um intervalo de valores onde deve-se

encontrar o parâmetro (intervalo de confiança).

amostralerropp ˆ

Page 14: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

14

Desde que a amostra seja aleatória e razoavelmente grande (n > 30), tem-se:

Os possíveis valores de seguem uma distribuição (aproximada) normal com média e desvio padrão dados por

n

)p.(1p = p

p =

p

Relação entre p e p

p

Page 15: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

15

Estimação de uma proporção p

Na prática, estima-se o erro padrão da proporção

por

n

)p.(1p = S

P

normal pelaaproximar Possível 5)ˆ1(

normal pelaaproximar Possível 5ˆ

pnSe

pnSe

Page 16: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

16

Nível de confiança

PARTE DE UMA TABELA NORMAL PADRÃO

Área 0,800 0,900 0,950 0,980 0,990 0.995 0,998

z 1,282 1,645 1,960 2,326 2,576 2,807 3,090

± z . S

Intervalo

de conf. p p

0 Z - Z

área interna = nível de confiança

Page 17: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

17

Estimação de uma proporção p Tamanho N da população conhecido

Faz-se uma correção no cálculo do erro padrão:

1N

nN

n

)p.(1p = S

P

OBS. Se N >> n, pode-se usar a expressão

anteriormente empregada.

Page 18: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

18

Exemplo 1

Numa amostra aleatória simples de 120 domicílios, realizada num certo bairro da cidade, observou-se que apenas 33,3% possuíam instalações sanitárias adequadas. Considerando que existam 460 domicílios no bairro, encontre um intervalo de 95% de confiança para a proporção de domicílios com instalações sanitárias adequadas.

Page 19: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

19

Exemplo 1

0307,01460

120460

120

)333,0.(1333,0 =

P

S

Intervalo de 95% de confiança para p: 33,3% 7,252%

1N

nN

n

)p.(1p = S

P

± z . S

p p

07252,0037,096,196,1 ˆ ps

Page 20: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

20

Estimação de uma média

Estimador pontual: o melhor estimador para a média populacional µ de uma variável é a média amostral da variável.

Desde que a amostra seja aleatória e razoavelmente grande (n > 30), tem-se:

Os valores da média amostral seguem uma distribuição aproximadamente normal, cujos parâmetros são:

n =

X

=

X DESCONHECIDA

Page 21: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

21

Estimação do erro padrão da média

1N

nN

n

S = S

X

para N conhecido

e não muito grande

n

S = S

Xpara N desconhecido

ou muito grande

Page 22: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

22

Intervalo de confiança para a média

XStX

X média da amostra

XS erro padrão da média

t abscissa da distrib. t com gl = n – 1 e

determinada confiança

Page 23: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

23

Modelo t de Student

O modelo tem média igual a zero (como a normal padrão).

Mas sua variância é: n/(n-2).

Onde n é o tamanho da amostra que foi retirada para o processo de Estimação.

O modelo t tem n – 1 graus de liberdade.

Page 24: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

Modelo t de Student

24

Desenvolveu a distribuição para

aplicar na melhoria da qualidade

da cerveja Guiness.

William Sealy Gossett

Escrevia sob o pseudônimo

“Student”, por razões de sigilo

industrial.

Page 25: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

25

Para cada valor de n temos uma curva t.

Modelo t de Student

Page 26: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

26

Exemplo 2

O tempo de resposta de um algoritmo de

otimização, implementado numa certa máquina,

foi observado 20 vezes. Desta amostra, obteve-se

as seguintes estatísticas: média de 82,0 minutos e

desvio padrão de 10,0 minutos. Apresente um

intervalo de confiança para o tempo médio de

resposta do algoritmo nesta máquina.

Page 27: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

27

Exemplo 2

20

10093,282..

n

stxCI

minutos 82x

n = 20 (19 graus de liberdade) s = 10 minutos

Nível de 95% de confiança: t = 2,093

7,482.. CI

L.I. = 82 – 4,7 = 77,3 minutos

L.S. = 82 + 4,7 = 86,7 minutos

Há 95% de probabilidade de µ estar entre 77,3 e 86,7 minutos.

Page 28: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

28

Tamanho da amostra para estimar uma Média

2

0

0 = n

E

st

0n =n se N é muito grande ou desconhecido

Cálculo inicial:

n+ N

n.N =n

0

0se N não for muito grande e

for conhecido

Page 29: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

29

Avaliação “a priori” do desvio padrão:

Estudos passados

Amostra piloto

Fixando-se um valor teórico

Tamanho de Amostras

Page 30: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

30

Exemplo 3

Qual o tamanho da amostra para estimar o tempo médio processamento de encomendas em uma agência franqueada dos correios, admitindo-se um erro máximo de 1 minuto? Considere que numa amostra piloto com 20 observações, encontrou-se um desvio padrão de 10,0 minutos.

Page 31: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

31

Exemplo 3

Nível de confiança: 95% E0 = 1 minuto

Amostra piloto: n = 20, s = 10 minutos

95% de confiança para 20-1 = 19 graus de liberdade, t = 2,093

4390649,4381

10093,2 = n

22

0

0

E

st

Mínimo de 439 elementos!

Page 32: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

32

Tamanho da amostra para estimar uma Proporção

0n =n se N é muito grande ou desconhecido

E

)1(z = n

0

2

2

0

pp Cálculo inicial:

n+ N

n.N =n

0

0se N não for muito grande e

for conhecido

Page 33: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

33

Estimação “a priori” da proporção p:

Estudos passados

Amostra piloto

Fixando-se um valor teórico (0,5) => estimativa EXAGERADA.

Tamanho da amostra para estimar uma Proporção

Page 34: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

34

Exemplo 4

Qual deve ser o tamanho de uma amostra aleatória simples para avaliar a preferência por um candidato de certo partido em um grande município, admitindo erro amostral máximo de 3%, com 95% de confiança:

a) Supondo que usualmente o partido obtém 40% de preferência popular?

b) Utilizando uma estimativa exagerada.

Page 35: Estimação de Parâmetros - CPGCCmarcelo.menezes.reis/Aula07CPGCC2019.pdfEstimação de uma proporção p Tamanho N da população conhecido Faz-se uma correção no cálculo do erro

35

Exemplo 4

102543,102403,0

6,04,096,1

E

)1( = n 2

2

0

2

2

0

ppz

a) p = 0,4 1- p = 0,6 E0 = 0,03 Nível de confiança = 0,95

Z = 1,96

b) p = 0,5 1- p = 0,5 E0 = 0,03 Nível de confiança = 0,95

Z = 1,96

106811,106703,0

5,05,096,1

E

)1( = n 2

2

0

2

2

0

ppz