estimação de parâmetros - cpgccmarcelo.menezes.reis/aula07cpgcc2019.pdfestimação de uma...
TRANSCRIPT
1
ESTIMAÇÃO DE PARÂMETROS
2
universo do estudo (população)
O raciocínio indutivo da estimação de parâmetros
dados observados
Estimação de Parâmetros
3
Estimação de Parâmetros
População
p
2
(parâmetros: números
reais desconhecidos)
Amostra
S 2
X
(estatísticas / estimadores:
variáveis aleatórias)
p
4
Propriedades Desejáveis de um Estimador
Não-tendenciosidade: um estimador é não tendencioso (não viesado; não viciado) se sua média (ou valor esperado) for o próprio parâmetro que se pretende estimar.
5
Não Tendenciosidade
E( ) = X X
= X Xi
n =
Não-tendencioso
Não-tendencioso
Número de ocorrências
(binomial)
n
Xp ˆ
pnpn
XEn
pE .1
)(1
)ˆ(
6
Não Tendenciosidade
n
xxi
2
2)(
22 1
)ˆ( n
nE
1
)( 2
2
n
xxs
i
Não-tendencioso
Tendencioso
22)( sE
7
Eficiência
Um estimador (T1) é mais eficiente que outro (T2) na estimação de um parâmetro se E{(T1 – )2} < E{(T2 – )2}
Se T1 e T2 forem não tendenciosos, T1 é mais
eficiente que T2 se Var(T1) < Var (T2)
8
Não tendenciosidade e Eficiência
x x x
x x x
x x x
x x x x x x
x x x
x x x x
x x x
x x
x x x x
x x x x x
x x x
x x x x
x x
x x x
x x x
x x x x
x x
x x x
x x x
x x x
x x x x x x
x x x
x x x x
x x x
x x
x x x x
x x x x x
x x x
x x x x
x x
x x x
x x x
x x x x
x x
x x x
x x x
x x x
x x x
x x x x
x x x
x x x
x x
x x x
x x x
x x x x
x x
x x x
x x x
x x x
x x x x
x x
x x x
x x x
x x x
x x x
x x x
x x x x
x x
x x x
x x x
x x x x
x x x
x x
x x x
x x x
x x x
x x x
x x x
x x x
x x x
x x x
x x x
Não-tendenciosos
T1 T2 T3
Tendencioso
T1 é mais eficiente que T2
9
Construção de estimadores
Estimador de mínimos quadrados: função que
minimiza o quadrado dos erros na amostra.
Ex. Dada uma amostra de medidas: X1, X2, ..., Xn,
supondo o modelo Xi = + ei
onde:
= medida verdadeira,
ei = erro associado à i-ésima medida, i = 1, 2, ...,n
10
Construção de estimadores
Estimador de máxima verossimilhança (EMV): supondo que os dados provém de um certo modelo probabilístico, o EMV de um parâmetro é a estatística T = T(X1, X2, ..., Xn) que produz um valor, o qual torna a amostra observada mais verossímil possível.
Ex. Expto: 3 lançamentos de uma moeda;
Modelo: P(cara) = p;
P(coroa) = 1 - p
Amostra: {cara, cara, coroa}
11
Estimador de máxima verossimilhança
(EMV) Ex. Expto: 3 lançamentos de uma moeda;
Modelo: P(cara) = p;
P(coroa) = 1 - p
Amostra: {cara, cara, coroa}
EMV: Valor de p que maximiza a função de verossimilhança L(p) = p 2.(1- p)
3
2ˆ0)( ppL
dp
d(proporção amostral)
12
Estimador de máxima verossimilhança
(EMV) Em geral, numa distribuição binomial, o EMV de p é a
proporção amostral
Numa distribuição normal, os EMV de e são, respectivamente:
n
Xp ˆ
n
X
X i
i
n
XXi
i
2
2
13
Estimação de Parâmetros
Por ponto: estima-se apenas um valor para o parâmetro pp ˆ
Por intervalo: estima-se um intervalo de valores onde deve-se
encontrar o parâmetro (intervalo de confiança).
amostralerropp ˆ
14
Desde que a amostra seja aleatória e razoavelmente grande (n > 30), tem-se:
Os possíveis valores de seguem uma distribuição (aproximada) normal com média e desvio padrão dados por
n
)p.(1p = p
p =
p
Relação entre p e p
p
15
Estimação de uma proporção p
Na prática, estima-se o erro padrão da proporção
por
n
)p.(1p = S
P
normal pelaaproximar Possível 5)ˆ1(
normal pelaaproximar Possível 5ˆ
pnSe
pnSe
16
Nível de confiança
PARTE DE UMA TABELA NORMAL PADRÃO
Área 0,800 0,900 0,950 0,980 0,990 0.995 0,998
z 1,282 1,645 1,960 2,326 2,576 2,807 3,090
± z . S
Intervalo
de conf. p p
0 Z - Z
área interna = nível de confiança
17
Estimação de uma proporção p Tamanho N da população conhecido
Faz-se uma correção no cálculo do erro padrão:
1N
nN
n
)p.(1p = S
P
OBS. Se N >> n, pode-se usar a expressão
anteriormente empregada.
18
Exemplo 1
Numa amostra aleatória simples de 120 domicílios, realizada num certo bairro da cidade, observou-se que apenas 33,3% possuíam instalações sanitárias adequadas. Considerando que existam 460 domicílios no bairro, encontre um intervalo de 95% de confiança para a proporção de domicílios com instalações sanitárias adequadas.
19
Exemplo 1
0307,01460
120460
120
)333,0.(1333,0 =
P
S
Intervalo de 95% de confiança para p: 33,3% 7,252%
1N
nN
n
)p.(1p = S
P
± z . S
p p
07252,0037,096,196,1 ˆ ps
20
Estimação de uma média
Estimador pontual: o melhor estimador para a média populacional µ de uma variável é a média amostral da variável.
Desde que a amostra seja aleatória e razoavelmente grande (n > 30), tem-se:
Os valores da média amostral seguem uma distribuição aproximadamente normal, cujos parâmetros são:
n =
X
=
X DESCONHECIDA
21
Estimação do erro padrão da média
1N
nN
n
S = S
X
para N conhecido
e não muito grande
n
S = S
Xpara N desconhecido
ou muito grande
22
Intervalo de confiança para a média
XStX
X média da amostra
XS erro padrão da média
t abscissa da distrib. t com gl = n – 1 e
determinada confiança
23
Modelo t de Student
O modelo tem média igual a zero (como a normal padrão).
Mas sua variância é: n/(n-2).
Onde n é o tamanho da amostra que foi retirada para o processo de Estimação.
O modelo t tem n – 1 graus de liberdade.
Modelo t de Student
24
Desenvolveu a distribuição para
aplicar na melhoria da qualidade
da cerveja Guiness.
William Sealy Gossett
Escrevia sob o pseudônimo
“Student”, por razões de sigilo
industrial.
25
Para cada valor de n temos uma curva t.
Modelo t de Student
26
Exemplo 2
O tempo de resposta de um algoritmo de
otimização, implementado numa certa máquina,
foi observado 20 vezes. Desta amostra, obteve-se
as seguintes estatísticas: média de 82,0 minutos e
desvio padrão de 10,0 minutos. Apresente um
intervalo de confiança para o tempo médio de
resposta do algoritmo nesta máquina.
27
Exemplo 2
20
10093,282..
n
stxCI
minutos 82x
n = 20 (19 graus de liberdade) s = 10 minutos
Nível de 95% de confiança: t = 2,093
7,482.. CI
L.I. = 82 – 4,7 = 77,3 minutos
L.S. = 82 + 4,7 = 86,7 minutos
Há 95% de probabilidade de µ estar entre 77,3 e 86,7 minutos.
28
Tamanho da amostra para estimar uma Média
2
0
0 = n
E
st
0n =n se N é muito grande ou desconhecido
Cálculo inicial:
n+ N
n.N =n
0
0se N não for muito grande e
for conhecido
29
Avaliação “a priori” do desvio padrão:
Estudos passados
Amostra piloto
Fixando-se um valor teórico
Tamanho de Amostras
30
Exemplo 3
Qual o tamanho da amostra para estimar o tempo médio processamento de encomendas em uma agência franqueada dos correios, admitindo-se um erro máximo de 1 minuto? Considere que numa amostra piloto com 20 observações, encontrou-se um desvio padrão de 10,0 minutos.
31
Exemplo 3
Nível de confiança: 95% E0 = 1 minuto
Amostra piloto: n = 20, s = 10 minutos
95% de confiança para 20-1 = 19 graus de liberdade, t = 2,093
4390649,4381
10093,2 = n
22
0
0
E
st
Mínimo de 439 elementos!
32
Tamanho da amostra para estimar uma Proporção
0n =n se N é muito grande ou desconhecido
E
)1(z = n
0
2
2
0
pp Cálculo inicial:
n+ N
n.N =n
0
0se N não for muito grande e
for conhecido
33
Estimação “a priori” da proporção p:
Estudos passados
Amostra piloto
Fixando-se um valor teórico (0,5) => estimativa EXAGERADA.
Tamanho da amostra para estimar uma Proporção
34
Exemplo 4
Qual deve ser o tamanho de uma amostra aleatória simples para avaliar a preferência por um candidato de certo partido em um grande município, admitindo erro amostral máximo de 3%, com 95% de confiança:
a) Supondo que usualmente o partido obtém 40% de preferência popular?
b) Utilizando uma estimativa exagerada.
35
Exemplo 4
102543,102403,0
6,04,096,1
E
)1( = n 2
2
0
2
2
0
ppz
a) p = 0,4 1- p = 0,6 E0 = 0,03 Nível de confiança = 0,95
Z = 1,96
b) p = 0,5 1- p = 0,5 E0 = 0,03 Nível de confiança = 0,95
Z = 1,96
106811,106703,0
5,05,096,1
E
)1( = n 2
2
0
2
2
0
ppz