inferências para uma amostra
DESCRIPTION
Inferências para uma amostra. Até agora: ICs e testes de hipótese para uma amostra X 1 , X 2 , …, X n i.i.d. N(0,1) Baseados no fato de que, sob a hipótese nula ( m = m 0 ou s 2 = s 0 2 ), determinadas estatísticas têm distribuições conhecidas. - PowerPoint PPT PresentationTRANSCRIPT
Inferências para uma amostra
• Até agora: ICs e testes de hipótese para uma amostra X1, X2, …, Xn i.i.d. N(0,1)
• Baseados no fato de que, sob a hipótese nula ( = 0 ou 2 = 0
2), determinadas estatísticas têm distribuições conhecidas.
• Para testar a hipótese nula, basta comparar o valor dessas estatísticas com os pontos críticos apropriados de suas distribuições.
Inferências para uma amostra
)1,0(~)( 0 N
XnZ
10 ~)(
ntS
XnT
220
22 ~
)(n
iX
212
0
22 ~
)(
n
i XX
• Estatísticas de Teste:
(sob a hipótese nula)
Inferências para duas amostras
• X1, …, Xm i.i.d N(1, 12)
Y1, …, Yn i.i.d N(2, 22)
com Xi e Yj independentes, para todo i e j
(observações não pareadas)
• Também pode ser considerado o caso em que as observações são pareadas.
Testes e ICs para as médias
• Baseados nas estatísticas
(variâncias conhecidas ou grandes amostras)
(variâncias desconhecidas, mas iguais)• No caso geral, é necessário recorrer a um teste
aproximado.
)1,0(~)()(
22
21
21 N
nm
YXZ
22221 ~
2
)()(11
)()(
nm
ii
t
nm
YYXX
nm
YXT
Testes e ICs para variância
• Ho: 12 = 2
2 vs H1: 12 2
2
• Estatística do teste:
1,12
2
~
1)(
1)(
nmi
i
F
nYY
mXX
F
A distribuição F
• Sejam U e V v.a. independentes, com distribuição m
2 e n2, respectivamente. A
distribuição de
é chamada de distribuição F com (m, n) graus de liberdade.
nV
mUF
/
/
Exemplo
Inferência para m amostras
• Análise da Variância (ANOVA) com um único fator
• m grupos de observações
Xi1, Xi2
, …, Xi ni i.i.d. N(i, i
2), i = 1, .., I
• todas as observações independentes entre si.
• em geral, a análise é feita supondo que as variâncias de todos os grupos são iguais.
Teste para a igualdade das médias
• H0: = 2 = …= I
H1: nem todas as médias são iguais
• Estatísticas de interesse:
erros) dos quadrados dos (soma)(
os) tratamentdos quadrados dos (soma)()(
total)quadrados dos (soma)(
geral) (média ...
grupos) dos (médias ,...,1,.
2.
2...
2...
2..
1..
ii j ij
i iii j i
i j ij
I
i j ij
i
j iji
XXSQE
XXnXXSQTr
XXSQT
nn
XX
Iin
XX
Teste para a igualdade das médias
• Teorema SQT = SQTr + SQE Sob a hipótese nula, SQTr e SQE são independentes, com
distribuições 2I–1 e 2
N–I, respectivamente, onde
N = n1+…+nI é o número total de observações. Logo,
QME = SQE/(N–I) é um estimador não viciado da variância 2
.
INIF
INSQEI
SQTr
QME
QMTrF
,1~1
Tabela ANOVA
Fonte de Variação
Graus de liberdade
Soma dos Quadrados
Média dos Quadrados
F
Tratamentos
(Entre)
I–1 SQTr QMtr QMTr/QME
Erros
(Intra)
N–I SQE QME
Total N–1 SQT
Exemplo
Regressão Linear Simples
• Modelo:
Yi = 0 + 1xi + i, i = 1, …, n, onde1, 2, …, n i.i.d. N(0, 2)
• Problemas– Estimação pontual e intervalar de 0 e 1
– Testes de hipótese (o mais importante: teste de “relevância do modelo”).
– Predição
Estimação Pontual
• A estimação de máxima verossimilhança de 0 e 1
resulta da minimização de (Yi – 0 – 1xi)2
Os estimadores acima são os ENVUMV de 0 e 1
• O ENVUMV de 2 é:
XY
S
S
XX
YYXX
xx
xy
i
ii
10
21
ˆˆ
)(
))((ˆ
2
)ˆˆ(
2
)ˆ(
2
210
22
n
xY
n
YY
n
SSES iiii
Exemplo
Xi Yi
1 2
2 3
3 7
Relevância do Modelo
• Teste de utilidade do modelo
H0: 1 = 0 vs. H1: 1 0
• Pode-se empregar um teste relativo à distribuição de 1 (teste t) ou um teste ANOVA (generalizável para regressão múltipla)
• Estatísticas relevantes
2
2
210
2
)(
)ˆ(
)ˆˆ()ˆ(
YYSQT
YYSQR
xYYYSQE
i
i
iiii
Teste de Relevância do Modelo
• Teorema SQT = SQR + SQE Sob a hipótese nula, SQR e SQE são independentes, com
distribuições 21 e 2
n–2, respectivamente. Logo
A razão R2 = SQR/SQT é chamado de coeficiente de determinação.
2,12~
2
1
nF
nSQE
SQR
S
QMRF
Tabela ANOVA
Fonte de Variação
Graus de liberdade
Soma dos Quadrados
Média dos Quadrados
F
Regressão 1 SQR QMR QMR/S2
Erros n–2 SQE S2
Total n–1 SQT
Inferências relativas aos coeficientes
• Baseadas nas estatísticas abaixo:
22
00
211
~/
ˆ
~/
ˆ
n
xxi
n
xx
tnSxS
tSS
Intervalos de Predição
• Para predizer o valor de Y quando x = x*• Baseados em
22
10 ~)*(1
1
*)ˆˆ(
n
xx
t
Sxx
nS
xYT