parte 4: inferencia
TRANSCRIPT
Aula 07
Gujarati e Porter, 2011 – Capítulos 7 e 8
Heij et al., 2004 – Capítulo 3
Análise de Regressão Linear Múltipla IV
2
Exemplo
Tomando por base o modelo
a senhorita Jolie, gerente do departamento de RH da
empresa TEMCO, desconfia que ao menos um dos
regressores é relevante para explicar a variável resposta.
Utilizando um nível de significância de 1%, conduza um teste
de hipóteses adequado.
iiiii prevanosempeducsalario explog 3210
re de zerometro difeos um parâ: pelo menH
βββ:H
A
0 3210
Modelo
iiiii prevanosempeducsalario explog 3210
Hipóteses de Interesse
Exemplo
SST = SSR + SSE
Se H0 for verdadeira, espera-se que SSE seja pequena e SSR grande.
5
;0 , 2 1
2
2 k(k) βse βχ~
σ
SSE.
É possível demonstrar que, sob certas condições, as v.a.
SSR, SSE e SST apresentam as seguintes características:
; 1 2
12 knχ~σ
SSR.
tes.independen são SSE e SSR 3.
Teste F
Consequências:
2
2 11 (a) σMSRE
kn
SSRE kn
σ
SSRE
Logo, MSR é um estimador não-viesado de s2
Se 1 = 2 = ... = k = 0, então MSE = SSE/k é um estimador não-viesado de
s2.
2
12σMSEE
k
SSEE 0 k,
SSEE (b)
kββse
s
Teste F
7
Logo, SST/(n-1) é estimador não-viesado de s2
Teste F
222
1
11
,0 Se (c)
) σ(n- σkσkn
SSEESSRESST E
ββ k
Consequências: (cont.)
8
12
2
1
1
1
1
,0 Se (d)
kn-,k
k
F~MSR
MSE
kn-
SSRk-
SSE
kn-
SSR/ σk
SSE/ σ
F
ββ
Teste FConsequências: (cont.)
9
1k-n
SSRMSR
k
SSEMSE
Fonte de
variação SS gl MS F
Regressão SSE k MSE MSE/MSR
Erro SSR n-(k+1) MSR
Total SST n-1
Teste FConsequências: (cont.)
10
1)(k-n ,k
H sob
2
2
F ~
1)(k-n)R-(1
(k)R
MSR
MSEF
0
Fc
Região crítica:
Teste FConsequências: (cont.)
11
Exemplo
Tomando por base o modelo
a senhorita Jolie, gerente do departamento de RH da
empresa TEMCO, desconfia que ao menos um dos
regressores é relevante para explicar a variável resposta.
Utilizando um nível de significância de 1%, conduza um teste
de hipóteses adequado.
iiiii prevanosempeducsalario explog 3210
12
re de zerometro difeos um parâ: pelo menH
βββ:H
A
0 3210
Modelo
iiiii prevanosempeducsalario explog 3210
Hipóteses de Interesse
Resolução do Exemplo
14
38,42Fobs
Fcrit
285,4)42,3,99.0(@
)01,0(
]42;3[ qfdistFFEviewsNo
crit
critobs0 F F se H Rejeito
Resolução do Exemplo
re de zerometro difeos um parâ: pelo menH
βββ:H
A
0 3210
15
valor-p se H Rejeito 0
p-valor
Fobs
13
]42;3[ 1007,9)42,3,38.42(@1 cfdistFFPvalorpEviewsNo
obs
re de zerometro difeos um parâ: pelo menH
βββ:H
A
0 4320
Resolução do Exemplo
16
Voltando ao Exemplo
A senhorita Jolie sabe que, a 1% de significância, ao menos
um dos regressores é relevante para explicar a variável
resposta. Todavia, a senhorita Jolie desconfia que expprev
seja irrelevante, dado que os funcionários da TEMCO passam
por um processo de treinamento assim que são admitidos na
empresa. Dessa forma, adotando um nível de significância de
1%, existem evidências favoráveis à desconfiança da gerente
de RH?
0
0
3
30
β:H
β:H
A
Modelo
iiiii prevanosempeducsalario explog 3210
Hipóteses de Interesse
Voltando ao Exemplo
Já foi visto que
~ 10
)1(
ˆ
2
2; N
RSQT
ββ
jj xx
jj
s
e como s2 é um parâmetro desconhecido, então deverá ser
estimado. Dessa maneira, será necessário estudar a
distribuição de probabilidades da nova v.a. resultante.
Teste t
Nos slides anteriores foi dito que SSR, SSE e SST são v.a. e,
ainda, não é difícil provar que, sob certas condições:
;~σ
SSR 2
12 kn
Assim,
MSR é um estimador não-viesado de s2
Teste t
2
2 11 σMSRE
kn
SSRE kn
σ
SSRE
21
Assim, substituindo s2, pelo seu estimador, MSR, na
expressão do slide 19, temos que
em que
j
jX
depadrãoerroRsn
j
j
s
s
ˆ :)1(1
ˆˆ
22
2
ˆ
regressãodapadrãoerroMSR :ˆˆ 2 ss
Teste t
)1(
ˆ
2
jj xx
jj
RSQT
MSR
ββ
22
Logo, para testarmos as hipóteses
H0: j = b (em particular b = 0)
HA: j b (HA: j < b ou HA: j > b),
utilizaremos o fato que, sob H0,
e construiremos a região crítica de acordo com a hipótese
alternativa adotada.
1
ˆ
t~ˆ
ˆ
kn-
j
j
bβ
s
Teste t
0
0
3
30
β:H
β:H
A
Modelo
iiiii prevanosempeducsalario explog 3210
Hipóteses de Interesse
Voltando ao Exemplo
25
698,2)42,995.0(@
)005,0(
]42[
)005,0(
]446[ qtdisttttEviewsNo
crit
cri to b s0 t t se H Rejeito
/2/2
tcrit- tcrit
0
0
3
30
β:H
β:H
A
Resolução do Exemplo
51004100053640
00027360,
,
,tobs
26
/2/2
tcrit- tcrit
valo r-p se H Rejeito 0
Resolução do Exemplo
0
0
3
30
β:H
β:H
A
51004100053640
00027360,
,
,tobs
6127,0)510041,0(@12510041,02
]42[ ctdisttPvalorpEviewsNo
27
Voltando ao Exemplo
Tomando por base o modelo
existem evidências sobre a relevância da variável educ, com
99% de confiança? Toda a sua análise deve ser baseada na
construção de um intervalo de confiança.
iiiii prevanosempeducsalario explog 3210
29
Intervalo de Confiança para j
Prova-se que
j
kn-jj tββIC
s ˆ2/
1ˆˆ);(
é um intervalo de confiança para o parâmetro j, com
coeficiente de confiança de 1-.
em que
jβado a o assoacierro padrãj
ˆˆ ˆ s
0
0
1
10
β:H
β:H
A
Modelo
iiiii prevanosempeducsalario explog 3210
Hipóteses de Interesse
Voltando ao Exemplo
698,2)42,995.0(@
)005,0(
]42[
)005,0(
]446[ qtdisttttEviewsNo
crit
/2/2
tcrit- tcrit
Resolução do Exemplo
068924,0;021126,0008858,0698,2045025,0);(
023899,0
jβIC
0
0
1
10
β:H
β:H
A
Como o IC não engloba o zero, então, com 99% de confiança, existem evidências
contrárias à hipótese nula.
33
A administração de um hospital particular deseja estudar a
relação entre a satisfação dos pacientes em relação ao
atendimento do hospital (escore de 0 a 100) em função do índice
de severidade da doença do paciente (escore de 0 a 100), do
custo hospitalar pago pelo paciente (em milhares de reais) e do
nível de ansiedade do paciente (escore de 0 a 5). Para o estudo
foi coletada uma amostra aleatória de 23 pacientes atendidos no
último mês e os resultados estão no arquivo sat_pacientes.xls.
Exercício Completo
34
a) Faça a análise descritiva dos dados obtidos em função do
problema a ser analisado.
b) Proponha e estime os parâmetros de um modelo de regressão
adequado. Escreva os resultados na forma usual. Interprete
as estimativas dos parâmetros do modelo em termos do
problema em questão.
c) Calcule uma medida de qualidade do ajuste do modelo e
interprete-a em termos do problema em questão.
d) Qual(is) das variáveis explicativas utilizadas no modelo
influenciam a satisfação dos pacientes? Justifique sua
resposta com base numa técnica inferencial adequada e use
um nível de significância de 10%.
Exercício Completo
35
e) Estime um novo modelo com base nos resultados obtidos no
item (d).
f) O diretor do hospital afirmou que o aumento de uma unidade
no índice de severidade da doença de um paciente provoca
um decréscimo de pelo menos 1,5 no escore de satisfação
esperado. Verifique se esta afirmação procede com 90% de
confiança.
g) Com base num intervalo com 95% de confiança, verifique se
há um decréscimo médio de 2 unidades no escore de
satisfação com o aumento do custo hospitalar em mil reais.
Exercício Completo
36
h) (DESAFIO) O diretor ainda afirmou que o escore de satisfação
decresce em média 2 unidades quando se aumenta o índice
de severidade em 1 unidade e o custo hospitalar em mil reais,
conjuntamente. Teste a afirmação do diretor com 10% de
significância.
Dica: Leitura complementar!!!!
Exercício Completo
37
Teste de Hipóteses sobre uma única
Combinação Linear de Parâmetros (teste t)
LEITURA COMPLEMENTAR
38
Exemplo
Seja a equação de regressão múltipla,
Verifique, a partir da formulação e construção de um teste de
hipóteses, se a variável educ apresenta um impacto superior
ao da variável produtividade na variável resposta. Nesse
exemplo, utilize o banco de dados TEMCOPROD.wf1.
adeprodutivideducsalário 210
40
Teste de hipóteses sobre uma única
combinação linear de parâmetros
) ou ( :H
0:H
A
0
jijiji
jiji
ββββββ
ββββ
Estatística do teste
)ββse(
)ββ(t
ji
ji
ˆˆ
0ˆˆ
)ββv(oC)βse()βse()ββse( jijijiˆ,ˆˆ2ˆˆˆˆ 22
Sejam as hipóteses
41
Teste de hipóteses sobre uma única
combinação linear de parâmetros
ALTERNATIVAS DE SOLUÇÃO
A) Calcular todos os componentes do erro padrão (o software
Eviews gera a matriz de variâncias e covariâncias para os
estimadores dos parâmetros do modelo de regressão. Lembra
onde está?).
)ββv(oC)βse()βse()ββse( jijijiˆ,ˆˆ2ˆˆˆˆ 22
42
Teste de hipóteses sobre uma única
combinação linear de parâmetros
ALTERNATIVAS DE SOLUÇÃO (cont.)
B) Trabalhar com um modelo transformado para obter o
resultado diretamente
Seja
= i – j,
por exemplo, j pode ser escrito como j = i – e,
substituindo este resultado na equação de regressão
múltipla, podemos testar H0: = 0, contra uma alternativa
apropriada.
43
Teste de hipóteses sobre uma única
combinação linear de parâmetros
C) Utilizar o menu do Eviews para solucionar o problema (teste
de restrições nos coeficientes).
D) Trabalhar com uma hipótese linear geral (R = r) e usar, por
exemplo, o MATLAB.
E) Estimar o modelo restrito e o irrestrito e, através dos
coeficientes de determinação de ambos, conduzir o teste de
hipóteses de interesse.
ALTERNATIVAS DE SOLUÇÃO (cont.)
44
Escrevendo = 1 –2, vem que
0
0
:
:
AH
0H
Voltando ao Exemplo (solução B)
:H
0:H
21A
21210
ββ
ββββ
Hipóteses
adeprodutivideducsalário 210
Modelo
45
Mas, = 1 – 2 1 = + 2, e substituindo este resultado no
modelo proposto, vem que
)(
)(
20
220
220
210
adeprodutivideduceducsalário
adeprodutivideduceducsalário
adeprodutivideducsalário
adeprodutivideducsalário
Voltando ao Exemplo (solução B)