erros de especificação - eco.unicamp.br · teste reset de especificação viés de omissão...
TRANSCRIPT
Erros de Especificação CE 731 – Econometria II
Prof. Alexandre Gori Maia
Instituto de Economia - UNICAMP
1
Ementa
Erro de especificação
Teste RESET de especificação
Viés de Omissão
Variável proxy
Bibliografia
WOLDRIDGE, J.M. (2006). Introductory Econometrics: a Modern Approach. Cap. 9.
Erro de Especificação
2
Seja o modelo de regressão inicialmente dado por:
ii eXXYii 2211
Haverá erro de especificação da forma funcional caso a correta relação entre as variáveis seja, por exemplo, dada pelas funções:
ii eXXXYiii 2
32211 2
ii eXXYii )ln()ln( 2211
ii eXXXXYiiii 2132211
Em qualquer das situações, a especificação inadequada levará a estimativas tendenciosas e inconsistentes dos coeficientes.
Erro de Especificação - Exemplo • Sejam duas especificações propostas para o preço das residências:
3
A termo quadrático do tamanho da propriedade mostrou-se significativo, sugerindo a
não linearidade da relação entre preço e tamanho.
iiiii ebdrmssqrftlotsizeprice 321
iiiiiii esqrftlotsizebdrmssqrftlotsizeprice 2
5
2
4321
• Os ajustes seriam dados por:
• As estimativas seriam:
Erro de Especificação - Exemplo • Podemos ainda realizar o teste de contribuição conjunta ( teste de contribuição marginal), que possui a vantagem de não ser afetado pela multicolinearidade entre os regressores quadráticos:
4
O comando test testa a hipótese nula que os coeficientes associados
às variáveis lotsize2 e sqrtft2 são conjuntamente iguais a 0.
• O teste de contribuição marginal pode realizado pela estatística F:
Como a contribuição de uma das variáveis
já se mostrou isoladamente significativa, o
teste F para a contribuição conjunta
apenas reforça a contribuição significativa
de pelo menos um dos regressores
quadráticos.
Y
jXj
X22
X12
Teste RESET (Ramsey) de Especificação
5
Seja o modelo de regressão inicialmente dado por:
ii eXXYii 2211
Uma maneira de avaliarmos a necessidade de, por exempo, termos quadráticos e combinações das variáveis independentes, seria ajustar o modelo:
ii eXXXXXXYiiiiii 2
5
2
432211 2121
E testar a hipótese 0: 5430 H
Para economizarmos graus de liberdade, podemos alternativamente ajustar o modelo:
^ ^ ^ ^ ^ Y
iiii eYYXXYii
3
4
2
32211ˆˆ
E testarmos as hipóteses: 0: 430 H
Este teste é denominado Ramsey Regression Equation Specification Error Test
(RESET).
Teste de Ramsey’s Reset - Exemplo • Sejam a especificação :
6
iiiii ebdrmssqrftlotsizeprice 321
• Utilizamos a opção reset do comando model ara testar a existência de erros de especificação:
Como o teste mostrou-se significativo, há
evidências significativas para afirmar a
existência de erro de especificação no
modelo. Termos adicionais seriam
necessários, ou transformação das
variáveis originais.
iiiiiiii eYYYbdrmssqrftlotsizeprice 4
6
3
5
2
4321ˆˆˆ
0: 6540 H
• Tendo:
A opção reset incorpora até o quarto
expoente no valor previsto do regressando.
^ ^ ^ ^
^ Y
Viés de Omissão - Conceito
7
• Suponha 6 parcelas de terras que apresentam 3 tipos distintos de qualidade do solo (Q=1..10, de muito ruim até muito bom);
• A produção agrícola (Y) tenderá a ser maior nos solos de melhor qualidade;
• Imagine agora que sejam aplciadas quantidades distintas de um fertilizante totalmente ineficaz (X) em cada parcela, sem qualquer impacto na produção (Y);
Q=2 Q=2 Q=4 Q=4 Q=6 Q=6
Y=2000 Y=2200 Y=4200 Y=4000 Y=6200 Y=6000
X=2 X=4 X=6 X=8 X=10 X=12
• Se relacionarmos a quantidade deste fertilizante ineficaz (F) com a produção (Y), sem considerar a qualidade do solo, podemos enganosadamente pensarmos que sua quantidade influencia na produção:
Y=2000 Y=2200 Y=4200 Y=4000 Y=6200 Y=6000
X=2 X=4 X=6 X=8 X=10 X=12
Produções Y altas estão associadas a elevadas quantidades de X, o que não significa que X necessariamente determine Y.
Viés de Omissão - Definição • Suponha que a real relação entre as variáveis na população seja:
8
ii eXXY 2211
• Mas, erroneamente, se ajusta o modelo:
ii eXY 11
~~
• A omissão indevida do regressor X2 no modelo causará viés na estimativa de 1. Pode-se demonstrar que: ~
1211
~)
~( E onde
1102
~~XX
• Assim, o viés em 1 dependerá de 2 e do sentido da relação entre X1 e X2. De maneira geral:
Corr (X1, X2) > 0 Corr (X1, X2) < 0
2 > 0 Viés Positivo Viés Negativo
2 < 0 Viés Negativo Viés Positivo
Viés de Omissão - Exemplo
9
• O viés de omissão pode ser identificado teoricamente, identificando possíveis variáveis omitidas que estejam relacionadas aos regressores;
• Podemos ainda realizar um análise de sensibillidade, verificando em que media a inclusão de regressores (observáveis) no modelo interferem nos coeficientes angulares;
A inclusão da variável sqrtf reduziu o efeito parcial da variável lotsize. Ou seja, o efeito da variável lotsize tende a apresentar um viés positivo caso a variável sqrtft não seja considerada no modelo .
Variável Proxy
10
Seja o modelo de regressão definido por:
ii eXXXYiii 332211
Caso X3 não seja observado, a exclusão deste regressor tornará as estimativas de β1 e β2 tendenciosas e inconsistes (a magnitude dependerá das relações entre X1, X2 e X3);
Uma alternativa é utilizar um variável proxy Z que tenha relação com X3, mas não esteja relacionada aos erros e. Ou seja:
ii uZXi
103 e 0),cov( ii eZ
O objetivo é unicamente estimar de maneira não tendenciosa os coeficientes β1 e β2, uma vez que β3 não poderá ser estimado
isoladamente:
iiii euZXXYii
)( 1032211
)()( 313221103 iiii ueZXXYii
Variável Proxy - Exemplo • Suponha que a renda seja dada por:
11 Com a omissão da variável IQ, proxy para a habilidade, a estimativa do coeficiente
associado à variável educ tende a superestimar o imapcto da escolaridade na renda. Isto
porque a escolaridade teria uma relação positiva com a habilidade que, por sua vez,
teria um impacto isolado positivo na renda.
iiiii eabilexpereducwage 321)ln(
• Onde a habilidade (abil) não seja observada.
• Como alternativa, podemos utilizar o QI (IQ) da pessoa como variável proxy:
Exercícios 1) A partir do arquivo Dados_Salarios.XLS, pede-se
a) Ajuste o logaritmo do salário como uma função linear da escolaridade e experiência profissional;
b) Verifique a existência de erro de especificação com o teste RESET.
c) Incorpore o quadrado da experiência profissional e compare as estimativas com as do modelo anterior;
d) Verifique a existência de erro de especificação no modelo com o termo quadrático;
12