econometria cap12 heterocedasticidade - unicamp...teste de breusch-pagan passos para efetuar o teste...
TRANSCRIPT
HeterocedasticidadeEconometria
Alexandre Gori Maia
Bibliografia Básica:- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12.
Ementa:• Definição;• Identificação: Análise Gráfica, Goldfeld-Quandt, Breusch-Pagan, White;• Correção: MQP e MQGF;• Estimadores Robustos para a Variância;
Teorema de Gauss-Markov1) Relação linear entre os regressores x e Y: O modelo só é válido para relações lineares.
2) Os valores de x são fixos em repetidas amostras, não aleatórios:Quem varia é o regressando, o regressor é fixo, qualquer que seja a amostra. Em outras palavras, dados os valores controlados de x, Y variará aleatoriamente segundo uma distribuição de probabilidade, com valor esperado dado por E(Y|x).
3) Esperança condicional dos erros igual a zero, ou seja, E(e|x)=0: É a mesma coisa afirmar que E(Y|x)=xi´b.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=s2
Os erros são homocedásticos, ou seja, sua variância é uma constante.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0: Não há relação entre valores dos erros.
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Heterocedasticidade - Definição
Homocedasticidade
Homocedasticidade:A variância dos erros e, condicionada aos valores das variáveis explanatórias, será constante.
Heterocedasticidade:A variância dos erros será diferente para cada valor condicional de Xji.
221 ),...,,/( s=
iii ki XXXeVar
Heterocedasticidade
221 ),...,,/( iki iii
XXXeVar s=
Y
XjX1
E(Y1)
X2
E(Y2)Var(e2)=s2
Var(e1)=s2
Y
XjX1 X2
Var(e2)=s22E(Y1)
Var(e1)=s21
E(Y2)
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Heterocedasticidade - CausasPrincipais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente tendência à heterocedasticia. Por exemplo, renda e poupança.
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser devida à omissão de importantes variáveis no modelo.
- Transformação dos dados: a transformação das variáveis (por exemplo, proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo ao invés de linear) pode eliminar a heterocedasticidade.
2)( iieVar s=iii eXY ++= ba
iii eXY ++= ba iiii eXXY +++= 221 bba
iii eXY ++= ba iii eXY ++= )ln()ln( ba
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Consequências - IneficiênciaIneficiência dos Estimadores de MQONa presenção de heterocedasticidade nos erros, os estimadores de MQO continuam sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não possuem mais variância mínima). Em outras palavras, seja b o estimador de MQO, então existe outro estimador b* tal que:
Homocedasticia
Y
X
Intervalo de Variação das
estimativas de MQO
Intervalo de Variação das
estimativas de outro método
Heterocedasticia
Y
X
Intervalo de Variação das
estimativas de MQO
Intervalo de Variação das
estimativas de um método
mais eficiente
)ˆ(*)ˆ( bb VarVar <
^^
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Consequências – TendenciosidadeTendenciosidade da Variância dos Estimadores:Outra importante consequência da heterocedasticidade é o viés do estimador da variância de !", mesmo para amostras grandes (inconsistência). Como resultado, as estatísticas de teste t e F deixam de ser válidas, pois dependem da variância do estimador. Em outras palavras, na presença de heterocedasticidade teremos:
Seja o modelo: iii eXY ++= ba
Pelo MQO:åå
=
== ni
2i
n
i ii
x
yx
1
1b eå =
= n
i2ix
S1
22ˆ
sb
No caso de heterocedasticia:
No caso de homocedasticia:
não viesado na ausência de heterocedasticidade e
viesado na sua presença
)ˆ()( 2ˆ bb VarSE ¹
2)( s=ieVarå =
= n
i ixVar
12
2)ˆ( sb
2)( iieVar s=2
12
122
)()ˆ(åå
=
== ni i
n
i ii
x
xVar
sb
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
IdentificaçãoPrincipais testes para se detectar a heterocedasticidade:
Análise gráfica: ê2 ´ Xj
Teste Goldfeld-QuandtIdentificação
Testes Estatísticos
Teste de Breusch-Pagan
Teste de White
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Análise Gráficaê2
Homocedasticidade
A dispersãodos resíduos é a mesma aolongo de X
X
ê2Heterocedasticidade
A dispersãodos resíduos é
uma funçãolinear de X
X
ê2Heterocedasticidade
A dispersãodos resíduosé uma funçãoquadrática de
X
X
ê2Heterocedasticidade
A dispersão dos resíduos cresce
de maneiraquadrática com os valores de X
constanteσ 2 = i22
i Xσσ =
2i2i1
2i XαX ασ +=
2i
22i Xσσ =
X
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Análise GráficaSejam os dados de 40 famílias para gastos com alimentação (Y) e renda (X):
A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de heterocedasticidade, em uma relação aparentemente linear.
iii eRendaAlimentGasto ˆ13,08,40 ++=i
22i Xσσ =
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Goldfeld-QuandtY
X
Sejam os valores da amostra:
ïî
ïíì
<
=22
211
22
210
σ: σH
σ: σH
Passos para efetuar o teste de Goldfeld-Quandt1- Ordenar as observações da amostra de acordo com os valores de X;2- Omitir c observações centrais para dar mais poder ao teste (c costuma ser igual a 4 para n=30 e c=10 para n=60) e separar observações em duas subamostras de (n-c)/2 observações; 3- Ajustar uma regressão para cada subamostra (cada regressão terá k variáveis independentes);4- Testar hipótese da igualdade dos erros quadráticos médios a partir da estatística F.
Regressão 1
Regressão 2
A omissão de c observações centrais objetiva acentuar a diferença entre o grupo com variância pequena (SQReg1) e com variância grande (SQReg2).
glSQResglSQResF//
1
2= )1(2
+--
= kcnglonde
glglF ,
Fp
Y1 Y2 ... YnX1 X2 ... Xn Onde: X1<X2<...<Xn
Para testar a hipótese nula da homocedasticia:
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Goldfeld-Quandt
99,47,5269,2629
ˆˆ21
22 ===
ssF
Regressão 1
Regressão 2
ïî
ïíì
<
=22
211
22
210
σ: σH
σ: σH
Amostra 1
iii eRendaAlimentGasto ˆ18,06,12 ++=
Das 40 observações originais, foram eliminadas 6 observações centrais para dar mais poder ao teste. Restaram dois subconjuntos com 17 observações cada.
Amostra 2
iii eRendaAlimentGasto ˆ09,01,75 ++=Fonte gl SQ QM F p
Regressão 1 5967,2 5967,2 11,33 0,0042Resíduos 15 7900,0 526,7Total 16 13867,2
Fonte gl SQ QM F pRegressão 1 2308,6 2308,6 0,88 0,3636Resíduos 15 39449,1 2629,9Total 16 41757,7
estatística de teste:
15,15F
99,40017,0
Rejeita-se H0, ou seja, pode-se afirmar que há diferença entre as variâncias
(heterocedasticidade) com uma probabilidade de erro de apenas 0,17%
E para calcular a probabilidade de erro do tipo I:
Sejam os gastos de 40 famílias com alimentação em função da renda:
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Breusch-Pagan
Passos para efetuar o teste de White1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes do modelo original; 3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de variáveis explanatórias;
2auxRnLM ´=
2kc
2auxRn´
p
ê2
Xj
iiii eXXY +++= 2211 bba
iiii uXXe +++= 221102ˆ ddd
Onde k é o número de variáveis explanatórias, R2aux o coeficiente de
determinação do ajuste auxiliar e n o número de
observaçõesîíì
¹==
0:0:
1
210
jHH
ddd
Seja o modelo de RLM com k=2:
Par verificarmos se os resíduos quadráticos têm relação com os regressores:
Para testar a hipótese nula da homocedasticia:
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de Breusch-Pagan - ExemploDo ajuste original por MQO obtivemos:
iii eRendaAlimentGasto ˆ13,08,40 ++=
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
iii uRendae ˆ21,55,279,2ˆ2 ++-=
O teste de hipóteses será dado por:
îíì
¹=0:0:
11
10
dd
HH 0,12301,0402 =´=´ auxRn
21c
0,12
0005,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação estaríamos sujeitos a uma chance de erro de apenas 0,05%.
Sejam os gastos de 40 famílias com alimentação em função da renda:
301,02 =auxRiii uRendae ++= 102ˆ dd
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de White
Passos para efetuar o teste de White1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes do modelo original, seus quadrados e produtos cruzados; 3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de variáveis explanatórias do ajuste auxiliar;
2auxRnLM ´=
2hc
2auxRn´
p
ê2
Xj
iiii eXXY +++= 2211 bba
iiiiiiii uXXXXXXe ++++++= 225
21421322110
2ˆ ddddddOnde h é o número de
variáveis explanatórias, R2aux o coeficiente de
determinação e n o número de observações, todos
referentes ao ajuste auxiliar
îíì
¹===
0:0...:
1
510
jHH
ddd
Seja o modelo de RLM com k=2:
Para verificar se os resíduos quadráticos têm relação com os regressores, seus quadrados e seus produtos cruzados:
Para testar a hipótese nula da homocedasticia:
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Teste de White - Exemplo
Do ajuste original por MQO obtivemos:
iii eRendaAlimentGasto ˆ13,08,40 ++=
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
O teste de hipóteses será dado por:22c
58,14A probabilidade de erro ao rejeitar H0 é de apenas 0,07%. Em
outras palavras, há fortíssimas evidências para afirmar que os erros são heterocedásticos pois, ao fazermos tal afirmação, estaríamos
sujeitos a uma chance de erro de apenas 0,07%.
Sejam os gastos de 40 famílias com alimentação em função da renda:
îíì
¹==
0:0:
1
210
jHH
ddd
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
"#$ = 1921 − 7,413."/01# + 0,009."/01#$ + 45#
"#$ = 67 +68 ."/01# +6$ ."/01#$ + 5#.9:;$ = 0,365
/×.9:;$ = 40×0,365 = 14,6 0,0007
Correção HeterocedasticidadeDada a equação de RLM:
222
1
2
22
21
0000...00000000
0000...00000000
)()( ss
s
ss
Veee =
úúúú
û
ù
êêêê
ë
é
=
úúúúú
û
ù
êêêêê
ë
é
==
nn
T
v
vv
EVar
eXβy +=A equivalente matricial:
Haverá heterocedasticidade quando:
A equação de RLM equivale à transformação:
A equação matricial equivale à trasnformação :
22)()( iii eEeVar s==Que pode ainda ser representado por:
ii veE 22 )( s=onde o fator vi indica
como varia a variância de e para cada observação i
A nova equação será homocedástica, pois:
Haverá heterocedasticidade quando:
ΛeΛXβΛy += onde
úúúúú
û
ù
êêêêê
ë
é
=
2
2
1
10000...0000100001
v
vv
Λ
A nova equação será homocedástica pois:
22)( ss IΛVΛΛΛee ==TE
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
!" = $ + &'(') + ⋯+ &+(+) + ,"
!"∗ = $ + &'(')∗ + ⋯+ &+(+)∗ + ,"∗!"#"= % 1
#"+ ()
*)+#"+ ⋯+ (-
*-+#"+ ."
#"
. ,"/"
0= . ,"0
/"= 1/". ,"0 = 20
Mínimos Quadrados PonderadosPonderação da variáveis:Uma vez conhecida a matriz V de variâncias e covariâncias do erros de um modelo de RLM, podemos obter os MELNV transformando as variáveis originais. Em outras palavras, seja o modelo:
eXβy += em que
Então: ΛeΛXβΛy += em que
Apresentará erros homocedásticos, pois:
1-= VΛΛT
22)( ss IΛVΛΛΛee ==TE
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
222
1
0000...00000000
)( ss Ve =
úúúú
û
ù
êêêê
ë
é
=
nv
vv
Var
úúúúú
û
ù
êêêêê
ë
é
=
2
2
1
10000...0000100001
v
vv
Λ e
Mínimos Quadrados PonderadosEstimadores de MQP:Seja o modelo de RLM:
eXβy += com heterocedasticidade dada por
Alternativamente, eu posso obter os estimadores de MQP diretamente por:
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Caso a matriz ! seja conhecida, eu posso aplicar MQO às variáveis transformadas !" e !# para estimar os coeficientes $.
%&'()) = ,-.
Então ΛeΛXβΛy += será homocedástico, pois %&'(!)) = /-.
yVXXVXΛyΛXΛXΛXβ 1111 )()(ˆ ---- == TTTTTT
Esse método é denominado de Mínimos Quadrados Ponderados (MQP), um caso específico do método de Mínimos Quadrados Generalizados (MQG). Os estimadores de MQP são não tendenciosos e os mais eficientes (MELNV) na presença de heterocedasticidade.
Raciocínio análogo é válido para obter os estimadores da variância:yVXβyVy 11 ˆSQRes -- -= TTT e 2112
ˆ ˆ)(S sb--= XVXT
MQP com V conhecida - Exemplo
2)( sii XeVar =
As estimativas de MQO são:
Supondo que:
Para obter as estimativas de MQP, aplicamos MQO ao modelo transformado:
Sejam os gastos de 40 famílias com alimentação em função da renda:
22
40
1
...0.........0...
)( ss V=úúú
û
ù
êêê
ë
é=
X
XeVar
iii eRendaAlimentGasto ˆ13,08,40 ++=
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
!"#$%&'()%&*+(
= - 1)%&*+(
+ 0 )%&*+()%&*+(
+ %()%&*+(
ΛeΛXβΛy +=1-= VΛΛTem que
As estimativas de MQP seriam:
!"#$%&'( = 32.0 + 0.14)%&*+( + %(∗As estimativas de MQP são não tendenciosas e as mais eficientes. O estimador da variância também é não tendencioso. Mas a validade dessas estimativas depende de um pressuposto forte, que a variância dos erros seja de fato uma função linear da renda.
MQGF - V DesconhecidaMínimos Quadrados Generalizados Factíveis (MQGF):Seja o modelo de RLM:
eXβy += com heterocedasticidade dada por: 2)( sii veVar =
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora denominada V, para obtermos os estimadores consistentes (embora possam ser viesados) de Mínimos Quadrados Generalizados Factíveis:
yVXXVXβ 111 ˆ)ˆ(ˆ ---= TT
Caso o fator vi seja desconhecido, podemos estimá-lo a partir da relação da dispersão dos resíduos de MQO com as variáveis X do modelo. Há várias especificações que podem ser assumidas. Uma estratégia simples é assumir que a dispersão seja uma função logarítmica de X:
*11
*0
2 ...)ˆln( ikki uXXeii++++= ddd
A transformação exponencial garante que todas as estimativas de !" sejam positivas (variância não assume valores negativos!).
ikki XXi ev ddd ˆ...ˆˆ 11
*0ˆ +++
=
^
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
MQGF com V Desconhecida - Exemplo
As estimativas de MQO foram:
Supondo agora que:
O fator de correção vi pode então ser estimado por:
Sejam os gastos de 40 famílias com alimentação em função da renda:
indaRe
i uee i102 dd +=
iii eRendaAlimentGasto ˆ13,08,40 ++=
*1
*0
2)ln( iii undaRee ++= dd
iii undaRee ˆ004,0363,3)ˆln( 2 ++= indaRei ev 004,0363,3ˆ +=
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
!" =
As variáveis transformadas seriam:$%&'()*"
+!"= , 1
+!"+ / 0()12"
+!"+ ("
+!"em que345 = 3456 + 347 34834 = 39:;
E as estimativas de MQGF seriam:$%&'()*" = 22,6 + 0.160()12" + ("∗
As estimativas de MQGF são válidas apenas para amostras grandes (consistentes). Nesse caso, asestimativas de MQGF seriam (assintoticamente) também mais eficientes que as de MQO. Mas, para amostras pequenas, podem ser tendenciosas.
Estimadores RobustosEstimadores da Variância Robustos à Heterocedasticidade - White:Seja o modelo de RLS:
iii eXY ++= ba
Embora os estimadores de MQO para b continuem não viesados, os estimadores de suas variâncias seriam viesados.Um estimador robusto da variância do estimador !", ou seja, igualmente válido na presença ou não de heterocedasticidade, pode ser dado por:
No caso de uma RLM teríamos:
Esse estimador robusto à heterocedasticidade, atribuído a White, é válido(não tendencioso) assintoticamente. Para amostras pequenas, as estatísticas t e Fbaseadas no estimador robusto não serão necessariamente válidas.
com heterocedasticidade dada por: 2)( sii veVar =
212
122
)()ˆ(åå
=
== ni i
ni ii
x
xVar
sb
212
122
2ˆ
)(
ˆ
åå
=
==* n
i i
n
i ii
x
exSb
ikj jji eXY
i++= å =1
ba 212
122
2ˆ
)ˆ(
ˆˆ
åå
=
==* ni j
ni ij
i
i
j u
euSb
Onde ûj é o resíduo do ajuste de Xj em função das demais variáveis independentes
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto
Estimador Robusto - Exemplo
As estimativas de MQO foram:
Caso os erros sejam homocedásticos, a estimativa de MQO para Var(b ) seria:
Finalmente, a estatística t para testar a significância de b seria:
Sejam os gastos de 40 famílias com alimentação em função da renda:
iii eRendaAlimentGasto ++= ba^
iii eRendaAlimentGasto ˆ13,08,40 ++=
2
12
22ˆ 031,000093,0
463.532.1429.1ˆ
====å =
n
i ixS
sb
Por sua vez, uma estimativa robusta à heterocedasticidade para Var(b) seria:^
222
12
122
2ˆ 038,00015,0
)463.532.1(919.453.421.3
)(
ˆ====
åå
=
=* n
i i
n
i ii
x
exSb
36,3038,013,0
==tEmbora haja evidências de heterocedasticidade no modelo, devemos ter cautela na interpretação desse teste t, já que o estimador robusto pode não ser válido para amostras pequenas (n=40).
Definição Análise Gráfica
Goldfeld-Quandt
Breusch-Pagan White MQP MQGF Estimador
Robusto