regressão - aula 04/04

43

Upload: rodrigo-de-sa

Post on 29-Jun-2015

8.559 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Análise de Regressão:Relaxando as hipóteses

Rodrigo de Sá

Fundação de Economia e Estatística, 2011

Page 2: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Livro texto

Damodar GujaratiEconometria Básica3ª ed. 2005.

Page 3: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Multicolinearidade

Uma das hipóteses do modelo clássico de regressão linear éa ausência de multicolinearidade entre as variáveisexplicativas.

Multicolinearidade perfeita: X1 = a + bX2.

Variáveis correlacionadas, mas não perfeitamente:X1 = a + bX2 + u.

Consequências da multicolinearidade perfeita:

O valor dos coe�cientes da regressão é indeterminado;A variância desses estimadores é in�nita.

Page 4: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Multicolinearidade

Uma das hipóteses do modelo clássico de regressão linear éa ausência de multicolinearidade entre as variáveisexplicativas.

Multicolinearidade perfeita: X1 = a + bX2.

Variáveis correlacionadas, mas não perfeitamente:X1 = a + bX2 + u.

Consequências da multicolinearidade perfeita:

O valor dos coe�cientes da regressão é indeterminado;A variância desses estimadores é in�nita.

Page 5: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Multicolinearidade

Uma das hipóteses do modelo clássico de regressão linear éa ausência de multicolinearidade entre as variáveisexplicativas.

Multicolinearidade perfeita: X1 = a + bX2.

Variáveis correlacionadas, mas não perfeitamente:X1 = a + bX2 + u.

Consequências da multicolinearidade perfeita:

O valor dos coe�cientes da regressão é indeterminado;A variância desses estimadores é in�nita.

Page 6: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Multicolinearidade

Figura: Multicolinearidade & Diagramas de Venn

Page 7: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Possíveis fontes de multicolinearidade

Método de coleta de dados: uma amostra que cubra umapequena parte dos valores possíveis de X .

Restrições presentes no modelo ou na população: se asvariáveis explicativas forem renda e consumo de energiaelétrica, na amostra elas serão altamente correlacionadaspor que pessoas com maior renda em geral consomem umaquantidade maior de energia elétrica.

Especi�cação do modelo: regressão polinomial quando ointervalo a que pertence o X é pequeno.

Em séries temporais, tendência comum: todas as variáveisexplicativas crescem ou decrescem com o passar do tempo.

Page 8: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Estimação na presença de multicolinearidade perfeita

Seja um modelo de regressão linear com duas variáveisexplicativas.

β1 mede em quantas unidades a esperança condicional deY muda em função da variação de uma unidade em X1,mantendo constante X2.

Mas se X1e X2 são perfeitamente correlacionados,X2 = λX1, então NÃO É POSSÍVEL que X1 aumente emuma unidade e X2 se mantenha constante - X2 variará λ.

Isto é, não se tem como se separar os efeitos de X1 e X2

sobre o Y .

Page 9: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Consequências práticas da multicolinearidade

Os estimadores de MQO continuam sendo MELNV.

Apesar disso, apresentam variância e covariância altas,di�cultando estimações precisas.

Fator de in�ação da variância

FIV =1

1− r212

Page 10: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Fator de in�ação da variância

Figura: Efeito do crescimento da correlação sobre a variância

Page 11: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Consequências práticas da multicolinearidade

Os intervalos de con�ança tendem a ser maiores, levando àaceitação da �hipótese nula zero� mais facilmente.

A estatística t de um ou mais estimadores tende a serinsigni�cativa.

Apesar das estatísticas t baixas, o R2 tende a ser alto.

Os estimadores de MQO e suas variâncias tendem a �carmais sensível a mudanças na amostra.

Page 12: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Detecção da multicolinearidade

R2 alto mas poucas estatísticas t signi�cativas.

Correlação entre pares de regressores alta. (Condiçãosu�ciente mas não necessária, exceto no caso de apenasdois regressores.)

Page 13: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Detecção da multicolinearidade

Regressões auxiliares.

Regressões auxiliares

Regride-se cada uma das variáveis explicativas Xi contra asdemais, Xj , j 6= i , e computa-se o R2

i da regressão (Porexemplo, para i = 2,X2 = a0 + a1X1 + a2X2 + a3X3 + ...akXk + u

Usa-se o seguinte teste F com a hipótese nula que a variávelexplicativa i não é correlacionada com as demais.

Fi =R2

i / (k − 2)(1− R2

i

)/ (n − k + 1)

Page 14: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Algumas medidas corretivas

Informação a priori. Por exemplo, suponha que saibamosque β1 = λβ2; então utilizamos essa informação parareescrever a regressão.

Eliminação de uma ou mais variáveis. Por exemplo, excluira variável riqueza da regressão consumo-renda-riqueza.Deve-se tomar cuidado para não se incorrer em viés deespeci�cação.

Transformação das variáveis. Em séries temporais, utilizara primeira diferença das variáveis.

Aumento da amostra.

Reduzir a colinearidade em regressões polinomiais,expressando as variáveis na forma de desvio.

Page 15: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Heterocedasticidade

A homoscedasticidade é uma das hipóteses do modeloclássico de regressão linear.

Homoscedasticidade: E(u2i)= σ2 para todo i = 1, 2, ..., n.

Heterocedasticidade: E(u2i)= σ2i .

Page 16: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Heterocedasticidade

A homoscedasticidade é uma das hipóteses do modeloclássico de regressão linear.

Homoscedasticidade: E(u2i)= σ2 para todo i = 1, 2, ..., n.

Heterocedasticidade: E(u2i)= σ2i .

Page 17: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Homoscedasticidade e heterocedasticidade

Figura: Comparação

Page 18: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Possíveis causas da heterocedasticidade

Modelos de aprendizagem e erro. À medida que as pessoasaprendem, diminuem seus erros, assim como a suavariabilidade.

À medida que a renda aumenta, as pessoas têm maiorrenda discricionária e, consequentemente, maior liberdadepara decidir como dispor sua renda, fazendo com que σ2iseja positivamente correlacionado com a renda.

Erro de especi�cação.

Observações aberrantes (outliers).

Page 19: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Observações aberrantes

Figura: Relação entre preço das ações e preços ao consumidor

Page 20: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Consequências da heterocedasticidade

O estimadores dos β's continuam sendo não viesados.

Porém, a fórmula da variância do estimador da inclinação édiferente, var

(β1

)=(∑

x2i σ2

i

)/(∑

x2i)2.

Os estimadores de MQO deixam de ser e�cientes, isto é,existe outro estimador não viesado com menor variância: oMétodo dos Mínimos Quadrados Generalizados (MQG).

Assim, os testes de hipótese tendem a aceitar a �hipótesenula zero� mas facilmente.

Page 21: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Método dos Mínimos Quadrados Generalizados(MQG)

MQG

Supondo que as variâncias σ2i sejam CONHECIDAS, pondera-secada observação inversamente ao seu desvio-padrão, chegandoa uma regressão do tipo MQO.

Yi = β0 + β1Xi + ui

Yi

σi= β0

(1σi

)+ β1

(Xi

σi

)+

(ui

σi

)Y ∗

i = β∗0X∗0i + β∗1X

∗i + u∗i

Pode-se mostrar que var (u∗i ) = 1, ou seja, os resíduostornam-se homocedásticos com esta transformação. Note que aregressão a ser estimada tem uma variável explicativa adicional(1/σi ) e não tem intercepto.

Page 22: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

MQG - exemplo

Figura: Ilustração de MQG

Page 23: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Métodos informais de detecção

Natureza do problema. Novamente, o exemploconsumo-renda.

Métodos grá�cos. Os resíduos da regressão originalapresentam algum padrão?

Alguns métodos formais:

Teste de Park;Teste de Glejser;Teste de Goldfeld-Quandt;Teste de Breusch-Pagan-Godfrey.

Page 24: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Métodos grá�cos

Figura: Padrões hipotéticos dos resíduos ao quadrado estimados

Page 25: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Teste geral de heterocedasticidade de White

Teste de White

Com os resíduos da regressão estimada rodamos a seguinteregressão auxiliar:

u2i = α1 + α2X2i + α3X3i + α4X2

2i + α5X2

3i + α6X2iX3i + vi

A variável nR2 ∼ χ2gl , com gl igual ao número de regressores naregressão auxiliar.Se o teste exceder o valor crítico, a conclusão é de que háheterocedasticidade.

Page 26: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Medidas quando σ2inão é conhecida

Variâncias e erros padrão consistentes emheterocedasticidade segundo White.

Hipóteses plausíveis a respeito do padrão deheteroscedasticidade:

E(u2i)

= σ2X 2

i =⇒ modelo/Xi

E(u2i)

= σ2Xi =⇒ modelo/√

Xi

E(u2i)

= σ2 [E (Yi )]2 =⇒ modelo/Yi

Estimar o modelo com as variáveis em escala logaritma.

Page 27: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

E(u2i

)= σ2

X2i

Figura: Variância proporcional a X 2

i

Page 28: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

E(u2i

)= σ2

Xi

Figura: Variância proporcional a Xi

Page 29: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Autocorrelação

A ausência de AUTOCORRELAÇÃO entre os resíduos éuma das hipóteses do modelo clássico de regressão.

É usual o termo CORRELAÇÃO SERIAL para designar aautocorrelação entre os resíduos em um modelo de sériesde tempo.

Page 30: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Padrões de autocorrelação

Figura: Padrões de autocorrelação

Page 31: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Possíveis causas da autocorrelação

Inércia ou rigidez das séries temporais.

Viés de especi�cação:

Exclusão de variável;Forma funcional incorreta.

Fenômeno da teia de aranha. Exemplo clássico da ofertade produtos agrícolas, onde a decisão da área plantada(oferta) depende do preço do ano anterior.

Defasagens. Um exemplo é a suavização do consumo, ondeo consumo atual depende do passado.

Manipulação de dados, como interpolação ou extrapolação.

Page 32: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Estimativa por MQO desconsiderando aautocorrelação

Os estimadores dos βs continuam não viesados econsistentes, mas deixam de ser e�cientes (variânciamínima).

A variância dos resíduos σ2 provavelmente irá superestimaro verdadeiro σ2.

Provavelmente o R2 será superestimado.

Os testes de signi�cância usuais tendem a levar aconclusões errôneas.

Page 33: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Método grá�co para detecção

Figura: Resíduos com autocorrelação

Page 34: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Teste d de Durbin-Watson

Estatística d

d =

∑t=nt=2

(ut − ut−1)2∑t=n

t=2u2t

Hipóteses fundamentais:

A regressão inclui o intercepto.As perturbações ut são geradas pelo esquemaauto-regressivo de primeira ordem, ut = ρut−1 + εt .O modelo de regressão não inclui termos defasados davariável dependente (Yt−1).

Page 35: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Teste d de Durbin-Watson

Estatística d

d =

∑t=nt=2

(ut − ut−1)2∑t=n

t=2u2t

Hipóteses fundamentais:

A regressão inclui o intercepto.As perturbações ut são geradas pelo esquemaauto-regressivo de primeira ordem, ut = ρut−1 + εt .O modelo de regressão não inclui termos defasados davariável dependente (Yt−1).

Page 36: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Teste d de Durbin-Watson

Figura: Estatística d

Page 37: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Teste d de Durbin-Watson

Figura: Regras de decisão

Page 38: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Método de Cochrane-Orcutt em duas etapas

Cochrane-Orcutt

Seja a regressão Yt = β0 + β1Xt + ut , onde se supõe que osresíduos seguem ut = ρut−1 + εt .

Estime a regressão pela rotina usual do MQO e obtenha osresíduos ut .

Usando os resíduos estimados, rode ut = ρut−1 + vt .

Usando o ρ estimado, estime

(Yt − ρYt−1) = [β0 (1− ρ)] + β1 [Xt − ρXt−1] + [ut − ρut−1] .

Page 39: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Método de Cochrane-Orcutt em duas etapas

Cochrane-Orcutt

Seja a regressão Yt = β0 + β1Xt + ut , onde se supõe que osresíduos seguem ut = ρut−1 + εt .

Estime a regressão pela rotina usual do MQO e obtenha osresíduos ut .

Usando os resíduos estimados, rode ut = ρut−1 + vt .

Usando o ρ estimado, estime

(Yt − ρYt−1) = [β0 (1− ρ)] + β1 [Xt − ρXt−1] + [ut − ρut−1] .

Page 40: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Exemplo - salários

Seja o seguinte modelo

Yi = α1 + α2Di + βXi + ui ,

onde Yi é o salário de um professor(a) universitário(a), Xi são os anos deexperiência de ensino e Di é uma variável qualitativa tal que

Di = 1 se homem

= 0 se mulher.

Assim, o salário médio de um professor(a) será

E (Yi |Xi , Di = 0) = α1 + βXi

E (Yi |Xi , Di = 1) = (α1 + α2) + βXi .

Este modelo postula que as inclinações da função salário de homens emulheres são iguais, mas que o seu intercepto é diferente (o intercepto dogrupo masculino é maior do que o feminino se α2 > 0, e o oposto casoα2 < 0).

Page 41: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Possíveis representações

Figura: Regressões plausíveis

Page 42: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Possíveis representações

Regressões coincidentes: nenhuma dummy.

Regressões paralelas: mesma inclinação e interceptosdiferentes.

Yi = α1 + α2Di + βXi + ui

Regressões convergentes: mesmo intercepto e inclinaçõesdiferentes.

Yi = α+ β1Xi + β2XiDi + ui

Regressões dissimilares: interceptos e inclinaçõesdiferentes.

Yi = α1 + α2Di + β1Xi + β2XiDi + ui

Page 43: Regressão - aula 04/04

Análise deRegressão:

Relaxando ashipóteses

Rodrigo deSá

Multicolin.

Heterocedast.

Autocorrel.

Dummies

Exercício

Exercício

Escolhe um modelo econômico que possa ser estimado porMQO e estime-o. O modelo deve ter duas ou mais variáveisexplicativas.

Teste o modelo quanto a presença de multicolinearidade,heterocedasticidade e autocorrelação, corrigindo-o se necessário.

Faça um relatório que contemple os seguintes pontos:

Explique o modelo econômico.Descreva as variáveis.Mostre os resultados da estimação (coe�cientes, testes designi�cância, teste F, R2, grá�co da estimação, etc.)Mostre os testes das hipóteses do modelo(multicolinearidade, heterocedasticidade e autocorrelação)e as correções, caso feitas.Interprete os resultados economicamente. Os resultadosdiferiram dos resultados esperados antes da estimação domodelo?

Data da entrega: até dia 2 de dezembro.