Download - Aula 7

Aula 7

Introdução ao StataAnálise de especificação

10 de maio de 2013

Regressão Linear: comparação de modelos

• Coeficiente de determinação: R2 não ajustado• Quando elevamos o numero de regressores na equação, o

valor do R2 não ajustado se eleva - um modelo com maior número de variáveis independentes é melhor do que um modelo com menor número de variáveis independentes.

• Esta conclusão pode ser espúria porque podemos estar adicionando variáveis sem sentido (non sense) ao modelo restrito.

• Qualquer variável acrescentada (mesmo que non sense) estará elevando o valor do R2 não ajustado.

Regressão Linear: comparação de modelos

• R2 ajustado: não afetado pelo numero de variáveis.

• A adição do regressor eleva o R2 não ajustado apenas quando este é linearmente independente em relação às colunas previas da matriz X. Ou seja, não existe problema de multicolinearidade.

• Ajuste do modelo Source | SS df MS Number of obs = 2955-------------+------------------------------ F( 7, 2947) = 124.98 Model | 1264.72124 7 180.674463 Prob > F = 0.0000 Residual | 4260.16814 2947 1.44559489 R-squared = 0.2289-------------+------------------------------ Adj R-squared = 0.2271 Total | 5524.88938 2954 1.87030785 Root MSE = 1.2023

------------------------------------------------------------------------------ ltotexp | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- suppins | .2556428 .0462264 5.53 0.000 .1650034 .3462821 phylim | .3020598 .0569709 5.30 0.000 .190353 .4137666 actlim | .3560054 .0621118 5.73 0.000 .2342185 .4777923 totchr | .3758201 .0184227 20.40 0.000 .3396974 .4119429 age | .0038016 .0036561 1.04 0.299 -.0033672 .0109705 female | -.0843275 .0455442 -1.85 0.064 -.1736292 .0049741 income | .0025498 .0010194 2.50 0.012 .000551 .0045486 _cons | 6.703737 .27676 24.22 0.000 6.161075 7.2464------------------------------------------------------------------------------

.

Modelos aninhados e não aninhados

• Modelos nested (aninhados): as variáveis independentes do primeiro modelo formam um subconjunto das variáveis independentes do primeiro modelo.

• Modelos não nested (não aninhados): os parâmetros (e variáveis) do primeiro modelo não estão contidos no conjunto de parâmetros (e variáveis) do segundo modelo (e vice-versa).

• Em suma, modelos nested são aqueles que podem ser obtidos a partir da simples inclusão de variáveis no primeiro modelo para obter o seguinte modelo.

aninhado

Não aninhado

Comparação de modelos

• Modelos não aninhados (abordagem não estatística): – olhar coeficiente de determinação e R2 ajustado:

saem do lado esquerdo da saída da regressão.– Olhar os valores dos critérios: AIC (Akaike), BIC

(Critério Bayesiano ou Schwarz ).– Consideram o ajuste e a parcimônia.Comando no Stata:

estat ic

Comando ic

• O grau para o qual o modelo ajustado melhora em relação ao modelo nulo na explicação da variável dependente é medido pelo maior valor (em termos absolutos) do ll(model) em comparação com o ll(null).

• BIC• AIC

Note: N=Obs used in calculating BIC; see [R] BIC note reg2 143180 -186936.9 -178443 6 356898 356957.2 Model Obs ll(null) ll(model) df AIC BIC

. estat ic

Comparação de modelos

• Abordagem Estatística: testes de comparação modelos restrito e irrestrito (distância de Wald).

Sobreespecificação do modelo

• Inclusão de variáveis irrelevantes no modelo de regressão.

• Não altera o fato de que os estimadores dos parâmetros das variáveis relevantes continuam sendo não viesados.

• Pode causar efeitos indesejáveis nas variâncias dos estimadores OLS.

• Diferente de subespecificação do modelo (omissão de variáveis relevantes!)

Multicolinearidade

• Multicolinearidade perfeita: um dos regressores é uma combinação linear de outros regressores – impede solução do MQO.

• Quase multicolinearidade: o ajuste da regressão pode ser bom mas os coeficientes podem ter erros padrões muito altos, sinais ou magnitudes incorretas.

• Teste vif (variance influence factor): quando um regressor não é ortogonal a outros regressores a variância do respectivo parâmetro fica inflacionada.

• O maior vif não pode ser maior que 10

Mean VIF 1.06 branca 1.01 0.993499 metropole 1.06 0.946200 urbano 1.07 0.934089 chefe 1.08 0.926821 homem 1.09 0.919974 Variable VIF 1/VIF

. estat vif

Download - Aula 7

Top Related