Download - Aula 7
![Page 1: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/1.jpg)
Aula 7
Introdução ao StataAnálise de especificação
10 de maio de 2013
![Page 2: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/2.jpg)
Regressão Linear: comparação de modelos
• Coeficiente de determinação: R2 não ajustado• Quando elevamos o numero de regressores na equação, o
valor do R2 não ajustado se eleva - um modelo com maior número de variáveis independentes é melhor do que um modelo com menor número de variáveis independentes.
• Esta conclusão pode ser espúria porque podemos estar adicionando variáveis sem sentido (non sense) ao modelo restrito.
• Qualquer variável acrescentada (mesmo que non sense) estará elevando o valor do R2 não ajustado.
![Page 3: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/3.jpg)
Regressão Linear: comparação de modelos
• R2 ajustado: não afetado pelo numero de variáveis.
• A adição do regressor eleva o R2 não ajustado apenas quando este é linearmente independente em relação às colunas previas da matriz X. Ou seja, não existe problema de multicolinearidade.
![Page 4: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/4.jpg)
• Ajuste do modelo Source | SS df MS Number of obs = 2955-------------+------------------------------ F( 7, 2947) = 124.98 Model | 1264.72124 7 180.674463 Prob > F = 0.0000 Residual | 4260.16814 2947 1.44559489 R-squared = 0.2289-------------+------------------------------ Adj R-squared = 0.2271 Total | 5524.88938 2954 1.87030785 Root MSE = 1.2023
------------------------------------------------------------------------------ ltotexp | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- suppins | .2556428 .0462264 5.53 0.000 .1650034 .3462821 phylim | .3020598 .0569709 5.30 0.000 .190353 .4137666 actlim | .3560054 .0621118 5.73 0.000 .2342185 .4777923 totchr | .3758201 .0184227 20.40 0.000 .3396974 .4119429 age | .0038016 .0036561 1.04 0.299 -.0033672 .0109705 female | -.0843275 .0455442 -1.85 0.064 -.1736292 .0049741 income | .0025498 .0010194 2.50 0.012 .000551 .0045486 _cons | 6.703737 .27676 24.22 0.000 6.161075 7.2464------------------------------------------------------------------------------
.
![Page 5: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/5.jpg)
Modelos aninhados e não aninhados
• Modelos nested (aninhados): as variáveis independentes do primeiro modelo formam um subconjunto das variáveis independentes do primeiro modelo.
• Modelos não nested (não aninhados): os parâmetros (e variáveis) do primeiro modelo não estão contidos no conjunto de parâmetros (e variáveis) do segundo modelo (e vice-versa).
• Em suma, modelos nested são aqueles que podem ser obtidos a partir da simples inclusão de variáveis no primeiro modelo para obter o seguinte modelo.
![Page 6: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/6.jpg)
aninhado
Não aninhado
![Page 7: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/7.jpg)
Comparação de modelos
• Modelos não aninhados (abordagem não estatística): – olhar coeficiente de determinação e R2 ajustado:
saem do lado esquerdo da saída da regressão.– Olhar os valores dos critérios: AIC (Akaike), BIC
(Critério Bayesiano ou Schwarz ).– Consideram o ajuste e a parcimônia.Comando no Stata:
estat ic
![Page 8: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/8.jpg)
Comando ic
• O grau para o qual o modelo ajustado melhora em relação ao modelo nulo na explicação da variável dependente é medido pelo maior valor (em termos absolutos) do ll(model) em comparação com o ll(null).
• BIC• AIC
Note: N=Obs used in calculating BIC; see [R] BIC note reg2 143180 -186936.9 -178443 6 356898 356957.2 Model Obs ll(null) ll(model) df AIC BIC
. estat ic
![Page 9: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/9.jpg)
Comparação de modelos
• Abordagem Estatística: testes de comparação modelos restrito e irrestrito (distância de Wald).
![Page 10: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/10.jpg)
Sobreespecificação do modelo
• Inclusão de variáveis irrelevantes no modelo de regressão.
• Não altera o fato de que os estimadores dos parâmetros das variáveis relevantes continuam sendo não viesados.
• Pode causar efeitos indesejáveis nas variâncias dos estimadores OLS.
• Diferente de subespecificação do modelo (omissão de variáveis relevantes!)
![Page 11: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/11.jpg)
Multicolinearidade
• Multicolinearidade perfeita: um dos regressores é uma combinação linear de outros regressores – impede solução do MQO.
• Quase multicolinearidade: o ajuste da regressão pode ser bom mas os coeficientes podem ter erros padrões muito altos, sinais ou magnitudes incorretas.
• Teste vif (variance influence factor): quando um regressor não é ortogonal a outros regressores a variância do respectivo parâmetro fica inflacionada.
![Page 12: Aula 7](https://reader036.vdocuments.com.br/reader036/viewer/2022082614/56815b54550346895dc934de/html5/thumbnails/12.jpg)
• O maior vif não pode ser maior que 10
Mean VIF 1.06 branca 1.01 0.993499 metropole 1.06 0.946200 urbano 1.07 0.934089 chefe 1.08 0.926821 homem 1.09 0.919974 Variable VIF 1/VIF
. estat vif