aula 3

Aula 3

17 de setembro de 2013Agrupamento independente de

cortes transversais

Cortes transversais agrupados

• Alguns conjuntos de dados têm características de corte transversal e de séries de tempo.

• Um mesmo conjunto de variáveis é coletado em diferentes períodos do tempo, em distintas amostras aleatórias de uma mesma população (Censo Demográfico, Pesquisa Nacional por Amostra de Domicílios –PNAD).

• Agrupar cortes transversais de diferentes anos é eficaz para analisar os efeitos de uma política pública.

• O ideal é coletar dados de anos anteriores e posteriores a uma importante mudança de política governamental.

Cortes transversais agrupados

• Aumenta o tamanho da amostra, a análise de corte transversal agrupada é importante para estimar como uma relação fundamental mudou ao longo do tempo.

• Observações amostrais são coletadas de forma independente.

• Eliminação da correlação nos erros entre diferentes observações.

• Intercepto deve diferir entre períodos de tempo diferentes – variáveis dummies para todos anos menos um (ano base)

Exemplo• Conjunto de dados sobre os preços da

moradia em 1993 e 1995 nos Estados Unidos

Exemplos de banco de dados com cortes transversais agrupados

• Pesquisa Nacional por amostra de domicílios do IBGE (podemos agrupar vários anos):

• A PNAD é uma pesquisa anual por amostragem probabilística de domicílios, realizada em todo o território nacional exclusive a área rural da região Norte.

• A PNAD adota um plano amostral estratificado e conglomerado com um, dois ou três estágios de seleção, dependendo do estrato.

Exemplos de banco de dados com cortes transversais agrupados

• Pesquisa Nacional por amostra de domicílios do IBGE (podemos agrupar vários anos):

• Amostra da PNAD é feita em 3 estágios de seleção (municípios, setores censitários e domicílios).

• Estratificação das unidades de 1º estágio e com probabilidades de seleção proporcionais ao tamanho para os municípios e setores.

• Os domicílios são selecionados com probabilidades iguais dentro dos setores.

• Fração de amostragem: probabilidade de um domicílio pertencer à amostra.

Modelo de dados agrupados

• As informações são agrupadas em um único banco de dados.

• O modelo pode ser escrito da seguinte forma:

• Termo constante• Variáveis explicativas

iiii uxanoy ...210

Fertilidade feminina ao longo do tempo

• Arquivo: fertil1.gdt

• Modelo que estima o número total de nascimentos por mulheres.

Coeficiente Erro Padrão razão-t p-valor

const -7,74246 3,05177 -2,5370 0,01132 **

educ -0,128427 0,0183486 -6,9993 <0,00001 ***

age 0,532135 0,138386 3,8453 0,00013 ***

agesq -0,005804 0,00156428 -3,7103 0,00022 ***

black 1,07566 0,173536 6,1985 <0,00001 ***

east 0,217324 0,132788 1,6366 0,10199

northcen 0,363114 0,120897 3,0035 0,00273 ***

west 0,197603 0,166913 1,1839 0,23672

farm -0,0525575 0,14719 -0,3571 0,72111

othrural -0,162854 0,175442 -0,9282 0,35348

town 0,0843532 0,124531 0,6774 0,49831

smcity 0,211879 0,160296 1,3218 0,18651

y74 0,268183 0,172716 1,5527 0,12077

y76 -0,0973795 0,179046 -0,5439 0,58663

y78 -0,0686665 0,181684 -0,3779 0,70554

y80 -0,0713053 0,182771 -0,3901 0,69651

y82 -0,522484 0,172436 -3,0300 0,00250 ***

y84 -0,545166 0,174516 -3,1239 0,00183 ***Média var. dependente 2,743136 D.P. var. dependente 1,653899Soma resíd. quadrados 2685,898 E.P. da regressão 1,554847R-quadrado 0,129512 R-quadrado ajustado 0,116192F(17, 1111) 9,723282 P-valor(F) 2,42e-24Log da verossimilhança -2091,224 Critério de Akaike 4218,448Critério de Schwarz 4308,972 Critério Hannan-Quinn 4252,650

Modelo 2: MQO, usando as observações 1-1129Variável dependente: kids

aula 3

Documents