aula 3
DESCRIPTION
Aula 3. 17 de setembro de 2013 Agrupamento independente de cortes transversais. Cortes transversais agrupados. Alguns conjuntos de dados têm características de corte transversal e de séries de tempo. - PowerPoint PPT PresentationTRANSCRIPT
Aula 3
17 de setembro de 2013Agrupamento independente de
cortes transversais
Cortes transversais agrupados
• Alguns conjuntos de dados têm características de corte transversal e de séries de tempo.
• Um mesmo conjunto de variáveis é coletado em diferentes períodos do tempo, em distintas amostras aleatórias de uma mesma população (Censo Demográfico, Pesquisa Nacional por Amostra de Domicílios –PNAD).
• Agrupar cortes transversais de diferentes anos é eficaz para analisar os efeitos de uma política pública.
• O ideal é coletar dados de anos anteriores e posteriores a uma importante mudança de política governamental.
Cortes transversais agrupados
• Aumenta o tamanho da amostra, a análise de corte transversal agrupada é importante para estimar como uma relação fundamental mudou ao longo do tempo.
• Observações amostrais são coletadas de forma independente.
• Eliminação da correlação nos erros entre diferentes observações.
• Intercepto deve diferir entre períodos de tempo diferentes – variáveis dummies para todos anos menos um (ano base)
Exemplo• Conjunto de dados sobre os preços da
moradia em 1993 e 1995 nos Estados Unidos
Exemplos de banco de dados com cortes transversais agrupados
• Pesquisa Nacional por amostra de domicílios do IBGE (podemos agrupar vários anos):
• A PNAD é uma pesquisa anual por amostragem probabilística de domicílios, realizada em todo o território nacional exclusive a área rural da região Norte.
• A PNAD adota um plano amostral estratificado e conglomerado com um, dois ou três estágios de seleção, dependendo do estrato.
Exemplos de banco de dados com cortes transversais agrupados
• Pesquisa Nacional por amostra de domicílios do IBGE (podemos agrupar vários anos):
• Amostra da PNAD é feita em 3 estágios de seleção (municípios, setores censitários e domicílios).
• Estratificação das unidades de 1º estágio e com probabilidades de seleção proporcionais ao tamanho para os municípios e setores.
• Os domicílios são selecionados com probabilidades iguais dentro dos setores.
• Fração de amostragem: probabilidade de um domicílio pertencer à amostra.
Modelo de dados agrupados
• As informações são agrupadas em um único banco de dados.
• O modelo pode ser escrito da seguinte forma:
• Termo constante• Variáveis explicativas
iiii uxanoy ...210
Fertilidade feminina ao longo do tempo
• Arquivo: fertil1.gdt
• Modelo que estima o número total de nascimentos por mulheres.
Coeficiente Erro Padrão razão-t p-valor
const -7,74246 3,05177 -2,5370 0,01132 **
educ -0,128427 0,0183486 -6,9993 <0,00001 ***
age 0,532135 0,138386 3,8453 0,00013 ***
agesq -0,005804 0,00156428 -3,7103 0,00022 ***
black 1,07566 0,173536 6,1985 <0,00001 ***
east 0,217324 0,132788 1,6366 0,10199
northcen 0,363114 0,120897 3,0035 0,00273 ***
west 0,197603 0,166913 1,1839 0,23672
farm -0,0525575 0,14719 -0,3571 0,72111
othrural -0,162854 0,175442 -0,9282 0,35348
town 0,0843532 0,124531 0,6774 0,49831
smcity 0,211879 0,160296 1,3218 0,18651
y74 0,268183 0,172716 1,5527 0,12077
y76 -0,0973795 0,179046 -0,5439 0,58663
y78 -0,0686665 0,181684 -0,3779 0,70554
y80 -0,0713053 0,182771 -0,3901 0,69651
y82 -0,522484 0,172436 -3,0300 0,00250 ***
y84 -0,545166 0,174516 -3,1239 0,00183 ***Média var. dependente 2,743136 D.P. var. dependente 1,653899Soma resíd. quadrados 2685,898 E.P. da regressão 1,554847R-quadrado 0,129512 R-quadrado ajustado 0,116192F(17, 1111) 9,723282 P-valor(F) 2,42e-24Log da verossimilhança -2091,224 Critério de Akaike 4218,448Critério de Schwarz 4308,972 Critério Hannan-Quinn 4252,650
Modelo 2: MQO, usando as observações 1-1129Variável dependente: kids