econometria de datos en panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>porque...

30
¿Porque paneles? Modelos lineales para datos en paneles Econometria de Datos en Paneles Walter Sosa-Escudero Universidad de San Andres Agosto de 2011 Walter Sosa-Escudero Econometria de Datos en Paneles

Upload: others

Post on 08-Apr-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Econometria de Datos en Paneles

Walter Sosa-Escudero

Universidad de San Andres

Agosto de 2011

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 2: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

¿Porque paneles?

Ejemplo (Cronwell y Trumbull): Determinantes del crimen

y = g(I), y = crimen, I = variables de justicia criminal.

Corte transversal: (yi, Ii) para varias regiones i = 1, . . . , n

I resulta ‘muy importante’

Critica: I capta el efecto de otros efectos regionales, quetambien son determinantes del crimen.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 3: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

En terminos econometricos

Existe una variable omitida y relacionada positivamente con I.

El estimador de MCO que regresa y en I es sesgado (haciaarriba)

Solucion? ‘Controlar’ por esta varaible omitida.

Paneles al rescate: una solucion simple sin tener que incorporarnuevas variables

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 4: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Datos en paneles

Una base de datos en panel contiene informacion para variosindividuos (empresas, paises, etc.) en el tiempo.

El aspecto fundamental es esta bidimensionalidad de los datos.

Ejemplos: PSID: 6500 familias desde 1968.La EPH tiene una estructura de panel rotativo.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 5: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Ventajas

Control de ‘heterogeneidades no observables’

Con N individuos y T periodos podriamos estimar N modelosde series de tiempo y T modelos de corte transversal.

Las ventajas de disponer de un panel tienen que ver con laposibilidad de agregar esta informacin de alguna manera.

Ejemplo: yit = x′itβ + uit

Supone que el modelo lineal subyacente es el mismo paratodos los individuos y periodos.

Mayor informacion sobre un mismo parametro. Mayoreficiencia.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 6: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Desventajas

No siempre es posible agregar informacion temporal y de cortetransversal (pueden ser ms observaciones pero de poblacionesheterogeneas).

Los paneles son costosos de implementar y administrar.

Problemas de selectividad: auto-seleccion, no respuesta,”attrition”.

Dimension temporal corta

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 7: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

El Modelo

El modelo basico es:

yit = x′itβ + uit

uit = µi + δt + εit

i = 1, . . . , N, t = 1, . . . , T . xit es un vector de K variablesexplicativas, incluyendo una constante.

El termino de error incluye tres componentes, que representanlas tres posibles fuentes de variabilidad no observable.

Supondremos δt = 0 y que εit satisface todos los supuestosclasicos.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 8: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Caso mas simple: µi = 0

En este caso, uit = εit satisface todos los supuestos del teorema deGauss-Markov:

E(εit) = 0

E(εitehs) =

σ2 si i = h y t = s0 si i 6= h o t 6= s

El estimador de MCO es MELI. La estructura de panel no agregainformacion

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 9: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

En terminos matriciales

Y = Xβ + u

YNT×1, XNT+×K , apilando las observaciones por individuo,primero ordenadas temporalmente.Entonces:

βMCO = (X ′X)−1X ′Y

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 10: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

El estimador de efectos fijos

yit = x′itβ + µi + εit

Las realizaciones de µi pueden ser estimadas con un panel (no conun corte transversal!).

Puede ser visto un modelo lineal en donde cada individuo tiene supropia ordenada al origen:

yit = µi + β1︸ ︷︷ ︸+β2 x2,it + · · ·+ βK xK,it + εit

El modelo se puede estimar usando N − 1 variables binarias porindividuo, para evitar la ‘trampa de variables binarias’.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 11: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

En terminos matriciales

Y = Xβ +Dµ+ u

Y es NT × 1, X es NT ×K, X incluye el intercepto.D es una matriz de N − 1 variables binarias por individuo.

1N ≡

11...1

, Z =

1N 0 · · · 0

0 1N 0...

.... . .

...0 0 · · · 1N

NT×(N−1)T

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 12: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Reescribamos el modelo como:

Y = Xβ +Dµ+ u = Xδ + u

con X ≡ [X D] y δ ≡ [β′ µ′]′.

Entonces, el estimador de efectos fijos es:

δEF =

(βEFµEF

)= (X ′X)−1X ′Y

que no es otra cosa que un estimador de MCO agregando N − 1variables binarias por individuo.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 13: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Efectos fijos y transformacion ‘within’

Comencemos con el modelo

yit = x′itβ + µi + εit

Tomando promedios por individuo:

yi = x′iβ + µi + εi

Restandoyit − yi = (xit − xi)′β + εit − εi

oy∗it = xit∗′β + ε∗it

con m∗it ≡ mit − mi, m = y, x, ε.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 14: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Resultado:

βEF = (X∗′X∗)−1X∗′ Y ∗

(Prueba: Teorema de Frisch,Waugh, Lovell)

Existen dos formas identicas de computar βEF .

Regresar Y en X y las variables binarias por individuo. βEF son loscoeficientes estimados para X.

En dos pasos: 1) Expresar las variables en desvios con respecto a lamedia por individuo. 2) MCO en base a estos desvios.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 15: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Terminologia:

Modelo within

yit − yi = (xit − xi)′β + εit − εi

Modelo betweenyi = x′iβ + µi + εi

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 16: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Propiedades de βEF

Es insesgado (X y Dµ son exogenas con respecto a ε).

Es consistente, cuando N o T →∞.

Importante: la insesgadez y consistencia de βEF no presuponeque X y Dµ son ortogonales (puede haber correlacion entreX y Dµ

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 17: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Efectos fijos y control de heterogeneidades no observables

Supongamos que el modelo es

yit = x′itβ + z′iδ + µi + εit

zi no es observable, pero esta correlacionada con xit.

La transformacion within de este modelo es

y∗it = xit∗′β + ε∗it

La tranformacion within elimina cualquier variable que no varia enel tiempo (zi y µi): estimar por efectos fijos permite ‘controlar’por la presencia de zi.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 18: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Es relevante notar que sin datos de panel, no podriamos haberdado cuenta de zi (que no sea incluyendola en el nodelo.

Con datos de corte transversal el modelo es

yi = x′iβ + z′iδ + µi + εi,

de modoe que omitir zi conduce a sesgos. Observar que latranformacion within es inaplicable (trivialmente cero).

Este es el sentido en el cual la disponibilidad de paneles permitecontrolar por variables omitidas que no varian en el tiempo.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 19: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Una exploracion grafica

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 20: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Verbalizacion

Y = tasa de criminalidad

X = ineficiencia del sistema judicial (mas ineficiente, mascriminalidad).

Dos regiones

Determinante omitido del crimen, a que varia solo por regiony correlacionado (positivamete) con la ineficiencia judicial:densidad poblacional.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 21: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 22: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 23: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

El estimador de efectos aleatorios

El modelo es el mismo

yit = x′itβ + µi + εit

En terminos matriciales

Y = Xβ +Dµ+ ε

Si Dµ es ortogonal a X, y si E(µi|X) = 0, entonces, el estimadorde MCO que regresa Y en X es insesgado.

Es decir, si Dµ es ortogonal a X, la omision de las variablesbinarias no sesga al estimador de MCO.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 24: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Efectos fijos vs aleatorios

Discusion muy extrana. Es mas una cuestion de tratamiento

Y = Xβ +Dµ+ ε

Efectos fijos (controla por Dµ)

Y = Xβ +Dµ+ ε

Efectos aleatorios (trata a Dµ como variable omitida)

Y = Xβ +Dµ+ ε

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 25: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Y = Xβ +Dµ+ ε

Y = Xβ + u, u ≡ Dµ+ ε

Problema: u no satisface los supuestos clasicos, aun cuando Dµ yε por separado lo hagan.

Prueba simple: supuestos clasicos por separado (esperanza nula,no correlacion ni heterocedasticidad), ademas, no correlacion entreDµ y ε. Entonces

V (u) = V (Dµ+ ε)

= DV (µ)D′ + V (ε)

= σ2µ + σ2ε INT

que no es un escalar por la matriz identidad (los elementos fuerade la diagonal no son cero).

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 26: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Intuicion: uit = µi + εit

Trivialmente, uit esta correlacionado con ui,t−1 ya que ambos‘comparten’ µi: la presencia permanente de µi hace que laespecificacion de efectos aleatorios induzca autocorrelacion.

Si bien MCO es insesgado, no es eficiente, por la presencia deautocorrelacion.

Eficiente? Minimos cuadrados generalizados.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 27: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

MCG para efectos aleatorios

Consideremos un modelo lineal basico:

Y = X ′β + u

en donde valen todos los supuestos clasicos, salvo que:

V (u) = Ω

Ω es una matriz simetrica y positiva definida (permite,potencialmente, autocorrelacion y heterocedasticidad).Teorema (Aitken): el MELI de β es:

βMCG = (X ′Ω−1X)−1X ′Ω−1Y

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 28: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

En nuestro caso

V (u) = σ2µDD′ + σ2ε INT ≡ Ω(θ)

con θ′ = (σ2µ, σ2ε )′

La implementacion de MCG requiere primero estimar θ (loscomponentes de varianzas).

Estimador de efectos aleatorios: estimador MCG.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 29: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Resumen

Y = Xβ +Dµ+ ε

X ⊥ Dµ: MCO, EF, EA y between son todos consistentesparar β. EA es eficiente.

X ¬⊥ Dµ: solo EF es consistente para β.

La practica gravita mayoritariamente a EF.

Walter Sosa-Escudero Econometria de Datos en Paneles

Page 30: Econometria de Datos en Panelesportal.eco.unc.edu.ar/files/ief/seminarios-conferencias/...>Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una

¿Porque paneles?Modelos lineales para datos en paneles

Test de Hausman

H0 : X ⊥ Dµ, HA : X ¬⊥ Dµ

Test de Hausman: bajo H0

H = (βEA − βEF )′(ΩEF − ΩEA)−1(βEA − βEF ) ∼ χ2(K)

Rechazar si H es significativamente distinto de cero.

Intuicion: bajo H0, βEA y βEF son consistentes, H deberiaser pequeno. Bajo HA, solo βEF es consistente, H deberiaser alto.

Permitiria, bajo H0, explotar las ganancias de eficiencia deestimar por EA.

Walter Sosa-Escudero Econometria de Datos en Paneles