Las funciones de control (también conocidas como inclusión residual de dos etapas ) son métodos estadísticos para corregir problemas de endogeneidad modelando la endogeneidad en el término de error . Por tanto, el enfoque difiere en aspectos importantes de otros modelos que intentan dar cuenta del mismo problema econométrico . Las variables instrumentales , por ejemplo, intentan modelar la variable endógena X como un modelo a menudo invertible con respecto a un instrumento Z relevante y exógeno . Análisis de panel utiliza propiedades de datos especiales para diferenciar la heterogeneidad no observada que se supone que se fija en el tiempo.
Las funciones de control fueron introducidas por Heckman y Robb [1], aunque el principio se remonta a artículos anteriores. [2] Una razón particular por la que son populares es porque funcionan para modelos no invertibles (como los modelos de elección discreta ) y permiten efectos heterogéneos , donde los efectos a nivel individual pueden diferir de los efectos a nivel agregado. [3] Un ejemplo bien conocido del enfoque de la función de control es la corrección de Heckman .
Definicion formal
Supongamos que partimos de una configuración de variable endógena estándar con errores aditivos, donde X es una variable endógena y Z es una variable exógena que puede servir como instrumento.
( 1 )
( 2 )
( 3 )
( 4 )
Un enfoque de variable instrumental popular es usar un procedimiento de dos pasos y estimar la ecuación ( 2 ) primero y luego usar las estimaciones de este primer paso para estimar la ecuación ( 1 ) en un segundo paso. La función de control, sin embargo, utiliza que este modelo implica
( 5 )
La función h ( V ) es efectivamente la función de control que modela la endogeneidad y de donde este enfoque econométrico presta su nombre. [4]
En un marco de resultados potenciales del modelo causal de Rubin , donde Y 1 es la variable de resultado de las personas para quienes el indicador de participación D es igual a 1, el enfoque de la función de control conduce al siguiente modelo
( 6 )
siempre que los resultados el potencial Y 0 y Y 1 son independientes de D condicional en X y Z . [5]
Corrección de varianza
Dado que la regresión de segunda etapa incluye regresores generados , es necesario ajustar su matriz de varianza-covarianza. [6] [7]
Ejemplos de
Endogeneidad en la regresión de Poisson
Wooldridge y Terza proporcionan una metodología para tratar y probar la endogeneidad dentro del marco de regresión exponencial, que la siguiente discusión sigue de cerca. [8] Si bien el ejemplo se centra en un modelo de regresión de Poisson , es posible generalizar a otros modelos de regresión exponencial, aunque esto puede tener el costo de suposiciones adicionales (por ejemplo, para modelos de respuesta binaria o de datos censurados).
Suponga el siguiente modelo de regresión exponencial, donde es un término no observado en la variable latente. Permitimos la correlación entre y (Insinuando es posiblemente endógena), pero no permiten tal correlación entre y .
Las variables sirven como variables instrumentales para el potencial endógeno . Se puede asumir una relación lineal entre estas dos variables o, alternativamente, proyectar la variable endógena en los instrumentos para obtener la siguiente ecuación en forma reducida:
( 1 )
Se necesita la condición de rango habitual para garantizar la identificación. La endogeneidad se modela luego de la siguiente manera, donde determina la severidad de la endogeneidad y se supone que es independiente de .
Imponer estos supuestos, asumiendo que los modelos están correctamente especificados y normalizando , podemos reescribir la media condicional de la siguiente manera:
( 2 )
Si se conocieran en este punto, sería posible estimar los parámetros relevantes mediante la estimación de verosimilitud cuasi máxima (QMLE). Siguiendo las estrategias del procedimiento de dos pasos, Wooldridge y Terza proponen estimar la ecuación ( 1 ) por mínimos cuadrados ordinarios . Los residuales ajustados de esta regresión se pueden insertar en la ecuación de estimación ( 2 ) y los métodos QMLE conducirán a estimadores consistentes de los parámetros de interés. Pruebas de significancia en luego se puede utilizar para probar la endogeneidad dentro del modelo.
Extensiones
El procedimiento original de Heckit hace supuestos distributivos sobre los términos de error, sin embargo, se han establecido enfoques de estimación más flexibles con supuestos distributivos más débiles. [9] Además, Blundell y Powell muestran cómo el enfoque de la función de control puede ser particularmente útil en modelos con errores no aditivos , como los modelos de elección discreta. [10] Este último enfoque, sin embargo, implícitamente hace fuertes supuestos de forma funcional y distributiva. [5]
Ver también
Referencias
- ^ Heckman, James J .; Robb, Richard (1985). "Métodos alternativos para evaluar el impacto de las intervenciones". Revista de Econometría . Elsevier BV. 30 (1–2): 239–267. doi : 10.1016 / 0304-4076 (85) 90139-3 . ISSN 0304-4076 .
- ^ Telser, LG (1964). "Estimación iterativa de un conjunto de ecuaciones de regresión lineal". Revista de la Asociación Estadounidense de Estadística . 59 (307): 845–862. doi : 10.1080 / 01621459.1964.10480731 .
- ^ Arellano, M. (2008). "Modelos binarios con variables explicativas endógenas" (PDF) . Notas de clase .
- ^ Arellano, M. (2003): Endogeneidad e instrumentos en modelos no paramétricos. Comentarios a artículos de Darolles, Florens & Renault; y Blundell & Powell. Avances en Economía y Econometría, Teoría y Aplicaciones, Octavo Congreso Mundial. Volumen II, ed. por M. Dewatripont, LP Hansen y SJ Turnovsky. Prensa de la Universidad de Cambridge, Cambridge.
- ^ a b Heckman, JJ y EJ Vytlacil (2007): Evaluación econométrica de programas sociales, Parte II: Uso del efecto del tratamiento marginal para organizar estimadores econométricos alternativos para evaluar programas sociales y pronosticar los efectos en nuevos entornos. Manual de Econometría, Vol. 6, ed. por JJ Heckman y EE Leamer. Holanda Septentrional.
- ^ Murphy, Kevin M .; Topel, Robert H. (1985). "Estimación e inferencia en modelos econométricos de dos pasos". Revista de Estadísticas Económicas y Empresariales . 3 (4): 370–379. JSTOR 1391724 .
- ^ Gauger, Jean (1989). "La corrección del regresor generado: impactos sobre las inferencias en la prueba de hipótesis". Revista de Macroeconomía . 11 (3): 383–395. doi : 10.1016 / 0164-0704 (89) 90065-7 .
- ^ Wooldridge 1997, págs. 382–383; Terza 1998
- ^ Matzkin, RL (2003). "Estimación no paramétrica de funciones aleatorias no aditivas". Econometrica . 71 (5): 1339-1375. doi : 10.1111 / 1468-0262.00452 . hdl : 10908/409 .
- ^ Blundell, R. y JL Powell (2003): endogeneidad en modelos de regresión no paramétricos y semiparamétricos. Avances en Economía y Econometría, Teoría y Aplicaciones, Octavo Congreso Mundial. Volumen II, ed. por M. Dewatripont, LP Hansen y SJ Turnovsky. Prensa de la Universidad de Cambridge, Cambridge.
Otras lecturas
- Guo, Zijian; Pequeño, Dylan S. (2016). "Estimación de variables instrumentales de función de control de modelos de efecto causal no lineal" . Revista de investigación sobre aprendizaje automático . 17 (100): 1–35.
- Wooldridge, Jeffrey M. (2015). "Métodos de función de control en econometría aplicada". Revista de Recursos Humanos . 50 (2): 420–445. doi : 10.3368 / jhr.50.2.420 .