En la estadística aplicada, los modelos fraccionarios están, hasta cierto punto, relacionados con los modelos de respuesta binaria . Sin embargo, en lugar de estimar la probabilidad de estar en un contenedor de una variable dicotómica , el modelo fraccional generalmente trata con variables que toman todos los valores posibles en el intervalo unitario . Se puede generalizar fácilmente este modelo para tomar valores en cualquier otro intervalo mediante transformaciones apropiadas. [1] Los ejemplos van desde las tasas de participación en los planes 401 (k) [2] hasta las clasificaciones televisivas de los juegos de la NBA . [3]
Descripción
Ha habido dos enfoques para modelar este problema. Aunque ambos se basan en un índice que es lineal en x i combinado con una función de enlace , [4] esto no es estrictamente necesario. El primer enfoque utiliza una transformación logarítmica de y como función lineal de x i , es decir,. Este enfoque es problemático por dos razones distintas. La variable y no puede tomar los valores límite 1 y 0, y la interpretación de los coeficientes no es sencilla. El segundo enfoque evita estos problemas utilizando la regresión logística como una función de enlace. Más específicamente,
Inmediatamente queda claro que esta configuración es muy similar al modelo logit binario , con la diferencia de que la variable y puede tomar valores en el intervalo unitario. Muchas de las técnicas de estimación para el modelo logit binario, como los mínimos cuadrados no lineales y cuasi-MLE , se transfieren de forma natural, al igual que los ajustes de heterocedasticidad y los cálculos de efectos parciales . [5]
Se han proporcionado extensiones a este modelo transversal que permiten tener en cuenta importantes cuestiones econométricas, como las variables explicativas endógenas y los efectos heterogéneos no observados. Bajo supuestos de exogeneidad estrictos , es posible diferenciar estos efectos no observados utilizando técnicas de datos de panel , aunque los supuestos de exogeneidad más débiles también pueden resultar en estimadores consistentes. [6] También se han propuesto técnicas de función de control para abordar los problemas de endogeneidad. [7]
Referencias
- ^ Wooldridge, J. (2002): Análisis econométrico de datos de panel y sección transversal , MIT Press, Cambridge, Mass.
- ^ Papke, LE y JM Wooldridge (1996): "Métodos econométricos para variables de respuesta fraccional con una aplicación a las tasas de participación del plan 401 (k)". Journal of Applied Econometrics (11), págs. 619–632
- ^ Hausman, JA y GK Leonard (1997): "Superestrellas en la Asociación Nacional de Baloncesto: Valor económico y política". Journal of Labor Economics (15), págs. 586–624
- ^ McCullagh, P. y JA Nelder (1989): modelos lineales generalizados , monografías de CRC sobre estadística y probabilidad aplicada (libro 37), segunda edición, Chapman y Hall, Londres.
- ^ Wooldridge, J. (2002): Análisis econométrico de datos de panel y sección transversal , MIT Press, Cambridge, Mass.
- ^ Papke, LE y JM Wooldridge (1996): "Métodos de datos de panel para variables de respuesta fraccional con una aplicación para probar las tasas de aprobación". Journal of Econometrics (145), págs. 121-133
- ^ Wooldridge, JM (2005): "heterogeneidad no observada y estimación de efectos parciales promedio". Identificación e inferencia para modelos econométricos: ensayos en honor a Thomas Rothenberg, ed. por Andrews, DWK y JH Stock, Cambridge University Press, Cambridge, págs. 27–55