En estadística , un modelo de efectos fijos es un modelo estadístico en el que los parámetros del modelo son cantidades fijas o no aleatorias. Esto contrasta con los modelos de efectos aleatorios y los modelos mixtos en los que todos o algunos de los parámetros del modelo son variables aleatorias. En muchas aplicaciones, incluidas la econometría [1] y la bioestadística [2] [3] [4] [5], un modelo de efectos fijos se refiere a un modelo de regresión en el que las medias de grupo son fijas (no aleatorias) en contraposición a un modelo de efectos aleatorios. en el que las medias del grupo son una muestra aleatoria de una población. [6]Generalmente, los datos se pueden agrupar de acuerdo con varios factores observados. Las medias de los grupos se pueden modelar como efectos fijos o aleatorios para cada agrupación. En un modelo de efectos fijos, la media de cada grupo es una cantidad fija específica del grupo.
En los datos de panel donde existen observaciones longitudinales para el mismo sujeto, los efectos fijos representan los medios específicos del sujeto. En el análisis de datos de panel, el término estimador de efectos fijos (también conocido como estimador interno ) se utiliza para referirse a un estimador de los coeficientes en el modelo de regresión, incluidos los efectos fijos (una intersección invariante en el tiempo para cada sujeto).
Descripción cualitativa
Dichos modelos ayudan a controlar el sesgo de las variables omitidas debido a la heterogeneidad no observada cuando esta heterogeneidad es constante en el tiempo. Esta heterogeneidad se puede eliminar de los datos mediante la diferenciación, por ejemplo, restando el promedio a nivel de grupo a lo largo del tiempo, o tomando una primera diferencia que eliminará los componentes invariantes en el tiempo del modelo.
Hay dos supuestos comunes sobre el efecto específico individual: el supuesto de efectos aleatorios y el supuesto de efectos fijos. El supuesto de efectos aleatorios es que los efectos específicos de cada individuo no están correlacionados con las variables independientes. El supuesto de efectos fijos es que los efectos específicos de cada individuo están correlacionados con las variables independientes. Si se cumple el supuesto de efectos aleatorios, el estimador de efectos aleatorios es más eficiente que el estimador de efectos fijos. Sin embargo, si este supuesto no se cumple, el estimador de efectos aleatorios no es consistente . La prueba de Durbin-Wu-Hausman se utiliza a menudo para discriminar entre los modelos de efectos fijos y aleatorios. [7] [8]
Modelo formal y supuestos
Considere el modelo lineal de efectos no observados para observaciones y períodos de tiempo:
- por y
Dónde:
- es la variable dependiente observada para el individuo en el momento .
- es la variante de tiempo (el número de variables independientes) vector regresor.
- es el matriz de parámetros.
- es el efecto individual invariante en el tiempo no observado. Por ejemplo, la capacidad innata de los individuos o los factores históricos e institucionales de los países.
- es el término de error .
a diferencia de , no se puede observar directamente.
A diferencia del modelo de efectos aleatorios donde lo no observado es independiente de para todos , el modelo de efectos fijos (FE) permite correlacionarse con la matriz regresora . Exogeneidad estricta con respecto al término de error idiosincrásico todavía es necesario.
Estimación estadística
Estimador de efectos fijos
Desde no es observable, no se puede controlar directamente . El modelo FE eliminadegradando las variables usando la transformación interior :
dónde , , y .
Desde es constante, y por tanto se elimina el efecto. El estimador de FE luego se obtiene mediante una regresión MCO de en .
Existen al menos tres alternativas a la transformación interior con variaciones.
Uno es agregar una variable ficticia para cada individuo (omitiendo el primer individuo debido a la multicolinealidad ). Esto es numéricamente, pero no computacionalmente, equivalente al modelo de efectos fijos y solo funciona si la suma del número de series y el número de parámetros globales es menor que el número de observaciones. [9] El enfoque de variable ficticia es particularmente exigente con respecto al uso de la memoria de la computadora y no se recomienda para problemas más grandes que la RAM disponible y que la compilación del programa aplicado puede acomodar.
La segunda alternativa es utilizar el enfoque de reiteraciones consecutivas para estimaciones locales y globales. [10] Este enfoque es muy adecuado para sistemas de memoria baja en los que es mucho más eficiente computacionalmente que el enfoque de variable ficticia.
El tercer enfoque es una estimación anidada mediante la cual la estimación local para series individuales se programa como parte de la definición del modelo. [11] Este enfoque es el más eficiente desde el punto de vista computacional y de memoria, pero requiere habilidades de programación competentes y acceso al código de programación del modelo; aunque se puede programar incluso en SAS. [12] [13]
Finalmente, cada una de las alternativas anteriores puede mejorarse si la estimación específica de la serie es lineal (dentro de un modelo no lineal), en cuyo caso la solución lineal directa para series individuales se puede programar como parte de la definición del modelo no lineal. [14]
Estimador de primera diferencia
Una alternativa a la transformación interna es la primera transformación de diferencias , que produce un estimador diferente. Para:
El estimador FD luego se obtiene mediante una regresión MCO de en .
Cuándo , los estimadores de primera diferencia y efectos fijos son numéricamente equivalentes. Para, no son. Si los términos de errorson homocedásticos sin correlación serial , el estimador de efectos fijos es más eficiente que el estimador de primera diferencia. Sisigue una caminata aleatoria , sin embargo, el primer estimador de diferencias es más eficiente. [15]
Igualdad de efectos fijos y estimadores de primera diferencia cuando T = 2
Para el caso especial de dos períodos (), el estimador de efectos fijos (FE) y el estimador de primera diferencia (FD) son numéricamente equivalentes. Esto se debe a que el estimador FE "duplica el conjunto de datos" utilizado en el estimador FD. Para ver esto, establezca que el estimador de efectos fijos es:
Desde cada uno se puede reescribir como , reescribiremos la línea como:
Método de Chamberlain
El método de Gary Chamberlain , una generalización del estimador interno, reemplazacon su proyección lineal sobre las variables explicativas. Escribiendo la proyección lineal como:
esto da como resultado la siguiente ecuación:
que puede estimarse mediante estimación de distancia mínima . [dieciséis]
Método de Hausman-Taylor
Necesita tener más de un regresor variable en el tiempo () y regresor invariante en el tiempo () y al menos uno y uno que no están correlacionados con .
Particionar el y variables tales que dónde y no están correlacionados con . Necesitar.
Estimación a través de OLS en utilizando y como instrumentos produce una estimación coherente.
Generalización con incertidumbre de entrada
Cuando hay incertidumbre de entrada para el datos, , entonces el debe minimizarse el valor, en lugar de la suma de los residuos al cuadrado. [17] Esto se puede lograr directamente a partir de las reglas de sustitución:
- ,
luego los valores y desviaciones estándar para y se puede determinar mediante el análisis clásico de mínimos cuadrados ordinarios y la matriz de varianza-covarianza .
Prueba de efectos fijos (FE) frente a efectos aleatorios (RE)
Podemos probar si un modelo de efectos fijos o aleatorios es apropiado usando una prueba de Durbin-Wu-Hausman .
- :
- :
Si es cierto, ambos y son consistentes, pero solo es eficiente. Si es verdad, es consistente y no es.
- dónde
La prueba de Hausman es una prueba de especificación, por lo que un estadístico de prueba grande podría indicar que puede haber errores en las variables (EIV) o que nuestro modelo está mal especificado. Si la suposición de FE es cierta, deberíamos encontrar que.
Una simple heurística es que si podría haber EIV.
Ver también
- Modelo de efectos aleatorios
- Modelo mixto
- Modelo dinámico de efectos no observados
- Modelo de Poisson de efectos fijos
Notas
- ^ Greene, WH, 2011. Análisis econométrico , 7ª ed., Prentice Hall.
- ^ Diggle, Peter J .; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Análisis de datos longitudinales (2ª ed.). Prensa de la Universidad de Oxford. págs. 169-171. ISBN 0-19-852484-6.
- ^ Fitzmaurice, Garrett M .; Laird, Nan M .; Ware, James H. (2004). Análisis longitudinal aplicado . Hoboken: John Wiley & Sons. págs. 326–328. ISBN 0-471-21487-6.
- ^ Laird, Nan M .; Ware, James H. (1982). "Modelos de efectos aleatorios para datos longitudinales". Biometría . 38 (4): 963–974. JSTOR 2529876 .
- ^ Gardiner, Joseph C .; Luo, Zhehui; Roman, Lee Anne (2009). "Efectos fijos, efectos aleatorios y GEE: ¿Cuáles son las diferencias?". Estadística en Medicina . 28 : 221-239. doi : 10.1002 / sim.3478 .
- ^ Ramsey, F., Schafer, D., 2002. El detective estadístico: un curso en métodos de análisis de datos , 2ª ed. Prensa de Duxbury
- ^ Cameron, A. Colin; Trivedi, Pravin K. (2005). Microeconometría: métodos y aplicaciones . Prensa de la Universidad de Cambridge. págs. 717-19.
- ^ Nerlove, Marc (2005). Ensayos en Econometría de datos de panel . Prensa de la Universidad de Cambridge. págs. 36–39.
- ^ García, Oscar. (1983). "Un modelo de ecuación diferencial estocástica para el crecimiento en altura de las masas forestales". Biometría : 1059–1072.
- ^ Tait, David; Cieszewski, Chris J .; Bella, Imre E. (1986). "La dinámica del rodal del pino lodgepole". Lata. J. Para. Res . 18 : 1255-1260.
- ^ Strub, Mike; Cieszewski, Chris J. (2006). "Propiedades de invariancia de edad base de dos técnicas para estimar los parámetros de los modelos de índice de sitio". Ciencia forestal . 52 (2): 182–186.
- ^ Strub, Mike; Cieszewski, Chris J. (2003). "Ajuste de los parámetros de índice de sitio global cuando el índice de sitio de parcela o árbol se trata como un parámetro de molestia local. En: Burkhart HA, editor. Actas del Simposio sobre estadísticas y tecnología de la información en el sector forestal; del 8 al 12 de septiembre de 2002; Blacksburg, Virginia: Virginia Polytechnic Instituto y Universidad Estatal ": 97–107. Cite journal requiere
|journal=
( ayuda ) - ^ Cieszewski, Chris J .; Harrison, Mike; Martin, Stacey W. (2000). "Métodos prácticos para estimar parámetros no sesgados en modelos autoreferenciados de crecimiento y rendimiento" (PDF) . Informe técnico del PMRC . 2000 (7): 12.
- ^ Schnute, Jon; McKinnell, Skip (1984). "Un enfoque biológicamente significativo para el análisis de superficie de respuesta". Lata. J. Fish. Aquat. Sci . 41 : 936–953.
- ^ Wooldridge, Jeffrey M. (2001). Análisis econométrico de datos de panel y de sección transversal . Prensa del MIT. pp. 279 -291. ISBN 978-0-262-23219-7.
- ^ Chamberlain, Gary (1984). "Capítulo 22 Datos del panel". 2 : 1247-1318. doi : 10.1016 / S1573-4412 (84) 02014-6 . ISSN 1573-4412 . Cite journal requiere
|journal=
( ayuda ) - ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M .; Pueyo, Laurent; Debes, John H .; Poteet, Charles A .; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A .; Hines, Dean C .; Schneider, Glenn; Soummer, Rémi (2018). "Una década de imágenes de disco MWC 758: ¿dónde están los planetas impulsores de brazo en espiral?". Las cartas de la revista astrofísica . 857 : L9. arXiv : 1803.06776 . Código Bibliográfico : 2018ApJ ... 857L ... 9R . doi : 10.3847 / 2041-8213 / aab7f5 .
Referencias
- Christensen, Ronald (2002). Respuestas planas a preguntas complejas: la teoría de los modelos lineales (tercera edición). Nueva York: Springer. ISBN 0-387-95361-2.
- Gujarati, Damodar N .; Porter, Dawn C. (2009). "Modelos de regresión de datos de panel". Econometría básica (Quinta ed. Internacional). Boston: McGraw-Hill. págs. 591–616. ISBN 978-007-127625-2.
- Hsiao, Cheng (2003). "Modelos de efectos fijos" . Análisis de datos de panel (2ª ed.). Nueva York: Cambridge University Press. págs. 95-103. ISBN 0-521-52271-4.
- Wooldridge, Jeffrey M. (2013). "Estimación de efectos fijos". Econometría introductoria: un enfoque moderno (Quinta edición internacional). Mason, OH: Sudoeste. págs. 466–474. ISBN 978-1-111-53439-4.
enlaces externos
- Modelos de efectos fijos y aleatorios
- Ejemplos de todos los modelos ANOVA y ANCOVA con hasta tres factores de tratamiento, incluidos bloques aleatorios, parcelas divididas, medidas repetidas y cuadrados latinos, y su análisis en R