El modelo de Fay-Herriot es un modelo estadístico que incluye algunas variaciones distintas para cada uno de varios subgrupos de observaciones. Es un modelo a nivel de área, lo que significa que algunos datos de entrada están asociados con agregados: regiones, jurisdicciones u otros subgrupos, y el modelo produce estimaciones sobre los subgrupos. El modelo generalmente se aplica en el contexto de la estimación de áreas pequeñas en las que hay muchos datos pero no muchos sobre cada subgrupo.
Los subgrupos se determinan antes de la estimación y se integran en la estructura del modelo. El modelo es del tipo de efectos aleatorios . El modelo se usa típicamente para ajustar las diferencias relacionadas con el grupo en alguna variable dependiente.
En modelos de efectos aleatorios como el de Fay-Herriot, se supone que los efectos por subgrupos se extraen independientemente de una distribución normal (gaussiana) , cuya varianza se estima a partir de los datos de cada subgrupo. Es común usar un modelo de efectos fijos para muchos grupos sistemáticamente diferentes, pero se prefiere un modelo de efectos aleatorios como el de Fay-Herriot si no hay suficientes observaciones por grupo para estimar de manera confiable los efectos fijos, o si por alguna razón los efectos fijos no se estimaría consistentemente.
El Fay-Herriot es un modelo jerárquico de dos etapas. A menudo se asume que los parámetros de las distribuciones dentro de los grupos son independientes, o se asume que están correlacionados con los medidos para otra variable.
Estructura y supuestos del modelo
En Fay-Herriot clásico (FH), los datos utilizados para la estimación son estimaciones agregadas para los subgrupos basados en encuestas.
El modelo también se puede aplicar a microdatos. Considere filas de observaciones numeradas j = 1 a J, en grupos de i = 1 a I, con datos predictivos para variable dependiente . Si el modelo incluye solo efectos aleatorios, se puede expresar mediante:
Se supone una distribución de probabilidad para los efectos aleatorios. , normalmente una distribución normal . Se puede suponer una distribución diferente, por ejemplo, si se sabe que la distribución de la muestra tiene colas pesadas. [1]
A menudo se incluyen efectos fijos, lo que lo convierte en un modelo mixto , con datos auxiliares y supuestos económicos o probabilísticos que permiten identificar estos efectos por separado unos de otros y a partir de la variación muestral.. [2]
Estimacion
Los parámetros de interés, incluidos los efectos aleatorios, se estiman juntos de forma iterativa. Los métodos pueden incluir la estimación de máxima verosimilitud , el método de momentos o una forma bayesiana. [3] [4] [5]
Los modelos de Fay-Herriot pueden caracterizarse como modelos mixtos, o en forma jerárquica , [6] o una regresión multinivel con posestratificación . [7] [8] [9] [10]
Las estimaciones resultantes para cada área (subgrupo) son promedios ponderados de las estimaciones directas y estimaciones indirectas basadas en estimaciones de variaciones.
Pruebas de consistencia
Para que los modelos de efectos aleatorios hagan estimaciones consistentes , es necesario que los efectos específicos del subgrupo no estén correlacionados con las otras variables predictoras del modelo. Esa correlación se puede probar ejecutando los modelos de efectos fijos y de efectos aleatorios y luego aplicando la prueba de especificación de Hausman . Si la prueba rechaza la hipótesis de que no están correlacionados, entonces la estimación de efectos aleatorios estaría sesgada, pero los efectos fijos no lo estarían.
Historia
Robert Fay y Roger Herriot de la Oficina del Censo de EE. UU. Desarrollaron el modelo para hacer estimaciones de las poblaciones en cada una de las muchas regiones geográficas. Los autores se refirieron al método como un procedimiento de James-Stein y no utilizaron el término "efectos aleatorios". [11] Es un modelo a nivel de área . [12] El modelo ha sido utilizado con el mismo propósito, llamado estimación de área pequeña, por otras agencias gubernamentales de Estados Unidos. [6] [13]
El texto de estimación de áreas pequeñas de Rao y Molina a veces se caracteriza como una fuente definitiva sobre el modelo FH. [14]
Aplicaciones
El modelo FH se utiliza ampliamente en el programa de Estimaciones de pobreza e ingresos de áreas pequeñas (SAIPE) de la Oficina del Censo de EE. UU. [15]
Referencias
- ^ Julie B. Gershunskaya; Terrance D. Savitsky. Modelado de efectos latentes dependientes para la estimación de encuestas con aplicación a las encuestas de estadísticas de empleo actuales . Actas JSM 2016.
- ^ Pushpal K. Mukhopadhyay y Allen McDowell. Estimación de áreas pequeñas para el análisis de datos de encuestas con el software SAS® Paper 336-2011. SAS Institute Inc.
- ^ Roberto Benavent; Domingo Morales. 2016. Modelos multivariados de Fay-Herriot para estimación de áreas pequeñas . Estadística computacional y análisis de datos 94, 372-390 https://doi.org/10.1016/j.csda.2015.07.013
- ^ Aaron T. Porter; Scott H. Holan; Christopher K. Wikle; Noel Cressie. 2013. Modelos espaciales de Fay-Herriot para la estimación de áreas pequeñas con covariables funcionales arXiv: 1303.6668
- ^ Isabel Molina; Yolanda Marhuenda. 2015. sae: Un paquete R para la estimación de áreas pequeñas . The R Journal 7: 1, páginas 81-98.
- ^ a b Cruze, Nathan B. 2018. Ajuste de un modelo bayesiano de Fay-Herriot . Presentación a WSS.
- ^ Aaron T. Porter; Scott H. Holan; Christopher K. Wikle; Noel Cressie . Modelos espaciales de Fay-Herriot para la estimación de áreas pequeñas con covariables funcionales
- ^ Julie Gershunskaya; Terrance D. Savitsky. 2018. Estimación robusta en presencia de desviaciones de la linealidad en modelos de dominio pequeño . Reuniones estadísticas conjuntas 2018, Sección de métodos de investigación de encuestas. págs. 595-614.
- ^ Lou Rizzo; J. Michael Brick. 2017. Búsqueda de literatura sobre la combinación de registros administrativos y de encuestas . Orden de trabajo 2, BLS BPA 1625DC-17-A-0001. La página C-5 explica el estimador de parámetros de Fay-Herriot después de ejecutar el modelo; no es una regresión lineal cuyo coeficiente se usa directamente.
- ^ Brendan Halpin. 2012. Modelos de efectos fijos y aleatorios Apuntes del curso de Sociología. Universidad de Limerick.
- ^ Fay, Robert. MI.; Roger A. Herriot. 1979. Estimaciones de ingresos para lugares pequeños: una aplicación de los procedimientos de James-Stein a los datos del censo. Revista de la Asociación Estadounidense de Estadística , vol. 74, núm. 366 (junio de 1979), págs. 269-277. jstor
- ^ https://www150.statcan.gc.ca/n1/pub/12-001-x/2016001/article/14540/03-eng.htm
- ^ Lee Baker; Taylor Le; Nicholas Rose. 2017. Uso de la macroedición por parte de la agencia de estadística en la estimación de empleo por área industrial . Reuniones estadísticas conjuntas, Sección de Estadísticas Sociales.
- ^ JNK Rao e Isabel Molina. 2015. Estimación de áreas pequeñas . Wiley & Sons. ISBN 9781118735787
- ^ https://www.census.gov/programs-surveys/saipe.html