Modelo mixto lineal generalizado

En estadística , un modelo lineal mixto generalizado (GLMM) es una extensión del modelo lineal generalizado (GLM) en el que el predictor lineal contiene efectos aleatorios además de los efectos fijos habituales . ^[1]^[2]^[3] También heredan de los GLM la idea de extender los modelos lineales mixtos a datos no normales .

Los GLMM proporcionan una amplia gama de modelos para el análisis de datos agrupados, ya que las diferencias entre grupos pueden modelarse como un efecto aleatorio. Estos modelos son útiles en el análisis de muchos tipos de datos, incluidos los datos longitudinales . ^[4]

Modelo

Los GLMM generalmente se definen de tal manera que, condicionados a los efectos aleatorios ${\ Displaystyle u}$ , la variable dependiente ${\ Displaystyle y}$ se distribuye de acuerdo con la familia exponencial con su expectativa relacionada con el predictor lineal ${\ textstyle X \ beta + Zu}$ a través de una función de enlace ${\ textstyle g}$ :

{\ Displaystyle g (E [y \ vert u]) = X \ beta + Zu}

.

Aquí ${\ textstyle X}$ y ${\ textstyle \ beta}$ son la matriz de diseño de efectos fijos y efectos fijos; ${\ textstyle Z}$ y ${\ textstyle u}$ son la matriz de diseño de efectos aleatorios y los efectos aleatorios. Para comprender esta breve definición, primero deberá comprender la definición de un modelo lineal generalizado y de un modelo mixto .

Los modelos lineales mixtos generalizados son casos especiales de modelos lineales generalizados jerárquicos en los que los efectos aleatorios se distribuyen normalmente.

La probabilidad completa ^[5]

{\ Displaystyle \ ln {p} (y, u) = \ ln \ int p (y \ vert u) p (u) du}

no tiene una forma cerrada general, y la integración sobre los efectos aleatorios suele ser extremadamente intensiva desde el punto de vista computacional. Además de aproximar numéricamente esta integral (por ejemplo, a través de la cuadratura de Gauss-Hermite ), se han propuesto métodos motivados por la aproximación de Laplace. ^[6] Por ejemplo, el método de cuasi-verosimilitud penalizado, que esencialmente implica ajustar repetidamente (es decir, doblemente iterativo) un modelo mixto normal ponderado con una variante de trabajo, ^[7] es implementado por varios programas estadísticos comerciales y de código abierto.

Ajuste de un modelo

Ajustar los GLMM a través de la máxima probabilidad (como a través de AIC ) implica la integración de los efectos aleatorios. En general, esas integrales no se pueden expresar en forma analítica . Se han desarrollado varios métodos aproximados, pero ninguno tiene buenas propiedades para todos los modelos y conjuntos de datos posibles (por ejemplo, los datos binarios no agrupados son particularmente problemáticos). Por esta razón, los métodos que involucran la cuadratura numérica o la cadena de Markov Monte Carlo se han utilizado cada vez más, ya que el aumento de la potencia de cálculo y los avances en los métodos los han hecho más prácticos.

El criterio de información de Akaike (AIC) es un criterio común para la selección del modelo . Recientemente se han obtenido estimaciones de AIC para GLMM basadas en ciertas distribuciones de familias exponenciales . ^[8]

Software

Varios paquetes contribuidos en R proporcionan funcionalidad GLMM ^[9]^[10]
GLMM se puede instalar utilizando SAS y SPSS ^[11]
Matlab también proporciona una función llamada "fitglme" para adaptarse a los modelos GLMM.
El paquete Python Statsmodels admite la implementación binomial y poisson ^[12]

Ver también

Referencias

^ Breslow, NE; Clayton, DG (1993), "Inferencia aproximada en modelos lineales mixtos generalizados", Revista de la Asociación Estadounidense de Estadística , 88 (421): 9-25, doi : 10.2307 / 2290687 , JSTOR 2290687
^ Stroup, WW (2012), Modelos lineales mixtos generalizados , CRC Press
^ Jiang, J. (2007), Modelos lineales y lineales mixtos generalizados y sus aplicaciones , Springer
^ Fitzmaurice, GM; Laird, NM; Ware, J .. (2011), Applied Longitudinal Analysis (2.a ed.), John Wiley & Sons , ISBN 978-0-471-21487-8
^ Pawitan, Yudi. En toda verosimilitud: modelado estadístico e inferencia usando verosimilitud (edición de bolsillo). OUP Oxford. pag. 459. ISBN 978-0199671229.
^ Breslow, NE; Clayton, DG (20 de diciembre de 2012). "Inferencia aproximada en modelos mixtos lineales generalizados". Revista de la Asociación Estadounidense de Estadística . 88 (421): 9-25. doi : 10.1080 / 01621459.1993.10594284 .
^ Wolfinger, Russ; O'connell, Michael (diciembre de 1993). "Modelos mixtos lineales generalizados un enfoque de pseudo-verosimilitud". Revista de Computación y Simulación Estadística . 48 (3–4): 233–243. doi : 10.1080 / 00949659308811554 .
^ Saefken, B .; Kneib, T .; van Waveren, C.-S .; Greven, S. (2014), "Un enfoque unificador para la estimación de la información condicional de Akaike en modelos mixtos lineales generalizados" (PDF) , Electronic Journal of Statistics , 8 : 201–225, doi : 10.1214 / 14-EJS881
^ Pinheiro, JC; Bates, DM (2000), modelos de efectos mixtos en S y S-PLUS , Springer, Nueva York
^ Berridge, DM; Crouchley, R. (2011), Modelos mixtos lineales generalizados multivariados con R , CRC Press
^ "Centro de conocimiento de IBM" . www.ibm.com . Consultado el 6 de diciembre de 2017 .
^ "Documentación de Statsmodels" . www.statsmodels.org . Consultado el 17 de marzo de 2021 .

[1] Breslow, NE; Clayton, DG (1993), "Inferencia aproximada en modelos lineales mixtos generalizados", Revista de la Asociación Estadounidense de Estadística , 88 (421): 9-25, doi : 10.2307 / 2290687 , JSTOR 2290687

[2] Stroup, WW (2012), Modelos lineales mixtos generalizados , CRC Press

[3] Jiang, J. (2007), Modelos lineales y lineales mixtos generalizados y sus aplicaciones , Springer

[4] Fitzmaurice, GM; Laird, NM; Ware, J .. (2011), Applied Longitudinal Analysis (2.a ed.), John Wiley & Sons , ISBN 978-0-471-21487-8

[5] Pawitan, Yudi. En toda verosimilitud: modelado estadístico e inferencia usando verosimilitud (edición de bolsillo). OUP Oxford. pag. 459. ISBN 978-0199671229.

[6] Breslow, NE; Clayton, DG (20 de diciembre de 2012). "Inferencia aproximada en modelos mixtos lineales generalizados". Revista de la Asociación Estadounidense de Estadística . 88 (421): 9-25. doi : 10.1080 / 01621459.1993.10594284 .

[7] Wolfinger, Russ; O'connell, Michael (diciembre de 1993). "Modelos mixtos lineales generalizados un enfoque de pseudo-verosimilitud". Revista de Computación y Simulación Estadística . 48 (3–4): 233–243. doi : 10.1080 / 00949659308811554 .

[Saefken-8] Saefken, B .; Kneib, T .; van Waveren, C.-S .; Greven, S. (2014), "Un enfoque unificador para la estimación de la información condicional de Akaike en modelos mixtos lineales generalizados" (PDF) , Electronic Journal of Statistics , 8 : 201–225, doi : 10.1214 / 14-EJS881

[9] Pinheiro, JC; Bates, DM (2000), modelos de efectos mixtos en S y S-PLUS , Springer, Nueva York

[10] Berridge, DM; Crouchley, R. (2011), Modelos mixtos lineales generalizados multivariados con R , CRC Press

[11] "Centro de conocimiento de IBM" . www.ibm.com . Consultado el 6 de diciembre de 2017 .

[12] "Documentación de Statsmodels" . www.statsmodels.org . Consultado el 17 de marzo de 2021 .

[1]