Un modelo mixto , modelo de efectos mixtos o modelo de error-componente mixto es un modelo estadístico que contiene ambos efectos fijos y efectos aleatorios . [1] Estos modelos son útiles en una amplia variedad de disciplinas en las ciencias físicas, biológicas y sociales. Son particularmente útiles en entornos donde se realizan mediciones repetidas en las mismas unidades estadísticas ( estudio longitudinal), o cuando las mediciones se realizan en grupos de unidades estadísticas relacionadas. Debido a su ventaja al tratar con valores perdidos, los modelos de efectos mixtos a menudo se prefieren a los enfoques más tradicionales, como el análisis de varianza de medidas repetidas .
Esta página discutirá principalmente modelos lineales de efectos mixtos (= LMEM) en lugar de modelos lineales mixtos generalizados o modelos de efectos mixtos no lineales .
Historia y estado actual
Ronald Fisher introdujo modelos de efectos aleatorios para estudiar las correlaciones de valores de rasgos entre parientes. [2] En la década de 1950, Charles Roy Henderson proporcionó las mejores estimaciones lineales insesgadas de efectos fijos y las mejores predicciones lineales insesgadas de efectos aleatorios. [3] [4] [5] [6] Posteriormente, el modelado mixto se ha convertido en un área importante de investigación estadística, incluido el trabajo en el cálculo de estimaciones de máxima verosimilitud, modelos de efectos mixtos no lineales, datos faltantes en modelos de efectos mixtos y bayesianos estimación de modelos de efectos mixtos. Los modelos mixtos se aplican en muchas disciplinas donde se realizan múltiples mediciones correlacionadas en cada unidad de interés. Se utilizan de forma destacada en investigaciones que involucran a sujetos humanos y animales en campos que van desde la genética hasta el marketing, y también se han utilizado en el béisbol [7] y las estadísticas industriales. [8]
Definición
En notación matricial, un modelo lineal mixto se puede representar como
dónde
- es un vector conocido de observaciones, con media ;
- es un vector desconocido de efectos fijos;
- es un vector desconocido de efectos aleatorios, con media y matriz de varianza-covarianza ;
- es un vector desconocido de errores aleatorios, con media y varianza ;
- y son matrices de diseño conocidas que relacionan las observaciones a y , respectivamente.
Estimacion
La densidad conjunta de y Se puede escribir como: . Asumiendo normalidad,, y y maximizando la densidad articular en y , proporciona las "ecuaciones de modelo mixto" (MME) de Henderson para modelos lineales mixtos: [3] [5] [9]
Las soluciones al MME, y son las mejores estimaciones y predictores lineales insesgados para y , respectivamente. Esto es una consecuencia del teorema de Gauss-Markov cuando la varianza condicional del resultado no es escalable a la matriz de identidad. Cuando se conoce la varianza condicional, entonces la estimación de mínimos cuadrados ponderados de la varianza inversa es la mejor estimación lineal insesgada. Sin embargo, la varianza condicional rara vez o nunca se conoce. Por lo tanto, es deseable estimar conjuntamente la varianza y las estimaciones de los parámetros ponderados al resolver MME.
Un método utilizado para ajustar tales modelos mixtos es el del algoritmo de expectativa-maximización donde los componentes de la varianza se tratan como parámetros de molestia no observados en la probabilidad conjunta. [10] Actualmente, este es el método implementado para los principales paquetes de software estadístico R (lme en el paquete nlme, o efectos mixtos lineales en el paquete lme4), Python ( paquete statsmodels ), Julia (paquete MixedModels.jl) y SAS (proc mixto). La solución a las ecuaciones del modelo mixto es una estimación de máxima verosimilitud cuando la distribución de los errores es normal. [11] [12]
Ver también
Referencias
- ^ Baltagi, Badi H. (2008). Análisis econométrico de datos de panel (cuarta ed.). Nueva York: Wiley. págs. 54–55. ISBN 978-0-470-51886-1.
- ^ Fisher, RA (1918). "La correlación entre parientes sobre el supuesto de herencia mendeliana" . Transacciones de la Royal Society de Edimburgo . 52 (2): 399–433. doi : 10.1017 / S0080456800012163 .
- ^ a b Robinson, GK (1991). "Ese BLUP es una buena cosa: la estimación de efectos aleatorios" . Ciencia estadística . 6 (1): 15–32. doi : 10.1214 / ss / 1177011926 . JSTOR 2245695 .
- ^ CR Henderson; Oscar Kempthorne; SR Searle; CM von Krosigk (1959). "La estimación de tendencias ambientales y genéticas a partir de registros sujetos a sacrificio". Biometría . Sociedad Biométrica Internacional. 15 (2): 192–218. doi : 10.2307 / 2527669 . JSTOR 2527669 .
- ^ a b L. Dale Van Vleck. "Charles Roy Henderson, 1 de abril de 1911 - 14 de marzo de 1989" (PDF) . Academia Nacional de Ciencias de los Estados Unidos .
- ^ McLean, Robert A .; Sanders, William L .; Stroup, Walter W. (1991). "Un enfoque unificado de modelos lineales mixtos". El estadístico estadounidense . Asociación Estadounidense de Estadística. 45 (1): 54–64. doi : 10.2307 / 2685241 . JSTOR 2685241 .
- ^ gurú de la analítica y modelo mixto
- ^ Modelos mixtos en la industria
- ^ Henderson, CR (1973). "Evaluación de toros y tendencias genéticas" (PDF) . Revista de ciencia animal . Sociedad Americana de Ciencia Animal. 1973 : 10–41. doi : 10.1093 / ansci / 1973 Simposio 10 . Consultado el 17 de agosto de 2014 .
- ^ Lindstrom, ML; Bates, DM (1988). "Newton-Raphson y algoritmos EM para modelos lineales de efectos mixtos para datos de medidas repetidas". JASA . 83 (404): 1014–1021. doi : 10.1080 / 01621459.1988.10478693 .
- ^ Laird, Nan M .; Ware, James H. (1982). "Modelos de efectos aleatorios para datos longitudinales". Biometría . Sociedad Biométrica Internacional. 38 (4): 963–974. doi : 10.2307 / 2529876 . JSTOR 2529876 . PMID 7168798 .
- ^ Fitzmaurice, Garrett M .; Laird, Nan M .; Ware, James H. (2004). Análisis longitudinal aplicado . John Wiley e hijos. págs. 326–328.
Otras lecturas
- Gałecki, Andrzej; Burzykowski, Tomasz (2013). Modelos lineales de efectos mixtos que utilizan R: un enfoque paso a paso . Nueva York: Springer. ISBN 978-1-4614-3900-4.
- Milliken, GA; Johnson, DE (1992). Análisis de datos confusos: Vol. Experimentos diseñados . Nueva York: Chapman & Hall.
- West, BT; Welch, KB; Galecki, AT (2007). Modelos lineales mixtos: una guía práctica con software estadístico . Nueva York: Chapman & Hall / CRC.