El modelo lineal general o el modelo de regresión multivariante general es una forma compacta de escribir simultáneamente varios modelos de regresión lineal múltiple . En ese sentido, no es un modelo lineal estadístico separado . Los diversos modelos de regresión lineal múltiple se pueden escribir de forma compacta como [1]
donde Y es una matriz con una serie de medidas multivariadas (cada columna es un conjunto de medidas en una de las variables dependientes ), X es una matriz de observaciones sobre variables independientes que podría ser una matriz de diseño (cada columna es un conjunto de observaciones sobre una de las variables independientes), B es una matriz que contiene parámetros que suelen ser estimados y U es una matriz que contiene errores (ruido). Por lo general, se supone que los errores no están correlacionados entre las mediciones y siguen una distribución normal multivariante . Si los errores no siguen una distribución normal multivariante, modelos lineales generalizados se pueden usar para relajarse suposiciones acerca de Y y U .
El modelo lineal general incorpora varios modelos estadísticos diferentes: ANOVA , ANCOVA , MANOVA , MANCOVA , regresión lineal ordinaria , t -test y F -test . El modelo lineal general es una generalización de la regresión lineal múltiple al caso de más de una variable dependiente. Si Y , B y U fueran vectores de columna , la ecuación matricial anterior representaría una regresión lineal múltiple.
Las pruebas de hipótesis con el modelo lineal general se pueden realizar de dos formas: multivariante o como varias pruebas univariadas independientes . En las pruebas multivariadas, las columnas de Y se prueban juntas, mientras que en las pruebas univariadas las columnas de Y se prueban de forma independiente, es decir, como múltiples pruebas univariadas con la misma matriz de diseño.
Comparación con la regresión lineal múltiple
La regresión lineal múltiple es una generalización de la regresión lineal simple al caso de más de una variable independiente, y un caso especial de modelos lineales generales, restringido a una variable dependiente. El modelo básico para la regresión lineal múltiple es
para cada observación i = 1, ..., n .
En la fórmula anterior, consideramos n observaciones de una variable dependiente yp variables independientes. Por tanto, Y i es la i- ésima observación de la variable dependiente, X ij es la i- ésima observación de la j- ésima variable independiente, j = 1, 2, ..., p . Los valores β j representan parámetros a estimar, y ε i es el i- ésimo error normal independiente distribuido idénticamente.
En la regresión lineal multivariante más general, hay una ecuación de la forma anterior para cada una de m > 1 variables dependientes que comparten el mismo conjunto de variables explicativas y, por lo tanto, se estiman simultáneamente entre sí:
para todas las observaciones indexadas como i = 1, ..., ny para todas las variables dependientes indexadas como j = 1, ..., m .
Tenga en cuenta que, dado que cada variable dependiente tiene su propio conjunto de parámetros de regresión para ajustar, desde un punto de vista computacional, la regresión multivariante general es simplemente una secuencia de regresiones lineales múltiples estándar que utilizan las mismas variables explicativas.
Comparación con el modelo lineal generalizado
El modelo lineal general y el modelo lineal generalizado (GLM) [2] [3] son dos familias de métodos estadísticos de uso común para relacionar cierto número de predictores continuos y / o categóricos con una única variable de resultado .
La principal diferencia entre los dos enfoques es que el modelo lineal general asume estrictamente que los residuos seguirán una distribución condicionalmente normal , [4] mientras que el GLM relaja este supuesto y permite una variedad de otras distribuciones de la familia exponencial para los residuos. [2] Es de destacar que el modelo lineal general es un caso especial del GLM en el que la distribución de los residuos sigue una distribución condicionalmente normal.
La distribución de los residuos depende en gran medida del tipo y distribución de la variable de resultado; diferentes tipos de variables de resultado conducen a la variedad de modelos dentro de la familia GLM. Los modelos comúnmente utilizados en la familia GLM incluyen regresión logística binaria [5] para resultados binarios o dicotómicos, regresión de Poisson [6] para resultados de recuento y regresión lineal para resultados continuos distribuidos normalmente. Esto significa que se puede hablar de GLM como una familia general de modelos estadísticos o como modelos específicos para tipos de resultados específicos.
Modelo linear general | Modelo lineal generalizado | |
---|---|---|
Método de estimación típico | Mínimos cuadrados , mejor predicción lineal insesgada | Máxima probabilidad o bayesiano |
Ejemplos de | ANOVA , ANCOVA , regresión lineal | regresión lineal , regresión logística , regresión de Poisson , regresión gamma, [7] modelo lineal general |
Extensiones y métodos relacionados | MANOVA , MANCOVA , modelo lineal mixto | modelo lineal mixto generalizado (GLMM), ecuaciones de estimación generalizadas (GEE) |
Paquete y función R | lm () en el paquete de estadísticas (base R) | glm () en el paquete de estadísticas (base R) |
Función Matlab | mvregress () | glmfit () |
Procedimientos SAS | PROC GLM , PROC REG | PROC GENMOD , PROC LOGISTIC (para resultados categóricos binarios y ordenados o no ordenados) |
Comando Stata | regreso | glm |
Comando de SPSS | regresión , glm | genlin, logístico |
Función de Wolfram Language & Mathematica | LinearModelFit [] [8] | GeneralizedLinearModelFit [] [9] |
Comando EViews | ls [10] | glm [11] |
Aplicaciones
Una aplicación del modelo lineal general aparece en el análisis de múltiples escáneres cerebrales en experimentos científicos donde Y contiene datos de escáneres cerebrales, X contiene variables de diseño experimental y factores de confusión. Por lo general, se prueba de una manera univariante (generalmente se denomina univariante de masa en esta configuración) y, a menudo, se denomina mapeo paramétrico estadístico . [12]
Ver también
- Regresión lineal multivariante bayesiana
Notas
- ^ KV Mardia , JT Kent y JM Bibby (1979). Análisis multivariado . Prensa académica . ISBN 0-12-471252-5.
- ^ a b McCullagh, P .; Nelder, JA (1989), "Un esquema de modelos lineales generalizados", Modelos lineales generalizados , Springer US, págs. 21–47, doi : 10.1007 / 978-1-4899-3242-6_2 , ISBN 9780412317606
- ↑ Fox, J. (2015). Análisis de regresión aplicado y modelos lineales generalizados . Publicaciones Sage.
- ^ Cohen, J., Cohen, P., West, SG y Aiken, LS (2003). Análisis de regresión / correlación múltiple aplicado para las ciencias del comportamiento.
- ^ Hosmer Jr, DW, Lemeshow, S. y Sturdivant, RX (2013). Regresión logística aplicada (Vol. 398). John Wiley e hijos.
- ^ Gardner, W .; Mulvey, EP; Shaw, CE (1995). "Análisis de regresión de recuentos y tasas: Poisson, Poisson sobredispersado y modelos binomiales negativos". Boletín psicológico . 118 (3): 392–404. doi : 10.1037 / 0033-2909.118.3.392 .
- ^ McCullagh, Peter ; Nelder, John (1989). Modelos lineales generalizados, segunda edición . Boca Raton: Chapman y Hall / CRC. ISBN 978-0-412-31760-6.
- ^ LinearModelFit , Centro de documentación de Wolfram Language.
- ^ GeneralizedLinearModelFit , Centro de documentación de Wolfram Language.
- ^ ls , Ayuda de EViews.
- ^ glm , Ayuda de EViews.
- ^ KJ Friston; AP Holmes; KJ Worsley; J.-B. Poline; CD Frith; RSJ Frackowiak (1995). "Mapas estadísticos paramétricos en imágenes funcionales: un enfoque lineal general". Cartografía del cerebro humano . 2 (4): 189–210. doi : 10.1002 / hbm.460020402 .
Referencias
- Christensen, Ronald (2002). Respuestas planas a preguntas complejas: la teoría de los modelos lineales (tercera edición). Nueva York: Springer. ISBN 0-387-95361-2.
- Wichura, Michael J. (2006). El enfoque sin coordenadas de los modelos lineales . Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge: Cambridge University Press. págs. xiv + 199. ISBN 978-0-521-86842-6. Señor 2283455 .
- Rawlings, John O .; Pantula, Sastry G .; Dickey, David A., eds. (1998). "Análisis de regresión aplicado". Springer Texts in Statistics. doi : 10.1007 / b98890 . ISBN 0-387-98454-2. Cite journal requiere
|journal=
( ayuda )