Ecuación de estimación generalizada

En estadística , se utiliza una ecuación de estimación generalizada (GEE) para estimar los parámetros de un modelo lineal generalizado con una posible correlación desconocida entre los resultados. ^[1]^[2]

Las estimaciones de los parámetros del GEE son consistentes incluso cuando la estructura de covarianza está mal especificada, en condiciones de regularidad leve. El enfoque del GEE es estimar la respuesta promedio sobre la población (efectos "promediados de la población") en lugar de los parámetros de regresión que permitirían predecir el efecto de cambiar una o más covariables en un individuo dado. Los GEE se suelen utilizar junto con el error estándar de Huber-White.estimaciones, también conocidas como estimaciones de "error estándar robusto" o "varianza sándwich". En el caso de un modelo lineal con una estructura de varianza de independencia de trabajo, estos se conocen como estimadores de "error estándar consistente de heterocedasticidad". De hecho, el GEE unificó varias formulaciones independientes de estos estimadores de error estándar en un marco general.

Los GEE pertenecen a una clase de técnicas de regresión que se denominan semiparamétricas porque se basan en la especificación de solo los dos primeros momentos . Son una alternativa popular al modelo mixto lineal generalizado basado en verosimilitud , que es más sensible a la especificación de la estructura de varianza. ^[3] Se utilizan comúnmente en grandes estudios epidemiológicos , especialmente en estudios de cohortes de múltiples sitios , porque pueden manejar muchos tipos de dependencia no medida entre resultados.

Dado un modelo medio para el sujeto y el tiempo que depende de los parámetros de regresión y la estructura de la varianza , la ecuación de estimación se forma mediante: ^[4] ${\ Displaystyle \ mu _ {ij}}$ ${\ Displaystyle i}$ ${\ Displaystyle j}$ ${\ Displaystyle \ beta _ {k}}$ ${\ Displaystyle V_ {i}}$

Los parámetros se estiman resolviendo y normalmente se obtienen mediante el algoritmo de Newton-Raphson . La estructura de la varianza se elige para mejorar la eficiencia de las estimaciones de los parámetros. El hessiano de la solución a los GEE en el espacio de parámetros se puede utilizar para calcular estimaciones robustas del error estándar. El término "estructura de varianza" se refiere a la forma algebraica de la matriz de covarianza entre los resultados, Y, en la muestra. Ejemplos de especificaciones de estructura de varianza incluyen independencia, intercambiable, autorregresiva, estacionaria dependiente de m y no estructurada. La forma más popular de inferencia sobre los parámetros de regresión de GEE es la prueba de Wald que utiliza errores estándar ingenuos o robustos, aunque la prueba de puntuación ${\ Displaystyle \ beta _ {k}}$ ${\ Displaystyle U (\ beta) = 0}$ También es válido y preferible cuando es difícil obtener estimaciones de información bajo la hipótesis alternativa. La prueba de razón de verosimilitud no es válida en este escenario porque las ecuaciones de estimación no son necesariamente ecuaciones de verosimilitud. La selección del modelo se puede realizar con el equivalente GEE del Criterio de información de Akaike (AIC), la Cuasilikelihood según el Criterio del modelo de independencia (QIC). ^[5]

La ecuación de estimación generalizada es un caso especial del método generalizado de momentos (GMM). ^[6] Esta relación es inmediatamente obvia a partir del requisito de que la función de puntuación satisfaga la ecuación: