Teorema de Gauss-Markov

En estadística , el teorema de Gauss-Markov (o simplemente el teorema de Gauss para algunos autores) ^[1] establece que el estimador de mínimos cuadrados ordinarios (MCO) tiene la varianza de muestreo más baja dentro de la clase de estimadores lineales insesgados , si los errores en la regresión lineal modelo no están correlacionados , tienen varianzas iguales y un valor esperado de cero. ^[2] Los errores no necesitan ser normales , ni necesitan ser independientes e idénticamente distribuidos (solo no correlacionado con media cero y homocedástico con varianza finita). El requisito de que el estimador sea insesgado no puede eliminarse, ya que existen estimadores sesgados con una varianza más baja. Consulte, por ejemplo, el estimador de James-Stein (que también elimina la linealidad), la regresión de cresta o simplemente cualquier estimador degenerado .

El teorema recibió su nombre de Carl Friedrich Gauss y Andrey Markov , aunque el trabajo de Gauss es significativamente anterior al de Markov. ^[3] Pero mientras Gauss derivó el resultado bajo el supuesto de independencia y normalidad, Markov redujo los supuestos a la forma establecida anteriormente. ^[4] Alexander Aitken dio una generalización adicional a los errores no esféricos . ^[5]

donde son parámetros no aleatorios pero no observables, son no aleatorios y observables (llamadas "variables explicativas"), son aleatorios y, por lo tanto, son aleatorios. Las variables aleatorias se denominan "perturbación", "ruido" o simplemente "error" (se contrastarán con "residuales" más adelante en el artículo; ver errores y residuales en estadísticas ). Tenga en cuenta que para incluir una constante en el modelo anterior, se puede optar por introducir la constante como una variable con una última columna recién introducida de X siendo la unidad, es decir, para todos . Tenga en cuenta que, aunque son respuestas de muestra, son observables, las siguientes declaraciones y argumentos, incluidas las suposiciones, ${\ estilo de visualización \ beta _ {j}}$ ${\ Displaystyle X_ {ij}}$ $\varepsilon _{i}$ $y_{i}$ $\varepsilon _{i}$ $\beta _{K+1}$ $X_{i(K+1)}=1$ $i$ $y_{i},$ única condición de saber pero no $X_{ij},$ $y_{i}.$

Los supuestos de Gauss-Markov se refieren al conjunto de variables aleatorias de error : $\varepsilon _{i}$

Un estimador lineal de es una combinación lineal $\beta _{j}$