Teorema de Gauss-Markov

En estadística , el teorema de Gauss-Markov (o simplemente el teorema de Gauss para algunos autores) ^[1] establece que el estimador de mínimos cuadrados ordinarios (MCO) tiene la varianza muestral más baja dentro de la clase de estimadores lineales insesgados , si los errores en la regresión lineal Los modelos no están correlacionados , tienen varianzas iguales y un valor esperado de cero. ^[2] Los errores no necesitan ser normales , ni necesitan ser independientes y distribuidos de manera idéntica .(solo no correlacionado con media cero y homocedástico con varianza finita). No se puede descartar el requisito de que el estimador sea insesgado, ya que existen estimadores sesgados con menor varianza. Véase, por ejemplo, el estimador de James-Stein (que también reduce la linealidad), la regresión de crestas o simplemente cualquier estimador degenerado .

El teorema lleva el nombre de Carl Friedrich Gauss y Andrey Markov , aunque el trabajo de Gauss es significativamente anterior al de Markov. ^[3] Pero mientras Gauss derivó el resultado bajo el supuesto de independencia y normalidad, Markov redujo los supuestos a la forma indicada anteriormente. ^[4] Alexander Aitken dio una generalización adicional a los errores no esféricos . ^[5]

donde son parámetros no aleatorios pero no observables, no son aleatorios y observables (llamados las "variables explicativas"), son aleatorios y, por lo tanto, son aleatorios. Las variables aleatorias se denominan "perturbación", "ruido" o simplemente "error" (se contrastará con "residual" más adelante en el artículo; ver errores y residuales en las estadísticas ). Tenga en cuenta que para incluir una constante en el modelo anterior, se puede optar por introducir la constante como una variable con una última columna recién introducida de X que es la unidad, es decir, para todos . Tenga en cuenta que, aunque como respuestas de muestra, son observables, las siguientes afirmaciones y argumentos, incluidas las suposiciones,pruebas y los demás asumen bajo el ${\ Displaystyle \ beta _ {j}}$ ${\ Displaystyle X_ {ij}}$ $\varepsilon _{i}$ $y_{i}$ $\varepsilon _{i}$ $\beta _{K+1}$ $X_{i(K+1)}=1$ $i$ $y_{i},$ única condición de saber pero no $X_{ij},$ $y_{i}.$

Los supuestos de Gauss-Markov se refieren al conjunto de variables aleatorias de error : $\varepsilon _{i}$

Un estimador lineal de es una combinación lineal $\beta _{j}$