Residuo estudentizado


En estadística , un residuo estudentizado es el cociente resultante de la división de un residuo por una estimación de su desviación estándar . Es una forma de estadística t de Student , con la estimación del error que varía entre puntos.

Esta es una técnica importante en la detección de valores atípicos . Se encuentra entre varios nombrados en honor a William Sealey Gosset , quien escribió bajo el seudónimo de Student . Dividir un estadístico por una desviación estándar muestral se denomina studentizar, en analogía con estandarizar y normalizar .

La razón clave para la estudiantilización es que, en el análisis de regresión de una distribución multivariante , las varianzas de los residuos en diferentes valores de variables de entrada pueden diferir, incluso si las varianzas de los errores en estos diferentes valores de variables de entrada son iguales. El problema es la diferencia entre errores y residuales en las estadísticas , particularmente el comportamiento de los residuales en las regresiones.

donde los errores , son independientes y todos tienen la misma varianza . Los residuales no son los verdaderos errores, sino estimaciones , basadas en los datos observables. Cuando se usa el método de mínimos cuadrados para estimar y , entonces los residuos , a diferencia de los errores , no pueden ser independientes ya que satisfacen las dos restricciones.

(Aquí ε i es el i- ésimo error y es el i- ésimo residuo).

Los residuos, a diferencia de los errores, no tienen todos la misma varianza: la varianza disminuye a medida que el valor x correspondiente se aleja del valor x promedio . Esta no es una característica de los datos en sí, sino de la regresión que mejor ajusta los valores en los extremos del dominio. También se refleja en las funciones de influencia de varios puntos de datos sobre los coeficientes de regresión : los puntos finales tienen más influencia. Esto también se puede ver porque los residuales en los puntos finales dependen en gran medida de la pendiente de una línea ajustada, mientras que los residuales en el medio son relativamente insensibles a la pendiente. El hecho de que las varianzas de los residuos difieran, aunquelas variaciones de los errores verdaderos son todas iguales entre sí, es la razón principal de la necesidad de la estudiantilización.