Error medio cuadrado


En estadística , el error cuadrático medio ( MSE ) [1] o desviación cuadrática media ( MSD ) de un estimador (de un procedimiento para estimar una cantidad no observada) mide el promedio de los cuadrados de los errores , es decir, la diferencia cuadrática promedio entre los valores estimados y el valor real. MSE es una función de riesgo , correspondiente al valor esperado de la pérdida por error al cuadrado. [ ¿según quién? ] [ aclaración necesaria ]El hecho de que MSE sea casi siempre estrictamente positivo (y no cero) se debe a la aleatoriedad o porque el estimador no tiene en cuenta la información que podría producir una estimación más precisa. [2]

El MSE es una medida de la calidad de un estimador. Como se deriva del cuadrado de la distancia euclidiana , siempre es un valor positivo que disminuye a medida que el error se acerca a cero. [ aclaración necesaria ]

El MSE es el segundo momento (sobre el origen) del error, [ se necesita aclaración ] y, por lo tanto, incorpora tanto la varianza del estimador (qué tan extendidas están las estimaciones de una muestra de datos a otra) y su sesgo (qué tan lejos del el valor promedio estimado es del valor real). [ cita requerida ] Para un estimador insesgado , el MSE es la varianza del estimador. Al igual que la varianza, MSE tiene las mismas unidades de medida que el cuadrado de la cantidad que se estima. En una analogía con la desviación estándar , tomando la raíz cuadrada de MSE se obtiene el error cuadrático medio odesviación cuadrática media (RMSE o RMSD), que tiene las mismas unidades que la cantidad que se estima; para un estimador insesgado, el RMSE es la raíz cuadrada de la varianza , conocida como error estándar .

El MSE evalúa la calidad de un predictor (es decir, una función que asigna entradas arbitrarias a una muestra de valores de alguna variable aleatoria ), o de un estimador (es decir, una función matemática que asigna una muestra de datos a una estimación de un parámetro de la población de la que se muestrean los datos). La definición de un MSE difiere según se esté describiendo un predictor o un estimador.

Si se genera un vector de predicciones a partir de una muestra de puntos de datos en todas las variables, y es el vector de valores observados de la variable que se predice, siendo los valores predichos (por ejemplo, a partir de un ajuste de mínimos cuadrados ), entonces el dentro- muestra MSE del predictor se calcula como

En otras palabras, el MSE es la media de los cuadrados de los errores . Esta es una cantidad fácilmente computable para una muestra en particular (y, por lo tanto, depende de la muestra).