En las estadísticas , la fracción de varianza no explicada ( FVU ) en el contexto de una tarea de regresión es la fracción de la varianza de la regressand (variable dependiente) Y que no puede ser explicado, es decir, que no se predijo correctamente, por la variables explicativas X .
Definicion formal
Supongamos que se nos da una función de regresión cediendo por cada un estimado dónde es el vector de las i- ésimas observaciones sobre todas las variables explicativas. [1] : 181 Definimos la fracción de varianza inexplicable (FVU) como:
donde R 2 es el coeficiente de determinación y VAR err y VAR tot son la varianza de los residuos y la varianza muestral de la variable dependiente. SS err (la suma de los errores de predicción al cuadrado, equivalentemente la suma residual de cuadrados ), SS tot (la suma total de cuadrados ) y SS reg (la suma de cuadrados de la regresión, equivalentemente la suma de cuadrados explicada ) están dados por
Alternativamente, la fracción de varianza no explicada se puede definir de la siguiente manera:
donde MSE ( f ) es el error cuadrático medio de la función de regresión ƒ .
Explicación
Es útil considerar la segunda definición para entender FVU. Al intentar predecir Y , la función de regresión más ingenua que podemos pensar es la función constante que predice la media de Y , es decir,. De ello se deduce que el MSE de esta función es igual a la varianza de Y ; es decir, SS err = SS tot y SS reg = 0. En este caso, no se puede explicar ninguna variación en Y , y la FVU tiene entonces su valor máximo de 1.
De manera más general, la FVU será 1 si las variables explicativas X nos dicen nada acerca de Y en el sentido de que los valores pronosticados de Y no lo hacen covarían con Y . Pero a medida que mejora la predicción y se puede reducir el MSE, el FVU disminuye. En el caso de una predicción perfecta dondepara todo i , el MSE es 0, SS err = 0, SS reg = SS tot y el FVU es 0.
Ver también
Referencias
- ^ Achen, CH (1990). " ' ¿Qué explica la" varianza explicada "?: Responder". Análisis político . 2 (1): 173–184. doi : 10.1093 / pan / 2.1.173 .