Error de predicción cuadrático medio

En estadística, el error cuadrático medio de predicción o el error cuadrático medio de las predicciones de un procedimiento de ajuste de curva o suavizado es el valor esperado de la diferencia cuadrática entre los valores ajustados implícitos en la función predictiva. ${\ Displaystyle {\ widehat {g}}}$ y los valores de la función (no observable) g . Es una medida inversa del poder explicativo de ${\ Displaystyle {\ widehat {g}},}$ y se puede utilizar en el proceso de validación cruzada de un modelo estimado.

Si el procedimiento de suavizado o ajuste tiene una matriz de proyección (es decir, una matriz de sombrero) L , que mapea el vector de valores observados ${\ Displaystyle y}$ al vector de valores predichos ${\ Displaystyle {\ hat {y}}}$ vía ${\ Displaystyle {\ hat {y}} = Ly,}$ luego

{\ Displaystyle \ operatorname {MSPE} (L) = \ operatorname {E} \ left [\ left (g (x_ {i}) - {\ widehat {g}} (x_ {i}) \ right) ^ {2 }\derecho].}

El MSPE se puede descomponer en dos términos: la media de los sesgos al cuadrado de los valores ajustados y la media de las varianzas de los valores ajustados:

{\ Displaystyle n \ cdot \ operatorname {MSPE} (L) = \ sum _ {i = 1} ^ {n} \ left (\ operatorname {E} \ left [{\ widehat {g}} (x_ {i} ) \ right] -g (x_ {i}) \ right) ^ {2} + \ sum _ {i = 1} ^ {n} \ operatorname {var} \ left [{\ widehat {g}} (x_ { i}) \ derecha].}

Se requiere conocimiento de g para calcular exactamente el MSPE; de lo contrario, se puede estimar.

Cálculo de MSPE sobre datos fuera de muestra

El error de predicción cuadrático medio se puede calcular exactamente en dos contextos. Primero, con una muestra de datos de longitud n , el analista de datos puede ejecutar la regresión solo sobre q de los puntos de datos (con q < n ), reteniendo los otros n - q puntos de datos con el propósito específico de usarlos para calcular el MSPE del modelo estimado fuera de la muestra (es decir, sin usar datos que se usaron en el proceso de estimación del modelo). Dado que el proceso de regresión se adapta a los q puntos dentro de la muestra, normalmente el MSPE dentro de la muestra será más pequeño que el fuera de la muestra calculado sobre los n - q puntos retenidos. Si el aumento en el MSPE fuera de la muestra en comparación con dentro de la muestra es relativamente leve, eso da como resultado que el modelo se vea favorablemente. Y si se van a comparar dos modelos, el que tiene el MSPE más bajo sobre los n - q puntos de datos fuera de la muestra se ve más favorablemente, independientemente del desempeño relativo dentro de la muestra de los modelos. El MSPE fuera de la muestra en este contexto es exacto para los puntos de datos fuera de la muestra sobre los que se calculó, pero es simplemente una estimación del MSPE del modelo para la población mayoritariamente no observada de la que se extrajeron los datos.

En segundo lugar, a medida que pasa el tiempo, es posible que el analista de datos disponga de más datos y, a continuación, se puede calcular el MSPE sobre estos nuevos datos.

Estimación de MSPE sobre la población

Cuando el modelo se ha estimado sobre todos los datos disponibles sin retener ninguno, el MSPE del modelo sobre toda la población de datos en su mayoría no observados se puede estimar como sigue.

Para el modelo ${\ Displaystyle y_ {i} = g (x_ {i}) + \ sigma \ varepsilon _ {i}}$ dónde ${\ Displaystyle \ varepsilon _ {i} \ sim {\ mathcal {N}} (0,1)}$ , uno puede escribir

{\ Displaystyle n \ cdot \ operatorname {MSPE} (L) = g ^ {\ text {T}} (IL) ^ {\ text {T}} (IL) g + \ sigma ^ {2} \ operatorname {tr} \ left [L ^ {\ text {T}} L \ right].}

Usando valores de datos en la muestra, el primer término en el lado derecho es equivalente a

{\ Displaystyle \ sum _ {i = 1} ^ {n} \ left (\ operatorname {E} \ left [g (x_ {i}) - {\ widehat {g}} (x_ {i}) \ right] \ right) ^ {2} = \ operatorname {E} \ left [\ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i}) \ derecha) ^ {2} \ right] - \ sigma ^ {2} \ operatorname {tr} \ left [\ left (IL \ right) ^ {T} \ left (IL \ right) \ right].}

Por lo tanto,

{\ Displaystyle n \ cdot \ operatorname {MSPE} (L) = \ operatorname {E} \ left [\ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i}) \ right) ^ {2} \ right] - \ sigma ^ {2} \ left (n- \ operatorname {tr} \ left [L \ right] \ right).}

Si ${\ Displaystyle \ sigma ^ {2}}$ es conocido o bien estimado por ${\ Displaystyle {\ widehat {\ sigma}} ^ {2}}$ , es posible estimar MSPE por

{\ Displaystyle n \ cdot \ operatorname {\ widehat {MSPE}} (L) = \ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i }) \ right) ^ {2} - {\ widehat {\ sigma}} ^ {2} \ left (n- \ operatorname {tr} \ left [L \ right] \ right).}

Colin Mallows abogó por este método en la construcción de su estadístico de selección de modelo C _p , que es una versión normalizada de la MSPE estimada:

{\ Displaystyle C_ {p} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i}) \ right) ^ { 2}} {{\ widehat {\ sigma}} ^ {2}}} - n + 2p.}

donde p el número de parámetros estimados p y ${\ Displaystyle {\ widehat {\ sigma}} ^ {2}}$ se calcula a partir de la versión del modelo que incluye todos los regresores posibles. Con eso concluye esta prueba.

Ver también

Otras lecturas

Pindyck, Robert S .; Rubinfeld, Daniel L. (1991). "Pronóstico con modelos de series de tiempo". Modelos econométricos y previsiones económicas (3ª ed.). Nueva York: McGraw-Hill. págs. 516–535 . ISBN 0-07-050098-3.