La desviación cuadrática media ( RMSD ) o el error cuadrático medio ( RMSE ) es una medida de uso frecuente de las diferencias entre los valores (valores de muestra o población) predichos por un modelo o estimador y los valores observados. El RMSD representa la raíz cuadrada del segundo momento muestral de las diferencias entre los valores predichos y los valores observados o la media cuadrática de estas diferencias. Estas desviaciones se denominan residuales cuando los cálculos se realizan sobre la muestra de datos que se utilizó para la estimación y se denominan errores.(o errores de predicción) cuando se calcula fuera de la muestra. El RMSD sirve para agregar las magnitudes de los errores en las predicciones para varios puntos de datos en una sola medida de poder predictivo. RMSD es una medida de precisión para comparar errores de pronóstico de diferentes modelos para un conjunto de datos en particular y no entre conjuntos de datos, ya que depende de la escala. [1]
RMSD siempre es no negativo y un valor de 0 (casi nunca se logra en la práctica) indicaría un ajuste perfecto a los datos. En general, un RMSD más bajo es mejor que uno más alto. Sin embargo, las comparaciones entre diferentes tipos de datos no serían válidas porque la medida depende de la escala de los números utilizados.
RMSD es la raíz cuadrada del promedio de errores cuadrados. El efecto de cada error en RMSD es proporcional al tamaño del error al cuadrado; por lo tanto, los errores más grandes tienen un efecto desproporcionadamente grande en RMSD. En consecuencia, RMSD es sensible a valores atípicos. [2] [3]
Fórmula
El RMSD de un estimador con respecto a un parámetro estimado se define como la raíz cuadrada del error cuadrático medio :
Para un estimador insesgado , la RMSD es la raíz cuadrada de la varianza, conocida como desviación estándar .
El RMSD de los valores predichos para los tiempos t de la variable dependiente de una regresión con variables observadas en T tiempos, se calcula para T predicciones diferentes como la raíz cuadrada de la media de los cuadrados de las desviaciones:
(Para regresiones sobre datos transversales , el subíndice t se reemplaza por i y T se reemplaza por n ).
En algunas disciplinas, el RMSD se utiliza para comparar diferencias entre dos cosas que pueden variar, ninguna de las cuales se acepta como "estándar". Por ejemplo, al medir la diferencia promedio entre dos series de tiempo y , la fórmula se convierte en
Normalización
La normalización de RMSD facilita la comparación entre conjuntos de datos o modelos con diferentes escalas. Aunque no existen medios consistentes de normalización en la literatura, las opciones comunes son la media o el rango (definido como el valor máximo menos el valor mínimo) de los datos medidos: [4]
- o .
Este valor se conoce comúnmente como la desviación o error cuadrático medio normalizado (NRMSD o NRMSE) y, a menudo, se expresa como un porcentaje, donde los valores más bajos indican una menor varianza residual. En muchos casos, especialmente para muestras más pequeñas, es probable que el rango de la muestra se vea afectado por el tamaño de la muestra, lo que dificultaría las comparaciones.
Otro método posible para hacer de la RMSD una medida de comparación más útil es dividir la RMSD por el rango intercuartílico . Al dividir el RMSD con el IQR, el valor normalizado se vuelve menos sensible a los valores extremos en la variable objetivo.
- dónde
con y donde CDF −1 es la función cuantil .
Al normalizar por el valor medio de las mediciones, se puede utilizar el término coeficiente de variación de RMSD, CV (RMSD) para evitar ambigüedades. [5] Esto es análogo al coeficiente de variación con el RMSD tomando el lugar de la desviación estándar .
Error absoluto medio
Algunos investigadores han recomendado el uso del error absoluto medio (MAE) en lugar de la desviación cuadrática media de la raíz. MAE posee ventajas en la interpretabilidad sobre RMSD. MAE es el promedio de los valores absolutos de los errores. MAE es fundamentalmente más fácil de entender que la raíz cuadrada del promedio de errores cuadrados. Además, cada error influye en MAE en proporción directa al valor absoluto del error, lo que no es el caso de RMSD. [2]
Aplicaciones
- En meteorología , para ver la eficacia con la que un modelo matemático predice el comportamiento de la atmósfera .
- En bioinformática , la desviación de la raíz cuadrada media de las posiciones atómicas es la medida de la distancia promedio entre los átomos de proteínas superpuestas .
- En base estructura de diseño de fármacos , la RMSD es una medida de la diferencia entre una conformación de cristal del ligando de conformación y un soporte para la predicción.
- En economía , el RMSD se utiliza para determinar si un modelo económico se ajusta a los indicadores económicos . Algunos expertos han argumentado que RMSD es menos confiable que el error absoluto relativo. [6]
- En psicología experimental , el RMSD se utiliza para evaluar qué tan bien los modelos matemáticos o computacionales de comportamiento explican el comportamiento observado empíricamente.
- En SIG , el RMSD es una medida utilizada para evaluar la precisión del análisis espacial y la teledetección.
- En hidrogeología , RMSD y NRMSD se utilizan para evaluar la calibración de un modelo de agua subterránea. [7]
- En la ciencia de la imagen , el RMSD es parte de la relación pico de señal a ruido , una medida utilizada para evaluar qué tan bien se desempeña un método para reconstruir una imagen en relación con la imagen original.
- En neurociencia computacional , el RMSD se usa para evaluar qué tan bien un sistema aprende un modelo dado. [8]
- En la espectroscopia de resonancia magnética nuclear de proteínas , la RMSD se utiliza como medida para estimar la calidad del conjunto de estructuras obtenido.
- Las presentaciones para el Premio Netflix se evaluaron utilizando el RMSD de los valores "verdaderos" no revelados del conjunto de datos de prueba.
- En la simulación del consumo de energía de los edificios, el RMSE y el CV (RMSE) se utilizan para calibrar modelos para medir el rendimiento del edificio. [9]
- En cristalografía de rayos X , RMSD (y RMSZ) se usa para medir la desviación de las coordenadas internas moleculares que se desvían de los valores de la biblioteca de restricciones.
Ver también
- Media cuadrática
- Error absoluto medio
- Desviación absoluta media
- Desviación media con signo
- Desviación cuadrática media
- Desviaciones cuadradas
- Errores y residuales en estadísticas
Referencias
- ^ Hyndman, Rob J .; Koehler, Anne B. (2006). "Otro vistazo a las medidas de precisión del pronóstico". Revista Internacional de Pronósticos . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016 / j.ijforecast.2006.03.001 .
- ^ a b Poncio, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Componentes de información para la comparación de múltiples resoluciones entre mapas que comparten una variable real". Estadísticas ecológicas ambientales . 15 (2): 111-142. doi : 10.1007 / s10651-007-0043-y .
- ^ Willmott, Cort; Matsuura, Kenji (2006). "Sobre el uso de medidas de error dimensionadas para evaluar el desempeño de interpoladores espaciales". Revista Internacional de Ciencias de la Información Geográfica . 20 : 89-102. doi : 10.1080 / 13658810500286976 .
- ^ "Wiki del programa de investigación de las ensenadas costeras (CIRP) - Estadísticas" . Consultado el 4 de febrero de 2015 .
- ^ "Preguntas frecuentes: ¿Qué es el coeficiente de variación?" . Consultado el 19 de febrero de 2019 .
- ^ Armstrong, J. Scott; Collopy, Fred (1992). "Medidas de error para generalizar sobre métodos de pronóstico: comparaciones empíricas" (PDF) . Revista Internacional de Pronósticos . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi : 10.1016 / 0169-2070 (92) 90008-w .
- ^ Anderson, diputado; Woessner, WW (1992). Modelización aplicada de aguas subterráneas: simulación de flujo y transporte advectivo (2ª ed.). Prensa académica.
- ^ Modelo de red neuronal de conjunto
- ^ ANSI / BPI-2400-S-2012: Práctica estándar para la calificación estandarizada de las predicciones de ahorro de energía de toda la casa por calibración al historial de uso de energía