El error porcentual absoluto medio ( MAPE ), también conocido como desviación porcentual absoluta media ( MAPD ), es una medida de precisión de predicción de un método de pronóstico en estadística . Por lo general, expresa la precisión como una relación definida por la fórmula:
donde A t es el valor real y F t es el valor de pronóstico. El MAPE también se informa a veces como un porcentaje, que es la ecuación anterior multiplicada por 100. La diferencia entre A t y F t se divide por el valor real A t nuevamente. El valor absoluto en este cálculo se suma para cada punto previsto en el tiempo y se divide por el número de puntos ajustados n .
MAPE en problemas de regresión
El error porcentual absoluto medio se usa comúnmente como una función de pérdida para problemas de regresión y en la evaluación de modelos, debido a su interpretación muy intuitiva en términos de error relativo.
Definición
Considere una configuración de regresión estándar en la que los datos están completamente descritos por un par aleatorio con valores en y n iid copias de . Los modelos de regresión tienen como objetivo encontrar un buen modelo para el par, que es una función medible g de a tal que está cerca de Y .
En el escenario de regresión clásica, la cercanía de a Y se mide a través del riesgo L 2 , también llamado error cuadrático medio (MSE). En el contexto de regresión MAPE, [1] la cercanía dea Y se mide a través del MAPE, y el objetivo de las regresiones MAPE es encontrar un modelo tal que:
dónde es la clase de modelos considerados (por ejemplo, modelos lineales).
En la práctica
En la práctica puede estimarse mediante la estrategia empírica de minimización de riesgos , lo que lleva a
Desde un punto de vista práctico, el uso del MAPE como una función de calidad para el modelo de regresión es equivalente a realizar una regresión del error absoluto medio ponderado (MAE), también conocida como regresión cuantílica . Esta propiedad es trivial ya que
Como consecuencia, el uso del MAPE es muy fácil en la práctica, por ejemplo, utilizando bibliotecas existentes para la regresión de cuantiles que permiten ponderaciones.
Consistencia
El uso del MAPE como función de pérdidas para el análisis de regresión es factible tanto desde un punto de vista práctico como teórico, ya que se puede demostrar la existencia de un modelo óptimo y la consistencia de la minimización empírica del riesgo. [1]
Definiciones alternativas de MAPE
Pueden surgir problemas al calcular el valor MAPE con una serie de denominadores pequeños. Puede ocurrir un problema de singularidad de la forma 'uno dividido por cero' y / o la creación de cambios muy grandes en el Error de Porcentaje Absoluto, causado por una pequeña desviación en el error.
Como alternativa, cada valor real ( A t ) de la serie en la fórmula original se puede reemplazar por el promedio de todos los valores reales ( Ā t ) de esa serie. Esta alternativa todavía se utiliza para medir el desempeño de modelos que pronostican los precios spot de la electricidad. [2]
Tenga en cuenta que esto equivale a dividir la suma de las diferencias absolutas por la suma de los valores reales y, a veces, se denomina WAPE (error porcentual absoluto ponderado) o wMAPE (error porcentual absoluto medio ponderado) .
Asuntos
Aunque el concepto de MAPE suena muy simple y convincente, tiene grandes inconvenientes en la aplicación práctica, [3] y hay muchos estudios sobre las deficiencias y los resultados engañosos de MAPE. [4] [5]
- No se puede utilizar si hay valores cero (lo que a veces ocurre, por ejemplo, en los datos de demanda) porque habría una división por cero.
- Para los pronósticos que son demasiado bajos, el error porcentual no puede exceder el 100%, pero para los pronósticos que son demasiado altos, no existe un límite superior para el error porcentual.
- MAPE impone una penalización más severa a los errores negativos, que en los errores positivos. [6] Como consecuencia, cuando se utiliza MAPE para comparar la precisión de los métodos de predicción, está sesgado en el sentido de que seleccionará sistemáticamente un método cuyos pronósticos son demasiado bajos. Este problema poco conocido pero grave se puede solucionar mediante el uso de una medida de precisión basada en el logaritmo de la relación de precisión (la relación entre el valor predicho y el real), dado por. Este enfoque conduce a propiedades estadísticas superiores y conduce a predicciones que pueden interpretarse en términos de la media geométrica. [3]
- La gente suele pensar que el MAPE se optimizará en la mediana. Pero, por ejemplo, un logaritmo normal tiene una mediana de donde como está optimizado MAPE en .
Para superar estos problemas con MAPE, hay algunas otras medidas propuestas en la literatura:
- Error escalado absoluto medio (MASE)
- Error de porcentaje absoluto simétrico medio (sMAPE)
- Precisión direccional media (MDA)
- Error porcentual absoluto arcoingente medio (MAAPE): MAAPE es una nueva métrica de error porcentual absoluto y se ha desarrollado observando MAPE desde un ángulo diferente. En esencia, MAAPE es una pendiente como ángulo , mientras que MAPE es una pendiente como razón . [5]
Ver también
enlaces externos
Referencias
- ↑ a b de Myttenaere, B Golden, B Le Grand, F Rossi (2015). "Error porcentual absoluto medio para modelos de regresión", Neurocomputing 2016 arXiv : 1605.02541
- ^ Jorrit Vander Mynsbrugge (2010). "Estrategias de licitación que utilizan el compromiso unitario basado en el precio en un mercado energético desregulado", KULeuven
- ↑ a b Tofallis (2015). "Una mejor medida de precisión de predicción relativa para la selección de modelos y la estimación de modelos", Revista de la Sociedad de Investigación Operativa , 66 (8): 1352-1362. preimpresión archivada
- ^ Hyndman, Rob J. y Anne B. Koehler (2006). "Otro vistazo a las medidas de precisión del pronóstico". Revista Internacional de Pronósticos , 22 (4): 679-688 doi: 10.1016 / j.ijforecast.2006.03.001 .
- ^ a b Kim, Sungil y Heeyoung Kim (2016). "Una nueva métrica de error porcentual absoluto para los pronósticos de demanda intermitente". International Journal of Forecasting , 32 (3): 669-679 doi: 10.1016 / j.ijforecast.2015.12.003 .
- ^ Makridakis, Spyros (1993) "Medidas de precisión: preocupaciones teóricas y prácticas". Revista Internacional de Pronósticos , 9 (4): 527-529 doi: 10.1016 / 0169-2070 (93) 90079-3