Error porcentual absoluto medio

Medida de la precisión de predicción de un pronóstico

El error porcentual absoluto medio ( MAPE ), también conocido como desviación porcentual absoluta media ( MAPD ), es una medida de la precisión de predicción de un método de pronóstico en estadística . Por lo general, expresa la precisión como una proporción definida por la fórmula:

{\mbox{MAPE}}=100{\frac {1}{n}}\sum _{t=1}^{n}\left|{\frac {A_{t}-F_{t}}{A_{t}}}\right|

donde $A t$ es el valor real y $F t$ es el valor pronosticado. Su diferencia se divide por el valor real $A t$ . El valor absoluto de esta relación se suma para cada punto pronosticado en el tiempo y se divide por el número de puntos ajustados $n$ .

MAPE en problemas de regresión

El error porcentual absoluto medio se utiliza comúnmente como función de pérdida para problemas de regresión y en la evaluación de modelos, debido a su interpretación muy intuitiva en términos de error relativo.

Definición

Consideremos una configuración de regresión estándar en la que los datos están completamente descritos por un par aleatorio con valores en , y $n$ copias iid de . Los modelos de regresión apuntan a encontrar un buen modelo para el par, es decir, una función medible $g$ de a tal que esté cerca de $Y$ . $Z=(X,Y)$ $\mathbb {R} ^{d}\times \mathbb {R}$ ${\ Displaystyle (X_ {1}, Y_ {1}),..., (X_ {n}, Y_ {n})}$ ${\estilo de visualización (X,Y)}$ $\mathbb {R} ^{d}$ $\mathbb {R}$ ${\estilo de visualización g(X)}$

En el contexto de la regresión clásica, la proximidad de a $Y$ se mide a través del riesgo $L$ $2$ , también llamado error cuadrático medio (MSE). En el contexto de la regresión MAPE, ^[1] la proximidad de a $Y$ se mide a través del MAPE, y el objetivo de las regresiones MAPE es encontrar un modelo tal que: ${\estilo de visualización g(X)}$ ${\estilo de visualización g(X)}$ $Estilo de visualización g_ {\text{MAPE}}}$

$g_{\mathrm {MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\mathbb {E} {\Biggl [}\left|{\frac {g(X)-Y}{Y}}\right||X=x{\Biggr ]}$

¿Dónde está la clase de modelos considerados (por ejemplo, modelos lineales)? ${\mathcal {G}}$

En la práctica

En la práctica se puede estimar mediante la estrategia empírica de minimización del riesgo , lo que conduce a $Estilo de visualización g_{\text{MAPE}}(x)}$

${\widehat {g}}_{\text{MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\sum _{i=1}^{n}\left|{\frac {g(X_{i})-Y_{i}}{Y_{i}}}\right|$

Desde un punto de vista práctico, el uso de MAPE como función de calidad para el modelo de regresión es equivalente a realizar una regresión de error absoluto medio ponderado (MAE), también conocida como regresión cuantil . Esta propiedad es trivial ya que

${\widehat {g}}_{\text{MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\sum _{i=1}^{n}\omega (Y_{i})\left|g(X_{i})-Y_{i}\right|{\mbox{ con }}\omega (Y_{i})=\left|{\frac {1}{Y_{i}}}\right|$

Como consecuencia, el uso de MAPE es muy fácil en la práctica, por ejemplo, utilizando bibliotecas existentes para regresión cuantil que permiten ponderaciones.

Consistencia

El uso de la MAPE como función de pérdida para el análisis de regresión es factible tanto desde un punto de vista práctico como teórico, ya que se puede demostrar la existencia de un modelo óptimo y la consistencia de la minimización empírica del riesgo. ^[1]

WMAPA

WMAPE (a veces escrito wMAPE ) significa error porcentual absoluto medio ponderado. ^[2] Es una medida utilizada para evaluar el rendimiento de los modelos de regresión o pronóstico. Es una variante de MAPE en la que los errores porcentuales absolutos medios se tratan como una media aritmética ponderada. Lo más común es que los errores porcentuales absolutos se ponderen por los datos reales (por ejemplo, en el caso del pronóstico de ventas, los errores se ponderan por el volumen de ventas). ^[3] De hecho, esto supera el problema del "error infinito". ^[4] Su fórmula es: ^[4] ${\mbox{wMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}\left(w_{i}\cdot {\tfrac {\left|A_{i}-F_{i}\right|}{|A_{i}|}}\right)}{\displaystyle \sum _{i=1}^{n}w_{i}}}={\frac {\displaystyle \sum _{i=1}^{n}\left(|A_{i}|\cdot {\tfrac {\left|A_{i}-F_{i}\right|}{|A_{i}|}}\right)}{\displaystyle \sum _{i=1}^{n}\left|A_{i}\right|}}$

Donde es el peso, es un vector de los datos reales y es el pronóstico o predicción. Sin embargo, esto se simplifica de manera efectiva a una fórmula mucho más simple: $estilo de visualización w_{i}}$ $A$ $F$ ${\mbox{wMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}\left|A_{i}-F_{i}\right|}{\displaystyle \sum _{i=1}^{n}\left|A_{i}\right|}}$

De manera confusa, a veces cuando las personas se refieren a wMAPE están hablando de un modelo diferente en el que el numerador y el denominador de la fórmula wMAPE anterior se ponderan nuevamente mediante otro conjunto de ponderaciones personalizadas . Tal vez sería más preciso llamarlo MAPE de doble ponderación (wwMAPE). Su fórmula es: $w_{i}$ ${\mbox{wwMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}w_{i}\left|A_{i}-F_{i}\right|}{\displaystyle \sum _{i=1}^{n}w_{i}\left|A_{i}\right|}}$

Asuntos

Aunque el concepto de MAPE suena muy simple y convincente, tiene grandes inconvenientes en su aplicación práctica ^[5] y hay muchos estudios sobre las deficiencias y los resultados engañosos de MAPE. ^[6]^[7]

No se puede utilizar si hay valores cero o cercanos a cero (lo que a veces sucede, por ejemplo en datos de demanda) porque habría una división por cero o valores de MAPE que tienden a infinito. ^[8]
Para los pronósticos demasiado bajos, el error porcentual no puede superar el 100%, pero para los pronósticos demasiado altos no hay límite superior para el error porcentual.
MAPE aplica una penalización más severa a los errores negativos que a los positivos. ^[9] Como consecuencia, cuando se utiliza MAPE para comparar la precisión de los métodos de predicción, está sesgado en el sentido de que seleccionará sistemáticamente un método cuyos pronósticos sean demasiado bajos. Este problema poco conocido pero grave se puede superar utilizando una medida de precisión basada en el logaritmo de la razón de precisión (la razón entre el valor predicho y el valor real), dada por . Este enfoque conduce a propiedades estadísticas superiores y también a predicciones que se pueden interpretar en términos de la media geométrica. ^[5] $A_{t}<F_{t}$ ${\textstyle \log \left({\frac {\text{predicted}}{\text{actual}}}\right)}$
La gente suele pensar que el MAPE se optimizará en la mediana, pero, por ejemplo, una normal logarítmica tiene una mediana de donde su MAPE se optimiza en . $e^{\mu }$ $e^{\mu -\sigma ^{2}}$

Para superar estos problemas con MAPE, existen otras medidas propuestas en la literatura:

Error absoluto medio escalado (MASE)
Error porcentual absoluto medio simétrico (sMAPE)
Precisión direccional media (MDA)
Error porcentual absoluto de arcotangente medio (MAAPE): MAAPE puede considerarse una pendiente como un ángulo , mientras que MAPE es una pendiente como una relación . ^[7]

Véase también

Enlaces externos

Error porcentual absoluto medio para modelos de regresión
Error porcentual absoluto medio (MAPE)
Errores en porcentajes de error: variantes de MAPE
Error porcentual absoluto de la arcotangente media (MAAPE)

Referencias

^ de Myttenaere, B Golden, B Le Grand, F Rossi (2015). "Error porcentual absoluto medio para modelos de regresión", Neurocomputing 2016 arXiv :1605.02541
^ "Comprensión de la precisión del pronóstico: MAPE, WAPE, WMAPE".
^ "WMAPE: Error porcentual absoluto medio ponderado".
^ ab "Errores de pronóstico estadístico".
^ ab Tofallis (2015). "Una mejor medida de la precisión relativa de la predicción para la selección y estimación de modelos", Journal of the Operational Research Society , 66(8):1352-1362. preimpresión archivada
^ Hyndman, Rob J. y Anne B. Koehler (2006). "Otra mirada a las medidas de precisión de los pronósticos". International Journal of Forecasting , 22(4):679-688 doi:10.1016/j.ijforecast.2006.03.001.
^ ab Kim, Sungil y Heeyoung Kim (2016). "Una nueva métrica de error porcentual absoluto para pronósticos de demanda intermitente". International Journal of Forecasting , 32(3):669-679 doi:10.1016/j.ijforecast.2015.12.003.
^ Kim, Sungil; Kim, Heeyoung (1 de julio de 2016). "Una nueva métrica de error porcentual absoluto para pronósticos de demanda intermitente". Revista Internacional de Pronósticos . 32 (3): 669–679. doi : 10.1016/j.ijforecast.2015.12.003 .
^ Makridakis, Spyros (1993) "Medidas de precisión: preocupaciones teóricas y prácticas". Revista Internacional de Previsión , 9(4):527-529 doi:10.1016/0169-2070(93)90079-3

[demyttenaere2016-1] Myttenaere, B Golden, B Le Grand, F Rossi (2015). "Error porcentual absoluto medio para modelos de regresión", Neurocomputing 2016 arXiv :1605.02541

[baeldungdef-2] "Comprensión de la precisión del pronóstico: MAPE, WAPE, WMAPE".

[ibfdef-3] "WMAPE: Error porcentual absoluto medio ponderado".

[statisticalforecast-4] "Errores de pronóstico estadístico".

[tofallis2015-5] Tofallis (2015). "Una mejor medida de la precisión relativa de la predicción para la selección y estimación de modelos", Journal of the Operational Research Society , 66(8):1352-1362. preimpresión archivada

[6] Hyndman, Rob J. y Anne B. Koehler (2006). "Otra mirada a las medidas de precisión de los pronósticos". International Journal of Forecasting , 22(4):679-688 doi:10.1016/j.ijforecast.2006.03.001.

[Kim2016-7] Kim, Sungil y Heeyoung Kim (2016). "Una nueva métrica de error porcentual absoluto para pronósticos de demanda intermitente". International Journal of Forecasting , 32(3):669-679 doi:10.1016/j.ijforecast.2015.12.003.

[8] Kim, Sungil; Kim, Heeyoung (1 de julio de 2016). "Una nueva métrica de error porcentual absoluto para pronósticos de demanda intermitente". Revista Internacional de Pronósticos . 32 (3): 669–679. doi : 10.1016/j.ijforecast.2015.12.003 .

[9] Makridakis, Spyros (1993) "Medidas de precisión: preocupaciones teóricas y prácticas". Revista Internacional de Previsión , 9(4):527-529 doi:10.1016/0169-2070(93)90079-3