El suavizado exponencial es una técnica de regla general para suavizar los datos de series de tiempo mediante la función de ventana exponencial . Mientras que en la media móvil simple las observaciones pasadas se ponderan por igual, las funciones exponenciales se utilizan para asignar ponderaciones decrecientes exponencialmente a lo largo del tiempo. Es un procedimiento de fácil aprendizaje y fácil aplicación para tomar alguna determinación basada en suposiciones previas por parte del usuario, como la estacionalidad. El suavizado exponencial se utiliza a menudo para el análisis de datos de series de tiempo.
El suavizado exponencial es una de las muchas funciones de ventana que se aplican comúnmente para suavizar los datos en el procesamiento de señales , actuando como filtros de paso bajo para eliminar el ruido de alta frecuencia . Este método está precedido por el uso de Poisson de funciones de ventana exponenciales recursivas en circunvoluciones del siglo XIX, así como por el uso de medias móviles recursivas de Kolmogorov y Zurbenko de sus estudios de turbulencia en la década de 1940.
La secuencia de datos brutos suele estar representada por comenzando en el tiempo , y la salida del algoritmo de suavizado exponencial se escribe comúnmente como , que puede considerarse como una mejor estimación de cuál es el siguiente valor de estarán. Cuando la secuencia de observaciones comienza en el momento, la forma más simple de suavizado exponencial viene dada por las fórmulas: [1]
dónde es el factor de suavizado , y.
Suavizado exponencial básico (simple) (lineal Holt)
El uso de la función de ventana exponencial se atribuye primero a Poisson [2] como una extensión de una técnica de análisis numérico del siglo XVII, y luego fue adoptada por la comunidad de procesamiento de señales en la década de 1940. Aquí, el suavizado exponencial es la aplicación de la función de ventana exponencial o de Poisson . El suavizado exponencial fue sugerido por primera vez en la literatura estadística sin citar trabajos previos de Robert Goodell Brown en 1956, [3] y luego ampliado por Charles C. Holt en 1957. [4] La siguiente formulación, que es la que se usa comúnmente, es atribuido a Brown y se conoce como "suavizado exponencial simple de Brown". [5] Todos los métodos de Holt, Winters y Brown pueden verse como una simple aplicación de filtrado recursivo, encontrado por primera vez en la década de 1940 [2] para convertir filtros de respuesta de impulso finito (FIR) en filtros de respuesta de impulso infinito .
La forma más simple de suavizado exponencial viene dada por la fórmula:
dónde es el factor de suavizado , y. En otras palabras, la estadística suavizada es un promedio ponderado simple de la observación actual y la estadística suavizada anterior . El suavizado exponencial simple se aplica fácilmente y produce una estadística suavizada tan pronto como dos observaciones están disponibles. El término factor de suavizado aplicado a aquí hay un nombre poco apropiado, ya que los valores más grandes de reducir realmente el nivel de suavizado, y en el caso límite con = 1 la serie de salida es solo la observación actual. Valores de cerca de uno tienen un efecto de suavizado menor y dan mayor peso a los cambios recientes en los datos, mientras que los valores de más cerca de cero tienen un mayor efecto de suavizado y responden menos a los cambios recientes.
No existe un procedimiento formalmente correcto para elegir . A veces, se utiliza el juicio del estadístico para elegir un factor apropiado. Alternativamente, se puede utilizar una técnica estadística para optimizar el valor de. Por ejemplo, el método de mínimos cuadrados podría usarse para determinar el valor de para lo cual la suma de las cantidades se minimiza. [6]
A diferencia de otros métodos de suavizado, como el promedio móvil simple, esta técnica no requiere que se realice un número mínimo de observaciones antes de comenzar a producir resultados. En la práctica, sin embargo, no se logrará un "buen promedio" hasta que se hayan promediado varias muestras juntas; por ejemplo, una señal constante tardará aproximadamenteetapas para alcanzar el 95% del valor real. Para reconstruir con precisión la señal original sin pérdida de información, todas las etapas de la media móvil exponencial también deben estar disponibles, porque las muestras más antiguas pierden peso de manera exponencial. Esto contrasta con una media móvil simple, en la que algunas muestras pueden omitirse sin tanta pérdida de información debido a la ponderación constante de las muestras dentro de la media. Si se pierde una cantidad conocida de muestras, también se puede ajustar un promedio ponderado para esto, dando el mismo peso a la nueva muestra y a todas las que se van a omitir.
Esta forma simple de suavizado exponencial también se conoce como promedio móvil ponderado exponencialmente (EWMA). Técnicamente, también se puede clasificar como un modelo de media móvil integrada autorregresiva (ARIMA) (0,1,1) sin término constante. [7]
Tiempo constante
La constante de tiempo de una media móvil exponencial es la cantidad de tiempo que tarda la respuesta suavizada de una función de paso unitario en alcanzarde la señal original. La relación entre esta constante de tiempo,y el factor de suavizado, , viene dada por la fórmula:
dónde es el intervalo de tiempo de muestreo de la implementación de tiempo discreto. Si el tiempo de muestreo es rápido en comparación con la constante de tiempo () luego
Elegir el valor suavizado inicial
Tenga en cuenta que en la definición anterior, se está inicializando para . Debido a que el suavizado exponencial requiere que en cada etapa tengamos el pronóstico anterior, no es obvio cómo comenzar con el método. Podríamos suponer que el pronóstico inicial es igual al valor inicial de la demanda; sin embargo, este enfoque tiene un serio inconveniente. El suavizado exponencial pone un peso sustancial en las observaciones pasadas, por lo que el valor inicial de la demanda tendrá un efecto irrazonablemente grande en los pronósticos iniciales. Este problema puede superarse permitiendo que el proceso evolucione durante un número razonable de períodos (10 o más) y utilizando el promedio de la demanda durante esos períodos como pronóstico inicial. Hay muchas otras formas de establecer este valor inicial, pero es importante tener en cuenta que cuanto menor sea el valor de, más sensible será su pronóstico en la selección de este valor inicial más suave . [8] [9]
Mejoramiento
Para cada método de suavizado exponencial, también debemos elegir el valor de los parámetros de suavizado. Para el suavizado exponencial simple, solo hay un parámetro de suavizado ( α ), pero para los métodos que siguen suele haber más de un parámetro de suavizado.
Hay casos en los que los parámetros de suavizado pueden elegirse de manera subjetiva: el pronosticador especifica el valor de los parámetros de suavizado basándose en la experiencia previa. Sin embargo, una forma más sólida y objetiva de obtener valores para los parámetros desconocidos incluidos en cualquier método de suavizado exponencial es estimarlos a partir de los datos observados.
Los parámetros desconocidos y los valores iniciales para cualquier método de suavizado exponencial se pueden estimar minimizando la suma de errores cuadrados (SSE). Los errores se especifican como por (los errores de pronóstico de un paso adelante dentro de la muestra). Por tanto, encontramos los valores de los parámetros desconocidos y los valores iniciales que minimizan
A diferencia del caso de regresión (donde tenemos fórmulas para calcular directamente los coeficientes de regresión que minimizan el SSE), esto implica un problema de minimización no lineal y necesitamos usar una herramienta de optimización para realizar esto.
Denominación "exponencial"
El nombre 'suavizado exponencial' se atribuye al uso de la función de ventana exponencial durante la convolución. Ya no se atribuye a Holt, Winters & Brown.
Mediante la sustitución directa de la ecuación definitoria por el suavizado exponencial simple en sí mismo, encontramos que
En otras palabras, a medida que pasa el tiempo, la estadística suavizada se convierte en el promedio ponderado de un número cada vez mayor de observaciones pasadas , y los pesos asignados a las observaciones anteriores son proporcionales a los términos de la progresión geométrica
Una progresión geométrica es la versión discreta de una función exponencial , por lo que aquí es donde se originó el nombre de este método de suavizado según la tradición de las estadísticas .
Comparación con media móvil
El suavizado exponencial y el promedio móvil tienen defectos similares de introducir un retraso en relación con los datos de entrada. Si bien esto se puede corregir cambiando el resultado a la mitad de la longitud de la ventana para un núcleo simétrico, como un promedio móvil o gaussiano, no está claro qué tan apropiado sería esto para el suavizado exponencial. Ambos también tienen aproximadamente la misma distribución de error de pronóstico cuando α = 2 / ( k + 1). Se diferencian en que el suavizado exponencial tiene en cuenta todos los datos pasados, mientras que la media móvil solo tiene en cuenta k puntos de datos pasados. Computacionalmente hablando, también difieren en que el promedio móvil requiere que se mantengan los k puntos de datos pasados , o el punto de datos en el retraso k + 1 más el valor de pronóstico más reciente, mientras que el suavizado exponencial solo necesita que se mantenga el valor de pronóstico más reciente conservó. [11]
En la literatura sobre procesamiento de señales , el uso de filtros no causales (simétricos) es común, y la función de ventana exponencial se usa ampliamente de esta manera, pero se usa una terminología diferente: el suavizado exponencial es equivalente a un impulso infinito de primer orden. El filtro de respuesta (IIR) y la media móvil es equivalente a un filtro de respuesta de impulso finito con factores de ponderación iguales.
Suavizado exponencial doble
El suavizado exponencial simple no funciona bien cuando hay una tendencia en los datos, lo cual es inconveniente. [1] En tales situaciones, se diseñaron varios métodos bajo el nombre de "suavizado exponencial doble" o "suavizado exponencial de segundo orden", que es la aplicación recursiva de un filtro exponencial dos veces, por lo que se denomina "suavizado exponencial doble". Esta nomenclatura es similar al suavizado exponencial cuádruple, que también hace referencia a su profundidad de recursividad. [12] La idea básica detrás del suavizado exponencial doble es introducir un término para tener en cuenta la posibilidad de que una serie muestre alguna forma de tendencia. Este componente de pendiente se actualiza a sí mismo mediante un suavizado exponencial.
Un método, a veces denominado "suavizado exponencial doble de Holt-Winters", funciona de la siguiente manera: [13]
Nuevamente, la secuencia de observaciones de datos brutos está representada por , comenzando en el tiempo . Usamos para representar el valor suavizado para el tiempo , y es nuestra mejor estimación de la tendencia en el momento . La salida del algoritmo ahora se escribe como, una estimación del valor de en el momento basado en los datos brutos hasta el momento . El suavizado exponencial doble viene dado por las fórmulas
Y para por
dónde () es el factor de suavizado de datos , y () es el factor de suavizado de tendencias .
Para pronosticar más allá viene dada por la aproximación:
Establecer el valor inicial es una cuestión de preferencia. Una opción distinta a la listada arriba es para algunos .
Tenga en cuenta que F 0 no está definido (no hay estimación para el tiempo 0), y de acuerdo con la definición F 1 = s 0 + b 0 , que está bien definida, por lo que se pueden evaluar más valores.
Un segundo método, denominado suavizado exponencial lineal de Brown (LES) o suavizado exponencial doble de Brown, funciona de la siguiente manera. [14]
donde a t , el nivel estimado en el momento t y b t , la tendencia estimada en el momento t son:
Suavizado triple exponencial (Holt Winters)
El suavizado exponencial triple aplica el suavizado exponencial tres veces, que se usa comúnmente cuando hay tres señales de alta frecuencia que deben eliminarse de una serie de tiempo en estudio. Hay diferentes tipos de estacionalidad: de naturaleza 'multiplicativa' y 'aditiva', al igual que la suma y la multiplicación son operaciones básicas en matemáticas.
Si todos los meses de diciembre vendemos 10.000 apartamentos más que en noviembre, la estacionalidad es aditiva por naturaleza. Sin embargo, si vendemos un 10% más de apartamentos en los meses de verano que en los meses de invierno, la estacionalidad es de naturaleza multiplicativa . La estacionalidad multiplicativa se puede representar como un factor constante, no como una cantidad absoluta. [15]
El suavizado exponencial triple fue sugerido por primera vez por el estudiante de Holt, Peter Winters, en 1960 después de leer un libro de procesamiento de señales de la década de 1940 sobre el suavizado exponencial. [16] La idea novedosa de Holt era repetir el filtrado un número impar de veces mayor que 1 y menor que 5, lo que era popular entre los estudiosos de épocas anteriores. [16] Si bien el filtrado recursivo se había utilizado anteriormente, se aplicó dos y cuatro veces para coincidir con la conjetura de Hadamard , mientras que la aplicación triple requería más del doble de operaciones de convolución singular. El uso de una aplicación triple se considera una técnica de regla general , en lugar de una basada en fundamentos teóricos y, a menudo, los profesionales lo han enfatizado demasiado. - Supongamos que tenemos una secuencia de observaciones, comenzando en el tiempo con un ciclo de cambio estacional de duración .
El método calcula una línea de tendencia para los datos, así como índices estacionales que ponderan los valores en la línea de tendencia en función de dónde cae ese punto de tiempo en el ciclo de longitud. .
Dejar representar el valor suavizado de la parte constante para el tiempo , es la secuencia de las mejores estimaciones de la tendencia lineal que se superponen a los cambios estacionales, y es la secuencia de factores de corrección estacionales. Deseamos estimar en todo momento modificación en el ciclo que asumen las observaciones. Como regla general, un mínimo de dos temporadas completas (o períodos) de datos históricos es necesario para inicializar un conjunto de factores estacionales.
La salida del algoritmo se escribe nuevamente como , una estimación del valor de en el momento basado en los datos brutos hasta el momento . El suavizado triple exponencial con estacionalidad multiplicativa viene dado por las fórmulas [1]
dónde () es el factor de suavizado de datos , () es el factor de suavizado de tendencias , y () es el factor de suavizado del cambio estacional .
La fórmula general para la estimación de tendencia inicial es:
Establecer las estimaciones iniciales para los índices estacionales por es un poco más complicado. Si es el número de ciclos completos presentes en sus datos, entonces:
dónde
Tenga en cuenta que es el valor medio de en el ciclo de sus datos.
El suavizado triple exponencial con estacionalidad aditiva viene dado por:
Implementaciones en paquetes de estadísticas
- R : la función HoltWinters en el paquete de estadísticas [17] y la función ets en el paquete de pronóstico [18] (una implementación más completa, que generalmente resulta en un mejor rendimiento [19] ).
- Python : el módulo holtwinters del paquete statsmodels permite un suavizado exponencial simple, doble y triple.
- IBM SPSS incluye Simple, Simple Seasonal, Tendencia lineal de Holt, Tendencia lineal de Brown, Tendencia amortiguada, Aditivo de Winters y Multiplicativo de Winters en el procedimiento de modelado de series temporales dentro de sus paquetes estadísticos Statistics y Modeler. La función por defecto modelizador experto evalúa los siete modelos de suavizado exponencial y modelos ARIMA con un rango de no estacional y de temporada p , d y q valores, y selecciona el modelo con menor estadística bayesiana Criterio de Información.
- Stata : comando tssmooth [20]
- LibreOffice 5.2 [21]
- Microsoft Excel 2016 [22]
Ver también
- Modelo de media móvil autorregresiva (ARMA)
- Errores y residuales en estadísticas
- Media móvil
- Fracción continua
Notas
- ^ a b c "Manual electrónico de métodos estadísticos de NIST / SEMATECH" . NIST . Consultado el 23 de mayo de 2010 .
- ^ a b Oppenheim, Alan V .; Schafer, Ronald W. (1975). Procesamiento de señales digitales . Prentice Hall . pag. 5. ISBN 0-13-214635-5.
- ^ Brown, Robert G. (1956). Suavizado exponencial para predecir la demanda . Cambridge, Massachusetts: Arthur D. Little Inc. pág. 15.
- ^ Holt, Charles C. (1957). "Pronóstico de tendencias y estacional por promedios ponderados exponencialmente". Memorando de la Oficina de Investigación Naval . 52 . reimpreso en Holt, Charles C. (enero-marzo de 2004). "Pronóstico de tendencias y estacional por promedios ponderados exponencialmente". Revista Internacional de Pronósticos . 20 (1): 5–10. doi : 10.1016 / j.ijforecast.2003.09.015 .
- ^ Brown, Robert Goodell (1963). Suavizar el pronóstico y la predicción de series temporales discretas . Englewood Cliffs, Nueva Jersey: Prentice-Hall.
- ^ "Manual electrónico de métodos estadísticos de NIST / SEMATECH, 6.4.3.1. Suavizado exponencial único" . NIST . Consultado el 5 de julio de 2017 .
- ^ Nau, Robert. "Modelos de suavizado exponencial y promediado" . Consultado el 26 de julio de 2010 .
- ^ "Análisis de producción y operaciones" Nahmias. 2009.
- ^ Čisar, P. y Čisar, SM (2011). "Métodos de optimización de las estadísticas EWMA". Acta Polytechnica Hungarica , 8 (5), 73–87. Página 78.
- ^ 7.1 Suavizado exponencial simple | Pronóstico: principios y práctica .
- ^ Nahmias, Steven (3 de marzo de 2008). Análisis de producción y operaciones (6ª ed.). ISBN 0-07-337785-6.[ página necesaria ]
- ^ "Modelo: suavizado exponencial de segundo orden" . SAP AG . Consultado el 23 de enero de 2013 .
- ^ "6.4.3.3. Suavizado exponencial doble" . itl.nist.gov . Consultado el 25 de septiembre de 2011 .
- ^ "Modelos de suavizado exponencial y promediado" . duke.edu . Consultado el 25 de septiembre de 2011 .
- ^ Kalehar, Prajakta S. "Pronóstico de series de tiempo mediante el suavizado exponencial de Holt-Winters" (PDF) . Consultado el 23 de junio de 2014 .
- ^ a b Winters, PR (abril de 1960). "Pronóstico de ventas por promedios móviles ponderados exponencialmente". Ciencias de la gestión . 6 (3): 324–342. doi : 10.1287 / mnsc.6.3.324 .
- ^ "R: filtrado de Holt-Winters" . stat.ethz.ch . Consultado el 5 de junio de 2016 .
- ^ "ets {pronóstico} | inside-R | Un sitio comunitario para R" . inside-r.org . Archivado desde el original el 16 de julio de 2016 . Consultado el 5 de junio de 2016 .
- ^ "Comparación de HoltWinters () y ets ()" . Hyndsight . 29 de mayo de 2011 . Consultado el 5 de junio de 2016 .
- ^ tssmooth en el manual de Stata
- ^ "LibreOffice 5.2: Notas de la versión - Wiki de Document Foundation" .
- ^ "Funciones de pronóstico de Excel 2016 | Estadísticas reales con Excel" .
enlaces externos
- Notas de clase sobre suavizado exponencial (Robert Nau, Duke University)
- Suavizado de datos por Jon McLoone, The Wolfram Demonstrations Project
- El enfoque de Holt-Winters para el suavizado exponencial: 50 años y cada vez más fuerte por Paul Goodwin (2010) Foresight: The International Journal of Applied Forecasting
- Algoritmos para series de tiempo con espacios desiguales: promedios móviles y otros operadores móviles por Andreas Eckner