En estadísticas y econometría , y en particular en análisis de series temporales , una autorregresivo integrado media (ARIMA) que se mueve modelo es una generalización de una autorregresivo de media móvil modelo (ARMA). Ambos modelos se ajustan a datos de series de tiempo para comprender mejor los datos o para predecir puntos futuros de la serie ( pronóstico ). Los modelos ARIMA se aplican en algunos casos donde los datos muestran evidencia de no estacionariedad en el sentido de media (pero no varianza / autocovarianza ), donde un paso de diferenciación inicial (correspondiente al "integrado"parte del modelo) se puede aplicar una o más veces para eliminar la no estacionariedad de la función media (es decir, la tendencia). [1] Cuando la estacionalidad se muestra en una serie de tiempo, se podría aplicar la diferenciación estacional [2] para eliminar el componente estacional. Dado que el modelo ARMA , de acuerdo con el teorema de descomposición de Wold, [3] [4] [5] es teóricamente suficiente para describir una serie de tiempo estacionaria regular (también conocida como puramente no determinista [5] ) de sentido amplio , estamos motivados para hacer estacionaria una series de tiempo no estacionarias, por ejemplo, usando diferenciación, antes de que podamos usar el modelo ARMA . [6] Tenga en cuenta que si la serie de tiempo contiene un subproceso predecible (también conocido como seno puro o proceso exponencial de valor complejo [4] ), el componente predecible se trata como un componente de media distinta de cero pero periódico (es decir, estacional) en el marco ARIMA para que sea eliminado por la diferenciación estacional.
La parte AR de ARIMA indica que la variable evolutiva de interés retrocede sobre sus propios valores rezagados (es decir, anteriores). La parte MA indica que el error de regresión es en realidad una combinación lineal de términos de error cuyos valores ocurrieron simultáneamente y en varios momentos en el pasado. [7] La I (para "integrado") indica que los valores de los datos se han reemplazado por la diferencia entre sus valores y los valores anteriores (y este proceso de diferenciación puede haberse realizado más de una vez). El propósito de cada una de estas características es hacer que el modelo se ajuste a los datos lo mejor posible.
Los modelos ARIMA no estacionales generalmente se denominan ARIMA ( p , d , q ) donde los parámetros p , d , yq son números enteros no negativos, p es el orden (número de retrasos de tiempo) del modelo autorregresivo , d es el grado de diferenciación (el número de veces que se han restado valores pasados a los datos), y q es el orden del modelo de media móvil . Los modelos ARIMA estacionales generalmente se denotan ARIMA ( p , d , q ) ( P , D , Q ) m , donde m se refiere al número de períodos en cada temporada, y las mayúsculas P , D , Q se refieren al autorregresivo, diferenciador, y términos de promedio móvil para la parte estacional del modelo ARIMA. [8] [2]
Cuando dos de los tres términos son ceros, se puede hacer referencia al modelo basándose en el parámetro distinto de cero, eliminando " AR ", " I " o " MA " del acrónimo que describe el modelo. Por ejemplo,es AR (1) ,es I (1) , yes MA (1) .
Los modelos ARIMA se pueden estimar siguiendo el enfoque de Box-Jenkins .
Definición
Dados los datos de series de tiempo X t donde t es un índice entero y X t son números reales, un el modelo está dado por
o equivalentemente por
dónde es el operador de retraso , el son los parámetros de la parte autorregresiva del modelo, el son los parámetros de la parte media móvil y la son términos de error. Los términos de errorgeneralmente se asume que son variables independientes distribuidas de manera idéntica muestreadas de una distribución normal con media cero.
Suponga ahora que el polinomio tiene una raíz unitaria (un factor) de multiplicidad d . Entonces se puede reescribir como:
Un proceso ARIMA ( p , d , q ) expresa esta propiedad de factorización polinomial con p = p'− d , y está dada por:
y así puede pensarse como un caso particular de un proceso ARMA ( p + d , q ) que tiene el polinomio autorregresivo con d raíces unitarias. (Por esta razón, ningún proceso descrito con precisión por un modelo ARIMA con d > 0 es estacionario de sentido amplio ).
Lo anterior se puede generalizar de la siguiente manera.
Esto define un proceso ARIMA ( p , d , q ) con deriva .
Otras formas especiales
La identificación explícita de la factorización del polinomio de autorregresión en factores como anteriormente, puede extenderse a otros casos, en primer lugar para aplicar al polinomio de media móvil y en segundo lugar para incluir otros factores especiales. Por ejemplo, tener un factoren un modelo es una forma de incluir una estacionalidad no estacionaria del período s en el modelo; este factor tiene el efecto de volver a expresar los datos como cambios respecto a períodos anteriores. Otro ejemplo es el factor, que incluye una estacionalidad (no estacionaria) del período 2. [ aclaración necesaria ] El efecto del primer tipo de factor es permitir que el valor de cada estación se desplace por separado a lo largo del tiempo, mientras que con el segundo tipo los valores de las estaciones adyacentes se mueven juntos. [ aclaración necesaria ]
La identificación y especificación de los factores apropiados en un modelo ARIMA puede ser un paso importante en el modelado, ya que puede permitir una reducción en el número total de parámetros a estimar, al tiempo que permite la imposición en el modelo de tipos de comportamiento que la lógica y la experiencia sugieren que deberían estar ahí.
Diferenciando
Las propiedades de una serie de tiempo estacionaria no dependen del momento en el que se observa la serie. Específicamente, para una serie de tiempo estacionaria de sentido amplio , la media y la varianza / autocovarianza se mantienen constantes en el tiempo. La diferenciación en estadística es una transformación aplicada a una serie de tiempo no estacionaria para hacerla estacionaria en el sentido medio (es decir, para eliminar la tendencia no constante), pero que no tiene nada que ver con la no estacionariedad de la varianza / autocovarianza . Asimismo, la diferenciación estacional se aplica a una serie temporal estacional para eliminar el componente estacional. Desde la perspectiva del procesamiento de señales, especialmente la teoría del análisis espectral de Fourier , la tendencia es la parte de baja frecuencia en el espectro de una serie de tiempo no estacionaria, mientras que la temporada es la parte de frecuencia periódica en el espectro de la misma. Por lo tanto, la diferenciación funciona como un filtro de paso alto (es decir, parada baja) y la diferenciación estacional como un filtro de peine para suprimir la tendencia de baja frecuencia y la estación de frecuencia periódica en el dominio del espectro (en lugar de directamente en el espectro). dominio del tiempo), respectivamente. [6] Esta perspectiva explica la filosofía, las matemáticas, el poder y los inconvenientes de la diferenciación y la diferenciación estacional.
Para diferenciar los datos, se calcula la diferencia entre observaciones consecutivas. Matemáticamente, esto se muestra como
La diferenciación elimina los cambios en el nivel de una serie temporal, eliminando tendencia y estacionalidad y, en consecuencia, estabilizando la media de la serie temporal. [6]
A veces puede ser necesario diferenciar los datos por segunda vez para obtener una serie de tiempo estacionaria, lo que se conoce como diferenciación de segundo orden :
Otro método para diferenciar datos es la diferenciación estacional, que implica calcular la diferencia entre una observación y la observación correspondiente en la temporada anterior, por ejemplo, un año. Esto se muestra como:
Los datos diferenciados se utilizan luego para la estimación de un modelo ARMA .
Ejemplos de
Algunos casos especiales bien conocidos surgen de forma natural o son matemáticamente equivalentes a otros modelos de pronóstico populares. Por ejemplo:
- Un modelo ARIMA (0, 1, 0) (o modelo I (1) ) viene dado por- que es simplemente un paseo al azar .
- Un ARIMA (0, 1, 0) con una constante, dada por - que es una caminata aleatoria con deriva.
- Un modelo ARIMA (0, 0, 0) es un modelo de ruido blanco .
- Un modelo ARIMA (0, 1, 2) es un modelo de Damped Holt.
- Un modelo ARIMA (0, 1, 1) sin constante es un modelo básico de suavizado exponencial . [9]
- Un modelo ARIMA (0, 2, 2) viene dado por - que es equivalente al método lineal de Holt con errores aditivos o suavizado exponencial doble . [9]
Elegir el orden
El orden pyq se puede determinar utilizando la función de autocorrelación de muestra (ACF), la función de autocorrelación parcial (PACF) y / o el método de función de autocorrelación extendida (EACF). [10]
Otros métodos alternativos incluyen AIC, BIC, etc. [10] Para determinar el orden de un modelo ARIMA no estacional, un criterio útil es el criterio de información de Akaike (AIC) . Esta escrito como
donde L es la probabilidad de los datos, p es el orden de la parte autorregresiva yq es el orden de la parte de la media móvil. La k representa la intersección del modelo ARIMA. Para AIC, si k = 1 entonces hay una intersección en el modelo ARIMA ( c ≠ 0) y si k = 0 entonces no hay intersección en el modelo ARIMA ( c = 0).
El AIC corregido para los modelos ARIMA se puede escribir como
El criterio de información bayesiano (BIC) se puede escribir como
El objetivo es minimizar los valores AIC, AICc o BIC para un buen modelo. Cuanto menor sea el valor de uno de estos criterios para una variedad de modelos que se están investigando, mejor se adaptará el modelo a los datos. El AIC y el BIC se utilizan para dos propósitos completamente diferentes. Mientras que el AIC intenta aproximar los modelos a la realidad de la situación, el BIC intenta encontrar el ajuste perfecto. El enfoque BIC a menudo se critica porque nunca se ajusta perfectamente a los datos complejos de la vida real; sin embargo, sigue siendo un método útil para la selección, ya que penaliza más a los modelos por tener más parámetros que los que tendría el AIC.
AICc solo se puede utilizar para comparar modelos ARIMA con los mismos órdenes de diferenciación. Para ARIMA con diferentes órdenes de diferenciación, RMSE se puede utilizar para comparar modelos.
Estimación de coeficientes
Pronósticos utilizando modelos ARIMA
El modelo ARIMA puede verse como una "cascada" de dos modelos. El primero es no estacionario:
mientras que el segundo es estacionario de sentido amplio :
Ahora se pueden hacer previsiones para el proceso. , utilizando una generalización del método de pronóstico autorregresivo .
Intervalos de previsión
Los intervalos de pronóstico (intervalos de confianza para los pronósticos) para los modelos ARIMA se basan en suposiciones de que los residuos no están correlacionados y están distribuidos normalmente. Si alguno de estos supuestos no se cumple, los intervalos de pronóstico pueden ser incorrectos. Por esta razón, los investigadores trazan el ACF y el histograma de los residuales para verificar los supuestos antes de producir intervalos de pronóstico.
Intervalo de pronóstico del 95%: , dónde es la varianza de .
Para , para todos los modelos ARIMA independientemente de los parámetros y pedidos.
Para ARIMA (0,0, q),
- [ cita requerida ]
En general, los intervalos de pronóstico de los modelos ARIMA aumentarán a medida que aumenta el horizonte de pronóstico.
Variaciones y ampliaciones
Normalmente se emplean varias variaciones del modelo ARIMA. Si se utilizan varias series de tiempo,pueden considerarse vectores y un modelo VARIMA puede ser apropiado. A veces se sospecha un efecto estacional en el modelo; en ese caso, generalmente se considera mejor usar un modelo SARIMA (ARIMA estacional) que aumentar el orden de las partes AR o MA del modelo. [11] Si se sospecha que la serie de tiempo exhibe una dependencia de largo alcance , entonces se puede permitir que el parámetro d tenga valores no enteros en un modelo de promedio móvil fraccionalmente integrado autorregresivo , que también se llama ARIMA fraccional (FARIMA o ARFIMA ) modelo.
Implementaciones de software
Se encuentran disponibles varios paquetes que aplican metodología como la optimización de parámetros de Box – Jenkins para encontrar los parámetros correctos para el modelo ARIMA.
- EViews : tiene amplias capacidades ARIMA y SARIMA.
- Julia : contiene una implementación ARIMA en el paquete TimeModels [12]
- Mathematica : incluye la función ARIMAProcess .
- MATLAB : Econometrics Toolbox incluye modelos ARIMA y regresión con errores ARIMA
- NCSS : incluye varios procedimientos de
ARIMA
ajuste y pronóstico. [13] [14] [15] - Python : el paquete "statsmodels" incluye modelos para análisis de series de tiempo - análisis de series de tiempo univariantes: AR, ARIMA - modelos autorregresivos vectoriales, VAR y VAR estructural - estadísticas descriptivas y modelos de proceso para análisis de series de tiempo.
- R : el paquete estándar de estadísticas de R incluye una función arima , que está documentada en "Modelado ARIMA de series temporales" . junto alEn parte, la función también incluye factores estacionales, un término de intersección y variables exógenas ( xreg , llamadas "regresores externos"). La vista de tareas CRAN en Series temporales es la referencia con muchos más enlaces. El paquete "pronóstico" en R puede seleccionar automáticamente un modelo ARIMA para una serie de tiempo dada con la
auto.arima()
función y también puede simular modelos ARIMA estacionales y no estacionales con susimulate.Arima()
función. [dieciséis] - Ruby : la gema "statsample-timeseries" se utiliza para el análisis de series de tiempo, incluidos los modelos ARIMA y el filtrado de Kalman.
- JavaScript : el paquete "arima" incluye modelos para el análisis y pronóstico de series de tiempo (ARIMA, SARIMA, SARIMAX, AutoARIMA)
- C : el paquete "ctsa" incluye ARIMA, SARIMA, SARIMAX, AutoARIMA y múltiples métodos para el análisis de series de tiempo.
- CAJAS DE HERRAMIENTAS SEGURAS : incluye modelado ARIMA y regresión con errores ARIMA .
- SAS : incluye un amplio procesamiento ARIMA en su sistema de análisis econométrico y de series temporales: SAS / ETS.
- IBM SPSS : incluye el modelado ARIMA en sus paquetes estadísticos Statistics y Modeler. La función predeterminada del Modelador experto evalúa un rango de configuraciones de promedios automáticos ( p ), integrados ( d ) y móviles ( q ) estacionales y no estacionales y siete modelos de suavizado exponencial. El modelador experto también puede transformar los datos de la serie temporal de destino en su raíz cuadrada o logaritmo natural. El usuario también tiene la opción de restringir el modelizador experto para los modelos ARIMA, o introducir manualmente ARIMA no estacional y de temporada p , d y q ajustes sin modelizador experto. La detección automática de valores atípicos está disponible para siete tipos de valores atípicos, y los valores atípicos detectados se incluirán en el modelo de serie temporal si se selecciona esta función.
- SAP : el paquete APO-FCS [17] en SAP ERP de SAP permite la creación y ajuste de modelos ARIMA utilizando la metodología Box – Jenkins.
- SQL Server Analysis Services : de Microsoft incluye ARIMA como algoritmo de minería de datos.
- Stata incluye el modelado ARIMA (usando su comando arima) a partir de Stata 9.
- StatSim : incluye modelos ARIMA en la aplicación web Forecast .
- Teradata Vantage tiene la función ARIMA como parte de su motor de aprendizaje automático.
- TOL (Time Oriented Language) está diseñado para modelar modelos ARIMA (incluidas las variantes SARIMA, ARIMAX y DSARIMAX) [1] .
- Scala : la biblioteca spark-timeseries contiene la implementación de ARIMA para Scala, Java y Python. La implementación está diseñada para ejecutarse en Apache Spark .
- PostgreSQL / MadLib: Análisis de series de tiempo / ARIMA .
- X-12-ARIMA : de la Oficina del Censo de EE. UU.
Ver también
- Autocorrelación
- ARMA
- Autocorrelación parcial
- Respuesta de impulso finito
- Respuesta de impulso infinito
Referencias
- ^ Para obtener más información sobre estacionariedad y diferenciación, consulte https://www.otexts.org/fpp/8/1
- ^ a b Hyndman, Rob J; Athanasopoulos, George. 8.9 Modelos ARIMA estacionales . Pronóstico: principios y práctica . oTextos . Consultado el 19 de mayo de 2015 .
- ^ Hamilton, James (1994). Análisis de series de tiempo . Prensa de la Universidad de Princeton. ISBN 9780691042893.
- ^ a b Papoulis, Athanasios (2002). Probabilidad, variables aleatorias y procesos estocásticos . Educación de Tata McGraw-Hill.
- ^ a b Triacca, Umberto (19 de febrero de 2021). "El teorema de descomposición de Wold" (PDF) .
- ^ a b c Wang, Shixiong; Li, Chongshou; Lim, Andrew (18 de diciembre de 2019). "Por qué ARIMA y SARIMA no son suficientes". arXiv : 1904.07632 [ stat.AP ].
- ^ Caja, George EP (2015). Análisis de series de tiempo: pronóstico y control . WILEY. ISBN 978-1-118-67502-1.
- ^ "Notación para modelos ARIMA" . Sistema de predicción de series de tiempo . Instituto SAS . Consultado el 19 de mayo de 2015 .
- ^ a b "Introducción a los modelos ARIMA" . people.duke.edu . Consultado el 5 de junio de 2016 .
- ^ a b Universidad Estatal de Missouri. "Especificación del modelo, análisis de series de tiempo" (PDF) .
- ^ Swain, S; et al. (2018). "Desarrollo de un modelo ARIMA para el pronóstico de lluvia mensual sobre el distrito de Khordha, Odisha, India". Hallazgos recientes en técnicas de computación inteligente . Hallazgos recientes en técnicas de computación inteligentes (Avances en Sistemas Inteligentes y Computación . Los avances en Sistemas Inteligentes y Computación. 708 . Págs. 325-331). doi : 10.1007 / 978-981-10-8636-6_34 . ISBN 978-981-10-8635-9.
- ^ TimeModels.jl www.github.com
- ^ ARIMA en NCSS ,
- ^ ARMA automático en NCSS ,
- ^ Autocorrelaciones y autocorrelaciones parciales en NCSS
- ^ 8.7 Modelado ARIMA en R | OTexts . www.otexts.org . Consultado el 12 de mayo de 2016 .
- ^ "Caja modelo Jenkins" . SAP . Consultado el 8 de marzo de 2013 .
Otras lecturas
- Asteriou, Dimitros; Hall, Stephen G. (2011). "Modelos ARIMA y la metodología Box-Jenkins". Econometría aplicada (Segunda ed.). Palgrave MacMillan. págs. 265-286. ISBN 978-0-230-27182-1.
- Mills, Terence C. (1990). Técnicas de series de tiempo para economistas . Prensa de la Universidad de Cambridge. ISBN 978-0-521-34339-8.
- Percival, Donald B .; Walden, Andrew T. (1993). Análisis espectral para aplicaciones físicas . Prensa de la Universidad de Cambridge. ISBN 978-0-521-35532-2.
enlaces externos
- La Oficina del Censo de EE. UU. Utiliza ARIMA para datos "ajustados estacionalmente" (programas, documentos y artículos aquí).
- Notas de conferencia sobre modelos ARIMA (Robert Nau, Duke University)