En la estadística análisis de series de tiempo , autorregresivo-de media móvil ( ARMA ) modelos proporcionan una descripción parsimonioso de un proceso estocástico (débilmente) estacionario en términos de dos polinomios, uno para la autorregresión (AR) y el segundo para la media móvil ( MAMÁ). El modelo ARMA general se describió en la tesis de 1951 de Peter Whittle , Prueba de hipótesis en el análisis de series de tiempo , y se popularizó en el libro de 1970 de George EP Box y Gwilym Jenkins .
Dada una serie temporal de datos X t , el modelo ARMA es una herramienta para comprender y, quizás, predecir los valores futuros de esta serie. La parte AR implica hacer una regresión de la variable en sus propios valores rezagados (es decir, pasados). La parte MA implica modelar el término de error como una combinación lineal de términos de error que ocurren al mismo tiempo y en varios momentos en el pasado. El modelo generalmente se conoce como el modelo ARMA ( p , q ) donde p es el orden de la parte AR yq es el orden de la parte MA (como se define a continuación).
Los modelos ARMA se pueden estimar utilizando el método de Box-Jenkins .
Modelo autorregresivo
La notación AR ( p ) se refiere al modelo autorregresivo de orden p . El modelo AR ( p ) está escrito
dónde son parámetros , es una constante y la variable aleatoria es ruido blanco .
Algunas restricciones son necesarias sobre los valores de los parámetros para que el modelo permanezca estacionario . Por ejemplo, procesos en el modelo AR (1) con no están estacionarios.
Modelo de media móvil
La notación MA ( q ) se refiere al modelo de media móvil de orden q :
donde θ 1 , ..., θ q son los parámetros del modelo, μ es la expectativa de (a menudo se supone que es igual a 0), y el , , ... son, de nuevo, términos de error de ruido blanco .
Modelo ARMA
La notación ARMA ( p , q ) se refiere al modelo con p términos autorregresivos y q términos de media móvil. Este modelo contiene los modelos AR ( p ) y MA ( q ),
El modelo ARMA general se describió en la tesis de 1951 de Peter Whittle , quien utilizó análisis matemático ( serie de Laurent y análisis de Fourier ) e inferencia estadística. [1] [2] Los modelos ARMA fueron popularizados por un libro de 1970 de George EP Box y Jenkins, quienes expusieron un método iterativo ( Box-Jenkins ) para elegirlos y estimarlos. Este método fue útil para polinomios de bajo orden (de grado tres o menos). [3]
El modelo ARMA es esencialmente un filtro de respuesta de impulso infinito aplicado al ruido blanco, con alguna interpretación adicional colocada sobre él.
Nota sobre los términos de error
Los términos de error generalmente se asume que son variables aleatorias independientes distribuidas de manera idéntica (iid) muestreadas a partir de una distribución normal con media cero:~ N (0, σ 2 ) donde σ 2 es la varianza. Estos supuestos pueden debilitarse, pero al hacerlo cambiarán las propiedades del modelo. En particular, un cambio en el supuesto de iid marcaría una diferencia bastante fundamental.
Especificación en términos de operador de retraso
En algunos textos los modelos se especificarán en términos del operador de retardos L . En estos términos, el modelo AR ( p ) viene dado por
dónde representa el polinomio
El modelo MA ( q ) viene dado por
donde θ representa el polinomio
Finalmente, el modelo combinado ARMA ( p , q ) viene dado por
o más concisamente,
o
Notación alternativa
Algunos autores, incluidos Box , Jenkins y Reinsel, utilizan una convención diferente para los coeficientes de autorregresión. [4] Esto permite que todos los polinomios que involucran al operador de retardo aparezcan en una forma similar en todas partes. Por lo tanto, el modelo ARMA se escribiría como
Además, a partir de las sumas de y ambientación y , obtenemos una formulación aún más elegante:
Modelos adecuados
Elegir pyq
Encontrar valores adecuados de p y q en el (ARMA p , q ) modelo se puede facilitar mediante el trazado de las funciones de autocorrelación parciales para una estimación de p , y del mismo modo usando las funciones de autocorrelación para una estimación de q . Las funciones de autocorrelación extendidas (EACF) se pueden utilizar para determinar simultáneamente py q. [5] La información adicional puede ser obtenida considerando las mismas funciones para los residuos de un modelo equipado con una selección inicial de p y q .
Brockwell y Davis recomiendan utilizar el criterio de información de Akaike (AIC) para encontrar p y q . [6] Otra opción posible para determinar el orden es el criterio BIC .
Estimación de coeficientes
Modelos ARMA en general puede ser, después de elegir p y q , armarios por mínimos cuadrados de regresión para encontrar los valores de los parámetros que minimizan el término de error. En general, se considera una buena práctica para encontrar los valores más pequeños de p y q que proporcionan un ajuste aceptable a los datos. Para un modelo AR puro, las ecuaciones de Yule-Walker pueden usarse para proporcionar un ajuste.
Implementaciones en paquetes de estadísticas
- En R , la función arima (en las estadísticas de paquetes estándar ) está documentada en ARIMA Modeling of Time Series . Los paquetes de extensión contienen funcionalidades relacionadas y extendidas, por ejemplo, el paquete tseries incluye una función arma , documentada en "Ajustar modelos ARMA a series temporales" ; el paquete fracdiff contiene fracdiff () para procesos ARMA integrados fraccionalmente; y el paquete de pronóstico incluye auto.arima para seleccionar un conjunto parsimonioso de p, q . La vista de tareas CRAN en Series temporales contiene enlaces a la mayoría de ellos.
- Mathematica tiene una biblioteca completa de funciones de series de tiempo que incluyen ARMA. [7]
- MATLAB incluye funciones como arma y ar para estimar modelos AR, ARX (exógenos autorregresivos) y ARMAX. Consulte Caja de herramientas de identificación del sistema y Caja de herramientas de econometría para obtener más información.
- Julia tiene algunos paquetes impulsados por la comunidad que implementan ajustados con un modelo ARMA como arma.jl .
- El módulo Statsmodels Python incluye muchos modelos y funciones para el análisis de series de tiempo, incluido ARMA. Anteriormente formaba parte de Scikit-learn , ahora es independiente y se integra bien con Pandas . Consulte aquí para obtener más detalles .
- PyFlux tiene una implementación de modelos ARIMAX basada en Python, incluidos los modelos ARIMAX bayesianos.
- Las bibliotecas numéricas IMSL son bibliotecas de funcionalidad de análisis numérico que incluyen procedimientos ARMA y ARIMA implementados en lenguajes de programación estándar como C, Java, C # .NET y Fortran.
- gretl también puede estimar el modelo ARMA, vea aquí donde se menciona .
- GNU Octave puede estimar modelos AR usando funciones del paquete adicional octave-forge .
- Stata incluye la función arima que puede estimar modelos ARMA y ARIMA . Consulte aquí para obtener más detalles .
- SuanShu es una biblioteca Java de métodos numéricos, que incluye paquetes de estadísticas integrales, en los que se implementan modelos ARMA, ARIMA, ARMAX, etc. univariados / multivariados en un enfoque orientado a objetos. Estas implementaciones están documentadas en "SuanShu, una biblioteca numérica y estadística de Java" .
- SAS tiene un paquete econométrico, ETS, que estima los modelos ARIMA. Consulte aquí para obtener más detalles .
Aplicaciones
ARMA es apropiado cuando un sistema es una función de una serie de choques no observados (el MA o parte de la media móvil), así como su propio comportamiento. Por ejemplo, los precios de las acciones pueden verse impactados por información fundamental, así como mostrar tendencias técnicas y efectos de reversión a la media debido a los participantes del mercado. [ cita requerida ]
Generalizaciones
Se supone que la dependencia de X t de valores pasados y los términos de error ε t es lineal a menos que se especifique lo contrario. Si la dependencia es no lineal, el modelo se denomina específicamente modelo de media móvil no lineal (NMA), autorregresivo no lineal (NAR) o modelo de media móvil autorregresiva no lineal (NARMA).
Los modelos autorregresivos de media móvil se pueden generalizar de otras formas. Consulte también los modelos de heterocedasticidad condicional autorregresiva (ARCH) y los modelos de media móvil integrada autorregresiva (ARIMA). Si se van a ajustar varias series de tiempo, se puede ajustar un modelo vectorial ARIMA (o VARIMA). Si la serie de tiempo en cuestión exhibe una memoria larga, entonces el modelado ARIMA fraccional (FARIMA, a veces llamado ARFIMA) puede ser apropiado: consulte Promedio móvil autoregresivo integrado fraccionalmente . Si se cree que los datos contienen efectos estacionales, se pueden modelar mediante un modelo SARIMA (ARIMA estacional) o un modelo ARMA periódico.
Otra generalización es el modelo autorregresivo multiescala (MAR). Un modelo MAR está indexado por los nodos de un árbol, mientras que un modelo autorregresivo estándar (tiempo discreto) está indexado por números enteros.
Tenga en cuenta que el modelo ARMA es un modelo univariado . Las extensiones para el caso multivariado son la autorregresión vectorial (VAR) y la media móvil de autorregresión vectorial (VARMA).
Modelo autorregresivo de media móvil con modelo de entradas exógenas (modelo ARMAX)
La notación ARMAX ( p , q , b ) se refiere al modelo con p términos autorregresivos, q términos de promedio móvil y b términos de insumos exógenos. Este modelo contiene los modelos AR ( p ) y MA ( q ) y una combinación lineal de los últimos términos b de una serie de tiempo conocida y externa.. Está dado por:
dónde son los parámetros de la entrada exógena.
Se han definido algunas variantes no lineales de modelos con variables exógenas: ver por ejemplo Modelo exógeno autorregresivo no lineal .
Los paquetes estadísticos implementan el modelo ARMAX mediante el uso de variables "exógenas" (es decir, independientes). Se debe tener cuidado al interpretar la salida de esos paquetes, porque los parámetros estimados generalmente (por ejemplo, en R [8] y gretl ) se refieren a la regresión:
donde m t incorpora todas las variables exógenas (o independientes):
Ver también
- Media móvil integrada autorregresiva (ARIMA)
- Suavizado exponencial
- Codificación predictiva lineal
- Analítica predictiva
- Respuesta de impulso infinito
- Respuesta de impulso finito
Referencias
- ^ Hannan, Edward James (1970). Varias series de tiempo . Serie de Wiley en probabilidad y estadística matemática. Nueva York: John Wiley and Sons.
- ^ Whittle, P. (1951). Prueba de hipótesis en el análisis de series de tiempo . Almquist y Wicksell.Whittle, P. (1963). Predicción y Regulación . Prensa de Universidades Inglesas. ISBN 0-8166-1147-5.
- Republicado como: Whittle, P. (1983). Predicción y regulación por métodos lineales de mínimos cuadrados . Prensa de la Universidad de Minnesota. ISBN 0-8166-1148-3.
- ^ Hannan y Deistler (1988 , p. 227): Hannan, EJ ; Deistler, Manfred (1988). Teoría estadística de sistemas lineales . Serie de Wiley en probabilidad y estadística matemática. Nueva York: John Wiley and Sons.
- ^ Caja, George; Jenkins, Gwilym M .; Reinsel, Gregory C. (1994). Análisis de series de tiempo: pronóstico y control (tercera edición). Prentice Hall. ISBN 0130607746.
- ^ Universidad Estatal de Missouri. "Especificación del modelo, análisis de series de tiempo" (PDF) .
- ^ Brockwell, PJ; Davis, RA (2009). Series temporales: teoría y métodos (2ª ed.). Nueva York: Springer. pag. 273. ISBN 9781441903198.
- ^ Funciones de series de tiempo en Mathematica Archivado el 24 de noviembre de 2011 en Wayback Machine
- ^ Modelado ARIMA de series temporales , documentación de R
Otras lecturas
- Mills, Terence C. (1990). Técnicas de series de tiempo para economistas . Prensa de la Universidad de Cambridge. ISBN 0521343399.
- Percival, Donald B .; Walden, Andrew T. (1993). Análisis espectral para aplicaciones físicas . Prensa de la Universidad de Cambridge. ISBN 052135532X.
- Francq, C .; Zakoïan, J.-M. (2005), "Resultados recientes para modelos de series de tiempo lineales con innovaciones no independientes", en Duchesne, P .; Remillard, B. (eds.), Modelado y análisis estadístico para problemas de datos complejos , Springer, págs. 241-265, CiteSeerX 10.1.1.721.1754.