Método de Box-Jenkins

En el análisis de series de tiempo , el método de Box-Jenkins, ^[1] llamado así por los estadísticos George Box y Gwilym Jenkins , aplica modelos de media móvil autorregresiva (ARMA) o media móvil integrada autorregresiva (ARIMA) para encontrar el mejor ajuste de una serie de tiempo. modelo a valores pasados de una serie de tiempo .

Enfoque de modelado

El modelo original utiliza un enfoque de modelado iterativo de tres etapas:

Identificación y selección del modelo : asegurarse de que las variables sean estacionarias , identificando la estacionalidad en la serie dependiente (diferenciándola estacionalmente si es necesario), y utilizando gráficas de lasfunciones de autocorrelación (ACF) y autocorrelación parcial (PACF) de la serie de tiempo dependiente para decidir qué componente autorregresivo o de media móvil (si lo hay) se debe utilizar en el modelo.
Estimación de parámetros mediante algoritmos de cálculo para llegar a los coeficientes que mejor se ajustan al modelo ARIMA seleccionado. Los métodos más comunes utilizan la estimación de máxima verosimilitud o la estimación por mínimos cuadrados no lineales .
Comprobación del modelo estadístico probando si el modelo estimado se ajusta a las especificaciones de un proceso univariado estacionario. En particular, los residuos deben ser independientes entre sí y constantes en media y varianza a lo largo del tiempo. (Trazar la media y la varianza de los residuales a lo largo del tiempo y realizar una prueba de Ljung-Box o trazar la autocorrelación y la autocorrelación parcial de los residuales son útiles para identificar errores de especificación). Si la estimación es inadecuada, tenemos que volver al paso uno e intentar construir un mejor modelo.

Los datos que utilizaron fueron de un horno de gas. Estos datos son bien conocidos como datos de hornos de gas de Box y Jenkins para la evaluación comparativa de modelos predictivos.

Commandeur y Koopman (2007, §10.4) ^[2] argumentan que el enfoque de Box-Jenkins es fundamentalmente problemático. El problema surge porque en "los campos económico y social, las series reales nunca son estacionarias por muchas diferencias que se hagan". Por lo tanto, el investigador tiene que enfrentarse a la pregunta: ¿qué tan cerca de estacionario está lo suficientemente cerca? Como señalan los autores, "esta es una pregunta difícil de responder". Los autores argumentan además que en lugar de usar Box-Jenkins, es mejor usar métodos de espacio de estados, ya que entonces no se requiere la estacionariedad de las series de tiempo.

Identificación del modelo Box – Jenkins

Estacionariedad y estacionalidad

El primer paso para desarrollar un modelo de Box-Jenkins es determinar si la serie de tiempo es estacionaria y si existe alguna estacionalidad significativa que deba modelarse.

Detectando estacionariedad

La estacionariedad se puede evaluar a partir de un diagrama de secuencia de ejecución . La gráfica de la secuencia de ejecución debe mostrar una ubicación y una escala constantes . También se puede detectar a partir de un gráfico de autocorrelación . Específicamente, la no estacionariedad a menudo se indica mediante una gráfica de autocorrelación con un decaimiento muy lento.

Detectando la estacionalidad

La estacionalidad (o periodicidad) generalmente se puede evaluar a partir de una gráfica de autocorrelación, una gráfica de subserie estacional o una gráfica espectral .

Diferenciar para lograr la estacionariedad

Box y Jenkins recomiendan el enfoque de diferenciación para lograr la estacionariedad. Sin embargo, ajustar una curva y restar los valores ajustados de los datos originales también se puede utilizar en el contexto de los modelos de Box-Jenkins.

Diferenciación estacional

En la etapa de identificación del modelo, el objetivo es detectar la estacionalidad, si existe, e identificar el orden de los términos de media móvil estacional autorregresiva y estacional. Para muchas series, el período es conocido y un solo término de estacionalidad es suficiente. Por ejemplo, para los datos mensuales, normalmente se incluiría un término AR 12 estacional o un término MA 12 estacional. Para los modelos Box-Jenkins, no se elimina explícitamente la estacionalidad antes de ajustar el modelo. En su lugar, se incluye el orden de los términos estacionales en la especificación del modelo para el software de estimación ARIMA . Sin embargo, puede ser útil aplicar una diferencia estacional a los datos y regenerar las gráficas de autocorrelación y autocorrelación parcial. Esto puede ayudar en la identificación del modelo del componente no estacional del modelo. En algunos casos, la diferenciación estacional puede eliminar la mayor parte o la totalidad del efecto de estacionalidad.

Identificar p y q

Una vez estacionariedad y estacionalidad han sido abordado, el siguiente paso es identificar el orden (es decir, la p y q ) de la autorregresivo y moviendo términos medios. Los diferentes autores tienen diferentes enfoques para identificar p y q . Brockwell y Davis (1991) ^[3] afirman que "nuestro criterio principal para la selección del modelo [entre los modelos ARMA (p, q)] será el AICc", es decir, el criterio de información de Akaike con corrección. Otros autores utilizan la gráfica de autocorrelación y la gráfica de autocorrelación parcial, que se describen a continuación.

Gráficos de autocorrelación y autocorrelación parcial

El gráfico de autocorrelación de muestra y el gráfico de autocorrelación parcial de muestra se comparan con el comportamiento teórico de estos gráficos cuando se conoce el orden.

Específicamente, para un proceso AR (1) , la función de autocorrelación de la muestra debe tener una apariencia exponencialmente decreciente. Sin embargo, los procesos de AR de orden superior son a menudo una mezcla de componentes sinusoidales amortiguados y decrecientes exponencialmente.

Para procesos autorregresivos de orden superior, la autocorrelación de la muestra debe complementarse con un gráfico de autocorrelación parcial. La autocorrelación parcial de un proceso AR ( p ) se vuelve cero en el retardo p + 1 y mayor, por lo que examinamos la función de autocorrelación parcial de muestra para ver si hay evidencia de una desviación de cero. Esto generalmente se determina colocando un intervalo de confianza del 95% en el gráfico de autocorrelación parcial de muestra (la mayoría de los programas de software que generan gráficos de autocorrelación de muestra también grafican este intervalo de confianza). Si el programa de software no genera la banda de confianza, es aproximadamente ${\ Displaystyle \ pm 2 / {\ sqrt {N}}}$ , donde N denota el tamaño de la muestra.

La función de autocorrelación de un proceso MA ( q ) se vuelve cero en el retardo q + 1 y mayor, por lo que examinamos la función de autocorrelación de muestra para ver dónde se convierte esencialmente en cero. Hacemos esto colocando el intervalo de confianza del 95% para la función de autocorrelación de la muestra en la gráfica de autocorrelación de la muestra. La mayoría del software que puede generar el gráfico de autocorrelación también puede generar este intervalo de confianza.

La función de autocorrelación parcial de muestra generalmente no es útil para identificar el orden del proceso de promedio móvil.

La siguiente tabla resume cómo se puede utilizar la función de autocorrelación de muestra para la identificación del modelo.

Forma	Modelo indicado
Exponencial, decayendo a cero	Modelo autorregresivo . Utilice la gráfica de autocorrelación parcial para identificar el orden del modelo autorregresivo.
Alternando positivo y negativo, decayendo a cero	Modelo autorregresivo. Utilice la gráfica de autocorrelación parcial para ayudar a identificar el orden.
Uno o más picos, el resto es esencialmente cero (o cerca de cero)	Modelo de promedio móvil , orden identificado por donde la parcela se vuelve cero.
Decaimiento, comenzando después de algunos retrasos	Modelo mixto autorregresivo y de media móvil ( ARMA ).
Todo cero o cerca de cero	Los datos son esencialmente aleatorios.
Valores altos a intervalos fijos	Incluya el término autorregresivo estacional.
Sin decadencia a cero (o decae muy lentamente)	La serie no es estacionaria.

Hyndman & Athanasopoulos sugieren lo siguiente: ^[4]

Los datos pueden seguir un modelo ARIMA ( p , d , 0) si las gráficas ACF y PACF de los datos diferenciados muestran los siguientes patrones:

el ACF está decayendo exponencialmente o sinusoidal;
hay un pico significativo en el rezago p en PACF, pero ninguno más allá del rezago p .

Los datos pueden seguir un modelo ARIMA (0, d , q ) si las gráficas ACF y PACF de los datos diferenciados muestran los siguientes patrones:

el PACF decae exponencialmente o es sinusoidal;
hay un pico significativo en el rezago q en ACF, pero ninguno más allá del rezago q .

En la práctica, las funciones de autocorrelación de muestra y autocorrelación parcial son variables aleatorias y no dan la misma imagen que las funciones teóricas. Esto dificulta la identificación del modelo. En particular, los modelos mixtos pueden ser particularmente difíciles de identificar. Aunque la experiencia es útil, el desarrollo de buenos modelos utilizando estos diagramas de muestra puede implicar mucho ensayo y error.

Estimación del modelo de Box-Jenkins

La estimación de los parámetros para los modelos de Box-Jenkins implica aproximar numéricamente las soluciones de ecuaciones no lineales. Por esta razón, es común utilizar software estadístico diseñado para manejar el enfoque; prácticamente todos los paquetes estadísticos modernos cuentan con esta capacidad. Los principales enfoques para ajustar los modelos de Box-Jenkins son los mínimos cuadrados no lineales y la estimación de máxima verosimilitud. La estimación de máxima verosimilitud es generalmente la técnica preferida. Las ecuaciones de probabilidad para el modelo completo de Box-Jenkins son complicadas y no se incluyen aquí. Ver (Brockwell y Davis, 1991) para detalles matemáticos.

Diagnóstico del modelo Box – Jenkins

Supuestos para un proceso univariado estable

El diagnóstico del modelo para los modelos de Box-Jenkins es similar a la validación del modelo para el ajuste por mínimos cuadrados no lineales.

Es decir, se supone que el término de error A _t sigue los supuestos para un proceso univariado estacionario. Los residuos deben ser ruido blanco (o independientes cuando sus distribuciones son normales) dibujos de una distribución fija con una media y varianza constantes. Si el modelo de Box-Jenkins es un buen modelo para los datos, los residuos deben satisfacer estos supuestos.

Si no se cumplen estos supuestos, es necesario ajustar un modelo más apropiado. Es decir, vuelva al paso de identificación del modelo e intente desarrollar un modelo mejor. Es de esperar que el análisis de los residuos pueda proporcionar algunas pistas sobre un modelo más apropiado.

Una forma de evaluar si los residuos del modelo de Box-Jenkins siguen los supuestos es generar gráficos estadísticos (incluida una gráfica de autocorrelación) de los residuos. También se podría observar el valor del estadístico Box-Ljung .

Referencias

^ Caja, George; Jenkins, Gwilym (1970). Análisis de series de tiempo: pronóstico y control . San Francisco: Holden-Day.
^ Commandeur, JJF; Koopman, SJ (2007). Introducción al análisis de series temporales de espacio de estados . Prensa de la Universidad de Oxford .
^ Brockwell, Peter J .; Davis, Richard A. (1991). Series temporales: teoría y métodos . Springer-Verlag. pag. 273.
^ Hyndman, Rob J; Athanasopoulos, George. "Forecasting: principios y práctica" . Consultado el 18 de mayo de 2015 .

Otras lecturas

Beveridge, S .; Oickle, C. (1994), "Comparación de Box-Jenkins y métodos objetivos para determinar el orden de un modelo ARMA no estacional", Journal of Forecasting , 13 : 419–434, doi : 10.1002 / for.3980130502
Pankratz, Alan (1983), Predicción con modelos de caja univariante de Jenkins: conceptos y casos , John Wiley & Sons

enlaces externos

Un primer curso sobre análisis de series de tiempo : un libro de código abierto sobre análisis de series de tiempo con SAS (Capítulo 7)
Modelos de Box-Jenkins en el Manual de estadísticas de ingeniería del NIST
Modelado de Box – Jenkins por Rob J Hyndman
La metodología Box-Jenkins para modelos de series de tiempo por Theresa Hoang Diem Ngo

Este artículo incorpora material de dominio público del sitio web del Instituto Nacional de Estándares y Tecnología https://www.nist.gov .

[1] Caja, George; Jenkins, Gwilym (1970). Análisis de series de tiempo: pronóstico y control . San Francisco: Holden-Day.

[2] Commandeur, JJF; Koopman, SJ (2007). Introducción al análisis de series temporales de espacio de estados . Prensa de la Universidad de Oxford .

[3] Brockwell, Peter J .; Davis, Richard A. (1991). Series temporales: teoría y métodos . Springer-Verlag. pag. 273.

[4] Hyndman, Rob J; Athanasopoulos, George. "Forecasting: principios y práctica" . Consultado el 18 de mayo de 2015 .

[1]