Muestreo de datos mixtos

Los modelos econométricos que involucran datos muestreados a diferentes frecuencias son de interés general. El muestreo de datos mixtos (MIDAS) es una regresión econométrica desarrollada por Eric Ghysels con varios coautores. En la actualidad existe una literatura sustancial sobre regresiones MIDAS y sus aplicaciones, incluyendo Ghysels, Santa-Clara y Valkanov (2006), ^[1] Ghysels, Sinko y Valkanov, ^[2] Andreou, Ghysels y Kourtellos (2010) ^[3] y Andreou , Ghysels y Kourtellos (2013). ^[4]

Una regresión MIDAS es una herramienta de pronóstico directo que puede relacionar datos futuros de baja frecuencia con indicadores de alta frecuencia actuales y rezagados, y producir diferentes modelos de pronóstico para cada horizonte de pronóstico. Puede tratar de manera flexible los datos muestreados en diferentes frecuencias y proporcionar un pronóstico directo de la variable de baja frecuencia. Incorpora cada uno de los datos de alta frecuencia en la regresión, lo que resuelve los problemas de pérdida de información potencialmente útil y de errores de especificación.

Un ejemplo de regresión simple tiene la variable independiente que aparece con una frecuencia más alta que la variable dependiente :

donde y es la variable dependiente, x es el regresor, m denota la frecuencia (por ejemplo, si y es anual es trimestral) es la perturbación y es una distribución rezagada, por ejemplo, la función Beta o Almon Lag . ${\ Displaystyle x_ {t} ^ {(4)}}$ ${\ Displaystyle \ varepsilon}$ ${\ Displaystyle B (L ^ {1 / m}; \ theta)}$

Los modelos de regresión pueden verse en algunos casos como sustitutos del filtro de Kalman cuando se aplican en el contexto de datos de frecuencia mixta. Bai, Ghysels y Wright (2013) ^[5] examinan la relación entre las regresiones MIDAS y los modelos de espacio de estado de filtro de Kalman aplicados a datos de frecuencia mixta. En general, este último implica un sistema de ecuaciones, mientras que, por el contrario, las regresiones MIDAS implican una sola ecuación (forma reducida). Como consecuencia, las regresiones MIDAS pueden ser menos eficientes, pero también menos propensas a errores de especificación. En los casos en que la regresión MIDAS es solo una aproximación, los errores de aproximación tienden a ser pequeños.

El MIDAS también se puede utilizar para series de tiempo de aprendizaje automático y transmisión inmediata de datos de panel . ^[6]^[7] Las regresiones MIDAS de aprendizaje automático involucran polinomios de Legendre . Las regresiones de series de tiempo de frecuencia mixta de alta dimensión involucran ciertas estructuras de datos que, una vez tomadas en cuenta, deberían mejorar el desempeño de los estimadores sin restricciones en muestras pequeñas. Estas estructuras están representadas por grupos que cubren variables dependientes rezagadas y grupos de rezagos para una covariable única (de alta frecuencia). Con ese fin, el enfoque MIDAS de aprendizaje automático aprovecha la regularización LASSO (sg-LASSO) de grupos dispersos que se adapta convenientemente a tales estructuras. ^[8] La característica atractiva del estimador sg-LASSO es que nos permite combinar de manera efectiva las señales aproximadamente escasas y densas.