Modelo de ecuaciones simultáneas


Los modelos de ecuaciones simultáneas son un tipo de modelo estadístico en el que las variables dependientes son funciones de otras variables dependientes, en lugar de solo variables independientes. [1] Esto significa que algunas de las variables explicativas se determinan conjuntamente con la variable dependiente, que en economía suele ser la consecuencia de algún mecanismo de equilibrio subyacente . Tome el modelo típico de oferta y demanda : mientras que normalmente se determinaría que la cantidad ofrecida y demandada es una función del precio establecido por el mercado, también es posible que ocurra lo contrario, donde los productores observan la cantidad que los consumidores demandany luego establecer el precio. [2]

La simultaneidad plantea desafíos para la estimación de los parámetros estadísticos de interés, porque se viola el supuesto de Gauss-Markov de exogeneidad estricta de los regresores. Y aunque sería natural estimar todas las ecuaciones simultáneas a la vez, esto a menudo conduce a un problema de optimización no lineal computacionalmente costoso incluso para el sistema más simple de ecuaciones lineales . [3] Esta situación impulsó el desarrollo, encabezado por la Comisión Cowles en las décadas de 1940 y 1950, [4] de varias técnicas que estiman cada ecuación en el modelo en serie, sobre todo información limitada de máxima verosimilitud.y mínimos cuadrados de dos etapas . [5]

donde i es el número de la ecuación y t = 1, ..., T es el índice de observación. En estas ecuaciones x que es la k i × 1 vector de variables exógenas, y que es la variable dependiente, y -i, t es el n i × 1 vector de todas las demás variables endógenas que entran en el i ésimo ecuación en la derecha lado, y T es son los términos de error. La notación “- i ” indica que el vector y −i, t puede contener cualquiera de las y'S excepto para y que (puesto que ya está presente en el lado de la izquierda). Los coeficientes de regresión β i y γ i son de dimensiones k i × 1 y n i × 1 correspondientemente. Apilando verticalmente las T observaciones correspondientes a la i- ésima ecuación, podemos escribir cada ecuación en forma vectorial como

donde y i y u i son T × 1 vectores, X i es una matriz T × k i de regresores exógenos, e Y −i es una matriz T × n i de regresores endógenos en el lado derecho de la i- ésima ecuación . Finalmente, podemos mover todas las variables endógenas al lado izquierdo y escribir las m ecuaciones conjuntamente en forma vectorial como

Esta representación se conoce como forma estructural . En esta ecuación, Y = [ y 1 y 2 ... y m ] es la matriz T × m de variables dependientes. Cada una de las matrices Y -i es de hecho un n i -columned submatriz de esta Y . La matriz m × m Γ, que describe la relación entre las variables dependientes, tiene una estructura complicada. Tiene unos en la diagonal, y todos los demás elementos de cada columna i son componentes del vector −γ io ceros, dependiendo de qué columnas de Y se incluyeron en la matriz Y −i . La matriz X de T × k contiene todos los regresores exógenos de todas las ecuaciones, pero sin repeticiones (es decir, la matriz X debe ser de rango completo). Por lo tanto, cada X i es una submatriz de X con columnas k i . La matriz Β tiene un tamaño k × m , y cada una de sus columnas consta de los componentes de los vectores β i y ceros, dependiendo de cuál de los regresores de X se incluyó o excluyó de X i . Finalmente, U= [ u 1 u 2 ... u m ] es una matriz T × m de los términos de error.

Este ya es un modelo lineal general simple y se puede estimar, por ejemplo, mediante mínimos cuadrados ordinarios . Desafortunadamente, la tarea de descomponer la matriz estimada en los factores individuales Β y Γ  −1 es bastante complicada y, por lo tanto, la forma reducida es más adecuada para la predicción pero no para la inferencia.