En econometría , el modelo de regresiones aparentemente no relacionadas ( SUR ) [1] : 306 [2] : 279 [3] : 332 o ecuaciones de regresión aparentemente no relacionadas ( SURE ) [4] [5] : 2 , propuesto por Arnold Zellner en (1962 ), es una generalización de un modelo de regresión linealque consta de varias ecuaciones de regresión, cada una con su propia variable dependiente y conjuntos potencialmente diferentes de variables explicativas exógenas. Cada ecuación es una regresión lineal válida por sí sola y se puede estimar por separado, razón por la cual el sistema se denomina aparentemente no relacionado , [3] : 332 aunque algunos autores sugieren que el término aparentemente relacionado sería más apropiado, [1] : 306 ya que se supone que los términos de error están correlacionados entre las ecuaciones.
El modelo se puede estimar ecuación por ecuación utilizando mínimos cuadrados ordinarios estándar (MCO). Tales estimaciones son consistentes , sin embargo, generalmente no son tan eficientes como el método SUR, que equivale a mínimos cuadrados generalizados factibles con una forma específica de la matriz de varianza-covarianza. Dos casos importantes en los que SUR es de hecho equivalente a MCO son cuando los términos de error no están correlacionados entre las ecuaciones (de modo que realmente no están relacionados) y cuando cada ecuación contiene exactamente el mismo conjunto de regresores en el lado derecho.
El modelo SUR puede verse como la simplificación del modelo lineal general donde ciertos coeficientes en la matrizestán restringidos a ser iguales a cero, o como la generalización del modelo lineal general donde se permite que los regresores del lado derecho sean diferentes en cada ecuación. El modelo SUR se puede generalizar aún más en el modelo de ecuaciones simultáneas , donde los regresores del lado derecho también pueden ser las variables endógenas.
El modelo
Suponga que hay m ecuaciones de regresión
Aquí i representa el número de la ecuación, r = 1,…, R es la observación individual, y estamos tomando la transposición de lavector de columna. Se supone que el número de observaciones R es grande, por lo que en el análisis tomamos R →, mientras que el número de ecuaciones m permanece fijo.
Cada ecuación i tiene una única variable de respuesta y ir , y un vector k i -dimensional de regresores x ir . Si apilamos las observaciones correspondientes a la i -ésima ecuación en vectores y matrices R -dimensionales, entonces el modelo se puede escribir en forma vectorial como
donde y i y ε i son vectores R × 1, X i es una matriz R × k i , y β i es un vector k i × 1.
Finalmente, si apilamos estas m ecuaciones vectoriales una encima de la otra, el sistema tomará la forma [4] ( ecuación (2.2) )
( 1 )
El supuesto del modelo es que los términos de error ε ir son independientes entre las observaciones, pero pueden tener correlaciones entre ecuaciones dentro de las observaciones. Por tanto, asumimos que E [ ε ir ε es | X ] = 0 siempre que r ≠ s , mientras que E [ ε ir ε jr | X ] = σ ij . Denotando Σ = [ σ ij ] la matriz de esquedasticidad m × m de cada observación, la matriz de covarianza de los términos de error apilados ε será igual a [4] ( ecuación (2.4) ) [3] : 332
donde I R es la matriz de identidad R -dimensional y ⊗ denota el producto de Kronecker de la matriz .
Estimacion
El modelo SUR generalmente se estima utilizando el método de mínimos cuadrados generalizados factibles (FGLS). Este es un método de dos pasos en el que en el primer paso ejecutamos una regresión de mínimos cuadrados ordinarios para ( 1 ). Los residuos de esta regresión se utilizan para estimar los elementos de la matriz.: [6] : 198
En el segundo paso, ejecutamos una regresión de mínimos cuadrados generalizada para ( 1 ) utilizando la matriz de varianza:
Este estimador es insesgado en muestras pequeñas asumiendo que los términos de error ε ir tienen distribución simétrica; en muestras grandes es consistente y asintóticamente normal con distribución limitante [6] : 198
Se sugirieron otras técnicas de estimación además de FGLS para el modelo SUR: [7] el método de máxima verosimilitud (ML) bajo el supuesto de que los errores se distribuyen normalmente; los mínimos cuadrados generalizados iterativos (IGLS), donde los residuos del segundo paso de FGLS se utilizan para recalcular la matriz, luego estima nuevamente usando GLS, y así sucesivamente, hasta que se logre la convergencia; el esquema iterativo de mínimos cuadrados ordinarios (IOLS), donde la estimación se realiza ecuación por ecuación, pero cada ecuación incluye como regresores adicionales los residuos de las ecuaciones estimadas previamente para tener en cuenta las correlaciones entre ecuaciones, la estimación es ejecutar iterativamente hasta que se logre la convergencia. Kmenta y Gilbert (1968) realizaron un estudio de Monte-Carlo y establecieron que los tres métodos — IGLS, IOLS y ML — producen resultados numéricamente equivalentes, también encontraron que la distribución asintótica de estos estimadores es la misma que la distribución del estimador FGLS , mientras que en muestras pequeñas ninguno de los estimadores fue superior a los demás. [8] Zellner y Ando (2010) desarrollaron un método Monte Carlo directo para el análisis bayesiano del modelo SUR. [9]
Equivalencia a OLS
Hay dos casos importantes en los que las estimaciones SUR resultan equivalentes a la ecuación por ecuación OLS, por lo que no hay ganancia en la estimación conjunta del sistema. Estos casos son:
- Cuando se sabe que la matriz Σ es diagonal, es decir, no hay correlaciones de ecuaciones cruzadas entre los términos de error. En este caso, el sistema no parece estar relacionado, sino realmente.
- Cuando cada ecuación contiene exactamente el mismo conjunto de regresores, eso es X 1 = X 2 =… = X m . Que los estimadores resultan ser numéricamente idénticos a las estimaciones de MCO se deduce del teorema del árbol de Kruskal , [1] : 313 o puede mostrarse mediante el cálculo directo. [6] : 197
Paquetes estadísticos
- En R , SUR se puede estimar utilizando el paquete "systemfit". [10] [11] [12] [13]
- En SAS , SUR se puede estimar mediante el
syslin
procedimiento. [14] - En Stata , SUR se puede estimar usando los comandos
sureg
ysuest
. [15] [16] [17] - En Limdep , SUR se puede estimar usando el
sure
comando [18] - En Python , SUR se puede estimar usando el comando
SUR
en el paquete "linearmodels". [19] - En gretl , SUR se puede estimar usando el
system
comando.
Ver también
- Modelo linear general
- Modelos de ecuaciones simultáneas
Referencias
- ^ a b c Davidson, Russell; MacKinnon, James G. (1993). Estimación e inferencia en econometría . Prensa de la Universidad de Oxford. ISBN 978-0-19-506011-9.
- ^ Hayashi, Fumio (2000). Econometría . Prensa de la Universidad de Princeton. ISBN 978-0-691-01018-2.
- ^ a b c Greene, William H. (2012). Análisis econométrico (Séptima ed.). Upper Saddle River: Pearson Prentice-Hall. págs. 332–344. ISBN 978-0-273-75356-8.
- ^ a b c Zellner, Arnold (1962). "Un método eficaz para estimar ecuaciones de regresión aparentemente no relacionadas y pruebas de sesgo de agregación". Revista de la Asociación Estadounidense de Estadística . 57 (298): 348–368. doi : 10.2307 / 2281644 . JSTOR 2281644 .
- ^ Srivastava, Virendra K .; Giles, David EA (1987). Modelos de ecuaciones de regresión aparentemente no relacionados: estimación e inferencia . Nueva York: Marcel Dekker. ISBN 978-0-8247-7610-7.
- ^ a b c Amemiya, Takeshi (1985). Econometría avanzada . Cambridge, Massachusetts: Harvard University Press. pag. 197 . ISBN 978-0-674-00560-0.
- ^ Srivastava, VK; Dwivedi, TD (1979). "Estimación de ecuaciones de regresión aparentemente no relacionadas: una breve encuesta". Revista de Econometría . 10 (1): 15–32. doi : 10.1016 / 0304-4076 (79) 90061-7 .
- ^ Kmenta, Jan ; Gilbert, Roy F. (1968). "Propiedades de muestra pequeña de estimadores alternativos de regresiones aparentemente no relacionadas". Revista de la Asociación Estadounidense de Estadística . 63 (324): 1180-1200. doi : 10.2307 / 2285876 . JSTOR 2285876 .
- ^ Zellner, A .; Ando, T. (2010). "Un enfoque directo de Monte Carlo para el análisis bayesiano del modelo de regresión aparentemente no relacionado". Revista de Econometría . 159 : 33–45. CiteSeerX 10.1.1.553.7799 . doi : 10.1016 / j.jeconom.2010.04.005 .
- ^ Hay ejemplos disponibles en la viñeta del paquete.
- ^ Zeileis, Achim (2008). "Vista de tareas CRAN: Econometría computacional" . Cite journal requiere
|journal=
( ayuda ) - ^ Kleiber, Christian; Zeileis, Achim (2008). Econometría Aplicada con R . Nueva York: Springer. págs. 89–90. ISBN 978-0-387-77318-6.
- ^ Vinod, Hrishikesh D. (2008). "Identificación de modelos de ecuaciones simultáneas" . Hands-on Intermedio Econometría Usando R . World Scientific. págs. 282–88. ISBN 978-981-281-885-0.
- ^ "Estimación SUR, 3SLS y FIML" . Soporte SAS .
- ^ "sureg - regresión aparentemente no relacionada de Zellner" (PDF) . Stata Manual .
- ^ Baum, Christopher F. (2006). Introducción a la econometría moderna con Stata . College Station: Stata Press. págs. 236–242. ISBN 978-1-59718-013-9.
- ^ Cameron, A. Colin; Trivedi, Pravin K. (2010). "Sistema de regresiones lineales" . Microeconometrics Using Stata (Ed. Revisada). College Station: Stata Press. págs. 162–69. ISBN 978-1-59718-073-3.
- ^ https://people.emich.edu/jthornton/text-files/Econ515_Limdep_Guide.doc
- ^ "Estimadores de regresión del sistema - documentación linearmodels 3.5" . bashtage.github.io . Consultado el 3 de julio de 2017 .
Otras lecturas
- Davidson, James (2000). Teoría econométrica . Oxford: Blackwell. págs. 308–314. ISBN 978-0-631-17837-8.
- Fiebig, Denzil G. (2001). "Regresión aparentemente no relacionada". En Baltagi, Badi H. (ed.). Un compañero de la econometría teórica . Oxford: Blackwell. págs. 101-121. ISBN 978-0-631-21254-6.
- Greene, William H. (2012). Análisis econométrico (Séptima ed.). Upper Saddle River: Pearson Prentice-Hall. págs. 332–344. ISBN 978-0-273-75356-8.