Regresiones aparentemente no relacionadas

En econometría , el modelo de regresiones aparentemente no relacionadas ( SUR ) ^[1]^{: 306}^[2]^{: 279}^[3]^{: 332} o ecuaciones de regresión aparentemente no relacionadas ( SURE ) ^[4]^[5]^{: 2} , propuesto por Arnold Zellner en (1962 ), es una generalización de un modelo de regresión linealque consta de varias ecuaciones de regresión, cada una con su propia variable dependiente y conjuntos potencialmente diferentes de variables explicativas exógenas. Cada ecuación es una regresión lineal válida por sí sola y se puede estimar por separado, razón por la cual el sistema se denomina aparentemente no relacionado , ^[3]^{: 332} aunque algunos autores sugieren que el término aparentemente relacionado sería más apropiado, ^[1]^{: 306} ya que se supone que los términos de error están correlacionados entre las ecuaciones.

El modelo se puede estimar ecuación por ecuación utilizando mínimos cuadrados ordinarios estándar (MCO). Tales estimaciones son consistentes , sin embargo, generalmente no son tan eficientes como el método SUR, que equivale a mínimos cuadrados generalizados factibles con una forma específica de la matriz de varianza-covarianza. Dos casos importantes en los que SUR es de hecho equivalente a MCO son cuando los términos de error no están correlacionados entre las ecuaciones (de modo que realmente no están relacionados) y cuando cada ecuación contiene exactamente el mismo conjunto de regresores en el lado derecho.

El modelo SUR puede verse como la simplificación del modelo lineal general donde ciertos coeficientes en la matriz ${\ Displaystyle \ mathrm {B}}$ están restringidos a ser iguales a cero, o como la generalización del modelo lineal general donde se permite que los regresores del lado derecho sean diferentes en cada ecuación. El modelo SUR se puede generalizar aún más en el modelo de ecuaciones simultáneas , donde los regresores del lado derecho también pueden ser las variables endógenas.

El modelo

Suponga que hay m ecuaciones de regresión

{\ Displaystyle y_ {ir} = x_ {ir} ^ {\ mathsf {T}} \; \! \ beta _ {i} + \ varepsilon _ {ir}, \ quad i = 1, \ ldots, m.}

Aquí i representa el número de la ecuación, r = 1,…, R es la observación individual, y estamos tomando la transposición de la ${\ Displaystyle x_ {ir}}$ vector de columna. Se supone que el número de observaciones R es grande, por lo que en el análisis tomamos R → ${\ Displaystyle \ infty}$ , mientras que el número de ecuaciones m permanece fijo.

Cada ecuación i tiene una única variable de respuesta y _ir , y un vector k _i -dimensional de regresores x _ir . Si apilamos las observaciones correspondientes a la i -ésima ecuación en vectores y matrices R -dimensionales, entonces el modelo se puede escribir en forma vectorial como

{\ Displaystyle y_ {i} = X_ {i} \ beta _ {i} + \ varepsilon _ {i}, \ quad i = 1, \ ldots, m,}

donde y _i y ε _i son vectores R × 1, X _i es una matriz R × k _i , y β _i es un vector k _i × 1.

Finalmente, si apilamos estas m ecuaciones vectoriales una encima de la otra, el sistema tomará la forma ^[4]^{( ecuación (2.2) )}

{\ displaystyle {\ begin {pmatrix} y_ {1} \\ y_ {2} \\\ vdots \\ y_ {m} \ end {pmatrix}} = {\ begin {pmatrix} X_ {1} & 0 & \ ldots & 0 \\ 0 & X_ {2} & \ ldots & 0 \\\ vdots & \ vdots & \ ddots & \ vdots \\ 0 & 0 & \ ldots & X_ {m} \ end {pmatrix}} {\ begin {pmatrix} \ beta _ {1} \\\ beta _ {2} \\\ vdots \\\ beta _ {m} \ end {pmatrix}} + {\ begin {pmatrix} \ varepsilon _ {1} \\\ varepsilon _ {2} \\\ vdots \\\ varepsilon _ {m} \ end {pmatrix}} = X \ beta + \ varepsilon \ ,.}

( 1 )

El supuesto del modelo es que los términos de error ε _ir son independientes entre las observaciones, pero pueden tener correlaciones entre ecuaciones dentro de las observaciones. Por tanto, asumimos que E [ ε _ir ε _es | X ] = 0 siempre que r ≠ s , mientras que E [ ε _ir ε _jr | X ] = σ _ij . Denotando Σ = [ σ _ij ] la matriz de esquedasticidad m × m de cada observación, la matriz de covarianza de los términos de error apilados ε será igual a ^[4]^{( ecuación (2.4) )}^[3]^{: 332}

{\ Displaystyle \ Omega \ equiv \ operatorname {E} [\, \ varepsilon \ varepsilon ^ {\ mathsf {T}} \, | X \,] = \ Sigma \ otimes I_ {R},}

donde I _R es la matriz de identidad R -dimensional y ⊗ denota el producto de Kronecker de la matriz .

Estimacion

El modelo SUR generalmente se estima utilizando el método de mínimos cuadrados generalizados factibles (FGLS). Este es un método de dos pasos en el que en el primer paso ejecutamos una regresión de mínimos cuadrados ordinarios para ( 1 ). Los residuos de esta regresión se utilizan para estimar los elementos de la matriz. ${\ Displaystyle \ Sigma}$ : ^[6]^{: 198}

{\ Displaystyle {\ hat {\ sigma}} _ {ij} = {\ frac {1} {R}} \, {\ hat {\ varepsilon}} _ {i} ^ {\ mathsf {T}} {\ sombrero {\ varepsilon}} _ {j}.}

En el segundo paso, ejecutamos una regresión de mínimos cuadrados generalizada para ( 1 ) utilizando la matriz de varianza ${\ Displaystyle \ scriptstyle {\ hat {\ Omega}} \; = \; {\ hat {\ Sigma}} \, \ otimes \, I_ {R}}$ :

{\ Displaystyle {\ hat {\ beta}} = {\ Big (} X ^ {\ mathsf {T}} ({\ hat {\ Sigma}} ^ {- 1} \ otimes I_ {R}) X {\ Grande)} ^ {\! - 1} X ^ {\ mathsf {T}} ({\ hat {\ Sigma}} ^ {- 1} \ otimes I_ {R}) \, y.}

Este estimador es insesgado en muestras pequeñas asumiendo que los términos de error ε _ir tienen distribución simétrica; en muestras grandes es consistente y asintóticamente normal con distribución limitante ^[6]^{: 198}

{\ Displaystyle {\ sqrt {R}} ({\ hat {\ beta}} - \ beta) \ {\ xrightarrow {d}} \ {\ mathcal {N}} {\ Big (} \, 0, \; {\ Big (} {\ tfrac {1} {R}} X ^ {\ mathsf {T}} (\ Sigma ^ {- 1} \ otimes I_ {R}) X {\ Big)} ^ {\! - 1} \, {\ Big)}.}

Se sugirieron otras técnicas de estimación además de FGLS para el modelo SUR: ^[7] el método de máxima verosimilitud (ML) bajo el supuesto de que los errores se distribuyen normalmente; los mínimos cuadrados generalizados iterativos (IGLS), donde los residuos del segundo paso de FGLS se utilizan para recalcular la matriz ${\ Displaystyle \ scriptstyle {\ hat {\ Sigma}}}$ , luego estima ${\ Displaystyle \ scriptstyle {\ hat {\ beta}}}$ nuevamente usando GLS, y así sucesivamente, hasta que se logre la convergencia; el esquema iterativo de mínimos cuadrados ordinarios (IOLS), donde la estimación se realiza ecuación por ecuación, pero cada ecuación incluye como regresores adicionales los residuos de las ecuaciones estimadas previamente para tener en cuenta las correlaciones entre ecuaciones, la estimación es ejecutar iterativamente hasta que se logre la convergencia. Kmenta y Gilbert (1968) realizaron un estudio de Monte-Carlo y establecieron que los tres métodos — IGLS, IOLS y ML — producen resultados numéricamente equivalentes, también encontraron que la distribución asintótica de estos estimadores es la misma que la distribución del estimador FGLS , mientras que en muestras pequeñas ninguno de los estimadores fue superior a los demás. ^[8] Zellner y Ando (2010) desarrollaron un método Monte Carlo directo para el análisis bayesiano del modelo SUR. ^[9]

Equivalencia a OLS

Hay dos casos importantes en los que las estimaciones SUR resultan equivalentes a la ecuación por ecuación OLS, por lo que no hay ganancia en la estimación conjunta del sistema. Estos casos son:

Cuando se sabe que la matriz Σ es diagonal, es decir, no hay correlaciones de ecuaciones cruzadas entre los términos de error. En este caso, el sistema no parece estar relacionado, sino realmente.
Cuando cada ecuación contiene exactamente el mismo conjunto de regresores, eso es X ₁ = X ₂ =… = X _m . Que los estimadores resultan ser numéricamente idénticos a las estimaciones de MCO se deduce del teorema del árbol de Kruskal , ^[1]^{: 313} o puede mostrarse mediante el cálculo directo. ^[6]^{: 197}

Paquetes estadísticos

En R , SUR se puede estimar utilizando el paquete "systemfit". ^[10]^[11]^[12]^[13]
En SAS , SUR se puede estimar mediante el syslinprocedimiento. ^[14]
En Stata , SUR se puede estimar usando los comandos suregy suest. ^[15]^[16]^[17]
En Limdep , SUR se puede estimar usando el surecomando ^[18]
En Python , SUR se puede estimar usando el comando SURen el paquete "linearmodels". ^[19]
En gretl , SUR se puede estimar usando el systemcomando.

Ver también

Modelo linear general
Modelos de ecuaciones simultáneas

Referencias

^ a b c Davidson, Russell; MacKinnon, James G. (1993). Estimación e inferencia en econometría . Prensa de la Universidad de Oxford. ISBN 978-0-19-506011-9.
^ Hayashi, Fumio (2000). Econometría . Prensa de la Universidad de Princeton. ISBN 978-0-691-01018-2.
^ a b c Greene, William H. (2012). Análisis econométrico (Séptima ed.). Upper Saddle River: Pearson Prentice-Hall. págs. 332–344. ISBN 978-0-273-75356-8.
^ a b c Zellner, Arnold (1962). "Un método eficaz para estimar ecuaciones de regresión aparentemente no relacionadas y pruebas de sesgo de agregación". Revista de la Asociación Estadounidense de Estadística . 57 (298): 348–368. doi : 10.2307 / 2281644 . JSTOR 2281644 .
^ Srivastava, Virendra K .; Giles, David EA (1987). Modelos de ecuaciones de regresión aparentemente no relacionados: estimación e inferencia . Nueva York: Marcel Dekker. ISBN 978-0-8247-7610-7.
^ a b c Amemiya, Takeshi (1985). Econometría avanzada . Cambridge, Massachusetts: Harvard University Press. pag. 197 . ISBN 978-0-674-00560-0.
^ Srivastava, VK; Dwivedi, TD (1979). "Estimación de ecuaciones de regresión aparentemente no relacionadas: una breve encuesta". Revista de Econometría . 10 (1): 15–32. doi : 10.1016 / 0304-4076 (79) 90061-7 .
^ Kmenta, Jan ; Gilbert, Roy F. (1968). "Propiedades de muestra pequeña de estimadores alternativos de regresiones aparentemente no relacionadas". Revista de la Asociación Estadounidense de Estadística . 63 (324): 1180-1200. doi : 10.2307 / 2285876 . JSTOR 2285876 .
^ Zellner, A .; Ando, T. (2010). "Un enfoque directo de Monte Carlo para el análisis bayesiano del modelo de regresión aparentemente no relacionado". Revista de Econometría . 159 : 33–45. CiteSeerX 10.1.1.553.7799 . doi : 10.1016 / j.jeconom.2010.04.005 .
^ Hay ejemplos disponibles en la viñeta del paquete.
^ Zeileis, Achim (2008). "Vista de tareas CRAN: Econometría computacional" . Cite journal requiere |journal=( ayuda )
^ Kleiber, Christian; Zeileis, Achim (2008). Econometría Aplicada con R . Nueva York: Springer. págs. 89–90. ISBN 978-0-387-77318-6.
^ Vinod, Hrishikesh D. (2008). "Identificación de modelos de ecuaciones simultáneas" . Hands-on Intermedio Econometría Usando R . World Scientific. págs. 282–88. ISBN 978-981-281-885-0.
^ "Estimación SUR, 3SLS y FIML" . Soporte SAS .
^ "sureg - regresión aparentemente no relacionada de Zellner" (PDF) . Stata Manual .
^ Baum, Christopher F. (2006). Introducción a la econometría moderna con Stata . College Station: Stata Press. págs. 236–242. ISBN 978-1-59718-013-9.
^ Cameron, A. Colin; Trivedi, Pravin K. (2010). "Sistema de regresiones lineales" . Microeconometrics Using Stata (Ed. Revisada). College Station: Stata Press. págs. 162–69. ISBN 978-1-59718-073-3.
^ https://people.emich.edu/jthornton/text-files/Econ515_Limdep_Guide.doc
^ "Estimadores de regresión del sistema - documentación linearmodels 3.5" . bashtage.github.io . Consultado el 3 de julio de 2017 .

Otras lecturas

Davidson, James (2000). Teoría econométrica . Oxford: Blackwell. págs. 308–314. ISBN 978-0-631-17837-8.
Fiebig, Denzil G. (2001). "Regresión aparentemente no relacionada". En Baltagi, Badi H. (ed.). Un compañero de la econometría teórica . Oxford: Blackwell. págs. 101-121. ISBN 978-0-631-21254-6.
Greene, William H. (2012). Análisis econométrico (Séptima ed.). Upper Saddle River: Pearson Prentice-Hall. págs. 332–344. ISBN 978-0-273-75356-8.

[DavidsonMacKinnon1993-1] Davidson, Russell; MacKinnon, James G. (1993). Estimación e inferencia en econometría . Prensa de la Universidad de Oxford. ISBN 978-0-19-506011-9.

[2] Hayashi, Fumio (2000). Econometría . Prensa de la Universidad de Princeton. ISBN 978-0-691-01018-2.

[Greene2012-3] Greene, William H. (2012). Análisis econométrico (Séptima ed.). Upper Saddle River: Pearson Prentice-Hall. págs. 332–344. ISBN 978-0-273-75356-8.

[Zellner1962-4] Zellner, Arnold (1962). "Un método eficaz para estimar ecuaciones de regresión aparentemente no relacionadas y pruebas de sesgo de agregación". Revista de la Asociación Estadounidense de Estadística . 57 (298): 348–368. doi : 10.2307 / 2281644 . JSTOR 2281644 .

[5] Srivastava, Virendra K .; Giles, David EA (1987). Modelos de ecuaciones de regresión aparentemente no relacionados: estimación e inferencia . Nueva York: Marcel Dekker. ISBN 978-0-8247-7610-7.

[Amemiya1985-6] Amemiya, Takeshi (1985). Econometría avanzada . Cambridge, Massachusetts: Harvard University Press. pag. 197 . ISBN 978-0-674-00560-0.

[7] Srivastava, VK; Dwivedi, TD (1979). "Estimación de ecuaciones de regresión aparentemente no relacionadas: una breve encuesta". Revista de Econometría . 10 (1): 15–32. doi : 10.1016 / 0304-4076 (79) 90061-7 .

[8] Kmenta, Jan ; Gilbert, Roy F. (1968). "Propiedades de muestra pequeña de estimadores alternativos de regresiones aparentemente no relacionadas". Revista de la Asociación Estadounidense de Estadística . 63 (324): 1180-1200. doi : 10.2307 / 2285876 . JSTOR 2285876 .

[9] Zellner, A .; Ando, T. (2010). "Un enfoque directo de Monte Carlo para el análisis bayesiano del modelo de regresión aparentemente no relacionado". Revista de Econometría . 159 : 33–45. CiteSeerX 10.1.1.553.7799 . doi : 10.1016 / j.jeconom.2010.04.005 .

[10] Hay ejemplos disponibles en la viñeta del paquete.

[Zeileis2008-11] Zeileis, Achim (2008). "Vista de tareas CRAN: Econometría computacional" . Cite journal requiere |journal=( ayuda )

[12] Kleiber, Christian; Zeileis, Achim (2008). Econometría Aplicada con R . Nueva York: Springer. págs. 89–90. ISBN 978-0-387-77318-6.

[13] Vinod, Hrishikesh D. (2008). "Identificación de modelos de ecuaciones simultáneas" . Hands-on Intermedio Econometría Usando R . World Scientific. págs. 282–88. ISBN 978-981-281-885-0.

[14] "Estimación SUR, 3SLS y FIML" . Soporte SAS .

[15] "sureg - regresión aparentemente no relacionada de Zellner" (PDF) . Stata Manual .

[16] Baum, Christopher F. (2006). Introducción a la econometría moderna con Stata . College Station: Stata Press. págs. 236–242. ISBN 978-1-59718-013-9.

[17] Cameron, A. Colin; Trivedi, Pravin K. (2010). "Sistema de regresiones lineales" . Microeconometrics Using Stata (Ed. Revisada). College Station: Stata Press. págs. 162–69. ISBN 978-1-59718-073-3.

[18] ttps://people.emich.edu/jthornton/text-files/Econ515_Limdep_Guide.doc

[19] "Estimadores de regresión del sistema - documentación linearmodels 3.5" . bashtage.github.io . Consultado el 3 de julio de 2017 .

[1]