Errores estándar consistentes con heterocedasticidad

El tema de los errores estándar consistentes con heterocedasticidad ( HC ) surge en estadística y econometría en el contexto de la regresión lineal y el análisis de series de tiempo . Estos también se conocen como errores estándar de Eicker-Huber-White (también errores estándar de Huber-White o errores estándar de White ), ^[1] para reconocer las contribuciones de Friedhelm Eicker , ^[2] Peter J. Huber , ^[3] y Halbert White . ^[4]

En modelos de regresión y series de tiempo, las formas básicas de modelos hacen uso del supuesto de que los errores o perturbaciones u _i tienen la misma varianza en todos los puntos de observación. Cuando este no es el caso, se dice que los errores son heteroscedásticos, o que tienen heteroscedasticidad , y este comportamiento se reflejará en los residuos. ${\ Displaystyle {\ widehat {u}} _ {i}}$ estimado a partir de un modelo ajustado. Los errores estándar consistentes con heterocedasticidad se utilizan para permitir el ajuste de un modelo que contiene residuos heterocedásticos. El primer enfoque de este tipo fue propuesto por Huber (1967), y desde entonces se han producido procedimientos mejorados para datos transversales, datos de series de tiempo y estimación GARCH .

Los errores estándar consistentes con heterocedasticidad que difieren de los errores estándar clásicos son un indicador de especificación incorrecta del modelo. Este error de especificación no se corrige simplemente reemplazando el clásico con errores estándar consistentes con heterocedasticidad; para todas las cantidades de interés, salvo unas pocas, la especificación incorrecta puede dar lugar a sesgos. En la mayoría de las situaciones, el problema debe encontrarse y solucionarse. ^[5] Otros tipos de ajustes de error estándar, como los errores estándar agrupados , pueden considerarse extensiones de los errores estándar de HC.

Historia

Friedhelm Eicker , ^[6]^[7] introduce errores estándar consistentes con heterocedasticidad y Halbert White los populariza en econometría .

Problema

Suponga que estamos estudiando el modelo de regresión lineal

{\ Displaystyle Y = X \ beta + U, \,}

donde X es el vector de variables explicativas y β es un vector de k × 1 columna de parámetros a estimar.

El estimador de mínimos cuadrados ordinarios (MCO) es

{\ Displaystyle {\ widehat {\ beta}} _ {\ text {OLS}} = (\ mathbb {X} '\ mathbb {X}) ^ {- 1} \ mathbb {X}' \ mathbb {Y}. \,}

dónde ${\ Displaystyle \ mathbb {X}}$ denota la matriz de apilados ${\ Displaystyle X_ {i} '}$ valores observados en los datos.

Si los errores muestrales tienen la misma varianza σ ² y no están correlacionados , entonces la estimación de mínimos cuadrados de β es AZUL (el mejor estimador lineal insesgado) y su varianza se estima con

{\ Displaystyle v _ {\ text {OLS}} \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right] = s ^ {2} (\ mathbb {X} '\ mathbb {X }) ^ {- 1}, \ quad s ^ {2} = {\ frac {\ sum _ {i} {\ widehat {u}} _ {i} ^ {2}} {nk}}}

dónde ${\ Displaystyle {\ widehat {u}} _ {i} = Y_ {i} -X_ {i} {\ widehat {\ beta}} _ {\ text {OLS}}}$ son los residuos de regresión.

Cuando los términos de error no tienen varianza constante (es decir, el supuesto de ${\ Displaystyle \ operatorname {E} [uu '] = \ sigma ^ {2} I_ {n}}$ es falso), el estimador MCO pierde sus propiedades deseables. La fórmula para la varianza ahora no se puede simplificar:

{\ Displaystyle V \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right] = V [(\ mathbb {X} '\ mathbb {X}) ^ {- 1} \ mathbb { X} '\ mathbb {Y}] = (\ mathbb {X}' \ mathbb {X}) ^ {- 1} \ mathbb {X} '\ Sigma \ mathbb {X} (\ mathbb {X}' \ mathbb {X}) ^ {- 1}}

dónde ${\ Displaystyle \ Sigma = V [u].}$

Si bien el estimador de puntos de MCO permanece insesgado, no es "el mejor" en el sentido de tener un error cuadrático medio mínimo, y el estimador de varianza de MCO ${\ Displaystyle v _ {\ text {OLS}} \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right]}$ no proporciona una estimación coherente de la varianza de las estimaciones de MCO.

Sin embargo, para cualquier modelo no lineal (por ejemplo, modelos logit y probit ), la heterocedasticidad tiene consecuencias más graves: las estimaciones de máxima verosimilitud de los parámetros estarán sesgadas (en una dirección desconocida), así como inconsistentes (a menos que la función de verosimilitud sea modificado para tener en cuenta correctamente la forma precisa de heterocedasticidad). ^[8]^[9] Como señaló Greene , "simplemente calcular una matriz de covarianza robusta para un estimador que de otro modo sería inconsistente no le da redención". ^[10]

Solución

Si los errores de regresión ${\ Displaystyle u_ {i}}$ son independientes, pero tienen distintas varianzas σ _i² , entonces ${\ Displaystyle \ Sigma = \ operatorname {diag} (\ sigma _ {1} ^ {2}, \ ldots, \ sigma _ {n} ^ {2})}$ que se puede estimar con ${\ displaystyle {\ widehat {\ sigma}} _ {i} ^ {2} = {\ widehat {u}} _ {i} ^ {2}}$ . Esto proporciona el estimador de White (1980), a menudo denominado HCE (estimador consistente de heterocedasticidad):

{\ Displaystyle {\ begin {alineado} v _ {\ text {HCE}} \ left [{\ widehat {\ beta}} _ {\ text {OLS}} \ right] & = {\ frac {1} {n} } \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '\ right) ^ {- 1} \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '{\ widehat {u}} _ {i} ^ {2} \ right) \ left ({\ frac {1} {n}} \ sum _ { i} X_ {i} X_ {i} '\ right) ^ {- 1} \\ & = (\ mathbb {X}' \ mathbb {X}) ^ {- 1} (\ mathbb {X} '\ operatorname {diag} ({\ widehat {u}} _ {1} ^ {2}, \ ldots, {\ widehat {u}} _ {n} ^ {2}) \ mathbb {X}) (\ mathbb {X } '\ mathbb {X}) ^ {- 1}, \ end {alineado}}}

donde como arriba ${\ Displaystyle \ mathbb {X}}$ denota la matriz de apilados ${\ Displaystyle X_ {i} '}$ valores de los datos. El estimador se puede derivar en términos del método generalizado de momentos (GMM).

Tenga en cuenta que también se discute a menudo en la literatura (incluso en el propio artículo de White) la matriz de covarianza ${\ Displaystyle {\ widehat {\ Omega}} _ {n}}$ de El ${\ Displaystyle {\ sqrt {n}}}$ -distribución limitante consistente:

{\ displaystyle {\ sqrt {n}} ({\ widehat {\ beta}} _ {n} - \ beta) \, {\ xrightarrow {d}} \, N (0, \ Omega),}

dónde

{\ Displaystyle \ Omega = \ operatorname {E} [XX '] ^ {- 1} \ operatorname {Var} [Xu] \ operatorname {E} [XX'] ^ {- 1},}

y

{\ Displaystyle {\ begin {alineado} {\ widehat {\ Omega}} _ {n} & = \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '\ right) ^ {- 1} \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i}' {\ widehat {u}} _ {i} ^ { 2} \ right) \ left ({\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '\ right) ^ {- 1} \\ & = n (\ mathbb { X} '\ mathbb {X}) ^ {- 1} (\ mathbb {X}' \ operatorname {diag} ({\ widehat {u}} _ {1} ^ {2}, \ ldots, {\ widehat { u}} _ {n} ^ {2}) \ mathbb {X}) (\ mathbb {X} '\ mathbb {X}) ^ {- 1} \ end {alineado}}}

Por lo tanto,

{\ Displaystyle {\ widehat {\ Omega}} _ {n} = n \ cdot v _ {\ text {HCE}} [{\ widehat {\ beta}} _ {\ text {OLS}}]}

y

{\ displaystyle {\ widehat {\ operatorname {Var}}} [Xu] = {\ frac {1} {n}} \ sum _ {i} X_ {i} X_ {i} '{\ widehat {u}} _ {i} ^ {2} = {\ frac {1} {n}} \ mathbb {X} '\ operatorname {diag} ({\ widehat {u}} _ {1} ^ {2}, \ ldots, {\ widehat {u}} _ {n} ^ {2}) \ mathbb {X}.}

Precisamente qué matriz de covarianza es de interés es una cuestión de contexto.

Se han propuesto estimadores alternativos en MacKinnon y White (1985) que corrigen las varianzas desiguales de los residuos de regresión debido a un apalancamiento diferente . ^[11] A diferencia del estimador asintótico de White, sus estimadores son insesgados cuando los datos son homocedásticos.

Ver también

Método delta
Mínimos cuadrados generalizados
Ecuaciones de estimación generalizadas
Mínimos cuadrados ponderados , una formulación alternativa
Prueba de White : una prueba para determinar si hay heterocedasticidad.
Estimador de Newey-West
Estimación de verosimilitud cuasimáxima

Software

EViews : EViews versión 8 ofrece tres métodos diferentes para mínimos cuadrados robustos: estimación M (Huber, 1973), estimación S (Rousseeuw y Yohai, 1984) y estimación MM (Yohai 1987). ^[12]
MATLAB : Consulte la hacfunción en la caja de herramientas Econometrics. ^[13]
Python : el paquete Statsmodel ofrece varias estimaciones robustas de errores estándar; consulte statsmodels.regression.linear_model.RegressionResults para obtener más descripciones
R : el vcovHC()comando del paquete de sándwich . ^[14]^[15]
La opción RATS : robusterrors está disponible en muchos de los comandos de regresión y optimización ( linreg , nlls , etc.).
Stata : robustopción aplicable en muchos procedimientos basados en pseudo-verosimilitud. ^[dieciséis]
Gretl : la opción --robustde varios comandos de estimación (como ols) en el contexto de un conjunto de datos de sección transversal produce errores estándar robustos. ^[17]

Referencias

↑ Kleiber, C .; Zeileis, A. (2006). "Econometría aplicada con R" (PDF) . Conferencia UseR-2006 . Archivado desde el original (PDF) el 22 de abril de 2007.
^ Eicker, Friedhelm (1967). "Teoremas del límite para la regresión con errores desiguales y dependientes" . Actas del Quinto Simposio de Berkeley sobre Probabilidad y Estadística Matemática . págs. 59–82. Señor 0214223 . Zbl 0217.51201 .
^ Huber, Peter J. (1967). "El comportamiento de las estimaciones de máxima verosimilitud en condiciones no estándar" . Actas del Quinto Simposio de Berkeley sobre Probabilidad y Estadística Matemática . págs. 221-233. Señor 0216620 . Zbl 0212.21504 .
^ White, Halbert (1980). "Un estimador de matriz de covarianza consistente de heterocedasticidad y una prueba directa de heterocedasticidad". Econometrica . 48 (4): 817–838. CiteSeerX 10.1.1.11.7646 . doi : 10.2307 / 1912934 . JSTOR 1912934 . Señor 0575027 .
^ King, Gary; Roberts, Margaret E. (2015). "Cómo los errores estándar sólidos exponen problemas metodológicos que no solucionan y qué hacer al respecto" . Análisis político . 23 (2): 159-179. doi : 10.1093 / pan / mpu015 . ISSN 1047-1987 .
^ "Normalidad asintótica y consistencia de los estimadores de mínimos cuadrados para familias de regresiones lineales" . Cite journal requiere |journal=( ayuda )
^ "Teoremas de límite para regresiones con errores desiguales y dependientes" . Cite journal requiere |journal=( ayuda )
^ Giles, Dave (8 de mayo de 2013). "Errores estándar robustos para modelos no lineales" . Beat Econometrics .
^ Guggisberg, Michael (2019). "Modelos de elección discreta mal especificados y errores estándar de Huber-White". Revista de métodos econométricos . 8 (1). doi : 10.1515 / jem-2016-0002 .
^ Greene, William H. (2012). Análisis econométrico (Séptima ed.). Boston: Educación de Pearson. págs. 692–693. ISBN 978-0-273-75356-8.
^ MacKinnon, James G .; White, Halbert (1985). "Algunos estimadores de matriz de covarianza heterocedástica consistente con propiedades mejoradas de la muestra finita". Revista de Econometría . 29 (3): 305–325. doi : 10.1016 / 0304-4076 (85) 90158-7 . hdl : 10419/189084 .
^ http://www.eviews.com/EViews8/ev8ecrobust_n.html
^ "Estimadores de covarianza consistentes de heterocedasticidad y autocorrelación" . Caja de herramientas de econometría .
^ sándwich: estimadores de matriz de covarianza robustos
^ Kleiber, Christian; Zeileis, Achim (2008). Econometría Aplicada con R . Nueva York: Springer. págs. 106-110. ISBN 978-0-387-77316-2.
^ Consulte la ayuda en línea para conocer las_robustopciones y losregresscomandos.
^ "Estimación de matriz de covarianza robusta" (PDF) . Guía del usuario de Gretl, capítulo 19 .

Otras lecturas

Freedman, David A. (2006). "En el llamado 'Estimador de sándwich de Huber' y 'Errores estándar robustos ' ". El estadístico estadounidense . 60 (4): 299-302. doi : 10.1198 / 000313006X152207 .
Hardin, James W. (2003). "La estimación de sándwich de varianza". En Fomby, Thomas B .; Hill, R. Carter (eds.). Estimación de máxima verosimilitud de modelos mal especificados: veinte años después . Amsterdam: Elsevier. págs. 45–74. ISBN 0-7623-1075-8.
Hayes, Andrew F .; Cai, Li (2007). "Uso de estimadores de error estándar coherentes con heterocedasticidad en regresión OLS: una introducción e implementación de software" . Métodos de investigación del comportamiento . 39 (4): 709–722. doi : 10.3758 / BF03192961 . PMID 18183883 .
King, Gary ; Roberts, Margaret E. (2015). "Cómo los errores estándar sólidos exponen problemas metodológicos que no solucionan y qué hacer al respecto" . Análisis político . 23 (2): 159-179. doi : 10.1093 / pan / mpu015 .
Wooldridge, Jeffrey M. (2009). "Inferencia robusta de heterocedasticidad después de la estimación de MCO". Econometría introductoria: un enfoque moderno (cuarta ed.). Mason: Suroeste. págs. 265-271. ISBN 978-0-324-66054-8.
Buja, Andreas y col. "Modelos como aproximaciones: una conspiración de regresores aleatorios y desviaciones del modelo contra la inferencia clásica en la regresión". Ciencia estadística (2015): 1. pdf

[1] Kleiber, C .; Zeileis, A. (2006). "Econometría aplicada con R" (PDF) . Conferencia UseR-2006 . Archivado desde el original (PDF) el 22 de abril de 2007.

[2] Eicker, Friedhelm (1967). "Teoremas del límite para la regresión con errores desiguales y dependientes" . Actas del Quinto Simposio de Berkeley sobre Probabilidad y Estadística Matemática . págs. 59–82. Señor 0214223 . Zbl 0217.51201 .

[3] Huber, Peter J. (1967). "El comportamiento de las estimaciones de máxima verosimilitud en condiciones no estándar" . Actas del Quinto Simposio de Berkeley sobre Probabilidad y Estadística Matemática . págs. 221-233. Señor 0216620 . Zbl 0212.21504 .

[4] White, Halbert (1980). "Un estimador de matriz de covarianza consistente de heterocedasticidad y una prueba directa de heterocedasticidad". Econometrica . 48 (4): 817–838. CiteSeerX 10.1.1.11.7646 . doi : 10.2307 / 1912934 . JSTOR 1912934 . Señor 0575027 .

[5] King, Gary; Roberts, Margaret E. (2015). "Cómo los errores estándar sólidos exponen problemas metodológicos que no solucionan y qué hacer al respecto" . Análisis político . 23 (2): 159-179. doi : 10.1093 / pan / mpu015 . ISSN 1047-1987 .

[6] "Normalidad asintótica y consistencia de los estimadores de mínimos cuadrados para familias de regresiones lineales" . Cite journal requiere |journal=( ayuda )

[7] "Teoremas de límite para regresiones con errores desiguales y dependientes" . Cite journal requiere |journal=( ayuda )

[8] Giles, Dave (8 de mayo de 2013). "Errores estándar robustos para modelos no lineales" . Beat Econometrics .

[9] Guggisberg, Michael (2019). "Modelos de elección discreta mal especificados y errores estándar de Huber-White". Revista de métodos econométricos . 8 (1). doi : 10.1515 / jem-2016-0002 .

[10] Greene, William H. (2012). Análisis econométrico (Séptima ed.). Boston: Educación de Pearson. págs. 692–693. ISBN 978-0-273-75356-8.

[11] MacKinnon, James G .; White, Halbert (1985). "Algunos estimadores de matriz de covarianza heterocedástica consistente con propiedades mejoradas de la muestra finita". Revista de Econometría . 29 (3): 305–325. doi : 10.1016 / 0304-4076 (85) 90158-7 . hdl : 10419/189084 .

[12] ttp://www.eviews.com/EViews8/ev8ecrobust_n.html

[13] "Estimadores de covarianza consistentes de heterocedasticidad y autocorrelación" . Caja de herramientas de econometría .

[14] sándwich: estimadores de matriz de covarianza robustos

[15] Kleiber, Christian; Zeileis, Achim (2008). Econometría Aplicada con R . Nueva York: Springer. págs. 106-110. ISBN 978-0-387-77316-2.

[16] Consulte la ayuda en línea para conocer las_robustopciones y losregresscomandos.

[17] "Estimación de matriz de covarianza robusta" (PDF) . Guía del usuario de Gretl, capítulo 19 .

[1]