Remuestreo con navaja

En estadística , la navaja es una técnica de remuestreo especialmente útil para la estimación de la varianza y el sesgo . El jackknife es anterior a otros métodos de remuestreo comunes, como el bootstrap . El estimador jackknife de un parámetro se encuentra omitiendo sistemáticamente cada observación de un conjunto de datos y calculando la estimación y luego encontrando el promedio de estos cálculos. Dada una muestra de tamaño ${\ Displaystyle n}$ , la estimación de la navaja se obtiene agregando las estimaciones de cada ${\ Displaystyle (n-1)}$ submuestra de tamaño.

La técnica de la navaja fue desarrollada por Maurice Quenouille (1924-1973) a partir de 1949 y refinada en 1956. John Tukey amplió la técnica en 1958 y propuso el nombre "navaja" porque, como una navaja física (una navaja plegable compacta), se trata de una áspera y listo herramienta que puede improvisar una solución para una variedad de problemas a pesar de los problemas específicos pueden ser resueltos de manera más eficiente con una herramienta de diseño especial. ^[1]

La navaja es una aproximación lineal del bootstrap . ^[1]

Estimacion

La estimación cortante de un parámetro se puede encontrar estimando el parámetro para cada submuestra omitiendo la observación i -ésima. ^[2] Por ejemplo, si el parámetro a estimar es la media poblacional de x , calculamos la media ${\ Displaystyle {\ bar {x}} _ {i}}$ para cada submuestra que consta de todos menos el i -ésimo punto de datos:

{\ Displaystyle {\ bar {x}} _ {i} = {\ frac {1} {n-1}} \ sum _ {j = 1, j \ neq i} ^ {n} x_ {j}, \ quad \ quad i = 1, \ dots, n.}

Estas n estimaciones forman una estimación de la distribución del estadístico muestral si se calculara sobre un gran número de muestras. En particular, la media de esta distribución muestral es el promedio de estas n estimaciones:

{\ Displaystyle {\ bar {x}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} {\ bar {x}} _ {i}.}

Se puede demostrar explícitamente que este ${\ displaystyle {\ bar {x}}}$ es igual a la estimación habitual ${\ Displaystyle {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} x_ {i}}$ , por lo que el punto real emerge para momentos superiores a la media. Se puede calcular una estimación cortante de la varianza del estimador a partir de la varianza de esta distribución de ${\ Displaystyle {\ bar {x}} _ {i}}$ : ^[3]^[4]

{\ Displaystyle \ operatorname {Var} ({\ bar {x}}) = {\ frac {n-1} {n}} \ sum _ {i = 1} ^ {n} ({\ bar {x}} _ {i} - {\ bar {x}}) ^ {2} = {\ frac {1} {n (n-1)}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2}.}

Estimación y corrección de sesgos

La técnica de la navaja se puede utilizar para estimar el sesgo de un estimador calculado sobre toda la muestra. Decir ${\ Displaystyle {\ hat {\ theta}}}$ es el estimador calculado del parámetro de interés basado en todos ${\ Displaystyle {n}}$ observaciones. Dejar

{\ Displaystyle {\ hat {\ theta}} _ {\ mathrm {(.)}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} {\ hat {\ theta }}_{(I)}}

dónde ${\ Displaystyle {\ hat {\ theta}} _ {(i)}}$ es la estimación de interés basada en la muestra con la i -ésima observación eliminada, y ${\ Displaystyle {\ hat {\ theta}} _ {\ mathrm {(.)}}}$ es el promedio de estas estimaciones de "dejar uno fuera". La estimación de la navaja del sesgo de ${\ Displaystyle {\ hat {\ theta}}}$ es dado por:

{\ Displaystyle {\ widehat {\ text {sesgo}}} _ {\ mathrm {(\ theta)}} = (n-1) ({\ hat {\ theta}} _ {\ mathrm {(.)}} - {\ hat {\ theta}})}

y la estimación de jackknife corregida por sesgo resultante de ${\ Displaystyle \ theta}$ es dado por:

{\ displaystyle {\ hat {\ theta}} _ {\ text {jack}} = {\ hat {\ theta}} - {\ widehat {\ text {sesgo}}} _ {\ mathrm {(\ theta)} } = n {\ hat {\ theta}} - (n-1) {\ hat {\ theta}} _ {\ mathrm {(.)}}}

Esto elimina el sesgo en el caso especial de que el sesgo sea ${\ Displaystyle O (n ^ {- 1})}$ y lo quita a ${\ Displaystyle O (n ^ {- 2})}$ en otros casos. ^[1]

Ver también

Error de dejar uno fuera

Notas

↑ ^a ^b ^c Cameron y Trivedi , 2005 , p. 375.
^ Efron 1982 , p. 2.
^ Efron 1982 , p. 14.
^ McIntosh, Avery I. "El método de estimación Jackknife" (PDF) . Universidad de Boston . Avery I. McIntosh . Consultado el 30 de abril de 2016 .: pag. 3.

Referencias

Cameron, Adrian; Trivedi, Pravin K. (2005). Microeconometría: métodos y aplicaciones . Cambridge Nueva York: Cambridge University Press. ISBN 9780521848053.
Efron, Bradley ; Stein, Charles (mayo de 1981). "La estimación de la varianza Jackknife" . The Annals of Statistics . 9 (3): 586–596. doi : 10.1214 / aos / 1176345462 . JSTOR 2240822 .
Efron, Bradley (1982). La navaja, el bootstrap y otros planes de remuestreo . Filadelfia, PA: Sociedad de Matemáticas Industriales y Aplicadas. ISBN 9781611970319.
Quenouille, Maurice H. (septiembre de 1949). "Problemas en el muestreo de aviones" . Los Anales de Estadística Matemática . 20 (3): 355–375. doi : 10.1214 / aoms / 1177729989 . JSTOR 2236533 .
Quenouille, Maurice H. (1956). "Notas sobre el sesgo en la estimación". Biometrika . 43 (3–4): 353–360. doi : 10.1093 / biomet / 43.3-4.353 . JSTOR 2332914 .
Tukey, John W. (1958). "Sesgo y confianza en muestras no muy grandes (resumen)" . Los Anales de Estadística Matemática . 29 (2): 614. doi : 10.1214 / aoms / 1177706647 .

[FOOTNOTECameronTrivedi2005375-1] Cameron y Trivedi , 2005 , p. 375.

[FOOTNOTEEfron19822-2] Efron 1982 , p. 2.

[FOOTNOTEEfron198214-3] Efron 1982 , p. 14.

[4] McIntosh, Avery I. "El método de estimación Jackknife" (PDF) . Universidad de Boston . Avery I. McIntosh . Consultado el 30 de abril de 2016 .: pag. 3.

[1]