Estimador de Horvitz-Thompson

En estadística , el estimador de Horvitz-Thompson , llamado así por Daniel G. Horvitz y Donovan J. Thompson, ^[1] es un método para estimar el total ^[2] y la media de una pseudopoblación en una muestra estratificada . La ponderación de probabilidad inversa se aplica para tener en cuenta las diferentes proporciones de observaciones dentro de los estratos de una población objetivo. El estimador de Horvitz-Thompson se aplica con frecuencia en los análisis de encuestas y se puede utilizar para contabilizar los datos faltantes .

El método

Formalmente, deja ${\ Displaystyle Y_ {i}, i = 1,2, \ ldots, n}$ ser una muestra independiente de n de N ≥ n estratos distintos con una media común μ . Supongamos además que ${\ Displaystyle \ pi _ {i}}$ es la probabilidad de inclusión de que un individuo muestreado al azar en una superpoblación pertenezca al estrato i . La estimación de Horvitz-Thompson del total viene dada por:

{\ Displaystyle {\ hat {Y}} _ {HT} = \ sum _ {i = 1} ^ {n} \ pi _ {i} ^ {- 1} Y_ {i},}

y la estimación de la media viene dada por:

{\ Displaystyle {\ hat {\ mu}} _ {HT} = N ^ {- 1} {\ hat {Y}} _ {HT} = N ^ {- 1} \ sum _ {i = 1} ^ { n} \ pi _ {i} ^ {- 1} Y_ {i}.}

En un marco probabilístico bayesiano ${\ Displaystyle \ pi _ {i}}$ Se considera la proporción de individuos de una población objetivo pertenecientes al i- ésimo estrato. Por eso, ${\ Displaystyle \ pi _ {i} ^ {- 1} Y_ {i}}$ podría considerarse como una estimación de la muestra completa de personas dentro del i- ésimo estrato. El estimador de Horvitz-Thompson también se puede expresar como el límite de una estimación de remuestreo bootstrap ponderada de la media. También puede verse como un caso especial de enfoques de imputación múltiple . ^[3]

Para colocar estratificado diseños de los estudios, la estimación de ${\ Displaystyle \ pi}$ y ${\ Displaystyle \ mu}$ se realizan en distintos pasos. En tales casos, calcular la varianza de ${\ Displaystyle {\ hat {\ mu}} _ {HT}}$ no es sencillo. Se pueden aplicar técnicas de remuestreo como el bootstrap o el jackknife para obtener estimaciones consistentes de la varianza del estimador de Horvitz-Thompson. ^[4] El paquete de "encuesta" para R realiza análisis de datos posestratificados utilizando el estimador de Horvitz-Thompson. ^[5]

Prueba de la estimación no sesgada de la media de Horvitz-Thompson

Se puede demostrar que el estimador de Horvitz-Thompson no es sesgado al evaluar la expectativa del estimador de Horvitz-Thompson, ${\ Displaystyle \ mathbf {E} {\ bar {X}} _ {n} ^ {HT}}$ , como sigue:

{\ Displaystyle \ mathbf {E} {\ bar {X}} _ {n} ^ {HT} = \ mathbf {E} {\ frac {1} {N}} \ sum _ {i = 1} ^ {n } {\ frac {\ mathbf {X} _ {I_ {i}}} {\ pi _ {I_ {i}}}}}

{\ Displaystyle = \ mathbf {E} {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {X_ {i}} {\ pi _ {i}}} 1_ {i \ in D_ {n}}}

{\ Displaystyle = \ sum _ {b = 1} ^ {B} P (D_ {n} ^ {(b)}) \ left [{\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {X_ {i}} {\ pi _ {i}}} 1_ {i \ in D_ {n} ^ {(b)}} \ right]}

{\ Displaystyle = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {X_ {i}} {\ pi _ {i}}} \ sum _ {b = 1} ^ {B} 1_ {i \ en D_ {n} ^ {(b)}} P (D_ {n} ^ {(b)})}

{\ Displaystyle = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} \ left ({\ frac {X_ {i}} {\ pi _ {i}}} \ right) \ pi _ {i}}

{\ Displaystyle = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} X_ {i}}

{\ Displaystyle {\ text {donde}} ~ D_ {n} = \ {x_ {1}, x_ {2}, ..., x_ {n} \}}

Referencias

^ Horvitz, DG; Thompson, DJ (1952) "Una generalización del muestreo sin reemplazo de un universo finito", Revista de la Asociación Estadounidense de Estadística , 47, 663–685,. JSTOR 2280784
^ William G. Cochran (1977), Técnicas de muestreo , tercera edición, Wiley. ISBN 0-471-16240-X
^ Roderick JA Little, Donald B. Rubin (2002) Análisis estadístico con datos faltantes , 2ª ed., Wiley. ISBN 0-471-18386-5
^ Septiembre, A. (2014). "El Bootstrap de población finita - desde la máxima probabilidad hasta el enfoque de Horvitz-Thompson". Revista austriaca de estadística . 43 : 93-102.
^ https://cran.r-project.org/web/packages/survey/

enlaces externos

Sitio web del paquete de encuestas para R

[1] Horvitz, DG; Thompson, DJ (1952) "Una generalización del muestreo sin reemplazo de un universo finito", Revista de la Asociación Estadounidense de Estadística , 47, 663–685,. JSTOR 2280784

[2] William G. Cochran (1977), Técnicas de muestreo , tercera edición, Wiley. ISBN 0-471-16240-X

[3] Roderick JA Little, Donald B. Rubin (2002) Análisis estadístico con datos faltantes , 2ª ed., Wiley. ISBN 0-471-18386-5

[4] Septiembre, A. (2014). "El Bootstrap de población finita - desde la máxima probabilidad hasta el enfoque de Horvitz-Thompson". Revista austriaca de estadística . 43 : 93-102.

[5] ttps://cran.r-project.org/web/packages/survey/

[1]