En estadística , el estimador de Horvitz-Thompson , llamado así por Daniel G. Horvitz y Donovan J. Thompson, [1] es un método para estimar el total [2] y la media de una pseudopoblación en una muestra estratificada . La ponderación de probabilidad inversa se aplica para tener en cuenta las diferentes proporciones de observaciones dentro de los estratos de una población objetivo. El estimador de Horvitz-Thompson se aplica con frecuencia en los análisis de encuestas y se puede utilizar para contabilizar los datos faltantes .
El método
Formalmente, deja ser una muestra independiente de n de N ≥ n estratos distintos con una media común μ . Supongamos además quees la probabilidad de inclusión de que un individuo muestreado al azar en una superpoblación pertenezca al estrato i . La estimación de Horvitz-Thompson del total viene dada por:
y la estimación de la media viene dada por:
En un marco probabilístico bayesianoSe considera la proporción de individuos de una población objetivo pertenecientes al i- ésimo estrato. Por eso,podría considerarse como una estimación de la muestra completa de personas dentro del i- ésimo estrato. El estimador de Horvitz-Thompson también se puede expresar como el límite de una estimación de remuestreo bootstrap ponderada de la media. También puede verse como un caso especial de enfoques de imputación múltiple . [3]
Para colocar estratificado diseños de los estudios, la estimación de y se realizan en distintos pasos. En tales casos, calcular la varianza deno es sencillo. Se pueden aplicar técnicas de remuestreo como el bootstrap o el jackknife para obtener estimaciones consistentes de la varianza del estimador de Horvitz-Thompson. [4] El paquete de "encuesta" para R realiza análisis de datos posestratificados utilizando el estimador de Horvitz-Thompson. [5]
Prueba de la estimación no sesgada de la media de Horvitz-Thompson
Se puede demostrar que el estimador de Horvitz-Thompson no es sesgado al evaluar la expectativa del estimador de Horvitz-Thompson, , como sigue:
Referencias
- ^ Horvitz, DG; Thompson, DJ (1952) "Una generalización del muestreo sin reemplazo de un universo finito", Revista de la Asociación Estadounidense de Estadística , 47, 663–685,. JSTOR 2280784
- ^ William G. Cochran (1977), Técnicas de muestreo , tercera edición, Wiley. ISBN 0-471-16240-X
- ^ Roderick JA Little, Donald B. Rubin (2002) Análisis estadístico con datos faltantes , 2ª ed., Wiley. ISBN 0-471-18386-5
- ^ Septiembre, A. (2014). "El Bootstrap de población finita - desde la máxima probabilidad hasta el enfoque de Horvitz-Thompson". Revista austriaca de estadística . 43 : 93-102.
- ^ https://cran.r-project.org/web/packages/survey/