Replicación repetida equilibrada

La replicación repetida equilibrada es una técnica estadística para estimar la variabilidad muestral de una estadística obtenida por muestreo estratificado .

Esquema de la técnica

Seleccione medias muestras balanceadas de la muestra completa.
Calcule la estadística de interés para cada media muestra.
Estime la varianza del estadístico sobre la base de las diferencias entre los valores de muestra completa y media muestra.

Selección de medias muestras

Versión simplificada

Considere primero una situación idealizada, donde cada estrato de nuestra muestra contiene solo dos unidades. Entonces, cada media muestra contendrá exactamente una de estas, de modo que las medias muestras compartan la estratificación de la muestra completa. Si hay s estratos, lo ideal sería tomar los 2 ^s formas de elegir el medio de cada estrato; pero si s es grande, esto puede ser inviable.

Si se deben tomar menos medias muestras, se seleccionan para que estén "equilibradas" (de ahí el nombre de la técnica). Sea H una matriz de Hadamard de tamaño s , y elija una fila por media muestra. (No importa qué filas; lo importante es que todas las filas de H son ortogonales). Ahora, para cada media muestra, elija qué unidad tomar de cada estrato de acuerdo con el signo de la entrada correspondiente en H : es decir, para la mitad de la muestra h , elegimos la primera unidad del estrato k si H _hk = −1 y la segunda unidad si H _hk = +1. La ortogonalidad de las filas de H asegura que nuestras elecciones no estén correlacionadas entre medias muestras.

Versión realista

Desafortunadamente, es posible que no exista una matriz de Hadamard de tamaño s . En este caso, elegimos uno de tamaño ligeramente mayor que s . Ahora, la submatriz de H que define nuestras opciones ya no necesita tener filas exactamente ortogonales, pero si el tamaño de H es solo un poco más grande que s, las filas serán aproximadamente ortogonales.

No es necesario que el número de unidades por estrato sea exactamente 2 y, por lo general, no lo será. En este caso, las unidades de cada estrato se dividen en dos "UPM de varianza" (UPM = unidad de muestreo primaria) de igual o casi igual tamaño. Esto puede hacerse al azar o de tal manera que las unidades de suministro de energía sean lo más similares posible. (Así, por ejemplo, si la estratificación se realizó sobre la base de algún parámetro numérico, las unidades de cada estrato pueden clasificarse en el orden de este parámetro y elegir otras alternativas para las dos UPM).

Si el número de estratos es muy grande, se pueden combinar varios estratos antes de aplicar BRR. Los grupos resultantes se conocen como "estratos de varianza".

Fórmula BRR

Sea a el valor de nuestra estadística calculada a partir de la muestra completa; Sea a _i ( i = 1, ..., n ) las estadísticas correspondientes calculadas para las medias muestras. ( n es el número de medias muestras).

Entonces, nuestra estimación de la varianza muestral del estadístico es el promedio de ( a _i - a ) ² . Esta es (al menos en el caso ideal) una estimación insesgada de la varianza muestral.

El método de Fay

El método de Fay es una generalización de BRR. En lugar de simplemente tomar muestras de la mitad del tamaño, usamos la muestra completa cada vez pero con una ponderación desigual: k para unidades fuera de la media muestra y 2 - k para unidades dentro de ella. (BRR es el caso k = 0.) La estimación de la varianza es entonces V / (1 - k ) ² , donde V es la estimación dada por la fórmula BRR anterior.

Ver también

Remuestreo (estadísticas)

Referencias y enlaces externos

Replicación repetida equilibrada , de los Institutos Estadounidenses de Investigación
Mccarthy, PJ (1969). Pseudo-replicación: mitades de muestras. Revisión del Instituto Internacional de Estadística , 37 (3), 239-264
Krewski, D. y JNK Rao (1981). Inferencia a partir de muestras estratificadas: propiedades de los métodos de linealización, navaja y repetición equilibrada. The Annals of Statistics , 9 (5), 1010-1019.
Judkins, DR (1990). Método de Fay para la estimación de la varianza. Diario de estadísticas oficiales , 6 (3), 223-239.
Rao, JNK y CFJ Wu (1985). Inferencia a partir de muestras estratificadas: análisis de segundo orden de tres métodos para estadísticas no lineales. Revista de la Asociación Estadounidense de Estadística , 80 (391), 620-630.