En estadística , el tamaño de muestra efectivo es una noción definida para una muestra a partir de una distribución cuando las observaciones de la muestra están correlacionadas o ponderadas . En 1965, Leslie Kish lo definió como el tamaño de la muestra original dividido por el efecto del diseño para reflejar la varianza del diseño muestral actual en comparación con lo que sería si la muestra fuera una muestra aleatoria simple [1] [2] : 162,259
Suponga una muestra de varias observaciones independientes distribuidas de forma idéntica se extrae de una distribución con media y desviación estándar . Entonces, la media de esta distribución se estima mediante la media de la muestra:
En ese caso, la varianza de es dado por
Sin embargo, si las observaciones de la muestra están correlacionadas (en el sentido de correlación intraclase ), entonceses algo mayor. Por ejemplo, si todas las observaciones de la muestra están completamente correlacionadas (), luego a pesar de .
El tamaño de muestra efectivo es el valor único (no necesariamente un número entero) tal que
es una función de la correlación entre las observaciones de la muestra.
Suponga que todas las correlaciones (no triviales) son iguales y mayores que , es decir, si , luego . Luego
Por lo tanto
En el caso donde , luego . Del mismo modo, si luego . Y si luego .
El caso en el que las correlaciones no son uniformes es algo más complicado. Tenga en cuenta que si la correlación es negativa, el tamaño de muestra efectivo puede ser mayor que el tamaño de muestra real. Si permitimos la forma más general (dónde ) entonces es posible construir matrices de correlación que tengan un incluso cuando todas las correlaciones son positivas. Intuitivamente, el valor máximo de sobre todas las opciones de los coeficientes puede considerarse como el contenido de información de los datos observados.
Si los datos han sido ponderados (los pesos no tienen que estar normalizados, es decir, tienen su suma igual a 1 o n, o alguna otra constante), entonces varias observaciones que componen una muestra se han extraído de la distribución con una correlación efectiva del 100%. con alguna muestra previa. En este caso, el efecto se conoce como Tamaño de muestra efectivo de Kish [3] [2] : 162,259