Muestreo estratificado


En estadística , el muestreo estratificado es un método de muestreo de una población que se puede dividir en subpoblaciones .

En las encuestas estadísticas , cuando varían las subpoblaciones dentro de una población general, podría ser ventajoso muestrear cada subpoblación ( estrato ) de forma independiente. La estratificación es el proceso de dividir a los miembros de la población en subgrupos homogéneos antes del muestreo. Los estratos deben definir una partición de la población. Es decir, debe ser colectivamente exhaustiva y mutuamente excluyente : cada elemento de la población debe ser asignado a uno y solo un estrato. Luego se aplica un muestreo aleatorio simple dentro de cada estrato. El objetivo es mejorar la precisión de la muestra reduciendo el error de muestreo . Puede producir una media ponderadaque tiene menos variabilidad que la media aritmética de una muestra aleatoria simple de la población.

En estadística computacional , el muestreo estratificado es un método de reducción de la varianza cuando se utilizan métodos de Monte Carlo para estimar las estadísticas de población de una población conocida. [1]

Suponga que necesitamos estimar el número promedio de votos para cada candidato en una elección. Suponga que un país tiene 3 ciudades: la ciudad A tiene 1 millón de trabajadores de fábrica, la ciudad B tiene 2 millones de oficinistas y la ciudad C tiene 3 millones de jubilados. Podemos optar por obtener una muestra aleatoria de tamaño 60 de toda la población, pero existe la posibilidad de que la muestra aleatoria resultante esté mal equilibrada entre estas ciudades y, por lo tanto, esté sesgada, lo que provocará un error significativo en la estimación (cuando el resultado de interés tiene un diferente distribución, en función del parámetro de interés, entre las localidades). En cambio, si elegimos tomar una muestra aleatoria de 10, 20 y 30 de la Ciudad A, B y C respectivamente, podemos producir un error menor en la estimación para el mismo tamaño de muestra total. Este método se utiliza generalmente cuando una población no es un grupo homogéneo.

Un ejemplo del mundo real del uso de muestreo estratificado sería para una encuesta política . Si los encuestados necesitaban reflejar la diversidad de la población, el investigador buscaría específicamente incluir participantes de varios grupos minoritarios, como raza o religión, en función de su proporcionalidad con la población total, como se mencionó anteriormente. Así, una encuesta estratificada podría pretender ser más representativa de la población que una encuesta de muestreo aleatorio simple o un muestreo sistemático .

Si la densidad de población varía mucho dentro de una región, el muestreo estratificado garantizará que se puedan realizar estimaciones con la misma precisión en diferentes partes de la región y que se puedan realizar comparaciones de subregiones con el mismo poder estadístico . Por ejemplo, en Ontario , una encuesta realizada en toda la provincia podría utilizar una fracción de muestreo más grande en el norte menos poblado, ya que la disparidad de población entre el norte y el sur es tan grande que una fracción de muestreo basada en la muestra provincial en su conjunto podría resultar en la recopilación de solo un puñado de datos del norte.


Muestreo aleatorio estratificado
Ejemplo de muestreo estratificado