Error de muestreo

En estadística , se incurre en errores de muestreo cuando las características estadísticas de una población se estiman a partir de un subconjunto, o muestra , de esa población. Dado que la muestra no incluye a todos los miembros de la población, las estadísticas de la muestra (a menudo conocidas como estimadores ), como las medias y los cuartiles, generalmente difieren de las estadísticas de toda la población (conocidas como parámetros ). La diferencia entre el estadístico muestral y el parámetro poblacional se considera el error de muestreo . ^[1]Por ejemplo, si uno mide la altura de mil individuos de una población de un millón, la altura promedio de los mil no suele ser la misma que la altura promedio del millón de personas en el país.

Dado que el muestreo casi siempre se realiza para estimar parámetros de la población que se desconocen, por definición, no será posible medir con exactitud los errores de muestreo; sin embargo, a menudo se pueden estimar, ya sea por métodos generales como bootstrapping , o por métodos específicos que incorporan algunos supuestos (o conjeturas) con respecto a la verdadera distribución de la población y sus parámetros.

El error de muestreo es el error que se produce al observar una muestra en lugar de toda la población. ^[1] El error de muestreo es la diferencia entre una estadística de muestra utilizada para estimar un parámetro de población y el valor real pero desconocido del parámetro. ^[2]

En estadística , una muestra verdaderamente aleatoria significa seleccionar individuos de una población con una probabilidad equivalente ; en otras palabras, elegir individuos de un grupo sin prejuicios. Si no se hace esto correctamente, se producirá un sesgo de muestreo , que puede aumentar drásticamente el error de muestreo en una muestra sistemática .manera. Por ejemplo, intentar medir la altura promedio de toda la población humana de la Tierra, pero medir una muestra solo de un país, podría resultar en una gran sobreestimación o subestimación. En realidad, obtener una muestra no sesgada puede ser difícil ya que muchos parámetros (en este ejemplo, país, edad, género, etc.) pueden sesgar fuertemente al estimador y se debe asegurar que ninguno de estos factores juegue un papel en el proceso de selección. .

Incluso en una muestra perfectamente insesgada, el error de muestra seguirá existiendo debido al componente estadístico restante; considere que medir solo dos o tres individuos y tomar el promedio produciría un resultado muy variable cada vez. El tamaño probable del error de muestreo generalmente se puede reducir tomando una muestra más grande. ^[3]

El costo de aumentar el tamaño de una muestra puede ser prohibitivo en la realidad. Dado que el error de la muestra a menudo se puede estimar de antemano como una función del tamaño de la muestra, se utilizan varios métodos de determinación del tamaño de la muestra para sopesar la precisión prevista de un estimador frente al costo previsto de tomar una muestra más grande.