El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta . Cuanto mayor sea el margen de error, menos confianza se debe tener en que el resultado de una encuesta reflejaría el resultado de una encuesta de toda la población . El margen de error será positivo siempre que se muestree una población de forma incompleta y la medida de resultado tenga una varianza positiva , es decir, la medida varía .
Densidades de probabilidad de encuestas de diferentes tamaños, cada una codificada por colores según su intervalo de confianza del 95% (abajo), margen de error (izquierda) y tamaño de muestra (derecha). Cada intervalo refleja el rango dentro del cual se puede tener un 95% de confianza en que se puede encontrar el porcentaje real , dado un porcentaje informado del 50%. El margen de error es la mitad del intervalo de confianza (también, el radio del intervalo). Cuanto mayor sea la muestra, menor será el margen de error. Además, cuanto más alejado del 50% sea el porcentaje informado, menor será el margen de error.
El término margen de error se usa a menudo en contextos que no son encuestas para indicar un error de observación al informar las cantidades medidas. También se utiliza en el habla coloquial para referirse a la cantidad de espacio o flexibilidad que uno podría tener para lograr una meta. Por ejemplo, los comentaristas lo usan a menudo en los deportes cuando describen cuánta precisión se requiere para lograr una meta, puntos o resultado. Un boliche que se usa en los Estados Unidos mide 4,75 pulgadas de ancho y la bola mide 8,5 pulgadas de ancho, por lo que se podría decir que un jugador de bolos tiene un margen de error de 21,75 pulgadas al intentar golpear un pin específico para ganar uno de repuesto (por ejemplo, 1 pin permaneciendo en el carril).
Concepto
Considere una simple encuesta de sí / no como muestra de encuestados extraídos de una población reportando el porcentaje de respuestas de sí . Nos gustaría saber que tan cerca es el verdadero resultado de una encuesta de toda la población , sin tener que realizar uno. Si, hipotéticamente, realizáramos una encuesta sobre muestras posteriores de encuestados (recién extraídos de ), esperaríamos esos resultados posteriores que se distribuya normalmente sobre . El margen de error describe la distancia dentro de la cual se espera que un porcentaje específico de estos resultados varíe de.
De acuerdo con la regla 68-95-99.7 , esperaríamos que el 95% de los resultadoscaer dentro de aproximadamente dos desviaciones estándar () a ambos lados de la verdadera media . Este intervalo se denomina intervalo de confianza y el radio (la mitad del intervalo) se denomina margen de error , que corresponde a un nivel de confianza del 95% .
Generalmente, a un nivel de confianza , una muestra del tamaño de una población que tiene una desviación estándar esperada tiene un margen de error
Esperaríamos que los valores distribuidos normalmente tener una desviación estándar que de alguna manera varía con . El pequeño, cuanto más ancho sea el margen. Esto se llama error estándar..
Para el resultado único de nuestra encuesta, asumimos que, y que todos los resultados posteriores juntos tendrían una variación .
Margen máximo de error a diferentes niveles de confianza
Por un nivel de confianza , hay un intervalo de confianza correspondiente sobre la media, es decir, el intervalo dentro de los cuales valores de debería caer con probabilidad . Valores precisos deestán dados por la función cuantil de la distribución normal (a la que se aproxima la regla 68-95-99.7).
Tenga en cuenta que no está definido para , es decir, no está definido, como está .
Gráficos log-log de vs tamaño de muestra ny nivel de confianza γ . Las flechas muestran que el margen de error máximo para un tamaño de muestra de 1000 es ± 3,1% al 95% de nivel de confianza y ± 4,1% al 99%. La parábola insertada ilustra la relación entre a y a
Desde a , podemos establecer arbitrariamente , calcular , , y para obtener el máximo margen de error para a un nivel de confianza dado y tamaño de la muestra , incluso antes de tener resultados reales. Con
Además, de manera útil, para cualquier
Márgenes de error específicos
Si una encuesta tiene varios resultados porcentuales (por ejemplo, una encuesta que mide una única preferencia de opción múltiple), el resultado más cercano al 50% tendrá el mayor margen de error. Por lo general, es este número el que se informa como el margen de error para toda la encuesta. Imagina una encuesta informes como
(como en la figura de arriba)
A medida que un porcentaje dado se acerca a los extremos de 0% o 100%, su margen de error se acerca a ± 0%.
Comparando porcentajes
Imagínese una encuesta de opción múltiple informes como . Como se describió anteriormente, el margen de error informado para la encuesta normalmente sería, como está más cerca del 50%. Sin embargo, la noción popular de empate estadístico o empate estadístico no se refiere a la precisión de los resultados individuales, sino a la clasificación de los resultados. ¿Cuál está en primer lugar?
Si, hipotéticamente, realizáramos una encuesta sobre muestras posteriores de encuestados (recién extraídos de ) y reportar el resultado , podríamos usar el error estándar de diferencia para comprender cómo se espera que caiga sobre . Para esto, necesitamos aplicar la suma de varianzas para obtener una nueva varianza,,
Tenga en cuenta que esto supone que es casi constante, es decir, los encuestados que eligen A o B casi nunca elegirían C (haciendo y cercano a perfectamente correlacionado negativamente ). Con tres o más opciones en disputa más cercana, elegir una fórmula correcta para se vuelve más complicado.
Efecto del tamaño de población finito
Las fórmulas anteriores para el margen de error asumen que hay una población infinitamente grande y, por lo tanto, no dependen del tamaño de la población., pero solo en el tamaño de la muestra . Según la teoría del muestreo , esta suposición es razonable cuando la fracción de muestreo es pequeña. El margen de error para un método de muestreo en particular es esencialmente el mismo independientemente de si la población de interés es del tamaño de una escuela, ciudad, estado o país, siempre que la fracción de muestreo sea pequeña.
En los casos en que la fracción de muestreo es mayor (en la práctica, más del 5%), los analistas pueden ajustar el margen de error utilizando una corrección de población finita para tener en cuenta la precisión adicional obtenida al muestrear un porcentaje mucho mayor de la población. El FPC se puede calcular mediante la fórmula [1]
... y entonces si encuesta se llevaron a cabo en más del 24% de, digamos, un electorado de 300.000 votantes
Intuitivamente, para apropiadamente grande ,
En el primer caso, es tan pequeño que no requiere corrección. En el último caso, la encuesta se convierte efectivamente en un censo y el error de muestreo se vuelve discutible.
Sudman, Seymour y Bradburn, Norman (1982). Formulación de preguntas: una guía práctica para el diseño de cuestionarios . San Francisco: Jossey Bass. ISBN 0-87589-546-8
Wonnacott, TH y RJ Wonnacott (1990). Estadísticas introductorias (5ª ed.). Wiley. ISBN 0-471-61518-8.