Margen de error

El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta . Cuanto mayor sea el margen de error, menos confianza se debe tener en que el resultado de una encuesta reflejaría el resultado de una encuesta de toda la población . El margen de error será positivo siempre que se muestree una población de forma incompleta y la medida de resultado tenga una varianza positiva , es decir, la medida varía .

Densidades de probabilidad de encuestas de diferentes tamaños, cada una codificada por colores según su intervalo de confianza del 95% (abajo), margen de error (izquierda) y tamaño de muestra (derecha). Cada intervalo refleja el rango dentro del cual se puede tener un 95% de confianza en que se puede encontrar el porcentaje real , dado un porcentaje informado del 50%. El margen de error es la mitad del intervalo de confianza (también, el radio del intervalo). Cuanto mayor sea la muestra, menor será el margen de error. Además, cuanto más alejado del 50% sea el porcentaje informado, menor será el margen de error.

El término margen de error se usa a menudo en contextos que no son encuestas para indicar un error de observación al informar las cantidades medidas. También se utiliza en el habla coloquial para referirse a la cantidad de espacio o flexibilidad que uno podría tener para lograr una meta. Por ejemplo, los comentaristas lo usan a menudo en los deportes cuando describen cuánta precisión se requiere para lograr una meta, puntos o resultado. Un boliche que se usa en los Estados Unidos mide 4,75 pulgadas de ancho y la bola mide 8,5 pulgadas de ancho, por lo que se podría decir que un jugador de bolos tiene un margen de error de 21,75 pulgadas al intentar golpear un pin específico para ganar uno de repuesto (por ejemplo, 1 pin permaneciendo en el carril).

Concepto

Considere una simple encuesta de sí / no ${\ Displaystyle P}$ como muestra de ${\ Displaystyle n}$ encuestados extraídos de una población ${\ Displaystyle N {\ text {,}} (n << N)}$ reportando el porcentaje ${\ Displaystyle p}$ de respuestas de sí . Nos gustaría saber que tan cerca ${\ Displaystyle p}$ es el verdadero resultado de una encuesta de toda la población ${\ Displaystyle N}$ , sin tener que realizar uno. Si, hipotéticamente, realizáramos una encuesta ${\ Displaystyle P}$ sobre muestras posteriores de ${\ Displaystyle n}$ encuestados (recién extraídos de ${\ Displaystyle N}$ ), esperaríamos esos resultados posteriores ${\ Displaystyle p_ {1}, p_ {2}, \ ldots}$ que se distribuya normalmente sobre ${\ Displaystyle {\ overline {p}}}$ . El margen de error describe la distancia dentro de la cual se espera que un porcentaje específico de estos resultados varíe de ${\ Displaystyle {\ overline {p}}}$ .

De acuerdo con la regla 68-95-99.7 , esperaríamos que el 95% de los resultados ${\ Displaystyle p_ {1}, p_ {2}, \ ldots}$ caer dentro de aproximadamente dos desviaciones estándar ( ${\ Displaystyle \ pm 2 \ sigma _ {P}}$ ) a ambos lados de la verdadera media ${\ Displaystyle {\ overline {p}}}$ . Este intervalo se denomina intervalo de confianza y el radio (la mitad del intervalo) se denomina margen de error , que corresponde a un nivel de confianza del 95% .

Generalmente, a un nivel de confianza ${\ Displaystyle \ gamma}$ , una muestra del tamaño ${\ Displaystyle n}$ de una población que tiene una desviación estándar esperada ${\ Displaystyle \ sigma}$ tiene un margen de error

{\ Displaystyle MOE _ {\ gamma} = z _ {\ gamma} \ times {\ sqrt {\ frac {\ sigma ^ {2}} {n}}}}

dónde ${\ Displaystyle z _ {\ gamma}}$ denota el cuantil (también, comúnmente, una puntuación z ), y ${\ Displaystyle {\ sqrt {\ frac {\ sigma ^ {2}} {n}}}}$ es el error estándar .

Desviación estándar y error estándar

Esperaríamos que los valores distribuidos normalmente ${\ Displaystyle p_ {1}, p_ {2}, \ ldots}$ tener una desviación estándar que de alguna manera varía con ${\ Displaystyle n}$ . El pequeño ${\ Displaystyle n}$ , cuanto más ancho sea el margen. Esto se llama error estándar. ${\ Displaystyle \ sigma _ {\ overline {p}}}$ .

Para el resultado único de nuestra encuesta, asumimos que ${\ Displaystyle p = {\ overline {p}}}$ , y que todos los resultados posteriores ${\ Displaystyle p_ {1}, p_ {2}, \ ldots}$ juntos tendrían una variación ${\ Displaystyle \ sigma _ {P} ^ {2} = P (1-P)}$ .

{\ Displaystyle {\ text {Error estándar}} = \ sigma _ {\ overline {p}} \ approx {\ sqrt {\ frac {\ sigma _ {P} ^ {2}} {n}}} \ approx { \ sqrt {\ frac {p (1-p)} {n}}}}

Tenga en cuenta que ${\ Displaystyle p (1-p)}$ corresponde a la varianza de una distribución de Bernoulli .

Margen máximo de error a diferentes niveles de confianza

Por un nivel de confianza ${\ Displaystyle \ gamma}$ , hay un intervalo de confianza correspondiente sobre la media ${\ Displaystyle \ mu \ pm z _ {\ gamma} \ sigma}$ , es decir, el intervalo ${\ Displaystyle [\ mu -z _ {\ gamma} \ sigma, \ mu + z _ {\ gamma} \ sigma]}$ dentro de los cuales valores de ${\ Displaystyle P}$ debería caer con probabilidad ${\ Displaystyle \ gamma}$ . Valores precisos de ${\ Displaystyle z _ {\ gamma}}$ están dados por la función cuantil de la distribución normal (a la que se aproxima la regla 68-95-99.7).

Tenga en cuenta que ${\ Displaystyle z _ {\ gamma}}$ no está definido para ${\ Displaystyle | \ gamma | \ geq 1}$ , es decir, ${\ Displaystyle z_ {1.00}}$ no está definido, como está ${\ Displaystyle z_ {1.10}}$ .

${\ Displaystyle \ gamma}$	${\ Displaystyle z _ {\ gamma}}$	${\ Displaystyle \ gamma}$	${\ Displaystyle z _ {\ gamma}}$
0,68	0.994 457 883 210	0,999	3.290 526 731 492
0,90	1.644 853 626 951	0,9999	3.890 591 886 413
0,95	1.959963984540	0,99999	4.417 173 413 469
0,98	2.326 347 874 041	0,999999	4.891 638 475 699
0,99	2.575 829 303 549	0,9999999	5.326 723 886 384
0,995	2.807 033 768 344	0,99999999	5.730 728 868 236
0,997	2.967 737 925 342	0,999999999	6.109 410 204 869

Gráficos log-log de

{\ Displaystyle MOE _ {\ gamma} (0.5)}

vs tamaño de muestra ny nivel de confianza γ . Las flechas muestran que el margen de error máximo para un tamaño de muestra de 1000 es ± 3,1% al 95% de nivel de confianza y ± 4,1% al 99%. La parábola insertada

{\ Displaystyle \ sigma _ {p} ^ {2} = pp ^ {2}}

ilustra la relación entre

{\ Displaystyle \ sigma _ {p} ^ {2}}

a

{\ Displaystyle p = .0.71}

y

{\ Displaystyle \ sigma _ {max} ^ {2}}

a

{\ Displaystyle p = .0.5}

Desde ${\ Displaystyle \ max \ sigma _ {P} ^ {2} = \ max P (1-P) = 0.25}$ a ${\ Displaystyle p = 0.5}$ , podemos establecer arbitrariamente ${\ Displaystyle p = {\ overline {p}} = 0.5}$ , calcular ${\ Displaystyle \ sigma _ {P}}$ , ${\ Displaystyle \ sigma _ {\ overline {p}}}$ , y ${\ Displaystyle z _ {\ gamma} \ sigma _ {\ overline {p}}}$ para obtener el máximo margen de error para ${\ Displaystyle P}$ a un nivel de confianza dado ${\ Displaystyle \ gamma}$ y tamaño de la muestra ${\ Displaystyle n}$ , incluso antes de tener resultados reales. Con ${\ Displaystyle p = 0.5, n = 1013}$

{\ Displaystyle MOE_ {95} (0.5) = z_ {0.95} \ sigma _ {\ overline {p}} \ approx z_ {0.95} {\ sqrt {\ frac {\ sigma _ {P} ^ {2}} { n}}} = 1,96 {\ sqrt {\ frac {.25} {n}}} = 0,98 / {\ sqrt {n}} = \ pm 3,1 \%}

{\ Displaystyle MOE_ {99} (0.5) = z_ {0.99} \ sigma _ {\ overline {p}} \ approx z_ {0.99} {\ sqrt {\ frac {\ sigma _ {P} ^ {2}} { n}}} = 2.58 {\ sqrt {\ frac {.25} {n}}} = 1.29 / {\ sqrt {n}} = \ pm 4.1 \%}

Además, de manera útil, para cualquier ${\ Displaystyle MOE_ {95}}$

{\ displaystyle MOE_ {99} = {\ frac {z_ {0.99}} {z_ {0.95}}} MOE_ {95} \ aproximadamente 1,3 \ veces MOE_ {95}}

Márgenes de error específicos

Si una encuesta tiene varios resultados porcentuales (por ejemplo, una encuesta que mide una única preferencia de opción múltiple), el resultado más cercano al 50% tendrá el mayor margen de error. Por lo general, es este número el que se informa como el margen de error para toda la encuesta. Imagina una encuesta ${\ Displaystyle P}$ informes ${\ Displaystyle p_ {a}, p_ {b}, p_ {c}}$ como ${\ Displaystyle 71 \%, 27 \%, 2 \%, n = 1013}$

{\ Displaystyle MOE_ {95} (P_ {a}) = z_ {0.95} \ sigma _ {\ overline {p_ {a}}} \ approx 1.96 {\ sqrt {\ frac {p_ {a} (1-p_ { a})} {n}}} = 0.89 / {\ sqrt {n}} = \ pm 2.8 \%}

(como en la figura de arriba)

{\ Displaystyle MOE_ {95} (P_ {b}) = z_ {0.95} \ sigma _ {\ overline {p_ {b}}} \ approx 1.96 {\ sqrt {\ frac {p_ {b} (1-p_ { b})} {n}}} = 0.87 / {\ sqrt {n}} = \ pm 2.7 \%}

{\ Displaystyle MOE_ {95} (P_ {c}) = z_ {0.95} \ sigma _ {\ overline {p_ {c}}} \ approx 1.96 {\ sqrt {\ frac {p_ {c} (1-p_ { c})} {n}}} = 0.27 / {\ sqrt {n}} = \ pm 0.8 \%}

A medida que un porcentaje dado se acerca a los extremos de 0% o 100%, su margen de error se acerca a ± 0%.

Comparando porcentajes

Imagínese una encuesta de opción múltiple ${\ Displaystyle P}$ informes ${\ Displaystyle p_ {a}, p_ {b}, p_ {c}}$ como ${\ Displaystyle 46 \%, 42 \%, 12 \%, n = 1013}$ . Como se describió anteriormente, el margen de error informado para la encuesta normalmente sería ${\ Displaystyle MOE_ {95} (P_ {a})}$ , como ${\ Displaystyle p_ {a}}$ está más cerca del 50%. Sin embargo, la noción popular de empate estadístico o empate estadístico no se refiere a la precisión de los resultados individuales, sino a la clasificación de los resultados. ¿Cuál está en primer lugar?

Si, hipotéticamente, realizáramos una encuesta ${\ Displaystyle P}$ sobre muestras posteriores de ${\ Displaystyle n}$ encuestados (recién extraídos de ${\ Displaystyle N}$ ) y reportar el resultado ${\ Displaystyle p_ {w} = p_ {a} -p_ {b}}$ , podríamos usar el error estándar de diferencia para comprender cómo ${\ Displaystyle p_ {w_ {1}}, p_ {w_ {2}}, p_ {w_ {3}}, \ ldots}$ se espera que caiga sobre ${\ Displaystyle {\ overline {p_ {w}}}}$ . Para esto, necesitamos aplicar la suma de varianzas para obtener una nueva varianza, ${\ Displaystyle \ sigma _ {P_ {w}} ^ {2}}$ ,

{\ Displaystyle \ sigma _ {P_ {w}} ^ {2} = \ sigma _ {P_ {a} -P_ {b}} ^ {2} = \ sigma _ {P_ {a}} ^ {2} + \ sigma _ {P_ {b}} ^ {2} -2 \ sigma _ {P_ {a}, P_ {b}} = p_ {a} (1-p_ {a}) + p_ {b} (1- p_ {b}) + 2p_ {a} p_ {b}}

dónde ${\ Displaystyle \ sigma _ {P_ {a}, P_ {b}} = - P_ {a} P_ {b}}$ es la covarianza de ${\ Displaystyle P_ {a}}$ y ${\ Displaystyle P_ {b}}$ .

Así (después de simplificar),

{\ displaystyle {\ text {Error estándar de diferencia}} = \ sigma _ {\ overline {w}} \ approx {\ sqrt {\ frac {\ sigma _ {P_ {w}} ^ {2}} {n} }} = {\ sqrt {\ frac {p_ {a} + p_ {b} - (p_ {a} -p_ {b}) ^ {2}} {n}}} = 0.029, P_ {w} = P_ {orden de busca y captura}}

{\ Displaystyle MOE_ {95} (P_ {a}) = z_ {0.95} \ sigma _ {\ overline {p_ {a}}} \ approx \ pm {3.1 \%}}

{\ Displaystyle MOE_ {95} (P_ {w}) = z_ {0.95} \ sigma _ {\ overline {w}} \ approx \ pm {5.8 \%}}

Tenga en cuenta que esto supone que ${\ Displaystyle P_ {c}}$ es casi constante, es decir, los encuestados que eligen A o B casi nunca elegirían C (haciendo ${\ Displaystyle P_ {a}}$ y ${\ Displaystyle P_ {b}}$ cercano a perfectamente correlacionado negativamente ). Con tres o más opciones en disputa más cercana, elegir una fórmula correcta para ${\ Displaystyle \ sigma _ {P_ {w}} ^ {2}}$ se vuelve más complicado.

Efecto del tamaño de población finito

Las fórmulas anteriores para el margen de error asumen que hay una población infinitamente grande y, por lo tanto, no dependen del tamaño de la población. ${\ Displaystyle N}$ , pero solo en el tamaño de la muestra ${\ Displaystyle n}$ . Según la teoría del muestreo , esta suposición es razonable cuando la fracción de muestreo es pequeña. El margen de error para un método de muestreo en particular es esencialmente el mismo independientemente de si la población de interés es del tamaño de una escuela, ciudad, estado o país, siempre que la fracción de muestreo sea pequeña.

En los casos en que la fracción de muestreo es mayor (en la práctica, más del 5%), los analistas pueden ajustar el margen de error utilizando una corrección de población finita para tener en cuenta la precisión adicional obtenida al muestrear un porcentaje mucho mayor de la población. El FPC se puede calcular mediante la fórmula ^[1]

{\ Displaystyle \ operatorname {FPC} = {\ sqrt {\ frac {Nn} {N-1}}}}

... y entonces si encuesta ${\ Displaystyle P}$ se llevaron a cabo en más del 24% de, digamos, un electorado de 300.000 votantes

{\ Displaystyle MOE_ {95} (0.5) = z_ {0.95} \ sigma _ {\ overline {p}} \ approx {\ frac {0.98} {\ sqrt {72,000}}} = \ pm 0.4 \%}

{\ Displaystyle MOE_ {95_ {FPC}} (0.5) = z_ {0.95} \ sigma _ {\ overline {p}} {\ sqrt {\ frac {Nn} {N-1}}} \ approx {\ frac { 0.98} {\ sqrt {72,000}}} {\ sqrt {\ frac {300,000-72,000} {300,000-1}}} = \ pm 0.3 \%}

Intuitivamente, para apropiadamente grande ${\ Displaystyle N}$ ,

{\ Displaystyle \ lim _ {n \ to 0} {\ sqrt {\ frac {Nn} {N-1}}} \ approx 1}

{\ Displaystyle \ lim _ {n \ to N} {\ sqrt {\ frac {Nn} {N-1}}} = 0}

En el primer caso, ${\ Displaystyle n}$ es tan pequeño que no requiere corrección. En el último caso, la encuesta se convierte efectivamente en un censo y el error de muestreo se vuelve discutible.

Ver también

Notas

^ Isserlis, L. (1918). "Sobre el valor de una media calculada a partir de una muestra" . Revista de la Royal Statistical Society . Publicación de Blackwell. 81 (1): 75–81. doi : 10.2307 / 2340569 . JSTOR 2340569 . (Ecuación 1)

Referencias

Sudman, Seymour y Bradburn, Norman (1982). Formulación de preguntas: una guía práctica para el diseño de cuestionarios . San Francisco: Jossey Bass. ISBN 0-87589-546-8
Wonnacott, TH y RJ Wonnacott (1990). Estadísticas introductorias (5ª ed.). Wiley. ISBN 0-471-61518-8.

enlaces externos

"Errores, teoría de" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
Weisstein, Eric W. "Margen de error" . MathWorld .

[1] Isserlis, L. (1918). "Sobre el valor de una media calculada a partir de una muestra" . Revista de la Royal Statistical Society . Publicación de Blackwell. 81 (1): 75–81. doi : 10.2307 / 2340569 . JSTOR 2340569 . (Ecuación 1)

[1]