Intervalo de confianza de la proporción binomial


En estadística , un intervalo de confianza de proporción binomial es un intervalo de confianza para la probabilidad de éxito calculada a partir del resultado de una serie de experimentos de éxito-fracaso ( ensayos de Bernoulli ). En otras palabras, un intervalo de confianza de proporción binomial es una estimación de intervalo de una probabilidad de éxito p cuando solo se conocen el número de experimentos n y el número de éxitos n S.

Existen varias fórmulas para un intervalo de confianza binomial, pero todas se basan en el supuesto de una distribución binomial . En general, se aplica una distribución binomial cuando un experimento se repite un número fijo de veces, cada ensayo del experimento tiene dos resultados posibles (éxito y fracaso), la probabilidad de éxito es la misma para cada ensayo y los ensayos son estadísticamente independientes . Debido a que la distribución binomial es una distribución de probabilidad discreta (es decir, no continua) y difícil de calcular para un gran número de ensayos, se utilizan una variedad de aproximaciones para calcular este intervalo de confianza, todas con sus propias compensaciones en precisión e intensidad computacional.

Un ejemplo simple de una distribución binomial es el conjunto de varios resultados posibles, y sus probabilidades, para el número de caras observado cuando se lanza una moneda diez veces. La proporción binomial observada es la fracción de los giros que resultan ser cara. Dada esta proporción observada, el intervalo de confianza para la probabilidad real de que la moneda caiga en cara es un rango de proporciones posibles, que pueden contener o no la proporción verdadera. Un intervalo de confianza del 95% para la proporción, por ejemplo, contendrá la proporción verdadera el 95% de las veces que se emplea el procedimiento para construir el intervalo de confianza. [1]


Una fórmula comúnmente utilizada para un intervalo de confianza binomial se basa en la aproximación de la distribución del error sobre una observación distribuida binomialmente , con una distribución normal . [3] Esta aproximación se basa en el teorema del límite central y no es confiable cuando el tamaño de la muestra es pequeño o la probabilidad de éxito es cercana a 0 o 1. [4]


Trazar el intervalo de aproximación normal en una curva logística arbitraria revela problemas de sobreimpulso y intervalos de ancho cero . [2]
Los intervalos de puntuación de Wilson se trazan en una curva logística, lo que revela asimetría y buen desempeño para n pequeños y donde p es igual o cerca de 0 o 1.
La función de densidad de probabilidad para el intervalo de puntuación de Wilson, más las PDF en los límites del intervalo. Las áreas de la cola son iguales.