En estadística , un intervalo de confianza de proporción binomial es un intervalo de confianza para la probabilidad de éxito calculada a partir del resultado de una serie de experimentos de éxito-fracaso ( ensayos de Bernoulli ). En otras palabras, un intervalo de confianza de proporción binomial es una estimación de intervalo de una probabilidad de éxito p cuando solo se conocen el número de experimentos n y el número de éxitos n S.
Existen varias fórmulas para un intervalo de confianza binomial, pero todas se basan en el supuesto de una distribución binomial . En general, se aplica una distribución binomial cuando un experimento se repite un número fijo de veces, cada ensayo del experimento tiene dos resultados posibles (éxito y fracaso), la probabilidad de éxito es la misma para cada ensayo y los ensayos son estadísticamente independientes . Debido a que la distribución binomial es una distribución de probabilidad discreta (es decir, no continua) y difícil de calcular para un gran número de ensayos, se utilizan una variedad de aproximaciones para calcular este intervalo de confianza, todas con sus propias compensaciones en precisión e intensidad computacional.
Un ejemplo simple de una distribución binomial es el conjunto de varios resultados posibles, y sus probabilidades, para el número de caras observado cuando se lanza una moneda diez veces. La proporción binomial observada es la fracción de los giros que resultan cara. Dada esta proporción observada, el intervalo de confianza para la probabilidad real de que la moneda caiga en cara es un rango de proporciones posibles, que pueden contener o no la proporción verdadera. Un intervalo de confianza del 95% para la proporción, por ejemplo, contendrá la proporción verdadera el 95% de las veces que se emplea el procedimiento para construir el intervalo de confianza. [1]
Intervalo de aproximación normal
Una fórmula comúnmente utilizada para un intervalo de confianza binomial se basa en la aproximación de la distribución del error sobre una observación distribuida binomialmente, , con una distribución normal . [3] Esta aproximación se basa en el teorema del límite central y no es confiable cuando el tamaño de la muestra es pequeño o la probabilidad de éxito es cercana a 0 o 1. [4]
Usando la aproximación normal, la probabilidad de éxito p se estima como
o el equivalente
dónde es la proporción de éxitos en un proceso de prueba de Bernoulli , medida con ensayos que producen éxitos y fallas, y es el Cuantil de una distribución normal estándar (es decir, el probit ) correspondiente a la tasa de error objetivo. Para un nivel de confianza del 95%, el error, entonces y .
Una derivación teórica importante de este intervalo de confianza implica la inversión de una prueba de hipótesis. Bajo esta formulación, el intervalo de confianza representa aquellos valores del parámetro de población que tendrían valores p grandes si fueran probados como una proporción de población hipotética . La colección de valores,, para el cual la aproximación normal es válida se puede representar como
dónde es el cuantil de una distribución normal estándar . Dado que la prueba en el medio de la desigualdad es una prueba de Wald , el intervalo de aproximación normal a veces se denomina intervalo de Wald , pero fue descrito por primera vez por Pierre-Simon Laplace en 1812. [5]
Error estándar de la estimación de una proporción cuando se utilizan datos ponderados
Sea una muestra aleatoria simple donde cada es iid de una distribución y peso de Bernoulli (p)es el peso de cada observación. Estandarizar las ponderaciones (positivas)por lo que suman 1. La proporción de la muestra ponderada es:. Desde el son independientes y cada uno tiene varianza , la varianza muestral de la proporción es, por tanto: [6]
.
El error estándar dees la raíz cuadrada de esta cantidad. Porque no sabemos, tenemos que estimarlo. Aunque hay muchos estimadores posibles, uno convencional es utilizar, la media de la muestra y conéctelo a la fórmula. Eso da:
Para datos no ponderados, , donación . El SE se convierte, lo que lleva a las fórmulas familiares, que muestran que el cálculo de datos ponderados es una generalización directa de ellos.
Intervalo de puntuación de Wilson
El intervalo de puntuación de Wilson es una mejora con respecto al intervalo de aproximación normal en múltiples aspectos. Fue desarrollado por Edwin Bidwell Wilson (1927). [7] A diferencia del intervalo de aproximación normal simétrico (arriba), el intervalo de puntuación de Wilson es asimétrico . No sufre problemas de sobreimpulso ni de intervalos de ancho cero que afectan al intervalo normal, y puede emplearse de forma segura con muestras pequeñas y observaciones sesgadas. [3] La probabilidad de cobertura observada está constantemente más cerca del valor nominal,. [2]
Al igual que el intervalo normal, pero a diferencia del intervalo de Clopper-Pearson , el intervalo se puede calcular directamente a partir de una fórmula.
Wilson comenzó con la aproximación normal al binomio:
con la fórmula analítica para la desviación estándar muestral dada por
- .
Combinando los dos y elevando al cuadrado el radical, se obtiene una ecuación que es cuadrática en p :
Transformar la relación en una ecuación cuadrática de forma estándar para p , tratandoy n como valores conocidos de la muestra (consulte la sección anterior), y el uso del valor de z que corresponde a la confianza deseada para la estimación de p da esto:
- ,
donde todos los valores entre paréntesis son cantidades conocidas. La solución para p estima los límites superior e inferior del intervalo de confianza para p . Por tanto, la probabilidad de éxito p se estima mediante
o el equivalente
La observación práctica de usar este intervalo es que tiene buenas propiedades incluso para un pequeño número de ensayos y / o una probabilidad extrema.
Intuitivamente, el valor central de este intervalo es el promedio ponderado de y , con recibiendo mayor peso a medida que aumenta el tamaño de la muestra. Formalmente, el valor central corresponde al uso de un pseudocontento de1/2 z ² , el número de desviaciones estándar del intervalo de confianza: sume este número tanto al recuento de éxitos como de fracasos para obtener la estimación de la razón. Para las dos desviaciones estándar comunes en cada intervalo de dirección (aproximadamente una cobertura del 95%, que en sí es aproximadamente 1,96 desviaciones estándar), esto produce la estimación, que se conoce como la "regla más cuatro".
Aunque la cuadrática se puede resolver explícitamente, en la mayoría de los casos las ecuaciones de Wilson también se pueden resolver numéricamente usando la iteración de punto fijo
con .
El intervalo de Wilson también se puede derivar de la prueba z de muestra única o de la prueba de chi-cuadrado de Pearson con dos categorías. El intervalo resultante,
luego se puede resolver para para producir el intervalo de puntuación de Wilson. La prueba en medio de la desigualdad es una prueba de puntuación .
El principio de igualdad de intervalo
Dado que el intervalo se deriva resolviendo de la aproximación normal al binomio, el intervalo de puntuación de Wilson tiene la propiedad de estar garantizado para obtener el mismo resultado que la prueba z equivalente o la prueba de chi-cuadrado .
Esta propiedad se puede visualizar trazando la función de densidad de probabilidad para el intervalo de puntuación de Wilson (ver Wallis 2021: 297-313) [8] y luego trazando una PDF normal en cada límite. Las áreas de cola de las distribuciones Wilson y normal resultantes, que representan la posibilidad de un resultado significativo en esa dirección, deben ser iguales.
El intervalo de puntuación de Wilson con corrección de continuidad y el intervalo de Clopper-Pearson también cumplen con esta propiedad. La importancia práctica es que estos intervalos pueden emplearse como pruebas de significación , con resultados idénticos a la prueba de origen, y pueden derivarse nuevas pruebas por geometría. [8]
Intervalo de puntuación de Wilson con corrección de continuidad
El intervalo de Wilson puede modificarse empleando una corrección de continuidad , con el fin de alinear la probabilidad de cobertura mínima , en lugar de la probabilidad de cobertura media, con el valor nominal,.
Así como el intervalo de Wilson refleja la prueba de chi-cuadrado de Pearson , el intervalo de Wilson con corrección de continuidad refleja la prueba de chi-cuadrado de Yates equivalente .
Las siguientes fórmulas para los límites inferior y superior del intervalo de puntuación de Wilson con corrección de continuidad se derivan de Newcombe (1998). [2]
Sin embargo, si p = 0,debe tomarse como 0; si p = 1, es entonces 1.
Wallis (2021) [8] identifica un método más simple para calcular intervalos de Wilson con corrección de continuidad que emplea funciones. Para el límite inferior, dejemos, dónde es el nivel de error seleccionado para . Luego. Este método tiene la ventaja de poder descomponerse aún más.
Intervalo de Jeffreys
El intervalo de Jeffreys tiene una derivación bayesiana, pero tiene buenas propiedades frecuentistas. En particular, tiene propiedades de cobertura que son similares a las del intervalo de Wilson, pero es uno de los pocos intervalos con la ventaja de tener colas iguales (por ejemplo, para un intervalo de confianza del 95%, las probabilidades del intervalo que se encuentra por encima o por debajo del valor real son ambos cercanos al 2,5%). Por el contrario, el intervalo de Wilson tiene un sesgo sistemático tal que se centra demasiado cerca de p = 0,5. [9]
El intervalo de Jeffreys es el intervalo creíble bayesiano obtenido al utilizar el Jeffreys anterior no informativo para la proporción binomial p . El previo de Jeffreys para este problema es una distribución Beta con parámetros (1/2, 1/2) , es un previo conjugado . Después de observar x éxitos en n ensayos, la distribución posterior de p es una distribución Beta con parámetros ( x + 1/2, n - x + 1/2) .
Cuando x ≠ 0 y x ≠ n , el intervalo de Jeffreys se toma como el intervalo de probabilidad posterior de cola igual al 100 (1 - α )% , es decir, los cuantiles α / 2 y 1 - α / 2 de una distribución Beta con parámetros ( x + 1/2, norte - x + 1/2) . Estos cuantiles deben calcularse numéricamente, aunque esto es razonablemente simple con el software estadístico moderno.
Para evitar que la probabilidad de cobertura tienda a cero cuando p → 0 o 1 , cuando x = 0 el límite superior se calcula como antes pero el límite inferior se establece en 0, y cuando x = n el límite inferior se calcula como antes pero el límite superior se establece en 1. [4]
Intervalo Clopper-Pearson
El intervalo de Clopper-Pearson es un método temprano y muy común para calcular intervalos de confianza binomiales. [10] Esto a menudo se denomina método "exacto", porque se basa en las probabilidades acumuladas de la distribución binomial (es decir, exactamente la distribución correcta en lugar de una aproximación). Sin embargo, en los casos en los que conocemos el tamaño de la población, los intervalos pueden no ser los más pequeños posibles. Por ejemplo, para una población de tamaño 20 con una proporción real del 50%, Clopper-Pearson da [0.272, 0.728], que tiene un ancho de 0.456 (y donde los límites están alejados 0.0280 de los "siguientes valores alcanzables" de 6/20 y 14 / 20); mientras que Wilson da [0.299, 0.701], que tiene un ancho de 0.401 (y está a 0.0007 de los siguientes valores alcanzables).
El intervalo Clopper-Pearson se puede escribir como
o equivalente,
con
donde 0 ≤ x ≤ n es el número de éxitos observados en la muestra y Bin ( n ; θ ) es una variable aleatoria binomial con n ensayos y probabilidad de éxito θ .
De manera equivalente, podemos decir que el intervalo de Clopper-Pearson es con nivel de confianza Si es el mínimo de aquellos tales que las siguientes pruebas de hipótesis tengan éxito con significación :
- H 0 :con H A :
- H 0 :con H A :.
Debido a una relación entre la distribución binomial y la distribución beta , el intervalo de Clopper-Pearson a veces se presenta en un formato alternativo que utiliza cuantiles de la distribución beta.
donde x es el número de éxitos, n es el número de ensayos, y B ( p ; v , w ) es el p ésimo cuantil de una distribución beta con parámetros de forma v y w .
Por lo tanto, , dónde:
El intervalo de confianza de la proporción binomial es entonces , como se desprende de la relación entre la función de distribución acumulativa de la distribución binomial y la función beta incompleta regularizada .
Cuándo es cualquiera o , las expresiones de forma cerrada para los límites de intervalo están disponibles: cuando el intervalo es y cuando es . [11]
La distribución beta, a su vez, está relacionada con la distribución F, por lo que se puede escribir una tercera formulación del intervalo de Clopper-Pearson utilizando cuantiles F:
donde x es el número de éxitos, n es el número de ensayos, y F ( c ; d 1 , d 2 ) es el c cuantil de una distribución F con d 1 y d 2 grados de libertad. [12]
El intervalo de Clopper-Pearson es un intervalo exacto ya que se basa directamente en la distribución binomial en lugar de una aproximación a la distribución binomial. Este intervalo nunca tiene una cobertura menor que la nominal para cualquier proporción de la población, pero eso significa que suele ser conservador. Por ejemplo, la verdadera tasa de cobertura de un intervalo de Clopper-Pearson 95% puede ser muy por encima de 95%, dependiendo de n y θ . [4] Por lo tanto, el intervalo puede ser más amplio de lo necesario para lograr un 95% de confianza. Por el contrario, vale la pena señalar que otros límites de confianza pueden ser más estrechos que su ancho de confianza nominal, es decir, el intervalo de aproximación normal (o "estándar"), intervalo de Wilson, [7] intervalo de Agresti-Coull, [12] etc., con una cobertura nominal del 95% puede de hecho cubrir menos del 95%. [4]
La definición del intervalo Clopper-Pearson también se puede modificar para obtener intervalos de confianza exactos para diferentes distribuciones. Por ejemplo, también se puede aplicar al caso en el que las muestras se extraen sin reemplazo de una población de un tamaño conocido, en lugar de extracciones repetidas de una distribución binomial. En este caso, la distribución subyacente sería la distribución hipergeométrica .
Intervalo de Agresti-Coull
El intervalo de Agresti-Coull es también otro intervalo de confianza binomial aproximado. [12]
Dado éxitos en ensayos, definir
y
Luego, un intervalo de confianza para es dado por
dónde es el cuantil de una distribución normal estándar, como antes (por ejemplo, un intervalo de confianza del 95% requiere , produciendo así ). Según Brown , Cai y DasGupta, [4] tomandoen lugar de 1,96 produce el intervalo "sumar 2 éxitos y 2 fracasos" descrito anteriormente por Agresti y Coull . [12]
Este intervalo se puede resumir empleando el ajuste del punto central, , del intervalo de puntuación de Wilson, y luego aplicando la aproximación Normal a este punto. [3] [4]
Transformación de arcoseno
La transformación de arcoseno tiene el efecto de sacar los extremos de la distribución. [13] Si bien puede estabilizar la varianza (y por lo tanto los intervalos de confianza) de los datos proporcionales, su uso ha sido criticado en varios contextos. [14]
Sea X el número de éxitos en n ensayos y sea p = X / n . La varianza de p es
Usando la transformada de arco seno, la varianza del arco seno de p 1/2 es [15]
Entonces, el intervalo de confianza en sí mismo tiene la siguiente forma:
dónde es el cuantil de una distribución normal estándar.
Este método puede usarse para estimar la varianza de p, pero su uso es problemático cuando p está cerca de 0 o 1.
t una transformación
Sea p la proporción de éxitos. Para 0 ≤ a ≤ 2,
Esta familia es una generalización de la transformada logit que es un caso especial con a = 1 y se puede usar para transformar una distribución de datos proporcional en una distribución aproximadamente normal . El parámetro una tiene que ser estimada para el conjunto de datos.
Regla de tres: para cuando no se observan éxitos
La regla de tres se utiliza para proporcionar una forma sencilla de establecer un intervalo de confianza aproximado del 95% para p , en el caso especial de que no haya éxito () se han observado. [16] El intervalo es (0,3 / n ) .
Por simetría, uno podría esperar solo éxitos (), el intervalo es (1-3 / n , 1) .
Comparación de diferentes intervalos
Hay varios trabajos de investigación que comparan estos y otros intervalos de confianza para la proporción binomial. [3] [2] [17] [18] Tanto Agresti como Coull (1998) [12] y Ross (2003) [19] señalan que métodos exactos como el intervalo Clopper-Pearson pueden no funcionar tan bien como ciertas aproximaciones . El intervalo de aproximación normal y su presentación en los libros de texto ha sido muy criticado, y muchos estadísticos abogan por que no se utilice. [4] Los principales problemas son sobreimpulso (los límites exceden [0, 1]), intervalos de ancho cero en= 0 y 1 (lo que implica falsamente certeza), [2] e inconsistencia general con las pruebas de significación. [3]
De las aproximaciones enumeradas anteriormente, los métodos de intervalo de puntuación de Wilson (con o sin corrección de continuidad) han demostrado ser los más precisos y sólidos, [3] [4] [2] aunque algunos prefieren el enfoque de Agresti-Coull para muestras más grandes Tamaños. [4] Los métodos de Wilson y Clopper-Pearson obtienen resultados consistentes con las pruebas de significación de la fuente, [8] y esta propiedad es decisiva para muchos investigadores.
Muchos de estos intervalos se pueden calcular en R usando paquetes como "binom" , o en Python usando el paquete "ebcic" (Calculadora de intervalo de confianza binomial exacta).
Ver también
- Teoría de la estimación
- Pseudocuenta
Referencias
- ↑ Sullivan, Lisa (27 de octubre de 2017). "Intervalos de confianza" . Escuela de Salud Pública de la Universidad de Boston .
- ^ a b c d e f Newcombe, RG (1998). "Intervalos de confianza de dos caras para la proporción única: comparación de siete métodos". Estadística en Medicina . 17 (8): 857–872. doi : 10.1002 / (SICI) 1097-0258 (19980430) 17: 8 <857 :: AID-SIM777> 3.0.CO; 2-E . PMID 9595616 .
- ^ a b c d e f Wallis, Sean A. (2013). "Intervalos de confianza binomial y pruebas de contingencia: fundamentos matemáticos y evaluación de métodos alternativos" (PDF) . Revista de Lingüística Cuantitativa . 20 (3): 178-208. doi : 10.1080 / 09296174.2013.799918 . S2CID 16741749 .
- ^ a b c d e f g h yo Brown, Lawrence D .; Cai, T. Tony ; DasGupta, Anirban (2001). "Estimación de intervalo para una proporción binomial". Ciencia estadística . 16 (2): 101-133. CiteSeerX 10.1.1.50.3025 . doi : 10.1214 / ss / 1009213286 . Señor 1861069 . Zbl 1059.62533 .
- ^ Laplace, Pierre Simon (1812). Théorie analytique des probabilités (en francés). Ve. Courcier. pag. 283.
- ^ ¿Cómo calcular el error estándar de una proporción utilizando datos ponderados?
- ^ a b Wilson, EB (1927). "Inferencia probable, ley de sucesión e inferencia estadística". Revista de la Asociación Estadounidense de Estadística . 22 (158): 209–212. doi : 10.1080 / 01621459.1927.10502953 . JSTOR 2276774 .
- ^ a b c d Wallis, Sean A. (2021). Estadística en la lingüística de corpus: un nuevo enfoque . Nueva York: Routledge. ISBN 9781138589384.
- ^ Cai, TT (2005). "Intervalos de confianza unilaterales en distribuciones discretas". Revista de Planificación e Inferencia Estadística . 131 (1): 63–88. doi : 10.1016 / j.jspi.2004.01.005 .
- ^ Clopper, C .; Pearson, ES (1934). "El uso de límites de confianza o fiduciales ilustrados en el caso del binomio". Biometrika . 26 (4): 404–413. doi : 10.1093 / biomet / 26.4.404 .
- ^ Thulin, Måns (1 de enero de 2014). "El costo de utilizar intervalos de confianza exactos para una proporción binomial". Revista Electrónica de Estadística . 8 (1): 817–840. arXiv : 1303.1288 . doi : 10.1214 / 14-EJS909 . ISSN 1935-7524 . S2CID 88519382 .
- ^ a b c d e Agresti, Alan ; Coull, Brent A. (1998). "Aproximado es mejor que 'exacto' para la estimación de intervalo de proporciones binomiales". El estadístico estadounidense . 52 (2): 119-126. doi : 10.2307 / 2685469 . JSTOR 2685469 . Señor 1628435 .
- ^ Holanda, Steven. "Transformaciones de proporciones y porcentajes" . strata.uga.edu . Consultado el 8 de septiembre de 2020 .
- ^ Warton, David I .; Hui, Francis KC (enero de 2011). "El arcoseno es estúpido: el análisis de proporciones en ecología" . Ecología . 92 (1): 3–10. doi : 10.1890 / 10-0340.1 . hdl : 1885/152287 . ISSN 0012-9658 .
- ^ Shao J (1998) Estadísticas matemáticas. Saltador. Nueva York, Nueva York, EE. UU.
- ^ Steve Simon (2010) "Intervalo de confianza con eventos cero" , The Children's Mercy Hospital, Kansas City, Missouri (sitio web: "Pregunte al profesor Mean en temas de estadísticas o investigación médica archivado el 15 de octubre de 2011 en Wayback Machine )
- ^ Reiczigel, J (2003). "Intervalos de confianza para el parámetro binomial: algunas nuevas consideraciones" (PDF) . Estadística en Medicina . 22 (4): 611–621. doi : 10.1002 / sim.1320 . PMID 12590417 .
- ^ Sauro J., Lewis JR (2005) "Comparación de calculadora de intervalos Wald, Adj-Wald, Exact y Wilson" Archivado el 18 de junio de 2012 en la Wayback Machine . Actas de la Sociedad de Factores Humanos y Ergonomía, 49ª Reunión Anual (HFES 2005) , Orlando, FL, págs. 2100–2104
- ^ Ross, TD (2003). "Intervalos de confianza precisos para la proporción binomial y la estimación de la tasa de Poisson" . Informática en Biología y Medicina . 33 (6): 509–531. doi : 10.1016 / S0010-4825 (03) 00019-2 . PMID 12878234 .