Intervalo de confianza


En estadística , un intervalo de confianza ( IC ) es un rango de estimaciones, definido por un límite inferior y un límite superior, para un parámetro desconocido . El intervalo se calcula a un nivel de confianza designado . Un nivel de confianza del 95% es el más común, pero a veces se utilizan otros niveles, como el 90% o el 99%. [1] El nivel de confianza representa la frecuencia a largo plazo de los intervalos de confianza que contienen el valor real del parámetro. En otras palabras, el 95% de los intervalos de confianza calculados al nivel de confianza del 95% contienen el parámetro, y también para otros niveles de confianza. [2]

Los factores que afectan la amplitud del IC incluyen el nivel de confianza, el tamaño de la muestra y la variabilidad en la muestra. [3] Las muestras más grandes producen intervalos de confianza más estrechos cuando todos los demás factores son iguales. Una mayor variabilidad en la muestra producirá intervalos de confianza más amplios cuando todos los demás factores sean iguales. Para una estimación dada, el uso de un nivel de confianza más alto producirá un intervalo de confianza más amplio. [4]

Sea X una muestra aleatoria de una distribución de probabilidad con el parámetro estadístico θ , que es una cantidad a estimar, y φ , que representa cantidades que no son de interés inmediato. Un intervalo de confianza para el parámetro θ , con nivel de confianza o coeficiente de confianza γ , es un intervalo con puntos finales aleatorios ( u ( X ),  v ( X )), determinado por el par de variables aleatorias u ( X ) yv ( X), con la propiedad:

Las cantidades φ en las que no existe un interés inmediato se denominan parámetros de molestia , ya que la teoría estadística aún necesita encontrar alguna forma de abordarlos. El número γ , con valores típicos cercanos pero no mayores a 1, a veces se da en la forma 1 -  α (o como un porcentaje 100% · (1 -  α )), donde α es un número pequeño no negativo, cerca a 0.

Aquí Pr θ , φ indica la distribución de probabilidad de X caracterizada por ( θφ ). Una parte importante de esta especificación es que el intervalo aleatorio ( u ( X ),  v ( X )) cubre el valor desconocido θ con una alta probabilidad sin importar cuál sea el verdadero valor de θ .

Tenga en cuenta que aquí Pr θ , φ no necesita referirse a una familia de distribuciones parametrizada dada explícitamente, aunque a menudo lo hace. Así como la variable aleatoria X corresponde teóricamente a otras posibles realizaciones de x de la misma población o de la misma versión de la realidad, los parámetros ( θφ ) indican que debemos considerar otras versiones de la realidad en las que la distribución de X podría tienen diferentes características.


En este gráfico de barras , los extremos superiores de las barras marrones indican las medias observadas y los segmentos de línea roja ("barras de error") representan los intervalos de confianza a su alrededor. Aunque las barras de error se muestran simétricas alrededor de las medias, no siempre es así. En la mayoría de los gráficos, las barras de error no representan intervalos de confianza (por ejemplo, a menudo representan errores estándar o desviaciones estándar )