Una banda de confianza se utiliza en análisis estadístico para representar la incertidumbre en una estimación de una curva o función basada en datos limitados o ruidosos. De manera similar, se usa una banda de predicción para representar la incertidumbre sobre el valor de un nuevo punto de datos en la curva, pero sujeto a ruido. Las bandas de confianza y predicción se utilizan a menudo como parte de la presentación gráfica de los resultados de un análisis de regresión .
Las bandas de confianza están estrechamente relacionadas con los intervalos de confianza , que representan la incertidumbre en una estimación de un solo valor numérico. "Como los intervalos de confianza, por construcción, solo se refieren a un único punto, son más estrechos (en este punto) que una banda de confianza que se supone que se mantiene simultáneamente en muchos puntos". [1]
Bandas de confianza puntuales y simultáneas
Suponga que nuestro objetivo es estimar una función f ( x ). Por ejemplo, f ( x ) podría ser la proporción de personas de una edad x en particular que apoyan a un candidato determinado en una elección. Si x se mide con la precisión de un solo año, podemos construir un intervalo de confianza del 95% por separado para cada edad. Cada uno de estos intervalos de confianza cubre el valor verdadero correspondiente f ( x ) con una confianza de 0,95. En conjunto, estos intervalos de confianza constituyen una banda de confianza puntual del 95% para f ( x ).
En términos matemáticos, una banda de confianza puntual con probabilidad de cobertura 1 - α satisface la siguiente condición por separado para cada valor de x :
dónde es la estimación puntual de f ( x ).
La probabilidad de cobertura simultánea de una colección de intervalos de confianza es la probabilidad de que todos cubran sus valores verdaderos correspondientes simultáneamente. En el ejemplo anterior, la probabilidad de cobertura simultánea es la probabilidad de que los intervalos para x = 18,19, ... todos cubran sus valores reales (asumiendo que 18 es la edad más joven a la que una persona puede votar). Si cada intervalo tiene individualmente una probabilidad de cobertura de 0,95, la probabilidad de cobertura simultánea es generalmente menor que 0,95. Una banda de confianza simultánea del 95% es una colección de intervalos de confianza para todos los valores x en el dominio de f ( x ) que se construye para tener una probabilidad de cobertura simultánea de 0,95.
En términos matemáticos, una banda de confianza simultánea con probabilidad de cobertura 1 - α satisface la siguiente condición:
En casi todos los casos, una banda de confianza simultánea será más ancha que una banda de confianza puntual con la misma probabilidad de cobertura. En la definición de una banda de confianza puntual, ese cuantificador universal se mueve fuera de la función de probabilidad.
Bandas de confianza en el análisis de regresión
Las bandas de confianza surgen comúnmente en el análisis de regresión . [2] En el caso de una regresión simple que involucra una sola variable independiente, los resultados se pueden presentar en forma de gráfico que muestre la línea de regresión estimada junto con bandas de confianza puntuales o simultáneas. Los métodos comúnmente utilizados para construir bandas de confianza simultáneas en regresión son los métodos de Bonferroni y Scheffé ; consulte Procedimientos de control de la tasa de error familiar para obtener más información.
Bandas de confianza para distribuciones de probabilidad
Se pueden construir bandas de confianza en torno a estimaciones de la función de distribución empírica . La teoría simple permite la construcción de intervalos de confianza puntuales, pero también es posible construir una banda de confianza simultánea para la función de distribución acumulativa en su conjunto invirtiendo la prueba de Kolmogorov-Smirnov o utilizando métodos de verosimilitud no paramétricos. [3]
Otras aplicaciones de las bandas de confianza
Las bandas de confianza surgen cuando un análisis estadístico se centra en estimar una función.
También se han diseñado bandas de confianza para estimaciones de funciones de densidad , funciones de densidad espectral , [4] funciones de cuantiles , suavizados de diagramas de dispersión , funciones de supervivencia y funciones características . [ cita requerida ]
Bandas de predicción
Las bandas de predicción están relacionadas con los intervalos de predicción de la misma manera que las bandas de confianza están relacionadas con los intervalos de confianza. Las bandas de predicción surgen comúnmente en el análisis de regresión. El objetivo de una banda de predicción es cubrir con una probabilidad prescrita los valores de una o más observaciones futuras de la misma población de la que se muestreó un conjunto de datos dado. Así como los intervalos de predicción son más amplios que los intervalos de confianza, las bandas de predicción serán más amplias que las bandas de confianza.
En términos matemáticos, una banda de predicción con probabilidad de cobertura 1 - α satisface la siguiente condición para cada valor de x :
donde y * es una observación tomada del proceso de generación de datos en el punto x dado que es independiente de los datos utilizados para construir la estimación puntualy el intervalo de confianza [ vago ] w ( x ). Este es un intervalo de predicción puntual. [ vago ] Sería posible construir un intervalo simultáneo [ vago ] para un número finito de observaciones independientes usando, por ejemplo, el método de Bonferroni para ampliar el intervalo [ vago ] en una cantidad apropiada.
Referencias
- ^ p.65 en W. Härdle, M. Müller, S. Sperlich, A. Werwatz (2004), Modelos no paramétricos y semiparamétricos, Springer, ISBN 3540207228"Copia archivada" . Archivado desde el original el 12 de abril de 2013 . Consultado el 6 de febrero de 2013 .CS1 maint: copia archivada como título ( enlace ), [1]
- ^ Liu, W; Lin S .; Piegorsch WW (2008). "Construcción de bandas de confianza simultáneas exactas para un modelo de regresión lineal simple" . Revista Estadística Internacional . 76 (1): 39–57. doi : 10.1111 / j.1751-5823.2007.00027.x .
- ^ Owen, AB (1995). "Bandas de confianza de verosimilitud no paramétrica para una función de distribución". Revista de la Asociación Estadounidense de Estadística . Asociación Estadounidense de Estadística. 90 (430): 516–521. doi : 10.2307 / 2291062 . JSTOR 2291062 .
- ^ Neumann, MH; Paparoditis, E. (2008). "Bandas de confianza simultáneas en la estimación de la densidad espectral". Biometrika . 95 (2): 381. CiteSeerX 10.1.1.569.3978 . doi : 10.1093 / biomet / asn005 .