Intervalo de tolerancia

Un intervalo de tolerancia es un intervalo estadístico dentro del cual, con algún nivel de confianza, cae una proporción específica de una población muestreada. "Más específicamente, un intervalo de tolerancia de 100 × p% / 100 × (1 − α) proporciona límites dentro de los cuales al menos una cierta proporción (p) de la población cae con un nivel de confianza dado (1 − α)". ^[1] "Un (p, 1 − α) intervalo de tolerancia (TI) basado en una muestra se construye de manera que incluya al menos una proporción p de la población muestreada con confianza 1 − α; tal TI generalmente se denomina como contenido p - (1 − α) cobertura TI ". ^[2] "Un (p, 1 − α) límite de tolerancia superior (TL) es simplemente un límite de confianza superior 1 − α para el percentil 100 pde la población ". ^[2]

Un intervalo de tolerancia puede verse como una versión estadística de un intervalo de probabilidad . "En el caso de parámetros conocidos, un intervalo de tolerancia del 95% y un intervalo de predicción del 95% son lo mismo". ^[3] Si conociéramos los parámetros exactos de una población, podríamos calcular un rango dentro del cual cae una cierta proporción de la población. Por ejemplo, si sabemos que una población se distribuye normalmente con media y desviación estándar , entonces el intervalo incluye el 95% de la población (1,96 es el puntaje z para una cobertura del 95% de una población con distribución normal). ${\ Displaystyle \ mu}$ ${\ Displaystyle \ sigma}$ ${\ Displaystyle \ mu \ pm 1.96 \ sigma}$

Sin embargo, si solo tenemos una muestra de la población, solo conocemos la media muestral y la desviación estándar muestral , que son solo estimaciones de los parámetros verdaderos. En ese caso, no necesariamente incluirá al 95% de la población, debido a la variación en estas estimaciones. Un intervalo de tolerancia limita esta varianza introduciendo un nivel de confianza , que es la confianza con la que este intervalo incluye realmente la proporción especificada de la población. Para una población distribuida normalmente, una puntuación z se puede transformar en un " factor k " o factor de tolerancia ^[4] para un determinado mediante tablas de búsqueda o varias fórmulas de aproximación. ^[5] ${\ Displaystyle {\ hat {\ mu}}}$ ${\ Displaystyle {\ hat {\ sigma}}}$ ${\ Displaystyle {\ hat {\ mu}} \ pm 1.96 {\ hat {\ sigma}}}$ ${\ Displaystyle \ gamma}$ ${\ Displaystyle \ gamma}$ "A medida que los grados de libertad se acercan al infinito, los intervalos de predicción y tolerancia se vuelven iguales". ^[6]

Fórmulas [ editar ]

Esta sección necesita ampliarse con: ecuaciones matemáticas. Puede ayudar agregando más . ( charla ) ( julio de 2014 )

Caso normal [ editar ]

Relación con otros intervalos [ editar ]

El intervalo de tolerancia es menos conocido que el intervalo de confianza y el intervalo de predicción , una situación que algunos educadores han lamentado, ya que puede llevar a un mal uso de los otros intervalos donde un intervalo de tolerancia es más apropiado. ^[7]^[8]

El intervalo de tolerancia difiere de un intervalo de confianza en que el intervalo de confianza limita un parámetro de población de valor único (la media o la varianza , por ejemplo) con cierta confianza, mientras que el intervalo de tolerancia limita el rango de valores de datos que incluye una proporción específica de la población. Mientras que el tamaño de un intervalo de confianza se debe completamente a un error de muestreo y se acercará a un intervalo de ancho cero en el parámetro de población real a medida que aumenta el tamaño de la muestra, el tamaño de un intervalo de tolerancia se debe en parte al error de muestreo y en parte a la varianza real en la población, y se acercará al intervalo de probabilidad de la población a medida que aumenta el tamaño de la muestra. ^[7]^[8]

El intervalo de tolerancia está relacionado con un intervalo de predicción en el sentido de que ambos ponen límites a la variación en muestras futuras. Sin embargo, el intervalo de predicción solo limita una única muestra futura, mientras que un intervalo de tolerancia limita a toda la población (de manera equivalente, una secuencia arbitraria de muestras futuras). En otras palabras, un intervalo de predicción cubre una proporción específica de una población en promedio , mientras que un intervalo de tolerancia la cubre con un cierto nivel de confianza , lo que hace que el intervalo de tolerancia sea más apropiado si se pretende que un solo intervalo limite múltiples muestras futuras. ^[8]^[9]

Ejemplos [ editar ]

^[7] da el siguiente ejemplo:

Así que considere una vez más un escenario proverbial de prueba de kilometraje de la EPA , en el que se prueban varios autos nominalmente idénticos de un modelo en particular para producir cifras de kilometraje . Si dichos datos se procesan para producir un intervalo de confianza del 95% para el millaje medio del modelo, es posible, por ejemplo, utilizarlo para proyectar el consumo medio o total de gasolina de la flota fabricada de dichos automóviles durante sus primeras 5.000 millas. de uso. Sin embargo, tal intervalo no sería de mucha ayuda para una persona que alquila uno de estos autos y se pregunta si el tanque de gasolina (lleno) de 10 galones será suficiente para llevarlo 350 millas hasta su destino. Para ese trabajo, un intervalo de predicción sería mucho más útil. (Considere las diferentes implicaciones de estar "95% seguro" de que ${\ Displaystyle y_ {1}, y_ {2}, ..., y_ {n}}$ ${\ Displaystyle \ mu \ geq 35}$ en lugar de estar "95% seguro" de eso ). Pero ni un intervalo de confianza ni un intervalo de predicción para un millaje adicional es exactamente lo que necesita un ingeniero de diseño encargado de determinar qué tan grande es el tanque de gasolina que el modelo realmente necesita garantizar. que el 99% de los autos producidos tendrán un alcance de crucero de 400 millas. Lo que realmente necesita el ingeniero es un intervalo de tolerancia para una fracción de los kilómetros de tales autos. ${\ Displaystyle y_ {n + 1} \ geq 35}$ ${\ Displaystyle \ mu}$ ${\ Displaystyle p = .99}$

Otro ejemplo lo dan: ^[9]

Los niveles de plomo en el aire se obtuvieron de diferentes áreas dentro de la instalación. Se observó que los niveles de plomo transformados logarítmicamente se ajustaban bien a una distribución normal (es decir, los datos provienen de una distribución logarítmica normal) . Sean y , respectivamente, la media de la población y la varianza de los datos transformados logarítmicamente. Si denota el valor aleatorio correspondiente Por lo tanto, tenemos . Observamos que es el nivel medio de plomo en el aire. Se puede construir un intervalo de confianza para de la manera habitual, basado en la distribución t ; esto a su vez proporcionará un intervalo de confianza para el nivel medio de plomo en el aire. Si y ${\ Displaystyle n = 15}$ ${\ Displaystyle \ mu}$ ${\ Displaystyle \ sigma ^ {2}}$ ${\ Displaystyle X}$ ${\ Displaystyle X \ sim {\ mathcal {N}} (\ mu, \ sigma ^ {2})}$ ${\ Displaystyle \ exp (\ mu)}$ ${\ Displaystyle \ mu}$ ${\ displaystyle {\ bar {X}}}$ ${\ Displaystyle S}$ denota la media muestral y la desviación estándar de los datos transformados logarítmicamente para una muestra de tamaño n, un intervalo de confianza del 95% para viene dado por , donde denota el cuantil de una distribución t con grados de libertad. También puede ser de interés derivar un límite de confianza superior del 95% para el nivel medio de plomo en el aire. Tal límite viene dado por . En consecuencia, un límite de confianza superior del 95% para la mediana de plomo en el aire viene dado por . Ahora suponga que queremos predecir el nivel de plomo en el aire en un área particular del laboratorio. Un límite de predicción superior del 95% para el nivel de plomo transformado logarítmicamente viene dado por ${\ Displaystyle \ mu}$ ${\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {(}}n)$ $t_{m,1-\alpha }$ $1-\alpha$ $m$ $\mu$ ${\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}$ $\exp {\left({\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}\right)}$ ${\bar {X}}+t_{n-1,0.95}S{\sqrt {\left(1+1/n\right)}}$ . Un intervalo de predicción de dos lados se puede calcular de manera similar. El significado y la interpretación de estos intervalos son bien conocidos. Por ejemplo, si el intervalo de confianza se calcula repetidamente a partir de muestras independientes, el 95% de los intervalos así calculados incluirán el valor verdadero de , a largo plazo. En otras palabras, el intervalo está destinado a proporcionar información sobre el parámetro ${\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}$ $\mu$ $\mu$ solamente. Un intervalo de predicción tiene una interpretación similar y está destinado a proporcionar información sobre un único nivel de cliente potencial. Ahora suponga que queremos usar la muestra para concluir si al menos el 95% de los niveles de plomo de la población están por debajo de un umbral. El intervalo de confianza y el intervalo de predicción no pueden responder a esta pregunta, ya que el intervalo de confianza es solo para el nivel de ventaja mediano y el intervalo de predicción es solo para un nivel de ventaja individual. Lo que se requiere es un intervalo de tolerancia; más específicamente, un límite de tolerancia superior. El límite de tolerancia superior se calculará sujeto a la condición de que al menos el 95% de los niveles de plomo de la población estén por debajo del límite, con un cierto nivel de confianza, digamos el 99%.

Cálculo [ editar ]

Los intervalos de tolerancia normal unilaterales tienen una solución exacta en términos de la media muestral y la varianza muestral basada en la distribución t no central . ^[10] Se pueden obtener intervalos de tolerancia normal de dos lados basados en la distribución chi-cuadrado no central . ^[10]

Ver también [ editar ]

Tolerancia de ingeniería
Factor de seguridad

Referencias [ editar ]

^ DS Young (2010), Reseñas de libros: "Regiones de tolerancia estadística: teoría, aplicaciones y computación", TECHNOMETRICS, FEBRERO DE 2010, VOL. 52, NO. 1, páginas 143-144.
^ a b Krishnamoorthy, K. y Lian, Xiaodong (2011) 'Intervalos de tolerancia aproximados de forma cerrada para algunos modelos lineales generales y estudios de comparación', Journal of Statistical Computation and Simulation, Publicado por primera vez el: 13 de junio de 2011 doi : 10.1080 / 00949655.2010 .545061
^ Thomas P. Ryan (22 de junio de 2007). Estadísticas de ingeniería moderna . John Wiley e hijos. págs. 222–. ISBN 978-0-470-12843-5. Consultado el 22 de febrero de 2013 .
^ "Interpretación estadística de datos - parte 6: determinación de intervalos de tolerancia estadística" . ISO 16269-6. 2014. p. 2.
^ "Intervalos de tolerancia para una distribución normal" . Manual de estadísticas de ingeniería . NIST / Sematech. 2010 . Consultado el 26 de agosto de 2011 .
^ De Gryze, S .; Langhans, I .; Vandebroek, M. (2007). "Uso de los intervalos correctos para la predicción: un tutorial sobre los intervalos de tolerancia para la regresión de mínimos cuadrados ordinarios". Quimiometría y sistemas inteligentes de laboratorio . 87 (2): 147. doi : 10.1016 / j.chemolab.2007.03.002 .
↑ a b c Stephen B. Vardeman (1992). "¿Qué pasa con los otros intervalos?". El estadístico estadounidense . 46 (3): 193-197. doi : 10.2307 / 2685212 . JSTOR 2685212 .
↑ a b c Mark J. Nelson (14 de agosto de 2011). "Es posible que desee un intervalo de tolerancia" . Consultado el 26 de agosto de 2011 .
↑ a b K. Krishnamoorthy (2009). Regiones de tolerancia estadística: teoría, aplicaciones y cálculo . John Wiley e hijos. págs. 1–6. ISBN 978-0-470-38026-0.
↑ a b Derek S. Young (agosto de 2010). "tolerancia: un paquete R para estimar intervalos de tolerancia" . Revista de software estadístico . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 . , pág.23

Lectura adicional [ editar ]

Hahn, Gerald J .; Meeker, William Q .; Escobar, Luis A. (2017). Intervalos estadísticos: una guía para profesionales e investigadores (2ª ed.). John Wiley & Sons, Incorporated. ISBN 978-0-471-68717-7.

K. Krishnamoorthy (2009). Regiones de tolerancia estadística: teoría, aplicaciones y cálculo . John Wiley e hijos. ISBN 978-0-470-38026-0.; Cap. 1, "Preliminares", está disponible en http://media.wiley.com/product_data/excerpt/68/04703802/0470380268.pdf
Derek S. Young (agosto de 2010). "tolerancia: un paquete R para estimar intervalos de tolerancia" . Revista de software estadístico . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 .
ISO 16269-6, Interpretación estadística de datos, Parte 6: Determinación de intervalos de tolerancia estadística, Comité Técnico ISO / TC 69, Aplicaciones de métodos estadísticos. Disponible en http://standardsproposals.bsigroup.com/home/getpdf/458

[1] DS Young (2010), Reseñas de libros: "Regiones de tolerancia estadística: teoría, aplicaciones y computación", TECHNOMETRICS, FEBRERO DE 2010, VOL. 52, NO. 1, páginas 143-144.

[Krishnamoorthy2011-2] Krishnamoorthy, K. y Lian, Xiaodong (2011) 'Intervalos de tolerancia aproximados de forma cerrada para algunos modelos lineales generales y estudios de comparación', Journal of Statistical Computation and Simulation, Publicado por primera vez el: 13 de junio de 2011 doi : 10.1080 / 00949655.2010 .545061

[Ryan2007-3] Thomas P. Ryan (22 de junio de 2007). Estadísticas de ingeniería moderna . John Wiley e hijos. págs. 222–. ISBN 978-0-470-12843-5. Consultado el 22 de febrero de 2013 .

[4] "Interpretación estadística de datos - parte 6: determinación de intervalos de tolerancia estadística" . ISO 16269-6. 2014. p. 2.

[5] "Intervalos de tolerancia para una distribución normal" . Manual de estadísticas de ingeniería . NIST / Sematech. 2010 . Consultado el 26 de agosto de 2011 .

[Example2006-6] De Gryze, S .; Langhans, I .; Vandebroek, M. (2007). "Uso de los intervalos correctos para la predicción: un tutorial sobre los intervalos de tolerancia para la regresión de mínimos cuadrados ordinarios". Quimiometría y sistemas inteligentes de laboratorio . 87 (2): 147. doi : 10.1016 / j.chemolab.2007.03.002 .

[vardeman-7] Stephen B. Vardeman (1992). "¿Qué pasa con los otros intervalos?". El estadístico estadounidense . 46 (3): 193-197. doi : 10.2307 / 2685212 . JSTOR 2685212 .

[nelson-8] Mark J. Nelson (14 de agosto de 2011). "Es posible que desee un intervalo de tolerancia" . Consultado el 26 de agosto de 2011 .

[Krishnamoorthy-9] K. Krishnamoorthy (2009). Regiones de tolerancia estadística: teoría, aplicaciones y cálculo . John Wiley e hijos. págs. 1–6. ISBN 978-0-470-38026-0.

[Young-10] Derek S. Young (agosto de 2010). "tolerancia: un paquete R para estimar intervalos de tolerancia" . Revista de software estadístico . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 . , pág.23

[1]