En estadística, la prueba de Grubbs o la prueba de Grubbs (llamada así en honor a Frank E. Grubbs , quien publicó la prueba en 1950 [1] ), también conocida como prueba residual máxima normalizada o prueba de desviación extrema studentizada , es una prueba utilizada para detectar valores atípicos en un conjunto de datos univariados que se supone que proviene de una población distribuida normalmente .
Definición
La prueba de Grubbs se basa en el supuesto de normalidad . Es decir, primero se debe verificar que los datos puedan aproximarse razonablemente mediante una distribución normal antes de aplicar la prueba de Grubbs. [2]
La prueba de Grubbs detecta un valor atípico a la vez. Este valor atípico se elimina del conjunto de datos y la prueba se repite hasta que no se detectan valores atípicos. Sin embargo, múltiples iteraciones cambian las probabilidades de detección, y la prueba no debe usarse para tamaños de muestra de seis o menos, ya que con frecuencia etiqueta la mayoría de los puntos como valores atípicos. [3]
La prueba de Grubbs se define para la hipótesis :
- H 0 : no hay valores atípicos en el conjunto de datos
- H a : hay exactamente un valor atípico en el conjunto de datos
La estadística de prueba de Grubbs se define como:
con y que denota la media muestral y la desviación estándar , respectivamente. El estadístico de la prueba de Grubbs es la mayor desviación absoluta de la media de la muestra en unidades de la desviación estándar de la muestra.
Esta es la prueba de dos caras , para la cual la hipótesis de no valores atípicos se rechaza en el nivel de significancia α si
con t α / (2 N ), N −2 denota el valor crítico superior de la distribución t con N - 2 grados de libertad y un nivel de significancia de α / (2 N ).
Estuche de una cara
La prueba de Grubbs también se puede definir como una prueba de un solo lado, en sustitución de α / (2 N ) con α / N . Para probar si el valor mínimo es un valor atípico, la estadística de prueba es
con Y min denotando el valor mínimo. Para probar si el valor máximo es un valor atípico, la estadística de prueba es
con Y max denotando el valor máximo.
Técnicas relacionadas
Varias técnicas gráficas pueden y deben usarse para detectar valores atípicos. Un diagrama de secuencia de ejecución simple , un diagrama de caja o un histograma deben mostrar cualquier punto obviamente periférico. También puede resultar útil una gráfica de probabilidad normal .
Ver también
Referencias
- ^ Grubbs, Frank E. (1950). "Criterios de muestra para probar observaciones atípicas" . Anales de estadística matemática . 21 (1): 27–58. doi : 10.1214 / aoms / 1177729885 .
- ^ Citado del Manual de ingeniería y estadística , párrafo 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
- ^ Adikaram, KKLB; Hussein, MA; Effenberger, M .; Becker, T. (14 de enero de 2015). "Técnica de transformación de datos para mejorar el poder de detección de valores atípicos de la prueba de Grubbs para los datos que se espera que sigan la relación lineal" . Revista de Matemáticas Aplicadas . doi : 10.1155 / 2015/708948 . Consultado el 3 de febrero de 2021 .
Otras lecturas
- Grubbs, Frank (febrero de 1969). "Procedimientos para la detección de observaciones atípicas en muestras". Tecnometría . Technometrics, vol. 11, núm. 1. 11 (1): 1–21. doi : 10.2307 / 1266761 . JSTOR 1266761 .
- Stefansky, W. (1972). "Rechazo de valores atípicos en diseños factoriales". Tecnometría . Technometrics, vol. 14, núm. 2. 14 (2): 469–479. doi : 10.2307 / 1267436 . JSTOR 1267436 .
Este artículo incorpora material de dominio público del sitio web del Instituto Nacional de Estándares y Tecnología https://www.nist.gov .