La prueba de Brown-Forsythe es una prueba estadística para la igualdad de varianzas de grupo basada en la realización de un análisis de varianza (ANOVA) en una transformación de la variable de respuesta . Cuando se realiza un ANOVA unidireccional , se supone que las muestras se extrajeron de distribuciones con igual varianza . Si esta suposición no es válida, la prueba F resultante no es válida. El estadístico de la prueba de Brown-Forsythe es el estadístico F resultante de un análisis de varianza ordinario unidireccional de las desviaciones absolutas de los datos de los grupos o tratamientos de sus medianas individuales. [1]
Transformación
La variable de respuesta transformada se construye para medir la dispersión en cada grupo. Dejar
dónde es la mediana del grupo j . El estadístico de prueba de Brown-Forsythe es el estadístico F del modelo de un ANOVA de una vía en z ij :
donde p es el número de grupos, n j es el número de observaciones en el grupo j , y N es el número total de observaciones. También son los medios grupales del y es la media general de la . Esta estadística F sigue la distribución F con grados de libertad y bajo la hipótesis nula.
Si las variaciones son realmente heterogéneas, se pueden utilizar técnicas que lo permitan (como el ANOVA unidireccional de Welch ) en lugar del ANOVA habitual.
Good [1994, 2005], observando que las desviaciones son linealmente dependientes, ha modificado la prueba para eliminar las desviaciones redundantes.
Comparación con la prueba de Levene
La prueba de Levene usa la media en lugar de la mediana. Aunque la elección óptima depende de la distribución subyacente, se recomienda la definición basada en la mediana como la opción que proporciona una buena solidez frente a muchos tipos de datos no normales al tiempo que conserva un buen poder estadístico (Derrick et. Si uno tiene conocimiento de la distribución subyacente de los datos, esto puede indicar el uso de una de las otras opciones. Brown y Forsythe realizaron estudios de Monte Carlo que indicaron que el uso de la media recortada se desempeñó mejor cuando los datos subyacentes siguieron una distribución de Cauchy (una distribución de cola pesada ) y la mediana se desempeñó mejor cuando los datos subyacentes siguieron una distribución χ 2 con cuatro grados de libertad. (una distribución marcadamente sesgada ). El uso de la media proporcionó la mejor potencia para distribuciones simétricas de colas moderadas.
Ver también
- Prueba de Bartlett para varianzas desiguales, que se deriva de la prueba de razón de verosimilitud bajo la distribución normal.
Referencias
- ^ "función plot.hov | Documentación de R" . www.rdocumentation.org . DataCamp.
- Brown, Morton B .; Forsythe, Alan B. (1974). "Pruebas robustas para la igualdad de varianzas". Revista de la Asociación Estadounidense de Estadística . 69 : 364–367. doi : 10.1080 / 01621459.1974.10482955 . JSTOR 2285659 .
- Derrick, B; Ruck, A; Al rebaño; Blanco, P (2018). "Pruebas de igualdad de varianzas entre dos muestras que contienen observaciones pareadas y observaciones independientes" (PDF) . Revista de métodos cuantitativos aplicados . 13 (2): 36–47.
- Bueno, PI (2005). Pruebas de hipótesis de permutación, paramétricas y bootstrap (3ª ed.). Nueva York: Springer.
- O'Brien, RG (1978). "Técnicas robustas para probar la heterogeneidad de los efectos de la varianza en diseños factoriales". Psychometrika . 43 (3): 327. doi : 10.1007 / BF02293643 .
enlaces externos
Este artículo incorpora material de dominio público del sitio web del Instituto Nacional de Estándares y Tecnología https://www.nist.gov .