En estadística , uno de los propósitos del análisis de varianza (ANOVA) es analizar las diferencias de medias entre grupos. El estadístico de prueba, F , asume independencia de las observaciones, varianzas homogéneas y normalidad de la población . ANOVA en rangos es una estadística diseñada para situaciones en las que se ha violado el supuesto de normalidad.
Lógica de la prueba F sobre medias
El estadístico F es una razón de un numerador a un denominador. Considere sujetos seleccionados al azar que posteriormente se asignan al azar a los grupos A, B y C. Bajo la verdad de la hipótesis nula , la variabilidad (o suma de cuadrados) de las puntuaciones en alguna variable dependiente será la misma dentro de cada grupo. Cuando se divide por los grados de libertad (es decir, basado en el número de sujetos por grupo), se obtiene el denominador de la relación F.
Trate la media de cada grupo como un puntaje y calcule la variabilidad (nuevamente, la suma de cuadrados) de esos tres puntajes. Cuando se divide por sus grados de libertad (es decir, basado en el número de grupos), se obtiene el numerador de la razón F.
Bajo la verdad de la hipótesis nula, la distribución muestral de la razón F depende de los grados de libertad para el numerador y el denominador.
Modele un tratamiento aplicado al grupo A aumentando cada puntuación en X. (Este modelo mantiene el supuesto subyacente de varianzas homogéneas. En la práctica, es raro, si no imposible, que se produzca un aumento de X en la media de un grupo a través de un aumento de cada miembro puntúa por X.) Esto cambiará la distribución X unidades en la dirección positiva, pero no tendrá ningún impacto en la variabilidad dentro del grupo. Sin embargo, ahora aumentará la variabilidad entre las puntuaciones medias de los tres grupos. Si la relación F resultante eleva el valor a tal punto que excede el umbral de lo que constituye un evento raro (llamado nivel Alfa), se dice que la prueba Anova F rechaza la hipótesis nula de medias iguales entre los tres grupos, en a favor de la hipótesis alternativa de que al menos uno de los grupos tiene una media mayor (que en este ejemplo es el grupo A).
Manejo de la violación de la normalidad de la población
La clasificación es uno de los muchos procedimientos que se utilizan para transformar datos que no cumplen con los supuestos de normalidad . Conover e Iman proporcionaron una revisión de los cuatro tipos principales de transformaciones de rango (RT). [1] Un método reemplaza cada valor de datos original por su rango (desde 1 para el más pequeño hasta N para el más grande). Este procedimiento basado en rangos se ha recomendado por ser robusto a errores anormales, resistente a valores atípicos y altamente eficiente para muchas distribuciones. Puede dar como resultado una estadística conocida (p. Ej., En los resultados de clasificación del diseño de dos muestras independientes en la prueba de suma de rangos de Wilcoxon / U de Mann-Whitney ) y proporciona la robustez deseada y el aumento de la potencia estadística que se busca. Por ejemplo, los estudios de Monte Carlo han demostrado que la transformación de rango en el diseño de la prueba t de dos muestras independientes se puede extender con éxito al ANOVA de muestras independientes unidireccionales, así como a los diseños T 2 de Hotelling multivariados de dos muestras independientes [2] Comercial Se siguieron paquetes de software estadístico (por ejemplo, SAS) con recomendaciones a los analistas de datos para ejecutar sus conjuntos de datos a través de un procedimiento de clasificación (por ejemplo, PROC RANK) antes de realizar análisis estándar utilizando procedimientos paramétricos. [3] [4] [5]
Fallo de clasificación en el ANOVA factorial y otros diseños complejos
ANOVA en rangos significa que se calcula un análisis estándar de varianza sobre los datos transformados por rangos. También se ha sugerido la realización de ANOVA factorial en los rangos de las puntuaciones originales. [6] [7] [8] Sin embargo, los estudios de Monte Carlo, [9] [10] [11] [12] y los estudios asintóticos posteriores [13] [14] encontraron que la transformación de rango es inapropiada para probar los efectos de interacción en un 4x3 y un diseño factorial 2x2x2. A medida que el número de efectos (es decir, interacción principal) se vuelve no nulo, y a medida que aumenta la magnitud de los efectos no nulos, hay un aumento en el error de Tipo I , lo que resulta en una falla completa de la estadística con un valor tan alto como una probabilidad del 100% de tomar una decisión falsa positiva. De manera similar, se encontró que la transformación de rango falla cada vez más en el diseño de dos muestras dependientes a medida que aumenta la correlación entre las puntuaciones de la prueba previa y la prueba posterior. [15] También se descubrió que el problema de la tasa de error de tipo I se agravaba en el contexto del análisis de covarianza, en particular a medida que aumentaba la correlación entre la covariable y la variable dependiente. [dieciséis]
Transformando filas
Una variante de la transformación de rango es la 'normalización de cuantiles' en la que se aplica una transformación adicional a los rangos de modo que los valores resultantes tengan alguna distribución definida (a menudo una distribución normal con una media y varianza especificadas). Los análisis posteriores de datos normalizados por cuantiles pueden asumir entonces esa distribución para calcular los valores de significancia. Sin embargo, se ha demostrado que dos tipos específicos de transformaciones secundarias, las puntuaciones normales aleatorias y la transformación de puntuaciones normales esperadas, inflan en gran medida los errores de Tipo I y reducen gravemente el poder estadístico. [17]
Violar la homocedasticidad
El ANOVA sobre rangos nunca se ha recomendado cuando se ha violado el supuesto subyacente de varianzas homogéneas, ya sea por sí mismo o junto con una violación del supuesto de normalidad de la población. [ cita requerida ] En general, las estadísticas basadas en rangos se vuelven no robustas con respecto a los errores de Tipo I para las desviaciones de la homocedasticidad incluso más rápidamente que las contrapartes paramétricas que comparten la misma suposición. [ cita requerida ]
Más información
Kepner y Wackerly resumieron la literatura señalando que "a fines de la década de 1980, el volumen de literatura sobre los métodos de RT se expandía rápidamente a medida que se obtenían nuevos conocimientos, tanto positivos como negativos, con respecto a la utilidad del método. Preocupados por el uso indebido de los métodos de RT, Sawilowsky et al. (1989, p. 255) advirtieron a los médicos que eviten el uso de estas pruebas 'excepto en aquellas situaciones específicas donde las características de las pruebas se comprenden bien' ". [18] Según Hettmansperger y McKean, [19] "Sawilowsky (1990) [20] proporciona una excelente revisión de enfoques no paramétricos para probar la interacción" en ANOVA.
Notas
- ^ Conover, WJ; Iman, RL (1981). "Transformaciones de rango como puente entre estadísticas paramétricas y no paramétricas" . Estadístico estadounidense . 35 (3): 124-129. doi : 10.2307 / 2683975 . JSTOR 2683975 . Archivado desde el original el 2 de marzo de 2011.
- ^ Nanna, MJ (2002). "T 2 de Hoteling frente a la transformación de rango con datos Likert reales". Revista de métodos estadísticos aplicados modernos . 1 : 83–99.
- ^ Instituto SAS. (1985). Guía SAS / stat para computadoras personales (5ª ed.). Cary, NC: Autor.
- ^ Instituto SAS. (1987). Guía SAS / stat para computadoras personales (6ª ed.). Cary, NC: Autor.
- ^ * Instituto SAS. (2008). Guía del usuario de SAS / STAT 9.2: Introducción al análisis no paramétrico. Cary, Carolina del Norte. Autor.
- ^ Conover, WJ; Iman, RL (1976). "Sobre algunos procedimientos alternativos utilizando rangos para el análisis de diseños experimentales". Comunicaciones en estadística . A5 : 1349-1368.
- ^ Iman, RL (1974). "Un estudio de potencia de una transformación de rango para el modelo de clasificación bidireccional cuando las interacciones pueden estar presentes". Revista canadiense de estadísticas . 2 (2): 227–239. doi : 10.2307 / 3314695 . JSTOR 3314695 .
- ^ Iman, RL y Conover, WJ (1976). Una comparación de varias pruebas de rango para el diseño bidireccional (SAND76-0631). Albuquerque, NM: Sandia Laboratories.
- ^ Sawilowsky, S. (1985). Análisis robusto y poderoso del ANOVA 2x2x2, transformación de rango, puntuaciones normales aleatorias y pruebas de transformación de puntuaciones normales esperadas . Tesis doctoral inédita, Universidad del Sur de Florida.
- ^ Sawilowsky, S .; Blair, RC y Higgins, JJ (1989). "Una investigación del error tipo I y las propiedades de potencia del procedimiento de transformación de rango en ANOVA factorial". Revista de Estadísticas Educativas . 14 (3): 255-267. doi : 10.2307 / 1165018 . JSTOR 1165018 .
- ^ Blair, RC; Sawilowsky, SS y Higgins, JJ (1987). "Limitaciones de la transformación de rango en ANOVA factorial". Comunicaciones en estadística: cálculos y simulaciones . B16 : 1133–1145.
- ^ Sawilowsky, S. (1990). "Pruebas no paramétricas de interacción en diseño experimental". Revisión de la investigación educativa . 60 (1): 91-126. doi : 10.3102 / 00346543060001091 .
- ^ Thompson, GL (1991). "Una nota sobre la transformación de rango para interacciones". Biometrika . 78 (3): 697–701. doi : 10.1093 / biomet / 78.3.697 .
- ^ Thompson, GL; Ammann, LP (1989). "Eficiencias de la transformación de rango en modelos bidireccionales sin interacción". Revista de la Asociación Estadounidense de Estadística . 84 (405): 325–330. doi : 10.1080 / 01621459.1989.10478773 .
- ^ Blair, RC; Higgins, JJ (1985). "Una comparación de la potencia de la estadística de transformación de rango de muestras pareadas con la de la estadística de rangos firmados de Wilcoxon". Revista de estadísticas educativas y conductuales . 10 (4): 368–383. doi : 10.3102 / 10769986010004368 .
- ^ Headrick, TC (1997). Error de tipo I y potencia del análisis de covarianza de transformación de rango (ANCOVA) en un diseño factorial de 3 x 4 . Tesis doctoral inédita, Universidad del Sur de Florida.
- ^ Sawilowsky, S. (1985). "Una comparación de la prueba de puntuaciones normales aleatorias bajo las distribuciones F y Chi-cuadrado con la prueba ANOVA 2x2x2". Florida Journal of Educational Research . 27 : 83–97.
- ^ Kepner, JL, Wackerly, DD (1996). Técnicas de transformación de rango para diseños equilibrados de medidas repetidas incompletas. Revista de la Asociación Estadounidense de Estadística , 91 (436), 1619-1625
- ^ Hettmansperger, TP; McKean, JW (1998). Métodos estadísticos robustos no paramétricos . Biblioteca de estadísticas de Kendall. 5 (Primera ed.). Londres: Edward Arnold. págs. xiv + 467 págs. ISBN 0-340-54937-8. Señor 1604954 .
- ^ Sawilowsky, S. (1990). "Pruebas no paramétricas de interacción en diseño experimental". Revisión de la investigación educativa . 60 : 91-126. doi : 10.3102 / 00346543060001091 .