El método Newman-Keuls o Student-Newman-Keuls (SNK) es un procedimiento de comparaciones múltiples escalonadas que se utiliza para identificar medias muestrales que son significativamente diferentes entre sí. [1] Lleva el nombre de Student (1927), [2] D. Newman, [3] y M. Keuls. [4] Este procedimiento se utiliza a menudo como una prueba post-hoc siempre que un análisis de varianza (ANOVA) haya revelado una diferencia significativa entre tres o más medias de muestra . [1] El método Newman-Keuls es similar a Prueba de rango de Tukey, ya que ambos procedimientos utilizan estadísticas de rango studentizadas . [5] [6] A diferencia de la prueba de rango de Tukey, el método Newman-Keuls usa diferentes valores críticos para diferentes pares de comparaciones de medias. Por lo tanto, es más probable que el procedimiento revele diferencias significativas entre las medias de los grupos y cometa errores de tipo I al rechazar incorrectamente una hipótesis nula cuando es verdadera. En otras palabras, el procedimiento de Neuman-Keuls es más poderoso pero menos conservador que la prueba de rango de Tukey. [6] [7]
Historia
El método Newman-Keuls fue introducido por Newman en 1939 y desarrollado por Keuls en 1952. Esto antes de que Tukey presentara el concepto de diferentes tipos de tasas de error múltiples (1952a, [8] 1952b, [9] 1953 [10] ). El método Newman-Keuls fue popular durante las décadas de 1950 y 1960 [ cita requerida ] . Pero cuando el control de la tasa de error familiar (FWER) se convirtió en un criterio aceptado en las pruebas de comparación múltiple, el procedimiento se volvió menos popular [ cita requerida ] ya que no controla FWER (excepto en el caso especial de exactamente tres grupos [11] ). En 1995 Benjamini y Hochberg presentaron un criterio nuevo, más liberal y más poderoso para ese tipo de problemas: el control de la tasa de falsos descubrimientos (FDR). [12] En 2006, Shaffer demostró (mediante una simulación extensa) que el método Newman-Keuls controla el FDR con algunas limitaciones. [13]
Supuestos requeridos
Los supuestos de la prueba de Newman-Keuls son esencialmente los mismos que para una prueba t de grupos independientes : normalidad, homogeneidad de varianza y observaciones independientes. La prueba es bastante robusta a las violaciones de la normalidad. Violar la homogeneidad de la varianza puede ser más problemático que en el caso de dos muestras, ya que el MSE se basa en datos de todos los grupos. El supuesto de independencia de las observaciones es importante y no debe violarse.
Procedimientos
El método Newman-Keuls emplea un enfoque escalonado al comparar medias muestrales. [14] Antes de cualquier comparación de medias, todas las medias muestrales se ordenan por rango en orden ascendente o descendente, produciendo así un rango ordenado ( p ) de medias muestrales. [1] [14] Luego se hace una comparación entre las medias de muestra más grandes y más pequeñas dentro del rango más grande. [14] Suponiendo que el rango más grande es de cuatro medias ( op = 4), una diferencia significativa entre la media más grande y la más pequeña según lo revelado por el método Newman-Keuls daría como resultado un rechazo de la hipótesis nula para ese rango específico de medias. . La siguiente comparación más grande de dos medias muestrales se haría entonces dentro de un rango más pequeño de tres medias ( op = 3). A menos que no haya diferencias significativas entre dos medias de muestra dentro de un rango dado, esta comparación paso a paso de medias de muestra continuará hasta que se haga una comparación final con el rango más pequeño de solo dos medias. Si no hay una diferencia significativa entre las dos medias de la muestra, entonces se mantendrán todas las hipótesis nulas dentro de ese rango y no serán necesarias más comparaciones dentro de rangos más pequeños.
Valores medios | 2 | 4 | 6 | 8 |
---|---|---|---|---|
2 | 2 | 4 | 6 | |
4 | 2 | 4 | ||
6 | 2 |
Para determinar si hay una diferencia significativa entre dos medias con tamaños de muestra iguales, el método de Newman-Keuls utiliza una fórmula idéntica a la utilizada en la prueba de rango de Tukey , que calcula el valor q tomando la diferencia entre dos medias de muestra y dividiéndolo por el error estándar:
dónde representa el valor del rango estudentizado , y son las medias de muestra más grandes y más pequeñas dentro de un rango, es la varianza del error tomada de la tabla ANOVA, y es el tamaño de la muestra (número de observaciones dentro de una muestra). Si las comparaciones se realizan con medias de tamaños de muestra desiguales (), la fórmula de Newman-Keuls se ajustaría de la siguiente manera:
dónde y representar los tamaños de muestra de las dos medias muestrales. En ambos casos, el MSE (error cuadrático medio) se toma del ANOVA realizado en la primera etapa del análisis.
Una vez calculado, el valor q calculado se puede comparar con un valor crítico q (o), que se puede encontrar en una tabla de distribución q basada en el nivel de significancia (), los grados de libertad de error () de la tabla ANOVA, y el rango () de los medios de muestra a ensayar. [15] Si el valor q calculado es igual o mayor que el valor crítico q , entonces se puede rechazar la hipótesis nula ( H 0 : μ A = μ B ) para ese rango específico de medias. [15] Debido a que el número de medias dentro de un rango cambia con cada comparación sucesiva por pares, el valor crítico del estadístico q también cambia con cada comparación, lo que hace que el método de Neuman-Keuls sea más indulgente y, por lo tanto, más poderoso que la prueba de rango de Tukey. Por lo tanto, si se encontró que una comparación por pares es significativamente diferente usando el método de Newman-Keuls, no necesariamente será significativamente diferente cuando se analice con la prueba de rango de Tukey. [7] [15] Por el contrario, si se encontró que la comparación por pares no era significativamente diferente usando el método Newman-Keuls, no puede ser de ninguna manera significativamente diferente cuando se probó con la prueba de rango de Tukey. [7]
Limitaciones
El procedimiento de Newman-Keuls no puede producir un intervalo de confianza para cada diferencia de medias o para valores p exactos ajustados por multiplicidad debido a su naturaleza secuencial. [ cita requerida ] Los resultados son algo difíciles de interpretar ya que es difícil articular cuáles son las hipótesis nulas que se probaron. [ cita requerida ]
Ver también
- Varias comparaciones
- Análisis post hoc
- Prueba de rango de Tukey
Referencias
- ↑ a b c De Muth, James E. (2006). Estadística básica y aplicaciones estadísticas farmacéuticas (2ª ed.). Boca Raton, FL: Chapman y Hall / CRC. págs. 229-259. ISBN 978-0-8493-3799-4.
- ^ Estudiante (1927). "Errores de análisis de rutina". Biometrika . 19 (1/2): 151-164. doi : 10.2307 / 2332181 . JSTOR 2332181 .
- ^ Newman, D. (1939). "La distribución del rango en muestras de una población normal, expresada en términos de una estimación independiente de la desviación estándar". Biometrika . 31 (1): 20–30. doi : 10.1093 / biomet / 31.1-2.20 .
- ^ Keuls, M. (1952). "El uso del" rango studentizado "en relación con un análisis de varianza" (PDF) . Euphytica . 1 (2): 112–122. doi : 10.1007 / bf01908269 . Archivado desde el original (PDF) el 4 de noviembre de 2014.
- ^ Broota, KD (1989). Diseño experimental en la investigación conductual (1ª ed.). Nueva Delhi, India: New Age International (P) Ltd. págs. 81–96. ISBN 978-81-224-0215-5.
- ^ a b Sheskin, David J. (1989). Manual de procedimientos estadísticos paramétricos y no paramétricos (3ª ed.). Boca Raton, FL: CRC Press. págs. 665–756. ISBN 978-1-58488-440-8.
- ^ a b c Roberts, Maxwell; Russo, Riccardo (1999). "Seguimiento de un ANOVA de un factor entre sujetos". Una guía del estudiante para el análisis de la varianza . Filey, Reino Unido: J&L Composition Ltd. págs. 82–109. ISBN 978-0-415-16564-8.
- ^ Tukey, JW (1952a). "Hojas de recordatorio de asignaciones para varios tipos de tasas de error. Manuscrito inédito". Brown, 1984 .
- ^ Tukey, JW (1952b). "Hojas de recordatorio para comparaciones múltiples. Manuscrito inédito". Brown, 1984 .
- ^ Tukey, JW (1953). "El problema de las comparaciones múltiples. Manuscrito inédito". Brown, 1984 .
- ^ MA Seaman; JR Levin y RC Serlin (1991). "Nuevos desarrollos en comparaciones múltiples por pares: algunos procedimientos potentes y practicables". Boletín psicológico . 110 (3): 577–586. doi : 10.1037 / 0033-2909.110.3.577 .
- ^ Benjamini, Y., Hochberg, Y. (1995). "Controlar la tasa de falsos descubrimientos: un enfoque nuevo y poderoso para múltiples pruebas" (PDF) . Revista de la Royal Statistical Society. Serie B (Metodológica) . 57 (1): 289–300. doi : 10.1111 / j.2517-6161.1995.tb02031.x . JSTOR 2346101 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Shaffer, Juliet P (2007). "Control de la tasa de falsos descubrimientos con restricciones: la prueba de Newman-Keuls revisada". Revista biométrica . 49 (1): 136-143. doi : 10.1002 / bimj.200610297 . PMID 17342955 .
- ^ a b c Toothaker, Larry E. (1993). Procedimientos de comparación múltiple (aplicaciones cuantitativas en las ciencias sociales) (2ª ed.). Newburry Park, CA: Chapman y Hall / CRC. págs. 27–45. ISBN 978-0-8039-4177-9.
- ^ a b c Zar, Jerrold H. (1999). Análisis bioestadístico (4ª ed.). Newburry Park, CA: Prentice Hall. págs. 208–230. ISBN 978-0-13-081542-2.