La prueba de rango con signo de Wilcoxon es una prueba de hipótesis estadística no paramétrica que se utiliza para comparar dos muestras relacionadas, muestras emparejadas o mediciones repetidas en una sola muestra para evaluar si los rangos medios de su población difieren (es decir, es una prueba de diferencias pareadas ). Se puede utilizar como una alternativa a la emparejado de Student t -test (también conocido como " t -test de pares emparejados" o " t -test para muestras dependientes") cuando la distribución de la diferencia entre las medias de dos muestras no se puede suponer para ser distribuido normalmente . [1] Una prueba de rango con signo de Wilcoxon es una prueba no paramétrica que se puede utilizar para determinar si se seleccionaron dos muestras dependientes de poblaciones que tienen la misma distribución.
Historia
La prueba lleva el nombre de Frank Wilcoxon (1892-1965) quien, en un solo artículo, propuso tanto la prueba como la suma de rangos para dos muestras independientes (Wilcoxon, 1945). [2] La prueba fue popularizada por Sidney Siegel (1956) en su influyente libro de texto sobre estadística no paramétrica. [3] Siegel usó el símbolo T para un valor relacionado con, pero no el mismo,. En consecuencia, la prueba se refiere a veces como el Wilcoxon T prueba , y la prueba estadística se informa como un valor de t .
Supuestos
- Los datos están emparejados y provienen de la misma población.
- Cada par se elige al azar e independientemente [ cita requerida ] .
- Los datos se miden en al menos una escala de intervalo cuando, como es habitual, se calculan las diferencias dentro de los pares para realizar la prueba (aunque basta con que las comparaciones dentro de los pares estén en una escala ordinal ).
Procedimiento de prueba
Dejar sea el tamaño de la muestra, es decir, el número de pares. Por tanto, hay un total de 2N puntos de datos. Por parejas, dejar y denotar las medidas.
- H 0 : la diferencia entre los pares sigue una distribución simétrica alrededor de cero
- H 1 : la diferencia entre los pares no sigue una distribución simétrica alrededor de cero.
- Para , calcular y , dónde es la función de signo .
- Excluir pares con . Dejar ser el tamaño reducido de la muestra.
- Ordene el restante pares desde la diferencia absoluta más pequeña hasta la diferencia absoluta más grande, .
- Clasifique los pares, comenzando con el par con la menor diferencia absoluta distinta de cero como 1. Los lazos reciben un rango igual al promedio de los rangos que abarcan. Dejar denotar el rango.
- Calcular la estadística de prueba
- , la suma de las filas firmadas.
- Bajo hipótesis nula, sigue una distribución específica sin una expresión simple. Esta distribución tiene un valor esperado de 0 y una varianza de.
- se puede comparar con un valor crítico de una tabla de referencia. [4]
- La prueba de dos caras consiste en rechazar Si .
- Como aumenta, la distribución muestral de converge a una distribución normal. Por lo tanto,
- Para , una puntuación z se puede calcular como , dónde .
- Para realizar una prueba de dos caras, rechace Si .
- Alternativamente, las pruebas unilaterales se pueden realizar con la distribución exacta o aproximada. Los valores p también se pueden calcular.
- Para se debe utilizar la distribución exacta.
Ejemplo
| ordenar por diferencia absoluta |
|
es la función de signo ,es el valor absoluto , yes el rango . Observe que los pares 3 y 9 están empatados en valor absoluto. Estarían clasificados 1 y 2, por lo que cada uno obtiene el promedio de esos rangos, 1.5.
- [5]
- que la mediana de las diferencias por pares es diferente de cero.
- La -el valor de este resultado es
Estadístico T histórico
En fuentes históricas se utilizó una estadística diferente, denotada por Siegel como la estadística T. El estadístico T es la menor de las dos sumas de rangos de signo dado; en el ejemplo, por lo tanto, T sería igual a 3 + 4 + 5 + 6 = 18. Se requieren valores bajos de T para ser significativos. T es más fácil de calcular a mano que W y la prueba es equivalente a la prueba de dos caras descrita anteriormente; sin embargo, la distribución de la estadística bajo tiene que ser ajustado.
- que las dos medianas son iguales.
Nota: valores críticos de T () por valores de se puede encontrar en los apéndices de los libros de texto de estadística, por ejemplo, en la Tabla B-3 de Estadísticas no paramétricas: un enfoque paso a paso, segunda edición de Dale I. Foreman y Gregory W. Corder ( https://www.oreilly.com /library/view/nonparametric-statistics-a/9781118840429/bapp02.xhtml ).
Alternativamente, si n es suficientemente grande, la distribución de T bajo puede aproximarse mediante una distribución normal con media y varianza .
Limitación
Como se demuestra en el ejemplo, cuando la diferencia entre los grupos es cero, las observaciones se descartan. Esto es especialmente preocupante si las muestras se toman de una distribución discreta. En estos escenarios, la modificación de la prueba de Wilcoxon por Pratt 1959, proporciona una alternativa que incorpora las diferencias cero. [6] [7] Esta modificación es más sólida para datos en una escala ordinal. [7]
Tamaño del efecto
Para calcular un tamaño de efecto para la prueba de rango con signo, se puede usar la correlación de rango biserial .
Si la estadística de prueba W se informa, el rango de correlación r es igual a la estadística de prueba W dividido por la suma total Posición S , o r = W / S . [8] Usando el ejemplo anterior, la estadística de prueba es W = 9. El tamaño de muestra de 9 tiene una suma de rango total de S = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) = 45 Por tanto, la correlación de rango es 9/45, por lo que r = 0,20.
Si se informa el estadístico de prueba T , una forma equivalente de calcular la correlación de rango es con la diferencia en la proporción entre las dos sumas de rango, que es la fórmula de diferencia simple de Kerby (2014). [8] Para continuar con el ejemplo actual, el tamaño de la muestra es 9, por lo que la suma de rango total es 45. T es la menor de las dos sumas de rango, por lo que T es 3 + 4 + 5 + 6 = 18. A partir de esta información solo, la suma de rango restante se puede calcular, porque es la suma total S menos T , o en este caso 45 - 18 = 27. A continuación, las dos proporciones de suma de rango son 27/45 = 60% y 18/45 = 40%. Finalmente, la correlación de rango es la diferencia entre las dos proporciones (.60 menos .40), por lo tanto, r = .20.
Implementaciones de software
- R incluye una implementación de la prueba como
wilcox.test(x,y, paired=TRUE)
, donde xey son vectores de igual longitud. [9] - ALGLIB incluye la implementación de la prueba de rango con signo de Wilcoxon en C ++, C #, Delphi, Visual Basic, etc.
- GNU Octave implementa varias versiones de una y dos colas de la prueba en la
wilcoxon_test
función. - SciPy incluye una implementación de la prueba de rango con signo de Wilcoxon en Python
- Accord.NET incluye una implementación de la prueba de rango con signo de Wilcoxon en C # para aplicaciones .NET
- MATLAB implementa esta prueba usando la "prueba de suma de rangos de Wilcoxon" ya que [p, h] = signrank (x, y) también devuelve un valor lógico que indica la decisión de la prueba. El resultado h = 1 indica un rechazo de la hipótesis nula, y h = 0 indica que no se rechazó la hipótesis nula al nivel de significancia del 5%.
- El paquete Julia HypothesisTests incluye la prueba de rango con signo de Wilcoxon como "valor (SignedRankTest (x, y))"
Ver también
- Prueba de Mann-Whitney-Wilcoxon (la variante para dos muestras independientes)
- Prueba de signos (como la prueba de Wilcoxon, pero sin el supuesto de distribución simétrica de las diferencias alrededor de la mediana y sin usar la magnitud de la diferencia)
Referencias
- ^ "Prueba t emparejada - Manual de estadísticas biológicas" . www.biostathandbook.com . Consultado el 18 de noviembre de 2019 .
- ^ Wilcoxon, Frank (diciembre de 1945). "Comparaciones individuales por métodos de clasificación" (PDF) . Boletín de biometría . 1 (6): 80–83. doi : 10.2307 / 3001968 . hdl : 10338.dmlcz / 135688 . JSTOR 3001968 .
- ^ Siegel, Sidney (1956). Estadística no paramétrica para las ciencias del comportamiento . Nueva York: McGraw-Hill. págs. 75–83. ISBN 9780070573482.
- ^ Lowry, Richard. "Conceptos y aplicaciones de la estadística inferencial" . Consultado el 5 de noviembre de 2018 .
- ^ Lowry, Richard. "Conceptos y aplicaciones de la estadística inferencial" . Consultado el 17 de diciembre de 2020 .
- ^ Pratt, J (1959). "Comentarios sobre ceros y empates en los procedimientos de rango firmado de Wilcoxon". Revista de la Asociación Estadounidense de Estadística . 54 (287): 655–667. doi : 10.1080 / 01621459.1959.10501526 .
- ^ a b Derrick, B; Blanco, P (2017). "Comparación de dos muestras de una pregunta individual de Likert". Revista Internacional de Matemáticas y Estadística . 18 (3): 1–13.
- ^ a b Kerby, Dave S. (2014), "La fórmula de la diferencia simple: un enfoque para enseñar la correlación no paramétrica.", Psicología integral , 3 : 11.IT.3.1, doi : 10.2466 / 11.IT.3.1
- ^ Dalgaard, Peter (2008). Introducción a la Estadística con R . Springer Science & Business Media. págs. 99–100. ISBN 978-0-387-79053-4.
enlaces externos
- Prueba de rango con signo de Wilcoxon en R
- Ejemplo de uso de la prueba de rango con signo de Wilcoxon
- Una versión en línea de la prueba.
- Una tabla de valores críticos para la prueba de rango con signo de Wilcoxon
- Breve guía del psicólogo experimental Karl L. Weunsch - Estimadores no paramétricos del tamaño del efecto (Copyright 2015 de Karl L. Weunsch)
- Kerby, DS (2014). La fórmula de la diferencia simple: un enfoque para enseñar la correlación no paramétrica. Psicología Integral , volumen 3, artículo 1. doi: 10.2466 / 11.IT.3.1. enlace al artículo