Prueba de rango con signo de Wilcoxon

La prueba de rango con signo de Wilcoxon es una prueba de hipótesis estadística no paramétrica que se utiliza para comparar dos muestras relacionadas, muestras emparejadas o mediciones repetidas en una sola muestra para evaluar si los rangos medios de su población difieren (es decir, es una prueba de diferencias pareadas ). Se puede utilizar como una alternativa a la emparejado de Student t -test (también conocido como " t -test de pares emparejados" o " t -test para muestras dependientes") cuando la distribución de la diferencia entre las medias de dos muestras no se puede suponer para ser distribuido normalmente . ^[1] Una prueba de rango con signo de Wilcoxon es una prueba no paramétrica que se puede utilizar para determinar si se seleccionaron dos muestras dependientes de poblaciones que tienen la misma distribución.

Historia

La prueba lleva el nombre de Frank Wilcoxon (1892-1965) quien, en un solo artículo, propuso tanto la prueba como la suma de rangos para dos muestras independientes (Wilcoxon, 1945). ^[2] La prueba fue popularizada por Sidney Siegel (1956) en su influyente libro de texto sobre estadística no paramétrica. ^[3] Siegel usó el símbolo T para un valor relacionado con, pero no el mismo, ${\ Displaystyle W}$ . En consecuencia, la prueba se refiere a veces como el Wilcoxon T prueba , y la prueba estadística se informa como un valor de t .

Supuestos

Los datos están emparejados y provienen de la misma población.
Cada par se elige al azar e independientemente ^{[ cita requerida ]} .
Los datos se miden en al menos una escala de intervalo cuando, como es habitual, se calculan las diferencias dentro de los pares para realizar la prueba (aunque basta con que las comparaciones dentro de los pares estén en una escala ordinal ).

Procedimiento de prueba

Dejar ${\ Displaystyle N}$ sea el tamaño de la muestra, es decir, el número de pares. Por tanto, hay un total de 2N puntos de datos. Por parejas ${\ Displaystyle i = 1, ..., N}$ , dejar ${\ Displaystyle x_ {1, i}}$ y ${\ Displaystyle x_ {2, i}}$ denotar las medidas.

H ₀ : la diferencia entre los pares sigue una distribución simétrica alrededor de cero

H ₁ : la diferencia entre los pares no sigue una distribución simétrica alrededor de cero.

Para ${\ Displaystyle i = 1, ..., N}$ , calcular ${\ Displaystyle | x_ {2, i} -x_ {1, i} |}$ y ${\ Displaystyle \ operatorname {sgn} (x_ {2, i} -x_ {1, i})}$ , dónde ${\ Displaystyle \ operatorname {sgn}}$ es la función de signo .
Excluir pares con ${\ Displaystyle | x_ {2, i} -x_ {1, i} | = 0}$ . Dejar ${\ Displaystyle N_ {r}}$ ser el tamaño reducido de la muestra.
Ordene el restante ${\ Displaystyle N_ {r}}$ pares desde la diferencia absoluta más pequeña hasta la diferencia absoluta más grande, ${\ Displaystyle | x_ {2, i} -x_ {1, i} |}$ .
Clasifique los pares, comenzando con el par con la menor diferencia absoluta distinta de cero como 1. Los lazos reciben un rango igual al promedio de los rangos que abarcan. Dejar ${\ Displaystyle R_ {i}}$ denotar el rango.
Calcular la estadística de prueba ${\ Displaystyle W}$
${\ Displaystyle W = \ sum _ {i = 1} ^ {N_ {r}} [\ operatorname {sgn} (x_ {2, i} -x_ {1, i}) \ cdot R_ {i}]}$ , la suma de las filas firmadas.
Bajo hipótesis nula, ${\ Displaystyle W}$ sigue una distribución específica sin una expresión simple. Esta distribución tiene un valor esperado de 0 y una varianza de ${\ Displaystyle {\ frac {N_ {r} (N_ {r} +1) (2N_ {r} +1)} {6}}}$ .
${\ Displaystyle W}$ se puede comparar con un valor crítico de una tabla de referencia. ^[4]
La prueba de dos caras consiste en rechazar ${\ Displaystyle H_ {0}}$ Si ${\ Displaystyle | W |> W_ {crítico, N_ {r}}}$ .
Como ${\ Displaystyle N_ {r}}$ aumenta, la distribución muestral de ${\ Displaystyle W}$ converge a una distribución normal. Por lo tanto,
Para ${\ Displaystyle N_ {r} \ geq 20}$ , una puntuación z se puede calcular como ${\ Displaystyle z = {\ frac {W} {\ sigma _ {W}}}}$ , dónde ${\ Displaystyle \ sigma _ {W} = {\ sqrt {\ frac {N_ {r} (N_ {r} +1) (2N_ {r} +1)} {6}}}}$ .
Para realizar una prueba de dos caras, rechace ${\ Displaystyle H_ {0}}$ Si ${\ Displaystyle | z |> z_ {crítico}}$ .
Alternativamente, las pruebas unilaterales se pueden realizar con la distribución exacta o aproximada. Los valores p también se pueden calcular.
Para ${\ Displaystyle N_ {r} <20}$ se debe utilizar la distribución exacta.

Ejemplo

${\ Displaystyle i}$	${\ Displaystyle x_ {2, i}}$	${\ Displaystyle x_ {1, i}}$	${\ Displaystyle x_ {2, i} -x_ {1, i}}$
${\ Displaystyle i}$	${\ Displaystyle x_ {2, i}}$	${\ Displaystyle x_ {1, i}}$	${\ Displaystyle \ operatorname {sgn}}$	${\ Displaystyle {\ text {abs}}}$
1	125	110	1	15
2	115	122	–1	7
3	130	125	1	5
4	140	120	1	20
5	140	140		0
6	115	124	–1	9
7	140	123	1	17
8	125	137	–1	12
9	140	135	1	5
10	135	145	–1	10

ordenar por diferencia absoluta

${\ Displaystyle i}$	${\ Displaystyle x_ {2, i}}$	${\ Displaystyle x_ {1, i}}$	${\ Displaystyle x_ {2, i} -x_ {1, i}}$
${\ Displaystyle i}$	${\ Displaystyle x_ {2, i}}$	${\ Displaystyle x_ {1, i}}$	${\ Displaystyle \ operatorname {sgn}}$	${\ Displaystyle {\ text {abs}}}$	${\ Displaystyle R_ {i}}$	${\ Displaystyle \ operatorname {sgn} \ cdot R_ {i}}$
5	140	140		0
3	130	125	1	5	1,5	1,5
9	140	135	1	5	1,5	1,5
2	115	122	–1	7	3	–3
6	115	124	–1	9	4	–4
10	135	145	–1	10	5	–5
8	125	137	–1	12	6	–6
1	125	110	1	15	7	7
7	140	123	1	17	8	8
4	140	120	1	20	9	9

${\ Displaystyle \ operatorname {sgn}}$ es la función de signo , ${\ Displaystyle {\ text {abs}}}$ es el valor absoluto , y ${\ Displaystyle R_ {i}}$ es el rango . Observe que los pares 3 y 9 están empatados en valor absoluto. Estarían clasificados 1 y 2, por lo que cada uno obtiene el promedio de esos rangos, 1.5.

{\ Displaystyle W = 1,5 + 1,5-3-4-5-6 + 7 + 8 + 9 = 9}

{\ Displaystyle | W |

^[5]

{\ displaystyle \ por lo tanto {\ text {no se pudo rechazar}} H_ {0}}

que la mediana de las diferencias por pares es diferente de cero.

La

{\ Displaystyle p}

-el valor de este resultado es

{\ Displaystyle 0.6113}

Estadístico T histórico

En fuentes históricas se utilizó una estadística diferente, denotada por Siegel como la estadística T. El estadístico T es la menor de las dos sumas de rangos de signo dado; en el ejemplo, por lo tanto, T sería igual a 3 + 4 + 5 + 6 = 18. Se requieren valores bajos de T para ser significativos. T es más fácil de calcular a mano que W y la prueba es equivalente a la prueba de dos caras descrita anteriormente; sin embargo, la distribución de la estadística bajo ${\ Displaystyle H_ {0}}$ tiene que ser ajustado.

{\ Displaystyle T> T _ {\ operatorname {crit} (\ alpha = 0.05, \ 9 {\ text {, dos caras}})} = 5}

{\ displaystyle \ por lo tanto {\ text {no se pudo rechazar}} H_ {0}}

que las dos medianas son iguales.

Nota: valores críticos de T ( ${\ displaystyle T _ {\ operatorname {crit}}}$ ) por valores de ${\ Displaystyle N_ {r}}$ se puede encontrar en los apéndices de los libros de texto de estadística, por ejemplo, en la Tabla B-3 de Estadísticas no paramétricas: un enfoque paso a paso, segunda edición de Dale I. Foreman y Gregory W. Corder ( https://www.oreilly.com /library/view/nonparametric-statistics-a/9781118840429/bapp02.xhtml ).

Alternativamente, si n es suficientemente grande, la distribución de T bajo ${\ Displaystyle H_ {0}}$ puede aproximarse mediante una distribución normal con media ${\ Displaystyle {\ frac {n (n + 1)} {4}}}$ y varianza ${\ Displaystyle {\ frac {n (n + 1) (2n + 1)} {24}}}$ .

Limitación

Como se demuestra en el ejemplo, cuando la diferencia entre los grupos es cero, las observaciones se descartan. Esto es especialmente preocupante si las muestras se toman de una distribución discreta. En estos escenarios, la modificación de la prueba de Wilcoxon por Pratt 1959, proporciona una alternativa que incorpora las diferencias cero. ^[6]^[7] Esta modificación es más sólida para datos en una escala ordinal. ^[7]

Tamaño del efecto

Para calcular un tamaño de efecto para la prueba de rango con signo, se puede usar la correlación de rango biserial .

Si la estadística de prueba W se informa, el rango de correlación r es igual a la estadística de prueba W dividido por la suma total Posición S , o r = W / S . ^[8] Usando el ejemplo anterior, la estadística de prueba es W = 9. El tamaño de muestra de 9 tiene una suma de rango total de S = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) = 45 Por tanto, la correlación de rango es 9/45, por lo que r = 0,20.

Si se informa el estadístico de prueba T , una forma equivalente de calcular la correlación de rango es con la diferencia en la proporción entre las dos sumas de rango, que es la fórmula de diferencia simple de Kerby (2014). ^[8] Para continuar con el ejemplo actual, el tamaño de la muestra es 9, por lo que la suma de rango total es 45. T es la menor de las dos sumas de rango, por lo que T es 3 + 4 + 5 + 6 = 18. A partir de esta información solo, la suma de rango restante se puede calcular, porque es la suma total S menos T , o en este caso 45 - 18 = 27. A continuación, las dos proporciones de suma de rango son 27/45 = 60% y 18/45 = 40%. Finalmente, la correlación de rango es la diferencia entre las dos proporciones (.60 menos .40), por lo tanto, r = .20.

Implementaciones de software

R incluye una implementación de la prueba como wilcox.test(x,y, paired=TRUE), donde xey son vectores de igual longitud. ^[9]
ALGLIB incluye la implementación de la prueba de rango con signo de Wilcoxon en C ++, C #, Delphi, Visual Basic, etc.
GNU Octave implementa varias versiones de una y dos colas de la prueba en la wilcoxon_testfunción.
SciPy incluye una implementación de la prueba de rango con signo de Wilcoxon en Python
Accord.NET incluye una implementación de la prueba de rango con signo de Wilcoxon en C # para aplicaciones .NET
MATLAB implementa esta prueba usando la "prueba de suma de rangos de Wilcoxon" ya que [p, h] = signrank (x, y) también devuelve un valor lógico que indica la decisión de la prueba. El resultado h = 1 indica un rechazo de la hipótesis nula, y h = 0 indica que no se rechazó la hipótesis nula al nivel de significancia del 5%.
El paquete Julia HypothesisTests incluye la prueba de rango con signo de Wilcoxon como "valor (SignedRankTest (x, y))"

Ver también

Prueba de Mann-Whitney-Wilcoxon (la variante para dos muestras independientes)
Prueba de signos (como la prueba de Wilcoxon, pero sin el supuesto de distribución simétrica de las diferencias alrededor de la mediana y sin usar la magnitud de la diferencia)

Referencias

^ "Prueba t emparejada - Manual de estadísticas biológicas" . www.biostathandbook.com . Consultado el 18 de noviembre de 2019 .
^ Wilcoxon, Frank (diciembre de 1945). "Comparaciones individuales por métodos de clasificación" (PDF) . Boletín de biometría . 1 (6): 80–83. doi : 10.2307 / 3001968 . hdl : 10338.dmlcz / 135688 . JSTOR 3001968 .
^ Siegel, Sidney (1956). Estadística no paramétrica para las ciencias del comportamiento . Nueva York: McGraw-Hill. págs. 75–83. ISBN 9780070573482.
^ Lowry, Richard. "Conceptos y aplicaciones de la estadística inferencial" . Consultado el 5 de noviembre de 2018 .
^ Lowry, Richard. "Conceptos y aplicaciones de la estadística inferencial" . Consultado el 17 de diciembre de 2020 .
^ Pratt, J (1959). "Comentarios sobre ceros y empates en los procedimientos de rango firmado de Wilcoxon". Revista de la Asociación Estadounidense de Estadística . 54 (287): 655–667. doi : 10.1080 / 01621459.1959.10501526 .
^ a b Derrick, B; Blanco, P (2017). "Comparación de dos muestras de una pregunta individual de Likert". Revista Internacional de Matemáticas y Estadística . 18 (3): 1–13.
^ a b Kerby, Dave S. (2014), "La fórmula de la diferencia simple: un enfoque para enseñar la correlación no paramétrica.", Psicología integral , 3 : 11.IT.3.1, doi : 10.2466 / 11.IT.3.1
^ Dalgaard, Peter (2008). Introducción a la Estadística con R . Springer Science & Business Media. págs. 99–100. ISBN 978-0-387-79053-4.

enlaces externos

Prueba de rango con signo de Wilcoxon en R
Ejemplo de uso de la prueba de rango con signo de Wilcoxon
Una versión en línea de la prueba.
Una tabla de valores críticos para la prueba de rango con signo de Wilcoxon
Breve guía del psicólogo experimental Karl L. Weunsch - Estimadores no paramétricos del tamaño del efecto (Copyright 2015 de Karl L. Weunsch)
Kerby, DS (2014). La fórmula de la diferencia simple: un enfoque para enseñar la correlación no paramétrica. Psicología Integral , volumen 3, artículo 1. doi: 10.2466 / 11.IT.3.1. enlace al artículo

[1] "Prueba t emparejada - Manual de estadísticas biológicas" . www.biostathandbook.com . Consultado el 18 de noviembre de 2019 .

[2] Wilcoxon, Frank (diciembre de 1945). "Comparaciones individuales por métodos de clasificación" (PDF) . Boletín de biometría . 1 (6): 80–83. doi : 10.2307 / 3001968 . hdl : 10338.dmlcz / 135688 . JSTOR 3001968 .

[3] Siegel, Sidney (1956). Estadística no paramétrica para las ciencias del comportamiento . Nueva York: McGraw-Hill. págs. 75–83. ISBN 9780070573482.

[lowry-4] Lowry, Richard. "Conceptos y aplicaciones de la estadística inferencial" . Consultado el 5 de noviembre de 2018 .

[5] Lowry, Richard. "Conceptos y aplicaciones de la estadística inferencial" . Consultado el 17 de diciembre de 2020 .

[Pratt-6] Pratt, J (1959). "Comentarios sobre ceros y empates en los procedimientos de rango firmado de Wilcoxon". Revista de la Asociación Estadounidense de Estadística . 54 (287): 655–667. doi : 10.1080 / 01621459.1959.10501526 .

[IndivLikert-7] Derrick, B; Blanco, P (2017). "Comparación de dos muestras de una pregunta individual de Likert". Revista Internacional de Matemáticas y Estadística . 18 (3): 1–13.

[Kerby2014-8] Kerby, Dave S. (2014), "La fórmula de la diferencia simple: un enfoque para enseñar la correlación no paramétrica.", Psicología integral , 3 : 11.IT.3.1, doi : 10.2466 / 11.IT.3.1

[9] Dalgaard, Peter (2008). Introducción a la Estadística con R . Springer Science & Business Media. págs. 99–100. ISBN 978-0-387-79053-4.

[1]