W de Kendall

La W de Kendall (también conocida como coeficiente de concordancia de Kendall ) es una estadística no paramétrica . Es una normalización de la estadística de la prueba de Friedman y se puede utilizar para evaluar la concordancia entre los evaluadores. La W de Kendall varía de 0 (sin acuerdo) a 1 (acuerdo completo).

Supongamos, por ejemplo, que se ha pedido a varias personas que clasifiquen una lista de preocupaciones políticas, de la más importante a la menos importante. La W de Kendall se puede calcular a partir de estos datos. Si la estadística de prueba W es 1, entonces todos los encuestados han sido unánimes y cada encuestado ha asignado el mismo orden a la lista de preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre las distintas respuestas.

Mientras que las pruebas que utilizan el coeficiente de correlación estándar de Pearson asumen valores distribuidos normalmente y comparan dos secuencias de resultados a la vez, la W de Kendall no hace suposiciones sobre la naturaleza de la distribución de probabilidad y puede manejar cualquier número de resultados distintos.

Definición

Suponga que el juez número j le da al objeto i el rango r _i, j , donde hay en total n objetos y m jueces. Entonces el rango total dado al objeto i es

{\ Displaystyle R_ {i} = \ sum _ {j = 1} ^ {m} r_ {i, j},}

y el valor medio de estos rangos totales es

{\ Displaystyle {\ bar {R}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} R_ {i}.}

La suma de las desviaciones al cuadrado, S , se define como

{\ Displaystyle S = \ sum _ {i = 1} ^ {n} (R_ {i} - {\ bar {R}}) ^ {2},}

y luego la W de Kendall se define como ^[1]

{\ Displaystyle W = {\ frac {12S} {m ^ {2} (n ^ {3} -n)}}.}

Si la estadística de la prueba W es 1, entonces todos los jueces o encuestados han sido unánimes y cada juez o encuestado ha asignado el mismo orden a la lista de objetos o preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre los distintos jueces o encuestados.

Kendall y Gibbons (1990) también muestran que W está relacionado linealmente con el valor medio de los coeficientes de correlación de rango de Spearman entre todos ${\ Displaystyle m \ elige {2}}$ posibles pares de clasificaciones entre jueces

{\ Displaystyle {\ bar {r}} _ {s} = {\ frac {mW-1} {m-1}}}

Bloques incompletos

Cuando los jueces evalúan solo algún subconjunto de los n objetos, y cuando el diseño de bloque correspondiente es un diseño (n, m, r, p, λ) (observe la notación diferente) . En otras palabras, cuando

cada juez clasifica el mismo número p de objetos para algunos ${\ Displaystyle p }>$ ,
cada objeto se clasifica exactamente el mismo número total r de veces,
y cada par de objetos se presenta junto a algún juez un total de exactamente λ veces, ${\ Displaystyle \ lambda \ geq 1}$ , una constante para todos los pares.

Entonces la W de Kendall se define como ^[2]

{\ Displaystyle W = {\ frac {12 \ sum _ {i = 1} ^ {n} (R_ {i} ^ {2}) - 3r ^ {2} n \ left (p + 1 \ right) ^ { 2}} {\ lambda ^ {2} n (n ^ {2} -1)}}.}

Si ${\ Displaystyle p = n}$ y ${\ Displaystyle \ lambda = r = m}$ para que cada juez clasifique todos los n objetos, la fórmula anterior es equivalente a la original.

Corrección de lazos

Cuando ocurren valores empatados, a cada uno se le da el promedio de los rangos que se habrían dado si no hubiera habido empates. Por ejemplo, el conjunto de datos {80,76,34,80,73,80} tiene valores de 80 empatados en el 4º, 5º y 6º lugar; dado que la media de {4,5,6} = 5, los rangos se asignarían a los valores de datos sin procesar de la siguiente manera: {5,3,1,5,2,5}.

El efecto de las ataduras es reducir el valor de W ; sin embargo, este efecto es pequeño a menos que exista una gran cantidad de vínculos. Para corregir los empates, asigne rangos a los valores empatados como se indicó anteriormente y calcule los factores de corrección

{\ Displaystyle T_ {j} = \ sum _ {i = 1} ^ {g_ {j}} (t_ {i} ^ {3} -t_ {i}),}

donde t _i es el número de rangos empatados en el i- ésimo grupo de rangos empatados, (donde un grupo es un conjunto de valores que tienen un rango constante (empatado)) yg _j es el número de grupos de empates en el conjunto de rangos (de 1 an ) para el juez j . Por tanto, T _j es el factor de corrección requerido para el conjunto de rangos del juez j , es decir, el j- ésimo conjunto de rangos. Tenga en cuenta que si no hay rangos empatados para el juez j , T _j es igual a 0.

Con la corrección por empates, la fórmula para W se convierte en

{\ Displaystyle W = {\ frac {12 \ sum _ {i = 1} ^ {n} (R_ {i} ^ {2}) - 3 m ^ {2} n (n + 1) ^ {2}} { m ^ {2} n (n ^ {2} -1) -m \ sum _ {j = 1} ^ {m} (T_ {j})}},}

donde R _i es la suma de los rangos del objeto i , y ${\ Displaystyle \ sum _ {j = 1} ^ {m} (T_ {j})}$ es la suma de los valores de T _j sobre todos los m conjuntos de rangos. ^[3]

Pruebas de significación

En el caso de rangos completos, Kendall y Gibbons (1990) dan una prueba de significación comúnmente utilizada para W contra una hipótesis nula de no concordancia (es decir, clasificaciones aleatorias) ^[4].

{\ Displaystyle \ chi ^ {2} = m (n-1) W}

Donde el estadístico de prueba toma una distribución chi-cuadrado con ${\ Displaystyle df = n-1}$ grados de libertad.

En el caso de clasificaciones incompletas (ver arriba), esto se convierte en

{\ Displaystyle \ chi ^ {2} = {\ frac {\ lambda (n ^ {2} -1)} {k + 1}} W}

Donde de nuevo, hay ${\ Displaystyle df = n-1}$ grados de libertad.

Legendre ^[5] comparó mediante simulación el poder de los enfoques de prueba de chi-cuadrado y permutación para determinar la importancia de la W de Kendall . Los resultados indicaron que el método de chi-cuadrado era demasiado conservador en comparación con una prueba de permutación cuando ${\ Displaystyle m <20}$ . Marozzi ^[6] amplió esto al considerar también la prueba F , como se propuso en la publicación original que presenta la estadística W de Kendall & Babington Smith (1939):

{\ Displaystyle F = {\ frac {W (m-1)} {1-W}}}

Donde el estadístico de prueba sigue una distribución F con ${\ Displaystyle v_ {1} = n-1- (2 / m)}$ y ${\ Displaystyle v_ {2} = (m-1) v_ {1}}$ grados de libertad. Marozzi encontró que la prueba F funciona aproximadamente tan bien como el método de prueba de permutación, y puede ser preferible a cuando ${\ Displaystyle m}$ es pequeño, ya que es computacionalmente más simple.

Ver también

Notas

^ Dodge (2003): consulte "concordancia, coeficiente de"
^ Gibbons y Chakraborti (2003)
^ Siegel y Castellan (1988, p. 266)
↑ Kendall, Maurice G. (Maurice George), 1907-1983. (1990). Métodos de correlación de rango . Gibbons, Jean Dickinson, 1938- (5ª ed.). Londres: E. Arnold. ISBN 0195208374. OCLC 21195423 .CS1 maint: varios nombres: lista de autores ( enlace )
↑ Legendre (2005)
^ Marozzi, Marco (2014). "Prueba de concordancia entre varios criterios". Revista de Computación y Simulación Estadística . 84 (9): 1843–1850. doi : 10.1080 / 00949655.2013.766189 .

Referencias

Kendall, MG; Babington Smith, B. (septiembre de 1939). "El problema de los rankings m " . Los Anales de Estadística Matemática . 10 (3): 275-287. doi : 10.1214 / aoms / 1177732186 . JSTOR 2235668 .
Kendall, MG y Gibbons, JD (1990). Métodos de correlación de rango. Nueva York, NY: Oxford University Press.
Corder, GW, Foreman, DI (2009). Estadísticas no paramétricas para no estadísticos: un enfoque paso a paso Wiley, ISBN 978-0-470-45461-9
Dodge, Y. (2003). Diccionario Oxford de términos estadísticos , OUP. ISBN 0-19-920613-9
Legendre, P (2005) Asociaciones de especies: el coeficiente de concordancia de Kendall revisado. Revista de estadísticas agrícolas, biológicas y ambientales , 10 (2), 226–245. [1]
Siegel, Sidney; Castellan, N. John, Jr. (1988). Estadística no paramétrica para las ciencias del comportamiento (2ª ed.). Nueva York: McGraw-Hill. pag. 266. ISBN 978-0-07-057357-4.
Gibbons, Jean Dickinson; Chakraborti, Subhabrata (2003). Inferencia estadística no paramétrica (4ª ed.). Nueva York: Marcel Dekker. págs. 476–482. ISBN 978-0-8247-4052-8.

[1] Dodge (2003): consulte "concordancia, coeficiente de"

[2] Gibbons y Chakraborti (2003)

[3] Siegel y Castellan (1988, p. 266)

[4] Kendall, Maurice G. (Maurice George), 1907-1983. (1990). Métodos de correlación de rango . Gibbons, Jean Dickinson, 1938- (5ª ed.). Londres: E. Arnold. ISBN 0195208374. OCLC 21195423 .CS1 maint: varios nombres: lista de autores ( enlace )

[5] Legendre (2005)

[6] Marozzi, Marco (2014). "Prueba de concordancia entre varios criterios". Revista de Computación y Simulación Estadística . 84 (9): 1843–1850. doi : 10.1080 / 00949655.2013.766189 .

[1]