La W de Kendall (también conocida como coeficiente de concordancia de Kendall ) es una estadística no paramétrica . Es una normalización de la estadística de la prueba de Friedman y se puede utilizar para evaluar la concordancia entre los evaluadores. La W de Kendall varía de 0 (sin acuerdo) a 1 (acuerdo completo).
Supongamos, por ejemplo, que se ha pedido a varias personas que clasifiquen una lista de preocupaciones políticas, de la más importante a la menos importante. La W de Kendall se puede calcular a partir de estos datos. Si la estadística de prueba W es 1, entonces todos los encuestados han sido unánimes y cada encuestado ha asignado el mismo orden a la lista de preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre las distintas respuestas.
Mientras que las pruebas que utilizan el coeficiente de correlación estándar de Pearson asumen valores distribuidos normalmente y comparan dos secuencias de resultados a la vez, la W de Kendall no hace suposiciones sobre la naturaleza de la distribución de probabilidad y puede manejar cualquier número de resultados distintos.
Definición
Suponga que el juez número j le da al objeto i el rango r i, j , donde hay en total n objetos y m jueces. Entonces el rango total dado al objeto i es
y el valor medio de estos rangos totales es
La suma de las desviaciones al cuadrado, S , se define como
y luego la W de Kendall se define como [1]
Si la estadística de la prueba W es 1, entonces todos los jueces o encuestados han sido unánimes y cada juez o encuestado ha asignado el mismo orden a la lista de objetos o preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre los distintos jueces o encuestados.
Kendall y Gibbons (1990) también muestran que W está relacionado linealmente con el valor medio de los coeficientes de correlación de rango de Spearman entre todos posibles pares de clasificaciones entre jueces
Bloques incompletos
Cuando los jueces evalúan solo algún subconjunto de los n objetos, y cuando el diseño de bloque correspondiente es un diseño (n, m, r, p, λ) (observe la notación diferente) . En otras palabras, cuando
- cada juez clasifica el mismo número p de objetos para algunos,
- cada objeto se clasifica exactamente el mismo número total r de veces,
- y cada par de objetos se presenta junto a algún juez un total de exactamente λ veces, , una constante para todos los pares.
Entonces la W de Kendall se define como [2]
Si y para que cada juez clasifique todos los n objetos, la fórmula anterior es equivalente a la original.
Corrección de lazos
Cuando ocurren valores empatados, a cada uno se le da el promedio de los rangos que se habrían dado si no hubiera habido empates. Por ejemplo, el conjunto de datos {80,76,34,80,73,80} tiene valores de 80 empatados en el 4º, 5º y 6º lugar; dado que la media de {4,5,6} = 5, los rangos se asignarían a los valores de datos sin procesar de la siguiente manera: {5,3,1,5,2,5}.
El efecto de las ataduras es reducir el valor de W ; sin embargo, este efecto es pequeño a menos que exista una gran cantidad de vínculos. Para corregir los empates, asigne rangos a los valores empatados como se indicó anteriormente y calcule los factores de corrección
donde t i es el número de rangos empatados en el i- ésimo grupo de rangos empatados, (donde un grupo es un conjunto de valores que tienen un rango constante (empatado)) yg j es el número de grupos de empates en el conjunto de rangos (de 1 an ) para el juez j . Por tanto, T j es el factor de corrección requerido para el conjunto de rangos del juez j , es decir, el j- ésimo conjunto de rangos. Tenga en cuenta que si no hay rangos empatados para el juez j , T j es igual a 0.
Con la corrección por empates, la fórmula para W se convierte en
donde R i es la suma de los rangos del objeto i , yes la suma de los valores de T j sobre todos los m conjuntos de rangos. [3]
Pruebas de significación
En el caso de rangos completos, Kendall y Gibbons (1990) dan una prueba de significación comúnmente utilizada para W contra una hipótesis nula de no concordancia (es decir, clasificaciones aleatorias) [4].
Donde el estadístico de prueba toma una distribución chi-cuadrado con grados de libertad.
En el caso de clasificaciones incompletas (ver arriba), esto se convierte en
Donde de nuevo, hay grados de libertad.
Legendre [5] comparó mediante simulación el poder de los enfoques de prueba de chi-cuadrado y permutación para determinar la importancia de la W de Kendall . Los resultados indicaron que el método de chi-cuadrado era demasiado conservador en comparación con una prueba de permutación cuando. Marozzi [6] amplió esto al considerar también la prueba F , como se propuso en la publicación original que presenta la estadística W de Kendall & Babington Smith (1939):
Donde el estadístico de prueba sigue una distribución F con y grados de libertad. Marozzi encontró que la prueba F funciona aproximadamente tan bien como el método de prueba de permutación, y puede ser preferible a cuando es pequeño, ya que es computacionalmente más simple.
Ver también
Notas
- ^ Dodge (2003): consulte "concordancia, coeficiente de"
- ^ Gibbons y Chakraborti (2003)
- ^ Siegel y Castellan (1988, p. 266)
- ↑ Kendall, Maurice G. (Maurice George), 1907-1983. (1990). Métodos de correlación de rango . Gibbons, Jean Dickinson, 1938- (5ª ed.). Londres: E. Arnold. ISBN 0195208374. OCLC 21195423 .CS1 maint: varios nombres: lista de autores ( enlace )
- ↑ Legendre (2005)
- ^ Marozzi, Marco (2014). "Prueba de concordancia entre varios criterios". Revista de Computación y Simulación Estadística . 84 (9): 1843–1850. doi : 10.1080 / 00949655.2013.766189 .
Referencias
- Kendall, MG; Babington Smith, B. (septiembre de 1939). "El problema de los rankings m " . Los Anales de Estadística Matemática . 10 (3): 275-287. doi : 10.1214 / aoms / 1177732186 . JSTOR 2235668 .
- Kendall, MG y Gibbons, JD (1990). Métodos de correlación de rango. Nueva York, NY: Oxford University Press.
- Corder, GW, Foreman, DI (2009). Estadísticas no paramétricas para no estadísticos: un enfoque paso a paso Wiley, ISBN 978-0-470-45461-9
- Dodge, Y. (2003). Diccionario Oxford de términos estadísticos , OUP. ISBN 0-19-920613-9
- Legendre, P (2005) Asociaciones de especies: el coeficiente de concordancia de Kendall revisado. Revista de estadísticas agrícolas, biológicas y ambientales , 10 (2), 226–245. [1]
- Siegel, Sidney; Castellan, N. John, Jr. (1988). Estadística no paramétrica para las ciencias del comportamiento (2ª ed.). Nueva York: McGraw-Hill. pag. 266. ISBN 978-0-07-057357-4.
- Gibbons, Jean Dickinson; Chakraborti, Subhabrata (2003). Inferencia estadística no paramétrica (4ª ed.). Nueva York: Marcel Dekker. págs. 476–482. ISBN 978-0-8247-4052-8.