El índice de Fowlkes-Mallows es un método de evaluación externo que se utiliza para determinar la similitud entre dos agrupaciones (agrupaciones obtenidas después de un algoritmo de agrupación ) y también una métrica para medir matrices de confusión . [1] Esta medida de similitud podría ser entre dos agrupaciones jerárquicas o una agrupación y una clasificación de referencia. Un valor más alto para el índice de Fowlkes-Mallows indica una mayor similitud entre los conglomerados y las clasificaciones de referencia.
Preliminares
El índice de Fowlkes-Mallows , cuando los resultados de dos algoritmos de agrupamiento se utilizan para evaluar los resultados, se define como [2]
dónde es el número de verdaderos positivos ,es el número de falsos positivos , yes el número de falsos negativos .es la tasa positiva verdadera , también llamada sensibilidad o recuerdo , yes la tasa de predicción positiva , también conocida como precisión .
El valor mínimo posible del índice de Fowlkes-Mallows es 0, que corresponde a la peor clasificación binaria posible, donde todos los elementos se han clasificado erróneamente. Y el valor máximo posible del índice de Fowlkes-Mallows es 1, que corresponde a la mejor clasificación binaria posible, donde todos los elementos han sido perfectamente clasificados.
Definición
Considere dos agrupaciones jerárquicas de objetos etiquetados y . Los árboles y se puede cortar para producir agrupaciones para cada árbol (ya sea seleccionando agrupaciones a una altura particular del árbol o estableciendo una fuerza diferente de la agrupación jerárquica). Por cada valor de, se puede crear la siguiente tabla
dónde es de objetos comunes entre los th grupo de y th grupo de . El índice de Fowlkes-Mallows para el valor específico de entonces se define como
dónde
luego se puede calcular para cada valor de y la similitud entre los dos agrupamientos se puede mostrar trazando versus . Para cada tenemos .
El índice Fowlkes-Mallows también se puede definir en función del número de puntos que son comunes o infrecuentes en las dos agrupaciones jerárquicas. Si definimos
- como el número de pares de puntos que están presentes en el mismo grupo en ambos y .
- como el número de pares de puntos que están presentes en el mismo grupo en pero no en .
- como el número de pares de puntos que están presentes en el mismo grupo en pero no en .
- como el número de pares de puntos que están en diferentes grupos en ambos y .
Se puede demostrar que los cuatro recuentos tienen la siguiente propiedad
y que el índice de Fowlkes-Mallows para dos agrupaciones se puede definir como [3]
- dónde es el número de verdaderos positivos , es el número de falsos positivos , y es el número de falsos negativos .
- es la tasa positiva verdadera , también llamada sensibilidad o recuerdo , y es la tasa de predicción positiva , también conocida como precisión .
- El índice de Fowlkes-Mallows es la media geométrica de precisión y recuerdo . [4]
Discusión
Dado que el índice es directamente proporcional al número de verdaderos positivos, un índice más alto significa una mayor similitud entre los dos agrupamientos utilizados para determinar el índice. Una forma básica de probar la validez de este índice es comparar dos agrupaciones que no están relacionadas entre sí. Fowlkes y Mallows demostraron que al utilizar dos agrupaciones no relacionadas, el valor de este índice se acerca a cero a medida que aumenta el número de puntos de datos totales elegidos para la agrupación; mientras que el valor del índice Rand para los mismos datos se acerca rápidamente[1] lo que hace que el índice de Fowlkes-Mallows sea una representación mucho más precisa para datos no relacionados. Este índice también funciona bien si se agrega ruido a un conjunto de datos existente y se compara su similitud. Fowlkes y Mallows mostraron que el valor del índice disminuye a medida que aumenta el componente del ruido. El índice también mostró similitud incluso cuando el conjunto de datos ruidoso tenía un número diferente de grupos que los grupos del conjunto de datos original. Por lo tanto, es una herramienta confiable para medir la similitud entre dos grupos.
Lecturas adicionales
- Fowlkes, Edward B; Mallows, Colin L (1983). "Un método para comparar dos agrupaciones jerárquicas" . Revista de la Asociación Estadounidense de Estadística . 78 (383): 553--569. doi : 10.1080 / 01621459.1983.10478008 .
Referencias
- ^ a b Fowlkes, EB; Mallows, CL (1 de septiembre de 1983). "Un método para comparar dos agrupaciones jerárquicas". Revista de la Asociación Estadounidense de Estadística . 78 (383): 553. doi : 10.2307 / 2288117 .
- ^ Halkidi, Maria; Batistakis, Yannis; Vazirgiannis, Michalis (1 de enero de 2001). "Sobre técnicas de validación de clústeres". Revista de sistemas de información inteligentes . 17 (2/3): 107–145. doi : 10.1023 / A: 1012801612483 .
- ^ MEILA, M (1 de mayo de 2007). "Comparación de agrupaciones: una distancia basada en información". Revista de análisis multivariante . 98 (5): 873–895. doi : 10.1016 / j.jmva.2006.11.013 .
- ^ Tharwat A (agosto de 2018). "Métodos de evaluación de clasificación" . Informática y Computación Aplicada . doi : 10.1016 / j.aci.2018.08.003 .