Clasificador de centroide más cercano


En el aprendizaje automático , el clasificador de centroide más cercano o el clasificador de prototipo más cercano es un modelo de clasificación que asigna a las observaciones la etiqueta de la clase de muestras de entrenamiento cuya media ( centroide ) está más cerca de la observación. Cuando se aplica a la clasificación de texto mediante vectores de palabras que contienen pesos tf*idf para representar documentos, el clasificador de centroide más cercano se conoce como el clasificador de Rocchio debido a su similitud con el algoritmo de Rocchio para la retroalimentación de relevancia . [1]

Una versión extendida del clasificador de centroide más cercano ha encontrado aplicaciones en el dominio médico, específicamente en la clasificación de tumores . [2]

Dadas las muestras de entrenamiento etiquetadas con etiquetas de clase , calcule los centroides por clase donde es el conjunto de índices de las muestras que pertenecen a la clase .


Clasificación Rocchio