Cadenas clasificadoras


Las cadenas de clasificadores son un método de aprendizaje automático para la transformación de problemas en la clasificación de múltiples etiquetas . Combina la eficiencia computacional del método de relevancia binaria sin dejar de tener en cuenta las dependencias de la etiqueta para la clasificación . [1]

Existen varios métodos de transformación de problemas. Uno de ellos es el método de relevancia binaria (BR). Dado un conjunto de etiquetas y un conjunto de datos con instancias del formulario donde es un vector de características y es un conjunto de etiquetas asignadas a la instancia. BR transforma el conjunto de datos en conjuntos de datos y aprende clasificadores binarios para cada etiqueta. Durante este proceso, no se conserva la información sobre las dependencias entre etiquetas. Esto puede conducir a una situación en la que se asigna un conjunto de etiquetas a una instancia, aunque estas etiquetas nunca coexisten juntas en el conjunto de datos. Por lo tanto, la información sobre la co-ocurrencia de etiquetas puede ayudar a asignar combinaciones de etiquetas correctas. La pérdida de esta información puede, en algunos casos, provocar una disminución en el rendimiento de la clasificación. [2]

Otro enfoque, que tiene en cuenta las correlaciones de etiquetas, es el método Label Powerset (LP). Cada combinación de etiquetas en un conjunto de datos se considera una sola etiqueta. Después de la transformación, se entrena un clasificador de etiqueta única dónde está el conjunto de potencia de todas las etiquetas en . El principal inconveniente de este enfoque es que el número de combinaciones de etiquetas crece exponencialmente con el número de etiquetas. Por ejemplo, un conjunto de datos de etiquetas múltiples con 10 etiquetas puede tener hasta combinaciones de etiquetas. Esto aumenta el tiempo de ejecución de la clasificación.

El método Classifier Chains se basa en el método BR y es eficaz incluso en un gran número de etiquetas. Además, considera las dependencias entre etiquetas.

Para un conjunto de etiquetas dado, el modelo de cadena de clasificadores (CC) aprende clasificadores como en el método de relevancia binaria. Todos los clasificadores están vinculados en una cadena a través del espacio de características.