Etiquetado de secuencia

En el aprendizaje automático , el etiquetado de secuencias es un tipo de tarea de reconocimiento de patrones que implica la asignación algorítmica de una etiqueta categórica a cada miembro de una secuencia de valores observados. Un ejemplo común de una tarea de etiquetado de secuencia es parte del etiquetado de voz , que busca asignar una parte de la voz a cada palabra en una oración o documento de entrada. El etiquetado de secuencias se puede tratar como un conjunto de tareas de clasificación independientes , una por miembro de la secuencia. Sin embargo, la precisión generalmente se mejora al hacer que la etiqueta óptima para un elemento dado dependa de las elecciones de elementos cercanos, utilizando algoritmos especiales para elegir globalmente mejor conjunto de etiquetas para toda la secuencia a la vez.

Como ejemplo de por qué la búsqueda de la mejor secuencia de etiquetas a nivel mundial puede producir mejores resultados que etiquetar un elemento a la vez, considere la tarea de etiquetado de parte del discurso que se acaba de describir. Con frecuencia, muchas palabras son miembros de múltiples partes del discurso, y la etiqueta correcta de dicha palabra a menudo se puede deducir de la etiqueta correcta de la palabra que se encuentra inmediatamente a la izquierda oa la derecha. Por ejemplo, la palabra "conjuntos" puede ser un sustantivo o un verbo. En una frase como "deja los libros", la palabra "él" es sin ambigüedades un pronombre y "el" sin ambigüedades un determinante , y usando cualquiera de estas etiquetas, "conjuntos" puede deducirse que es un verbo, ya que los sustantivos muy raramente siguen los pronombres y es menos probable que precedan a los determinantes que los verbos. Pero en otros casos, solo una de las palabras adyacentes es igualmente útil. En "él pone y luego tira la mesa", sólo la palabra "él" a la izquierda es útil (cf. "... recoge los conjuntos y luego vuelca ..."). Por el contrario, en "... y también pone la mesa", sólo la palabra "el" a la derecha es útil (cf. "... y también los juegos de libros fueron ..."). Un algoritmo que procede de izquierda a derecha, etiquetando una palabra a la vez, solo puede usar las etiquetas de las palabras adyacentes a la izquierda y podría fallar en el segundo ejemplo anterior; viceversa para un algoritmo que procede de derecha a izquierda.

La mayoría de los algoritmos de etiquetado de secuencias son de naturaleza probabilística y se basan en la inferencia estadística para encontrar la mejor secuencia. Los modelos estadísticos más comunes que se utilizan para el etiquetado de secuencias hacen una suposición de Markov, es decir, que la elección de la etiqueta para una palabra en particular depende directamente sólo de las etiquetas inmediatamente adyacentes; por tanto, el conjunto de etiquetas forma una cadena de Markov . Esto conduce naturalmente al modelo oculto de Markov (HMM), uno de los modelos estadísticos más comunes utilizados para el etiquetado de secuencias. Otros modelos comunes en uso son el modelo de Markov de máxima entropía y el campo aleatorio condicional .

Ver también

Inteligencia artificial
Redes bayesianas (de las cuales los HMM son un ejemplo)
Clasificación (aprendizaje automático)
Sistema dinámico lineal , que se aplica a tareas en las que la "etiqueta" es en realidad un número real.
Aprendizaje automático
Reconocimiento de patrones
Minería de secuencia

Referencias

Otras lecturas

Erdogan H., [1] . "Etiquetado de secuencias: enfoques generativos y discriminativos, modelos de Markov ocultos, campos aleatorios condicionales y SVM estructuradas", tutorial de ICMLA 2010, Bethesda, MD (2010)