Modelo de Markov oculto jerárquico


El modelo de Markov oculto jerárquico (HHMM) es un modelo estadístico derivado del modelo de Markov oculto (HMM). En un HHMM, cada estado se considera un modelo probabilístico autónomo . Más precisamente, cada estado del HHMM es en sí mismo un HHMM.

A veces es útil utilizar HMM en estructuras específicas para facilitar el aprendizaje y la generalización. Por ejemplo, aunque siempre se puede usar un HMM completamente conectado si hay suficientes datos de entrenamiento disponibles, a menudo es útil restringir el modelo al no permitir transiciones de estado arbitrarias. De la misma manera, puede resultar beneficioso integrar el HMM en una estructura mayor; que, en teoría, no puede resolver ningún otro problema que el HMM básico, pero puede resolver algunos problemas de manera más eficiente cuando se trata de la cantidad de datos de entrenamiento requeridos.

En el modelo jerárquico oculto de Markov (HHMM), cada estado se considera un modelo probabilístico autónomo. Más precisamente, cada estado del HHMM es en sí mismo un HHMM. Esto implica que los estados del HHMM emiten secuencias de símbolos de observación en lugar de símbolos de observación únicos como es el caso de los estados estándar del HMM.

Cuando se activa un estado en un HHMM, activará su propio modelo probabilístico, es decir, activará uno de los estados del HHMM subyacente, que a su vez puede activar su HHMM subyacente y así sucesivamente. El proceso se repite hasta que se activa un estado especial, llamado estado de producción. Solo los estados de producción emiten símbolos de observación en el sentido habitual de HMM. Cuando el estado de producción ha emitido un símbolo, el control vuelve al estado que activó el estado de producción. Los estados que no emiten símbolos de observación directamente se denominan estados internos. La activación de un estado en un HHMM bajo un estado interno se denomina transición vertical . Después de que se completa una transición vertical, una transición horizontalocurre a un estado dentro del mismo nivel. Cuando una transición horizontal conduce a un estado de terminación , el control se devuelve al estado en el HHMM, más arriba en la jerarquía, que produjo la última transición vertical.

Tenga en cuenta que una transición vertical puede resultar en más transiciones verticales antes de alcanzar una secuencia de estados de producción y finalmente regresar al nivel superior. Así, los estados de producción visitados dan lugar a una secuencia de símbolos de observación que es "producida" por el estado en el nivel superior.

Los métodos para estimar los parámetros HHMM y la estructura del modelo son más complejos que los de los parámetros HMM, y el lector interesado puede consultar Fine et al. (1998).


Ilustración de la estructura de un HHMM. Las líneas grises muestran transiciones verticales. Las transiciones horizontales se muestran como líneas negras. Los círculos de color gris claro son los estados internos y los círculos de color gris oscuro son los estados terminales que devuelven el control al estado de activación. Los estados de producción no se muestran en esta figura.