El modelo de Bernoulli oculto no homogéneo en el tiempo (TI-HBM) es una alternativa al modelo de Markov oculto (HMM) para el reconocimiento automático de voz . A diferencia de HMM, el proceso de transición de estado en TI-HBM no es un proceso dependiente de Markov , sino que es un proceso Bernoulli generalizado (independiente). Esta diferencia conduce a la eliminación de la programación dinámica a nivel de estado en el proceso de decodificación de TI-HBM. Por lo tanto, la complejidad computacional de TI-HBM para la evaluación de probabilidad y la estimación de estado es (en vez de en el caso de HMM, donde y son el número de estados y la longitud de la secuencia de observación, respectivamente). El TI-HBM puede modelar la duración de la unidad acústica (por ejemplo, la duración del teléfono / palabra) mediante el uso de un parámetro incorporado llamado probabilidad de supervivencia. El TI-HBM es más simple y rápido que HMM en una tarea de reconocimiento de fonemas, pero su rendimiento es comparable al HMM.
Referencias
- Jahanshah Kabudian, M. Mehdi Homayounpour, S. Mohammad Ahadi, "Bernoulli versus Markov: Investigación del régimen de transición de estado en modelos acústicos de estado de conmutación" , Procesamiento de señales , vol. 89, no. 4, págs. 662–668, abril de 2009.
- Jahanshah Kabudian, M. Mehdi Homayounpour, S. Mohammad Ahadi, "Modelo de Bernoulli oculto no homogéneo en el tiempo: una alternativa al modelo de Markov oculto para el reconocimiento automático de voz", Actas de la Conferencia Internacional IEEE sobre Acústica, Habla y Procesamiento de Señales (ICASSP) , págs. 4101–4104, Las Vegas, Nevada, EE. UU., marzo de 2008.