Algoritmo de Baum-Welch


En ingeniería eléctrica , computación estadística y bioinformática , el algoritmo de Baum-Welch es un caso especial del algoritmo EM utilizado para encontrar los parámetros desconocidos de un modelo oculto de Markov (HMM). Hace uso del algoritmo adelante-atrás para calcular las estadísticas para el paso de expectativa.

El algoritmo Baum-Welch recibió su nombre de sus inventores Leonard E. Baum y Lloyd R. Welch . El algoritmo y los modelos ocultos de Markov se describieron por primera vez en una serie de artículos de Baum y sus colegas del Instituto de Análisis de Defensa a fines de la década de 1960 y principios de la de 1970. [1] Una de las primeras aplicaciones importantes de los HMM fue en el campo del procesamiento del habla . [2] En la década de 1980, los HMM surgieron como una herramienta útil en el análisis de información y sistemas biológicos, y en particular , información genética . [3] Desde entonces, se han convertido en una herramienta importante en el modelado probabilístico de secuencias genómicas. [4]

Un modelo oculto de Markov describe la probabilidad conjunta de una colección de variables aleatorias discretas " ocultas " y observadas. Se basa en la suposición de que la i -ésima variable oculta dada la ( i − 1)-ésima variable oculta es independiente de las variables ocultas anteriores, y las variables de observación actuales dependen solo del estado oculto actual.

El algoritmo de Baum-Welch utiliza el conocido algoritmo EM para encontrar la estimación de máxima verosimilitud de los parámetros de un modelo oculto de Markov dado un conjunto de vectores de características observados.

Sea una variable aleatoria oculta discreta con valores posibles (es decir, suponemos que hay estados en total). Suponemos que es independiente del tiempo , lo que conduce a la definición de la matriz de transición estocástica independiente del tiempo

La distribución de estado inicial (es decir, cuando ) viene dada por