Alineación de secuencias múltiples


El alineamiento de secuencias múltiples ( MSA ) puede referirse al proceso o al resultado del alineamiento de secuencias de tres o más secuencias biológicas , generalmente proteínas , ADN o ARN . En muchos casos, se supone que el conjunto de entrada de secuencias de consulta tiene una relación evolutiva por la cual comparten un vínculo y descienden de un ancestro común. A partir del MSA resultante, se puede inferir la homología de secuencias y se puede realizar un análisis filogenético para evaluar los orígenes evolutivos compartidos de las secuencias. Las representaciones visuales de la alineación como en la imagen de la derecha ilustran la mutacióneventos tales como mutaciones puntuales (cambios de un solo aminoácido o nucleótido ) que aparecen como caracteres diferentes en una sola columna de alineación, y mutaciones de inserción o eliminación ( indels o gaps) que aparecen como guiones en una o más de las secuencias de la alineación. La alineación de secuencias múltiples se usa a menudo para evaluar la conservación de secuencias de dominios de proteínas , estructuras terciarias y secundarias e incluso aminoácidos o nucleótidos individuales.

Los algoritmos computacionales se utilizan para producir y analizar los MSA debido a la dificultad y la intratabilidad de procesar manualmente las secuencias dada su longitud biológicamente relevante. Los MSA requieren metodologías más sofisticadas que la alineación por pares porque son computacionalmente más complejos . La mayoría de los programas de alineación de secuencias múltiples utilizan métodos heurísticos en lugar de optimización global.porque identificar la alineación óptima entre más de unas pocas secuencias de longitud moderada es prohibitivamente caro desde el punto de vista computacional. Por otro lado, los métodos heurísticos generalmente no brindan garantías sobre la calidad de la solución, y las soluciones heurísticas se muestran a menudo muy por debajo de la solución óptima en instancias de referencia. [1] [2] [3]

Secuencias dadas , similar a la siguiente forma:


Primeras 90 posiciones de una alineación de secuencias múltiples de proteínas de instancias de la proteína ribosomal ácida P0 (L10E) de varios organismos. Generado con ClustalX .
Un perfil HMM que modela una alineación de secuencia múltiple
Alineación de exones no homólogos mediante un método iterativo (a) y mediante un método consciente de la filogenia (b)
Alineación de las siete caspasas de Drosophila coloreadas por motivos identificados por MEME. Cuando las posiciones de los motivos y las alineaciones de secuencias se generan de forma independiente, a menudo se correlacionan bien pero no perfectamente, como en este ejemplo.