La Comparación de Secuencias Múltiples por Log-Expectativa ( MUSCLE ) es un software de computadora para el alineamiento de secuencias múltiples de secuencias de proteínas y nucleótidos . Se licencia como dominio público . El método fue publicado por Robert C. Edgar en dos artículos en 2004. El primer artículo, publicado en Nucleic Acids Research , introdujo el algoritmo de alineación de secuencias. [1] El segundo artículo, publicado en BMC Bioinformatics , presentó más detalles técnicos. [2]
Autor (es) original (es) | Robert C. Edgar |
---|---|
Desarrollador (es) | drive5 |
Versión inicial | 2004 |
Lanzamiento estable | 3.8.31 / 18 de agosto de 2016 |
Repositorio | |
Sistema operativo | Linux , macOS , Windows |
Plataforma | IA-32 , x86-64 |
Disponible en | inglés |
Tipo | Alineación de múltiples secuencias |
Licencia | Dominio publico |
Sitio web | www |
Algoritmo
El algoritmo MUSCLE avanza en tres etapas: el borrador progresivo , el progresivo mejorado y las etapas de refinamiento . En la etapa de borrador progresivo , el algoritmo produce un borrador de alineación múltiple, enfatizando la velocidad sobre la precisión. En la etapa progresiva mejorada , la distancia de Kimura se utiliza para volver a estimar el árbol binario para crear la alineación de borrador, lo que a su vez produce una alineación múltiple más precisa. La etapa de refinamiento final refina la alineación mejorada realizada en el paso dos. Hay varias alineaciones disponibles al final de cada etapa. En las dos primeras etapas del algoritmo, la complejidad temporal es O ( N 2 L + NL 2 ) , la complejidad espacial es O ( N 2 + NL + L 2 ) . La etapa de refinamiento agrega a la complejidad del tiempo otro término, O ( N 3 L ) . [1] MUSCLE se usa a menudo como un reemplazo de Clustal , ya que generalmente (pero no siempre) da mejores alineaciones de secuencia, dependiendo de las opciones elegidas. Además, MUSCLE es significativamente más rápido que Clustal, más aún para alineaciones más grandes. [1] [2]
Integración
MUSCLE está integrado en el software Lasergene de DNASTAR , Geneious y MacVector y está disponible en Sequencher , MEGA y UGENE como complemento . MUSCLE también está disponible como un servicio web a través del Laboratorio Europeo de Biología Molecular (EMBL) - Instituto Europeo de Bioinformática (EBI). [3] Hasta septiembre de 2016, los dos artículos que describen MUSCLE han sido citados más de 19.000 veces en total. [4]
Ver también
Referencias
- ↑ a b c Edgar RC (2004). "MUSCLE: alineación de secuencia múltiple con alta precisión y alto rendimiento" . Investigación de ácidos nucleicos . 32 (5): 1792–97. doi : 10.1093 / nar / gkh340 . PMC 390337 . PMID 15034147 .
- ^ a b Edgar RC (2004). "MUSCLE: un método de alineación de secuencia múltiple con una complejidad de tiempo y espacio reducida" . BMC Bioinformática . 5 (1): 113. doi : 10.1186 / 1471-2105-5-113 . PMC 517706 . PMID 15318951 .
- ^ "MÚSCULO ón>. Consultado el 1 de septiembre de 2014 .
- ^ "Robert C. Edgar - citas de Google Académico" . Consultado el 1 de septiembre de 2016 .
enlaces externos
- Página web oficial
- Servidor web MUSCLE (EMBL-EBI)