T-Coffee ( función de objetivo de coherencia basada en árboles para la evaluación de la alineación ) es un software de alineación de secuencias múltiples que utiliza un enfoque progresivo. [1] Genera una biblioteca de alineaciones por pares para guiar la alineación de múltiples secuencias. También puede combinar múltiples secuencias de alineaciones obtenidas previamente y en las últimas versiones puede utilizar información estructural de archivos PDB (3D-Coffee). Tiene características avanzadas para evaluar la calidad de las alineaciones y cierta capacidad para identificar la ocurrencia de motivos (Mocca). Produce alineación en formato aln ( Clustal ) por defecto, pero también puede producir formato PIR, MSF y FASTA. Se admiten los formatos de entrada más comunes ( FASTA , PIR ).
Desarrollador (es) | Cédric Notredame, Centro de Regulacio Genomica (CRG) - Barcelona |
---|---|
Lanzamiento estable | 13.45.0.4846264 / 15 de octubre de 2020 |
Versión de vista previa | 13.45.33.7d7e789 / 23 de diciembre de 2020 |
Repositorio | |
Sistema operativo | UNIX , Linux , MS-Windows , Mac OS X |
Tipo | Herramienta de bioinformática |
Licencia | GPL |
Sitio web | www |
Comparaciones con otro software de alineación
Si bien la salida predeterminada es un formato similar a Clustal, es lo suficientemente diferente de la salida de ClustalW / X que muchos programas que admiten el formato Clustal no pueden leerlo; afortunadamente, ClustalX puede importar la salida de T-Coffee, por lo que la solución más sencilla para este problema suele ser importar la salida de T-Coffee a ClustalX y luego volver a exportarla. Otra posibilidad es solicitar el formato de salida estricto de Clustalw con la opción " -output=clustalw_aln
".
Una especificidad importante de T-Coffee es su capacidad para combinar diferentes métodos y diferentes tipos de datos. En su última versión, T-Coffee se puede utilizar para combinar secuencias y estructuras de proteínas, secuencias y estructuras de ARN. También puede ejecutar y combinar la salida de los paquetes de alineación de secuencia y estructura más comunes. Para obtener una lista completa, consulte: tclinkdb.txt
T-Coffee viene con una sofisticada utilidad de reformateo de secuencias llamada seq_reformat. Una extensa documentación está disponible en t_coffee_technical.htm junto con un tutorial t_coffee_tutorial.htm
Variaciones
- M-Café
- un modo especial de T-Coffee que permite combinar la salida de los paquetes de alineación de secuencias múltiples más comunes (Muscle, ClustalW, Mafft, ProbCons, etc.). Las alineaciones resultantes son ligeramente mejores que las individuales, pero lo más importante es que el programa indica las regiones de alineación en las que coinciden los distintos paquetes. Las regiones de alto acuerdo suelen estar bien alineadas.
- Expresso y 3D-Coffee
- Estos son modos especiales de T-Coffee que permiten combinar secuencias y estructuras en una alineación. Las alineaciones basadas en estructuras se pueden realizar utilizando los alineadores estructurales más comunes como TMalign, Mustang y sap.
- R-Café
- un modo especial de T-Coffee que permite alinear secuencias de ARN mientras se usa información de estructura secundaria.
- PSI-Café
- alinea proteínas relacionadas lejanamente usando extensión de homología (lenta y precisa) [2] [3]
- TM-Café
- alinea las proteínas transmembrana mediante extensión de homología [4]
- Pro-Café
- alinea regiones promotoras homólogas [5]
- Preciso
- Combina automáticamente los modos más precisos para ADN, ARN y proteínas ( ¡experimental! )
Evaluación
- TCS
- ( T ransitive C OHERENCIA S del núcleo) una versión extendida del sistema de puntuación T-Coffee. [6] Utiliza bibliotecas de T-Coffee de alineaciones por pares para evaluar cualquier MSA de terceros. Las proyecciones por pares se pueden producir utilizando métodos rápidos o lentos, lo que permite un equilibrio entre velocidad y precisión. Se ha demostrado que TCS conduce a estimaciones significativamente mejores de precisión estructural y árboles filogenéticos más precisos contra Heads-or-Tails, GUIDANCE, Gblocks y trimAl. [7]
Ver también
Referencias
- ↑ a b Notredame C, Higgins DG , Heringa J (8 de septiembre de 2000). "T-Coffee: un método novedoso para la alineación de secuencia múltiple rápida y precisa". J Mol Biol . 302 (1): 205–217. doi : 10.1006 / jmbi.2000.4042 . PMID 10964570 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ a b Di Tommaso P, Moretti S, Xenarios I, Orobitg M, Montanyola A, Chang JM, Taly JF, Notredame C (julio de 2011). "T-Coffee: un servidor web para la alineación de múltiples secuencias de proteínas y secuencias de ARN utilizando información estructural y extensión de homología" . Ácidos nucleicos Res . 39 (Problema del servidor web): W13–7. doi : 10.1093 / nar / gkr245 . PMC 3125728 . PMID 21558174 .
- ^ Kemena C, Notredame C (1 de octubre de 2009). "Próximos desafíos para múltiples métodos de alineación de secuencia en la era de alto rendimiento" . Bioinformática . 25 (19): 2455–65. doi : 10.1093 / bioinformatics / btp452 . PMC 2752613 . PMID 19648142 .
- ^ Chang JM, Di Tommaso P, Taly JF, Notredame C (28 de marzo de 2012). "Alineación precisa de múltiples secuencias de proteínas transmembrana con PSI-Coffee" . BMC Bioinformática . 13 : S1. doi : 10.1186 / 1471-2105-13-S4-S1 . PMC 3303701 . PMID 22536955 .
- ^ Erb I, González-Vallinas JR, Bussotti G, Blanco E, Eyras E, Notredame C (abril de 2012). "Uso de datos de ChIP-Seq para el diseño de un método de alineación de promotores múltiples" . Ácidos nucleicos Res . 40 (7): e52. doi : 10.1093 / nar / gkr1292 . PMC 3326335 . PMID 22230796 .
- ^ Chang, JM; Di Tommaso, P; Lefort, V; Gascuel, O; Notredame, C (1 de julio de 2015). "TCS: un servidor web para la evaluación de alineación de secuencias múltiples y reconstrucción filogenética" . Investigación de ácidos nucleicos . 43 (W1): W3-6. doi : 10.1093 / nar / gkv310 . PMC 4489230 . PMID 25855806 .
- ^ Chang, JM; Di Tommaso, P; Notredame, C (junio de 2014). "TCS: una nueva medida de confiabilidad de alineación de secuencia múltiple para estimar la precisión de la alineación y mejorar la reconstrucción del árbol filogenético" . Biología Molecular y Evolución . 31 (6): 1625–37. doi : 10.1093 / molbev / msu117 . PMID 24694831 .
enlaces externos
- Página web oficial
- Servidor T-Coffee Aligner
- Página de descarga de T-Coffee
- Documentación técnica
- Tutorial
- Lista de alineadores de terceros compatibles con T-Coffee