TopHat es una herramienta bioinformática de código abierto para la alineación del rendimiento de las lecturas de secuenciación de ADNc escopetas generadas por tecnologías de transcriptómica (por ejemplo, RNA-Seq ) utilizando Bowtie primero y luego mapeando a un genoma de referencia para descubrir sitios de empalme de ARN de novo . [1] TopHat alinea las lecturas de RNA-Seq con genomas del tamaño de un mamífero. [2]
Historia
TopHat fue desarrollado originalmente en 2009 por Cole Trapnell , Lior Pachter y Steven Salzberg en el Departamento de Matemáticas, UC Berkeley y el Centro de Bioinformática y Biología Computacional de la Universidad de Maryland, College Park . [1] Trapnell se trasladó más tarde al Departamento de Ciencias del Genoma de la Universidad de Washington . TopHat es un esfuerzo de colaboración entre Cole Trapnell de la Universidad de Washington y Daehwan Kim y Steven Salzberg en el Centro de Biología Computacional de la Universidad Johns Hopkins, quienes juntos en 2013 también crearon TopHat2, que hace una alineación precisa de transcriptomas en presencia de inserciones. deleciones y fusiones de genes. [3]
Usos
TopHat se utiliza para alinear las lecturas de un experimento de RNA-Seq. Es un algoritmo de mapeo de lectura y alinea las lecturas con un genoma de referencia. Es útil porque no necesita depender de sitios de empalme conocidos. [1] TopHat se puede usar con la tubería Tuxedo y se usa frecuentemente con Bowtie .
Ventajas desventajas
Ventajas
Cuando apareció por primera vez TopHat, era más rápido que los sistemas anteriores. Asignó más de 2,2 millones de lecturas por hora de CPU. Esa velocidad permitió al usuario procesar todo el experimento de RNA-Seq en menos de un día, incluso en una computadora de escritorio estándar. [1] Tophat usa Bowtie al principio para analizar las lecturas, pero luego hace más para analizar las lecturas que abarcan las uniones exón-exón. Si está utilizando TopHat para datos de RNA-Seq, obtendrá más lecturas alineadas con el genoma de referencia. [4]
Otra ventaja de TopHat es que no necesita depender de sitios de empalme conocidos al alinear las lecturas con un genoma de referencia. [1]
Desventajas
TopHat se encuentra en una etapa de bajo mantenimiento y soporte, y contiene errores de software que han generado software de posprocesamiento de terceros para corregir. [5] Ha sido reemplazado por HISAT2, que es más eficiente y preciso y proporciona la misma funcionalidad central (alineación empalmada de lecturas de RNA-Seq). [2]
Los protocolos más nuevos son más eficientes ahora, en comparación con TopHat, como gemelos, STAR y limma.
Ver también
Referencias
- ↑ a b c d e Trapnell C, Pachter L, Salzberg SL (mayo de 2009). "TopHat: descubrimiento de uniones de empalme con RNA-Seq" . Bioinformática . 25 (9): 1105-11. doi : 10.1093 / bioinformatics / btp120 . PMC 2672628 . PMID 19289445 .
- ^ a b "TopHat" . ccb.jhu.edu . Consultado el 17 de abril de 2018 .
- ^ Kim D, Pertea G, Trapnell C, Pimentel H, Kelley R, Salzberg SL (abril de 2013). "TopHat2: alineación precisa de transcriptomas en presencia de inserciones, deleciones y fusiones de genes" . Biología del genoma . 14 (4): R36. doi : 10.1186 / gb-2013-14-4-r36 . PMC 4053844 . PMID 23618408 .
- ^ "Pajarita y sombrero de copa" . www.biostars.org . Consultado el 24 de abril de 2018 .
- ^ Brueffer C, Saal LH (mayo de 2016). "TopHat-Recondition: un postprocesador para lecturas no asignadas de TopHat" . BMC Bioinformática . 17 (1): 199. doi : 10.1186 / s12859-016-1058-x . PMC 4855331 . PMID 27142976 .
enlaces externos
- Página de TopHat en el Centro de Biología Computacional en JHU