Esta lista de software de alineación de secuencias es una compilación de herramientas de software y portales web que se utilizan en la alineación de secuencias por pares y la alineación de secuencias múltiples . Consulte el software de alineación estructural para la alineación estructural de proteínas.
Solo búsqueda en base de datos
Nombre | Descripción | Tipo de secuencia * | Autores | Año |
---|---|---|---|---|
EXPLOSIÓN | Búsqueda local con heurística rápida de tuplas k (herramienta básica de búsqueda de alineación local) | Ambas cosas | Altschul SF , Gish W , Miller W , Myers EW , Lipman DJ [1] | 1990 |
HPC-BLAST | Envoltura BLAST multinodo y multinúcleo compatible con NCBI. Distribuido con la última versión de BLAST, este contenedor facilita la paralelización del algoritmo en arquitecturas híbridas modernas con muchos nodos y muchos núcleos dentro de cada nodo. [2] | Proteína | Burdyshaw CE , Sawyer S , Horton MD , Brook RG , Rekapalli B | 2017 |
CS-BLAST | BLAST específico de secuencia-contexto, más sensible que BLAST, FASTA y SSEARCH. Versión iterativa de posición específica CSI-BLAST más sensible que PSI-BLAST | Proteína | Angermueller C, Biegert A, Soeding J [3] | 2013 |
CUDASW ++ | Algoritmo Smith Waterman acelerado por GPU para múltiples GPU de host compartido | Proteína | Liu Y, Maskell DL y Schmidt B | 2009/2010 |
DIAMANTE | Alineador BLASTX y BLASTP basado en doble indexación | Proteína | Buchfink B, Xie C, Huson DH, Reuter K, Drost HG [4] [5] | 2015/2021 |
FASTA | Búsqueda local con heurística rápida k -tuple, más lenta pero más sensible que BLAST | Ambas cosas | ||
GGSEARCH, GLSEARCH | Global: Global (GG), Global: Local (GL) alineación con estadísticas | Proteína | ||
Mago del genoma | Software para búsqueda de motivos de secuencia de ADN local ultrarrápida y alineación por pares para datos NGS (FASTA, FASTQ). | ADN | Hepperle D (www.sequentix.de) | 2020 |
Genoogle | Genoogle utiliza técnicas de indexación y procesamiento paralelo para buscar secuencias de ADN y proteínas. Está desarrollado en Java y de código abierto. | Ambas cosas | Albrecht F | 2015 |
HMMER | Búsqueda local y global con modelos de perfil Hidden Markov, más sensibles que PSI-BLAST | Ambas cosas | Durbin R , Eddy SR , Krogh A , Mitchison G [6] | 1998 |
HH-suite | Comparación por pares de modelos de perfil Hidden Markov; muy sensible | Proteína | Söding J [7] [8] | 2005/2012 |
IDF | Frecuencia de documento inversa | Ambas cosas | ||
Infernal | Búsqueda de perfil SCFG | ARN | Eddy S | |
KLAST | Herramienta de búsqueda de similitud de secuencias de uso general de alto rendimiento | Ambas cosas | 2009/2014 | |
LAMBDA | Alineador local de alto rendimiento compatible con BLAST, pero mucho más rápido; soporta SAM / BAM | Proteína | Hannes Hauswedell, cantante de Jochen, Knut Reinert [9] | 2014 |
MMseqs2 | Paquete de software para buscar y agrupar grandes conjuntos de secuencias. Sensibilidad similar a BLAST y PSI-BLAST pero órdenes de magnitud más rápido | Proteína | Steinegger M, Mirdita M, Galiez C, Söding J [10] | 2017 |
USEARCH | Herramienta de análisis de secuencia ultrarrápida | Ambas cosas | Edgar, RC (2010). "Búsqueda y agrupación de órdenes de magnitud más rápido que BLAST" . Bioinformática . 26 (19): 2460–2461. doi : 10.1093 / bioinformatics / btq461 . PMID 20709691 . publicación | 2010 |
OSWALD | OpenCL Smith-Waterman sobre FPGA de Altera para grandes bases de datos de proteínas | Proteína | Rucci E, García C, Botella G, De Giusti A, Naiouf M, Prieto-Matías M [11] | 2016 |
parasail | Búsqueda rápida de Smith-Waterman mediante paralelización SIMD | Ambas cosas | Diario J | 2015 |
PSI-BLAST | BLAST iterativo de posición específica, búsqueda local con matrices de puntuación específicas de posición , mucho más sensible que BLAST | Proteína | Altschul SF , Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W , Lipman DJ [12] | 1997 |
Búsqueda de PSI | Combinando el algoritmo de búsqueda de Smith-Waterman con la estrategia de construcción del perfil PSI-BLAST para encontrar secuencias de proteínas relacionadas lejanamente y prevenir errores homólogos de sobreextensión. | Proteína | Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR [13] | 2012 |
ScalaBLAST | BLAST escalable altamente paralelo | Ambas cosas | Oehmen y col. [14] | 2011 |
Sequilab | Vinculación y creación de perfiles de datos de alineación de secuencias de los resultados de NCBI-BLAST con los principales servidores / servicios de análisis de secuencias | Nucleótido, péptido | 2010 | |
SAM | Búsqueda local y global con modelos de perfil Hidden Markov, más sensibles que PSI-BLAST | Ambas cosas | Karplus K , Krogh A [15] | 1999 |
BÚSQUEDA | Búsqueda Smith-Waterman, más lenta pero más sensible que FASTA | Ambas cosas | ||
SWAPHI | Primer algoritmo paralelo que emplea el emergente Intel Xeon Phis para acelerar la búsqueda en la base de datos de proteínas Smith-Waterman | Proteína | Liu Y y Schmidt B | 2014 |
SWAPHI-LS | Primer algoritmo paralelo de Smith-Waterman que aprovecha los clústeres de Intel Xeon Phi para acelerar la alineación de largas secuencias de ADN | ADN | Liu Y, Tran TT, Lauenroth F, Schmidt B | 2014 |
Nadar | Implementación de Smith-Waterman para arquitecturas Intel Multicore y Manycore | Proteína | Rucci E, García C, Botella G, De Giusti A, Naiouf M y Prieto-Matías M [16] | 2015 |
SWIMM2.0 | Smith-Waterman mejorado en las arquitecturas Intel Multicore y Manycore basadas en extensiones vectoriales AVX-512 | Proteína | Rucci E, García C, Botella G, De Giusti A, Naiouf M y Prieto-Matías M [17] | 2018 |
GOLPE FUERTE | Búsqueda rápida de Smith-Waterman mediante paralelización SIMD | Ambas cosas | Rognes T | 2011 |
* Tipo de secuencia: proteína o nucleótido
Alineación por pares
Nombre | Descripción | Tipo de secuencia * | Tipo de alineación ** | Autor | Año |
---|---|---|---|---|---|
ACANA | Alineación por pares basada en anclaje heurístico rápido | Ambas cosas | Ambas cosas | Huang, Umbach, Li | 2005 |
Alinearme | Alineaciones para secuencias de proteínas de membrana | Proteína | Ambas cosas | M. Stamm, K. Khafizov, R. Staritzbichler, LR Forrest | 2013 |
ALLALIGN | Para moléculas de ADN, ARN y proteínas de hasta 32 MB, alinea todas las secuencias de tamaño K o superior. Las alineaciones similares se agrupan para su análisis. Filtro automático de secuencia repetitiva. | Ambas cosas | Local | E. Wachtel | 2017 |
Bioconductores bioconductores :: pairwiseAlignment | Programación dinámica | Ambas cosas | Ambos + Extremos libres | P. Aboyoun | 2008 |
BioPerl dpAlign | Programación dinámica | Ambas cosas | Ambos + Extremos libres | YM Chan | 2003 |
BLASTZ, LASTZ | Coincidencia de patrones sembrados | Nucleótido | Local | Schwartz y col. [18] [19] | 2004,2009 |
CUDAlign | Alineación de secuencias de ADN de tamaño ilimitado en una o varias GPU | Nucleótido | Local, semiglobal, global | E. Sandes [20] [21] [22] | 2011-2015 |
DNADot | Herramienta de diagrama de puntos basada en la web | Nucleótido | Global | R. Bowen | 1998 |
Suite de biología molecular DNASTAR Lasergene | Software para alinear secuencias de ADN, ARN, proteína o ADN + proteína a través de algoritmos de alineación de secuencia múltiple y por pares que incluyen análisis MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson y Dotplot. | Ambas cosas | Ambas cosas | DNASTAR | 1993-2016 |
DOTLET | Herramienta de trazado de puntos basada en Java | Ambas cosas | Global | M. Pagni y T. Junier | 1998 |
BANQUETE | Extensión local de base posterior con modelo descriptivo de evolución | Nucleótido | Local | AK Hudek y DG Brown | 2010 |
Compilador del genoma Compilador del genoma | Alinee archivos de cromatograma (.ab1, .scf) con una secuencia de plantilla, localice errores y corríjalos al instante. | Nucleótido | Local | Corporación del compilador del genoma | 2014 |
G-PAS | Programación dinámica basada en GPU con retroceso | Ambas cosas | Local, semiglobal, global | W. Frohmberg, M. Kierzynka y col. | 2011 |
GapMis | Hace una alineación de secuencia por pares con un espacio | Ambas cosas | SemiGlobal | K. Frousios, T. Flouri, CS Iliopoulos, K. Park, SP Pissis, G. Tischler | 2012 |
Mago del genoma | Software para búsqueda de motivos de secuencia de ADN local ultrarrápida y alineación por pares para datos NGS (FASTA, FASTQ). | ADN | Local, semiglobal, global | Hepperle D (www.sequentix.de) | 2020 |
GGSEARCH, GLSEARCH | Global: Global (GG), Global: Local (GL) alineación con estadísticas | Proteína | Global en consulta | W. Pearson | 2007 |
JAligner | Implementación Java de código abierto de Smith-Waterman | Ambas cosas | Local | A. Moustafa | 2005 |
K * Sincronización | Secuencia de proteínas a alineación de estructura que incluye estructura secundaria, conservación estructural, perfiles de secuencia derivados de la estructura y puntuaciones de alineación de consenso | Proteína | Ambas cosas | D. Chivian y D. Baker [23] | 2003 |
LALIGN | Similitud local múltiple, no superpuesta (mismo algoritmo que SIM) | Ambas cosas | Local no superpuesto | W. Pearson | 1991 (algoritmo) |
NW-alinear | Algoritmo de programación dinámica estándar de Needleman-Wunsch | Proteína | Global | Y Zhang | 2012 |
maligno | modelado de alineación; modela el contenido de información de las secuencias | Nucleótido | Ambas cosas | D. Powell, L. Allison y TI Dix | 2004 |
comparador | Alineación local Waterman-Eggert (basado en LALIGN) | Ambas cosas | Local | I. Longden (modificado de W. Pearson) | 1999 |
MCALIGN2 | modelos explícitos de evolución indel | ADN | Global | J. Wang y col. | 2006 |
Máscara | sufijo basado en árbol | Nucleótido | Global | S. Kurtz y col. | 2004 |
aguja | Programación dinámica Needleman-Wunsch | Ambas cosas | SemiGlobal | A. Bleasby | 1999 |
Ngila | Costos de brecha logarítmica y afín y modelos explícitos de evolución indele | Ambas cosas | Global | R. Cartwright | 2007 |
noroeste | Programación dinámica Needleman-Wunsch | Ambas cosas | Global | ACR Martín | 1990-2015 |
parasail | Biblioteca de programación dinámica C / C ++ / Python / Java SIMD para SSE, AVX2 | Ambas cosas | Global, sin fines, local | J. Diario | 2015 |
Camino | Smith-Waterman en proteínas Back traducción gráfica (detecta marco de lectura a nivel de proteína) | Proteína | Local | M. Gîrdea y col. [24] | 2009 |
PatrónCazador | Coincidencia de patrones sembrados | Nucleótido | Local | B. Ma y col. [25] [26] | 2002-2004 |
ProbA (también propA) | Muestreo de función de partición estocástica mediante programación dinámica | Ambas cosas | Global | U. Mückstein | 2002 |
PyMOL | El comando "alinear" alinea la secuencia y la aplica a la estructura | Proteína | Global (por selección) | WL DeLano | 2007 |
REPUT | sufijo basado en árbol | Nucleótido | Local | S. Kurtz y col. | 2001 |
SABERTOOTH | Alineación mediante perfiles de conectividad previstos | Proteína | Global | F. Teichert, J. Minning, U. Bastolla y M. Porto | 2009 |
Satsuma | Alineaciones paralelas de sinteno de genoma completo | ADN | Local | MG Grabherr y col. | 2010 |
SEQALN | Varias programaciones dinámicas | Ambas cosas | Local o global | MS Waterman y P. Hardy | 1996 |
SIM, GAP, SIESTA, VUELTA | Similitud local con diferentes tratamientos de brechas | Ambas cosas | Local o global | X. Huang y W. Miller | 1990-6 |
SIM | Similitud local | Ambas cosas | Local | X. Huang y W. Miller | 1991 |
SPA: Alineación súper por pares | Alineación global rápida por pares | Nucleótido | Global | Shen, Yang, Yao, Hwang | 2002 |
BÚSQUEDA | Alineación local ( Smith-Waterman ) con estadísticas | Proteína | Local | W. Pearson | 1981 (algoritmo) |
Estudio de secuencias | Applet de Java que muestra varios algoritmos de [27] | Secuencia genérica | Local y global | A.Meskauskas | 1997 (libro de referencia) |
SWIFOLD | Aceleración Smith-Waterman en FPGA de Intel con OpenCL para secuencias de ADN largas | Nucleótido | Local | E. Rucci [28] [29] | 2017-2018 |
Traje SWIFT | Búsqueda rápida de alineación local | ADN | Local | K. Rasmussen, [30] W. Gerlach | 2005,2008 |
camilla | Programación dinámica Needleman-Wunsch con memoria optimizada | Ambas cosas | Global | I. Longden (modificado de G. Myers y W. Miller) | 1999 |
tranalign | Alinea las secuencias de ácidos nucleicos con una alineación de proteínas. | Nucleótido | N / A | G. Williams (modificado de B. Pearson) | 2002 |
UGENE | Fuente abierta Smith-Waterman para SSE / CUDA, buscador de repeticiones y diagrama de puntos basados en matrices de sufijos | Ambas cosas | Ambas cosas | UniPro | 2010 |
agua | Programación dinámica Smith-Waterman | Ambas cosas | Local | A. Bleasby | 1999 |
palabra | k -tuple coincidencia por pares | Ambas cosas | N / A | I. Longden | 1998 |
YASS | Coincidencia de patrones sembrados | Nucleótido | Local | L. Noe y G. Kucherov [31] | 2004 |
* Tipo de secuencia: proteína o nucleótido ** Tipo de alineación: local o global
Alineación de múltiples secuencias
Nombre | Descripción | Tipo de secuencia * | Tipo de alineación ** | Autor | Año | Licencia |
---|---|---|---|---|---|---|
ABA | Alineación A-Bruijn | Proteína | Global | B.Raphael y col. | 2004 | Propietario , software gratuito para educación, investigación, sin fines de lucro |
CERVEZA INGLESA | alineación manual; algo de asistencia de software | Nucleótidos | Local | J. Blandy y K. Fogel | 1994 (última versión 2007) | Gratis, GPL 2 |
ALLALIGN | Para moléculas de ADN, ARN y proteínas de hasta 32 MB, alinea todas las secuencias de tamaño K o superior, MSA o dentro de una sola molécula. Las alineaciones similares se agrupan para su análisis. Filtro automático de secuencia repetitiva. | Ambas cosas | Local | E. Wachtel | 2017 | Libre |
UN MAPA | Recocido de secuencia | Ambas cosas | Global | A. Schwartz y L. Pachter | 2006 | |
luego. | alineación rápida y óptima de tres secuencias utilizando costes de huecos lineales | Nucleótidos | Global | D. Powell, L. Allison y TI Dix | 2000 | |
BAli-Phy | Árbol + alineación múltiple; probabilístico-bayesiano; estimación conjunta | Ambos + Codones | Global | BD Redelings y MA Suchard | 2005 (última versión 2018) | Gratis, GPL |
Base por base | Editor de alineación de múltiples secuencias basado en Java con herramientas de análisis integradas | Ambas cosas | Local o global | R. Brodie y col. | 2004 | Propietario , software gratuito , debe registrarse |
CAOS, DIALIGN | Alineación iterativa | Ambas cosas | Local (preferido) | M. Brudno y B. Morgenstern | 2003 | |
Clúster W | Alineación progresiva | Ambas cosas | Local o global | Thompson y col. | 1994 | Gratis, LGPL |
Alineador CodonCode | Multi-alineación; Compatibilidad con ClustalW y Phrap | Nucleótidos | Local o global | P. Richterich y col. | 2003 (última versión 2009) | |
Brújula | Comparación de múltiples alineaciones de secuencias de proteínas con la evaluación de la significación estadística | Proteína | Global | RI Sadreyev y col. | 2009 | |
DESCIFRAR | Alineación progresiva-iterativa | Ambas cosas | Global | Erik S. Wright | 2014 | Gratis, GPL |
DIALIGN-TX y DIALIGN-T | Método basado en segmentos | Ambas cosas | Local (preferido) o Global | ARSubramanian | 2005 (última versión 2008) | |
Alineación de ADN | Método basado en segmentos para alineaciones intraespecíficas | Ambas cosas | Local (preferido) o Global | A.Roehl | 2005 (última versión 2008) | |
Ensamblador de secuencia básica de ADN | Multi-alineación; Alineación de secuencia completamente automática; Corrección automática de ambigüedad; Llamador de base interno; Alineación de secuencia de línea de comando | Nucleótidos | Local o global | Heracle BioSoft SRL | 2006 (última versión 2018) | Comercial (algunos módulos son gratuitos) |
DNADynamo | ADN vinculado a proteína alineación múltiple con MUSCLE , Clustal y Smith-Waterman | Ambas cosas | Local o global | DNADynamo | 2004 (versión más reciente 2017) | |
Suite de biología molecular DNASTAR Lasergene | Software para alinear secuencias de ADN, ARN, proteína o ADN + proteína a través de algoritmos de alineación de secuencia múltiple y por pares que incluyen análisis MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson y Dotplot. | Ambas cosas | Local o global | DNASTAR | 1993-2016 | |
EDNA | Alineación de secuencias múltiples basada en energía para sitios de unión de ADN | Nucleótidos | Local o global | Salama, RA. et al. | 2013 | |
FAMSA | Alineación progresiva para familias de proteínas extremadamente grandes (cientos de miles de miembros) | Proteína | Global | Deorowicz y col. | 2016 | |
FSA | Recocido de secuencia | Ambas cosas | Global | RK Bradley y col. | 2008 | |
Generoso | Alineación progresiva-iterativa; Complemento ClustalW | Ambas cosas | Local o global | AJ Drummond y col. | 2005 (última versión 2017) | |
Kalign | Alineación progresiva | Ambas cosas | Global | T. Lassmann | 2005 | |
MAFFT | Alineación progresiva-iterativa | Ambas cosas | Local o global | K. Katoh y col. | 2005 | Gratis, BSD |
MARNA | Multi-alineación de ARN | ARN | Local | S. Siebert y col. | 2005 | |
MAVID | Alineación progresiva | Ambas cosas | Global | N. Bray y L. Pachter | 2004 | |
MSA | Programación dinámica | Ambas cosas | Local o global | DJ Lipman y col. | 1989 (modificado en 1995) | |
MSAProbs | Programación dinámica | Proteína | Global | Y. Liu, B. Schmidt, D. Maskell | 2010 | |
MULTALIN | Agrupación dinámica de programación | Ambas cosas | Local o global | F. Corpet | 1988 | |
Multi-LAGAN | Alineación de programación dinámica progresiva | Ambas cosas | Global | M. Brudno y col. | 2003 | |
MÚSCULO | Alineación progresiva-iterativa | Ambas cosas | Local o global | R. Edgar | 2004 | |
Ópalo | Alineación progresiva-iterativa | Ambas cosas | Local o global | T. Wheeler y J. Kececioglu | 2007 (última versión estable de 2013, última versión beta de 2016) | |
Pacana | Consistencia probabilística | ADN | Global | B. Paten y col. | 2008 | |
Phylo | Un marco informático humano para la genómica comparativa para resolver la alineación múltiple | Nucleótidos | Local o global | McGill Bioinformática | 2010 | |
PMFastR | Alineación progresiva consciente de la estructura | ARN | Global | D. DeBlasio, J Braund, S Zhang | 2009 | |
Almendra garapiñada | Alineación extendida de homología de consistencia progresiva iterativa con preperfilado y predicción de estructura secundaria | Proteína | Global | J. Heringa | 1999 (última versión 2009) | |
PicXAA | Alineación no progresiva, máxima precisión esperada | Ambas cosas | Global | SME Sahraeian y BJ Yoon | 2010 | |
POA | Orden parcial / modelo de Markov oculto | Proteína | Local o global | C. Lee | 2002 | |
Probalign | Probabilística / coherencia con las probabilidades de la función de partición | Proteína | Global | Roshan y Livesay | 2006 | Libre, dominio público |
ProbCons | Probabilista / consistencia | Proteína | Local o global | C. Do et al. | 2005 | Libre, dominio público |
PROMALES3D | Alineación progresiva / modelo de Markov oculto / Estructura secundaria / Estructura 3D | Proteína | Global | J. Pei y col. | 2008 | |
PRRN / PRRP | Alineación iterativa (especialmente refinamiento) | Proteína | Local o global | Y. Totoki (basado en O. Gotoh) | 1991 y posteriores | |
PSAlign | Alineación que preserva no heurística | Ambas cosas | Local o global | SH Sze, Y. Lu, Q. Yang. | 2006 | |
RevTrans | Combina la alineación de ADN y proteínas, mediante la traducción inversa de la alineación de proteínas a ADN. | ADN / Proteína (especial) | Local o global | Wernersson y Pedersen | 2003 (versión más reciente 2005) | |
SAGA | Alineación de secuencia por algoritmo genético | Proteína | Local o global | C. Notredame y col. | 1996 (nueva versión 1998) | |
SAM | Modelo de Markov oculto | Proteína | Local o global | A. Krogh y col. | 1994 (versión más reciente 2002) | |
Sello | Alineación manual | Ambas cosas | Local | A. Rambaut | 2002 | |
StatAlign | Coestimación bayesiana de alineación y filogenia (MCMC) | Ambas cosas | Global | A. Novak y col. | 2008 | |
Stemloc | Predicción de alineación múltiple y estructura secundaria | ARN | Local o global | I. Holmes | 2005 | Gratis, GPL 3 (parte de DART ) |
T-Coffee | Alineación progresiva más sensible | Ambas cosas | Local o global | C. Notredame y col. | 2000 (versión más reciente 2008) | Gratis, GPL 2 |
UGENE | Soporta alineación múltiple con MUSCLE , Kalign, Clustal y Mafft plugins | Ambas cosas | Local o global | Equipo UGENE | 2010 (versión más reciente 2020) | Gratis, GPL 2 |
VectorAmigos | VectorFriends Aligner, complemento MUSCLE y complemento Clustal W | Ambas cosas | Local o global | Equipo de BioFriends | 2013 | Software gratuito y patentado para uso académico |
GLProbs | Enfoque basado en el modelo de Markov oculto de pares adaptativos | Proteína | Global | Y. Ye y col. | 2013 |
* Tipo de secuencia: proteína o nucleótido. ** Tipo de alineación: local o global
Análisis genómico
Nombre | Descripción | Tipo de secuencia * | |
---|---|---|---|
ÁGUILA [32] | Una herramienta ultrarrápida para encontrar palabras relativamente ausentes en datos genómicos | Nucleótido | |
ACT (Herramienta de comparación de Artemis) | Synteny y genómica comparada | Nucleótido | |
ÁVIDO | Alineación global por pares con genomas completos | Nucleótido | |
BLAT | Alineación de secuencias de ADNc a un genoma. | Nucleótido | |
DESCIFRAR | Alineación de genomas reorganizados mediante traducción de 6 cuadros | Nucleótido | |
REPROCHES | Alineación y análisis difusos del genoma completo | Nucleótido | |
GMAP | Alineación de secuencias de ADNc a un genoma. Identifica las uniones del sitio de empalme con alta precisión. | Nucleótido | |
Splign | Alineación de secuencias de ADNc a un genoma. Identifica las uniones del sitio de empalme con alta precisión. Capaz de reconocer y separar duplicaciones de genes. | Nucleótido | |
Color de malva | Alineación múltiple de genomas reorganizados | Nucleótido | |
MGA | Alineador de múltiples genomas | Nucleótido | |
Mulan | Múltiples alineamientos locales de secuencias de longitud del genoma | Nucleótido | |
Multiz | Múltiple alineación de genomas | Nucleótido | |
PLAST-ncRNA | Búsqueda de ncRNA en genomas por alineación local de función de partición | Nucleótido | |
Sequerome | Perfiles de datos de alineación de secuencias con los principales servidores / servicios | Nucleótido, péptido | |
Sequilab | Perfiles de datos de alineación de secuencias a partir de resultados NCBI-BLAST con los principales servicios de servidor | Nucleótido, péptido | |
Shuffle-LAGAN | Alineación glocal por pares de regiones genómicas completas | Nucleótido | |
SIBsim4, Sim4 | Un programa diseñado para alinear una secuencia de ADN expresada con una secuencia genómica, permitiendo intrones | Nucleótido | |
GOLPE | Búsqueda de genes, alineación, anotación (identificación de homología humano-ratón) | Nucleótido | |
SRPRISM | Un alineador eficiente para montajes con garantías explícitas, alineando lecturas sin empalmes | Nucleótido |
* Tipo de secuencia: proteína o nucleótido
Encontrar motivo
Nombre | Descripción | Tipo de secuencia * |
---|---|---|
Síndrome premenstrual | Búsqueda y descubrimiento de motivos | Ambas cosas |
FMM | Búsqueda y descubrimiento de motivos (también puede obtener secuencias positivas y negativas como entrada para la búsqueda de motivos enriquecidos) | Nucleótido |
BLOQUES | Identificación de motivos sin espacios de la base de datos BLOCKS | Ambas cosas |
eMOTIF | Extracción e identificación de motivos más cortos | Ambas cosas |
Muestreador de motivos Gibbs | Extracción de motivos estocásticos por probabilidad estadística | Ambas cosas |
HMMTOP | Predicción de hélices transmembrana y topología de proteínas. | Proteína |
I-sitios | Biblioteca de motivos de estructura local | Proteína |
JCoils | Predicción de bobina en espiral y cremallera de leucina | Proteína |
MEME / MASTIL | Descubrimiento y búsqueda de motivos | Ambas cosas |
CUDA-MEME | Algoritmo MEME (v4.4.0) acelerado por GPU para clústeres de GPU | Ambas cosas |
MERCI | Búsqueda y descubrimiento de motivos discriminativos | Ambas cosas |
PHI-Blast | Herramienta de búsqueda y alineación de motivos | Ambas cosas |
Phyloscan | Herramienta de búsqueda de motivos | Nucleótido |
PRATT | Generación de patrones para usar con ScanProsite | Proteína |
ScanProsite | Herramienta de búsqueda de base de datos de Motif | Proteína |
TEIRESIAS | Extracción de motivos y búsqueda en bases de datos | Ambas cosas |
BASALTO | Búsqueda de múltiples motivos y expresiones regulares | Ambas cosas |
* Tipo de secuencia: proteína o nucleótido
Benchmarking
Nombre | Autores |
---|---|
PFAM 30.0 (2016) | |
INTELIGENTE (2015) | Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork |
BAliBASE 3 (2015) | Thompson, Plewniak, Poch |
Oxbench (2011) | Raghava, Searle, Audley, Barbero, Barton |
Colección Benchmark (2009) | Edgar |
HOMSTRAD (2005) | Mizuguchi |
PREFAB 4.0 (2005) | Edgar |
SABmark (2004) | Van Walle, Lasters, Wyns |
Visores de alineación, editores
Consulte la Lista de software de visualización de alineación .
Alineación de secuencia de lectura corta
Nombre | Descripción | opción de extremo emparejado | Utilice la calidad FASTQ | Huecos | Multiproceso | Licencia | Referencia | Año |
---|---|---|---|---|---|---|---|---|
Arioc | Calcula alineaciones con huecos de Smith-Waterman y calidades de mapeo en una o más GPU. Admite alineaciones BS-seq. Procesa de 100.000 a 500.000 lecturas por segundo (varía según los datos, el hardware y la sensibilidad configurada). | sí | No | sí | sí | Gratis, BSD | [33] | 2015 |
Barracuda | Un programa de alineación de lectura corta de transformación de Burrows-Wheeler (índice FM) acelerado por GPGPU basado en BWA, admite la alineación de indeles con aberturas y extensiones de huecos. | sí | No | sí | Sí, POSIX Threads y CUDA | Gratis, GPL | ||
BBMap | Utiliza un kmers corto para indexar rápidamente el genoma; sin límite de tamaño o cantidad de andamios. Mayor sensibilidad y especificidad que los alineadores Burrows-Wheeler, con velocidad similar o mayor. Realiza una alineación global optimizada por transformación afín, que es más lenta pero más precisa que Smith-Waterman. Maneja datos de Illumina, 454, PacBio, Sanger e Ion Torrent. Consciente de empalmes; capaz de procesar indeles largos y RNA-seq. Java puro; se ejecuta en cualquier plataforma. Utilizado por el Joint Genome Institute . | sí | sí | sí | sí | Gratis, BSD | 2010 | |
MEJOR | Compensación explícita de tiempo y precisión con una estimación de precisión previa, respaldada por la indexación de las secuencias de referencia. Comprime de forma óptima los índices. Puede manejar miles de millones de lecturas cortas. Puede manejar inserciones, eliminaciones, SNP y errores de color (puede mapear lecturas de espacio de color ABI SOLiD). Realiza una alineación completa de Smith Waterman. | Sí, hilos POSIX | Gratis, GPL | [34] | 2009 | |||
BigBWA | Ejecuta Burrows-Wheeler Aligner -BWA en un clúster Hadoop . Admite los algoritmos BWA-MEM, BWA-ALN y BWA-SW, y trabaja con lecturas emparejadas y únicas. Implica una reducción importante en el tiempo computacional cuando se ejecuta en un clúster Hadoop, agregando escalabilidad y tolerancia a fallas. | sí | Recorte de bases de baja calidad | sí | sí | Gratis, GPL 3 | [35] | 2015 |
BLASTN | El programa de alineación de nucleótidos de BLAST, lento y no preciso para lecturas cortas, utiliza una base de datos de secuencias (EST, secuencia de Sanger) en lugar de un genoma de referencia. | |||||||
BLAT | Hecho por Jim Kent . Puede manejar un desajuste en el paso de alineación inicial. | Si, cliente-servidor | Patentada , software gratuito para uso no comercial y académica | [36] | 2002 | |||
Corbata de moño | Utiliza una transformación de Burrows-Wheeler para crear un índice del genoma permanente y reutilizable; Huella de memoria de 1,3 GB para el genoma humano. Alinea más de 25 millones de lecturas de Illumina en 1 hora de CPU. Admite políticas de alineación similares a Maq y SOAP | sí | sí | No | Sí, hilos POSIX | Libre, Artístico | [37] | 2009 |
BWA | Utiliza una transformación de Burrows-Wheeler para crear un índice del genoma. Es un poco más lento que Bowtie pero permite alinear indeles. | sí | Recorte de bases de baja calidad | sí | sí | Gratis, GPL | [38] | 2009 |
BWA-PSSM | Un alineador probabilístico de lectura corta basado en el uso de matrices de puntuación específicas de posición (PSSM). El alineador es adaptable en el sentido de que puede tener en cuenta las puntuaciones de calidad de las lecturas y modelos de sesgos específicos de datos, como los observados en ADN antiguo, datos PAR-CLIP o genomas con composiciones de nucleótidos sesgadas. [39] | sí | sí | sí | sí | Gratis, GPL | [39] | 2014 |
EFECTIVO | Cuantifique y administre grandes cantidades de datos de secuencia de lectura corta. La canalización CASHX contiene un conjunto de herramientas que se pueden usar juntas o por separado como módulos. Este algoritmo es muy preciso para aciertos perfectos en un genoma de referencia. | No | Patentada , software gratuito para uso no comercial y académica | |||||
Chaparrón | Mapeo de lectura corta con Hadoop MapReduce | Sí, Hadoop MapReduce | Libre, Artístico | |||||
CUDA-EC | Corrección de errores de alineación de lectura corta mediante GPU. | Sí, GPU habilitado | ||||||
CUSHAW | Un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler | sí | sí | No | Sí (GPU habilitado) | Gratis, GPL | [40] | 2012 |
CUSHAW2 | Alineación con brechas de lectura corta y larga basada en semillas de coincidencia exacta máxima. Este alineador admite tanto el espacio base (p. Ej., De los secuenciadores Illumina, 454, Ion Torrent y PacBio) como las alineaciones de lectura del espacio de color ABI SOLiD. | sí | No | sí | sí | Gratis, GPL | 2014 | |
CUSHAW2-GPU | Alineador de lectura corta CUSHAW2 acelerado por GPU. | sí | No | sí | sí | Gratis, GPL | ||
CUSHAW3 | Alineación de lectura corta sensible y precisa del espacio base y del espacio de color con siembra híbrida | sí | No | sí | sí | Gratis, GPL | [41] | 2012 |
drFAST | Software de alineación de mapas de lectura que implementa el olvido de la caché para minimizar las transferencias de memoria principal / caché como mrFAST y mrsFAST, pero diseñado para la plataforma de secuenciación SOLiD (lecturas de espacio de color). También devuelve todas las ubicaciones posibles del mapa para mejorar el descubrimiento de variaciones estructurales. | sí | Sí, por variación estructural | sí | No | Gratis, BSD | ||
ELANDO | Implementado por Illumina. Incluye alineación sin espacios con una longitud de lectura finita. | |||||||
ERNE | Alineador numérico aleatorio extendido para una alineación precisa de las lecturas de NGS. Puede mapear lecturas tratadas con bisulfito. | sí | Recorte de bases de baja calidad | sí | Multihilo y habilitado para MPI | Gratis, GPL 3 | ||
GASSST | Encuentra alineaciones globales de secuencias cortas de ADN frente a grandes bancos de ADN | Subprocesos múltiples | Licencia CeCILL versión 2. | [42] | 2011 | |||
JOYA | Motor de alineación de alta calidad (mapeo exhaustivo con sustituciones e indels). Más preciso y varias veces más rápido que BWA o Bowtie 1/2. Se proporcionan muchas aplicaciones biológicas independientes (mapeador, mapeador dividido, mapeo y otras). | sí | sí | sí | sí | Gratis, GPL 3 | [43] | 2012 |
Mapa de Genalice | Alineador de lectura NGS ultrarrápido y completo con alta precisión y espacio de almacenamiento reducido. | sí | Recorte de bases de baja calidad | sí | sí | Propietario , comercial | ||
Ensamblador generoso | Ensamblador de superposición rápido y preciso con la capacidad de manejar cualquier combinación de tecnología de secuenciación, longitud de lectura, cualquier orientación de emparejamiento, con cualquier tamaño de espaciador para el emparejamiento, con o sin un genoma de referencia. | sí | Propietario , comercial | |||||
GensearchNGS | Marco completo con GUI fácil de usar para analizar datos NGS. Integra un algoritmo de alineación patentado de alta calidad y la capacidad de complemento para integrar varios alineadores públicos en un marco que permite importar lecturas cortas, alinearlas, detectar variantes y generar informes. Está hecho para volver a secuenciar proyectos, es decir, en un entorno de diagnóstico. | sí | No | sí | sí | Propietario , comercial | ||
GMAP y GSNAP | Alineación robusta y rápida de lectura corta. GMAP: lecturas más largas, con múltiples indeles y empalmes (consulte la entrada anterior en Análisis genómico); GSNAP: lecturas más cortas, con una indel o hasta dos empalmes por lectura. Útil para la expresión de genes digitales, SNP y genotipado indel. Desarrollado por Thomas Wu en Genentech. Utilizado por el Centro Nacional de Recursos Genómicos (NCGR) en Alpheus. | sí | sí | sí | sí | Patentada , software gratuito para uso no comercial y académica | ||
GNUMAP | Realiza con precisión la alineación con huecos de los datos de secuencia obtenidos de las máquinas de secuenciación de próxima generación (específicamente de Solexa-Illumina) de nuevo a un genoma de cualquier tamaño. Incluye recorte de adaptador, llamada SNP y análisis de secuencia de bisulfito. | Sí, también admite archivos Illumina * _int.txt y * _prb.txt con los 4 puntajes de calidad para cada base | Multihilo y habilitado para MPI | [44] | 2009 | |||
HIVE-hexágono | Utiliza una tabla hash y una matriz de floración para crear y filtrar posiciones potenciales en el genoma. Para una mayor eficiencia, utiliza la similitud cruzada entre lecturas cortas y evita realinear secuencias redundantes no únicas. Es más rápido que Bowtie y BWA y permite indeles y alineaciones sensibles divergentes en virus, bacterias y alineaciones eucariotas más conservadoras. | sí | sí | sí | sí | Patentada , software gratuito para los usuarios académicos y no comerciales registrado a instancia de implementación COLMENA | [45] | 2014 |
IMOS | Meta-alineador mejorado y Minimap2 en Spark. Un alineador distribuido de lectura larga en la plataforma Apache Spark con escalabilidad lineal con ejecución de un solo nodo. | sí | sí | sí | Libre | |||
Isaac | Utiliza completamente toda la potencia informática disponible en un nodo de servidor; por lo tanto, se escala bien en una amplia gama de arquitecturas de hardware y el rendimiento de alineación mejora con las capacidades del hardware | sí | sí | sí | sí | Gratis, GPL | ||
ÚLTIMO | Utiliza semillas adaptativas y hace frente de manera más eficiente a secuencias ricas en repeticiones (por ejemplo, genomas). Por ejemplo: puede alinear las lecturas con los genomas sin repetición de enmascaramiento, sin sentirse abrumado por golpes repetitivos. | sí | sí | sí | sí | Gratis, GPL | [46] | 2011 |
MAQ | Alineación sin huecos que tiene en cuenta los puntajes de calidad de cada base. | Gratis, GPL | ||||||
mrFAST, mrsFAST | Software de alineación con huecos (mrFAST) y sin huecos (mrsFAST) que implementa el olvido de la caché para minimizar las transferencias de memoria principal / caché. Están diseñados para la plataforma de secuenciación de Illumina y pueden devolver todas las ubicaciones de mapas posibles para mejorar el descubrimiento de variaciones estructurales. | sí | Sí, por variación estructural | sí | No | Gratis, BSD | ||
MAMÁ | MOM o mapeo máximo de oligonucleótidos es una herramienta de búsqueda de coincidencias que captura una coincidencia de longitud máxima dentro de la lectura corta. | sí | ||||||
MOSAIK | Alineador de brechas rápidas y ensamblador guiado por referencia. Alinea las lecturas utilizando un algoritmo de Smith-Waterman con bandas sembrado por los resultados de un esquema de hash k-mer. Admite lecturas que varían en tamaño, desde muy cortas hasta muy largas. | sí | ||||||
MPscan | Alineador rápido basado en una estrategia de filtración (sin indexación, use q-gramos y coincidencia DAWG no determinista hacia atrás ) | [47] | 2009 | |||||
Novoalign y NovoalignCS | Alineación con huecos de un solo extremo y un extremo emparejado Illumina GA I y II, espacio de color ABI y lecturas ION Torrent. Alta sensibilidad y especificidad, utilizando cualidades de base en todos los pasos de la alineación. Incluye recorte del adaptador, calibración de calidad base, alineación Bi-Seq y opciones para informar múltiples alineaciones por lectura. El uso de códigos IUPAC ambiguos en referencia a SNP comunes puede mejorar la recuperación de SNP y eliminar el sesgo alélico. | sí | sí | sí | Versiones multiproceso y MPI disponibles con licencia paga | Versión patentada y gratuita de un solo subproceso para uso académico y no comercial | ||
NextGENe | Desarrollado para su uso por biólogos que realizan análisis de datos de secuenciación de próxima generación de las plataformas Roche Genome Sequencer FLX, Illumina GA / HiSeq, Life Technologies Applied BioSystems 'SOLiD System, PacBio e Ion Torrent. | sí | sí | sí | sí | Propietario , comercial | ||
NextGenMap | Programa de mapeo de lectura rápida y flexible (dos veces más rápido que BWA), logra una sensibilidad de mapeo comparable a Stampy. Utiliza internamente una estructura de índice de memoria eficiente (tabla hash) para almacenar las posiciones de todos los 13-mers presentes en el genoma de referencia. Las regiones de mapeo donde se requieren alineaciones por pares se determinan dinámicamente para cada lectura. Utiliza instrucciones SIMD rápidas (SSE) para acelerar los cálculos de alineación en la CPU. Si está disponible, las alineaciones se calculan en GPU (usando OpenCL / CUDA) reduciendo aún más el tiempo de ejecución entre un 20 y un 50%. | sí | No | sí | Sí, hilos POSIX , OpenCL / CUDA , SSE | Libre | [48] | 2013 |
Kit de herramientas de variantes de Omixon | Incluye herramientas de alta sensibilidad y precisión para detectar SNP e indels. Ofrece una solución para mapear lecturas cortas de NGS con una distancia moderada (hasta un 30% de divergencia de secuencia) de los genomas de referencia. No impone restricciones en el tamaño de la referencia, lo que, combinado con su alta sensibilidad, hace que Variant Toolkit sea adecuado para proyectos de secuenciación y diagnósticos específicos. | sí | sí | sí | sí | Propietario , comercial | ||
PALMapper | Calcula eficientemente alineaciones empalmadas y no empalmadas con alta precisión. Basándose en una estrategia de aprendizaje automático combinada con un mapeo rápido basado en un algoritmo tipo Smith-Waterman con bandas, alinea alrededor de 7 millones de lecturas por hora en una CPU. Refina el enfoque QPALMA propuesto originalmente. | sí | Gratis, GPL | |||||
Partek Flow | Para uso de biólogos y bioinformáticos. Es compatible con la alineación sin espacios, con espacios y empalmes a partir de lecturas de extremos únicos y emparejados de Illumina, Life Technologies Solid TM, Roche 454 e Ion Torrent datos sin procesar (con o sin información de calidad). Integra un potente control de calidad a nivel FASTQ / Qual y en datos alineados. Las funciones adicionales incluyen el recorte y filtrado de lecturas sin procesar, detección de SNP e InDel, cuantificación de ARNm y microARN y detección de genes de fusión. | sí | sí | sí | Posibilidad de instalación de núcleo multiprocesador, cliente-servidor | Versión de prueba patentada , comercial y gratuita | ||
APROBAR | Indexa el genoma y luego extiende las semillas utilizando alineaciones de palabras precalculadas. Funciona con el espacio base, el espacio de color (SOLID) y puede alinear lecturas de secuencia de ARN empalmadas y genómicas. | sí | sí | sí | sí | Patentada , software gratuito para uso no comercial y académica | ||
Permanente | Indexa el genoma con semillas periódicas para encontrar rápidamente alineaciones con total sensibilidad hasta cuatro desajustes. Puede mapear lecturas de Illumina y SOLiD. A diferencia de la mayoría de los programas de mapas, la velocidad aumenta para longitudes de lectura más largas. | sí | Gratis, GPL | [49] | ||||
PRIMEX | Indexa el genoma con una tabla de búsqueda de k-mer con sensibilidad completa hasta un número ajustable de desajustes. Es mejor para mapear secuencias de 15 a 60 pb en un genoma. | No | No | sí | No, múltiples procesos por búsqueda | [1] | 2003 | |
QPalma | Puede utilizar puntuaciones de calidad, longitudes de intrones y predicciones de sitios de empalme de cálculo para realizar y realiza una alineación insesgada. Se puede entrenar para los detalles específicos de un experimento y genoma de RNA-seq. Útil para el descubrimiento de intrones / sitios de empalme y para la construcción de modelos genéticos. (Consulte PALMapper para obtener una versión más rápida). | Si, cliente-servidor | Gratis, GPL 2 | |||||
RazerS | Sin límite de longitud de lectura. Hamming o edición de mapas de distancia con tasas de error configurables. Sensibilidad configurable y predecible (compensación de tiempo de ejecución / sensibilidad). Admite mapeo de lectura de extremo emparejado. | Gratis, LGPL | ||||||
REAL, CREAL | REAL es una herramienta eficiente, precisa y sensible para alinear lecturas cortas obtenidas de la secuenciación de próxima generación. El programa puede manejar una enorme cantidad de lecturas de un solo extremo generadas por el analizador de genoma Illumina / Solexa de próxima generación. cREAL es una extensión simple de REAL para alinear lecturas cortas obtenidas de la secuenciación de próxima generación a un genoma con estructura circular. | sí | sí | Gratis, GPL | ||||
RMAP | Puede mapear lecturas con o sin información de probabilidad de error (puntajes de calidad) y admite lecturas de extremos emparejados o mapeo de lectura tratado con bisulfito. No hay limitaciones en la longitud de lectura o el número de discrepancias. | sí | sí | sí | Gratis, GPL 3 | |||
ARN | Un alineador numérico aleatorio para una alineación precisa de las lecturas de NGS | sí | Recorte de bases de baja calidad | sí | Multihilo y habilitado para MPI | Gratis, GPL 3 | ||
Investigador RTG | Extremadamente rápido, tolerante a altos recuentos de indel y sustitución. Incluye alineación de lectura completa. El producto incluye tuberías integrales para la detección de variantes y el análisis metagenómico con cualquier combinación de datos de Illumina, Complete Genomics y Roche 454. | sí | Sí, para llamadas variantes | sí | sí | Software gratuito y patentado para uso individual de investigadores | ||
Segemehl | Puede manejar inserciones, eliminaciones, desajustes; utiliza matrices de sufijos mejoradas | sí | No | sí | sí | Software gratuito y patentado para uso no comercial | [50] | 2009 |
SeqMap | Hasta 5 sustituciones mixtas e inserciones-deleciones; varias opciones de ajuste y formatos de entrada-salida | Patentada , software gratuito para uso no comercial y académica | ||||||
Shrec | Corrección de errores de lectura breve con una estructura de datos de árbol de sufijos | Sí, Java | ||||||
Camarón | Indexa el genoma de referencia a partir de la versión 2. Utiliza máscaras para generar posibles claves. Puede mapear lecturas de espacio de color ABI SOLiD. | sí | sí | sí | Sí, OpenMP | Gratis, [[Licencias BSD | style = "background: #ddfd; color: black; vertical-align: middle; text-align: center;" class = "free table-free" | Gratis, BSD ]] derivado | [51] [52] | 2009-2011 |
DESLIZADOR | Slider es una aplicación para la salida del analizador de secuencias de Illumina que utiliza los archivos de "probabilidad" en lugar de los archivos de secuencia como entrada para la alineación con una secuencia de referencia o un conjunto de secuencias de referencia. | sí | sí | No | No | [53] [54] | 2009-2010 | |
SOAP, SOAP2, SOAP3, SOAP3-dp | SOAP: robusto con un número pequeño (1-3) de lagunas y desajustes. Mejora de velocidad sobre BLAT, utiliza una tabla hash de 12 letras. SOAP2: usa BWT bidireccional para construir el índice de referencia, y es mucho más rápido que la primera versión. SOAP3: versión acelerada por GPU que podría encontrar las 4 alineaciones de desajuste en decenas de segundos por cada millón de lecturas. SOAP3-dp, también acelerado por GPU, admite un número arbitrario de desajustes y brechas de acuerdo con puntuaciones de penalización por brechas afines. | sí | No | Sí, SOAP3-dp | Sí, POSIX Threads ; SOAP3, SOAP3-dp necesitan GPU con soporte CUDA | Gratis, GPL | [55] [56] | |
SOCS | Para tecnologías ABI SOLiD. Aumento significativo del tiempo para asignar lecturas con desajustes (o errores de color). Utiliza una versión iterativa del algoritmo de búsqueda de cadenas de Rabin-Karp. | sí | Gratis, GPL | |||||
SparkBWA | Integra Burrows-Wheeler Aligner —BWA en un marco Apache Spark que se ejecuta sobre Hadoop . La versión 0.2 de octubre de 2016 admite los algoritmos BWA-MEM, BWA-backtrack y BWA-ALN. Todos ellos funcionan con lecturas únicas y lecturas emparejadas. | sí | Recorte de bases de baja calidad | sí | sí | Gratis, GPL 3 | [57] | 2016 |
SSAHA, SSAHA2 | Rápido para un pequeño número de variantes | Patentada , software gratuito para uso no comercial y académica | ||||||
Stampy | Para las lecturas de Illumina. Alta especificidad y sensibilidad para lecturas con indeles, variantes estructurales o muchos SNP. Lento, pero la velocidad aumentó drásticamente al usar BWA para la primera pasada de alineación. | sí | sí | sí | No | Patentada , software gratuito para uso no comercial y académica | [58] | 2010 |
Tormenta | Para lecturas de Illumina o ABI SOLiD, con salida nativa SAM . Muy sensible para lecturas con muchos errores, indels (completo de 0 a 15, soporte extendido en caso contrario). Utiliza semillas espaciadas (un solo golpe) y un filtro de alineación de bandas SSE - SSE2 - AVX2 - AVX-512 muy rápido . Solo para lecturas de longitud fija, los autores recomiendan SHRiMP2 de lo contrario. | No | sí | sí | Sí, OpenMP | Libre | [59] | 2010 |
Subread, Subjunc | Alineadores de lectura ultrarrápidos y precisos. El subpan se puede utilizar para mapear las lecturas de gDNA-seq y RNA-seq. Subjunc detecta las uniones exón-exón y mapea las lecturas de RNA-seq. Emplean un paradigma de mapeo novedoso llamado semilla y voto . | sí | sí | sí | sí | Gratis, GPL 3 | ||
Taipan | Ensamblador de novo para lecturas de Illumina | Patentada , software gratuito para uso no comercial y académica | ||||||
UGENE | Interfaz visual tanto para Bowtie como para BWA, y un alineador integrado | sí | sí | sí | sí | Gratis, GPL | ||
VelociMapper | Herramienta de mapeo de alineación de secuencia de referencia acelerada por FPGA de TimeLogic . Más rápido que los algoritmos basados en transformaciones de Burrows-Wheeler como BWA y Bowtie. Admite hasta 7 desajustes y / o indeles sin penalización de rendimiento. Produce alineaciones con huecos de Smith-Waterman sensibles. | sí | sí | sí | sí | Propietario , comercial | ||
XpressAlign | Alineador de lectura corta de ventana deslizante basado en FPGA que explota la propiedad vergonzosamente paralela de la alineación de lectura corta. El rendimiento escala linealmente con el número de transistores en un chip (es decir, rendimiento garantizado que se duplicará con cada iteración de la Ley de Moore sin modificación del algoritmo). El bajo consumo de energía es útil para equipos de centros de datos. Tiempo de ejecución predecible. Mejor precio / rendimiento que los alineadores de ventana deslizante de software en el hardware actual, pero no mejor que los alineadores de software basados en BWT actualmente. Puede gestionar un gran número (> 2) de desajustes. Encontrará todas las posiciones de impacto para todas las semillas. Versión experimental de FPGA simple, necesita trabajar para desarrollarla en una versión de producción de FPGA múltiple. | Patentada , software gratuito para uso no comercial y académica | ||||||
ZOOM | Sensibilidad del 100% para lecturas entre 15-240 pb con discrepancias prácticas. Muy rapido. Admite inserciones y eliminaciones. Funciona con instrumentos Illumina y SOLiD, no con 454. | Sí (GUI), no (CLI) | Propietario , comercial | [60] |
Ver también
- Lista de software bioinformático de código abierto
Referencias
- ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Molinero; Myers; Lipman (octubre de 1990). "Herramienta básica de búsqueda de alineación local". Revista de Biología Molecular . 215 (3): 403–10. doi : 10.1016 / S0022-2836 (05) 80360-2 . PMID 2231712 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Repositorio de código HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
- ^ Angermüller, C .; Biegert, A .; Söding, J. (diciembre de 2012). "Modelado discriminativo de probabilidades de sustitución de aminoácidos específicas del contexto" . Bioinformática . 28 (24): 3240–7. doi : 10.1093 / bioinformatics / bts622 . PMID 23080114 .
- ^ Buchfink, Xie y Huson (2015). "Alineación de proteínas rápida y sensible usando DIAMOND". Métodos de la naturaleza . 12 (1): 59–60. doi : 10.1038 / nmeth.3176 . PMID 25402007 . S2CID 5346781 .
- ^ B Buchfink, K Reuter y HG Drost (2021). "Alineaciones de proteínas sensibles a escala de árbol de la vida utilizando DIAMOND" . Métodos de la naturaleza . 18 (4): 366–368. doi : 10.1038 / s41592-021-01101-x . PMC 8026399 . PMID 33828273 .
- ^ Durbin, Richard; Eddy, Sean R .; Krogh, Anders ; Mitchison, Graeme, eds. (1998). Análisis de secuencias biológicas: modelos probabilísticos de proteínas y ácidos nucleicos . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3.[ página necesaria ]
- ^ Söding J (abril de 2005). "Detección de homología de proteínas por comparación HMM-HMM" . Bioinformática . 21 (7): 951–60. doi : 10.1093 / bioinformatics / bti125 . PMID 15531603 .
- ^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (25 de diciembre de 2011). "HHblits: búsqueda de secuencias de proteínas iterativas ultrarrápidas por alineación HMM-HMM". Métodos de la naturaleza . 9 (2): 173-175. doi : 10.1038 / nmeth.1818 . hdl : 11858 / 00-001M-0000-0015-8D56-A . ISSN 1548-7105 . PMID 22198341 . S2CID 205420247 .
- ^ Hauswedell H, cantante J, Reinert K (1 de septiembre de 2014). "Lambda: el alineador local de datos biológicos masivos" . Bioinformática . 30 (17): 349–355. doi : 10.1093 / bioinformatics / btu439 . PMC 4147892 . PMID 25161219 .
- ^ Steinegger, Martin; Soeding, Johannes (16 de octubre de 2017). "MMseqs2 permite la búsqueda de secuencias de proteínas sensibles para el análisis de conjuntos de datos masivos" . Biotecnología de la naturaleza . 35 (11): 1026–1028. doi : 10.1038 / nbt.3988 . hdl : 11858 / 00-001M-0000-002E-1967-3 . PMID 29035372 . S2CID 402352 .
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (30 de junio de 2016). "OSWALD: OpenCL Smith-Waterman en FPGA de Altera para grandes bases de datos de proteínas" . Revista internacional de aplicaciones informáticas de alto rendimiento . 32 (3): 337–350. doi : 10.1177 / 1094342016654215 . ISSN 1094-3420 . S2CID 212680914 .
- ^ Altschul SF, Madden TL, Schäffer AA, et al. (Septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda de bases de datos de proteínas" . Investigación de ácidos nucleicos . 25 (17): 3389–402. doi : 10.1093 / nar / 25.17.3389 . PMC 146917 . PMID 9254694 .
- ^ Li W, McWilliam H, Goujon M, et al. (Junio 2012). "PSI-Search: búsqueda iterativa SSEARCH de perfil reducido HOE" . Bioinformática . 28 (12): 1650-1651. doi : 10.1093 / bioinformatics / bts240 . PMC 3371869 . PMID 22539666 .
- ^ Oehmen, C .; Nieplocha, J. (agosto de 2006). "ScalaBLAST: una implementación escalable de BLAST para análisis bioinformático de datos de alto rendimiento" . Transacciones IEEE en sistemas paralelos y distribuidos . 17 (8): 740–749. doi : 10.1109 / TPDS.2006.112 . S2CID 11122366 .
- ^ Hughey, R .; Karplus, K .; Krogh, A. (2003). SAM: sistema de software de alineación y modelado de secuencias. Informe técnico UCSC-CRL-99-11 (Informe). Universidad de California, Santa Cruz, CA.
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25/12/2015). "Un análisis de rendimiento de energía consciente de SWIMM: implementación de Smith-Waterman en las arquitecturas Intel Multicore y Manycore" . Concurrencia y Computación: Práctica y Experiencia . 27 (18): 5517–5537. doi : 10.1002 / cpe.3598 . ISSN 1532-0634 . S2CID 42945406 .
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25/12/2015). "SWIMM 2.0: Smith-Waterman mejorado en las arquitecturas Intel Multicore y Manycore basadas en extensiones vectoriales AVX-512" . Revista Internacional de Programación Paralela . 47 (2): 296–317. doi : 10.1007 / s10766-018-0585-7 . ISSN 1573-7640 . S2CID 49670113 .
- ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Alineaciones humano-ratón con BLASTZ" . Investigación del genoma . 13 (1): 103–107. doi : 10.1101 / gr.809403 . PMC 430961 . PMID 12529312 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Harris RS (2007). Mejora de la alineación por pares del ADN genómico (Tesis).
- ^ Sandes, Edans F. de O .; de Melo, Alba Cristina MA (mayo de 2013). "Recuperación de alineaciones de Smith-Waterman con optimizaciones para secuencias biológicas de Megabase mediante GPU". Transacciones IEEE en sistemas paralelos y distribuidos . 24 (5): 1009–1021. doi : 10.1109 / TPDS.2012.194 .
- ^ Sandes, Edans F. de O .; Miranda, G .; De Melo, ACMA; Martorell, X .; Ayguade, E. (mayo de 2014). CUDAlign 3.0: Comparación de secuencias biológicas paralelas en grandes clústeres de GPU . Computación en clúster, en la nube y en red (CCGrid), 2014 XIV Simposio Internacional IEEE / ACM sobre. pag. 160. doi : 10.1109 / CCGrid.2014.18 .
- ^ Sandes, Edans F. de O .; Miranda, G .; De Melo, ACMA; Martorell, X .; Ayguade, E. (agosto de 2014). Comparación de secuencia de megabase paralela de grano fino con varias GPU heterogéneas . Actas del XIX Simposio ACM SIGPLAN sobre Principios y Práctica de la Programación Paralela. págs. 383–384. doi : 10.1145 / 2555243.2555280 .
- ^ Chivian, D; Baker, D (2006). "Modelado de homología utilizando generación de conjuntos de alineación paramétrica con consenso y selección de modelos basados en energía" . Investigación de ácidos nucleicos . 34 (17): e112. doi : 10.1093 / nar / gkl480 . PMC 1635247 . PMID 16971460 .
- ^ Girdea, M; Noe, L; Kucherov, G (enero de 2010). "Retraducción para descubrir homologías de proteínas distantes en presencia de mutaciones de cambio de marco" . Algoritmos de Biología Molecular . 5 (6): 6. doi : 10.1186 / 1748-7188-5-6 . PMC 2821327 . PMID 20047662 .
- ^ Ma, B .; Tromp, J .; Li, M. (2002). "PatternHunter: búsqueda de homología más rápida y sensible" . Bioinformática . 18 (3): 440–445. doi : 10.1093 / bioinformatics / 18.3.440 . PMID 11934743 .
- ^ Li, M .; Ma, B .; Kisman, D .; Tromp, J. (2004). "Patternhunter II: búsqueda de homología muy sensible y rápida". Revista de Bioinformática y Biología Computacional . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi : 10.1142 / S0219720004000661 . PMID 15359419 .
- ^ Gusfield, Dan (1997). Algoritmos sobre cadenas, árboles y secuencias . Prensa de la Universidad de Cambridge. ISBN 978-0-521-58519-4.
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: implementación de Smith-Waterman en FPGA con OpenCL para secuencias de ADN largas" . Biología de sistemas BMC . 12 (Supl. 5): 96. doi : 10.1186 / s12918-018-0614-6 . PMC 6245597 . PMID 30458766 .
- ^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel. Aceleración de la alineación de Smith-Waterman de secuencias largas de ADN con OpenCL en FPGA . V Congreso Internacional de Trabajo en Bioinformática e Ingeniería Biomédica. pag. 500-511. doi : 10.1007 / 978-3-319-56154-7_45 .
- ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Filtros de q-Gram eficientes para encontrar todas las coincidencias épsilon en una longitud determinada". Revista de Biología Computacional . 13 (2): 296-308. CiteSeerX 10.1.1.465.2084 . doi : 10.1089 / cmb.2006.13.296 . PMID 16597241 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Noe L, Kucherov G; Kucherov (2005). "YASS: mejora de la sensibilidad de la búsqueda de similitud de ADN" . Investigación de ácidos nucleicos . 33 (supl_2): W540 – W543. doi : 10.1093 / nar / gki478 . PMC 1160238 . PMID 15980530 .
- ^ Pratas, Diogo; Silva, Jorge (2020). "Secuencias mínimas persistentes de SARS-CoV-2" . Bioinformática . 36 (21): 5129–5132. doi : 10.1093 / bioinformatics / btaa686 . PMC 7559010 . PMID 32730589 .
- ^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J .; Salzberg, Steven L .; Szalay, Alexander S. (2015). "Arioc: alineación de lectura de alto rendimiento con exploración acelerada por GPU del espacio de búsqueda de semilla y extensión" . PeerJ . 3 : e808. doi : 10.7717 / peerj.808 . PMC 4358639 . PMID 25780763 .
- ^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: una herramienta de alineación para la resecuenciación del genoma a gran escala" . PLOS ONE . 4 (11): e7767. Código Bibliográfico : 2009PLoSO ... 4.7767H . doi : 10.1371 / journal.pone.0007767 . PMC 2770639 . PMID 19907642 .
- ^ Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). "BigBWA: acercando el alineador de Burrows-Wheeler a las tecnologías de Big Data" . Bioinformática . 31 (24): 4003–5. doi : 10.1093 / bioinformatics / btv506 . PMID 26323715 .
- ^ Kent, WJ (2002). "BLAT --- La herramienta de alineación BLAST-Like" . Investigación del genoma . 12 (4): 656–664. doi : 10.1101 / gr.229202 . ISSN 1088-9051 . PMC 187518 . PMID 11932250 .
- ^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). "Alineación ultrarrápida y eficiente para la memoria de secuencias cortas de ADN con el genoma humano" . Biología del genoma . 10 (3): R25. doi : 10.1186 / gb-2009-10-3-r25 . ISSN 1465-6906 . PMC 2690996 . PMID 19261174 .
- ^ Li, H .; Durbin, R. (2009). "Alineación de lectura corta rápida y precisa con la transformación de Burrows-Wheeler" . Bioinformática . 25 (14): 1754-1760. doi : 10.1093 / bioinformatics / btp324 . ISSN 1367-4803 . PMC 2705234 . PMID 19451168 .
- ^ a b Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Mapeo probabilístico adaptable de lecturas cortas utilizando matrices de puntuación específicas de posición" . BMC Bioinformática . 15 (1): 100. doi : 10.1186 / 1471-2105-15-100 . ISSN 1471-2105 . PMC 4021105 . PMID 24717095 .
- ^ Liu, Y .; Schmidt, B .; Maskell, DL (2012). "CUSHAW: un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler" . Bioinformática . 28 (14): 1830–1837. doi : 10.1093 / bioinformatics / bts276 . ISSN 1367-4803 . PMID 22576173 .
- ^ Liu, Y .; Schmidt, B. (2012). "Alineación de lectura larga basada en semillas de coincidencia exacta máxima" . Bioinformática . 28 (18): i318 – i324. doi : 10.1093 / bioinformatics / bts414 . ISSN 1367-4803 . PMC 3436841 . PMID 22962447 .
- ^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: herramienta de búsqueda de secuencia corta de alineación global" . Bioinformática . 26 (20): 2534-2540. doi : 10.1093 / bioinformatics / btq485 . PMC 2951093 . PMID 20739310 .
- ^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "El mapeador GEM: alineación por filtración rápida, precisa y versátil". Métodos de la naturaleza . 9 (12): 1185-1188. doi : 10.1038 / nmeth.2221 . ISSN 1548-7091 . PMID 23103880 . S2CID 2004416 .
- ^ Clement, NL; Snell, Q .; Clement, MJ; Hollenhorst, PC; Purwar, J .; Graves, BJ; Cairns, BR; Johnson, WE (2009). "El algoritmo GNUMAP: mapeo probabilístico imparcial de oligonucleótidos de secuenciación de próxima generación" . Bioinformática . 26 (1): 38–45. doi : 10.1093 / bioinformatics / btp614 . ISSN 1367-4803 . PMC 6276904 . PMID 19861355 .
- ^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: alineación de secuencia paralela de alto rendimiento para análisis de datos de secuenciación de próxima generación" . PLOS ONE . 9 (6): 1754-1760. Código Bibliográfico : 2014PLoSO ... 999033S . doi : 10.1371 / journal.pone.0099033 . PMC 4053384 . PMID 24918764 .
- ^ Kielbasa, SM; Wan, R .; Sato, K .; Horton, P .; Frith, MC (2011). "Semillas adaptativas domesticar la comparación de la secuencia genómica" . Investigación del genoma . 21 (3): 487–493. doi : 10.1101 / gr.113985.110 . PMC 3044862 . PMID 21209072 .
- ^ Rivales, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: localización rápida de múltiples lecturas en genomas . Algoritmos en Bioinformática . Apuntes de conferencias en informática. 5724 . págs. 246–260. Código Bibliográfico : 2009LNCS.5724..246R . CiteSeerX 10.1.1.156.928 . doi : 10.1007 / 978-3-642-04241-6_21 . ISBN 978-3-642-04240-9.
- ^ Sedlazeck, Fritz J .; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: mapeo de lectura rápido y preciso en genomas altamente polimórficos" . Bioinformática . 29 (21): 2790–2791. doi : 10.1093 / bioinformatics / btt468 . PMID 23975764 .
- ^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: mapeo eficiente de lecturas de secuenciación corta con semillas espaciadas completamente sensibles periódicas" . Bioinformática . 25 (19): 2514–2521. doi : 10.1093 / bioinformatics / btp486 . PMC 2752623 . PMID 19675096 .
- ^ Searls, David B .; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M .; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F .; Hackermüller, Jörg (2009). "Mapeo rápido de secuencias cortas con desajustes, inserciones y eliminaciones utilizando estructuras de índice" . PLOS Biología Computacional . 5 (9): e1000502. Código Bibliográfico : 2009PLSCB ... 5E0502H . doi : 10.1371 / journal.pcbi.1000502 . ISSN 1553-7358 . PMC 2730575 . PMID 19750212 .
- ^ Rumble, Stephen M .; Lacroute, Phil; Dalca, Adrian V .; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: asignación precisa de lecturas de espacio de color corto" . PLOS Biología Computacional . 5 (5): e1000386. Código Bibliográfico : 2009PLSCB ... 5E0386R . doi : 10.1371 / journal.pcbi.1000386 . PMC 2678294 . PMID 19461883 .
- ^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: mapeo de lectura corta sensible pero práctico" . Bioinformática . 27 (7): 1011–1012. doi : 10.1093 / bioinformatics / btr046 . PMID 21278192 .
- ^ Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). "Control deslizante: uso máximo de información de probabilidad para la alineación de lecturas de secuencia corta y detección de SNP" . Bioinformática . 25 (1): 6–13. doi : 10.1093 / bioinformatics / btn565 . PMC 2638935 . PMID 18974170 .
- ^ Malhis, Nawar; Jones, Steven JM (2010). "Llamadas SNP de alta calidad con datos de Illumina con cobertura superficial" . Bioinformática . 26 (8): 1029–1035. doi : 10.1093 / bioinformatics / btq092 . PMID 20190250 .
- ^ Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). "SOAP: programa de alineación de oligonucleótidos corto" . Bioinformática . 24 (5): 713–714. doi : 10.1093 / bioinformatics / btn025 . ISSN 1367-4803 . PMID 18227114 .
- ^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Wang, J. (2009). "SOAP2: una herramienta ultrarrápida mejorada para alineación de lectura corta" . Bioinformática . 25 (15): 1966–1967. doi : 10.1093 / bioinformatics / btp336 . ISSN 1367-4803 . PMID 19497933 .
- ^ Abuín, José M .; Pichel, Juan C .; Pena, Tomás F .; Amigo, Jorge (16 de mayo de 2016). "SparkBWA: acelerar la alineación de datos de secuenciación de ADN de alto rendimiento" . PLOS ONE . 11 (5): e0155461. Código bibliográfico : 2016PLoSO..1155461A . doi : 10.1371 / journal.pone.0155461 . ISSN 1932-6203 . PMC 4868289 . PMID 27182962 .
- ^ Lunter, G .; Goodson, M. (2010). "Stampy: un algoritmo estadístico para el mapeo sensible y rápido de lecturas de secuencia de Illumina" . Investigación del genoma . 21 (6): 936–939. doi : 10.1101 / gr.111120.110 . ISSN 1088-9051 . PMC 3106326 . PMID 20980556 .
- ^ Noe, L .; Girdea, M .; Kucherov, G. (2010). "Diseño de semillas espaciadas eficientes para mapeo de lectura SOLiD" . Avances en bioinformática . 2010 : 708501. doi : 10.1155 / 2010/708501 . PMC 2945724 . PMID 20936175 .
- ^ Lin, H .; Zhang, Z .; Zhang, MQ; Ma, B .; Li, M. (2008). "¡ZOOM! Millones de oligos mapeados" . Bioinformática . 24 (21): 2431–2437. doi : 10.1093 / bioinformatics / btn416 . PMC 2732274 . PMID 18684737 .