Lista de software de alineación de secuencias

Esta lista de software de alineación de secuencias es una compilación de herramientas de software y portales web que se utilizan en la alineación de secuencias por pares y la alineación de secuencias múltiples . Consulte el software de alineación estructural para la alineación estructural de proteínas.

Solo búsqueda en base de datos

Nombre	Descripción	Tipo de secuencia *	Autores	Año
EXPLOSIÓN	Búsqueda local con heurística rápida de tuplas k (herramienta básica de búsqueda de alineación local)	Ambas cosas	Altschul SF , Gish W , Miller W , Myers EW , Lipman DJ ^[1]	1990
HPC-BLAST	Envoltura BLAST multinodo y multinúcleo compatible con NCBI. Distribuido con la última versión de BLAST, este contenedor facilita la paralelización del algoritmo en arquitecturas híbridas modernas con muchos nodos y muchos núcleos dentro de cada nodo. ^[2]	Proteína	Burdyshaw CE , Sawyer S , Horton MD , Brook RG , Rekapalli B	2017
CS-BLAST	BLAST específico de secuencia-contexto, más sensible que BLAST, FASTA y SSEARCH. Versión iterativa de posición específica CSI-BLAST más sensible que PSI-BLAST	Proteína	Angermueller C, Biegert A, Soeding J ^[3]	2013
CUDASW ++	Algoritmo Smith Waterman acelerado por GPU para múltiples GPU de host compartido	Proteína	Liu Y, Maskell DL y Schmidt B	2009/2010
DIAMANTE	Alineador BLASTX y BLASTP basado en doble indexación	Proteína	Buchfink B, Xie C, Huson DH, Reuter K, Drost HG ^[4]^[5]	2015/2021
FASTA	Búsqueda local con heurística rápida k -tuple, más lenta pero más sensible que BLAST	Ambas cosas
GGSEARCH, GLSEARCH	Global: Global (GG), Global: Local (GL) alineación con estadísticas	Proteína
Mago del genoma	Software para búsqueda de motivos de secuencia de ADN local ultrarrápida y alineación por pares para datos NGS (FASTA, FASTQ).	ADN	Hepperle D (www.sequentix.de)	2020
Genoogle	Genoogle utiliza técnicas de indexación y procesamiento paralelo para buscar secuencias de ADN y proteínas. Está desarrollado en Java y de código abierto.	Ambas cosas	Albrecht F	2015
HMMER	Búsqueda local y global con modelos de perfil Hidden Markov, más sensibles que PSI-BLAST	Ambas cosas	Durbin R , Eddy SR , Krogh A , Mitchison G ^[6]	1998
HH-suite	Comparación por pares de modelos de perfil Hidden Markov; muy sensible	Proteína	Söding J ^[7]^[8]	2005/2012
IDF	Frecuencia de documento inversa	Ambas cosas
Infernal	Búsqueda de perfil SCFG	ARN	Eddy S
KLAST	Herramienta de búsqueda de similitud de secuencias de uso general de alto rendimiento	Ambas cosas		2009/2014
LAMBDA	Alineador local de alto rendimiento compatible con BLAST, pero mucho más rápido; soporta SAM / BAM	Proteína	Hannes Hauswedell, cantante de Jochen, Knut Reinert ^[9]	2014
MMseqs2	Paquete de software para buscar y agrupar grandes conjuntos de secuencias. Sensibilidad similar a BLAST y PSI-BLAST pero órdenes de magnitud más rápido	Proteína	Steinegger M, Mirdita M, Galiez C, Söding J ^[10]	2017
USEARCH	Herramienta de análisis de secuencia ultrarrápida	Ambas cosas	Edgar, RC (2010). "Búsqueda y agrupación de órdenes de magnitud más rápido que BLAST" . Bioinformática . 26 (19): 2460–2461. doi : 10.1093 / bioinformatics / btq461 . PMID 20709691 . publicación	2010
OSWALD	OpenCL Smith-Waterman sobre FPGA de Altera para grandes bases de datos de proteínas	Proteína	Rucci E, García C, Botella G, De Giusti A, Naiouf M, Prieto-Matías M ^[11]	2016
parasail	Búsqueda rápida de Smith-Waterman mediante paralelización SIMD	Ambas cosas	Diario J	2015
PSI-BLAST	BLAST iterativo de posición específica, búsqueda local con matrices de puntuación específicas de posición , mucho más sensible que BLAST	Proteína	Altschul SF , Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W , Lipman DJ ^[12]	1997
Búsqueda de PSI	Combinando el algoritmo de búsqueda de Smith-Waterman con la estrategia de construcción del perfil PSI-BLAST para encontrar secuencias de proteínas relacionadas lejanamente y prevenir errores homólogos de sobreextensión.	Proteína	Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR ^[13]	2012
ScalaBLAST	BLAST escalable altamente paralelo	Ambas cosas	Oehmen y col. ^[14]	2011
Sequilab	Vinculación y creación de perfiles de datos de alineación de secuencias de los resultados de NCBI-BLAST con los principales servidores / servicios de análisis de secuencias	Nucleótido, péptido		2010
SAM	Búsqueda local y global con modelos de perfil Hidden Markov, más sensibles que PSI-BLAST	Ambas cosas	Karplus K , Krogh A ^[15]	1999
BÚSQUEDA	Búsqueda Smith-Waterman, más lenta pero más sensible que FASTA	Ambas cosas
SWAPHI	Primer algoritmo paralelo que emplea el emergente Intel Xeon Phis para acelerar la búsqueda en la base de datos de proteínas Smith-Waterman	Proteína	Liu Y y Schmidt B	2014
SWAPHI-LS	Primer algoritmo paralelo de Smith-Waterman que aprovecha los clústeres de Intel Xeon Phi para acelerar la alineación de largas secuencias de ADN	ADN	Liu Y, Tran TT, Lauenroth F, Schmidt B	2014
Nadar	Implementación de Smith-Waterman para arquitecturas Intel Multicore y Manycore	Proteína	Rucci E, García C, Botella G, De Giusti A, Naiouf M y Prieto-Matías M ^[16]	2015
SWIMM2.0	Smith-Waterman mejorado en las arquitecturas Intel Multicore y Manycore basadas en extensiones vectoriales AVX-512	Proteína	Rucci E, García C, Botella G, De Giusti A, Naiouf M y Prieto-Matías M ^[17]	2018
GOLPE FUERTE	Búsqueda rápida de Smith-Waterman mediante paralelización SIMD	Ambas cosas	Rognes T	2011

* Tipo de secuencia: proteína o nucleótido

Alineación por pares

Nombre	Descripción	Tipo de secuencia *	Tipo de alineación **	Autor	Año
ACANA	Alineación por pares basada en anclaje heurístico rápido	Ambas cosas	Ambas cosas	Huang, Umbach, Li	2005
Alinearme	Alineaciones para secuencias de proteínas de membrana	Proteína	Ambas cosas	M. Stamm, K. Khafizov, R. Staritzbichler, LR Forrest	2013
ALLALIGN	Para moléculas de ADN, ARN y proteínas de hasta 32 MB, alinea todas las secuencias de tamaño K o superior. Las alineaciones similares se agrupan para su análisis. Filtro automático de secuencia repetitiva.	Ambas cosas	Local	E. Wachtel	2017
Bioconductores bioconductores :: pairwiseAlignment	Programación dinámica	Ambas cosas	Ambos + Extremos libres	P. Aboyoun	2008
BioPerl dpAlign	Programación dinámica	Ambas cosas	Ambos + Extremos libres	YM Chan	2003
BLASTZ, LASTZ	Coincidencia de patrones sembrados	Nucleótido	Local	Schwartz y col. ^[18]^[19]	2004,2009
CUDAlign	Alineación de secuencias de ADN de tamaño ilimitado en una o varias GPU	Nucleótido	Local, semiglobal, global	E. Sandes ^[20]^[21]^[22]	2011-2015
DNADot	Herramienta de diagrama de puntos basada en la web	Nucleótido	Global	R. Bowen	1998
Suite de biología molecular DNASTAR Lasergene	Software para alinear secuencias de ADN, ARN, proteína o ADN + proteína a través de algoritmos de alineación de secuencia múltiple y por pares que incluyen análisis MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson y Dotplot.	Ambas cosas	Ambas cosas	DNASTAR	1993-2016
DOTLET	Herramienta de trazado de puntos basada en Java	Ambas cosas	Global	M. Pagni y T. Junier	1998
BANQUETE	Extensión local de base posterior con modelo descriptivo de evolución	Nucleótido	Local	AK Hudek y DG Brown	2010
Compilador del genoma Compilador del genoma	Alinee archivos de cromatograma (.ab1, .scf) con una secuencia de plantilla, localice errores y corríjalos al instante.	Nucleótido	Local	Corporación del compilador del genoma	2014
G-PAS	Programación dinámica basada en GPU con retroceso	Ambas cosas	Local, semiglobal, global	W. Frohmberg, M. Kierzynka y col.	2011
GapMis	Hace una alineación de secuencia por pares con un espacio	Ambas cosas	SemiGlobal	K. Frousios, T. Flouri, CS Iliopoulos, K. Park, SP Pissis, G. Tischler	2012
Mago del genoma	Software para búsqueda de motivos de secuencia de ADN local ultrarrápida y alineación por pares para datos NGS (FASTA, FASTQ).	ADN	Local, semiglobal, global	Hepperle D (www.sequentix.de)	2020
GGSEARCH, GLSEARCH	Global: Global (GG), Global: Local (GL) alineación con estadísticas	Proteína	Global en consulta	W. Pearson	2007
JAligner	Implementación Java de código abierto de Smith-Waterman	Ambas cosas	Local	A. Moustafa	2005
K * Sincronización	Secuencia de proteínas a alineación de estructura que incluye estructura secundaria, conservación estructural, perfiles de secuencia derivados de la estructura y puntuaciones de alineación de consenso	Proteína	Ambas cosas	D. Chivian y D. Baker ^[23]	2003
LALIGN	Similitud local múltiple, no superpuesta (mismo algoritmo que SIM)	Ambas cosas	Local no superpuesto	W. Pearson	1991 (algoritmo)
NW-alinear	Algoritmo de programación dinámica estándar de Needleman-Wunsch	Proteína	Global	Y Zhang	2012
maligno	modelado de alineación; modela el contenido de información de las secuencias	Nucleótido	Ambas cosas	D. Powell, L. Allison y TI Dix	2004
comparador	Alineación local Waterman-Eggert (basado en LALIGN)	Ambas cosas	Local	I. Longden (modificado de W. Pearson)	1999
MCALIGN2	modelos explícitos de evolución indel	ADN	Global	J. Wang y col.	2006
Máscara	sufijo basado en árbol	Nucleótido	Global	S. Kurtz y col.	2004
aguja	Programación dinámica Needleman-Wunsch	Ambas cosas	SemiGlobal	A. Bleasby	1999
Ngila	Costos de brecha logarítmica y afín y modelos explícitos de evolución indele	Ambas cosas	Global	R. Cartwright	2007
noroeste	Programación dinámica Needleman-Wunsch	Ambas cosas	Global	ACR Martín	1990-2015
parasail	Biblioteca de programación dinámica C / C ++ / Python / Java SIMD para SSE, AVX2	Ambas cosas	Global, sin fines, local	J. Diario	2015
Camino	Smith-Waterman en proteínas Back traducción gráfica (detecta marco de lectura a nivel de proteína)	Proteína	Local	M. Gîrdea y col. ^[24]	2009
PatrónCazador	Coincidencia de patrones sembrados	Nucleótido	Local	B. Ma y col. ^[25]^[26]	2002-2004
ProbA (también propA)	Muestreo de función de partición estocástica mediante programación dinámica	Ambas cosas	Global	U. Mückstein	2002
PyMOL	El comando "alinear" alinea la secuencia y la aplica a la estructura	Proteína	Global (por selección)	WL DeLano	2007
REPUT	sufijo basado en árbol	Nucleótido	Local	S. Kurtz y col.	2001
SABERTOOTH	Alineación mediante perfiles de conectividad previstos	Proteína	Global	F. Teichert, J. Minning, U. Bastolla y M. Porto	2009
Satsuma	Alineaciones paralelas de sinteno de genoma completo	ADN	Local	MG Grabherr y col.	2010
SEQALN	Varias programaciones dinámicas	Ambas cosas	Local o global	MS Waterman y P. Hardy	1996
SIM, GAP, SIESTA, VUELTA	Similitud local con diferentes tratamientos de brechas	Ambas cosas	Local o global	X. Huang y W. Miller	1990-6
SIM	Similitud local	Ambas cosas	Local	X. Huang y W. Miller	1991
SPA: Alineación súper por pares	Alineación global rápida por pares	Nucleótido	Global	Shen, Yang, Yao, Hwang	2002
BÚSQUEDA	Alineación local ( Smith-Waterman ) con estadísticas	Proteína	Local	W. Pearson	1981 (algoritmo)
Estudio de secuencias	Applet de Java que muestra varios algoritmos de ^[27]	Secuencia genérica	Local y global	A.Meskauskas	1997 (libro de referencia)
SWIFOLD	Aceleración Smith-Waterman en FPGA de Intel con OpenCL para secuencias de ADN largas	Nucleótido	Local	E. Rucci ^[28]^[29]	2017-2018
Traje SWIFT	Búsqueda rápida de alineación local	ADN	Local	K. Rasmussen, ^[30] W. Gerlach	2005,2008
camilla	Programación dinámica Needleman-Wunsch con memoria optimizada	Ambas cosas	Global	I. Longden (modificado de G. Myers y W. Miller)	1999
tranalign	Alinea las secuencias de ácidos nucleicos con una alineación de proteínas.	Nucleótido	N / A	G. Williams (modificado de B. Pearson)	2002
UGENE	Fuente abierta Smith-Waterman para SSE / CUDA, buscador de repeticiones y diagrama de puntos basados en matrices de sufijos	Ambas cosas	Ambas cosas	UniPro	2010
agua	Programación dinámica Smith-Waterman	Ambas cosas	Local	A. Bleasby	1999
palabra	k -tuple coincidencia por pares	Ambas cosas	N / A	I. Longden	1998
YASS	Coincidencia de patrones sembrados	Nucleótido	Local	L. Noe y G. Kucherov ^[31]	2004

* Tipo de secuencia: proteína o nucleótido ** Tipo de alineación: local o global

Alineación de múltiples secuencias

Nombre	Descripción	Tipo de secuencia *	Tipo de alineación **	Autor	Año	Licencia
ABA	Alineación A-Bruijn	Proteína	Global	B.Raphael y col.	2004	Propietario , software gratuito para educación, investigación, sin fines de lucro
CERVEZA INGLESA	alineación manual; algo de asistencia de software	Nucleótidos	Local	J. Blandy y K. Fogel	1994 (última versión 2007)	Gratis, GPL 2
ALLALIGN	Para moléculas de ADN, ARN y proteínas de hasta 32 MB, alinea todas las secuencias de tamaño K o superior, MSA o dentro de una sola molécula. Las alineaciones similares se agrupan para su análisis. Filtro automático de secuencia repetitiva.	Ambas cosas	Local	E. Wachtel	2017	Libre
UN MAPA	Recocido de secuencia	Ambas cosas	Global	A. Schwartz y L. Pachter	2006
luego.	alineación rápida y óptima de tres secuencias utilizando costes de huecos lineales	Nucleótidos	Global	D. Powell, L. Allison y TI Dix	2000
BAli-Phy	Árbol + alineación múltiple; probabilístico-bayesiano; estimación conjunta	Ambos + Codones	Global	BD Redelings y MA Suchard	2005 (última versión 2018)	Gratis, GPL
Base por base	Editor de alineación de múltiples secuencias basado en Java con herramientas de análisis integradas	Ambas cosas	Local o global	R. Brodie y col.	2004	Propietario , software gratuito , debe registrarse
CAOS, DIALIGN	Alineación iterativa	Ambas cosas	Local (preferido)	M. Brudno y B. Morgenstern	2003
Clúster W	Alineación progresiva	Ambas cosas	Local o global	Thompson y col.	1994	Gratis, LGPL
Alineador CodonCode	Multi-alineación; Compatibilidad con ClustalW y Phrap	Nucleótidos	Local o global	P. Richterich y col.	2003 (última versión 2009)
Brújula	Comparación de múltiples alineaciones de secuencias de proteínas con la evaluación de la significación estadística	Proteína	Global	RI Sadreyev y col.	2009
DESCIFRAR	Alineación progresiva-iterativa	Ambas cosas	Global	Erik S. Wright	2014	Gratis, GPL
DIALIGN-TX y DIALIGN-T	Método basado en segmentos	Ambas cosas	Local (preferido) o Global	ARSubramanian	2005 (última versión 2008)
Alineación de ADN	Método basado en segmentos para alineaciones intraespecíficas	Ambas cosas	Local (preferido) o Global	A.Roehl	2005 (última versión 2008)
Ensamblador de secuencia básica de ADN	Multi-alineación; Alineación de secuencia completamente automática; Corrección automática de ambigüedad; Llamador de base interno; Alineación de secuencia de línea de comando	Nucleótidos	Local o global	Heracle BioSoft SRL	2006 (última versión 2018)	Comercial (algunos módulos son gratuitos)
DNADynamo	ADN vinculado a proteína alineación múltiple con MUSCLE , Clustal y Smith-Waterman	Ambas cosas	Local o global	DNADynamo	2004 (versión más reciente 2017)
Suite de biología molecular DNASTAR Lasergene	Software para alinear secuencias de ADN, ARN, proteína o ADN + proteína a través de algoritmos de alineación de secuencia múltiple y por pares que incluyen análisis MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson y Dotplot.	Ambas cosas	Local o global	DNASTAR	1993-2016
EDNA	Alineación de secuencias múltiples basada en energía para sitios de unión de ADN	Nucleótidos	Local o global	Salama, RA. et al.	2013
FAMSA	Alineación progresiva para familias de proteínas extremadamente grandes (cientos de miles de miembros)	Proteína	Global	Deorowicz y col.	2016
FSA	Recocido de secuencia	Ambas cosas	Global	RK Bradley y col.	2008
Generoso	Alineación progresiva-iterativa; Complemento ClustalW	Ambas cosas	Local o global	AJ Drummond y col.	2005 (última versión 2017)
Kalign	Alineación progresiva	Ambas cosas	Global	T. Lassmann	2005
MAFFT	Alineación progresiva-iterativa	Ambas cosas	Local o global	K. Katoh y col.	2005	Gratis, BSD
MARNA	Multi-alineación de ARN	ARN	Local	S. Siebert y col.	2005
MAVID	Alineación progresiva	Ambas cosas	Global	N. Bray y L. Pachter	2004
MSA	Programación dinámica	Ambas cosas	Local o global	DJ Lipman y col.	1989 (modificado en 1995)
MSAProbs	Programación dinámica	Proteína	Global	Y. Liu, B. Schmidt, D. Maskell	2010
MULTALIN	Agrupación dinámica de programación	Ambas cosas	Local o global	F. Corpet	1988
Multi-LAGAN	Alineación de programación dinámica progresiva	Ambas cosas	Global	M. Brudno y col.	2003
MÚSCULO	Alineación progresiva-iterativa	Ambas cosas	Local o global	R. Edgar	2004
Ópalo	Alineación progresiva-iterativa	Ambas cosas	Local o global	T. Wheeler y J. Kececioglu	2007 (última versión estable de 2013, última versión beta de 2016)
Pacana	Consistencia probabilística	ADN	Global	B. Paten y col.	2008
Phylo	Un marco informático humano para la genómica comparativa para resolver la alineación múltiple	Nucleótidos	Local o global	McGill Bioinformática	2010
PMFastR	Alineación progresiva consciente de la estructura	ARN	Global	D. DeBlasio, J Braund, S Zhang	2009
Almendra garapiñada	Alineación extendida de homología de consistencia progresiva iterativa con preperfilado y predicción de estructura secundaria	Proteína	Global	J. Heringa	1999 (última versión 2009)
PicXAA	Alineación no progresiva, máxima precisión esperada	Ambas cosas	Global	SME Sahraeian y BJ Yoon	2010
POA	Orden parcial / modelo de Markov oculto	Proteína	Local o global	C. Lee	2002
Probalign	Probabilística / coherencia con las probabilidades de la función de partición	Proteína	Global	Roshan y Livesay	2006	Libre, dominio público
ProbCons	Probabilista / consistencia	Proteína	Local o global	C. Do et al.	2005	Libre, dominio público
PROMALES3D	Alineación progresiva / modelo de Markov oculto / Estructura secundaria / Estructura 3D	Proteína	Global	J. Pei y col.	2008
PRRN / PRRP	Alineación iterativa (especialmente refinamiento)	Proteína	Local o global	Y. Totoki (basado en O. Gotoh)	1991 y posteriores
PSAlign	Alineación que preserva no heurística	Ambas cosas	Local o global	SH Sze, Y. Lu, Q. Yang.	2006
RevTrans	Combina la alineación de ADN y proteínas, mediante la traducción inversa de la alineación de proteínas a ADN.	ADN / Proteína (especial)	Local o global	Wernersson y Pedersen	2003 (versión más reciente 2005)
SAGA	Alineación de secuencia por algoritmo genético	Proteína	Local o global	C. Notredame y col.	1996 (nueva versión 1998)
SAM	Modelo de Markov oculto	Proteína	Local o global	A. Krogh y col.	1994 (versión más reciente 2002)
Sello	Alineación manual	Ambas cosas	Local	A. Rambaut	2002
StatAlign	Coestimación bayesiana de alineación y filogenia (MCMC)	Ambas cosas	Global	A. Novak y col.	2008
Stemloc	Predicción de alineación múltiple y estructura secundaria	ARN	Local o global	I. Holmes	2005	Gratis, GPL 3 (parte de DART )
T-Coffee	Alineación progresiva más sensible	Ambas cosas	Local o global	C. Notredame y col.	2000 (versión más reciente 2008)	Gratis, GPL 2
UGENE	Soporta alineación múltiple con MUSCLE , Kalign, Clustal y Mafft plugins	Ambas cosas	Local o global	Equipo UGENE	2010 (versión más reciente 2020)	Gratis, GPL 2
VectorAmigos	VectorFriends Aligner, complemento MUSCLE y complemento Clustal W	Ambas cosas	Local o global	Equipo de BioFriends	2013	Software gratuito y patentado para uso académico
GLProbs	Enfoque basado en el modelo de Markov oculto de pares adaptativos	Proteína	Global	Y. Ye y col.	2013

* Tipo de secuencia: proteína o nucleótido. ** Tipo de alineación: local o global

Análisis genómico

Nombre	Descripción	Tipo de secuencia *
ÁGUILA ^[32]	Una herramienta ultrarrápida para encontrar palabras relativamente ausentes en datos genómicos	Nucleótido
ACT (Herramienta de comparación de Artemis)	Synteny y genómica comparada	Nucleótido
ÁVIDO	Alineación global por pares con genomas completos	Nucleótido
BLAT	Alineación de secuencias de ADNc a un genoma.	Nucleótido
DESCIFRAR	Alineación de genomas reorganizados mediante traducción de 6 cuadros	Nucleótido
REPROCHES	Alineación y análisis difusos del genoma completo	Nucleótido
GMAP	Alineación de secuencias de ADNc a un genoma. Identifica las uniones del sitio de empalme con alta precisión.	Nucleótido
Splign	Alineación de secuencias de ADNc a un genoma. Identifica las uniones del sitio de empalme con alta precisión. Capaz de reconocer y separar duplicaciones de genes.	Nucleótido
Color de malva	Alineación múltiple de genomas reorganizados	Nucleótido
MGA	Alineador de múltiples genomas	Nucleótido
Mulan	Múltiples alineamientos locales de secuencias de longitud del genoma	Nucleótido
Multiz	Múltiple alineación de genomas	Nucleótido
PLAST-ncRNA	Búsqueda de ncRNA en genomas por alineación local de función de partición	Nucleótido
Sequerome	Perfiles de datos de alineación de secuencias con los principales servidores / servicios	Nucleótido, péptido
Sequilab	Perfiles de datos de alineación de secuencias a partir de resultados NCBI-BLAST con los principales servicios de servidor	Nucleótido, péptido
Shuffle-LAGAN	Alineación glocal por pares de regiones genómicas completas	Nucleótido
SIBsim4, Sim4	Un programa diseñado para alinear una secuencia de ADN expresada con una secuencia genómica, permitiendo intrones	Nucleótido
GOLPE	Búsqueda de genes, alineación, anotación (identificación de homología humano-ratón)	Nucleótido
SRPRISM	Un alineador eficiente para montajes con garantías explícitas, alineando lecturas sin empalmes	Nucleótido

* Tipo de secuencia: proteína o nucleótido

Encontrar motivo

Nombre	Descripción	Tipo de secuencia *
Síndrome premenstrual	Búsqueda y descubrimiento de motivos	Ambas cosas
FMM	Búsqueda y descubrimiento de motivos (también puede obtener secuencias positivas y negativas como entrada para la búsqueda de motivos enriquecidos)	Nucleótido
BLOQUES	Identificación de motivos sin espacios de la base de datos BLOCKS	Ambas cosas
eMOTIF	Extracción e identificación de motivos más cortos	Ambas cosas
Muestreador de motivos Gibbs	Extracción de motivos estocásticos por probabilidad estadística	Ambas cosas
HMMTOP	Predicción de hélices transmembrana y topología de proteínas.	Proteína
I-sitios	Biblioteca de motivos de estructura local	Proteína
JCoils	Predicción de bobina en espiral y cremallera de leucina	Proteína
MEME / MASTIL	Descubrimiento y búsqueda de motivos	Ambas cosas
CUDA-MEME	Algoritmo MEME (v4.4.0) acelerado por GPU para clústeres de GPU	Ambas cosas
MERCI	Búsqueda y descubrimiento de motivos discriminativos	Ambas cosas
PHI-Blast	Herramienta de búsqueda y alineación de motivos	Ambas cosas
Phyloscan	Herramienta de búsqueda de motivos	Nucleótido
PRATT	Generación de patrones para usar con ScanProsite	Proteína
ScanProsite	Herramienta de búsqueda de base de datos de Motif	Proteína
TEIRESIAS	Extracción de motivos y búsqueda en bases de datos	Ambas cosas
BASALTO	Búsqueda de múltiples motivos y expresiones regulares	Ambas cosas

* Tipo de secuencia: proteína o nucleótido

Benchmarking

Nombre	Autores
PFAM 30.0 (2016)
INTELIGENTE (2015)	Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork
BAliBASE 3 (2015)	Thompson, Plewniak, Poch
Oxbench (2011)	Raghava, Searle, Audley, Barbero, Barton
Colección Benchmark (2009)	Edgar
HOMSTRAD (2005)	Mizuguchi
PREFAB 4.0 (2005)	Edgar
SABmark (2004)	Van Walle, Lasters, Wyns

Visores de alineación, editores

Consulte la Lista de software de visualización de alineación .

Alineación de secuencia de lectura corta

Nombre	Descripción	opción de extremo emparejado	Utilice la calidad FASTQ	Huecos	Multiproceso	Licencia	Referencia	Año
Arioc	Calcula alineaciones con huecos de Smith-Waterman y calidades de mapeo en una o más GPU. Admite alineaciones BS-seq. Procesa de 100.000 a 500.000 lecturas por segundo (varía según los datos, el hardware y la sensibilidad configurada).	sí	No	sí	sí	Gratis, BSD	^[33]	2015
Barracuda	Un programa de alineación de lectura corta de transformación de Burrows-Wheeler (índice FM) acelerado por GPGPU basado en BWA, admite la alineación de indeles con aberturas y extensiones de huecos.	sí	No	sí	Sí, POSIX Threads y CUDA	Gratis, GPL
BBMap	Utiliza un kmers corto para indexar rápidamente el genoma; sin límite de tamaño o cantidad de andamios. Mayor sensibilidad y especificidad que los alineadores Burrows-Wheeler, con velocidad similar o mayor. Realiza una alineación global optimizada por transformación afín, que es más lenta pero más precisa que Smith-Waterman. Maneja datos de Illumina, 454, PacBio, Sanger e Ion Torrent. Consciente de empalmes; capaz de procesar indeles largos y RNA-seq. Java puro; se ejecuta en cualquier plataforma. Utilizado por el Joint Genome Institute .	sí	sí	sí	sí	Gratis, BSD		2010
MEJOR	Compensación explícita de tiempo y precisión con una estimación de precisión previa, respaldada por la indexación de las secuencias de referencia. Comprime de forma óptima los índices. Puede manejar miles de millones de lecturas cortas. Puede manejar inserciones, eliminaciones, SNP y errores de color (puede mapear lecturas de espacio de color ABI SOLiD). Realiza una alineación completa de Smith Waterman.				Sí, hilos POSIX	Gratis, GPL	^[34]	2009
BigBWA	Ejecuta Burrows-Wheeler Aligner -BWA en un clúster Hadoop . Admite los algoritmos BWA-MEM, BWA-ALN y BWA-SW, y trabaja con lecturas emparejadas y únicas. Implica una reducción importante en el tiempo computacional cuando se ejecuta en un clúster Hadoop, agregando escalabilidad y tolerancia a fallas.	sí	Recorte de bases de baja calidad	sí	sí	Gratis, GPL 3	^[35]	2015
BLASTN	El programa de alineación de nucleótidos de BLAST, lento y no preciso para lecturas cortas, utiliza una base de datos de secuencias (EST, secuencia de Sanger) en lugar de un genoma de referencia.
BLAT	Hecho por Jim Kent . Puede manejar un desajuste en el paso de alineación inicial.				Si, cliente-servidor	Patentada , software gratuito para uso no comercial y académica	^[36]	2002
Corbata de moño	Utiliza una transformación de Burrows-Wheeler para crear un índice del genoma permanente y reutilizable; Huella de memoria de 1,3 GB para el genoma humano. Alinea más de 25 millones de lecturas de Illumina en 1 hora de CPU. Admite políticas de alineación similares a Maq y SOAP	sí	sí	No	Sí, hilos POSIX	Libre, Artístico	^[37]	2009
BWA	Utiliza una transformación de Burrows-Wheeler para crear un índice del genoma. Es un poco más lento que Bowtie pero permite alinear indeles.	sí	Recorte de bases de baja calidad	sí	sí	Gratis, GPL	^[38]	2009
BWA-PSSM	Un alineador probabilístico de lectura corta basado en el uso de matrices de puntuación específicas de posición (PSSM). El alineador es adaptable en el sentido de que puede tener en cuenta las puntuaciones de calidad de las lecturas y modelos de sesgos específicos de datos, como los observados en ADN antiguo, datos PAR-CLIP o genomas con composiciones de nucleótidos sesgadas. ^[39]	sí	sí	sí	sí	Gratis, GPL	^[39]	2014
EFECTIVO	Cuantifique y administre grandes cantidades de datos de secuencia de lectura corta. La canalización CASHX contiene un conjunto de herramientas que se pueden usar juntas o por separado como módulos. Este algoritmo es muy preciso para aciertos perfectos en un genoma de referencia.				No	Patentada , software gratuito para uso no comercial y académica
Chaparrón	Mapeo de lectura corta con Hadoop MapReduce				Sí, Hadoop MapReduce	Libre, Artístico
CUDA-EC	Corrección de errores de alineación de lectura corta mediante GPU.				Sí, GPU habilitado
CUSHAW	Un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler	sí	sí	No	Sí (GPU habilitado)	Gratis, GPL	^[40]	2012
CUSHAW2	Alineación con brechas de lectura corta y larga basada en semillas de coincidencia exacta máxima. Este alineador admite tanto el espacio base (p. Ej., De los secuenciadores Illumina, 454, Ion Torrent y PacBio) como las alineaciones de lectura del espacio de color ABI SOLiD.	sí	No	sí	sí	Gratis, GPL		2014
CUSHAW2-GPU	Alineador de lectura corta CUSHAW2 acelerado por GPU.	sí	No	sí	sí	Gratis, GPL
CUSHAW3	Alineación de lectura corta sensible y precisa del espacio base y del espacio de color con siembra híbrida	sí	No	sí	sí	Gratis, GPL	^[41]	2012
drFAST	Software de alineación de mapas de lectura que implementa el olvido de la caché para minimizar las transferencias de memoria principal / caché como mrFAST y mrsFAST, pero diseñado para la plataforma de secuenciación SOLiD (lecturas de espacio de color). También devuelve todas las ubicaciones posibles del mapa para mejorar el descubrimiento de variaciones estructurales.	sí	Sí, por variación estructural	sí	No	Gratis, BSD
ELANDO	Implementado por Illumina. Incluye alineación sin espacios con una longitud de lectura finita.
ERNE	Alineador numérico aleatorio extendido para una alineación precisa de las lecturas de NGS. Puede mapear lecturas tratadas con bisulfito.	sí	Recorte de bases de baja calidad	sí	Multihilo y habilitado para MPI	Gratis, GPL 3
GASSST	Encuentra alineaciones globales de secuencias cortas de ADN frente a grandes bancos de ADN				Subprocesos múltiples	Licencia CeCILL versión 2.	^[42]	2011
JOYA	Motor de alineación de alta calidad (mapeo exhaustivo con sustituciones e indels). Más preciso y varias veces más rápido que BWA o Bowtie 1/2. Se proporcionan muchas aplicaciones biológicas independientes (mapeador, mapeador dividido, mapeo y otras).	sí	sí	sí	sí	Gratis, GPL 3	^[43]	2012
Mapa de Genalice	Alineador de lectura NGS ultrarrápido y completo con alta precisión y espacio de almacenamiento reducido.	sí	Recorte de bases de baja calidad	sí	sí	Propietario , comercial
Ensamblador generoso	Ensamblador de superposición rápido y preciso con la capacidad de manejar cualquier combinación de tecnología de secuenciación, longitud de lectura, cualquier orientación de emparejamiento, con cualquier tamaño de espaciador para el emparejamiento, con o sin un genoma de referencia.				sí	Propietario , comercial
GensearchNGS	Marco completo con GUI fácil de usar para analizar datos NGS. Integra un algoritmo de alineación patentado de alta calidad y la capacidad de complemento para integrar varios alineadores públicos en un marco que permite importar lecturas cortas, alinearlas, detectar variantes y generar informes. Está hecho para volver a secuenciar proyectos, es decir, en un entorno de diagnóstico.	sí	No	sí	sí	Propietario , comercial
GMAP y GSNAP	Alineación robusta y rápida de lectura corta. GMAP: lecturas más largas, con múltiples indeles y empalmes (consulte la entrada anterior en Análisis genómico); GSNAP: lecturas más cortas, con una indel o hasta dos empalmes por lectura. Útil para la expresión de genes digitales, SNP y genotipado indel. Desarrollado por Thomas Wu en Genentech. Utilizado por el Centro Nacional de Recursos Genómicos (NCGR) en Alpheus.	sí	sí	sí	sí	Patentada , software gratuito para uso no comercial y académica
GNUMAP	Realiza con precisión la alineación con huecos de los datos de secuencia obtenidos de las máquinas de secuenciación de próxima generación (específicamente de Solexa-Illumina) de nuevo a un genoma de cualquier tamaño. Incluye recorte de adaptador, llamada SNP y análisis de secuencia de bisulfito.		Sí, también admite archivos Illumina * _int.txt y * _prb.txt con los 4 puntajes de calidad para cada base		Multihilo y habilitado para MPI		^[44]	2009
HIVE-hexágono	Utiliza una tabla hash y una matriz de floración para crear y filtrar posiciones potenciales en el genoma. Para una mayor eficiencia, utiliza la similitud cruzada entre lecturas cortas y evita realinear secuencias redundantes no únicas. Es más rápido que Bowtie y BWA y permite indeles y alineaciones sensibles divergentes en virus, bacterias y alineaciones eucariotas más conservadoras.	sí	sí	sí	sí	Patentada , software gratuito para los usuarios académicos y no comerciales registrado a instancia de implementación COLMENA	^[45]	2014
IMOS	Meta-alineador mejorado y Minimap2 en Spark. Un alineador distribuido de lectura larga en la plataforma Apache Spark con escalabilidad lineal con ejecución de un solo nodo.		sí	sí	sí	Libre
Isaac	Utiliza completamente toda la potencia informática disponible en un nodo de servidor; por lo tanto, se escala bien en una amplia gama de arquitecturas de hardware y el rendimiento de alineación mejora con las capacidades del hardware	sí	sí	sí	sí	Gratis, GPL
ÚLTIMO	Utiliza semillas adaptativas y hace frente de manera más eficiente a secuencias ricas en repeticiones (por ejemplo, genomas). Por ejemplo: puede alinear las lecturas con los genomas sin repetición de enmascaramiento, sin sentirse abrumado por golpes repetitivos.	sí	sí	sí	sí	Gratis, GPL	^[46]	2011
MAQ	Alineación sin huecos que tiene en cuenta los puntajes de calidad de cada base.					Gratis, GPL
mrFAST, mrsFAST	Software de alineación con huecos (mrFAST) y sin huecos (mrsFAST) que implementa el olvido de la caché para minimizar las transferencias de memoria principal / caché. Están diseñados para la plataforma de secuenciación de Illumina y pueden devolver todas las ubicaciones de mapas posibles para mejorar el descubrimiento de variaciones estructurales.	sí	Sí, por variación estructural	sí	No	Gratis, BSD
MAMÁ	MOM o mapeo máximo de oligonucleótidos es una herramienta de búsqueda de coincidencias que captura una coincidencia de longitud máxima dentro de la lectura corta.				sí
MOSAIK	Alineador de brechas rápidas y ensamblador guiado por referencia. Alinea las lecturas utilizando un algoritmo de Smith-Waterman con bandas sembrado por los resultados de un esquema de hash k-mer. Admite lecturas que varían en tamaño, desde muy cortas hasta muy largas.				sí
MPscan	Alineador rápido basado en una estrategia de filtración (sin indexación, use q-gramos y coincidencia DAWG no determinista hacia atrás )						^[47]	2009
Novoalign y NovoalignCS	Alineación con huecos de un solo extremo y un extremo emparejado Illumina GA I y II, espacio de color ABI y lecturas ION Torrent. Alta sensibilidad y especificidad, utilizando cualidades de base en todos los pasos de la alineación. Incluye recorte del adaptador, calibración de calidad base, alineación Bi-Seq y opciones para informar múltiples alineaciones por lectura. El uso de códigos IUPAC ambiguos en referencia a SNP comunes puede mejorar la recuperación de SNP y eliminar el sesgo alélico.	sí	sí	sí	Versiones multiproceso y MPI disponibles con licencia paga	Versión patentada y gratuita de un solo subproceso para uso académico y no comercial
NextGENe	Desarrollado para su uso por biólogos que realizan análisis de datos de secuenciación de próxima generación de las plataformas Roche Genome Sequencer FLX, Illumina GA / HiSeq, Life Technologies Applied BioSystems 'SOLiD System, PacBio e Ion Torrent.	sí	sí	sí	sí	Propietario , comercial
NextGenMap	Programa de mapeo de lectura rápida y flexible (dos veces más rápido que BWA), logra una sensibilidad de mapeo comparable a Stampy. Utiliza internamente una estructura de índice de memoria eficiente (tabla hash) para almacenar las posiciones de todos los 13-mers presentes en el genoma de referencia. Las regiones de mapeo donde se requieren alineaciones por pares se determinan dinámicamente para cada lectura. Utiliza instrucciones SIMD rápidas (SSE) para acelerar los cálculos de alineación en la CPU. Si está disponible, las alineaciones se calculan en GPU (usando OpenCL / CUDA) reduciendo aún más el tiempo de ejecución entre un 20 y un 50%.	sí	No	sí	Sí, hilos POSIX , OpenCL / CUDA , SSE	Libre	^[48]	2013
Kit de herramientas de variantes de Omixon	Incluye herramientas de alta sensibilidad y precisión para detectar SNP e indels. Ofrece una solución para mapear lecturas cortas de NGS con una distancia moderada (hasta un 30% de divergencia de secuencia) de los genomas de referencia. No impone restricciones en el tamaño de la referencia, lo que, combinado con su alta sensibilidad, hace que Variant Toolkit sea adecuado para proyectos de secuenciación y diagnósticos específicos.	sí	sí	sí	sí	Propietario , comercial
PALMapper	Calcula eficientemente alineaciones empalmadas y no empalmadas con alta precisión. Basándose en una estrategia de aprendizaje automático combinada con un mapeo rápido basado en un algoritmo tipo Smith-Waterman con bandas, alinea alrededor de 7 millones de lecturas por hora en una CPU. Refina el enfoque QPALMA propuesto originalmente.				sí	Gratis, GPL
Partek Flow	Para uso de biólogos y bioinformáticos. Es compatible con la alineación sin espacios, con espacios y empalmes a partir de lecturas de extremos únicos y emparejados de Illumina, Life Technologies Solid TM, Roche 454 e Ion Torrent datos sin procesar (con o sin información de calidad). Integra un potente control de calidad a nivel FASTQ / Qual y en datos alineados. Las funciones adicionales incluyen el recorte y filtrado de lecturas sin procesar, detección de SNP e InDel, cuantificación de ARNm y microARN y detección de genes de fusión.	sí	sí	sí	Posibilidad de instalación de núcleo multiprocesador, cliente-servidor	Versión de prueba patentada , comercial y gratuita
APROBAR	Indexa el genoma y luego extiende las semillas utilizando alineaciones de palabras precalculadas. Funciona con el espacio base, el espacio de color (SOLID) y puede alinear lecturas de secuencia de ARN empalmadas y genómicas.	sí	sí	sí	sí	Patentada , software gratuito para uso no comercial y académica
Permanente	Indexa el genoma con semillas periódicas para encontrar rápidamente alineaciones con total sensibilidad hasta cuatro desajustes. Puede mapear lecturas de Illumina y SOLiD. A diferencia de la mayoría de los programas de mapas, la velocidad aumenta para longitudes de lectura más largas.				sí	Gratis, GPL	^[49]
PRIMEX	Indexa el genoma con una tabla de búsqueda de k-mer con sensibilidad completa hasta un número ajustable de desajustes. Es mejor para mapear secuencias de 15 a 60 pb en un genoma.	No	No	sí	No, múltiples procesos por búsqueda		[1]	2003
QPalma	Puede utilizar puntuaciones de calidad, longitudes de intrones y predicciones de sitios de empalme de cálculo para realizar y realiza una alineación insesgada. Se puede entrenar para los detalles específicos de un experimento y genoma de RNA-seq. Útil para el descubrimiento de intrones / sitios de empalme y para la construcción de modelos genéticos. (Consulte PALMapper para obtener una versión más rápida).				Si, cliente-servidor	Gratis, GPL 2
RazerS	Sin límite de longitud de lectura. Hamming o edición de mapas de distancia con tasas de error configurables. Sensibilidad configurable y predecible (compensación de tiempo de ejecución / sensibilidad). Admite mapeo de lectura de extremo emparejado.					Gratis, LGPL
REAL, CREAL	REAL es una herramienta eficiente, precisa y sensible para alinear lecturas cortas obtenidas de la secuenciación de próxima generación. El programa puede manejar una enorme cantidad de lecturas de un solo extremo generadas por el analizador de genoma Illumina / Solexa de próxima generación. cREAL es una extensión simple de REAL para alinear lecturas cortas obtenidas de la secuenciación de próxima generación a un genoma con estructura circular.		sí		sí	Gratis, GPL
RMAP	Puede mapear lecturas con o sin información de probabilidad de error (puntajes de calidad) y admite lecturas de extremos emparejados o mapeo de lectura tratado con bisulfito. No hay limitaciones en la longitud de lectura o el número de discrepancias.	sí	sí	sí		Gratis, GPL 3
ARN	Un alineador numérico aleatorio para una alineación precisa de las lecturas de NGS	sí	Recorte de bases de baja calidad	sí	Multihilo y habilitado para MPI	Gratis, GPL 3
Investigador RTG	Extremadamente rápido, tolerante a altos recuentos de indel y sustitución. Incluye alineación de lectura completa. El producto incluye tuberías integrales para la detección de variantes y el análisis metagenómico con cualquier combinación de datos de Illumina, Complete Genomics y Roche 454.	sí	Sí, para llamadas variantes	sí	sí	Software gratuito y patentado para uso individual de investigadores
Segemehl	Puede manejar inserciones, eliminaciones, desajustes; utiliza matrices de sufijos mejoradas	sí	No	sí	sí	Software gratuito y patentado para uso no comercial	^[50]	2009
SeqMap	Hasta 5 sustituciones mixtas e inserciones-deleciones; varias opciones de ajuste y formatos de entrada-salida					Patentada , software gratuito para uso no comercial y académica
Shrec	Corrección de errores de lectura breve con una estructura de datos de árbol de sufijos				Sí, Java
Camarón	Indexa el genoma de referencia a partir de la versión 2. Utiliza máscaras para generar posibles claves. Puede mapear lecturas de espacio de color ABI SOLiD.	sí	sí	sí	Sí, OpenMP	Gratis, [[Licencias BSD \| style = "background: #ddfd; color: black; vertical-align: middle; text-align: center;" class = "free table-free" \| Gratis, BSD ]] derivado	^[51]^[52]	2009-2011
DESLIZADOR	Slider es una aplicación para la salida del analizador de secuencias de Illumina que utiliza los archivos de "probabilidad" en lugar de los archivos de secuencia como entrada para la alineación con una secuencia de referencia o un conjunto de secuencias de referencia.	sí	sí	No	No		^[53]^[54]	2009-2010
SOAP, SOAP2, SOAP3, SOAP3-dp	SOAP: robusto con un número pequeño (1-3) de lagunas y desajustes. Mejora de velocidad sobre BLAT, utiliza una tabla hash de 12 letras. SOAP2: usa BWT bidireccional para construir el índice de referencia, y es mucho más rápido que la primera versión. SOAP3: versión acelerada por GPU que podría encontrar las 4 alineaciones de desajuste en decenas de segundos por cada millón de lecturas. SOAP3-dp, también acelerado por GPU, admite un número arbitrario de desajustes y brechas de acuerdo con puntuaciones de penalización por brechas afines.	sí	No	Sí, SOAP3-dp	Sí, POSIX Threads ; SOAP3, SOAP3-dp necesitan GPU con soporte CUDA	Gratis, GPL	^[55]^[56]
SOCS	Para tecnologías ABI SOLiD. Aumento significativo del tiempo para asignar lecturas con desajustes (o errores de color). Utiliza una versión iterativa del algoritmo de búsqueda de cadenas de Rabin-Karp.				sí	Gratis, GPL
SparkBWA	Integra Burrows-Wheeler Aligner —BWA en un marco Apache Spark que se ejecuta sobre Hadoop . La versión 0.2 de octubre de 2016 admite los algoritmos BWA-MEM, BWA-backtrack y BWA-ALN. Todos ellos funcionan con lecturas únicas y lecturas emparejadas.	sí	Recorte de bases de baja calidad	sí	sí	Gratis, GPL 3	^[57]	2016
SSAHA, SSAHA2	Rápido para un pequeño número de variantes					Patentada , software gratuito para uso no comercial y académica
Stampy	Para las lecturas de Illumina. Alta especificidad y sensibilidad para lecturas con indeles, variantes estructurales o muchos SNP. Lento, pero la velocidad aumentó drásticamente al usar BWA para la primera pasada de alineación.	sí	sí	sí	No	Patentada , software gratuito para uso no comercial y académica	^[58]	2010
Tormenta	Para lecturas de Illumina o ABI SOLiD, con salida nativa SAM . Muy sensible para lecturas con muchos errores, indels (completo de 0 a 15, soporte extendido en caso contrario). Utiliza semillas espaciadas (un solo golpe) y un filtro de alineación de bandas SSE - SSE2 - AVX2 - AVX-512 muy rápido . Solo para lecturas de longitud fija, los autores recomiendan SHRiMP2 de lo contrario.	No	sí	sí	Sí, OpenMP	Libre	^[59]	2010
Subread, Subjunc	Alineadores de lectura ultrarrápidos y precisos. El subpan se puede utilizar para mapear las lecturas de gDNA-seq y RNA-seq. Subjunc detecta las uniones exón-exón y mapea las lecturas de RNA-seq. Emplean un paradigma de mapeo novedoso llamado semilla y voto .	sí	sí	sí	sí	Gratis, GPL 3
Taipan	Ensamblador de novo para lecturas de Illumina					Patentada , software gratuito para uso no comercial y académica
UGENE	Interfaz visual tanto para Bowtie como para BWA, y un alineador integrado	sí	sí	sí	sí	Gratis, GPL
VelociMapper	Herramienta de mapeo de alineación de secuencia de referencia acelerada por FPGA de TimeLogic . Más rápido que los algoritmos basados en transformaciones de Burrows-Wheeler como BWA y Bowtie. Admite hasta 7 desajustes y / o indeles sin penalización de rendimiento. Produce alineaciones con huecos de Smith-Waterman sensibles.	sí	sí	sí	sí	Propietario , comercial
XpressAlign	Alineador de lectura corta de ventana deslizante basado en FPGA que explota la propiedad vergonzosamente paralela de la alineación de lectura corta. El rendimiento escala linealmente con el número de transistores en un chip (es decir, rendimiento garantizado que se duplicará con cada iteración de la Ley de Moore sin modificación del algoritmo). El bajo consumo de energía es útil para equipos de centros de datos. Tiempo de ejecución predecible. Mejor precio / rendimiento que los alineadores de ventana deslizante de software en el hardware actual, pero no mejor que los alineadores de software basados en BWT actualmente. Puede gestionar un gran número (> 2) de desajustes. Encontrará todas las posiciones de impacto para todas las semillas. Versión experimental de FPGA simple, necesita trabajar para desarrollarla en una versión de producción de FPGA múltiple.					Patentada , software gratuito para uso no comercial y académica
ZOOM	Sensibilidad del 100% para lecturas entre 15-240 pb con discrepancias prácticas. Muy rapido. Admite inserciones y eliminaciones. Funciona con instrumentos Illumina y SOLiD, no con 454.				Sí (GUI), no (CLI)	Propietario , comercial	^[60]

Ver también

Lista de software bioinformático de código abierto

Referencias

^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Molinero; Myers; Lipman (octubre de 1990). "Herramienta básica de búsqueda de alineación local". Revista de Biología Molecular . 215 (3): 403–10. doi : 10.1016 / S0022-2836 (05) 80360-2 . PMID 2231712 .CS1 maint: varios nombres: lista de autores ( enlace )
^ Repositorio de código HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
^ Angermüller, C .; Biegert, A .; Söding, J. (diciembre de 2012). "Modelado discriminativo de probabilidades de sustitución de aminoácidos específicas del contexto" . Bioinformática . 28 (24): 3240–7. doi : 10.1093 / bioinformatics / bts622 . PMID 23080114 .
^ Buchfink, Xie y Huson (2015). "Alineación de proteínas rápida y sensible usando DIAMOND". Métodos de la naturaleza . 12 (1): 59–60. doi : 10.1038 / nmeth.3176 . PMID 25402007 . S2CID 5346781 .
^ B Buchfink, K Reuter y HG Drost (2021). "Alineaciones de proteínas sensibles a escala de árbol de la vida utilizando DIAMOND" . Métodos de la naturaleza . 18 (4): 366–368. doi : 10.1038 / s41592-021-01101-x . PMC 8026399 . PMID 33828273 .
^ Durbin, Richard; Eddy, Sean R .; Krogh, Anders ; Mitchison, Graeme, eds. (1998). Análisis de secuencias biológicas: modelos probabilísticos de proteínas y ácidos nucleicos . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3.^{[ página necesaria ]}
^ Söding J (abril de 2005). "Detección de homología de proteínas por comparación HMM-HMM" . Bioinformática . 21 (7): 951–60. doi : 10.1093 / bioinformatics / bti125 . PMID 15531603 .
^ Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (25 de diciembre de 2011). "HHblits: búsqueda de secuencias de proteínas iterativas ultrarrápidas por alineación HMM-HMM". Métodos de la naturaleza . 9 (2): 173-175. doi : 10.1038 / nmeth.1818 . hdl : 11858 / 00-001M-0000-0015-8D56-A . ISSN 1548-7105 . PMID 22198341 . S2CID 205420247 .
^ Hauswedell H, cantante J, Reinert K (1 de septiembre de 2014). "Lambda: el alineador local de datos biológicos masivos" . Bioinformática . 30 (17): 349–355. doi : 10.1093 / bioinformatics / btu439 . PMC 4147892 . PMID 25161219 .
^ Steinegger, Martin; Soeding, Johannes (16 de octubre de 2017). "MMseqs2 permite la búsqueda de secuencias de proteínas sensibles para el análisis de conjuntos de datos masivos" . Biotecnología de la naturaleza . 35 (11): 1026–1028. doi : 10.1038 / nbt.3988 . hdl : 11858 / 00-001M-0000-002E-1967-3 . PMID 29035372 . S2CID 402352 .
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (30 de junio de 2016). "OSWALD: OpenCL Smith-Waterman en FPGA de Altera para grandes bases de datos de proteínas" . Revista internacional de aplicaciones informáticas de alto rendimiento . 32 (3): 337–350. doi : 10.1177 / 1094342016654215 . ISSN 1094-3420 . S2CID 212680914 .
^ Altschul SF, Madden TL, Schäffer AA, et al. (Septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda de bases de datos de proteínas" . Investigación de ácidos nucleicos . 25 (17): 3389–402. doi : 10.1093 / nar / 25.17.3389 . PMC 146917 . PMID 9254694 .
^ Li W, McWilliam H, Goujon M, et al. (Junio 2012). "PSI-Search: búsqueda iterativa SSEARCH de perfil reducido HOE" . Bioinformática . 28 (12): 1650-1651. doi : 10.1093 / bioinformatics / bts240 . PMC 3371869 . PMID 22539666 .
^ Oehmen, C .; Nieplocha, J. (agosto de 2006). "ScalaBLAST: una implementación escalable de BLAST para análisis bioinformático de datos de alto rendimiento" . Transacciones IEEE en sistemas paralelos y distribuidos . 17 (8): 740–749. doi : 10.1109 / TPDS.2006.112 . S2CID 11122366 .
^ Hughey, R .; Karplus, K .; Krogh, A. (2003). SAM: sistema de software de alineación y modelado de secuencias. Informe técnico UCSC-CRL-99-11 (Informe). Universidad de California, Santa Cruz, CA.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25/12/2015). "Un análisis de rendimiento de energía consciente de SWIMM: implementación de Smith-Waterman en las arquitecturas Intel Multicore y Manycore" . Concurrencia y Computación: Práctica y Experiencia . 27 (18): 5517–5537. doi : 10.1002 / cpe.3598 . ISSN 1532-0634 . S2CID 42945406 .
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25/12/2015). "SWIMM 2.0: Smith-Waterman mejorado en las arquitecturas Intel Multicore y Manycore basadas en extensiones vectoriales AVX-512" . Revista Internacional de Programación Paralela . 47 (2): 296–317. doi : 10.1007 / s10766-018-0585-7 . ISSN 1573-7640 . S2CID 49670113 .
^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Alineaciones humano-ratón con BLASTZ" . Investigación del genoma . 13 (1): 103–107. doi : 10.1101 / gr.809403 . PMC 430961 . PMID 12529312 .CS1 maint: varios nombres: lista de autores ( enlace )
^ Harris RS (2007). Mejora de la alineación por pares del ADN genómico (Tesis).
^ Sandes, Edans F. de O .; de Melo, Alba Cristina MA (mayo de 2013). "Recuperación de alineaciones de Smith-Waterman con optimizaciones para secuencias biológicas de Megabase mediante GPU". Transacciones IEEE en sistemas paralelos y distribuidos . 24 (5): 1009–1021. doi : 10.1109 / TPDS.2012.194 .
^ Sandes, Edans F. de O .; Miranda, G .; De Melo, ACMA; Martorell, X .; Ayguade, E. (mayo de 2014). CUDAlign 3.0: Comparación de secuencias biológicas paralelas en grandes clústeres de GPU . Computación en clúster, en la nube y en red (CCGrid), 2014 XIV Simposio Internacional IEEE / ACM sobre. pag. 160. doi : 10.1109 / CCGrid.2014.18 .
^ Sandes, Edans F. de O .; Miranda, G .; De Melo, ACMA; Martorell, X .; Ayguade, E. (agosto de 2014). Comparación de secuencia de megabase paralela de grano fino con varias GPU heterogéneas . Actas del XIX Simposio ACM SIGPLAN sobre Principios y Práctica de la Programación Paralela. págs. 383–384. doi : 10.1145 / 2555243.2555280 .
^ Chivian, D; Baker, D (2006). "Modelado de homología utilizando generación de conjuntos de alineación paramétrica con consenso y selección de modelos basados en energía" . Investigación de ácidos nucleicos . 34 (17): e112. doi : 10.1093 / nar / gkl480 . PMC 1635247 . PMID 16971460 .
^ Girdea, M; Noe, L; Kucherov, G (enero de 2010). "Retraducción para descubrir homologías de proteínas distantes en presencia de mutaciones de cambio de marco" . Algoritmos de Biología Molecular . 5 (6): 6. doi : 10.1186 / 1748-7188-5-6 . PMC 2821327 . PMID 20047662 .
^ Ma, B .; Tromp, J .; Li, M. (2002). "PatternHunter: búsqueda de homología más rápida y sensible" . Bioinformática . 18 (3): 440–445. doi : 10.1093 / bioinformatics / 18.3.440 . PMID 11934743 .
^ Li, M .; Ma, B .; Kisman, D .; Tromp, J. (2004). "Patternhunter II: búsqueda de homología muy sensible y rápida". Revista de Bioinformática y Biología Computacional . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi : 10.1142 / S0219720004000661 . PMID 15359419 .
^ Gusfield, Dan (1997). Algoritmos sobre cadenas, árboles y secuencias . Prensa de la Universidad de Cambridge. ISBN 978-0-521-58519-4.
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: implementación de Smith-Waterman en FPGA con OpenCL para secuencias de ADN largas" . Biología de sistemas BMC . 12 (Supl. 5): 96. doi : 10.1186 / s12918-018-0614-6 . PMC 6245597 . PMID 30458766 .
^ Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel. Aceleración de la alineación de Smith-Waterman de secuencias largas de ADN con OpenCL en FPGA . V Congreso Internacional de Trabajo en Bioinformática e Ingeniería Biomédica. pag. 500-511. doi : 10.1007 / 978-3-319-56154-7_45 .
^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Filtros de q-Gram eficientes para encontrar todas las coincidencias épsilon en una longitud determinada". Revista de Biología Computacional . 13 (2): 296-308. CiteSeerX 10.1.1.465.2084 . doi : 10.1089 / cmb.2006.13.296 . PMID 16597241 .CS1 maint: varios nombres: lista de autores ( enlace )
^ Noe L, Kucherov G; Kucherov (2005). "YASS: mejora de la sensibilidad de la búsqueda de similitud de ADN" . Investigación de ácidos nucleicos . 33 (supl_2): W540 – W543. doi : 10.1093 / nar / gki478 . PMC 1160238 . PMID 15980530 .
^ Pratas, Diogo; Silva, Jorge (2020). "Secuencias mínimas persistentes de SARS-CoV-2" . Bioinformática . 36 (21): 5129–5132. doi : 10.1093 / bioinformatics / btaa686 . PMC 7559010 . PMID 32730589 .
^ Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J .; Salzberg, Steven L .; Szalay, Alexander S. (2015). "Arioc: alineación de lectura de alto rendimiento con exploración acelerada por GPU del espacio de búsqueda de semilla y extensión" . PeerJ . 3 : e808. doi : 10.7717 / peerj.808 . PMC 4358639 . PMID 25780763 .
^ Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: una herramienta de alineación para la resecuenciación del genoma a gran escala" . PLOS ONE . 4 (11): e7767. Código Bibliográfico : 2009PLoSO ... 4.7767H . doi : 10.1371 / journal.pone.0007767 . PMC 2770639 . PMID 19907642 .
^ Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). "BigBWA: acercando el alineador de Burrows-Wheeler a las tecnologías de Big Data" . Bioinformática . 31 (24): 4003–5. doi : 10.1093 / bioinformatics / btv506 . PMID 26323715 .
^ Kent, WJ (2002). "BLAT --- La herramienta de alineación BLAST-Like" . Investigación del genoma . 12 (4): 656–664. doi : 10.1101 / gr.229202 . ISSN 1088-9051 . PMC 187518 . PMID 11932250 .
^ Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). "Alineación ultrarrápida y eficiente para la memoria de secuencias cortas de ADN con el genoma humano" . Biología del genoma . 10 (3): R25. doi : 10.1186 / gb-2009-10-3-r25 . ISSN 1465-6906 . PMC 2690996 . PMID 19261174 .
^ Li, H .; Durbin, R. (2009). "Alineación de lectura corta rápida y precisa con la transformación de Burrows-Wheeler" . Bioinformática . 25 (14): 1754-1760. doi : 10.1093 / bioinformatics / btp324 . ISSN 1367-4803 . PMC 2705234 . PMID 19451168 .
^ a b Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Mapeo probabilístico adaptable de lecturas cortas utilizando matrices de puntuación específicas de posición" . BMC Bioinformática . 15 (1): 100. doi : 10.1186 / 1471-2105-15-100 . ISSN 1471-2105 . PMC 4021105 . PMID 24717095 .
^ Liu, Y .; Schmidt, B .; Maskell, DL (2012). "CUSHAW: un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler" . Bioinformática . 28 (14): 1830–1837. doi : 10.1093 / bioinformatics / bts276 . ISSN 1367-4803 . PMID 22576173 .
^ Liu, Y .; Schmidt, B. (2012). "Alineación de lectura larga basada en semillas de coincidencia exacta máxima" . Bioinformática . 28 (18): i318 – i324. doi : 10.1093 / bioinformatics / bts414 . ISSN 1367-4803 . PMC 3436841 . PMID 22962447 .
^ Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: herramienta de búsqueda de secuencia corta de alineación global" . Bioinformática . 26 (20): 2534-2540. doi : 10.1093 / bioinformatics / btq485 . PMC 2951093 . PMID 20739310 .
^ Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "El mapeador GEM: alineación por filtración rápida, precisa y versátil". Métodos de la naturaleza . 9 (12): 1185-1188. doi : 10.1038 / nmeth.2221 . ISSN 1548-7091 . PMID 23103880 . S2CID 2004416 .
^ Clement, NL; Snell, Q .; Clement, MJ; Hollenhorst, PC; Purwar, J .; Graves, BJ; Cairns, BR; Johnson, WE (2009). "El algoritmo GNUMAP: mapeo probabilístico imparcial de oligonucleótidos de secuenciación de próxima generación" . Bioinformática . 26 (1): 38–45. doi : 10.1093 / bioinformatics / btp614 . ISSN 1367-4803 . PMC 6276904 . PMID 19861355 .
^ Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: alineación de secuencia paralela de alto rendimiento para análisis de datos de secuenciación de próxima generación" . PLOS ONE . 9 (6): 1754-1760. Código Bibliográfico : 2014PLoSO ... 999033S . doi : 10.1371 / journal.pone.0099033 . PMC 4053384 . PMID 24918764 .
^ Kielbasa, SM; Wan, R .; Sato, K .; Horton, P .; Frith, MC (2011). "Semillas adaptativas domesticar la comparación de la secuencia genómica" . Investigación del genoma . 21 (3): 487–493. doi : 10.1101 / gr.113985.110 . PMC 3044862 . PMID 21209072 .
^ Rivales, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: localización rápida de múltiples lecturas en genomas . Algoritmos en Bioinformática . Apuntes de conferencias en informática. 5724 . págs. 246–260. Código Bibliográfico : 2009LNCS.5724..246R . CiteSeerX 10.1.1.156.928 . doi : 10.1007 / 978-3-642-04241-6_21 . ISBN 978-3-642-04240-9.
^ Sedlazeck, Fritz J .; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: mapeo de lectura rápido y preciso en genomas altamente polimórficos" . Bioinformática . 29 (21): 2790–2791. doi : 10.1093 / bioinformatics / btt468 . PMID 23975764 .
^ Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: mapeo eficiente de lecturas de secuenciación corta con semillas espaciadas completamente sensibles periódicas" . Bioinformática . 25 (19): 2514–2521. doi : 10.1093 / bioinformatics / btp486 . PMC 2752623 . PMID 19675096 .
^ Searls, David B .; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M .; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F .; Hackermüller, Jörg (2009). "Mapeo rápido de secuencias cortas con desajustes, inserciones y eliminaciones utilizando estructuras de índice" . PLOS Biología Computacional . 5 (9): e1000502. Código Bibliográfico : 2009PLSCB ... 5E0502H . doi : 10.1371 / journal.pcbi.1000502 . ISSN 1553-7358 . PMC 2730575 . PMID 19750212 .
^ Rumble, Stephen M .; Lacroute, Phil; Dalca, Adrian V .; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: asignación precisa de lecturas de espacio de color corto" . PLOS Biología Computacional . 5 (5): e1000386. Código Bibliográfico : 2009PLSCB ... 5E0386R . doi : 10.1371 / journal.pcbi.1000386 . PMC 2678294 . PMID 19461883 .
^ David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: mapeo de lectura corta sensible pero práctico" . Bioinformática . 27 (7): 1011–1012. doi : 10.1093 / bioinformatics / btr046 . PMID 21278192 .
^ Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). "Control deslizante: uso máximo de información de probabilidad para la alineación de lecturas de secuencia corta y detección de SNP" . Bioinformática . 25 (1): 6–13. doi : 10.1093 / bioinformatics / btn565 . PMC 2638935 . PMID 18974170 .
^ Malhis, Nawar; Jones, Steven JM (2010). "Llamadas SNP de alta calidad con datos de Illumina con cobertura superficial" . Bioinformática . 26 (8): 1029–1035. doi : 10.1093 / bioinformatics / btq092 . PMID 20190250 .
^ Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). "SOAP: programa de alineación de oligonucleótidos corto" . Bioinformática . 24 (5): 713–714. doi : 10.1093 / bioinformatics / btn025 . ISSN 1367-4803 . PMID 18227114 .
^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Wang, J. (2009). "SOAP2: una herramienta ultrarrápida mejorada para alineación de lectura corta" . Bioinformática . 25 (15): 1966–1967. doi : 10.1093 / bioinformatics / btp336 . ISSN 1367-4803 . PMID 19497933 .
^ Abuín, José M .; Pichel, Juan C .; Pena, Tomás F .; Amigo, Jorge (16 de mayo de 2016). "SparkBWA: acelerar la alineación de datos de secuenciación de ADN de alto rendimiento" . PLOS ONE . 11 (5): e0155461. Código bibliográfico : 2016PLoSO..1155461A . doi : 10.1371 / journal.pone.0155461 . ISSN 1932-6203 . PMC 4868289 . PMID 27182962 .
^ Lunter, G .; Goodson, M. (2010). "Stampy: un algoritmo estadístico para el mapeo sensible y rápido de lecturas de secuencia de Illumina" . Investigación del genoma . 21 (6): 936–939. doi : 10.1101 / gr.111120.110 . ISSN 1088-9051 . PMC 3106326 . PMID 20980556 .
^ Noe, L .; Girdea, M .; Kucherov, G. (2010). "Diseño de semillas espaciadas eficientes para mapeo de lectura SOLiD" . Avances en bioinformática . 2010 : 708501. doi : 10.1155 / 2010/708501 . PMC 2945724 . PMID 20936175 .
^ Lin, H .; Zhang, Z .; Zhang, MQ; Ma, B .; Li, M. (2008). "¡ZOOM! Millones de oligos mapeados" . Bioinformática . 24 (21): 2431–2437. doi : 10.1093 / bioinformatics / btn416 . PMC 2732274 . PMID 18684737 .

[1] Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Molinero; Myers; Lipman (octubre de 1990). "Herramienta básica de búsqueda de alineación local". Revista de Biología Molecular . 215 (3): 403–10. doi : 10.1016 / S0022-2836 (05) 80360-2 . PMID 2231712 .CS1 maint: varios nombres: lista de autores ( enlace )

[2] Repositorio de código HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST

[3] Angermüller, C .; Biegert, A .; Söding, J. (diciembre de 2012). "Modelado discriminativo de probabilidades de sustitución de aminoácidos específicas del contexto" . Bioinformática . 28 (24): 3240–7. doi : 10.1093 / bioinformatics / bts622 . PMID 23080114 .

[4] Buchfink, Xie y Huson (2015). "Alineación de proteínas rápida y sensible usando DIAMOND". Métodos de la naturaleza . 12 (1): 59–60. doi : 10.1038 / nmeth.3176 . PMID 25402007 . S2CID 5346781 .

[5] B Buchfink, K Reuter y HG Drost (2021). "Alineaciones de proteínas sensibles a escala de árbol de la vida utilizando DIAMOND" . Métodos de la naturaleza . 18 (4): 366–368. doi : 10.1038 / s41592-021-01101-x . PMC 8026399 . PMID 33828273 .

[6] Durbin, Richard; Eddy, Sean R .; Krogh, Anders ; Mitchison, Graeme, eds. (1998). Análisis de secuencias biológicas: modelos probabilísticos de proteínas y ácidos nucleicos . Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3.^{[ página necesaria ]}

[7] Söding J (abril de 2005). "Detección de homología de proteínas por comparación HMM-HMM" . Bioinformática . 21 (7): 951–60. doi : 10.1093 / bioinformatics / bti125 . PMID 15531603 .

[8] Remmert, Michael; Biegert, Andreas; Hauser, Andreas; Söding, Johannes (25 de diciembre de 2011). "HHblits: búsqueda de secuencias de proteínas iterativas ultrarrápidas por alineación HMM-HMM". Métodos de la naturaleza . 9 (2): 173-175. doi : 10.1038 / nmeth.1818 . hdl : 11858 / 00-001M-0000-0015-8D56-A . ISSN 1548-7105 . PMID 22198341 . S2CID 205420247 .

[9] Hauswedell H, cantante J, Reinert K (1 de septiembre de 2014). "Lambda: el alineador local de datos biológicos masivos" . Bioinformática . 30 (17): 349–355. doi : 10.1093 / bioinformatics / btu439 . PMC 4147892 . PMID 25161219 .

[10] Steinegger, Martin; Soeding, Johannes (16 de octubre de 2017). "MMseqs2 permite la búsqueda de secuencias de proteínas sensibles para el análisis de conjuntos de datos masivos" . Biotecnología de la naturaleza . 35 (11): 1026–1028. doi : 10.1038 / nbt.3988 . hdl : 11858 / 00-001M-0000-002E-1967-3 . PMID 29035372 . S2CID 402352 .

[11] Rucci, Enzo; García, Carlos; Botella, Guillermo; Giusti, Armando E. De; Naiouf, Marcelo; Prieto-Matias, Manuel (30 de junio de 2016). "OSWALD: OpenCL Smith-Waterman en FPGA de Altera para grandes bases de datos de proteínas" . Revista internacional de aplicaciones informáticas de alto rendimiento . 32 (3): 337–350. doi : 10.1177 / 1094342016654215 . ISSN 1094-3420 . S2CID 212680914 .

[12] Altschul SF, Madden TL, Schäffer AA, et al. (Septiembre de 1997). "Gapped BLAST y PSI-BLAST: una nueva generación de programas de búsqueda de bases de datos de proteínas" . Investigación de ácidos nucleicos . 25 (17): 3389–402. doi : 10.1093 / nar / 25.17.3389 . PMC 146917 . PMID 9254694 .

[13] Li W, McWilliam H, Goujon M, et al. (Junio 2012). "PSI-Search: búsqueda iterativa SSEARCH de perfil reducido HOE" . Bioinformática . 28 (12): 1650-1651. doi : 10.1093 / bioinformatics / bts240 . PMC 3371869 . PMID 22539666 .

[14] Oehmen, C .; Nieplocha, J. (agosto de 2006). "ScalaBLAST: una implementación escalable de BLAST para análisis bioinformático de datos de alto rendimiento" . Transacciones IEEE en sistemas paralelos y distribuidos . 17 (8): 740–749. doi : 10.1109 / TPDS.2006.112 . S2CID 11122366 .

[15] Hughey, R .; Karplus, K .; Krogh, A. (2003). SAM: sistema de software de alineación y modelado de secuencias. Informe técnico UCSC-CRL-99-11 (Informe). Universidad de California, Santa Cruz, CA.

[16] Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25/12/2015). "Un análisis de rendimiento de energía consciente de SWIMM: implementación de Smith-Waterman en las arquitecturas Intel Multicore y Manycore" . Concurrencia y Computación: Práctica y Experiencia . 27 (18): 5517–5537. doi : 10.1002 / cpe.3598 . ISSN 1532-0634 . S2CID 42945406 .

[17] Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25/12/2015). "SWIMM 2.0: Smith-Waterman mejorado en las arquitecturas Intel Multicore y Manycore basadas en extensiones vectoriales AVX-512" . Revista Internacional de Programación Paralela . 47 (2): 296–317. doi : 10.1007 / s10766-018-0585-7 . ISSN 1573-7640 . S2CID 49670113 .

[18] Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Alineaciones humano-ratón con BLASTZ" . Investigación del genoma . 13 (1): 103–107. doi : 10.1101 / gr.809403 . PMC 430961 . PMID 12529312 .CS1 maint: varios nombres: lista de autores ( enlace )

[19] Harris RS (2007). Mejora de la alineación por pares del ADN genómico (Tesis).

[20] Sandes, Edans F. de O .; de Melo, Alba Cristina MA (mayo de 2013). "Recuperación de alineaciones de Smith-Waterman con optimizaciones para secuencias biológicas de Megabase mediante GPU". Transacciones IEEE en sistemas paralelos y distribuidos . 24 (5): 1009–1021. doi : 10.1109 / TPDS.2012.194 .

[21] Sandes, Edans F. de O .; Miranda, G .; De Melo, ACMA; Martorell, X .; Ayguade, E. (mayo de 2014). CUDAlign 3.0: Comparación de secuencias biológicas paralelas en grandes clústeres de GPU . Computación en clúster, en la nube y en red (CCGrid), 2014 XIV Simposio Internacional IEEE / ACM sobre. pag. 160. doi : 10.1109 / CCGrid.2014.18 .

[22] Sandes, Edans F. de O .; Miranda, G .; De Melo, ACMA; Martorell, X .; Ayguade, E. (agosto de 2014). Comparación de secuencia de megabase paralela de grano fino con varias GPU heterogéneas . Actas del XIX Simposio ACM SIGPLAN sobre Principios y Práctica de la Programación Paralela. págs. 383–384. doi : 10.1145 / 2555243.2555280 .

[23] Chivian, D; Baker, D (2006). "Modelado de homología utilizando generación de conjuntos de alineación paramétrica con consenso y selección de modelos basados en energía" . Investigación de ácidos nucleicos . 34 (17): e112. doi : 10.1093 / nar / gkl480 . PMC 1635247 . PMID 16971460 .

[24] Girdea, M; Noe, L; Kucherov, G (enero de 2010). "Retraducción para descubrir homologías de proteínas distantes en presencia de mutaciones de cambio de marco" . Algoritmos de Biología Molecular . 5 (6): 6. doi : 10.1186 / 1748-7188-5-6 . PMC 2821327 . PMID 20047662 .

[25] Ma, B .; Tromp, J .; Li, M. (2002). "PatternHunter: búsqueda de homología más rápida y sensible" . Bioinformática . 18 (3): 440–445. doi : 10.1093 / bioinformatics / 18.3.440 . PMID 11934743 .

[26] Li, M .; Ma, B .; Kisman, D .; Tromp, J. (2004). "Patternhunter II: búsqueda de homología muy sensible y rápida". Revista de Bioinformática y Biología Computacional . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi : 10.1142 / S0219720004000661 . PMID 15359419 .

[27] Gusfield, Dan (1997). Algoritmos sobre cadenas, árboles y secuencias . Prensa de la Universidad de Cambridge. ISBN 978-0-521-58519-4.

[28] Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel (2018). "SWIFOLD: implementación de Smith-Waterman en FPGA con OpenCL para secuencias de ADN largas" . Biología de sistemas BMC . 12 (Supl. 5): 96. doi : 10.1186 / s12918-018-0614-6 . PMC 6245597 . PMID 30458766 .

[29] Rucci, Enzo; García, Carlos; Botella, Guillermo; Naiouf, Marcelo; De Giusti, Armando; Prieto-Matias, Manuel. Aceleración de la alineación de Smith-Waterman de secuencias largas de ADN con OpenCL en FPGA . V Congreso Internacional de Trabajo en Bioinformática e Ingeniería Biomédica. pag. 500-511. doi : 10.1007 / 978-3-319-56154-7_45 .

[30] Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). "Filtros de q-Gram eficientes para encontrar todas las coincidencias épsilon en una longitud determinada". Revista de Biología Computacional . 13 (2): 296-308. CiteSeerX 10.1.1.465.2084 . doi : 10.1089 / cmb.2006.13.296 . PMID 16597241 .CS1 maint: varios nombres: lista de autores ( enlace )

[31] Noe L, Kucherov G; Kucherov (2005). "YASS: mejora de la sensibilidad de la búsqueda de similitud de ADN" . Investigación de ácidos nucleicos . 33 (supl_2): W540 – W543. doi : 10.1093 / nar / gki478 . PMC 1160238 . PMID 15980530 .

[Pratas2020-32] Pratas, Diogo; Silva, Jorge (2020). "Secuencias mínimas persistentes de SARS-CoV-2" . Bioinformática . 36 (21): 5129–5132. doi : 10.1093 / bioinformatics / btaa686 . PMC 7559010 . PMID 32730589 .

[WiltonEtAl2015-33] Wilton, Richard; Budavari, Tamas; Langmead, Ben; Wheelan, Sarah J .; Salzberg, Steven L .; Szalay, Alexander S. (2015). "Arioc: alineación de lectura de alto rendimiento con exploración acelerada por GPU del espacio de búsqueda de semilla y extensión" . PeerJ . 3 : e808. doi : 10.7717 / peerj.808 . PMC 4358639 . PMID 25780763 .

[HomerMerrimanNelson2009-34] Homer, Nils; Merriman, Barry; Nelson, Stanley F. (2009). "BFAST: una herramienta de alineación para la resecuenciación del genoma a gran escala" . PLOS ONE . 4 (11): e7767. Código Bibliográfico : 2009PLoSO ... 4.7767H . doi : 10.1371 / journal.pone.0007767 . PMC 2770639 . PMID 19907642 .

[Abuin2015-35] Abuín, JM; Pichel, JC; Pena, TF; Amigo, J. (2015). "BigBWA: acercando el alineador de Burrows-Wheeler a las tecnologías de Big Data" . Bioinformática . 31 (24): 4003–5. doi : 10.1093 / bioinformatics / btv506 . PMID 26323715 .

[Kent2002-36] Kent, WJ (2002). "BLAT --- La herramienta de alineación BLAST-Like" . Investigación del genoma . 12 (4): 656–664. doi : 10.1101 / gr.229202 . ISSN 1088-9051 . PMC 187518 . PMID 11932250 .

[LangmeadTrapnell2009-37] Langmead, Ben; Trapnell, Cole; Pop, Mihai; Salzberg, Steven L (2009). "Alineación ultrarrápida y eficiente para la memoria de secuencias cortas de ADN con el genoma humano" . Biología del genoma . 10 (3): R25. doi : 10.1186 / gb-2009-10-3-r25 . ISSN 1465-6906 . PMC 2690996 . PMID 19261174 .

[LiDurbin2009-38] Li, H .; Durbin, R. (2009). "Alineación de lectura corta rápida y precisa con la transformación de Burrows-Wheeler" . Bioinformática . 25 (14): 1754-1760. doi : 10.1093 / bioinformatics / btp324 . ISSN 1367-4803 . PMC 2705234 . PMID 19451168 .

[KerpedjievFrellsen2014-39] Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). "Mapeo probabilístico adaptable de lecturas cortas utilizando matrices de puntuación específicas de posición" . BMC Bioinformática . 15 (1): 100. doi : 10.1186 / 1471-2105-15-100 . ISSN 1471-2105 . PMC 4021105 . PMID 24717095 .

[LiuSchmidt2012a-40] Liu, Y .; Schmidt, B .; Maskell, DL (2012). "CUSHAW: un alineador de lectura corta compatible con CUDA para genomas grandes basado en la transformada de Burrows-Wheeler" . Bioinformática . 28 (14): 1830–1837. doi : 10.1093 / bioinformatics / bts276 . ISSN 1367-4803 . PMID 22576173 .

[LiuSchmidt2012b-41] Liu, Y .; Schmidt, B. (2012). "Alineación de lectura larga basada en semillas de coincidencia exacta máxima" . Bioinformática . 28 (18): i318 – i324. doi : 10.1093 / bioinformatics / bts414 . ISSN 1367-4803 . PMC 3436841 . PMID 22962447 .

[RizkLavenier2012-42] Rizk, Guillaume; Lavenier, Dominique (2010). "GASSST: herramienta de búsqueda de secuencia corta de alineación global" . Bioinformática . 26 (20): 2534-2540. doi : 10.1093 / bioinformatics / btq485 . PMC 2951093 . PMID 20739310 .

[Marco-SolaSammeth2012-43] Marco-Sola, Santiago; Sammeth, Michael; Guigó, Roderic; Ribeca, Paolo (2012). "El mapeador GEM: alineación por filtración rápida, precisa y versátil". Métodos de la naturaleza . 9 (12): 1185-1188. doi : 10.1038 / nmeth.2221 . ISSN 1548-7091 . PMID 23103880 . S2CID 2004416 .

[ClementSnell2009-44] Clement, NL; Snell, Q .; Clement, MJ; Hollenhorst, PC; Purwar, J .; Graves, BJ; Cairns, BR; Johnson, WE (2009). "El algoritmo GNUMAP: mapeo probabilístico imparcial de oligonucleótidos de secuenciación de próxima generación" . Bioinformática . 26 (1): 38–45. doi : 10.1093 / bioinformatics / btp614 . ISSN 1367-4803 . PMC 6276904 . PMID 19861355 .

[VSimonyan2014-45] Santana-Quintero, Luis; Dingerdissen, Hayley; Thierry-Mieg, Jean; Mazumder, Raja; Simonyan, Vahan (2014). "HIVE-Hexagon: alineación de secuencia paralela de alto rendimiento para análisis de datos de secuenciación de próxima generación" . PLOS ONE . 9 (6): 1754-1760. Código Bibliográfico : 2014PLoSO ... 999033S . doi : 10.1371 / journal.pone.0099033 . PMC 4053384 . PMID 24918764 .

[46] Kielbasa, SM; Wan, R .; Sato, K .; Horton, P .; Frith, MC (2011). "Semillas adaptativas domesticar la comparación de la secuencia genómica" . Investigación del genoma . 21 (3): 487–493. doi : 10.1101 / gr.113985.110 . PMC 3044862 . PMID 21209072 .

[RivalsEtAl2009-47] Rivales, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). mpscan: localización rápida de múltiples lecturas en genomas . Algoritmos en Bioinformática . Apuntes de conferencias en informática. 5724 . págs. 246–260. Código Bibliográfico : 2009LNCS.5724..246R . CiteSeerX 10.1.1.156.928 . doi : 10.1007 / 978-3-642-04241-6_21 . ISBN 978-3-642-04240-9.

[SedlazeckReschenederVonHaeseler2013-48] Sedlazeck, Fritz J .; Rescheneder, Philipp; von Haeseler, Arndt (2013). "NextGenMap: mapeo de lectura rápido y preciso en genomas altamente polimórficos" . Bioinformática . 29 (21): 2790–2791. doi : 10.1093 / bioinformatics / btt468 . PMID 23975764 .

[ChenSouaiaiaChen2009-49] Chen, Yangho; Souaiaia, Tade; Chen, Ting (2009). "PerM: mapeo eficiente de lecturas de secuenciación corta con semillas espaciadas completamente sensibles periódicas" . Bioinformática . 25 (19): 2514–2521. doi : 10.1093 / bioinformatics / btp486 . PMC 2752623 . PMID 19675096 .

[SearlsHoffmann2009-50] Searls, David B .; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M .; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F .; Hackermüller, Jörg (2009). "Mapeo rápido de secuencias cortas con desajustes, inserciones y eliminaciones utilizando estructuras de índice" . PLOS Biología Computacional . 5 (9): e1000502. Código Bibliográfico : 2009PLSCB ... 5E0502H . doi : 10.1371 / journal.pcbi.1000502 . ISSN 1553-7358 . PMC 2730575 . PMID 19750212 .

[RumbleLacrouteDalcaFiumeSidowBrudno2009-51] Rumble, Stephen M .; Lacroute, Phil; Dalca, Adrian V .; Fiume, Marc; Sidow, Arend; Brudno, Michael (2009). "SHRiMP: asignación precisa de lecturas de espacio de color corto" . PLOS Biología Computacional . 5 (5): e1000386. Código Bibliográfico : 2009PLSCB ... 5E0386R . doi : 10.1371 / journal.pcbi.1000386 . PMC 2678294 . PMID 19461883 .

[DavidDzambaListerIlieBrudno2011-52] David, Matei; Dzamba, Misko; Lister, Dan; Ilie, Lucian; Brudno, Michael (2011). "SHRiMP2: mapeo de lectura corta sensible pero práctico" . Bioinformática . 27 (7): 1011–1012. doi : 10.1093 / bioinformatics / btr046 . PMID 21278192 .

[MalhisButterfieldEsterJones2009-53] Malhis, Nawar; Butterfield, Yaron SN; Ester, Martin; Jones, Steven JM (2009). "Control deslizante: uso máximo de información de probabilidad para la alineación de lecturas de secuencia corta y detección de SNP" . Bioinformática . 25 (1): 6–13. doi : 10.1093 / bioinformatics / btn565 . PMC 2638935 . PMID 18974170 .

[MalhisJones2010-54] Malhis, Nawar; Jones, Steven JM (2010). "Llamadas SNP de alta calidad con datos de Illumina con cobertura superficial" . Bioinformática . 26 (8): 1029–1035. doi : 10.1093 / bioinformatics / btq092 . PMID 20190250 .

[LiLi2008-55] Li, R .; Li, Y .; Kristiansen, K .; Wang, J. (2008). "SOAP: programa de alineación de oligonucleótidos corto" . Bioinformática . 24 (5): 713–714. doi : 10.1093 / bioinformatics / btn025 . ISSN 1367-4803 . PMID 18227114 .

[LiYu2009-56] Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Yiu, S.-M .; Kristiansen, K .; Wang, J. (2009). "SOAP2: una herramienta ultrarrápida mejorada para alineación de lectura corta" . Bioinformática . 25 (15): 1966–1967. doi : 10.1093 / bioinformatics / btp336 . ISSN 1367-4803 . PMID 19497933 .

[57] Abuín, José M .; Pichel, Juan C .; Pena, Tomás F .; Amigo, Jorge (16 de mayo de 2016). "SparkBWA: acelerar la alineación de datos de secuenciación de ADN de alto rendimiento" . PLOS ONE . 11 (5): e0155461. Código bibliográfico : 2016PLoSO..1155461A . doi : 10.1371 / journal.pone.0155461 . ISSN 1932-6203 . PMC 4868289 . PMID 27182962 .

[LunterGoodson2010-58] Lunter, G .; Goodson, M. (2010). "Stampy: un algoritmo estadístico para el mapeo sensible y rápido de lecturas de secuencia de Illumina" . Investigación del genoma . 21 (6): 936–939. doi : 10.1101 / gr.111120.110 . ISSN 1088-9051 . PMC 3106326 . PMID 20980556 .

[NoeGirdeaKucherov2010-59] Noe, L .; Girdea, M .; Kucherov, G. (2010). "Diseño de semillas espaciadas eficientes para mapeo de lectura SOLiD" . Avances en bioinformática . 2010 : 708501. doi : 10.1155 / 2010/708501 . PMC 2945724 . PMID 20936175 .

[LinZhangZhangMaLi2008-60] Lin, H .; Zhang, Z .; Zhang, MQ; Ma, B .; Li, M. (2008). "¡ZOOM! Millones de oligos mapeados" . Bioinformática . 24 (21): 2431–2437. doi : 10.1093 / bioinformatics / btn416 . PMC 2732274 . PMID 18684737 .

[1]