CS-BLAST


CS-BLAST [1] [2] [3] (BLAST de contexto específico) es una herramienta que busca una secuencia de proteína que extiende BLAST (Herramienta de búsqueda de alineación local básica) , [4] usando probabilidades de mutación específicas del contexto. Más específicamente, CS-BLAST deriva similitudes de aminoácidos específicas del contexto en cada secuencia de consulta a partir de ventanas cortas en las secuencias de consulta [4]. El uso de CS-BLAST duplica la sensibilidad y mejora significativamente la calidad de la alineación sin pérdida de velocidad en comparación con BLAST. CSI-BLAST ( BLAST iterado específico del contexto) es el análogo específico del contexto de PSI-BLAST [5](BLAST iterado de posición específica), que calcula el perfil de mutación con probabilidades de sustitución y lo mezcla con el perfil de consulta [2]. CSI-BLAST (BLAST iterado de contexto específico) es el análogo específico de contexto de PSI-BLAST (BLAST iterado de posición específica). Ambos programas están disponibles como servidor web y están disponibles para su descarga gratuita.

La homología es la relación entre estructuras o secuencias biológicas derivadas de un ancestro común. Las proteínas homólogas (proteínas que tienen un ancestro común) se infieren a partir de la similitud de su secuencia. Inferir relaciones homólogas implica calcular puntuaciones de pares alineados menos penalizaciones por huecos. Los pares de proteínas alineados identifican regiones de similitud que indican una relación entre las dos o más proteínas. Para tener una relación homóloga, la suma de las puntuaciones de todos los pares alineados de aminoácidos o nucleótidos debe ser suficientemente alta [2]. Los métodos estándar de comparación de secuencias utilizan una matriz de sustitución para lograr esto [4]. Las similitudes entre aminoácidos o nucleótidos se cuantifican en estas matrices de sustitución. La puntuación de sustitución ( ) de aminoácidosy podemos escribir lo siguiente:

donde denota la probabilidad de que un aminoácido se transforme en un aminoácido [2]. En un gran conjunto de alineaciones de secuencia, contar el número de aminoácidos y el número de pares alineados le permitirá derivar las probabilidades y .