Clúster


Clustal es una serie de programas informáticos ampliamente utilizados en bioinformática para el alineamiento de secuencias múltiples . [2] Ha habido muchas versiones de Clustal sobre el desarrollo del algoritmo que se enumeran a continuación. El análisis de cada herramienta y su algoritmo también se detallan en sus respectivas categorías. Los sistemas operativos disponibles enumerados en la barra lateral son una combinación de la disponibilidad del software y es posible que no sean compatibles con todas las versiones actuales de las herramientas de Clustal. Clustal Omega tiene la más amplia variedad de sistemas operativos de todas las herramientas de Clustal.

Los artículos que describen el software clustal han sido muy citados, y dos de ellos se encuentran entre los artículos más citados de todos los tiempos. [9]

La versión más reciente del software disponible para Windows, Mac OS y Unix/Linux. También se usa comúnmente a través de una interfaz web en su propia página de inicio o alojada por el Instituto Europeo de Bioinformática .

El árbol guía en los programas iniciales se construyó a través de un análisis de grupos UPGMA de las alineaciones por pares, de ahí el nombre CLUSTAL. [10] cf. [11] Las primeras cuatro versiones en 1988 tenían números arábigos (1 a 4), mientras que con la quinta versión Des Higgins cambió al número romano V en 1992. [10] cf. [12] [4] En 1994 y en 1997, para las siguientes dos versiones, las letras después de la letra V se usaron y se hicieron para corresponder a W para ponderado y X para X Window . [10] cf. [13] [5] El nombre omega fue elegido para marcar un cambio de los anteriores.[10]

Todas las variaciones del software Clustal alinean secuencias utilizando una heurística que crea progresivamente una alineación de secuencias múltiples a partir de una serie de alineaciones por pares. Este método funciona analizando las secuencias como un todo y luego utilizando el método de unión UPGMA/Vecino para generar una matriz de distancia. A continuación, se calcula un árbol guía a partir de las puntuaciones de las secuencias en la matriz y, posteriormente, se utiliza para construir la alineación de secuencias múltiples alineando progresivamente las secuencias en orden de similitud. [14] Esencialmente, Clustal crea múltiples alineaciones de secuencia a través de tres pasos principales:

Estos pasos se llevan a cabo automáticamente cuando selecciona "Realizar alineación completa". Otras opciones son "Hacer alineación desde árbol guía y filogenia" y "Producir solo árbol guía".


Alineación de secuencias múltiples de la proteína CDK4 generada con ClustalW. Las flechas indican mutaciones puntuales.
Representa los pasos que utiliza el algoritmo del software ClustalW para las alineaciones globales
Diagrama que muestra el método de unión de vecinos en la alineación de secuencias para bioinformática
Diagrama de flujo que representa el algoritmo paso a paso utilizado en Clustal Omega.
Aquí se muestra la estructura de un perfil HMM utilizado en la implementación de Clustal Omega.