Análisis de acoplamiento directo


El análisis de acoplamiento directo o DCA es un término general que comprende varios métodos para analizar datos de secuencias en biología computacional . [1] La idea común de estos métodos es usar modelos estadísticos para cuantificar la fuerza de la relación directa entre dos posiciones de una secuencia biológica , excluyendo los efectos de otras posiciones. Esto contrasta las medidas habituales de correlación , que pueden ser grandes incluso si no hay una relación directa entre las posiciones (de ahí el nombre de análisis de acoplamiento directo ). Tal relación directa puede ser, por ejemplo, la presión evolutivapara dos posiciones para mantener la compatibilidad mutua en la estructura biomolecular de la secuencia, lo que lleva a la coevolución molecular entre las dos posiciones. DCA se ha utilizado en la inferencia de contactos de residuos de proteínas , [1] [2] [3] [4] predicción de la estructura del ARN , [5] [6] la inferencia de redes de interacción proteína-proteína [7] [8] [9 ] y el modelado de paisajes de fitness . [10] [11] [12]

La base de DCA es un modelo estadístico para la variabilidad dentro de un conjunto de secuencias biológicas filogenéticamente relacionadas . Cuando se ajusta a una alineación de secuencia múltiple (MSA) de secuencias de longitud , el modelo define una probabilidad para todas las secuencias posibles de la misma longitud. [1] Esta probabilidad se puede interpretar como la probabilidad de que la secuencia en cuestión pertenezca a la misma clase de secuencias que las del MSA, por ejemplo, la clase de todas las secuencias de proteínas que pertenecen a una familia de proteínas específica .

Denotamos una secuencia por , siendo las variables categóricas que representan los monómeros de la secuencia (si las secuencias son, por ejemplo , secuencias de aminoácidos alineadas de proteínas de una familia de proteínas, toman como valores cualquiera de los 20 aminoácidos estándar ). La probabilidad de una secuencia dentro de un modelo se define entonces como