Mapa de contacto de proteínas


Un mapa de contacto de proteínas representa la distancia entre todos los posibles pares de residuos de aminoácidos de una estructura de proteína tridimensional utilizando una matriz bidimensional binaria . Para dos residuos y , el elemento de la matriz es 1 si los dos residuos están más cerca de un umbral predeterminado y 0 en caso contrario. Se han propuesto varias definiciones de contacto: La distancia entre el átomo C α -C α con umbral 6-12 Å ; distancia entre los átomos de C β -C β con un umbral de 6-12 Å (C α se usa para Glycine); y la distancia entre los centros de masa de las cadenas laterales .

Los mapas de contacto proporcionan una representación más reducida de la estructura de una proteína que sus coordenadas atómicas 3D completas. La ventaja es que los mapas de contacto son invariantes a las rotaciones y traslaciones. Son más fáciles de predecir mediante métodos de aprendizaje automático . También se ha demostrado que bajo ciertas circunstancias (por ejemplo, bajo contenido de contactos predichos erróneamente) es posible reconstruir las coordenadas 3D de una proteína utilizando su mapa de contactos. [1] [2]

Los mapas de contacto también se utilizan para la superposición de proteínas y para describir la similitud entre las estructuras de las proteínas. [3] Se predicen a partir de la secuencia de proteínas o se calculan a partir de una estructura determinada.

Con la disponibilidad de un gran número de secuencias genómicas, se vuelve factible analizar tales secuencias para residuos coevolutivos . La eficacia de este enfoque resulta del hecho de que es más probable que una mutación en la posición i de una proteína esté asociada con una mutación en la posición j que con una retromutación en i si ambas posiciones están acopladas funcionalmente (p. ej., participando en un dominio enzimático, o por ser adyacente en una proteína plegada, o incluso por ser adyacente en un oligómero de esa proteína). [4]

Existen varios métodos estadísticos para extraer de un alineamiento de secuencias múltiples tales pares de residuos acoplados: frecuencias observadas frente a esperadas de pares de residuos (OMES); [5] la correlación de sustitución basada en McLachlan (McBASC); [6] análisis de acoplamiento estadístico ; métodos basados ​​en información mutua (MI); [7] y recientemente análisis de acoplamiento directo (DCA). [8] [9]

Los algoritmos de aprendizaje automático han podido mejorar los métodos de análisis de MSA, especialmente para proteínas no homólogas (es decir, MSA superficiales). [10]


Mapa de contacto de proteínas
Mapa de contacto de proteínas de la proteína VPA0982 de Vibrio parahaemolyticus
Elementos de estructura secundaria en parcela HB, hay hojas paralelas y antiparalelas intercambiadas
Parcela HB y estructura del Citocromo P450 2B4 en forma cerrada
Beta-lactoglobulina en forma abierta (blanca) y unida a ligando (roja)
Gráficos de HB de beta-lactoglobulina en forma abierta (2BLG) y unida a ligando (2AKQ)