Prueba de distancia global


La prueba de distancia global ( GDT ), también escrita como GDT_TS para representar la "puntuación total", es una medida de similitud entre dos estructuras de proteínas con correspondencias de aminoácidos conocidas (por ejemplo , secuencias de aminoácidos idénticas ) pero diferentes estructuras terciarias . Se utiliza más comúnmente para comparar los resultados de la predicción de la estructura de la proteína con la estructura determinada experimentalmente medida por cristalografía de rayos X , RMN de proteína o, cada vez más, microscopía crioelectrónica . La métrica fue desarrollada por Adam Zemla en el Laboratorio Nacional Lawrence Livermore.e implementado originalmente en el programa Local-Global Alignment ( LGA ). [1] [2] Se pretende que sea una medida más precisa que la métrica de la desviación cuadrática media común (RMSD), que es sensible a las regiones atípicas creadas, por ejemplo, por un modelado deficiente de regiones de bucle individuales en una estructura que por lo demás, es razonablemente precisa. [1] La puntuación GDT_TS convencional se calcula sobre los átomos de carbono alfa y se informa como un porcentaje, que varía de 0 a 100. En general, cuanto más alta es la puntuación GDT_TS, más se aproxima un modelo a una estructura de referencia determinada.

Las mediciones de GDT_TS se utilizan como criterios de evaluación principales en la producción de resultados de la Evaluación crítica de la predicción de estructuras (CASP), un experimento a gran escala en la comunidad de predicción de estructuras dedicado a evaluar las técnicas de modelado actuales. [1] [3] [4] La métrica se introdujo por primera vez como estándar de evaluación en la tercera iteración del experimento bianual (CASP3) en 1998. [3] Se han desarrollado varias extensiones del método original; las variaciones que tienen en cuenta las posiciones de las cadenas laterales se conocen como cálculos de distancia global ( GDC ). [5]

La puntuación de GDT se calcula como el conjunto más grande de átomos de carbono alfa de los residuos de aminoácidos en la estructura del modelo que se encuentran dentro de un límite de distancia definido de su posición en la estructura experimental, después de superponer iterativamente las dos estructuras. Según el diseño original, el algoritmo GDT calcula 20 puntuaciones GDT, es decir, para cada uno de los 20 cortes de distancia consecutivos (0,5 Å , 1,0 Å, 1,5 Å, ... 10,0 Å). [2]Para la evaluación de la similitud de la estructura, se pretende utilizar los puntajes de GDT de varias distancias de corte, y los puntajes generalmente aumentan al aumentar el límite. Una meseta en este aumento puede indicar una divergencia extrema entre las estructuras experimentales y predichas, de modo que no se incluyen átomos adicionales en ningún límite de una distancia razonable. La puntuación total convencional de GDT_TS en CASP es el resultado medio de los puntos de corte en 1, 2, 4 y 8 Å. [1] [6] [7]

El GDT_TS original se calcula en función de las superposiciones y las puntuaciones de GDT producidas por el programa Local-Global Alignment (LGA). [1] Una versión de "alta precisión" llamada GDT_HA se calcula mediante la selección de distancias de corte más pequeñas (la mitad del tamaño de GDT_TS) y, por lo tanto, penaliza más severamente las desviaciones más grandes de la estructura de referencia. Se utilizó en la categoría de alta precisión de CASP7. [8] CASP8 definió una nueva "puntuación TR", que es GDT_TS menos una penalización por residuos agrupados demasiado cerca, destinada a penalizar los choques estéricos en la estructura predicha, a veces para jugar con la medida de corte de GDT. [9] [10]

La evaluación primaria de GDT utiliza solo los átomos de carbono alfa . Para aplicar la puntuación basada en la superposición a las cadenas laterales de los residuos de aminoácidos , se diseñó e implementó una puntuación similar a GDT llamada "cálculo de distancia global para cadenas laterales" (GDC_sc) dentro del programa LGA en 2008. [1] [5] En lugar de comparar posiciones de residuos sobre la base de carbonos alfa, GDC_sc utiliza un "átomo característico" predefinido cerca del final de cada residuo para la evaluación de las desviaciones de distancia entre residuos. Una variante de "todos los átomos" de la puntuación GDC (GDC_all) se calcula utilizando información de modelo completo y es una de las medidas estándar utilizadas por los organizadores y evaluadores de CASP para evaluar la precisión de los modelos estructurales predichos.[5] [7][11]