La prueba de distancia global ( GDT ), también escrita como GDT_TS para representar la "puntuación total", es una medida de similitud entre dos estructuras de proteínas con correspondencias de aminoácidos conocidas (por ejemplo , secuencias de aminoácidos idénticas ) pero estructuras terciarias diferentes . Se usa más comúnmente para comparar los resultados de la predicción de la estructura de la proteína con la estructura determinada experimentalmente medida por cristalografía de rayos X , RMN de proteína o, cada vez más, microscopía crioelectrónica . La métrica fue desarrollada por Adam Zemla en el Laboratorio Nacional Lawrence Livermore.e implementado originalmente en el programa Local-Global Alignment ( LGA ). [1] [2] Está pensado como una medida más precisa que la métrica de la desviación cuadrática media común (RMSD), que es sensible a las regiones atípicas creadas, por ejemplo, por un modelado deficiente de regiones de bucle individuales en una estructura que por lo demás, es razonablemente precisa. [1] La puntuación GDT_TS convencional se calcula sobre los átomos de carbono alfa y se informa como un porcentaje, que varía de 0 a 100. En general, cuanto más alta es la puntuación GDT_TS, más se aproxima un modelo a una estructura de referencia dada.
Las mediciones de GDT_TS se utilizan como criterios de evaluación principales en la producción de resultados de la Evaluación crítica de la predicción de estructuras (CASP), un experimento a gran escala en la comunidad de predicción de estructuras dedicado a evaluar las técnicas de modelado actuales. [1] [3] [4] La métrica se introdujo por primera vez como estándar de evaluación en la tercera iteración del experimento bianual (CASP3) en 1998. [3] Se han desarrollado varias extensiones del método original; las variaciones que tienen en cuenta las posiciones de las cadenas laterales se conocen como cálculos de distancia global ( GDC ). [5]
Cálculo
La puntuación de GDT se calcula como el conjunto más grande de átomos de carbono alfa de los residuos de aminoácidos en la estructura del modelo que se encuentran dentro de un límite de distancia definido de su posición en la estructura experimental, después de superponer iterativamente las dos estructuras. Según el diseño original, el algoritmo GDT calcula 20 puntuaciones GDT, es decir, para cada uno de los 20 cortes de distancia consecutivos (0,5 Å , 1,0 Å, 1,5 Å, ... 10,0 Å). [2] Para la evaluación de la similitud de estructuras, se pretende utilizar los puntajes de GDT de varias distancias de corte, y los puntajes generalmente aumentan al aumentar el límite. Una meseta en este aumento puede indicar una divergencia extrema entre las estructuras experimentales y predichas, de modo que no se incluyen átomos adicionales en ningún límite de una distancia razonable. La puntuación total convencional de GDT_TS en CASP es el resultado promedio de los puntos de corte en 1, 2, 4 y 8 Å. [1] [6] [7]
Variaciones y ampliaciones
El GDT_TS original se calcula en función de las superposiciones y las puntuaciones de GDT producidas por el programa Local-Global Alignment (LGA). [1] Una versión de "alta precisión" denominada GDT_HA se calcula mediante la selección de distancias de corte más pequeñas (la mitad del tamaño de GDT_TS) y, por lo tanto, penaliza más severamente las desviaciones más grandes de la estructura de referencia. Se utilizó en la categoría de alta precisión de CASP7. [8] CASP8 definió una nueva "puntuación TR", que es GDT_TS menos una penalización por residuos agrupados demasiado cerca, destinada a penalizar los choques estéricos en la estructura predicha, a veces para jugar con la medida de corte de GDT. [9] [10]
La evaluación primaria de GDT utiliza solo los átomos de carbono alfa . Para aplicar la puntuación basada en la superposición a las cadenas laterales de los residuos de aminoácidos , se diseñó e implementó una puntuación similar a la de GDT llamada "cálculo de distancia global para cadenas laterales" (GDC_sc) dentro del programa LGA en 2008. [1] [5] En lugar de comparar posiciones de residuos sobre la base de carbonos alfa, GDC_sc utiliza un "átomo característico" predefinido cerca del final de cada residuo para la evaluación de las desviaciones de distancia entre residuos. Una variante de "todos los átomos" de la puntuación GDC (GDC_all) se calcula utilizando información de modelo completo y es una de las medidas estándar utilizadas por los organizadores y evaluadores de CASP para evaluar la precisión de los modelos estructurales predichos. [5] [7] [11]
Las puntuaciones de GDT generalmente se calculan con respecto a una única estructura de referencia. En algunos casos, los modelos estructurales con puntuaciones GDT más bajas para una estructura de referencia determinada por RMN de proteína se ajustan mejor a los datos experimentales subyacentes. [12] Se han desarrollado métodos para estimar la incertidumbre de las puntuaciones de GDT debido a la flexibilidad de las proteínas y la incertidumbre en la estructura de referencia. [13]
Ver también
- Desviación cuadrática media (bioinformática) : una medida de comparación de estructura diferente.
- Puntuación TM : una medida de comparación de estructura diferente.
Referencias
- ↑ a b c d e f Zemla A (2003). "LGA: un método para encontrar similitudes 3D en estructuras de proteínas" . Investigación de ácidos nucleicos . 31 (13): 3370–3374. doi : 10.1093 / nar / gkg571 . PMC 168977 . PMID 12824330 .
- ^ a b Patente estadounidense 8024127 B2 , Adam Zemla, "Alineación local-global para encontrar similitudes 3D en estructuras de proteínas", emitida el 20 de septiembre de 2011, asignada a Lawrence Livermore National Security, LLC
- ^ a b Zemla A, Venclovas C, Moult J, Fidelis K (1999). "Procesamiento y análisis de las predicciones de la estructura de la proteína CASP3". Las proteínas . S3 : 22-29. doi : 10.1002 / (SICI) 1097-0134 (1999) 37: 3+ <22 :: AID-PROT5> 3.0.CO; 2-W . PMID 10526349 .
- ^ Zemla A, Venclovas C, Moult J, Fidelis K (2001). "Procesamiento y evaluación de predicciones en CASP4". Las proteínas . 45 (S5): 13-21. doi : 10.1002 / prot.10052 . PMID 11835478 . S2CID 28166260 .
- ^ a b c Keedy, DA; Williams, CJ; Headd, JJ; Arendall, WB; Chen, VB; Kapral, GJ; Gillespie, RA; Block, JN; Zemla, A; Richardson, DC; Richardson, JS (2009). "El otro 90% de la proteína: evaluación más allá del carbono α para modelos CASP8 basados en plantillas y de alta precisión" . Las proteínas . 77 (Supl. 9): 29–49. doi : 10.1002 / prot.22551 . PMC 2877634 . PMID 19731372 .
- ^ Kryshtafovych, A; Prlic, A; Dmytriv, Z; Daniluk, P; Milostán, M; Eyrich, V; Hubbard, T; Fidelis, K (2007). "Nuevas herramientas y capacidades ampliadas de análisis de datos en el Centro de Predicción de Estructura de Proteínas" . Las proteínas . 69 Supl. 8: 19-26. doi : 10.1002 / prot.21653 . PMC 2656758 . PMID 17705273 .
- ^ a b "Ayuda de la tabla de resultados" . XIV Experimento comunitario sobre la evaluación crítica de técnicas para la predicción de la estructura de proteínas . Consultado el 27 de diciembre de 2020 .
- ^ Leer, Randy J .; Chavali, Gayatri (2007). "Evaluación de las predicciones CASP7 en la categoría de modelado basado en plantillas de alta precisión" . Las proteínas . 69 (S8): 27–37. doi : 10.1002 / prot.21662 . PMID 17894351 . S2CID 33172629 .
- ^ Shi, S; Pei, J; Sadreyev, RI; Kinch, LN; Majumdar, yo; Tong, J; Cheng, H; Kim, BH; Grishin, NV (2009). "Análisis de objetivos CASP8, predicciones y métodos de evaluación" . Base de datos: The Journal of Biological Databases and Curation . 2009 : bap003. doi : 10.1093 / base de datos / bap003 . PMC 2794793 . PMID 20157476 .. Página relacionada
- ^ Sadreyev, RI; Shi, S; Baker, D; Grishin, NV (15 de mayo de 2009). "Medida de similitud de estructura con penalización para residuos cercanos no equivalentes" . Bioinformática . 25 (10): 1259–63. doi : 10.1093 / bioinformatics / btp148 . PMC 2677741 . PMID 19321733 .
- ^ Modi V, Xu QF, Adhikari S, Dunbrack RL (2016). "Evaluación del modelado basado en plantillas de la estructura de proteínas en CASP11" . Las proteínas . 84 : 200–220. doi : 10.1002 / prot.25049 . PMC 5030193 . PMID 27081927 .
- ^ MacCallum, Justin L .; Hua, Lan; Schnieders, Michael J .; Pande, Vijay S .; Jacobson, Matthew P .; Eneldo, Ken A. (2009). "Evaluación de la categoría de refinamiento de la estructura de proteínas en CASP8" . Proteínas: estructura, función y bioinformática . 77 (S9): 66–80. doi : 10.1002 / prot.22538 .
- ^ Li, Wenlin; Schaeffer, R. Dustin; Otwinowski, Zbyszek; Grishin, Nick V. (5 de mayo de 2016). "Estimación de incertidumbres en la prueba de distancia global (GDT_TS) para modelos CASP" . PLOS ONE . 11 (5): e0154786. doi : 10.1371 / journal.pone.0154786 .
enlaces externos
- Resultados de CASP14 : tablas de resumen del último experimento de CASP ejecutado en 2020, incluidos gráficos de ejemplo de la puntuación de GDT en función de la distancia de corte
- Servicios de descripción de GDT, GDC, LCS y LGA y documentación sobre comparación de estructuras y medidas de similitud.