En bioinformática , la desviación cuadrática media de las posiciones atómicas , o simplemente la desviación cuadrática media (RMSD) , es la medida de la distancia promedio entre los átomos (generalmente los átomos de la columna vertebral) de proteínas superpuestas . Tenga en cuenta que el cálculo de RMSD se puede aplicar a otras moléculas no proteicas, como pequeñas moléculas orgánicas. [1] En el estudio de las conformaciones de proteínas globulares, habitualmente se mide la similitud en la estructura tridimensional mediante el RMSD de las coordenadas atómicas Cα después de la superposición óptima de cuerpos rígidos.
Cuando un sistema dinámico fluctúa alrededor de una posición promedio bien definida, el RMSD del promedio a lo largo del tiempo puede denominarse RMSF o fluctuación cuadrática media . El tamaño de esta fluctuación se puede medir, por ejemplo, utilizando espectroscopia de Mössbauer o resonancia magnética nuclear , y puede proporcionar información física importante. El índice de Lindemann es un método para colocar el RMSF en el contexto de los parámetros del sistema.
Una forma ampliamente utilizada de comparar las estructuras de biomoléculas o cuerpos sólidos es trasladar y rotar una estructura con respecto a la otra para minimizar el RMSD. Coutsias, et al. presentó una derivación simple, basada en cuaterniones , para la transformación óptima del cuerpo sólido (rotación-traslación) que minimiza la RMSD entre dos conjuntos de vectores. [2] Demostraron que el método del cuaternión es equivalente al conocido algoritmo de Kabsch . [3] La solución dada por Kabsch es un ejemplo de la solución del problema d- dimensional, presentado por Hurley y Cattell. [4] La solución del cuaternión para calcular la rotación óptima se publicó en el apéndice de un artículo de Petitjean. [5] Esta solución de cuaterniones y el cálculo de la isometría óptima en el caso d- dimensional se extendieron a conjuntos infinitos y al caso continuo en el apéndice A de otro artículo de Petitjean. [6]
La ecuacion
donde δ i es la distancia entre el átomo i y una estructura de referencia o la posición media de los N átomos equivalentes. Esto a menudo se calcula para los átomos pesados de la cadena principal C , N , O y C α o, a veces, solo los átomos C α .
Normalmente se realiza una superposición rígida que minimiza el RMSD, y se devuelve este mínimo. Dados dos conjuntos de puntos y , el RMSD se define de la siguiente manera:
Un valor de RMSD se expresa en unidades de longitud. La unidad más utilizada en biología estructural es el Ångström (Å), que es igual a 10 −10 m.
Usos
Normalmente, RMSD se usa como una medida cuantitativa de similitud entre dos o más estructuras de proteínas. Por ejemplo, la competencia de predicción de la estructura de la proteína CASP utiliza RMSD como una de sus evaluaciones de qué tan bien una estructura enviada coincide con la estructura objetivo conocida. Por lo tanto, cuanto menor sea el RMSD, mejor será el modelo en comparación con la estructura objetivo.
Además, algunos científicos que estudian el plegamiento de proteínas mediante simulaciones por computadora utilizan RMSD como una coordenada de reacción para cuantificar dónde se encuentra la proteína entre el estado plegado y el estado desplegado.
El estudio de RMSD para moléculas orgánicas pequeñas (comúnmente llamadas ligandos cuando se unen a macromoléculas, como proteínas, se estudia) es común en el contexto del acoplamiento , [1] así como en otros métodos para estudiar la configuración de ligandos. cuando se une a macromoléculas. Tenga en cuenta que, para el caso de los ligandos (al contrario de las proteínas, como se describe anteriormente), sus estructuras no se superponen con mayor frecuencia antes del cálculo de la RMSD.
RMSD es también una de varias métricas que se han propuesto para cuantificar la similitud evolutiva entre proteínas, así como la calidad de las alineaciones de secuencias. [7] [8]
Ver también
- Desviación cuadrática media
- Fluctuación cuadrática media
- Quaternion : se utiliza para optimizar los cálculos de RMSD
- Algoritmo de Kabsch : un algoritmo que se utiliza para minimizar el RMSD al encontrar primero la mejor rotación [3]
- GDT : una medida de comparación de estructuras diferente
- Puntuación TM : una medida de comparación de estructura diferente
- Segmento continuo más largo (LCS): una medida de comparación de estructura diferente
- Cálculo de distancia global (GDC_sc, GDC_all): medidas de comparación de estructuras que utilizan información del modelo completo (no solo carbono α) para evaluar la similitud
- Alineación global local (LGA): programa de alineación de la estructura de proteínas y medida de comparación de la estructura
Referencias
- ^ a b "Acoplamiento molecular, estimación de energías libres de unión y campo de fuerza semi-empírico de AutoDock" . Sitio web de Sebastian Raschka . 2014-06-26 . Consultado el 7 de junio de 2016 .
- ^ Coutsias EA, Seok C, Dill KA (2004). "Uso de cuaterniones para calcular RMSD". J Comput Chem . 25 (15): 1849–1857. doi : 10.1002 / jcc.20110 . PMID 15376254 . S2CID 18224579 .
- ^ a b Kabsch W. (1976). "Una solución para la mejor rotación para relacionar dos conjuntos de vectores". Acta Crystallographica . 32 (5): 922–923. Código Bibliográfico : 1976AcCrA..32..922K . doi : 10.1107 / S0567739476001873 .
- ^ Hurley JR, Cattell RB (1962). "El programa Procrustes: producción de rotación directa para probar una estructura factorial hipotética". Ciencias del comportamiento . 7 (2): 258–262. doi : 10.1002 / bs.3830070216 .
- ^ Petitjean M (1999). "En la quiralidad cuantitativa de la raíz cuadrada media y medidas de simetría cuantitativa" (PDF) . Revista de Física Matemática . 40 (9): 4587–4595. Código Bibliográfico : 1999JMP .... 40.4587P . doi : 10.1063 / 1.532988 .
- ^ Petitjean M (2002). "Mezclas quirales" (PDF) . Revista de Física Matemática . 43 (8): 185-192. Código bibliográfico : 2002JMP .... 43.4147P . doi : 10.1063 / 1.1484559 .
- ^ Jewett AI, Huang CC, Ferrin TE (2003). "MINRMS: un algoritmo eficiente para determinar la similitud de la estructura de la proteína utilizando la raíz-media-distancia al cuadrado" (PDF) . Bioinformática . 19 (5): 625–634. doi : 10.1093 / bioinformatics / btg035 . PMID 12651721 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Armougom F, Moretti S, Keduas V, Notredame C (2006). "El iRMSD: una medida local de precisión de alineación de secuencia utilizando información estructural" (PDF) . Bioinformática . 22 (14): e35–39. doi : 10.1093 / bioinformatics / btl218 . PMID 16873492 .
Otras lecturas
- Shibuya T (2009). "Búsqueda de estructuras 3-D de proteínas en tiempo lineal". Proc. 13ª Conferencia Internacional Anual sobre Investigación en Biología Molecular Computacional (RECOMB 2009), LNCS 5541: 1-15.
- Damm KL, Carlson HA (2006). "Superposición de proteínas RMSD ponderada por Gauss: una comparación estructural de proteínas flexibles y estructuras proteicas previstas" . Biophys J . 90 (12): 4558–4573. Código bibliográfico : 2006BpJ .... 90.4558D . doi : 10.1529 / biophysj.105.066654 . PMC 1471868 . PMID 16565070 .
- Kneller GR (2005). "Comentario sobre 'Usar cuaterniones para calcular RMSD' [ J. Comp. Chem. 25, 1849 (2004)]" . J Comput Chem . 26 (15): 1660–1662. doi : 10.1002 / jcc.20296 . PMID 16175580 . S2CID 27004373 .
- Theobald DL (2005). "Cálculo rápido de RMSD utilizando un polinomio característico basado en cuaterniones" . Un Acta Crystallogr . 61 (Pt 4): 478–480. Código bibliográfico : 2005AcCrA..61..478T . doi : 10.1107 / S0108767305015266 . PMID 15973002 .
- Maiorov VN, Crippen GM (1994). "Importancia de la desviación de la raíz cuadrada media en la comparación de estructuras tridimensionales de proteínas globulares" (PDF) . J Mol Biol . 235 (2): 625–634. doi : 10.1006 / jmbi.1994.1017 . hdl : 2027,42 / 31835 . PMID 8289285 .
enlaces externos
- Medidas de distancia molecular: un tutorial sobre cómo calcular RMSD
- RMSD: otro tutorial sobre cómo calcular RMSD con código de ejemplo
- Coincidencia de estructuras secundarias (SSM) : una herramienta para la comparación de estructuras de proteínas. Utiliza RMSD.
- GDT, LCS y LGA : diferentes medidas de comparación de estructuras. Descripción y servicios.
- SuperPose : un servidor de superposición de proteínas. Utiliza RMSD.
- superposición : alineación estructural basada en la combinación de estructuras secundarias. Por el proyecto CCP4. Utiliza RMSD.
- Una secuencia de comandos de Python está disponible en https://github.com/charnley/rmsd
- Una secuencia de comandos de Python alternativa está disponible en https://github.com/jewettaij/superpose3d