En bioquímica , una biblioteca rotámero columna vertebral dependiente proporciona las frecuencias, medias ángulos diedros , y desviaciones estándar de las conformaciones discretas (conocidos como rotámeros ) de los aminoácidos cadenas laterales en proteínas como una función de la columna vertebral diedro ángulos φ y ψ de la Mapa de Ramachandran. Por el contrario, las bibliotecas de rotámeros independientes de la columna vertebral expresan las frecuencias y los ángulos diedros medios para todas las cadenas laterales de las proteínas, independientemente de la conformación de la columna vertebral de cada tipo de residuo. Se ha demostrado que las bibliotecas de rotámeros dependientes de la columna vertebral tienen ventajas significativas sobre las bibliotecas de rotámeros independientes de la columna vertebral, principalmente cuando se usan como un término energético, al acelerar los tiempos de búsqueda de los algoritmos de empaquetamiento de cadenas laterales utilizados en la predicción de la estructura de proteínas y el diseño de proteínas . [1]
Historia
La primera biblioteca de rotámeros dependiente de la columna vertebral fue desarrollada en 1993 por Roland Dunbrack y Martin Karplus para ayudar en la predicción de las coordenadas cartesianas de las cadenas laterales de una proteína dadas las coordenadas cartesianas determinadas o predichas experimentalmente de su cadena principal. [2] La biblioteca se derivó de las estructuras de 132 proteínas del Protein Data Bank con una resolución de 2,0 Å o mejor. La biblioteca proporcionó los recuentos y frecuencias de χ 1 o χ 1 + χ 2 rotámeros de 18 aminoácidos (excluyendo los tipos de residuos de glicina y alanina , ya que no tienen un diedro χ 1 ) para cada intervalo de 20 ° x 20 ° del Ramachandran mapa (φ, ψ = -180 ° a -160 °, -160 ° a -140 °, etc.).
En 1997, Dunbrack y Fred E. Cohen de la Universidad de California en San Francisco presentaron una biblioteca de rotámeros dependiente de la columna vertebral derivada de las estadísticas bayesianas . [3] El enfoque bayesiano brindó la oportunidad para la definición de un anterior bayesiano para las frecuencias de rotámeros en cada intervalo de 10 ° x 10 ° derivado asumiendo que los efectos estéricos y electrostáticos de los ángulos diedros φ y ψ son independientes. Además, se utilizó un núcleo periódico con una periodicidad de 180 ° para contar las cadenas laterales a 180 ° en cada dirección del contenedor de interés. Como exponente de una función sen 2 , se comportó de manera muy similar a una distribución de von Mises que se usa comúnmente en estadística direccional . La biblioteca de 1997 se puso a disposición del público a través de la World Wide Web en 1997, y se encontró un uso temprano en la predicción de la estructura de proteínas [4] y el diseño de proteínas . [5] La biblioteca derivada de las estadísticas bayesianas se actualizó en 2002 [6]
Muchos programas de modelado, como Rosetta , usan una biblioteca de rotámeros dependiente de la columna vertebral como función de puntuación (generalmente en la forma E = -ln (p (rotámero ( i ) | φ, ψ)) para el i- ésimo rotámero, y optimizan la conformación de la columna vertebral de las proteínas minimizando la energía del rotámero con derivadas de las probabilidades logarítmicas con respecto a φ, ψ. [7] Esto requiere funciones de probabilidad suaves con derivadas suaves, porque la mayoría de los algoritmos de optimización matemática usan derivadas primera y, a veces, segundas y se atascan en mínimos locales en superficies rugosas. En 2011, Shapovalov y Dunbrack publicaron una biblioteca de rotámeros suavizados dependientes de la columna vertebral derivada de estimaciones de densidad de kernel y regresiones de kernel con kernels de distribución de von Mises en las variables φ, ψ. [8] El tratamiento de los no rotámeros grados de libertad (los ángulos diedros que no se refieren a enlaces sp 3 -sp 3 , como asparagina y aspartato χ 2 , fenilalanina , tirosina , histidina , triptófano χ 2 y glutamina y glutamato χ 3 ) fue una mejora ed mediante el modelado de la densidad de probabilidad del ángulo diedro de cada uno de estos ángulos diedros en función de χ 1 rotámero (o χ 1 y χ 2 para Gln y Glu) y φ, ψ. Las funciones son esencialmente regresiones de una densidad de probabilidad periódica en un toro .
Además del análisis estadístico de estructuras en el Protein Data Bank , las bibliotecas de rotámeros dependientes de la columna vertebral también pueden derivarse de simulaciones de dinámica molecular de proteínas, como lo demuestra la Dynameomics Library del grupo de investigación de Valerie Daggett . [9] Debido a que estas bibliotecas se basan en muestreos de simulaciones, pueden generar un número mucho mayor de puntos de datos en las regiones del mapa de Ramachandran que están escasamente pobladas en estructuras experimentales, lo que lleva a una mayor significación estadística en estas regiones. Las bibliotecas de rotámeros derivadas de las simulaciones dependen del campo de fuerza utilizado en las simulaciones. La biblioteca Dynameomics se basa en simulaciones que utilizan el campo de fuerza ENCAD de Levitt et al. desde 1995. [10]
Dependencia de la columna vertebral de las poblaciones de rotámeros
El efecto de la conformación del esqueleto en las frecuencias de los rotámeros de la cadena lateral se debe principalmente a las repulsiones estéricas entre los átomos del esqueleto cuya posición depende de φ y ψ y los átomos pesados γ de la cadena lateral (carbono, oxígeno o azufre) de cada tipo de residuo (PDB tipos de átomos CG, CG1, CG2, OG, OG1, SG). Estos ocurren en combinaciones predecibles que dependen de los diedros que conectan los átomos de la columna vertebral con los átomos de la cadena lateral. [11] [3] Estas interacciones estéricas ocurren cuando los ángulos diedros de conexión forman un par de ángulos diedros con valores {-60 °, + 60 °} o {+ 60 °, -60 °}, de una manera relacionada con el fenómeno. de la interferencia del pentano . Por ejemplo, el átomo de nitrógeno del residuo i + 1 está conectado al átomo pesado γ de cualquier cadena lateral por un conjunto conectado de 5 átomos: N (i + 1) -C (i) -Cα (i) -Cβ (i ) -Cγ (i). El ángulo diedro N (i + 1) -C (i) -Cα (i) -Cβ (i) es igual a ψ + 120 °, y C (i) -Cα (i) -Cβ (i) -Cγ ( i) es igual a χ 1 -120 °. Cuando ψ es -60 ° y χ 1 es + 60 ° (el g + rotámero de una cadena lateral), hay una interacción estérica entre N (i + 1) y Cγ porque los ángulos diedros que los conectan son N (i + 1) -C (i) -Cα (i) -Cβ (i) = ψ + 120 ° = + 60 °, y C (i) -Cα (i) -Cβ (i) -Cγ (i) = χ 1 -120 ° = -60 °. La misma interacción ocurre cuando ψ es 0 ° y χ 1 es 180 ° (el transrrotámero de una cadena lateral). El oxígeno del carbonilo del residuo i juega el mismo papel cuando ψ = -60 ° para el rotámero g + y cuando ψ = 180 ° para el rotámero trans. Finalmente, las interacciones dependientes de φ ocurren entre los átomos pesados γ de la cadena lateral en los rotámeros g- y g + por un lado, y el carbono carbonilo del residuo i-1 y un átomo pesado γ, y entre el esqueleto NH del residuo i y su socio de enlace de hidrógeno por el otro.
Las interacciones dependientes de φ, ψ de los átomos de la columna vertebral y los átomos Cγ de la cadena lateral se pueden observar en la distribución de observaciones en la gráfica de Ramachandran de cada rotámero χ 1 (marcado en la figura). En estas posiciones, las poblaciones Ramachandran de rotámeros se reducen significativamente. Se pueden resumir de la siguiente manera:
Rotámero | N (i + 1) | O (yo) |
---|---|---|
g + | ψ = -60 ° | ψ = + 120 ° |
trans | ψ = 180 ° | ψ = 0 ° |
Rotámero | C (i-1) | HBond a NH (i) |
g + | φ = + 60 ° | φ = -120 ° |
gramo- | φ = -180 ° | φ = 0 ° |
Los tipos de cadena lateral con dos átomos pesados (Val, Ile, Thr) tienen interacciones dependientes de la columna vertebral con ambos átomos pesados. Val tiene CG1 en χ 1 y CG2 en χ 1 + 120 °. Debido a que las conformaciones Val g + y g- tienen interacciones estéricas con la columna vertebral cerca de ψ = 120 ° y -60 ° (los rangos ψ más poblados), Val es el único aminoácido donde el rotámero t (χ 1 ~ 180 °) es el más común. En la mayoría de los valores de φ y ψ, solo se permite un rotámero de Val (mostrado en la figura). Ile tiene CG1 en χ 1 y CG2 en χ 1 -120 °. Thr tiene OG1 en χ 1 y CG2 en χ 1 -120 °.
Usos
La biblioteca de rotámeros dependientes de la columna vertebral de Dunbrack se utiliza en varios programas para la predicción de la estructura de proteínas y el diseño computacional, que incluyen:
- Predicción de la conformación de cadenas laterales en el modelado de estructuras de proteínas
- Swiss-model [12] y su software, ProMod3 [13]
- Rosetta [7]
- I-TASSER
- Phyre [14]
- OEChem TK [15]
- YASARA [16]
- GalaxyRefine [17]
- SCWRL4 [18]
- Diseño de proteínas
- Rosetta [7]
- EvoEF2 [19]
- Visualización de mutaciones de proteínas
- PyMol [20]
- Quimera UCSF [21]
Referencias
- ^ Huang, X; Pearce, R; Zhang, Y (2020). "Hacia la precisión y la velocidad del embalaje de la cadena lateral de proteínas: un estudio sistemático sobre las bibliotecas de rotámeros" . Revista de información química y modelado . 60 (1): 410–420. doi : 10.1021 / acs.jcim.9b00812 . PMC 7938712 . PMID 31851497 . Consultado el 18 de febrero de 2021 .
- ^ Dunbrack, RL, Jr .; Karplus, M (1993). "Biblioteca de rotámeros dependientes de la columna vertebral para proteínas. Aplicación a la predicción de cadenas laterales". Revista de Biología Molecular . 230 (2): 543–74. doi : 10.1006 / jmbi.1993.1170 . PMID 8464064 .
- ^ a b Dunbrack, RL, Jr .; Cohen, FE (1997). "Análisis estadístico bayesiano de las preferencias de los rotámeros de la cadena lateral de proteínas" . Ciencia de las proteínas . 6 (8): 1661–81. doi : 10.1002 / pro.5560060807 . PMC 2143774 . PMID 9260279 .
- ^ Bower, MJ; Cohen, FE; Dunbrack, RL, Jr. (1997). "Predicción de rotámeros de cadena lateral de proteínas de una biblioteca de rotámeros dependientes de la columna vertebral: una nueva herramienta de modelado de homología". Revista de Biología Molecular . 267 (5): 1268–82. doi : 10.1006 / jmbi.1997.0926 . PMID 9150411 .
- ^ Kuhlman, B; Baker, D (2000). "Las secuencias de proteínas nativas son casi óptimas para sus estructuras" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 97 (19): 10383–8. Código Bibliográfico : 2000PNAS ... 9710383K . doi : 10.1073 / pnas.97.19.10383 . PMC 27033 . PMID 10984534 .
- ^ Dunbrack, RL, Jr. (2002). "Bibliotecas rotamer en el siglo XXI". Opinión actual en biología estructural . 12 (4): 431–40. doi : 10.1016 / s0959-440x (02) 00344-5 . PMID 12163064 .
- ^ a b c Alford, RF; Leaver-Fay, A; Jeliazkov, JR; O'Meara, MJ; DiMaio, FP; Park, H; Shapovalov, MV; Renfrew, PD; Mulligan, VK; Kappel, K; Labonte, JW; Pacella, MS; Bonneau, R; Bradley, P; Dunbrack, RL; Das, R; Baker, D; Kuhlman, B; Kortemme, T; Gray, JJ (13 de junio de 2017). "La función de energía de Rosetta All-Atom para el modelado y diseño macromolecular" . Revista de teoría química y computación . 13 (6): 3031-3048. doi : 10.1021 / acs.jctc.7b00125 . PMC 5717763 . PMID 28430426 .
- ^ Shapovalov, MV; Dunbrack, RL, Jr. (2011). "Una biblioteca de rotámeros dependiente de la columna vertebral suavizada para proteínas derivadas de regresiones y estimaciones de densidad del núcleo adaptativo" . Estructura (Cell Press) . 19 (6): 844–58. doi : 10.1016 / j.str.2011.03.019 . PMC 3118414 . PMID 21645855 .
- ^ Towse, Clare-Louise; Rysavy, Steven J .; Vulovic, Ivan M .; Daggett, Valerie (5 de enero de 2016). "Nuevas bibliotecas de rotámeros dinámicos: análisis basado en datos de las propensiones conformacionales de la cadena lateral" . Estructura . 24 (1): 187-199. doi : 10.1016 / j.str.2015.10.017 . ISSN 0969-2126 . PMC 4715459 . PMID 26745530 .
- ^ Levitt, Michael; Hirshberg, Miriam; Sharon, Ruth; Daggett, Valerie (1995). "Función de energía potencial y parámetros para simulaciones de la dinámica molecular de proteínas y ácidos nucleicos en solución". Comunicaciones de Física Informática . 91 (1): 215–231. Código Bibliográfico : 1995CoPhC..91..215L . doi : 10.1016 / 0010-4655 (95) 00049-L .
- ^ Dunbrack, RL, Jr .; Karplus, M (1994). "Análisis conformacional de las preferencias de rotámero dependientes de la columna vertebral de las cadenas laterales de proteínas" . Biología estructural de la naturaleza . 1 (5): 334–340. doi : 10.1038 / nsb0594-334 . ISSN 1545-9985 . PMID 7664040 . S2CID 9157373 .
- ^ Waterhouse, A; Bertoni, M; Bienert, S; Studer, G; Tauriello, G; Gumienny, R; Heer, FT; de Beer, TAP; Rempfer, C; Bordoli, L; Lepore, R; Schwede, T (2018). "SWISS-MODEL: modelado por homología de estructuras y complejos de proteínas" . Investigación de ácidos nucleicos . 46 (W1): W296 – W303. doi : 10.1093 / nar / gky427 . PMC 6030848 . PMID 29788355 .
- ^ Studer, G; Tauriello, G; Bienert, S; Biasini, M; Johner, N; Schwede, T (2021). "ProMod3-A caja de herramientas de modelado de homología versátil" . PLOS Biología Computacional . 17 (1): e1008667. doi : 10.1371 / journal.pcbi.1008667 . PMC 7872268 . PMID 33507980 . Consultado el 18 de febrero de 2021 .
- ^ Kelley, LA; Mezulis, S; Yates, CM; Wass, MN; Sternberg, MJ (2015). "El portal web Phyre2 para el modelado, la predicción y el análisis de proteínas" . Protocolos de la naturaleza . 10 (6): 845–58. doi : 10.1038 / nprot.2015.053 . PMC 5298202 . PMID 25950237 .
- ^ Software científico OpenEye. "Conformaciones de macromoléculas - Toolkits - Java" . Kit de herramientas de OEChem 3.1.0.0 . Consultado el 10 de febrero de 2021 .
- ^ Krieger, E. "Modelado de cadenas laterales de proteínas en YASARA" . www.yasara.org . Yasara Biosciences . Consultado el 10 de febrero de 2021 .
- ^ Heo, L; Park, H; Seok, C (2013). "GalaxyRefine: refinamiento de la estructura de proteínas impulsado por reembalaje de la cadena lateral" . Investigación de ácidos nucleicos . 41 (Problema del servidor web): W384-8. doi : 10.1093 / nar / gkt458 . PMC 3692086 . PMID 23737448 .
- ^ Krivov, Georgii G .; Shapovalov, Maxim V .; Dunbrack, Roland L. (2009). "Mejora de la predicción de las conformaciones de la cadena lateral de proteínas con SCWRL4" . Proteínas: estructura, función y bioinformática . 77 (4): 778–795. doi : 10.1002 / prot.22488 . ISSN 1097-0134 . PMC 2885146 . PMID 19603484 .
- ^ Huang, X; Pearce, R; Zhang, Y (2020). "EvoEF2: función de energía precisa y rápida para el diseño de proteínas computacionales" . Bioinformática . 36 (4): 1135-1142. doi : 10.1093 / bioinformatics / btz740 . PMC 7144094 . PMID 31588495 .
- ^ Kulp, Daniel W. "Rotamer Toggle - PyMOLWiki" . pymolwiki.org . Consorcio SBGrid . Consultado el 10 de febrero de 2021 .
- ^ Pettersen, EF; Goddard, TD; Huang, CC; Meng, EC; Sofá, GS; Croll, TI; Morris, JH; Ferrin, TE. "Herramientas de Rotamer (ChimeraX)" . La guía del usuario de ChimeraX . Regentes de la Universidad de California . Consultado el 9 de febrero de 2021 .
Enlaces externos
- Biblioteca Rotamer dependiente de la red troncal de Dunbrack 2010
- Análisis conformacional de la cadena lateral de proteínas
- Bibliotecas Rotamer independientes de la red troncal de Richardson
- Bibliotecas Rotamer independientes y dependientes de la red troncal de Dynameomics