De Wikipedia, la enciclopedia libre
Ir a navegaciónSaltar a buscar

Las bibliotecas de fragmentos de la cadena principal de proteínas se han utilizado con éxito en una variedad de aplicaciones de biología estructural , incluido el modelado de homología , [1] predicción de estructura de novo , [2] [3] [4] y determinación de estructura . [5] Al reducir la complejidad del espacio de búsqueda, estas bibliotecas de fragmentos permiten una búsqueda más rápida del espacio conformacional , lo que conduce a modelos más eficientes y precisos.

Motivación

Las proteínas pueden adoptar un número exponencial de estados cuando se modelan discretamente. Normalmente, las conformaciones de una proteína se representan como conjuntos de ángulos diedros , longitudes de enlace y ángulos de enlace entre todos los átomos conectados. La simplificación más común es asumir longitudes y ángulos de enlace ideales. Sin embargo, esto todavía deja los ángulos phi-psi de la columna vertebral y hasta cuatro ángulos diedros para cada cadena lateral , lo que lleva a una complejidad en el peor de los casos de k 6 * n estados posibles de la proteína, donde n es el número de residuos y kes el número de estados discretos modelados para cada ángulo diedro. Para reducir el espacio conformacional, se pueden utilizar bibliotecas de fragmentos de proteínas en lugar de modelar explícitamente cada ángulo phi-psi.

Los fragmentos son segmentos cortos de la estructura del péptido, típicamente de 5 a 15 residuos de largo, y no incluyen las cadenas laterales. Pueden especificar la ubicación de solo los átomos C-alfa si se trata de una representación de átomo reducido, o todos los átomos pesados ​​de la cadena principal (N, C-alfa, C carbonilo, O). Tenga en cuenta que las cadenas laterales generalmente no se modelan utilizando el enfoque de biblioteca de fragmentos. Para modelar estados discretos de una cadena lateral, se podría usar un enfoque de biblioteca de rotámeros . [6]

Este enfoque opera bajo el supuesto de que las interacciones locales juegan un papel importante en la estabilización de la conformación de la proteína en general. En cualquier secuencia corta, las fuerzas moleculares restringen la estructura, lo que conduce a solo un pequeño número de posibles conformaciones, que pueden modelarse mediante fragmentos. De hecho, de acuerdo con la paradoja de Levinthal , una proteína no podría tomar muestras de todas las conformaciones posibles en un período de tiempo biológicamente razonable. Las estructuras estabilizadas localmente reducirían el espacio de búsqueda y permitirían que las proteínas se plieguen en el orden de milisegundos.

Construcción

Agrupación de fragmentos.
Agrupación de fragmentos similares. El centroide se muestra en azul.

Las bibliotecas de estos fragmentos se construyen a partir de un análisis del Protein Data Bank (PDB). En primer lugar, se elige un subconjunto representativo de la AP que debe cubrir un conjunto diverso de estructuras, preferiblemente con una buena resolución. Luego, para cada estructura, cada conjunto de n residuos consecutivos se toma como un fragmento de muestra. A continuación, las muestras se agrupan en k grupos, en función de su similitud entre sí en la configuración espacial, utilizando algoritmos como k -medias de agrupación . Los parámetros n y k se eligen de acuerdo con la aplicación (consulte la discusión sobre la complejidad a continuación). Los centroidesde los grupos se toman para representar el fragmento. Se puede realizar una optimización adicional para garantizar que el centroide posea una geometría de enlace ideal, ya que se obtuvo promediando otras geometrías. [7]

Debido a que los fragmentos se derivan de estructuras que existen en la naturaleza, el segmento de la columna vertebral que representan tendrá geometrías de enlace realistas. Esto ayuda a evitar tener que explorar todo el espacio de los ángulos de conformación, muchos de los cuales conducirían a geometrías poco realistas.

El agrupamiento anterior se puede realizar sin tener en cuenta las identidades de los residuos, o puede ser específico del residuo. [2] Es decir, para cualquier secuencia de entrada de aminoácidos dada, se puede derivar un agrupamiento utilizando solo muestras encontradas en el AP con la misma secuencia en el fragmento k -mer. Esto requiere más trabajo computacional que derivar una biblioteca de fragmentos independiente de la secuencia, pero potencialmente puede producir modelos más precisos. Por el contrario, se requiere un conjunto de muestras más grande y es posible que no se logre una cobertura completa.

Ejemplo de uso: modelado de bucle

Construcción de bucle.
Bucle de longitud 10 construido utilizando 6 fragmentos, cada uno de longitud 4. En este modelo 2D sólo se utilizaron superposiciones de 2. Los puntos de anclaje están encerrados en un círculo.

En el modelado de homología , una aplicación común de las bibliotecas de fragmentos es modelar los bucles de la estructura. Por lo general, las hélices alfa y las hojas beta se enlazan con una estructura de plantilla, pero los bucles intermedios no se especifican y deben predecirse. Encontrar el bucle con la configuración óptima es NP-difícil . Para reducir el espacio conformacional que debe explorarse, se puede modelar el bucle como una serie de fragmentos superpuestos. A continuación, se puede tomar una muestra del espacio o, si el espacio ahora es lo suficientemente pequeño, se puede enumerar exhaustivamente.

Un enfoque para la enumeración exhaustiva es el siguiente. [1] La construcción del bucle comienza alineando todos los fragmentos posibles para que se superpongan con los tres residuos en el extremo N del bucle (el punto de anclaje). Luego, todas las opciones posibles para un segundo fragmento se alinean con (todas las opciones posibles de) el primer fragmento, asegurando que los últimos tres residuos del primer fragmento se superpongan con los primeros tres residuos del segundo fragmento. Esto asegura que la cadena de fragmentos forme ángulos realistas tanto dentro del fragmento como entre fragmentos. Esto luego se repite hasta que se construye un bucle con la longitud correcta de residuos.

El bucle debe comenzar en el ancla del lado N y terminar en el ancla del lado C. Por lo tanto, cada bucle debe probarse para ver si sus últimos residuos se superponen con el ancla del terminal C. Muy pocos de estos números exponenciales de bucles candidatos cerrarán el bucle. Después de filtrar los bucles que no se cierran, se debe determinar qué bucle tiene la configuración óptima, determinada por tener la energía más baja utilizando algún campo de fuerza de la mecánica molecular.

Complejidad

La complejidad del espacio de estados sigue siendo exponencial en el número de residuos, incluso después de utilizar bibliotecas de fragmentos. Sin embargo, el grado del exponente se reduce. Para una biblioteca de fragmentos de F -mer, con fragmentos L en la biblioteca, y para modelar una cadena de residuos N que se superponen a cada fragmento en 3, habrá cadenas posibles L [ N / ( F -3)] + 1 . [7] Esto es mucho menos que los K N posibilidades si modelar explícitamente los ángulos phi-psi como K combinaciones posibles, como la complejidad crece a un grado menor que N .

La complejidad aumenta en L , el tamaño de la biblioteca de fragmentos. Sin embargo, las bibliotecas con más fragmentos capturarán una mayor diversidad de estructuras de fragmentos, por lo que existe una compensación en la precisión del modelo frente a la velocidad de exploración del espacio de búsqueda. Esta elección gobierna qué K se usa al realizar la agrupación.

Además, para cualquier L fijo , la diversidad de estructuras que pueden modelarse disminuye a medida que aumenta la longitud de los fragmentos. Los fragmentos más cortos son más capaces de cubrir la diversa gama de estructuras que se encuentran en la AP que los más largos. Recientemente, se demostró que las bibliotecas de hasta 15 de longitud son capaces de modelar el 91% de los fragmentos en el PDB con una precisión de 2,0 angstroms. [8]

Ver también

Referencias

  1. a b Kolodny, R., Guibas, L., Levitt, M. y Koehl, P. (2005, marzo). Cinemática inversa en biología: el problema del cierre del bucle de proteínas. The International Journal of Robotics Research 24 (2-3), 151-163.
  2. ^ a b Simons, K., Kooperberg, C., Huang, E. y Baker, D. (1997). Ensamblaje de estructuras terciarias de proteínas a partir de fragmentos con secuencias locales similares utilizando funciones de anotación simulada y de puntuación bayesiana. J Mol Biol 268, 209-225.
  3. ^ Bujnicki, J. (2006) Predicción de la estructura de la proteína por recombinación de fragmentos. ChemBioChem. 7, 19-27.
  4. ^ Li, S. et al. (2008) Fragmento-HMM: un nuevo enfoque para la predicción de la estructura de proteínas. Ciencia de las proteínas. 17, 1925-1934.
  5. ^ DiMaio, F., Shavlik, J., Phillips, G. Un enfoque probabilístico para el rastreo de la columna vertebral de proteínas en mapas de densidad de electrones (2006). Bioinformática 22 (14), 81-89.
  6. ^ Canutescu, A., Shelenkov, A. y Dunbrack, R. (2003). Un algoritmo de teoría de grafos para la predicción de cadenas laterales de proteínas. Protein Sci. 12, 2001-2014.
  7. ↑ a b Kolodny, R., Koehl, P., Guibas, L. y Levitt, M. (2005). Pequeñas bibliotecas de fragmentos de proteínas modelan estructuras de proteínas nativas con precisión. J Mol Biol 323, 297-307.
  8. ^ Du, P., Andrec, M. y Levy, R. ¿Hemos visto todas las estructuras correspondientes a fragmentos de proteína cortos en el banco de datos de proteínas? Una actualización. Ingeniería de proteínas. 2003, 16 (6) 407-414.