diseño de proteínas


El diseño de proteínas es el diseño racional de nuevas moléculas de proteínas para diseñar actividades, comportamientos o propósitos novedosos, y para avanzar en la comprensión básica de la función de las proteínas. [1] Las proteínas se pueden diseñar desde cero ( diseño de novo ) o haciendo variantes calculadas de una estructura de proteína conocida y su secuencia (denominado rediseño de proteína ). Los enfoques de diseño racional de proteínas hacen predicciones de secuencias de proteínas que se plegarán a estructuras específicas. Estas secuencias pronosticadas luego pueden validarse experimentalmente a través de métodos como la síntesis de péptidos , la mutagénesis dirigida al sitio o la síntesis de genes artificiales ..

El diseño racional de proteínas se remonta a mediados de la década de 1970. [2] Recientemente, sin embargo, hubo numerosos ejemplos de diseño racional exitoso de péptidos y proteínas solubles en agua e incluso transmembrana, en parte debido a una mejor comprensión de los diferentes factores que contribuyen a la estabilidad de la estructura de la proteína y al desarrollo de mejores métodos computacionales.

El objetivo del diseño racional de proteínas es predecir las secuencias de aminoácidos que se plegarán a una estructura proteica específica. Aunque la cantidad de posibles secuencias de proteínas es enorme, y crece exponencialmente con el tamaño de la cadena de proteínas, solo un subconjunto de ellas se plegará de manera confiable y rápida a un estado nativo . El diseño de proteínas implica la identificación de nuevas secuencias dentro de este subconjunto. El estado nativo de una proteína es el mínimo de energía libre conformacional para la cadena. Así, el diseño de proteínas es la búsqueda de secuencias que tengan la estructura elegida como mínimo de energía libre. En cierto sentido, es lo contrario de la predicción de la estructura de la proteína . En diseño, una estructura terciariase especifica y se identifica una secuencia que se plegará a él. Por lo tanto, también se denomina plegado inverso . El diseño de proteínas es entonces un problema de optimización: utilizando algunos criterios de puntuación, se elige una secuencia optimizada que se plegará a la estructura deseada.

Cuando las primeras proteínas se diseñaron racionalmente durante las décadas de 1970 y 1980, la secuencia de estas se optimizó manualmente en función de los análisis de otras proteínas conocidas, la composición de la secuencia, las cargas de aminoácidos y la geometría de la estructura deseada. [2] Las primeras proteínas diseñadas se atribuyen a Bernd Gutte, quien diseñó una versión reducida de un catalizador conocido, la ribonucleasa bovina, y estructuras terciarias que consisten en láminas beta y hélices alfa, incluido un aglutinante de DDT . Posteriormente, Urry y sus colegas diseñaron péptidos fibrosos similares a la elastina basados ​​en reglas sobre la composición de secuencias. Richardson y colaboradores diseñaron una proteína de 79 residuos sin homología de secuencia con una proteína conocida. [2]En la década de 1990, el advenimiento de computadoras potentes, bibliotecas de conformaciones de aminoácidos y campos de fuerza desarrollados principalmente para simulaciones de dinámica molecular permitieron el desarrollo de herramientas de diseño de proteínas computacionales basadas en estructuras. Tras el desarrollo de estas herramientas informáticas, se ha logrado un gran éxito en los últimos 30 años en el diseño de proteínas. La primera proteína diseñada con éxito completamente de novo fue realizada por Stephen Mayo y sus colaboradores en 1997, [3] y, poco después, en 1999, Peter S. Kim y sus colaboradores diseñaron dímeros, trímeros y tetrámeros de bobinas enrolladas dextrógiras antinaturales . [4] [5] En 2003,El laboratorio de David Baker diseñó una proteína completa con un pliegue nunca antes visto en la naturaleza. [6] Más tarde, en 2008, el grupo de Baker diseñó enzimas computacionalmente para dos reacciones diferentes. [7] En 2010, se aisló uno de los anticuerpos ampliamente neutralizantes más poderosos del suero de un paciente mediante una sonda de proteína diseñada computacionalmente. [8] Debido a estos y otros éxitos (p. ej., consulte los ejemplos a continuación), el diseño de proteínas se ha convertido en una de las herramientas más importantes disponibles para la ingeniería de proteínas . Existe una gran esperanza de que el diseño de nuevas proteínas, pequeñas y grandes, tenga usos en biomedicina y bioingeniería .


La proteína Top7 fue una de las primeras proteínas diseñadas para un pliegue que nunca antes se había visto en la naturaleza [6]
FSD-1 (mostrado en azul, PDB id: 1FSV) fue el primer diseño computacional de novo de una proteína completa. [3] El pliegue objetivo fue el del dedo de zinc en los residuos 33–60 de la estructura de la proteína Zif268 (mostrado en rojo, PDB id: 1ZAA). La secuencia diseñada tenía muy poca identidad de secuencia con cualquier secuencia de proteína conocida.
Los programas comunes de diseño de proteínas utilizan bibliotecas de rotámeros para simplificar el espacio conformacional de las cadenas laterales de proteínas. Esta animación recorre todos los rotámeros del aminoácido isoleucina según la penúltima biblioteca de rotámeros. [10]
Comparación de varias funciones de energía potencial. Las energías más precisas son aquellas que utilizan cálculos de mecánica cuántica, pero son demasiado lentas para el diseño de proteínas. En el otro extremo, las funciones de energía heurísticas se basan en términos estadísticos y son muy rápidas. En el medio están las funciones de energía de la mecánica molecular que tienen una base física pero no son tan costosas desde el punto de vista computacional como las simulaciones de la mecánica cuántica. [15]
Los enlaces de hidrógeno mediados por agua juegan un papel clave en la unión proteína-proteína. Una de estas interacciones se muestra entre los residuos D457, S365 en la cadena pesada del anticuerpo de neutralización amplia del VIH VRC01 (verde) y los residuos N58 e Y59 en la proteína de la cubierta del VIH GP120 (púrpura). [18]
Esta animación ilustra la complejidad de una búsqueda de diseño de proteínas, que normalmente compara todas las conformaciones de rotámero de todas las posibles mutaciones en todos los residuos. En este ejemplo, se permite que los residuos Phe36 e His 106 muten a, respectivamente, los aminoácidos Tyr y Asn. Phe y Tyr tienen 4 rotámeros cada uno en la biblioteca de rotámeros, mientras que Asn e His tienen 7 y 8 rotámeros, respectivamente, en la biblioteca de rotámeros (de la penúltima biblioteca de rotámeros de Richardson [10] ). La animación recorre todas las (4 + 4) x (7 + 8) = 120 posibilidades. La estructura que se muestra es la de la mioglobina, PDB id: 1mbn.