Ingeniería de proteínas


La ingeniería de proteínas es el proceso de desarrollo de proteínas útiles o valiosas . Es una disciplina joven, con mucha investigación en curso sobre la comprensión del plegamiento de proteínas y el reconocimiento de los principios del diseño de proteínas . También es un mercado de productos y servicios, con un valor estimado de $ 168 mil millones para 2017. [1]

Hay dos estrategias generales para la ingeniería de proteínas: diseño racional de proteínas y evolución dirigida . Estos métodos no son mutuamente excluyentes; los investigadores a menudo aplicarán ambos. En el futuro, un conocimiento más detallado de la estructura y función de las proteínas y los avances en el cribado de alto rendimiento pueden ampliar enormemente las capacidades de la ingeniería de proteínas. Eventualmente, incluso se pueden incluir aminoácidos no naturales, a través de métodos más nuevos, como el código genético expandido , que permiten codificar nuevos aminoácidos en el código genético.

En el diseño racional de proteínas, un científico utiliza un conocimiento detallado de la estructura y función de una proteína para realizar los cambios deseados. En general, esto tiene la ventaja de ser económico y técnicamente fácil, ya que los métodos de mutagénesis dirigida al sitio están bien desarrollados. Sin embargo, su principal inconveniente es que el conocimiento estructural detallado de una proteína a menudo no está disponible e, incluso cuando está disponible, puede ser muy difícil predecir los efectos de varias mutaciones, ya que la información estructural a menudo proporciona una imagen estática de la estructura de una proteína. Sin embargo, programas como Folding @ home y Foldit han utilizado técnicas de crowdsourcing para obtener información sobre los motivos de plegamiento de las proteínas. [2]

Los algoritmos de diseño de proteínas computacionales buscan identificar nuevas secuencias de aminoácidos que son de baja energía cuando se pliegan a la estructura objetivo preespecificada. Si bien el espacio de conformación de secuencia que debe buscarse es grande, el requisito más desafiante para el diseño de proteínas computacionales es una función de energía rápida, pero precisa, que pueda distinguir secuencias óptimas de otras subóptimas similares.

Sin información estructural sobre una proteína, el análisis de secuencias suele ser útil para dilucidar información sobre la proteína. Estas técnicas implican la alineación de secuencias de proteínas diana con otras secuencias de proteínas relacionadas. Esta alineación puede mostrar qué aminoácidos se conservan entre especies y son importantes para la función de la proteína. Estos análisis pueden ayudar a identificar los aminoácidos de los puntos calientes que pueden servir como sitios objetivo para las mutaciones. El alineamiento de múltiples secuencias utiliza bases de datos como PREFAB, SABMARK, OXBENCH, IRMBASE y BALIBASE para realizar referencias cruzadas de secuencias de proteínas diana con secuencias conocidas. A continuación se enumeran varias técnicas de alineación de secuencias. [3] [ página necesaria ]

Este método comienza realizando una alineación por pares de secuencias utilizando métodos k-tuple o Needleman-Wunsch . Estos métodos calculan una matriz que describe la similitud por pares entre los pares de secuencias. Las puntuaciones de similitud se transforman luego en puntuaciones de distancia que se utilizan para producir un árbol guía utilizando el método de unión de vecinos. Este árbol guía se emplea luego para producir una alineación de secuencia múltiple. [3] [ página necesaria ]