En biología evolutiva , el espacio de secuencias es una forma de representar todas las secuencias posibles (para una proteína , gen o genoma ). [1] [2] El espacio de secuencia tiene una dimensión por aminoácido o nucleótido en la secuencia que conduce a espacios altamente dimensionales . [3] [4]
La mayoría de las secuencias en el espacio de secuencias no tienen función, dejando regiones relativamente pequeñas que están pobladas por genes naturales. [5] Cada secuencia de proteínas es adyacente a todas las demás secuencias a las que se puede llegar a través de una sola mutación . Se ha estimado que la vida en la Tierra ha explorado todo el espacio de secuencias de proteínas funcionales. [6] La evolución se puede visualizar como el proceso de muestreo de secuencias cercanas en el espacio de secuencia y pasar a cualquiera con una aptitud mejorada sobre la actual.
Representación
Un espacio de secuencia generalmente se presenta como una cuadrícula. Para los espacios de secuencias de proteínas , cada residuo de la proteína está representado por una dimensión con 20 posibles posiciones a lo largo de ese eje correspondientes a los posibles aminoácidos. [3] [4] Por lo tanto, hay 400 dipéptidos posibles dispuestos en un espacio de 20x20 pero que se expande a 10 130 para que incluso una pequeña proteína de 100 aminoácidos se disponga en un espacio de 100 dimensiones. Aunque esta abrumadora multidimensionalidad no puede visualizarse o representarse en forma de diagrama, proporciona un modelo abstracto útil para pensar en el rango de proteínas y la evolución de una secuencia a otra.
Estos espacios altamente multidimensionales se pueden comprimir en 2 o 3 dimensiones mediante el análisis de componentes principales . Un paisaje de fitness es simplemente un espacio de secuencia con un eje vertical adicional de fitness agregado para cada secuencia. [7]
Secuencias funcionales en el espacio secuencial
A pesar de la diversidad de superfamilias de proteínas, el espacio de secuencias está muy escasamente poblado por proteínas funcionales. La mayoría de las secuencias de proteínas aleatorias no tienen plegado ni función. [8] Las superfamilias de enzimas , por lo tanto, existen como pequeños grupos de proteínas activas en un vasto espacio vacío de secuencia no funcional. [9] [10]
La densidad de proteínas funcionales en el espacio de secuencia y la proximidad de diferentes funciones entre sí es un factor determinante clave para comprender la capacidad de evolución . [11] El grado de interpenetración de dos redes neutrales de diferentes actividades en el espacio secuencial determinará qué tan fácil es evolucionar de una actividad a otra. Cuanto más superposición entre las diferentes actividades en el espacio de secuencia, más críptica será la variación para la actividad promiscua . [12]
El espacio de la secuencia de proteínas se ha comparado con la Biblioteca de Babel , una biblioteca teórica que contiene todos los libros posibles de 410 páginas. [13] [14] En la Biblioteca de Babel , era imposible encontrar un libro que tuviera sentido debido a la gran cantidad y la falta de orden. Lo mismo sucedería con las secuencias de proteínas si no fuera por la selección natural, que ha seleccionado solo las secuencias de proteínas que tienen sentido. Además, cada secuencia de proteínas está rodeada por un conjunto de vecinos (mutantes puntuales) que probablemente tengan al menos alguna función.
Por otro lado, el "alfabeto" efectivo del espacio de secuencia puede ser de hecho bastante pequeño, reduciendo el número útil de aminoácidos de 20 a un número mucho menor. Por ejemplo, en una vista extremadamente simplificada, todos los aminoácidos se pueden clasificar en dos clases (hidrofóbico / polar) por hidrofobicidad y aún así permitir que aparezcan muchas estructuras comunes. La vida temprana en la Tierra puede tener solo cuatro o cinco tipos de aminoácidos con los que trabajar, [15] y las investigaciones han demostrado que se pueden crear proteínas funcionales a partir de las de tipo salvaje mediante un proceso similar de reducción alfabética. [16] [17] Los alfabetos reducidos también son útiles en bioinformática , ya que proporcionan una forma fácil de analizar la similitud de proteínas. [18] [19]
Exploración a través de la evolución dirigida y el diseño racional
Un enfoque importante en el campo de la ingeniería de proteínas es la creación de bibliotecas de ADN que muestreen regiones del espacio de secuencias, a menudo con el objetivo de encontrar mutantes de proteínas con funciones mejoradas en comparación con el tipo salvaje . Estas bibliotecas se crean usando una secuencia de tipo salvaje como plantilla y aplicando una o más técnicas de mutagénesis para hacer diferentes variantes de la misma, o creando proteínas desde cero usando síntesis de genes artificiales . A continuación, estas bibliotecas se criban o seleccionan , y las que tienen fenotipos mejorados se utilizan para la siguiente ronda de mutagénesis.
Ver también
- Proteína
- Espacio de secuencia
- Evolución dirigida
- Ingeniería de proteínas
- Espacio de alta dimensión
Referencias
- ^ DePristo, Mark A .; Weinreich, Daniel M .; Hartl, Daniel L. (2 de agosto de 2005). "Meandros sin sentido en el espacio de la secuencia: una vista biofísica de la evolución de las proteínas". Nature Reviews Genética . 6 (9): 678–687. doi : 10.1038 / nrg1672 . PMID 16074985 . S2CID 13236893 .
- ^ Maynard Smith, John (7 de febrero de 1970). "Selección natural y el concepto de espacio proteico". Naturaleza . 225 (5232): 563–564. Código Bibliográfico : 1970Natur.225..563M . doi : 10.1038 / 225563a0 . PMID 5411867 . S2CID 204994726 .
- ^ a b Bornberg-Bauer, E .; Chan, HS (14 de septiembre de 1999). "Modelado de paisajes evolutivos: estabilidad mutacional, topología y superfunnels en el espacio de secuencia" . Actas de la Academia Nacional de Ciencias . 96 (19): 10689–10694. Código Bibliográfico : 1999PNAS ... 9610689B . doi : 10.1073 / pnas.96.19.10689 . PMC 17944 . PMID 10485887 .
- ^ a b Cordes, MH; Davidson, AR; Sauer, RT (febrero de 1996). "Espacio de secuencia, plegado y diseño de proteínas". Opinión actual en biología estructural . 6 (1): 3–10. doi : 10.1016 / S0959-440X (96) 80088-1 . PMID 8696970 .
- ^ Hermes, JD; Blacklow, SC; Knowles, JR (enero de 1990). "Búsqueda de espacio de secuencia por mutagénesis definitivamente aleatoria: mejora de la potencia catalítica de una enzima" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 87 (2): 696–700. Código Bibliográfico : 1990PNAS ... 87..696H . doi : 10.1073 / pnas.87.2.696 . PMC 53332 . PMID 1967829 .
- ^ http://rsif.royalsocietypublishing.org/content/5/25/953
- ^ Romero, PA; Arnold, FH (diciembre de 2009). "Explorando paisajes de fitness de proteínas por evolución dirigida" . Nature Reviews Biología celular molecular . 10 (12): 866–76. doi : 10.1038 / nrm2805 . PMC 2997618 . PMID 19935669 .
- ^ Keefe, AD; Szostak, JW (5 de abril de 2001). "Proteínas funcionales de una biblioteca de secuencia aleatoria" . Naturaleza . 410 (6829): 715–8. Código bibliográfico : 2001Natur.410..715K . doi : 10.1038 / 35070613 . PMC 4476321 . PMID 11287961 .
- ^ Stemmer, Willem PC (junio de 1995). "Buscando espacio de secuencia". Bio / Tecnología . 13 (6): 549–553. doi : 10.1038 / nbt0695-549 . S2CID 20117819 .
- ^ Bornberg-Bauer, E (noviembre de 1997). "¿Cómo se distribuyen las estructuras de las proteínas modelo en el espacio de secuencias?" . Revista biofísica . 73 (5): 2393–403. Código Bibliográfico : 1997BpJ .... 73.2393B . doi : 10.1016 / S0006-3495 (97) 78268-7 . PMC 1181141 . PMID 9370433 .
- ^ Bornberg-Bauer, E; Huylmans, AK; Sikosek, T (junio de 2010). "¿Cómo surgen nuevas proteínas?". Opinión actual en biología estructural . 20 (3): 390–6. doi : 10.1016 / j.sbi.2010.02.005 . PMID 20347587 .
- ^ Wagner, Andreas (14 de julio de 2011). Los orígenes de las innovaciones evolutivas: una teoría del cambio transformador en los sistemas vivos . Oxford [etc.]: Oxford University Press. ISBN 978-0199692590.
- ^ Arnold, FH (2000). "La biblioteca de Maynard-Smith: mi búsqueda de sentido en el universo de proteínas". Avances en la química de proteínas . 55 : ix – xi. doi : 10.1016 / s0065-3233 (01) 55000-7 . PMID 11050930 .
- ^ Ostermeier, M (marzo de 2007). "Más allá de catalogar la Biblioteca de Babel" . Química y Biología . 14 (3): 237–8. doi : 10.1016 / j.chembiol.2007.03.002 . PMID 17379136 .
- ^ Dryden, DT; Thomson, AR; White, JH (6 de agosto de 2008). "¿Cuánto espacio de secuencias de proteínas ha sido explorado por la vida en la Tierra?" . Revista de la Royal Society, Interface . 5 (25): 953–6. doi : 10.1098 / rsif.2008.0085 . PMC 2459213 . PMID 18426772 .
- ^ Akanuma, S .; Kigawa, T .; Yokoyama, S. (2 de octubre de 2002). "Mutagénesis combinatoria para restringir el uso de aminoácidos en una enzima a un conjunto reducido" . Actas de la Academia Nacional de Ciencias . 99 (21): 13549-13553. Código bibliográfico : 2002PNAS ... 9913549A . doi : 10.1073 / pnas.222243999 . PMC 129711 . PMID 12361984 .
- ^ Fujishima, Kosuke; Wang, Kendrick M .; Palmer, Jesse A .; Abe, Nozomi; Nakahigashi, Kenji; Endy, Drew; Rothschild, Lynn J. (29 de enero de 2018). "Reconstrucción de la biosíntesis de cisteína utilizando enzimas libres de cisteína diseñadas" . Informes científicos . 8 (1): 1776. Bibcode : 2018NatSR ... 8.1776F . doi : 10.1038 / s41598-018-19920-y . PMC 5788988 . PMID 29379050 .
- ^ Bacardit, Jaume; Stout, Michael; Hirst, Jonathan D; Valencia, Alfonso; Smith, Robert E; Krasnogor, Natalio (6 de enero de 2009). "Reducción automatizada del alfabeto para conjuntos de datos de proteínas" . BMC Bioinformática . 10 (1): 6. doi : 10.1186 / 1471-2105-10-6 . PMC 2646702 . PMID 19126227 .
- ^ Solis, Armando D. (30 de julio de 2019). "Alfabeto reducido de aminoácidos prebióticos codifica de manera óptima el espacio conformacional de diversos pliegues proteicos existentes" . Biología Evolutiva BMC . 19 (1): 158. doi : 10.1186 / s12862-019-1464-6 . PMC 6668081 . PMID 31362700 .