La estructura secundaria de la proteína es la forma tridimensional de segmentos locales de proteínas . Los dos elementos estructurales secundarios más comunes son las hélices alfa y las láminas beta , aunque también se producen giros beta y bucles omega . Los elementos de la estructura secundaria típicamente se forman espontáneamente como un intermedio antes de que la proteína se pliegue en su estructura terciaria tridimensional .
Estructura secundaria se define formalmente por el patrón de enlaces de hidrógeno entre el amino hidrógeno y carboxilo átomos de oxígeno en el péptido columna vertebral . Alternativamente, la estructura secundaria puede definirse basándose en el patrón regular de ángulos diedros de la columna vertebral en una región particular de la gráfica de Ramachandran independientemente de si tiene los enlaces de hidrógeno correctos.
El concepto de estructura secundaria fue introducido por primera vez por Kaj Ulrik Linderstrøm-Lang en Stanford en 1952. [1] [2] Otros tipos de biopolímeros como los ácidos nucleicos también poseen estructuras secundarias características .
Tipos
Atributo de geometría | α-hélice | 3 10 hélice | π-hélice |
---|---|---|---|
Residuos por turno | 3.6 | 3,0 | 4.4 |
Traducción por residuo | 1,5 Å (0,15 nm) | 2,0 Å (0,20 nm) | 1,1 Å (0,11 nm) |
Radio de hélice | 2,3 Å (0,23 nm) | 1,9 Å (0,19 nm) | 2,8 Å (0,28 nm) |
Terreno de juego | 5,4 Å (0,54 nm) | 6,0 Å (0,60 nm) | 4,8 Å (0,48 nm) |
Las estructuras secundarias más comunes son las hélices alfa y las hojas beta . Se calcula que otras hélices, como la hélice 3 10 y la hélice π , tienen patrones de enlaces de hidrógeno energéticamente favorables, pero rara vez se observan en proteínas naturales, excepto en los extremos de las hélices α debido al empaquetamiento desfavorable del esqueleto en el centro de la hélice. Otras estructuras extendidas, como la hélice de poliprolina y la hoja alfa, son raras en las proteínas en estado nativo , pero a menudo se plantea la hipótesis de que son importantes intermedios de plegamiento de proteínas . Tight vueltas y, bucles flexibles sueltas enlazan los elementos de estructura secundaria más "regular". La bobina aleatoria no es una verdadera estructura secundaria, pero es la clase de conformaciones que indican una ausencia de estructura secundaria regular.
Los aminoácidos varían en su capacidad para formar los diversos elementos de la estructura secundaria. La prolina y la glicina a veces se conocen como "rompedores de hélice" porque alteran la regularidad de la conformación de la estructura de la hélice α; sin embargo, ambos tienen habilidades conformacionales inusuales y comúnmente se encuentran en turnos . Los aminoácidos que prefieren adoptar conformaciones helicoidales en las proteínas incluyen metionina , alanina , leucina , glutamato y lisina ("MALEK" en los códigos de 1 letra de aminoácidos ); por el contrario, los residuos aromáticos grandes ( triptófano , tirosina y fenilalanina ) y los aminoácidos ramificados C β ( isoleucina , valina y treonina ) prefieren adoptar conformaciones de cadena β . Sin embargo, estas preferencias no son lo suficientemente fuertes como para producir un método confiable de predecir la estructura secundaria solo a partir de la secuencia.
Se cree que las vibraciones colectivas de baja frecuencia son sensibles a la rigidez local dentro de las proteínas, lo que revela que las estructuras beta son genéricamente más rígidas que las proteínas alfa o desordenadas. [5] [6] Las mediciones de dispersión de neutrones han conectado directamente la característica espectral a ~ 1 THz con los movimientos colectivos de la estructura secundaria de la proteína de barril beta GFP. [7]
Los patrones de enlace de hidrógeno en las estructuras secundarias pueden distorsionarse significativamente, lo que dificulta la determinación automática de la estructura secundaria. Hay varios métodos para definir formalmente la estructura secundaria de la proteína (por ejemplo, DSSP , [8] DEFINE, [9] STRIDE , [10] ScrewFit, [11] SST [12] ).
Clasificación DSSP
El Dictionary of Protein Secondary Structure, abreviado DSSP, se usa comúnmente para describir la estructura secundaria de la proteína con códigos de una sola letra. La estructura secundaria se asigna en base a patrones de enlaces de hidrógeno como los propuestos inicialmente por Pauling et al. en 1951 (antes de que se hubiera determinado experimentalmente ninguna estructura proteica ). Hay ocho tipos de estructura secundaria que define DSSP:
- G = hélice de 3 vueltas ( 3 10 hélice ). Longitud mínima 3 residuos.
- H = hélice de 4 vueltas ( hélice α ). Longitud mínima 4 residuos.
- I = hélice de 5 vueltas ( hélice π ). Longitud mínima 5 residuos.
- T = turno unido por hidrógeno (3, 4 o 5 turnos)
- E = hebra extendida en conformación de hoja β paralela y / o antiparalela . Longitud mínima 2 residuos.
- B = residuo en el puente β aislado (formación de un enlace de hidrógeno de un solo par de láminas β)
- S = doblez (la única asignación no basada en enlaces de hidrógeno).
- C = bobina (residuos que no están en ninguna de las conformaciones anteriores).
'Bobina' a menudo se codifica como '' (espacio), C (bobina) o '-' (guión). Se requiere que las hélices (G, H e I) y las conformaciones de la hoja tengan una longitud razonable. Esto significa que 2 residuos adyacentes en la estructura primaria deben formar el mismo patrón de enlaces de hidrógeno. Si el patrón de enlace de hidrógeno de la hélice o la hoja es demasiado corto, se designan como T o B, respectivamente. Existen otras categorías de asignación de estructura secundaria de proteínas (giros bruscos, bucles Omega , etc.), pero se utilizan con menos frecuencia.
La estructura secundaria se define por enlaces de hidrógeno , por lo que la definición exacta de un enlace de hidrógeno es fundamental. La definición estándar de enlace de hidrógeno para la estructura secundaria es la de DSSP , que es un modelo puramente electrostático. Asigna cargas de ± q 1 ≈ 0,42 e al carbono carbonilo y al oxígeno, respectivamente, y cargas de ± q 2 ≈ 0,20 e a la amida de hidrógeno y nitrógeno, respectivamente. La energía electrostática es
Según DSSP, existe un enlace de hidrógeno si y solo si E es menor que −0,5 kcal / mol (−2,1 kJ / mol). Aunque la fórmula DSSP es una aproximación relativamente burda de la energía física del enlace de hidrógeno, generalmente se acepta como una herramienta para definir la estructura secundaria.
Clasificación SST [12]
SST es un método bayesiano para asignar estructura secundaria a datos de coordenadas de proteínas utilizando el criterio de información de Shannon de inferencia de longitud mínima de mensaje ( MML ). SST trata cualquier asignación de estructura secundaria como una hipótesis potencial que intenta explicar ( comprimir ) datos de coordenadas de proteínas dadas. La idea central es que la mejor asignación estructural secundaria es la que puede explicar ( comprimir ) las coordenadas de una proteína determinada de la manera más económica, vinculando así la inferencia de la estructura secundaria a la compresión de datos sin pérdidas . SST delinea con precisión cualquier cadena de proteínas en regiones asociadas con los siguientes tipos de asignación: [13]
- E = hebra (extendida) de una hoja plegada β
- G = diestro 3 10 hélice
- H = Hélice α diestra
- I = diestro π - hélice
- g = Para zurdos 3 10 hélice
- h = α-hélice zurda
- i = Zurdo π - hélice
- 3 = 3 10 -como Turn
- 4 = giro similar a α
- 5 = π- como Turn
- T = Turno no especificado
- C = bobina
- - = Residuo no asignado
SST detecta π y 3 10 casquillos helicoidales en hélices α estándar y ensambla automáticamente las diversas hebras extendidas en láminas plegadas β consistentes. Proporciona una salida legible de elementos estructurales secundarios diseccionados y un script descargable PyMol correspondiente para visualizar los elementos estructurales secundarios asignados individualmente.
Determinación experimental
El contenido de estructura secundaria aproximada de un biopolímero (por ejemplo, "esta proteína es 40% de hélice α y 20% de lámina β ") se puede estimar espectroscópicamente . [14] Para las proteínas, un método común es el dicroísmo circular ultravioleta lejano (UV lejano, 170-250 nm) . Un doble mínimo pronunciado a 208 y 222 nm indica una estructura α-helicoidal, mientras que un mínimo único a 204 nm o 217 nm refleja una estructura de bobina aleatoria o de lámina β, respectivamente. Un método menos común es la espectroscopia infrarroja , que detecta diferencias en las oscilaciones de los enlaces de los grupos amida debido a los enlaces de hidrógeno. Finalmente, el contenido de la estructura secundaria se puede estimar con precisión utilizando los cambios químicos de un espectro de RMN inicialmente no asignado . [15]
Predicción
La predicción de la estructura terciaria de la proteína a partir únicamente de su secuencia de aminoácidos es un problema muy desafiante (ver predicción de la estructura de la proteína ), pero usar las definiciones de estructura secundaria más simples es más manejable.
Los primeros métodos de predicción de estructuras secundarias se restringieron a predecir los tres estados predominantes: hélice, hoja o espiral aleatoria. Estos métodos se basaron en las propensiones a formar hélices o láminas de los aminoácidos individuales, a veces junto con reglas para estimar la energía libre de formar elementos de estructura secundaria. Las primeras técnicas ampliamente utilizadas para predecir la estructura secundaria de proteínas a partir de la secuencia de aminoácidos fueron el método Chou-Fasman [16] [17] [18] y el método GOR . [19] Aunque dichos métodos afirmaron lograr una precisión de ~ 60% en la predicción de cuál de los tres estados (hélice / hoja / bobina) adopta un residuo, las evaluaciones de computación ciega mostraron más tarde que la precisión real era mucho menor. [20]
Se logró un aumento significativo de la precisión (hasta casi el 80%) aprovechando la alineación de múltiples secuencias ; conocer la distribución completa de los aminoácidos que ocurren en una posición (y en su vecindad, típicamente ~ 7 residuos en cada lado) a lo largo de la evolución proporciona una imagen mucho mejor de las tendencias estructurales cerca de esa posición. [21] [22] Por ejemplo, una proteína determinada podría tener una glicina en una posición determinada, lo que por sí mismo podría sugerir una espiral aleatoria allí. Sin embargo, la alineación de múltiples secuencias podría revelar que los aminoácidos que favorecen la hélice se encuentran en esa posición (y posiciones cercanas) en el 95% de las proteínas homólogas que abarcan casi mil millones de años de evolución. Además, al examinar la hidrofobicidad promedio en esa y en las posiciones cercanas, la misma alineación también podría sugerir un patrón de accesibilidad al solvente residual consistente con una hélice α. Tomados en conjunto, estos factores sugerirían que la glicina de la proteína original adopta una estructura α-helicoidal, en lugar de una espiral aleatoria. Se utilizan varios tipos de métodos para combinar todos los datos disponibles para formar una predicción de 3 estados, incluidas redes neuronales , modelos de Markov ocultos y máquinas de vectores de soporte . Los métodos de predicción modernos también proporcionan una puntuación de confianza para sus predicciones en cada posición.
Los métodos de predicción de la estructura secundaria se evaluaron mediante los experimentos de Evaluación Crítica de Predicción de la Estructura de la proteína (CASP) y se compararon continuamente, por ejemplo, mediante EVA (punto de referencia) . Según estas pruebas, los métodos más precisos fueron Psipred , SAM, [23] PORTER, [24] PROF, [25] y SABLE. [26] El área principal de mejora parece ser la predicción de cadenas β; es probable que los residuos predichos con seguridad como cadena β lo sean, pero los métodos tienden a pasar por alto algunos segmentos de la cadena β (falsos negativos). Es probable que exista un límite superior de ~ 90% de precisión de predicción en general, debido a las idiosincrasias del método estándar ( DSSP ) para asignar clases de estructura secundaria (hélice / hebra / bobina) a estructuras PDB, contra las cuales se comparan las predicciones. [27]
La predicción precisa de la estructura secundaria es un elemento clave en la predicción de la estructura terciaria , excepto en los casos más simples ( modelado de homología ). Por ejemplo, un patrón predicho con seguridad de seis elementos de estructura secundaria βαββαβ es la firma de un pliegue de ferredoxina . [28]
Aplicaciones
Pueden usarse estructuras secundarias tanto de proteínas como de ácidos nucleicos para ayudar en la alineación de múltiples secuencias . Estas alineaciones pueden hacerse más precisas mediante la inclusión de información de estructura secundaria además de información de secuencia simple. Esto a veces es menos útil en el ARN porque el emparejamiento de bases está mucho más conservado que la secuencia. Las relaciones distantes entre proteínas cuyas estructuras primarias no se pueden alinear a veces se pueden encontrar por estructura secundaria. [21]
Se ha demostrado que las α-hélices son más estables, resistentes a las mutaciones y designables que las β-cadenas en las proteínas naturales, [29] por lo tanto, diseñar proteínas funcionales todas-α probablemente sea más fácil que diseñar proteínas con hélices y hebras; esto se ha confirmado recientemente de forma experimental. [30]
Ver también
- Plegable (química)
- Estructura secundaria de ácido nucleico
- Traducción
- Motivo estructural
- Banco de datos de dicroísmo circular de proteínas
- Y si el software
- Lista de programas de predicción de estructuras secundarias de proteínas
Referencias
- ^ Linderstrøm-Lang KU (1952). Conferencias médicas de Lane: proteínas y enzimas . Prensa de la Universidad de Stanford. pag. 115. ASIN B0007J31SC .
- ^ Schellman JA, Schellman CG (1997). "Kaj Ulrik Linderstrøm-Lang (1896-1959)" . Protein Sci . 6 (5): 1092–100. doi : 10.1002 / pro.5560060516 . PMC 2143695 . PMID 9144781 .
Ya había introducido los conceptos de la estructura primaria, secundaria y terciaria de las proteínas en la tercera conferencia de Lane (Linderstram-Lang, 1952).
- ^ Steven Bottomley (2004). "Tutorial interactivo de estructura de proteínas" . Archivado desde el original el 1 de marzo de 2011 . Consultado el 9 de enero de 2011 .
- ^ Schulz, GE (Georg E.), 1939- (1979). Principios de estructura proteica . Schirmer, R. Heiner, 1942-. Nueva York: Springer-Verlag. ISBN 0-387-90386-0. OCLC 4498269 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Perticaroli S, Nickels JD, Ehlers G, O'Neill H, Zhang Q, Sokolov AP (octubre de 2013). "Estructura secundaria y rigidez en proteínas modelo". Materia blanda . 9 (40): 9548–56. doi : 10.1039 / C3SM50807B . PMID 26029761 .
- ^ Perticaroli S, Nickels JD, Ehlers G, Sokolov AP (junio de 2014). "Rigidez, estructura secundaria y universalidad del pico del bosón en proteínas" . Revista biofísica . 106 (12): 2667–74. doi : 10.1016 / j.bpj.2014.05.009 . PMC 4070067 . PMID 24940784 .
- ^ Nickels JD, Perticaroli S, O'Neill H, Zhang Q, Ehlers G, Sokolov AP (2013). "Dispersión de neutrones coherente y dinámica colectiva en la proteína, GFP" . Biophys. J . 105 (9): 2182–87. doi : 10.1016 / j.bpj.2013.09.029 . PMC 3824694 . PMID 24209864 .
- ^ Kabsch W, Sander C (diciembre de 1983). "Diccionario de estructura secundaria de proteínas: reconocimiento de patrones de características geométricas y con enlaces de hidrógeno". Biopolímeros . 22 (12): 2577–637. doi : 10.1002 / bip.360221211 . PMID 6667333 .
- ^ Richards FM, Kundrot CE (1988). "Identificación de motivos estructurales a partir de datos de coordenadas de proteínas: estructura secundaria y estructura supersecundaria de primer nivel". Las proteínas . 3 (2): 71–84. doi : 10.1002 / prot.340030202 . PMID 3399495 .
- ^ Frishman D, Argos P (diciembre de 1995). "Asignación de estructura secundaria de proteínas basada en el conocimiento" (PDF) . Las proteínas . 23 (4): 566–79. CiteSeerX 10.1.1.132.9420 . doi : 10.1002 / prot.340230412 . PMID 8749853 . Archivado desde el original (PDF) el 13 de junio de 2010.
- ^ Calligari PA, Kneller GR (diciembre de 2012). "ScrewFit: combinación de localización y descripción de la estructura secundaria de la proteína". Acta Crystallographica Sección D . 68 (Pt 12): 1690–3. doi : 10.1107 / s0907444912039029 . PMID 23151634 .
- ^ a b Konagurthu AS, Lesk AM, Allison L (junio de 2012). "Inferencia de longitud de mensaje mínima de estructura secundaria a partir de datos de coordenadas de proteínas" . Bioinformática . 28 (12): i97 – i105. doi : 10.1093 / bioinformatics / bts223 . PMC 3371855 . PMID 22689785 .
- ^ "Servidor web SST" . Consultado el 17 de abril de 2018 .
- ^ Pelton JT, McLean LR (2000). "Métodos espectroscópicos para el análisis de la estructura secundaria de proteínas". Anal. Biochem . 277 (2): 167–76. doi : 10.1006 / abio.1999.4320 . PMID 10625503 .
- ^ Meiler J, Baker D (2003). "Determinación rápida de pliegues de proteínas utilizando datos de RMN no asignados" . Proc. Natl. Acad. Sci. USA . 100 (26): 15404–09. doi : 10.1073 / pnas.2434121100 . PMC 307580 . PMID 14668443 .
- ^ Chou PY, Fasman GD (enero de 1974). "Predicción de la conformación de proteínas". Bioquímica . 13 (2): 222–45. doi : 10.1021 / bi00699a002 . PMID 4358940 .
- ^ Chou PY, Fasman GD (1978). "Predicciones empíricas de la conformación de la proteína". Revisión anual de bioquímica . 47 : 251–76. doi : 10.1146 / annurev.bi.47.070178.001343 . PMID 354496 .
- ^ Chou PY, Fasman GD (1978). "Predicción de la estructura secundaria de proteínas a partir de su secuencia de aminoácidos". Avances en enzimología y áreas afines de la biología molecular . Avances en enzimología y áreas relacionadas de la biología molecular. 47 . págs. 45-148 . doi : 10.1002 / 9780470122921.ch2 . ISBN 9780470122921. PMID 364941 .
- ^ Garnier J, Osguthorpe DJ, Robson B (marzo de 1978). "Análisis de la precisión e implicaciones de métodos simples para predecir la estructura secundaria de proteínas globulares". Revista de Biología Molecular . 120 (1): 97-120. doi : 10.1016 / 0022-2836 (78) 90297-8 . PMID 642007 .
- ^ Kabsch W, Sander C (mayo de 1983). "¿Qué tan buenas son las predicciones de la estructura secundaria de las proteínas?". Cartas FEBS . 155 (2): 179–82. doi : 10.1016 / 0014-5793 (82) 80597-8 . PMID 6852232 .
- ^ a b Simossis VA, Heringa J (agosto de 2004). "Integración de la predicción de estructura secundaria de proteínas y alineación de secuencia múltiple". Ciencia actual de proteínas y péptidos . 5 (4): 249–66. doi : 10.2174 / 1389203043379675 . PMID 15320732 .
- ^ Pirovano W, Heringa J (2010). Predicción de la estructura secundaria de proteínas . Methods Mol. Biol . Métodos en Biología Molecular. 609 . págs. 327–48. doi : 10.1007 / 978-1-60327-241-4_19 . ISBN 978-1-60327-240-7. PMID 20221928 .
- ^ Karplus K (2009). "SAM-T08, predicción de la estructura de la proteína basada en HMM" . Ácidos nucleicos Res . 37 (Problema del servidor web): W492–97. doi : 10.1093 / nar / gkp403 . PMC 2703928 . PMID 19483096 .
- ^ Pollastri G, McLysaght A (2005). "Porter: un servidor nuevo y preciso para la predicción de la estructura secundaria de proteínas" . Bioinformática . 21 (8): 1719-20. doi : 10.1093 / bioinformatics / bti203 . PMID 15585524 .
- ^ Yachdav G, Kloppmann E, Kajan L, Hecht M, Goldberg T, Hamp T, Hönigschmid P, Schafferhans A, Roos M, Bernhofer M, Richter L, Ashkenazy H, Punta M, Schlessinger A, Bromberg Y, Schneider R, Vriend G , Sander C, Ben-Tal N, Rost B (2014). "PredictProtein: un recurso abierto para la predicción en línea de características estructurales y funcionales de proteínas" . Ácidos nucleicos Res . 42 (Problema del servidor web): W337–43. doi : 10.1093 / nar / gku366 . PMC 4086098 . PMID 24799431 .
- ^ Adamczak R, Porollo A, Meller J (2005). "Combinando predicción de estructura secundaria y accesibilidad a solventes en proteínas". Las proteínas . 59 (3): 467–75. doi : 10.1002 / prot.20441 . PMID 15768403 .
- ^ Kihara D (agosto de 2005). "El efecto de las interacciones de largo alcance en la formación de estructuras secundarias de proteínas" . Ciencia de las proteínas . 14 (8): 1955–963. doi : 10.1110 / ps.051479505 . PMC 2279307 . PMID 15987894 .
- ^ Qi Y, Grishin NV (2005). "Clasificación estructural de proteínas de pliegue de tipo tiorredoxina" (PDF) . Las proteínas . 58 (2): 376–88. CiteSeerX 10.1.1.644.8150 . doi : 10.1002 / prot.20329 . PMID 15558583 .
Dado que la definición de pliegue debe incluir solo los elementos estructurales secundarios centrales que están presentes en la mayoría de los homólogos, definimos el pliegue similar a tiorredoxina como un sándwich α / β de dos capas con el patrón de estructura secundaria βαβββα.
- ^ Abrusan G, Marsh JA (2016). "Las hélices alfa son más resistentes a las mutaciones que las cadenas beta" . Biología Computacional PLoS . 12 (12): e1005242. doi : 10.1371 / journal.pcbi.1005242 . PMC 5147804 . PMID 27935949 .
- ^ Rocklin GJ y col. (2017). "Análisis global de plegamiento de proteínas mediante diseño, síntesis y pruebas masivamente paralelas" . Ciencia . 357 (6347): 168-175. doi : 10.1126 / science.aan0693 . PMC 5568797 . PMID 28706065 .
Otras lecturas
- Branden C, Autor J (1999). Introducción a la estructura de las proteínas (2ª ed.). Nueva York: Garland Science. ISBN 978-0815323051.
- Pauling L. , Corey RB (1951). "Configuraciones de cadenas polipeptídicas con orientaciones favorables alrededor de enlaces simples: dos nuevas hojas plisadas" . Proc. Natl. Acad. Sci. USA . 37 (11): 729–40. doi : 10.1073 / pnas.37.11.729 . PMC 1063460 . PMID 16578412 . (El artículo de conformación de la hoja beta original).
- Pauling L. , Corey RB , Branson HR (1951). "La estructura de las proteínas; dos configuraciones helicoidales con enlaces de hidrógeno de la cadena polipeptídica" . Proc. Natl. Acad. Sci. USA . 37 (4): 205-11. doi : 10.1073 / pnas.37.4.205 . PMC 1063337 . PMID 14816373 . (conformaciones de hélice alfa y pi, ya que predijeron que hélices no serían posibles.)
enlaces externos
- NetSurfP: predictor de accesibilidad de superficie y estructura secundaria
- PROFE
- ScrewFit
- PSSpred Un programa de entrenamiento de múltiples redes neuronales para la predicción de la estructura secundaria de proteínas
- Metaserver metaservidor Genesilico que permite ejecutar más de 20 predictores de estructura secundaria diferentes con un solo clic
- Servidor web SST : una asignación estructural secundaria basada en la teoría de la información (basada en compresión).