Una superfamilia de proteínas es el grupo más grande ( clado ) de proteínas para el cual se puede inferir un ancestro común (ver homología ). Por lo general, esta ascendencia común se infiere de la alineación estructural [1] y la similitud mecanicista, incluso si no hay similitud de secuencia evidente. [2] Entonces se puede deducir la homología de secuencia incluso si no es evidente (debido a la baja similitud de secuencia). Las superfamilias contienen típicamente varias familias de proteínas que muestran similitud de secuencia dentro de cada familia. El término clan de proteínas se usa comúnmente para proteasas y glicosil hidrolasas.superfamilias basadas en los sistemas de clasificación MEROPS y CAZy . [2] [3]
Identificación
Las superfamilias de proteínas se identifican utilizando varios métodos. Los miembros estrechamente relacionados se pueden identificar mediante métodos diferentes a los necesarios para agrupar a los miembros más divergentes evolutivamente.
Similitud de secuencia
Históricamente, la similitud de diferentes secuencias de aminoácidos ha sido el método más común de inferir homología . [5] La similitud de secuencia se considera un buen predictor de parentesco, ya que las secuencias similares son más probablemente el resultado de la duplicación de genes y la evolución divergente , más que el resultado de la evolución convergente . La secuencia de aminoácidos suele estar más conservada que la secuencia de ADN (debido al código genético degenerado ), por lo que es un método de detección más sensible. Dado que algunos de los aminoácidos tienen propiedades similares (p. Ej., Carga, hidrofobicidad, tamaño), las mutaciones conservadoras que los intercambian a menudo son neutrales para funcionar. Las regiones de secuencia más conservadas de una proteína a menudo corresponden a regiones funcionalmente importantes como sitios catalíticos y sitios de unión, ya que estas regiones son menos tolerantes a los cambios de secuencia.
El uso de la similitud de secuencia para inferir homología tiene varias limitaciones. No existe un nivel mínimo de similitud de secuencia garantizado para producir estructuras idénticas. Durante largos períodos de evolución, las proteínas relacionadas pueden no mostrar similitudes de secuencia detectables entre sí. Las secuencias con muchas inserciones y deleciones a veces también pueden ser difíciles de alinear y así identificar las regiones de secuencia homólogas. En el clan de proteasas PA , por ejemplo, no se conserva un solo residuo a través de la superfamilia, ni siquiera los de la tríada catalítica . Por el contrario, las familias individuales que forman una superfamilia se definen sobre la base de su alineación de secuencia, por ejemplo, la familia de proteasa C04 dentro del clan PA.
Sin embargo, la similitud de secuencia es la forma de evidencia más comúnmente utilizada para inferir la relación, ya que el número de secuencias conocidas supera ampliamente el número de estructuras terciarias conocidas . [6] En ausencia de información estructural, la similitud de secuencia limita los límites de las proteínas que se pueden asignar a una superfamilia. [6]
Similitud estructural
La estructura se conserva mucho más evolutivamente que la secuencia, de modo que las proteínas con estructuras muy similares pueden tener secuencias completamente diferentes. [7] En escalas de tiempo evolutivas muy largas, muy pocos residuos muestran una conservación detectable de la secuencia de aminoácidos, sin embargo, los elementos estructurales secundarios y los motivos estructurales terciarios están altamente conservados. También se pueden conservar algunas dinámicas de proteínas [8] y cambios conformacionales de la estructura de la proteína, como se ve en la superfamilia de serpinas . [9] En consecuencia, la estructura terciaria de la proteína puede usarse para detectar homología entre proteínas incluso cuando no queda evidencia de parentesco en sus secuencias. Los programas de alineación estructural , como DALI , utilizan la estructura 3D de una proteína de interés para encontrar proteínas con pliegues similares. [10] Sin embargo, en raras ocasiones, las proteínas relacionadas pueden evolucionar para ser estructuralmente diferentes [11] y la relación solo puede inferirse por otros métodos. [12] [13] [14]
Similitud mecanicista
El mecanismo catalítico de las enzimas dentro de una superfamilia se conserva comúnmente, aunque la especificidad del sustrato puede ser significativamente diferente. [15] Los residuos catalíticos también tienden a ocurrir en el mismo orden en la secuencia de proteínas. [16] Para las familias dentro del clan PA de proteasas, aunque ha habido una evolución divergente de los residuos de la tríada catalítica utilizados para realizar la catálisis, todos los miembros utilizan un mecanismo similar para realizar catálisis covalente nucleofílica en proteínas, péptidos o aminoácidos. [17] Sin embargo, el mecanismo por sí solo no es suficiente para inferir la relación. Algunos mecanismos catalíticos han evolucionado de manera convergente varias veces de forma independiente, por lo que forman superfamilias separadas, [18] [19] [20] y en algunas superfamilias muestran una gama de mecanismos diferentes (aunque a menudo químicamente similares). [15] [21]
Importancia evolutiva
Las superfamilias de proteínas representan los límites actuales de nuestra capacidad para identificar ancestros comunes. [22] Son el grupo evolutivo más grande basado en evidencia directa que es posible actualmente. Por lo tanto, se encuentran entre los eventos evolutivos más antiguos estudiados actualmente. Algunas superfamilias tienen miembros presentes en todos los reinos de la vida , lo que indica que el último ancestro común de esa superfamilia estaba en el último ancestro común universal de toda la vida (LUCA). [23]
Los miembros de la superfamilia pueden pertenecer a diferentes especies, siendo la proteína ancestral la forma de la proteína que existía en la especie ancestral ( ortología ). Por el contrario, las proteínas pueden pertenecer a la misma especie, pero evolucionaron a partir de una única proteína cuyo gen se duplicó en el genoma ( paralogía ).
Diversificación
La mayoría de las proteínas contienen múltiples dominios. Entre el 66 y el 80% de las proteínas eucariotas tienen múltiples dominios, mientras que aproximadamente el 40-60% de las proteínas procariotas tienen múltiples dominios. [5] Con el tiempo, muchas de las superfamilias de dominios se han mezclado. De hecho, es muy raro encontrar "superfamilias consistentemente aisladas". [5] [1] Cuando los dominios se combinan, el orden de dominio de N- a C-terminal (la "arquitectura de dominio") generalmente se conserva bien. Además, el número de combinaciones de dominios que se ven en la naturaleza es pequeño en comparación con el número de posibilidades, lo que sugiere que la selección actúa sobre todas las combinaciones. [5]
Ejemplos de
Superfamilia α / β hidrolasa : los miembros comparten una hoja α / β, que contiene 8 hebras conectadas por hélices , conresiduos de tríada catalítica en el mismo orden, [24] las actividades incluyen proteasas , lipasas , peroxidasas , esterasas , epóxido hidrolasas y deshalogenasas . [25]
Superfamilia de fosfatasa alcalina : los miembros comparten una estructura de sándwich αβα [26] y realizan reacciones promiscuas comunesmediante un mecanismo común. [27]
Superfamilia de globina : los miembros comparten un pliegue de globina globular de8 hélice alfa . [28] [29]
Superfamilia de inmunoglobulinas : los miembros comparten una estructura similar a un sándwich de dos láminas de hebras β antiparalelas( pliegues de Ig ) y participan en el reconocimiento, la unión y la adhesión . [30] [31]
Clan PA : los miembros comparten undoblepliegue de barril β similar a la quimotripsina ymecanismos de proteólisis similares, pero una identidad de secuencia de <10%. El clan contiene tanto cisteína como serina proteasas (diferentes nucleófilos ). [2] [32]
Superfamilia Ras : los miembros comparten un dominio G catalítico común de una hoja β de 6 hebras rodeada por 5 hélices α. [33]
Superfamilia Serpin : los miembros comparten un pliegue estresado de alta energía que puede sufrir un gran cambio conformacional , que generalmente se usa para inhibir las proteasas de serina y cisteína al alterar su estructura. [9]
Superfamilia de barriles TIM : los miembros comparten una granestructura de barrilα 8 β 8 . Es uno de los pliegues de proteínas más comunesy la monoflicidad de esta superfamilia aún se cuestiona. [34] [35]
Recursos de la superfamilia de proteínas
Varias bases de datos biológicas documentan superfamilias de proteínas y pliegues de proteínas, por ejemplo:
- Pfam - Base de datos de familias de proteínas de alineaciones y HMM
- PROSITE - Base de datos de dominios de proteínas, familias y sitios funcionales
- PIRSF - Sistema de clasificación de superfamilias
- PASS2 - Alineación de proteínas como superfamilias estructurales v2
- SUPERFAMILIA - Biblioteca de HMM que representan superfamilias y base de datos de anotaciones (superfamilia y familia) para todos los organismos completamente secuenciados
- SCOP y CATH : clasificaciones de estructuras de proteínas en superfamilias, familias y dominios
De manera similar, existen algoritmos que buscan en el PDB proteínas con homología estructural con una estructura objetivo, por ejemplo:
- DALI : alineación estructural basada en un método de matriz de alineación de distancia
Ver también
- Alineación estructural
- Dominios proteicos
- Familia proteica
- Mimético de proteínas
- Estructura proteica
- Homología (biología)
- Interolog
- Lista de familias de genes
- SUPERFAMILIA
- CATH
Referencias
- ↑ a b Holm L, Rosenström P (julio de 2010). "Servidor Dali: mapeo de conservación en 3D" . Investigación de ácidos nucleicos . 38 (Problema del servidor web): W545–9. doi : 10.1093 / nar / gkq366 . PMC 2896194 . PMID 20457744 .
- ^ a b c Rawlings ND, Barrett AJ, Bateman A (enero de 2012). "MEROPS: la base de datos de enzimas proteolíticas, sus sustratos e inhibidores" . Investigación de ácidos nucleicos . 40 (Problema de la base de datos): D343–50. doi : 10.1093 / nar / gkr987 . PMC 3245014 . PMID 22086950 .
- ^ Henrissat B, Bairoch A (junio de 1996). "Actualización de la clasificación basada en secuencia de glicosil hidrolasas" . La revista bioquímica . 316 (Parte 2): 695–6. doi : 10.1042 / bj3160695 . PMC 1217404 . PMID 8687420 .
- ^ "Preguntas frecuentes de Clustal # Símbolos" . Clustal . Archivado desde el original el 24 de octubre de 2016 . Consultado el 8 de diciembre de 2014 .
- ^ a b c d Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (abril de 2007). "El plegamiento y evolución de proteínas multidominio". Nature Reviews Biología celular molecular . 8 (4): 319-30. doi : 10.1038 / nrm2144 . PMID 17356578 . S2CID 13762291 .
- ^ a b Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (enero de 2002). "SUPFAM - una base de datos de posibles relaciones de superfamilias de proteínas derivadas de la comparación de familias basadas en secuencias y basadas en estructuras: implicaciones para la genómica estructural y anotación de funciones en los genomas" . Investigación de ácidos nucleicos . 30 (1): 289–93. doi : 10.1093 / nar / 30.1.289 . PMC 99061 . PMID 11752317 .
- ^ Orengo CA, Thornton JM (2005). "Familias de proteínas y su evolución: una perspectiva estructural". Revisión anual de bioquímica . 74 (1): 867–900. doi : 10.1146 / annurev.biochem.74.082803.133029 . PMID 15954844 .
- ^ Liu Y, Bahar I (septiembre de 2012). "La evolución de la secuencia se correlaciona con la dinámica estructural" . Biología Molecular y Evolución . 29 (9): 2253–63. doi : 10.1093 / molbev / mss097 . PMC 3424413 . PMID 22427707 .
- ^ a b Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (septiembre 2001). "Las serpinas son una superfamilia en expansión de proteínas estructuralmente similares pero funcionalmente diversas. Evolución, mecanismo de inhibición, funciones nuevas y una nomenclatura revisada" . La revista de química biológica . 276 (36): 33293–6. doi : 10.1074 / jbc.R100016200 . PMID 11435447 .
- ^ Holm L, Laakso LM (julio de 2016). "Actualización del servidor Dali" . Investigación de ácidos nucleicos . 44 (W1): W351–5. doi : 10.1093 / nar / gkw357 . PMC 4987910 . PMID 27131377 .
- ^ Pascual-García A, Abia D, Ortiz ÁR, Bastolla U (2009). "Cruce entre el espacio de estructura de proteínas discreta y continua: información sobre la clasificación automática y las redes de estructuras de proteínas" . PLOS Biología Computacional . 5 (3). doi : 10.1371 / journal.pcbi.1000331 .
- ^ Li D, Zhang L, Yin H, Xu H, Satkoski Trask J, Smith DG, Li Y, Yang M, Zhu Q (junio de 2014). "Evolución de las defensinas α y θ de primates reveladas por análisis de genomas". Informes de biología molecular . 41 (6): 3859–66. doi : 10.1007 / s11033-014-3253-z . PMID 24557891 . S2CID 14936647 .
- ^ Krishna SS, Grishin NV (abril de 2005). "Deriva estructural: un posible camino al cambio de pliegues de proteínas" . Bioinformática . 21 (8): 1308–10. doi : 10.1093 / bioinformatics / bti227 . PMID 15604105 .
- ^ Bryan PN, Orban J (agosto de 2010). "Proteínas que cambian de pliegue" . Opinión actual en biología estructural . 20 (4): 482–8. doi : 10.1016 / j.sbi.2010.06.002 . PMC 2928869 . PMID 20591649 .
- ^ a b Dessailly, Benoit H .; Dawson, Natalie L .; Das, Sayoni; Orengo, Christine A. (2017), "Diversidad de funciones dentro de pliegues y superfamilias", De la estructura de proteínas a la función con bioinformática , Springer Países Bajos, págs. 295-325, doi : 10.1007 / 978-94-024-1069-3_9 , ISBN 9789402410679
- ^ Echave J, Spielman SJ, Wilke CO (febrero de 2016). "Causas de la variación de la tasa evolutiva entre los sitios de proteínas" . Reseñas de la naturaleza. Genética . 17 (2): 109–21. doi : 10.1038 / nrg.2015.18 . PMC 4724262 . PMID 26781812 .
- ^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (septiembre de 2015). "Handicap-Recover Evolution conduce a una proteasa permisiva de nucleófilos, químicamente versátil" . ChemBioChem . 16 (13): 1866–1869. doi : 10.1002 / cbic.201500295 . PMC 4576821 . PMID 26097079 .
- ^ Buller AR, Townsend CA (febrero de 2013). "Restricciones evolutivas intrínsecas en la estructura de la proteasa, acilación de la enzima y la identidad de la tríada catalítica" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (8): E653–61. doi : 10.1073 / pnas.1221050110 . PMC 3581919 . PMID 23382230 .
- ^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (abril de 2003). "Una clasificación familiar jerárquica en evolución para glicosiltransferasas". Revista de Biología Molecular . 328 (2): 307-17. doi : 10.1016 / S0022-2836 (03) 00307-3 . PMID 12691742 .
- ^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (mayo de 2015). "Evolución independiente de cuatro superfamilias de hemo peroxidasa" . Archivos de Bioquímica y Biofísica . 574 : 108-19. doi : 10.1016 / j.abb.2014.12.025 . PMC 4420034 . PMID 25575902 .
- ^ Akiva, Eyal; Brown, Shoshana; Almonacid, Daniel E .; Barber, Alan E .; Custer, Ashley F .; Hicks, Michael A .; Huang, Conrad C .; Lauck, Florian; Mashiyama, Susan T. (23 de noviembre de 2013). "La base de datos de vinculación estructura-función" . Investigación de ácidos nucleicos . 42 (D1): D521 – D530. doi : 10.1093 / nar / gkt1130 . ISSN 0305-1048 . PMC 3965090 . PMID 24271399 .
- ^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (marzo de 2005). "La estructura de la proteína y la historia evolutiva determinan la topología del espacio de secuencia" . Investigación del genoma . 15 (3): 385–92. arXiv : q-bio / 0404040 . doi : 10.1101 / gr.3133605 . PMC 551565 . PMID 15741509 .
- ^ Ranea JA, Sillero A, Thornton JM, Orengo CA (octubre de 2006). "Evolución de la superfamilia de proteínas y el último ancestro común universal (LUCA)". Revista de evolución molecular . 63 (4): 513-25. Código bibliográfico : 2006JMolE..63..513R . doi : 10.1007 / s00239-005-0289-7 . hdl : 10261/78338 . PMID 17021929 . S2CID 25258028 .
- ^ Carr PD, Ollis DL (2009). "Pliegue de hidrolasa alfa / beta: una actualización". Letras de proteínas y péptidos . 16 (10): 1137–48. doi : 10.2174 / 092986609789071298 . PMID 19508187 .
- ^ Nardini M, Dijkstra BW (diciembre de 1999). "Enzimas de pliegue alfa / beta hidrolasa: la familia sigue creciendo". Opinión actual en biología estructural . 9 (6): 732–7. doi : 10.1016 / S0959-440X (99) 00037-8 . PMID 10607665 .
- ^ "SCOP" . Archivado desde el original el 29 de julio de 2014 . Consultado el 28 de mayo de 2014 .
- ^ Mohamed MF, Hollfelder F (enero de 2013). "Promiscuidad catalítica transversal, eficiente entre enzimas que catalizan la transferencia de fosforilo". Biochimica et Biophysica Acta (BBA) - Proteínas y proteómica . 1834 (1): 417–24. doi : 10.1016 / j.bbapap.2012.07.015 . PMID 22885024 .
- ^ Branden C, Tooze J (1999). Introducción a la estructura de las proteínas (2ª ed.). Nueva York: Garland Pub. ISBN 978-0815323051.
- ^ Bolognesi M, Onesti S, Gatti G, Coda A, Ascenzi P, Brunori M (febrero de 1989). "Mioglobina de Aplysia limacina. Análisis cristalográfico a una resolución de 1,6". Revista de Biología Molecular . 205 (3): 529–44. doi : 10.1016 / 0022-2836 (89) 90224-6 . PMID 2926816 .
- ^ Bork P, Holm L, Sander C (septiembre de 1994). "El pliegue de la inmunoglobulina. Clasificación estructural, patrones de secuencia y núcleo común". Revista de Biología Molecular . 242 (4): 309-20. doi : 10.1006 / jmbi.1994.1582 . PMID 7932691 .
- ^ Brümmendorf T, Rathjen FG (1995). "Moléculas de adhesión celular 1: superfamilia de inmunoglobulinas". Perfil de proteínas . 2 (9): 963-1108. PMID 8574878 .
- ^ Bazan JF, Fletterick RJ (noviembre de 1988). "Las proteasas de cisteína virales son homólogas a la familia de proteasas de serina de tipo tripsina: implicaciones estructurales y funcionales" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 85 (21): 7872–6. Código Bibliográfico : 1988PNAS ... 85.7872B . doi : 10.1073 / pnas.85.21.7872 . PMC 282299 . PMID 3186696 .
- ^ Vetter IR, Wittinghofer A (noviembre de 2001). "El interruptor de unión de nucleótidos de guanina en tres dimensiones". Ciencia . 294 (5545): 1299–304. Código Bibliográfico : 2001Sci ... 294.1299V . doi : 10.1126 / science.1062023 . PMID 11701921 . S2CID 6636339 .
- ^ Nagano N, Orengo CA, Thornton JM (agosto de 2002). "Un pliegue con muchas funciones: las relaciones evolutivas entre familias de barriles TIM en función de sus secuencias, estructuras y funciones". Revista de Biología Molecular . 321 (5): 741–65. doi : 10.1016 / s0022-2836 (02) 00649-6 . PMID 12206759 .
- ^ Farber G (1993). "Un barril α / β lleno de problemas evolutivos". Opinión actual en biología estructural . 3 (3): 409–412. doi : 10.1016 / S0959-440X (05) 80114-9 .
enlaces externos
- Medios relacionados con las superfamilias de proteínas en Wikimedia Commons