Un gen superpuesto (o OLG ) [1] es un gen cuya secuencia de nucleótidos expresable se superpone parcialmente con la secuencia de nucleótidos expresable de otro gen. [2] De esta manera, una secuencia de nucleótidos puede contribuir a la función de uno o más productos génicos . La sobreimpresión se refiere a un tipo de superposición en la que toda o parte de la secuencia de un gen se lee en un marco de lectura alternativo de otro gen en el mismo locus . Se ha planteado la hipótesis de que la sobreimpresión es un mecanismo para la aparición de novo de nuevos genesa partir de secuencias existentes, genes más antiguos o regiones del genoma que no codificaban previamente . [3] Los genes sobreimpresos son características particularmente comunes de la organización genómica de los virus, y es probable que aumenten en gran medida el número de genes expresables potenciales a partir de un pequeño conjunto de información genética viral. [4]
Clasificación
Los genes pueden superponerse de diversas formas y pueden clasificarse por sus posiciones entre sí. [2] [6] [7] [8] [9]
- Superposición unidireccional o en tándem : el extremo 3 ' de un gen se superpone con el extremo 5' de otro gen en la misma hebra. Esta disposición se puede simbolizar con la notación → → donde las flechas indican el marco de lectura de principio a fin.
- Superposición convergente o de extremo a extremo : los extremos 3 ' de los dos genes se superponen en hebras opuestas. Esto se puede escribir como → ←.
- Superposición divergente o en cola : los extremos 5 ' de los dos genes se superponen en hebras opuestas. Esto se puede escribir como ← →.
Los genes superpuestos también se pueden clasificar por fases , que describen sus marcos de lectura relativos : [2] [6] [7] [8] [9]
- La superposición en fase se produce cuando las secuencias compartidas utilizan el mismo marco de lectura. Esto también se conoce como "fase 0". Los genes unidireccionales con superposición de fase 0 no se consideran genes distintos, sino más bien como sitios de inicio alternativos del mismo gen.
- Las superposiciones fuera de fase se producen cuando las secuencias compartidas utilizan diferentes marcos de lectura. Esto puede ocurrir en la "fase 1" o en la "fase 2", dependiendo de si los marcos de lectura están compensados por 1 o 2 nucleótidos. Debido a que un codón tiene una longitud de tres nucleótidos, un desplazamiento de tres nucleótidos es un marco de fase 0 en fase.
Evolución
Los genes superpuestos son particularmente comunes en genomas de rápida evolución, como los de virus , bacterias y mitocondrias . Pueden originarse de tres formas: [10]
- Por extensión de un marco de lectura abierto (ORF) existente corriente abajo en un gen contiguo debido a la pérdida de un codón de parada ;
- Por extensión de un ORF existente corriente arriba en un gen contiguo debido a la pérdida de un codón de iniciación ;
- Por generación de un ORF nuevo dentro de uno existente debido a una mutación puntual .
El uso de la misma secuencia de nucleótidos para codificar múltiples genes puede proporcionar una ventaja evolutiva debido a la reducción del tamaño del genoma y debido a la oportunidad de co-regulación transcripcional y traduccional de los genes superpuestos. [7] [11] [12] [13] Las superposiciones de genes introducen nuevas limitaciones evolutivas en las secuencias de las regiones de superposición. [9] [14]
Orígenes de nuevos genes
En 1977, Pierre-Paul Grassé propuso que uno de los genes del par podría haberse originado de novo por mutaciones para introducir ORF novedosos en marcos de lectura alternativos; describió el mecanismo como sobreimpresión . [15] : 231 Más tarde fue corroborado por Susumu Ohno , quien identificó un gen candidato que pudo haber surgido por este mecanismo. [16] Algunos genes de novo que se originan de esta manera pueden no permanecer superpuestos, sino subfuncionalizar después de la duplicación de genes , [3] contribuyendo a la prevalencia de genes huérfanos . Qué miembro de un par de genes superpuestos es más joven puede identificarse bioinformáticamente mediante una distribución filogenética más restringida o mediante un uso de codones menos optimizado . [4] [17] [18] Los miembros más jóvenes de la pareja tienden a tener un mayor desorden estructural intrínseco que los miembros mayores, pero los miembros mayores también están más desordenados que otras proteínas, presumiblemente como una forma de aliviar las mayores limitaciones evolutivas planteadas por la superposición . [17] Es más probable que las superposiciones se originen en proteínas que ya tienen un alto desorden. [17]
Distribución taxonómica
Los genes superpuestos ocurren en todos los dominios de la vida , aunque con frecuencias variables. Son especialmente comunes en los genomas virales .
Virus
La existencia de genes superpuestos se identificó por primera vez en los virus; el primer genoma de ADN secuenciado, del bacteriófago ΦX174 , contenía varios ejemplos. [19] Otro ejemplo es el gen ORF3d en el virus SARS-CoV 2 . [1] [21] Los genes superpuestos son particularmente comunes en los genomas virales . [4] Algunos estudios atribuyen esta observación a la presión selectiva hacia los tamaños pequeños del genoma mediada por las limitaciones físicas de empaquetar el genoma en una cápside viral , particularmente una de geometría icosaédrica . [22] Sin embargo, otros estudios disputan esta conclusión y argumentan que la distribución de superposiciones en genomas virales es más probable que refleje la sobreimpresión como el origen evolutivo de genes virales superpuestos. [23] La sobreimpresión es una fuente común de genes de novo en los virus. [18]
Los estudios de genes virales sobreimpresos sugieren que sus productos proteicos tienden a ser proteínas accesorias que no son esenciales para la proliferación viral, pero contribuyen a la patogenicidad . Las proteínas sobreimpresas a menudo tienen distribuciones de aminoácidos inusuales y altos niveles de trastorno intrínseco . [24] En algunos casos, las proteínas sobreimpresas tienen estructuras tridimensionales bien definidas, pero novedosas; [25] un ejemplo es el supresor de silenciamiento de ARN p19 que se encuentra en Tombusvirus , que tiene un nuevo pliegue de proteína y un nuevo modo de unión en el reconocimiento de ARNip . [18] [20] [26]
Procariotas
Las estimaciones de la superposición de genes en los genomas bacterianos generalmente encuentran que alrededor de un tercio de los genes bacterianos se superponen, aunque generalmente solo por unos pocos pares de bases. [7] [27] [28] La mayoría de los estudios de superposición en genomas bacterianos encuentran evidencia de que la superposición cumple una función en la regulación de genes , permitiendo que los genes superpuestos sean corregulados transcripcional y traduccionalmente . [7] [13] En los genomas procarióticos, las superposiciones unidireccionales son las más comunes, posiblemente debido a la tendencia de los genes procarióticos adyacentes a compartir la orientación. [7] [9] [6] Entre las superposiciones unidireccionales, las superposiciones largas se leen más comúnmente con un desplazamiento de un nucleótido en el marco de lectura (es decir, la fase 1) y las superposiciones cortas se leen con más frecuencia en la fase 2. [28] [29 ] Las superposiciones largas de más de 60 pares de bases son más comunes para los genes convergentes; sin embargo, las supuestas superposiciones largas tienen tasas muy altas de anotación errónea . [30] Son raros los ejemplos sólidamente validados de superposiciones prolongadas en genomas bacterianos; en el organismo modelo bien estudiado Escherichia coli , solo cuatro pares de genes están bien validados por tener superposiciones largas y sobreimpresas. [31]
Eucariotas
En comparación con los genomas procariotas, los genomas eucariotas suelen estar mal anotados y, por lo tanto, identificar superposiciones genuinas es relativamente difícil. [18] Sin embargo, se han documentado ejemplos de superposiciones de genes validados en una variedad de organismos eucariotas, incluidos mamíferos como ratones y humanos. [32] [33] [34] [35] Los eucariotas se diferencian de los procariotas en la distribución de los tipos de superposición: mientras que las superposiciones unidireccionales (es decir, de la misma hebra) son más comunes en procariotas, las superposiciones de hebras opuestas o antiparalelas son más comunes en eucariotas. Entre las superposiciones de hebras opuestas, la orientación convergente es la más común. [33] La mayoría de los estudios de superposición de genes eucariotas han encontrado que los genes superpuestos están ampliamente sujetos a reorganización genómica incluso en especies estrechamente relacionadas y, por lo tanto, la presencia de una superposición no siempre se conserva bien. [34] [36] La superposición con genes más antiguos o menos taxonómicamente restringidos es también una característica común de los genes que probablemente se hayan originado de novo en un linaje eucariota dado. [34] [37] [38]
Función
Las funciones precisas de los genes superpuestos parecen variar a lo largo de los dominios de la vida, pero varios experimentos han demostrado que son importantes para los ciclos de vida del virus a través de la expresión de proteínas y la estequiometría adecuadas [39] , además de desempeñar un papel en el plegamiento de proteínas adecuado. [40] También se creó una versión del bacteriófago ΦX174 en la que se eliminaron todas las superposiciones de genes [41], lo que demuestra que no eran necesarios para la replicación.
Referencias
- ^ a b Nelson, Chase W; et al. (1 de octubre de 2020). "Gen superpuesto novedoso en evolución dinámica como un factor en la pandemia de SARS-CoV-2" . eLife . 9 . doi : 10.7554 / eLife.59633 . PMC 7655111 . PMID 33001029 . Consultado el 11 de noviembre de 2020 .
- ^ a b c Y. Fukuda, M. Tomita y T. Washio (1999). "Estudio comparativo de genes superpuestos en los genomas de Mycoplasma genitalium y Mycoplasma pneumoniae " . Ácidos nucleicos Res . 27 (8): 1847–1853. doi : 10.1093 / nar / 27.8.1847 . PMC 148392 . PMID 10101192 .
- ^ a b Keese, PK; Gibbs, A (15 de octubre de 1992). "Orígenes de los genes: ¿" big bang "o creación continua?" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 89 (20): 9489–93. Código Bibliográfico : 1992PNAS ... 89.9489K . doi : 10.1073 / pnas.89.20.9489 . PMC 50157 . PMID 1329098 .
- ^ a b c d Pavesi, Angelo; Magiorkinis, Gkikas; Karlin, David G .; Wilke, Claus O. (15 de agosto de 2013). "Las proteínas virales originadas de novo por sobreimpresión pueden identificarse mediante el uso de codones: aplicación al" vivero de genes "de los deltaretrovirus" . PLOS Biología Computacional . 9 (8): e1003162. doi : 10.1371 / journal.pcbi.1003162 . PMC 3744397 . PMID 23966842 .
- ^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG (abril de 1981). "Secuencia y organización del genoma mitocondrial humano". Naturaleza . 290 (5806): 457–465. Código Bibliográfico : 1981Natur.290..457A . doi : 10.1038 / 290457a0 . PMID 7219534 . S2CID 4355527 .
- ^ a b c Fukuda, Yoko; Nakayama, Yoichi; Tomita, Masaru (diciembre de 2003). "Sobre la dinámica de genes superpuestos en genomas bacterianos". Gene . 323 : 181-187. doi : 10.1016 / j.gene.2003.09.021 . PMID 14659892 .
- ^ a b c d e f Johnson Z, Chisholm S (2004). "Las propiedades de los genes superpuestos se conservan en los genomas microbianos" . Genome Res . 14 (11): 2268–72. doi : 10.1101 / gr.2433104 . PMC 525685 . PMID 15520290 .
- ^ a b Normark S .; Bergstrom S .; Edlund T .; Grundstrom T .; Jaurin B .; Lindberg FP; Olsson O. (1983). "Genes superpuestos". Revisión anual de genética . 17 : 499–525. doi : 10.1146 / annurev.ge.17.120183.002435 . PMID 6198955 .
- ^ a b c d Rogozin, Igor B .; Spiridonov, Alexey N .; Sorokin, Alexander V .; Wolf, Yuri I .; Jordan, I. King; Tatusov, Roman L .; Koonin, Eugene V. (mayo de 2002). "Selección purificante y direccional en genes procarióticos superpuestos". Tendencias en Genética . 18 (5): 228–232. doi : 10.1016 / S0168-9525 (02) 02649-5 . PMID 12047938 .
- ^ Krakauer, David C. (junio de 2000). "Estabilidad y evolución de genes superpuestos" . Evolución . 54 (3): 731–739. doi : 10.1111 / j.0014-3820.2000.tb00075.x . PMID 10937248 . S2CID 8818055 .
- ^ Delaye, Luis; DeLuna, Alexander; Lazcano, Antonio; Becerra, Arturo (2008). "El origen de un gen novedoso a través de la sobreimpresión en Escherichia coli" . Biología Evolutiva BMC . 8 (1): 31. doi : 10.1186 / 1471-2148-8-31 . PMC 2268670 . PMID 18226237 .
- ^ Saha, Deeya; Podder, Soumita; Panda, Arup; Ghosh, Tapash Chandra (mayo de 2016). "Superposición de genes: un correlato genómico significativo de las tasas de crecimiento procariótico". Gene . 582 (2): 143-147. doi : 10.1016 / j.gene.2016.02.002 . PMID 26853049 .
- ^ a b Luo, Yingqin; Battistuzzi, Fabia; Lin, Kui; Gibas, Cynthia (29 de noviembre de 2013). "Dinámica evolutiva de genes superpuestos en Salmonella" . PLOS ONE . 8 (11): e81016. doi : 10.1371 / journal.pone.0081016 . PMC 3843671 . PMID 24312259 .
- ^ Wei, X .; Zhang, J. (31 de diciembre de 2014). "Un método simple para estimar la fuerza de la selección natural en genes superpuestos" . Biología y evolución del genoma . 7 (1): 381–390. doi : 10.1093 / gbe / evu294 . PMC 4316641 . PMID 25552532 .
- ^ Grassé, Pierre-Paul (1977). Evolución de los organismos vivos: evidencia de una nueva teoría de la transformación . Prensa académica. ISBN 9781483274096.
- ^ Ohno, S (abril de 1984). "Nacimiento de una enzima única a partir de un marco de lectura alternativo de la secuencia de codificación repetitiva internamente preexistente" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (8): 2421–5. Código Bib : 1984PNAS ... 81.2421O . doi : 10.1073 / pnas.81.8.2421 . PMC 345072 . PMID 6585807 .
- ^ a b c Willis, Sara; Masel, Joanna (19 de julio de 2018). "El nacimiento de genes contribuye al trastorno estructural codificado por genes superpuestos" . Genética . 210 (1): 303–313. doi : 10.1534 / genetics.118.301249 . PMC 6116962 . PMID 30026186 .
- ^ a b c d Sabath, N .; Wagner, A .; Karlin, D. (19 de julio de 2012). "Evolución de proteínas virales originadas de novo por sobreimpresión" . Biología Molecular y Evolución . 29 (12): 3767–3780. doi : 10.1093 / molbev / mss179 . PMC 3494269 . PMID 22821011 .
- ^ a b Sanger, F .; Aire, GM; Barrell, BG; Brown, NL; Coulson, AR; Fiddes, JC; Hutchison, CA; Slocombe, PM; Smith, M. (1977). "Secuencia de nucleótidos del ADN del bacteriófago ΦX174". Naturaleza . 265 (5596): 687–95. Código Bibliográfico : 1977Natur.265..687S . doi : 10.1038 / 265687a0 . PMID 870828 . S2CID 4206886 .
- ^ a b Ye, Keqiong; Malinina, Lucy; Patel, Dinshaw J. (3 de diciembre de 2003). "Reconocimiento de ARN interferente pequeño por un supresor viral de silenciamiento de ARN" . Naturaleza . 426 (6968): 874–878. Código bibliográfico : 2003Natur.426..874Y . doi : 10.1038 / nature02213 . PMC 4694583 . PMID 14661029 .
- ^ Dockrill, Peter (11 de noviembre de 2020). "Los científicos acaban de encontrar un 'gen misteriosamente oculto dentro de un gen' en el SARS-CoV-2" . ScienceAlert . Consultado el 11 de noviembre de 2020 .
- ^ Chirico, N .; Vianelli, A .; Belshaw, R. (7 de julio de 2010). "Por qué los genes se superponen en los virus" . Actas de la Royal Society B: Ciencias Biológicas . 277 (1701): 3809–3817. doi : 10.1098 / rspb.2010.1052 . PMC 2992710 . PMID 20610432 .
- ^ Brandes, Nadav; Linial, Michal (21 de mayo de 2016). "Superposición de genes y limitaciones de tamaño en el mundo viral" . Biology Direct . 11 (1): 26. doi : 10.1186 / s13062-016-0128-3 . PMC 4875738 . PMID 27209091 .
- ^ Rancurel, C .; Khosravi, M .; Dunker, AK; Romero, PR; Karlin, D. (29 de julio de 2009). "Los genes superpuestos producen proteínas con propiedades de secuencia inusuales y ofrecen información sobre la creación de proteínas de Novo" . Revista de Virología . 83 (20): 10719–10736. doi : 10.1128 / JVI.00595-09 . PMC 2753099 . PMID 19640978 .
- ^ Abroi, Aare (1 de diciembre de 2015). "Una vista basada en el dominio de proteínas de la relación virosfera-anfitrión". Biochimie . 119 : 231–243. doi : 10.1016 / j.biochi.2015.08.008 . PMID 26296474 .
- ^ Vargason, Jeffrey M; Szittya, György; Burgyán, József; Hall, Traci M. Tanaka (diciembre de 2003). "Reconocimiento selectivo de tamaño de ARNip por un supresor silenciador de ARN" . Celular . 115 (7): 799–811. doi : 10.1016 / S0092-8674 (03) 00984-X . PMID 14697199 . S2CID 12993441 .
- ^ Huvet, Maxime; Stumpf, Michael PH (1 de enero de 2014). "Superposición de genes: una ventana a la evolución genética" . BMC Genomics . 15 (1): 721. doi : 10.1186 / 1471-2164-15-721 . ISSN 1471-2164 . PMC 4161906 . PMID 25159814 .
- ^ a b Gallo, Peter JA; Whitworth, David E. (19 de marzo de 2007). "Evolución de superposiciones de genes: sesgo de marco de lectura relativo en genes de sistema de dos componentes procarióticos". Revista de evolución molecular . 64 (4): 457–462. doi : 10.1007 / s00239-006-0180-1 . PMID 17479344 . S2CID 21612308 .
- ^ Fonseca, MM; Harris, DJ; Posada, D. (5 de noviembre de 2013). "Distribución de origen y longitud de genes superpuestos procarióticos unidireccionales" . G3: Genes, Genomas, Genética . 4 (1): 19-27. doi : 10.1534 / g3.113.005652 . PMC 3887535 . PMID 24192837 .
- ^ Pallejà, Albert; Harrington, Eoghan D; Bork, Peer (2008). "Grandes superposiciones de genes en genomas procarióticos: ¿resultado de limitaciones funcionales o predicciones erróneas?" . BMC Genomics . 9 (1): 335. doi : 10.1186 / 1471-2164-9-335 . PMC 2478687 . PMID 18627618 .
- ^ Fellner, Lea; Simon, Svenja; Scherling, Christian; Witting, Michael; Schober, Steffen; Polte, Christine; Schmitt-Kopplin, Philippe; Keim, Daniel A .; Scherer, Siegfried; Neuhaus, Klaus (18 de diciembre de 2015). "Evidencia del origen reciente de un gen huérfano superpuesto que codifica una proteína bacteriana por sobreimpresión evolutiva" . Biología Evolutiva BMC . 15 (1): 283. doi : 10.1186 / s12862-015-0558-z . PMC 4683798 . PMID 26677845 .
- ^ McLysaght, Aoife; Guerzoni, Daniele (31 de agosto de 2015). "Nuevos genes de secuencia no codificante: el papel de genes codificadores de proteínas de novo en la innovación evolutiva eucariota" . Transacciones filosóficas de la Royal Society B: Ciencias biológicas . 370 (1678): 20140332. doi : 10.1098 / rstb.2014.0332 . PMC 4571571 . PMID 26323763 .
- ^ a b C. Sanna, W. Li y L. Zhang (2008). "Superposición de genes en los genomas humanos y de ratón" . BMC Genomics . 9 (169): 169. doi : 10.1186 / 1471-2164-9-169 . PMC 2335118 . PMID 18410680 .
- ^ a b c Makałowska, Izabela; Lin, Chiao-Feng; Hernández, Krisitina (2007). "Nacimiento y muerte de superposiciones de genes en vertebrados" . Biología Evolutiva BMC . 7 (1): 193. doi : 10.1186 / 1471-2148-7-193 . PMC 2151771 . PMID 17939861 .
- ^ Veeramachaneni, V. (1 de febrero de 2004). "Genes superpuestos de mamíferos: la perspectiva comparativa" . Investigación del genoma . 14 (2): 280–286. doi : 10.1101 / gr.1590904 . PMC 327103 . PMID 14762064 .
- ^ Behura, Susanta K; Severson, David W (2013). "Superposición de genes de Aedes aegypti: implicaciones evolutivas de la comparación con ortólogos de Anopheles gambiae y otros insectos" . Biología Evolutiva BMC . 13 (1): 124. doi : 10.1186 / 1471-2148-13-124 . PMC 3689595 . PMID 23777277 .
- ^ Murphy, Daniel N .; McLysaght, Aoife; Carmel, Liran (21 de noviembre de 2012). "Origen de novo de genes codificadores de proteínas en roedores murinos" . PLOS ONE . 7 (11): e48650. Código bibliográfico : 2012PLoSO ... 748650M . doi : 10.1371 / journal.pone.0048650 . PMC 3504067 . PMID 23185269 .
- ^ Knowles, DG; McLysaght, A. (2 de septiembre de 2009). "Origen de novo reciente de genes codificadores de proteínas humanas" . Investigación del genoma . 19 (10): 1752-1759. doi : 10.1101 / gr.095026.109 . PMC 2765279 . PMID 19726446 .
- ^ Wright, Bradley W .; Ruan, Juanfang; Molloy, Mark P .; Jaschke, Paul R. (20 de noviembre de 2020). "La modularización del genoma revela que la topología de genes superpuestos es necesaria para una reproducción viral eficiente" . Biología sintética ACS . 9 (11): 3079-3090. doi : 10.1021 / acssynbio.0c00323 . ISSN 2161-5063 . PMID 33044064 .
- ^ Pradhan, Prajakta; Li, Wen; Kaur, Parjit (enero de 2009). "El acoplamiento traslacional controla la expresión y función de la bomba de eflujo de fármaco DrrAB" . Revista de Biología Molecular . 385 (3): 831–842. doi : 10.1016 / j.jmb.2008.11.027 . PMID 19063901 .
- ^ Jaschke, Paul R .; Lieberman, Erica K .; Rodríguez, Jon; Sierra, Adrian; Endy, Drew (diciembre de 2012). "Un genoma del bacteriófago sintético øX174 completamente descomprimido ensamblado y archivado en levadura" . Virología . 434 (2): 278–284. doi : 10.1016 / j.virol.2012.09.020 . ISSN 0042-6822 . PMID 23079106 .