El nacimiento de genes de novo es el proceso mediante el cual nuevos genes evolucionan a partir de secuencias de ADN que eran ancestralmente no génicas . [3] Los genes de novo representan un subconjunto de genes nuevos y pueden codificar proteínas o actuar como genes de ARN. [4] Los procesos que gobiernan elnacimiento de genes de novo no se comprenden bien, aunque existen varios modelos que describen los posibles mecanismos por los cualespuede ocurrir el nacimiento de genes de novo .
Aunque el nacimiento de genes de novo puede haber ocurrido en cualquier momento de la historia evolutiva de un organismo, los eventos de nacimiento de genes de novo antiguos son difíciles de detectar. La mayoría de los estudios de genes de novo hasta la fecha se han centrado, por tanto, en genes jóvenes, normalmente genes restringidos taxonómicamente (TRG) que están presentes en una única especie o linaje, incluidos los denominados genes huérfanos , definidos como genes que carecen de un homólogo identificable. Sin embargo, es importante señalar que no todos los genes huérfanos surgen de novo , sino que pueden surgir a través de mecanismos bastante bien caracterizados, como la duplicación de genes (incluida la retroposición) o la transferencia horizontal de genes seguida de divergencia de secuencia o por fisión / fusión de genes . [5] [6]
Aunque el nacimiento de un gen de novo alguna vez fue visto como una ocurrencia altamente improbable, [7] ahora se han descrito varios ejemplos inequívocos, [8] y algunos investigadores especulan que el nacimiento de un gen de novo podría jugar un papel importante en la innovación evolutiva. [9] [10]
Historia
Ya en la década de 1930, JBS Haldane y otros sugirieron que las copias de genes existentes pueden conducir a nuevos genes con funciones novedosas. [6] En 1970, Susumu Ohno publicó el texto fundamental Evolution by Gene Duplication . [11] Durante algún tiempo posteriormente, la opinión de consenso fue que prácticamente todos los genes se derivaban de genes ancestrales, [12] y François Jacob comentó en un ensayo de 1977 que "la probabilidad de que una proteína funcional apareciera de novo por asociación aleatoria de aminoácidos es prácticamente cero ". [7]
En el mismo año, sin embargo, Pierre-Paul Grassé acuñó el término "sobreimpresión" para describir la aparición de genes a través de la expresión de marcos de lectura abiertos alternativos (ORF) que se superponen a genes preexistentes. [13] Estos nuevos ORF pueden estar fuera de marco o antisentido con el gen preexistente. También pueden estar en el marco del ORF existente, creando una versión truncada del gen original, o representar extensiones 3 'de un ORF existente en un ORF cercano. Los dos primeros tipos de sobreimpresión pueden considerarse como un subtipo particular de nacimiento de un gen de novo ; aunque se solapa con una región codificante del genoma, la secuencia de aminoácidos primaria de la nueva proteína es completamente nueva y deriva de un marco que no contenía previamente un gen. Los primeros ejemplos de este fenómeno en bacteriófagos se informaron en una serie de estudios de 1976 a 1978, [14] [15] [16] y desde entonces se han identificado muchos otros ejemplos en virus, bacterias y varias especies eucariotas. [17] [18] [19] [20] [21] [22]
El fenómeno de exonización también representa un caso especial de nacimiento de genes de novo , en el que, por ejemplo, secuencias intrónicas a menudo repetitivas adquieren sitios de empalme a través de mutaciones, lo que conduce a exones de novo . Esto se describió por primera vez en 1994 en el contexto de las secuencias de Alu que se encuentran en las regiones codificantes de los ARNm de primates. [23] Curiosamente, estos exones de novo se encuentran con frecuencia en variantes de empalme menores, lo que puede permitir la "prueba" evolutiva de secuencias novedosas mientras se conserva la funcionalidad de las variantes de empalme principales. [24]
Aún así, algunos pensaban que la mayoría o todas las proteínas eucariotas se construían a partir de un conjunto limitado de exones de "tipo iniciador". [25] Utilizando los datos de secuencia disponibles en ese momento, una revisión de 1991 estimó que el número de exones eucariotas ancestrales únicos era <60.000, [25] mientras que en 1992 se publicó un artículo en el que se estimaba que la gran mayoría de las proteínas no pertenecían a más de 1,000 familias. [26] Aproximadamente al mismo tiempo, sin embargo, se liberó la secuencia del cromosoma III de la levadura en ciernes Saccharomyces cerevisiae , [27] lo que representa la primera vez que se ha secuenciado un cromosoma completo de cualquier organismo eucariota. La secuenciación de todo el genoma nuclear de la levadura se completó a principios de 1996 a través de un esfuerzo internacional masivo de colaboración. [28] En su revisión del proyecto del genoma de levadura, Bernard Dujon señaló que la abundancia inesperada de genes que carecen de homólogos conocidos fue quizás el hallazgo más sorprendente de todo el proyecto. [28]
En 2006 y 2007, una serie de estudios proporcionaron posiblemente los primeros ejemplos documentados de nacimiento de genes de novo que no implicaron sobreimpresión. [29] [30] [31] Estos estudios se realizaron utilizando los transcriptomas de glándulas accesorias de Drosophila yakuba y Drosophila erecta e identificaron 20 genes putativos de linaje restringido que parecía poco probable que fueran el resultado de la duplicación de genes. [31] Levine y sus colegas identificaron y confirmaron cinco genes candidatos de novo específicos de Drosophila melanogaster y / o Drosophila simulans estrechamente relacionados mediante un enfoque riguroso que combinaba técnicas bioinformáticas y experimentales. [30]
Desde estos estudios iniciales, muchos grupos han identificado casos específicos de eventos de nacimiento de genes de novo en diversos organismos. [32] El primer gen de novo identificado en levadura, el gen BSC4 , se identificó en S. cerevisiae en 2008. Este gen muestra evidencia de selección purificadora, se expresa tanto a nivel de ARNm como de proteína, y cuando se elimina es sintéticamente letal con otros dos genes de levadura, todos los cuales indican un papel funcional para el producto del gen BSC4 . [33] Históricamente, un argumento en contra de la noción de nacimiento de genes de novo generalizado es la complejidad evolucionada del plegamiento de proteínas. Curiosamente, se demostró más tarde que Bsc4 adopta un estado parcialmente plegado que combina las propiedades del plegamiento de proteínas nativas y no nativas. [34] En las plantas, el primer gen de novo que se caracterizó funcionalmente fue QQS , un gen de Arabidopsis thaliana identificado en 2009 que regula el metabolismo del carbono y el nitrógeno. [35] El primer gen de novo funcionalmente caracterizado identificado en ratones, un gen de ARN no codificante, también se describió en 2009. [36] En primates, un análisis informático de 2008 estimó que se habían formado de novo 15/270 genes huérfanos de primates . [37] Un informe de 2009 identificó los primeros tres genes humanos de novo , uno de los cuales es un objetivo terapéutico en la leucemia linfocítica crónica. [38] Desde entonces, una plétora de estudios a nivel del genoma han identificado un gran número de genes huérfanos en muchos organismos, aunque el grado en el que surgieron de novo y el grado en que pueden considerarse funcionales siguen siendo objeto de debate.
Identificación
Identificación de secuencias emergentes de novo
Hay dos enfoques principales para la identificación sistemática de genes nuevos: la filoestratigrafía genómica [39] y los métodos basados en sintenia . [40] Ambos enfoques se utilizan ampliamente, de forma individual o complementaria.
Filoestratigrafía genómica
La filoestratigrafía genómica implica examinar cada gen en una especie focal o de referencia e inferir la presencia o ausencia de homólogos ancestrales mediante el uso de algoritmos de alineación de secuencias BLAST [41] o herramientas relacionadas. A cada gen en la especie focal se le puede asignar una edad (también conocida como "nivel de conservación" o "phylostratum genómico") que se basa en una filogenia predeterminada, con la edad correspondiente a la especie relacionada más lejana en la que se detecta un homólogo. [39] Cuando un gen carece de cualquier homólogo detectable fuera de su propio genoma, o parientes cercanos, se dice que es un gen nuevo, taxonómicamente restringido o huérfano.
La filoestratigrafía está limitada por el conjunto de genomas estrechamente relacionados que están disponibles y los resultados dependen de los criterios de búsqueda BLAST. [42] Además, a menudo es difícil determinar, basándose en la falta de similitud de secuencia observada, si un nuevo gen ha surgido de novo o se ha desviado de un gen ancestral más allá del reconocimiento, por ejemplo, tras un evento de duplicación. Esto fue señalado por un estudio que simuló la evolución de genes de igual edad y encontró que los ortólogos distantes pueden ser indetectables para genes que evolucionan rápidamente. [43] Por otro lado, al tener en cuenta los cambios en la tasa de evolución en regiones jóvenes de genes, un enfoque filoestratigráfico fue más preciso para asignar edades de genes en datos simulados. [44] Estudios posteriores que utilizaron la evolución simulada encontraron que la filoestratigrafía no pudo detectar un ortólogo en las especies más lejanas para el 13,9% de los genes de D. melanogaster y el 11,4% de los genes de S. cerevisiae . [45] [46] Sin embargo, un nuevo análisis de estudios que utilizaron filoestratigrafía en levaduras, moscas de la fruta y humanos encontró que incluso cuando se tienen en cuenta tales tasas de error y se excluyen genes difíciles de estratificar de los análisis, las conclusiones cualitativas no se vieron afectadas. [47] El impacto del sesgo filoestratigráfico en los estudios que examinan varias características de genes de novo sigue siendo objeto de debate.
Enfoques basados en Synteny
Los enfoques basados en Synteny utilizan el orden y el posicionamiento relativo de los genes (u otras características) para identificar los antepasados potenciales de los genes candidatos de novo . [10] [42] Las alineaciones sinténicas están ancladas por "marcadores" conservados. Los genes son el marcador más común en la definición de bloques sinténicos, aunque también se utilizan k-mers y exones. [48] [40] La confirmación de que la región sinténica carece de potencial de codificación en especies exóticas permite afirmar un origen de novo con mayor confianza. [42] La evidencia más fuerte posible para la emergencia de novo es la inferencia de la mutación o mutaciones "habilitadoras" específicas que crearon el potencial de codificación, típicamente a través del análisis de regiones de secuencia más pequeñas, denominadas regiones microsinténicas, de especies estrechamente relacionadas.
Un desafío en la aplicación de métodos basados en synteny es que puede ser difícil de detectar en escalas de tiempo más largas. Para abordar esto, se han creado varias técnicas de optimización, como el uso de exones agrupados independientemente de su orden específico para definir bloques sinténicos [40] o algoritmos que usan regiones genómicas bien conservadas para expandir bloques microsinténicos. [49] También existen dificultades asociadas con la aplicación de enfoques basados en sintenia a los ensamblajes del genoma que están fragmentados [50] o en linajes con altas tasas de reordenamientos cromosómicos, como es común en los insectos. [51] Los enfoques basados en Synteny se pueden aplicar a estudios de genoma completo de genes de novo [37] [38] [52] [53] [54] [55] [56] [57] y representan un área prometedora de algoritmos desarrollo para la datación del nacimiento de genes. Algunos han utilizado enfoques basados en sintenia en combinación con búsquedas de similitud en un intento de desarrollar tuberías estandarizadas y estrictas [58] que se pueden aplicar a cualquier grupo de genomas en un intento de abordar las discrepancias en las diversas listas de genes de novo que se han generado.
Determinación de estatus
Incluso cuando se ha establecido el origen evolutivo de una secuencia de codificación particular, todavía existe una falta de consenso sobre lo que constituye un evento genuino de nacimiento de un gen de novo . Una razón de esto es la falta de acuerdo sobre si la totalidad de la secuencia debe ser de origen no génico o no. Para genes de novo que codifican proteínas, se ha propuesto que los genes de novo se dividan en subtipos en función de la proporción del ORF en cuestión que se deriva de una secuencia previamente no codificante. [42] Además, para que se produzca el nacimiento de un gen de novo , la secuencia en cuestión debe ser un gen que ha llevado a cuestionar qué constituye un gen, con algunos modelos que establecen una dicotomía estricta entre secuencias génicas y no génicas, y otros proponiendo un continuo más fluido. [59]
Todas las definiciones de genes están vinculadas a la noción de función, ya que generalmente se acepta que un gen genuino debe codificar un producto funcional, ya sea ARN o proteína. Sin embargo, existen diferentes puntos de vista sobre lo que constituye una función, dependiendo de si una secuencia determinada se evalúa utilizando enfoques genéticos, bioquímicos o evolutivos. [42] [60] [61] [62] La ambigüedad del concepto de "función" es especialmente problemática para el campo del nacimiento de genes de novo , donde los objetos de estudio a menudo evolucionan rápidamente. [62] Para abordar estos desafíos, el modelo de función de Pittsburgh deconstruye "función" en cinco significados para describir las diferentes propiedades que adquiere un locus que experimenta el nacimiento de un gen de novo : expresión, capacidades, interacciones, implicaciones fisiológicas e implicaciones evolutivas. [62]
En general, se acepta que un gen de novo genuino se expresa en al menos algún contexto, [5] permitiendo que la selección opere, y muchos estudios utilizan la evidencia de expresión como criterio de inclusión para definir genes de novo . La expresión de secuencias a nivel de ARNm puede confirmarse individualmente mediante técnicas como la PCR cuantitativa , o globalmente mediante secuenciación de ARN (RNA-seq) . De manera similar, la expresión a nivel de proteína se puede determinar con alta confianza para proteínas individuales usando técnicas como espectrometría de masas o transferencia de Western , mientras que el perfil de ribosoma (Ribo-seq) proporciona un estudio global de traducción en una muestra dada. Idealmente, para confirmar que un gen surgió de novo , también se demostraría una falta de expresión de la región sinténica de las especies exóticas. [63]
Los enfoques genéticos para detectar un fenotipo específico o un cambio en la aptitud tras la interrupción de una secuencia particular, son útiles para inferir la función. [61] También pueden emplearse otros enfoques experimentales, incluidos los exámenes de detección de interacciones proteína-proteína y / o genéticas, para confirmar un efecto biológico para un ORF de novo particular .
Pueden emplearse enfoques evolutivos para inferir la existencia de una función molecular a partir de firmas de selección derivadas computacionalmente. En el caso de los TRG, una firma común de selección es la proporción de sustituciones no sinónimas y sinónimas (proporción dN / dS ), calculada a partir de diferentes especies del mismo taxón. De manera similar, en el caso de genes específicos de especie, los datos de polimorfismo pueden usarse para calcular una relación pN / pS de diferentes cepas o poblaciones de la especie focal. Dado que los genes de novo jóvenes, específicos de la especie, carecen de conservación profunda por definición, la detección de desviaciones estadísticamente significativas de 1 puede ser difícil sin un número irrealmente grande de cepas / poblaciones secuenciadas. Un ejemplo de esto se puede ver en Mus musculus , donde tres genes de novo muy jóvenes carecen de firmas de selección a pesar de funciones fisiológicas bien demostradas. [64] Por esta razón, los enfoques pN / pS a menudo se aplican a grupos de genes candidatos, lo que permite a los investigadores inferir que al menos algunos de ellos se conservan evolutivamente, sin poder especificar cuál. En su lugar, se han empleado otras firmas de selección, como el grado de divergencia de nucleótidos dentro de las regiones sinténicas, la conservación de los límites de ORF o, para genes codificantes de proteínas, una puntuación de codificación basada en frecuencias de hexámeros de nucleótidos. [sesenta y cinco]
Predominio
Estimaciones de números
Las estimaciones de frecuencia y número de genes de novo en varios linajes varían ampliamente y dependen en gran medida de la metodología. Los estudios pueden identificar genes de novo mediante métodos basados en filoestratigrafía / BLAST únicamente, o pueden emplear una combinación de técnicas computacionales, y pueden o no evaluar la evidencia experimental de expresión y / o función biológica. [10] Además, los análisis a escala del genoma pueden considerar todos o la mayoría de los ORF del genoma, [59] o, en cambio, pueden limitar su análisis a genes previamente anotados.
El linaje de D. melanogaster es ilustrativo de estos enfoques diferentes. Una encuesta temprana que utilizó una combinación de búsquedas BLAST realizadas en secuencias de ADNc junto con búsquedas manuales e información de sintento identificó 72 nuevos genes específicos de D. melanogaster y 59 nuevos genes específicos de tres de las cuatro especies en el complejo de especies de D. melanogaster . Este informe encontró que solo 2/72 (~ 2,8%) de los nuevos genes específicos de D. melanogaster y 7/59 (~ 11,9%) de los nuevos genes específicos del complejo de especies se derivaron de novo , [56] y el resto surgió mediante duplicación / retroposición. De manera similar, un análisis de 195 genes jóvenes (<35 millones de años) de D. melanogaster identificados a partir de alineamientos sinténicos encontró que solo 16 habían surgido de novo . [54] Por el contrario, un análisis centrado en los datos transcriptómicos de los testículos de seis cepas de D. melanogaster identificó 106 genes de novo fijos y 142 segregantes . [55] Para muchos de estos, se identificaron ORF ancestrales pero no se expresaron. Destacando las diferencias entre las comparaciones entre especies e intraespecies, un estudio en poblaciones naturales de Saccharomyces paradoxus encontró que el número de polipéptidos de novo identificados se duplicó con creces al considerar la diversidad intraespecífica. [66] En primates, un estudio temprano identificó 270 genes huérfanos (exclusivos de humanos, chimpancés y macacos), de los cuales se pensaba que 15 se originaron de novo , [37] mientras que un informe posterior identificó 60 genes de novo solo en humanos que están respaldados por evidencia transcripcional y proteómica. [57] Los estudios en otros linajes / organismos también han llegado a diferentes conclusiones con respecto al número de genes de novo presentes en cada organismo, así como a los conjuntos específicos de genes identificados. En la siguiente tabla se describe una muestra de estos estudios a gran escala.
En términos generales, sigue siendo objeto de debate si la duplicación y la divergencia o el nacimiento de genes de novo representan el mecanismo dominante para la aparición de nuevos genes, [54] [56] [59] [67] [68] [69] en parte porque los genes de novo es probable que surjan y se pierdan con más frecuencia que otros genes jóvenes. En un estudio sobre el origen de genes huérfanos en 3 linajes eucariotas diferentes, los autores encontraron que, en promedio, solo alrededor del 30% de los genes huérfanos pueden explicarse por la divergencia de secuencia. [69]
Dinámica
Es importante distinguir entre la frecuencia de nacimiento de genes de novo y el número de genes de novo en un linaje determinado. Si el nacimiento de genes de novo es frecuente, podría esperarse que los genomas tiendan a aumentar su contenido genético con el tiempo; sin embargo, el contenido genético de los genomas suele ser relativamente estable. [10] Esto implica que un proceso frecuente de muerte genética debe equilibrar el nacimiento de genes de novo y, de hecho, los genes de novo se distinguen por su rápida renovación en relación con los genes establecidos. En apoyo de esta noción, es mucho más probable que se pierdan los genes de Drosophila surgidos recientemente , principalmente a través de la pseudogeneización , y los huérfanos más jóvenes se pierden con la tasa más alta; [70] Esto es a pesar del hecho de que se ha demostrado que algunos genes huérfanos de Drosophila se vuelven esenciales rápidamente. [54] Se observó una tendencia similar de pérdida frecuente entre familias de genes jóvenes en el género de nematodos Pristionchus . [71] De manera similar, un análisis de cinco transcriptomas de mamíferos encontró que la mayoría de los ORF en ratones eran muy viejos o específicos de la especie, lo que implica el nacimiento y muerte frecuentes de transcripciones de novo . [68] En las poblaciones silvestres de S. paradoxus , surgen ORF de novo y se pierden a tasas similares. [66] Sin embargo, sigue existiendo una correlación positiva entre el número de genes específicos de la especie en un genoma y la distancia evolutiva de su antepasado más reciente. [72] Además del nacimiento y muerte de genes de novo a nivel del ORF, los procesos mutacionales y de otro tipo también someten a los genomas a un constante "recambio transcripcional". Un estudio en murinos encontró que si bien todas las regiones del genoma ancestral se transcribieron en algún momento en al menos un descendiente, la porción del genoma bajo transcripción activa en una cepa o subespecie determinada está sujeta a cambios rápidos. [73] El recambio transcripcional de los genes de ARN no codificantes es particularmente rápido en comparación con los genes codificantes. [74]
Ejemplo de tabla de genes de novo
Organismo / Linaje | Gene | Evidencia de origen de novo | Evidencia de selección | Evidencia fenotípica | Año descubierto | Notas | Árbitro. |
---|---|---|---|---|---|---|---|
Arabidopsis thaliana | QQS | N / A | Exceso de almidón de hojas en derribos de ARNi | 2009 | [35] | ||
Drosophila | CG9284 | Alineamientos sinténicos de 12 especies de Drosophila | La caída del ARNi es letal | 2010 | [54] | ||
Drosophila | CG30395 | Alineamientos sinténicos de 12 especies de Drosophila | La caída del ARNi es letal | 2010 | [54] | ||
Drosophila | CG31882 | Alineamientos sinténicos de 12 especies de Drosophila | La caída del ARNi es letal | 2010 | [54] | ||
Drosophila | CG31406 | tBLASTn de regiones codificantes de proteínas para los 12 genomas de Drosophila y comparación de alineaciones BLASTZ | dN / dS <1 indica selección de purificación | La caída del ARNi inhibe la fertilidad | 2013 | [75] | |
Drosophila | CG32582 | tBLASTn de regiones codificantes de proteínas para los 12 genomas de Drosophila y comparación de alineaciones BLASTZ | Posible selección positiva pero no estadísticamente significativa | La caída del ARNi inhibe la fertilidad | 2013 | [75] | |
Drosophila | CG33235 | tBLASTn de regiones codificantes de proteínas para los 12 genomas de Drosophila y comparación de alineaciones BLASTZ | dN / dS <1 indica selección de purificación | La caída del ARNi inhibe la fertilidad | 2013 | [75] | |
Drosophila | CG34434 | tBLASTn de regiones codificantes de proteínas para los 12 genomas de Drosophila y comparación de alineaciones BLASTZ | dN / dS <1 indica selección de purificación | La caída del ARNi inhibe la fertilidad | 2013 | [75] | |
Gadidae | AFGP | Examen de la filogenia de Gadid | Gen multiplicado en especies de Gadid en hábitats más fríos, pero descompuesto en especies que no están bajo amenaza de congelación | Inhibir la formación de hielo. | La función es similar a la de otras proteínas anticongelantes que evolucionaron de forma independiente. | [76] [77] | |
Mus | Gm13030 | Enfoque combinado de filoestratigrafía y sintencia | ORF solo retenido en M. m. musculus y M. m. poblaciones castaneus ; sin evidencia de selección positiva | El mutante knockout tiene ciclos de embarazo irregulares | 2019 | [78] | |
Mus | Poldi | Región homóloga no expresada en especies estrechamente relacionadas y exóticas | Evidencia de barrido selectivo reciente en M. m. musculus | El mutante knockout ha reducido la motilidad de los espermatozoides y el peso de los testículos | 2009 | Gen de ARN | [36] |
Mamíferos placentarios | ORF-Y | PhyloCSF del gen POLG en Homo sapiens , sinónimo de conservación de sitios en mamíferos y tBLASTN de mamíferos, saurópsidos, anfibios y peces teleósteos | La desaparición de la conservación mejorada del sitio sinónimo dentro del ORF de POLG después del codón de terminación del ORF-Y y la alta conservación del contexto de inicio del codón de inicio indican una selección de purificación | 41 variantes de Clinvar que afectan al péptido ORF-Y pero no a la secuencia de aminoácidos de POLG | 2020 | [22] | |
Saccharomyces cerevisiae | BSC4 | tBLASTN y alineaciones sinténicas de especies estrechamente relacionadas | Bajo selección negativa basada en datos de población | Tiene dos compañeros letales sintéticos | 2008 | Adopta una estructura tridimensional parcialmente específica | [33] [34] |
Saccharomyces cerevisiae | MDF1 | Solo los supuestos homólogos identificados son ORF truncados, no expresados y no funcionales | Se corrigió en 39 cepas distintas, sin cambios de marco ni mutaciones sin sentido | Disminuye la eficiencia de apareamiento al unirse a MATα2; promueve el crecimiento a través de una interacción con Snf1 | 2010 | La expresión es suprimida por su gen antisentido. | [79] [80] |
Características
Características generales
Los genes de novo que han surgido recientemente se diferencian de los genes establecidos en varias formas. En una amplia gama de especies, se ha informado que los genes jóvenes y / o taxonómicamente restringidos tienen una longitud más corta que los genes establecidos, evolucionan más rápidamente y se expresan menos. [37] [59] [70] [71] [81] [82] [83] [84] [85] [86] [87] [88] Aunque estas tendencias podrían ser el resultado del sesgo de detección de homología, un nuevo análisis de varios estudios que explicaron este sesgo encontraron que las conclusiones cualitativas alcanzadas no se vieron afectadas. [47] Otra característica incluye la tendencia de los genes jóvenes a tener menos aminoácidos hidrófobos, [89] ya tener estos residuos más agrupados uno cerca del otro a lo largo de la secuencia primaria. [90]
También se ha encontrado que la expresión de genes jóvenes es más específica de tejido o condición que la de genes establecidos. [29] [31] [37] [55] [57] [59] [86] [91] [92] [93] En particular, se observó una expresión relativamente alta de genes de novo en tejidos reproductivos masculinos en Drosophila , ratones , y humanos, y, en el cerebro humano. [57] [94] En animales con sistemas inmunitarios adaptativos, una mayor expresión en el cerebro y los testículos puede ser una función de la naturaleza inmuno-privilegiada de estos tejidos. Un análisis en ratones encontró una expresión específica de transcripciones intergénicas en el timo y el bazo (además del cerebro y los testículos). Se ha propuesto que en los vertebrados las transcripciones de novo deben expresarse primero en tejidos que carecen de células inmunes antes de que puedan expresarse en tejidos que tienen vigilancia inmunitaria. [93]
Características que promueven el nacimiento de genes de novo
También es interesante comparar las características de los genes de novo surgidos recientemente con el grupo de ORF no génicos de los que surgen. El modelado teórico ha demostrado que tales diferencias son el producto tanto de la selección de características que aumentan la probabilidad de funcionalización, como de fuerzas evolutivas neutrales que influyen en el recambio alélico. [95] Los experimentos en S. cerevisiae mostraron que los dominios transmembrana predichos estaban fuertemente asociados con efectos de aptitud beneficiosos cuando se sobreexpresaban los ORF jóvenes, pero no cuando se sobreexpresaban los ORF establecidos (más antiguos). [96] Si bien muchas otras características también se correlacionan con genes jóvenes, esta es la primera característica de secuencia conocida que se asocia con efectos beneficiosos para la aptitud.
Características dependientes del linaje
Las características de los genes de novo pueden depender de la especie o linaje examinado. Esto parece ser en parte el resultado de la variación del contenido de GC en los genomas y que los genes jóvenes tienen más similitud con las secuencias no génicas del genoma en el que surgieron que los genes establecidos. [97] Las características de la proteína resultante, como el porcentaje de residuos transmembrana y la frecuencia relativa de varias características estructurales secundarias predichas , muestran una fuerte dependencia de GC en genes huérfanos, mientras que en genes más antiguos estas características solo están débilmente influenciadas por el contenido de GC. [97]
La relación entre la edad de los genes y la cantidad de trastorno estructural intrínseco predicho (ISD) en las proteínas codificadas ha sido objeto de un debate considerable. Se ha afirmado que la ISD también es una característica dependiente del linaje, ejemplificada por el hecho de que en organismos con un contenido relativamente alto de GC, desde D. melanogaster hasta el parásito Leishmania major , los genes jóvenes tienen una ISD alta, [98] [99] mientras que en un genoma de GC bajo, como la levadura en ciernes, varios estudios han demostrado que los genes jóvenes tienen un ISD bajo. [59] [81] [88] [97] Sin embargo, un estudio que excluyó genes jóvenes con evidencia dudosa de funcionalidad, definidos en términos binarios como bajo selección para retención de genes, encontró que los genes restantes de levadura jóvenes tienen un alto ISD, lo que sugiere que el resultado de la levadura puede deberse a la contaminación del conjunto de genes jóvenes con ORF que no cumplen con esta definición y, por lo tanto, es más probable que tengan propiedades que reflejen el contenido de GC y otras características no génicas del genoma. [89] Más allá de los huérfanos más jóvenes, este estudio encontró que ISD tiende a disminuir con el aumento de la edad de los genes, y que esto se debe principalmente a la composición de aminoácidos más que al contenido de GC. [89] En escalas de tiempo más cortas, el uso de genes de novo que tienen la mayor validación sugiere que los genes más jóvenes están más desordenados en Lachancea , pero menos desordenados en Saccharomyces . [88]
Papel de las modificaciones epigenéticas
Un examen de genes de novo en A. thaliana encontró que ambos están hipermetilados y generalmente sin modificaciones de histonas . [53] De acuerdo con el modelo protogénico o la contaminación con no genes, los niveles de metilación de genes de novo eran intermedios entre los genes establecidos y las regiones intergénicas. Los patrones de metilación de estos genes de novo se heredan de manera estable, y los niveles de metilación fueron más altos, y más similares a los genes establecidos, en genes de novo con capacidad de codificación de proteínas verificada. [53] En el hongo patógeno Magnaporthe oryzae , los genes menos conservados tienden a tener patrones de metilación asociados con niveles bajos de transcripción. [100] Un estudio en levaduras también encontró que los genes de novo se enriquecen en puntos calientes de recombinación , que tienden a ser regiones libres de nucleosomas. [88]
En Pristionchus pacificus , los genes huérfanos con expresión confirmada presentan estados de cromatina que difieren de los de genes establecidos expresados de manera similar. [87] Los sitios de inicio de genes huérfanos tienen firmas epigenéticas que son características de los potenciadores, en contraste con los genes conservados que exhiben promotores clásicos. [87] Muchos genes huérfanos no expresados están decorados con modificaciones de histonas represivas, mientras que la falta de tales modificaciones facilita la transcripción de un subconjunto expresado de huérfanos, lo que respalda la idea de que la cromatina abierta promueve la formación de genes nuevos. [87]
Mecanismos
Expresión penetrante
Con el desarrollo de tecnologías como RNA-seq y Ribo-seq, ahora se sabe que los genomas eucariotas se transcriben de forma generalizada [101] [102] [103] [104] y se traducen. [105] Muchos ORF que no están anotados o anotados como ARN largos no codificantes (lncRNA) se traducen en algún nivel, ya sea en una condición o en una forma específica de tejido. [59] [105] [106] [107] [108] [109] Aunque son poco frecuentes, estos eventos de traducción exponen la secuencia no génica a la selección. Esta expresión generalizada forma la base de varios modelos que describen el nacimiento de genes de novo .
Se ha especulado que el panorama epigenético de los genes de novo en las primeras etapas de formación puede ser particularmente variable entre poblaciones, lo que da como resultado una expresión genética variable que permite a los genes jóvenes explorar el "panorama de expresión". [110] El gen QQS en A. thaliana es un ejemplo de este fenómeno; su expresión está regulada negativamente por la metilación del ADN que, si bien es heredable durante varias generaciones, varía ampliamente en sus niveles tanto entre accesiones naturales como dentro de poblaciones silvestres. [110] La epigenética también es en gran parte responsable del entorno transcripcional permisivo en los testículos, particularmente a través de la incorporación en nucleosomas de variantes de histonas no canónicas que son reemplazadas por protaminas similares a histonas durante la espermatogénesis. [111]
Orden de eventos
Para que se produzca el nacimiento de un gen codificador de proteínas de novo , una secuencia no génica debe transcribirse y adquirir un ORF antes de traducirse. Estos eventos pueden ocurrir en cualquier orden, y hay evidencia que respalda tanto un modelo de "ORF primero" y un modelo de "transcripción primero". [5] Un análisis de genes de novo que se segregan en D. melanogaster encontró que las secuencias que se transcriben tenían un potencial de codificación similar al de las secuencias ortólogas de líneas que carecen de evidencia de transcripción. [55] Este hallazgo apoya la noción de que pueden existir muchos ORF antes de ser expresados. El gen de la glicoproteína anticongelante AFGP , que surgió de novo en los bacalaos del Ártico, proporciona un ejemplo más definitivo en el que se demostró que la emergencia de novo del ORF precedería a la región promotora. [76] Además, los ORF supuestamente no génicos lo suficientemente largos como para codificar péptidos funcionales son numerosos en los genomas eucariotas, y se espera que ocurran con alta frecuencia por casualidad. [55] [59] Al mismo tiempo, la transcripción de genomas eucariotas es mucho más extensa de lo que se pensaba anteriormente, y hay ejemplos documentados de regiones genómicas que se transcribieron antes de la aparición de un ORF que se convirtió en un gen de novo . [75] Se desconoce la proporción de genes de novo que codifican proteínas, pero la aparición de la "transcripción primero" ha llevado a algunos a postular que los genes de novo que codifican proteínas pueden existir primero como intermediarios de genes de ARN. El caso de los ARN bifuncionales, que se traducen y funcionan como genes de ARN, muestra que tal mecanismo es plausible. [112]
Los dos eventos pueden ocurrir simultáneamente cuando el reordenamiento cromosómico es el evento que precipita el nacimiento del gen. [113]
Modelos
Se han descrito varios modelos teóricos y posibles mecanismos de nacimiento de genes de novo . Los modelos generalmente no son mutuamente excluyentes y es posible que múltiples mecanismos den lugar a genes de novo . [42]
Hipótesis "fuera de testículo"
Un estudio de caso temprano del nacimiento de genes de novo , que identificó cinco genes de novo en D. melanogaster , observó la expresión preferencial de estos genes en los testículos, [30] y se identificaron varios genes de novo adicionales utilizando datos transcriptómicos derivados de los testículos y glándulas accesorias masculinas de D. yakuba y D. erecta . [29] [31] Esto está de acuerdo con otros estudios que mostraron que hay una rápida evolución de genes relacionados con la reproducción en una variedad de linajes, [114] [115] [116] lo que sugiere que la selección sexual puede desempeñar un papel clave en la adaptación evolución y nacimiento de genes de novo . Un análisis posterior a gran escala de seis cepas de D. melanogaster identificó 248 genes de novo expresados en testículos , de los cuales ~ 57% no se fijaron. [55] Se ha sugerido que el gran número de genes de novo con expresión masculina específica identificados en Drosophila probablemente se deba al hecho de que dichos genes se retienen preferentemente en relación con otros genes de novo , por razones que no están del todo claras. [70] Curiosamente, se demostró que dos genes putativos de novo en Drosophila ( Goddard y Saturn ) eran necesarios para la fertilidad masculina normal. [117]
En humanos, un estudio que identificó 60 genes de novo específicos para humanos encontró que su expresión promedio, medida por RNA-seq, era más alta en los testículos. [57] Otro estudio que analizó genes específicos de mamíferos de manera más general también encontró una expresión enriquecida en los testículos. [118] Se cree que la transcripción en testículos de mamíferos es particularmente promiscua, debido en parte a la expresión elevada de la maquinaria de transcripción [119] [120] y un entorno de cromatina abierto. [121] Junto con la naturaleza inmuno-privilegiada de los testículos, se cree que esta transcripción promiscua crea las condiciones ideales para la expresión de secuencias no génicas necesarias para el nacimiento de genes de novo . La expresión específica de testículos parece ser una característica general de todos los genes nuevos, ya que un análisis de especies de vertebrados y Drosophila encontró que los genes jóvenes mostraban una expresión sesgada en los testículos independientemente de su mecanismo de origen. [91]
Modelo de preadaptación
El modelo de preadaptación del nacimiento de genes de novo utiliza modelos matemáticos para mostrar que cuando las secuencias que normalmente están ocultas se exponen a una selección débil o protegida, el conjunto resultante de secuencias "crípticas" (es decir, protogenes) se puede purgar de "evidentemente" variantes deletéreas ”, como las que son propensas a conducir a la agregación de proteínas y, por lo tanto, enriquecidas en adaptaciones potenciales relativas a un conjunto de secuencias completamente no expresado y sin purgar. [122] Esta revelación y purga de secuencias crípticas deletéreas no génicas es un subproducto de la transcripción y traducción generalizadas de secuencias intergénicas, y se espera que facilite el nacimiento de genes codificadores de proteínas funcionales de novo . [108] Esto se debe a que al eliminar las variantes más perjudiciales, lo que queda es, mediante un proceso de eliminación, más probable que sea adaptativo de lo esperado a partir de secuencias aleatorias. Usando la definición evolutiva de función (es decir, que un gen está por definición bajo selección purificadora contra pérdida), el modelo de preadaptación asume que “el nacimiento del gen es una transición repentina a la funcionalidad” [89] que ocurre tan pronto como un ORF adquiere un beneficio neto efecto. Para evitar ser deletéreos, se espera que los genes del recién nacido muestren versiones exageradas de las características génicas asociadas con la evitación del daño. Esto contrasta con el modelo protogénico, que espera que los genes recién nacidos tengan características intermedias entre los genes antiguos y los no genes. [89]
Las matemáticas del modelo de preadaptación asumen que la distribución de los efectos de la aptitud es bimodal, con nuevas secuencias de mutaciones que tienden a romper algo o modificar, pero rara vez se encuentran en el medio. [122] [123] Siguiendo esta lógica, las poblaciones pueden desarrollar soluciones locales, en las que la selección opera en cada locus individual y se mantiene una tasa de error relativamente alta, o una solución global con una tasa de error baja que permita la acumulación de elementos crípticos deletéreos. secuencias. [122] Se cree que el nacimiento de genes de novo se ve favorecido en poblaciones que desarrollan soluciones locales, ya que la tasa de error relativamente alta dará como resultado un conjunto de variaciones crípticas que se “preadaptan” mediante la purga de secuencias deletéreas. Las soluciones locales son más probables en poblaciones con un tamaño de población efectivo alto .
En apoyo del modelo de preadaptación, un análisis de ISD en ratones y levaduras encontró que los genes jóvenes tienen ISD más alto que los genes viejos, mientras que las secuencias aleatorias no génicas tienden a mostrar los niveles más bajos de ISD. [89] Aunque la tendencia observada puede haber resultado en parte de un subconjunto de genes jóvenes derivados por sobreimpresión, [124] también se observa un ISD más alto en genes jóvenes entre pares de genes virales superpuestos. [125] Con respecto a otras características estructurales previstas, como el contenido de la cadena β y la propensión a la agregación, los péptidos codificados por protogenes son similares a las secuencias no génicas y categóricamente distintos de los genes canónicos. [126]
Modelo de protogén
Este modelo de protogén concuerda con el modelo de preadaptación sobre la importancia de la expresión generalizada y se refiere al conjunto de secuencias expresadas de manera generalizada que no cumplen con todas las definiciones de un gen como "protogenes". [59] En contraste con el modelo de preadaptación, el modelo protogénico sugiere que los genes recién nacidos tienen características intermedias entre los genes antiguos y los no genes. [89] Específicamente, este modelo prevé un proceso más gradual bajo la selección de un estado no génico a un estado génico, rechazando la clasificación binaria de gen y no gen.
En una extensión del modelo de proto-genes, se ha propuesto que a medida que los proto-genes se vuelven más parecidos a los genes, su potencial de cambio adaptativo da paso a efectos seleccionados; por tanto, el impacto previsto de las mutaciones sobre la aptitud depende del estado evolutivo del ORF. [127] Esta noción está respaldada por el hecho de que la sobreexpresión de ORF establecidos en S. cerevisiae tiende a ser menos beneficiosa (y más dañina) que la sobreexpresión de ORF emergentes. [127]
Varias características de los ORF se correlacionan con la edad del ORF según lo determinado por el análisis filoestratigráfico, y los ORF jóvenes tienen propiedades intermedias entre los ORF antiguos y los no genes; esto se ha tomado como evidencia a favor del modelo de proto-gen, en el que el estado del proto-gen es un continuo. [59] Esta evidencia ha sido criticada porque también se esperan las mismas tendencias aparentes bajo un modelo en el que la identidad como gen es un binario. Según este modelo, cuando cada grupo de edad contiene una proporción diferente de genes frente a no genes, la paradoja de Simpson puede generar correlaciones en la dirección incorrecta. [89]
Modelo de crecimiento lento y muda
El modelo de "crecimiento lento y muda" describe un mecanismo potencial de nacimiento de genes de novo , en particular para los genes que codifican proteínas. En este escenario, los ORF que codifican proteínas existentes se expanden en sus extremos, especialmente en sus extremos 3 ', lo que lleva a la creación de nuevos dominios N- y C-terminales. [128] [129] [130] [131] [132] Los nuevos dominios C-terminales pueden evolucionar primero bajo una selección débil a través de una expresión ocasional a través de la traducción de lectura completa, como en el modelo de preadaptación, solo más tarde se expresan constitutivamente a través de una mutación que interrumpe el codón de parada. [122] [129] Los genes que experimentan una alta lectura traslacional tienden a tener terminales C intrínsecamente desordenados. [133] Además, los genes existentes suelen estar cerca de secuencias repetitivas que codifican dominios desordenados. Estos nuevos dominios desordenados pueden inicialmente conferir alguna capacidad de unión no específica que se refina gradualmente mediante la selección. Las secuencias que codifican estos nuevos dominios pueden separarse ocasionalmente de su ORF original, lo que conduce o contribuye a la creación de un gen de novo . [129] Curiosamente, un análisis de 32 genomas de insectos encontró que los dominios nuevos (es decir, los únicos de los insectos) tienden a evolucionar de manera bastante neutral, con solo unos pocos sitios bajo selección positiva, mientras que las proteínas del huésped permanecen bajo selección purificadora, lo que sugiere que nuevos los dominios emergen de forma gradual y algo estocástica. [134]
Salud humana
Además de su importancia para el campo de la biología evolutiva, el nacimiento de genes de novo tiene implicaciones para la salud humana. Se ha especulado que los genes nuevos, incluidos los genes de novo , pueden desempeñar un papel enorme en los rasgos específicos de las especies; [6] [10] [32] [135] sin embargo, muchos genes específicos de especies carecen de anotación funcional. [118] No obstante, hay pruebas que sugieren que genes de novo específicos de seres humanos están implicados en enfermedades como el cáncer. NYCM , un gen de novo exclusivo de humanos y chimpancés, regula la patogénesis de los neuroblastomas en modelos de ratón, [136] y el PART1 específico de primates , un gen de lncRNA, se ha identificado como supresor de tumores y como oncogén en diferentes contextos. [37] [137] [138] Varios otros genes de novo específicos de primates o humanos , incluidos PBOV1 , [139] GR6 , [140] [141] MYEOV , [142] ELFN1-AS1 , [143] y CLLU1 , [38] también están relacionados con el cáncer. Algunos incluso han sugerido considerar genes novedosos evolutivos expresados específicamente en tumores como su propia clase de elementos genéticos, señalando que muchos de estos genes están bajo selección positiva y pueden ser neofuncionalizados en el contexto de tumores. [143]
La expresión específica de muchos genes de novo en el cerebro humano [57] también plantea la intrigante posibilidad de que los genes de novo influyan en los rasgos cognitivos humanos. Un ejemplo de ello es FLJ33706 , un gen de novo que se identificó en GWAS y análisis de ligamiento para la adicción a la nicotina y muestra una expresión elevada en los cerebros de los pacientes con Alzheimer. [144] En términos generales, la expresión de genes jóvenes específicos de primates se enriquece en el cerebro humano fetal en relación con la expresión de genes igualmente jóvenes en el cerebro de ratón. [145] La mayoría de estos genes jóvenes, varios de los cuales se originaron de novo , se expresan en la neocorteza, que se cree que es responsable de muchos aspectos de la cognición humana específica. Muchos de estos genes jóvenes muestran firmas de selección positiva y las anotaciones funcionales indican que están involucrados en diversos procesos moleculares, pero están enriquecidos con factores de transcripción. [145]
Además de sus funciones en los procesos del cáncer, los genes humanos originados de novo se han implicado en el mantenimiento de la pluripotencia [146] y en la función inmunitaria. [37] [118] [147] La expresión preferencial de genes de novo en los testículos también sugiere un papel en la reproducción. Dado que la función de muchos genes humanos de novo sigue sin caracterizarse, parece probable que continúe aumentando el reconocimiento de su contribución a la salud y el desarrollo humanos.
Organismo / Linaje | Método (s) de detección de homología | ¿Evidencia de expresión? | ¿Evidencia de selección? | ¿Evidencia de papel fisiológico? | # Genes huérfanos / De Novo | Notas | Árbitro. |
---|---|---|---|---|---|---|---|
Artrópodos | BLASTP para las 30 especies entre sí, TBLASTN solo para Formicidae , buscado por synteny para ortólogos no anotados solo en Formicidae | EST, RNA-seq; RT-PCR en candidatos seleccionados | 37 Los ortólogos restringidos por Formicidae aparecen bajo selección positiva (modelos M1a a M2a y M7 a M8 usando pruebas de razón de verosimilitud); Como grupo, los ortólogos restringidos por Formicidae tienen una tasa de K a / K s significativamente más alta que los ortólogos no restringidos. | Predicción de péptidos señal y localización subcelular para subconjuntos de huérfanos | ~ 65.000 genes huérfanos en 30 especies | Abundancia de genes huérfanos que dependen del tiempo transcurrido desde la aparición de un ancestro común; > 40% de los huérfanos de coincidencias intergénicas, lo que indica un posible origen de novo | [72] |
Arabidopsis thaliana | BLASTP contra 62 especies, PSI-BLAST contra la base de datos de proteínas no redundantes NCBI, TBLASTN contra la base de datos de transcripciones únicas ensambladas por PlantGDB; región sinténica buscada de dos especies estrechamente relacionadas | Datos transcriptómicos y traductómicos de múltiples fuentes | Frecuencias alélicas de genes de novo correlacionados con sus niveles de metilación del ADN | Ninguno | 782 genes de novo | También se evaluó la metilación del ADN y las modificaciones de histonas. | [53] |
Bombyx mori | BLASTP contra cuatro lepidópteros , TBLASTN contra secuencias EST de lepidópteros, BLASTP contra NCBI base de datos de proteínas no redundantes | Microarrays, RT-PCR | Ninguno | El ARNi en cinco genes de novo no produjo fenotipos visibles. | 738 genes huérfanos | Cinco huérfanos identificados como genes de novo | [85] |
Brassicaceae | BLASTP contra la base de datos de proteínas no redundantes NCBI, TBLASTN contra la base de datos de nucleótidos NCBI, TBLASTN contra la base de datos EST de NCBI, PSI-BLAST contra la base de datos de proteínas no redundantes NCBI, InterProScan [148] | Microarray | Ninguno | TRG enriquecidos para cambios de expresión en respuesta a tensiones abióticas en comparación con otros genes | 1761 TRG nucleares; 28 TRG mitocondriales | ~ 2% de los TRG que se cree que son genes de novo | [86] |
Drosophila melanogaster | BLASTN de ADNc de consulta contra genomas de D. melanogaster , D. simulans y D. yakuba ; También realizó un control de la región sinténica en especies hermanas. | ADNc / etiquetas de secuencia expresada (EST) | Las proporciones K a / K s calculadas entre los nuevos genes retenidos y sus genes parentales son significativamente> 1, lo que indica que la mayoría de los genes nuevos están funcionalmente restringidos. | La lista incluye varios genes con roles moleculares caracterizados | 72 genes huérfanos; 2 genes de novo | Mecanismo dominante de duplicación de genes para nuevos genes; 7/59 huérfanos específicos del complejo de especies de D. melanogaster identificados como de novo | [56] |
Drosophila melanogaster | Presencia o ausencia de ortólogos en otras especies de Drosophila inferidas por sinteno basado en alineaciones del genoma UCSC y sinteno basado en proteína FlyBase; TBLASTN contra el subgrupo de Drosophila | Indirecto (ARNi) | Los genes esenciales más jóvenes muestran firmas de selección positiva (α = 0,25 como grupo) | Derribo con ARNi constitutivo letal para 59 TRG | 195 TRG “jóvenes” (> 35 millones); 16 genes de novo | Mecanismo dominante de duplicación de genes para genes nuevos | [54] |
Drosophila melanogaster | RNA-seq en D. melanogaster y parientes cercanos; alineamientos sinténicos con D. simulans y D. yakuba ; BLASTP contra la base de datos de proteínas no redundantes NCBI | Secuencia de ARN | La diversidad de nucleótidos es menor en los parientes que no se expresan; Estadística similar a Hudson-Kreitman-Aguade más baja en genes fijos de novo que en regiones intergénicas | Características estructurales de genes de novo (p. Ej., Enriquecimiento de ORF largos) sugestivos de función | 106 genes fijos y 142 segregantes de novo | Expresado específicamente en testículos | [55] |
Homo sapiens | BLASTP contra otros primates; BLAT contra genomas de chimpancés y orangután, comprobación manual de regiones sinténicas en chimpancés y orangután | Secuencia de ARN | La tasa de sustitución proporciona alguna evidencia de una selección débil; 59/60 genes de novo están fijos | Ninguno | 60 genes de novo | Habilitación de mutaciones identificadas; máxima expresión observada en el cerebro y los testículos | [57] |
Homo sapiens | BLASTP contra chimpancé, BLAT y búsqueda de región sinténica en chimpancé, control manual de regiones sinténicas en chimpancé y macaco | EST / ADNc | No hay evidencia de restricción selectiva vista por divergencia de nucleótidos | Uno de los genes identificados tiene un papel conocido en la leucemia. | 3 genes de novo | Se estima que el genoma humano contiene ~ 18 genes de novo específicos para humanos | [38] |
Lachancea y Saccharomyces | BLASTP de todas las especies focales entre sí, BLASTP contra la base de datos de proteínas no redundantes de NCBI, PSI-BLAST contra la base de datos de proteínas no redundantes de NCBI, Perfil de HMM de las familias de TRG entre sí; las familias luego se fusionaron y buscaron en cuatro bases de datos de perfiles | Espectrometría de masas (MS) | Las relaciones K a / K s en Saccharomyces indican que los candidatos están bajo una selección débil que aumenta con la edad del gen; en las especies de Lachancea con múltiples cepas, las proporciones pN / pS son más bajas para los candidatos de novo que para los "TRG falsos" | Ninguno | 288 TRG candidatos de novo en Saccharomyces , 415 en Lachancea | Prueba de traducción de MS para 25 candidatos | [88] |
Mus musculus y Rattus norvegicus | BLASTP de rata y ratón entre sí, BLASTP contra la base de datos de comparación de Ensembl; búsqueda de regiones sinténicas en ratas y ratones | Base de datos UniGene | El subconjunto de genes muestra una baja diversidad de nucleótidos y una alta conservación del ORF en 17 cepas | Dos genes de ratón causan morbilidad cuando se eliminan | 69 genes de novo en ratón y 6 genes de novo en rata | Habilitando mutaciones identificadas para 9 genes de ratón | [149] |
Mus musculus | BLASTP contra la base de datos de proteínas no redundantes NCBI | Microarray | Ninguno | Ninguno | 781 genes huérfanos | Características de genes dependientes de la edad compatibles con la aparición de novo de muchos huérfanos | [67] |
Oryza | BLAT proteína a proteína y nucleótido a nucleótido contra ocho especies de Oryza y dos especies exóticas; buscó en las regiones sinténicas de estas especies el potencial de codificación | RNA-seq (todos los TRG de novo ); Perfiles de ribosomas y EM dirigida (algunos TRG de novo ) | 22 candidatos de novo aparecen bajo selección negativa y seis bajo selección positiva, según la medición de la tasa de K a / K s | La expresión de TRG de novo es específica de tejido | 175 TRG de novo | ~ 57% de los genes de novo tienen evidencia de traducción; la transcripción es anterior al potencial de codificación en la mayoría de los casos | [150] |
Primates | BLASTP contra 15 eucariotas, BLASTN contra genoma humano, análisis de regiones sinténicas | EST | Relaciones K a / K s para TRG inferiores a uno pero superiores a los genes establecidos; puntuaciones de codificación coherentes con las proteínas traducidas | Varios genes tienen funciones celulares bien caracterizadas. | 270 TRG | ~ 5,5% de los TRG que se estima que se han originado de novo | [37] |
Pristionchus pacificus | BLASTP y tBLASTN, análisis sinténico | RNA-Seq | 2 casos completaron el origen del gen de novo | Otros 27 huérfanos de alta confianza cuyos métodos de origen incluyeron artefactos de anotación, origen quimérico, uso de marcos de lectura alternativos y división de genes con la consiguiente ganancia de exones de novo. | [151] | ||
Rodentia | BLASTP contra la base de datos de proteínas no redundantes NCBI | Ninguno | Los genes del ratón comparten un 50% de identidad con el ortólogo de rata | Ninguno | 84 TRG | Genes específicos de la especie excluidos del análisis; resultados robustos a la tasa de evolución | [89] |
Saccharomyces cerevisiae | BLASTP y PSI-BLAST contra 18 especies de hongos, HMMER y HHpred contra varias bases de datos, TBLASTN contra tres parientes cercanos | Ninguno | Ninguno | La mayoría de los huérfanos han caracterizado los efectos de la aptitud | 188 genes huérfanos | Edades de genes determinadas a nivel de residuos individuales | [81] |
Saccharomyces cerevisiae | BLASTP, TBLASTX y TBLASTN contra otras 14 especies de levadura, BLASTP contra NCBI base de datos de proteínas no redundantes | Perfilado de ribosomas | Los 25 genes de novo , 115 protogenes bajo selección purificadora (pN / pS <1) | Ninguno | 25 genes de novo ; 1.891 "protogenes" | El nacimiento de genes de novo es más común que los genes nuevos por duplicación; Los protogenes son exclusivos de las levaduras Saccharomyces ( Sensu stricto ) | [59] |
Saccharomyces cerevisiae | BLASTN, TBLASTX, contra nt / nr, inspección manual de alineación sinténica | transcripciones que se cree que no codifican, inspección manual de las trazas de perfiles de ribosomas | Ninguno | Ninguno | 1 gen candidato de novo , 217 transcripciones asociadas a ribosomas | El gen candidato de novo es polimórfico. Los datos del perfil ribosómico son los mismos que en [59] | [108] |
Saccharomyces paradoxus | Los ORF intergénicos (iORF) se anotaron en regiones intergénicas ortólogas identificadas por microsinteny; BLASTP contra la base de datos de proteínas refseq del NCBI contra 417 especies, incluidas 237 especies de hongos. | Ribo-seq, RNA-seq Ensayo de traducción in vivo para el subconjunto (45) de iORFS traducido | La relación global dn / ds para iORF traducidos en 24 cepas de S. paradoxus no mostró evidencia para purificar la selección. | Ninguno | 447 iORF con traducción significativa que eran específicos de 3 linajes de S. paradoxus y 1 linaje de S. cerevisiae . | La eficiencia de traducción de iORF fue generalmente menor que la de los genes anotados con superposición significativa; sólo ~ 2% de los 19.689 iORF encontrados mostraron una traducción significativa, pero suman> 8% del proteoma canónico en poblaciones de levaduras silvestres. | [66] |
Saccharomyces sensu estricto | BLASTP contra la base de datos de proteínas no redundantes NCBI, TBLASTN contra diez especies exóticas; BLASTP y phmmer contra 20 especies de levadura reanotadas utilizando alineaciones sinténicas | Secuenciación de isoformas de transcripción (TIF-seq), perfilado de ribosomas | La mayoría de los genes están débilmente restringidos pero un subconjunto bajo una fuerte selección, según el índice de neutralidad, dirección de selección, K a / K s y pruebas de McDonald-Kreitman. | Localización subcelular demostrada para cinco genes | ~ 13.000 genes de novo | > 65% de los genes de novo son isoformas de genes antiguos; > 97% del conjunto de datos TIF-seq | [52] |
Nota: Para los propósitos de esta tabla, los genes se definen como los genes huérfanos (cuando cada especie) o TRGS (cuando se limita a un grupo estrechamente relacionado de las especies), cuando no se ha investigado el mecanismo de la originación, y como de novo genes cuando se de no se ha inferido ningún origen, independientemente del método de inferencia. La designación de genes de novo como "candidatos" o "protogenes" refleja el lenguaje utilizado por los autores de los respectivos estudios.
Ver también
- Evolución molecular
- Genética de poblaciones
- Evolvability
- Gen superpuesto
- Gen huérfano
Referencias
Este artículo fue adaptado de la siguiente fuente bajo una licencia CC BY 4.0 ( 2019 ) ( informes de los revisores ): Stephen Branden Van Oss; Anne-Ruxandra Carvunis (23 de mayo de 2019). "Nacimiento del gen de novo" . PLOS Genetics . 15 (5): e1008160. doi : 10.1371 / JOURNAL.PGEN.1008160 . ISSN 1553-7390 . PMC 6542195 . PMID 31120894 . Wikidata Q86320144 .
- ^ Long M, Betrán E, Thornton K, Wang W (noviembre de 2003). "El origen de nuevos genes: atisbos de jóvenes y mayores". Nature Reviews Genética . 4 (11): 865–75. doi : 10.1038 / nrg1204 . PMID 14634634 . S2CID 33999892 .
- ^ Wang W, Yu H, Long M (mayo de 2004). "Duplicación-degeneración como mecanismo de fisión de genes y el origen de nuevos genes en especies de Drosophila " . Genética de la naturaleza . 36 (5): 523–7. doi : 10.1038 / ng1338 . PMID 15064762 .
- ^ Levy, Adam (16 de octubre de 2019). "Cómo la evolución construye genes desde cero: los científicos asumieron durante mucho tiempo que aparecen nuevos genes cuando la evolución juega con los antiguos. Resulta que la selección natural es mucho más creativa" . Naturaleza . 574 (7778): 314–316. doi : 10.1038 / d41586-019-03061-x . PMID 31619796 .
- ^ Schmitz JF, Bornberg-Bauer E (2017). "de novo a partir de ADN previamente no codificante" . F1000Research . 6 : 57. doi : 10.12688 / f1000research.10079.1 . PMC 5247788 . PMID 28163910 .
- ^ a b c Schlötterer C (abril de 2015). "Los genes desde cero - el destino evolutivo de los genes de novo" . Tendencias en Genética . 31 (4): 215–9. doi : 10.1016 / j.tig.2015.02.007 . PMC 4383367 . PMID 25773713 .
- ^ a b c Kaessmann H (octubre de 2010). "Orígenes, evolución e impacto fenotípico de nuevos genes" . Investigación del genoma . 20 (10): 1313-26. doi : 10.1101 / gr.101386.109 . PMC 2945180 . PMID 20651121 .
- ^ a b Jacob F (junio de 1977). "Evolución y retoques". Ciencia . 196 (4295): 1161–6. Código Bibliográfico : 1977Sci ... 196.1161J . doi : 10.1126 / science.860134 . PMID 860134 . S2CID 29756896 .
- ^ Carvunis, Anne-Ruxandra; Oss, Stephen Branden Van (23 de mayo de 2019). "Nacimiento del gen de novo" . PLOS Genetics . 15 (5): e1008160. doi : 10.1371 / journal.pgen.1008160 . ISSN 1553-7404 . PMC 6542195 . PMID 31120894 .
- ^ Khalturin K, Hemmrich G, Fraune S, Augustin R, Bosch TC (septiembre de 2009). "Más que huérfanos: ¿son los genes restringidos taxonómicamente importantes en la evolución?". Tendencias en Genética . 25 (9): 404-13. doi : 10.1016 / j.tig.2009.07.006 . PMID 19716618 .
- ^ a b c d e Tautz D, Domazet-Lošo T (agosto de 2011). "El origen evolutivo de los genes huérfanos". Nature Reviews Genética . 12 (10): 692–702. doi : 10.1038 / nrg3053 . PMID 21878963 . S2CID 31738556 .
- ^ Evolución de Ohno S (1970) por duplicación de genes Allen & Unwin ; Springer-Verlag
- ^ Tautz D (2014). "El descubrimiento de la evolución genética de novo". Perspectivas en biología y medicina . 57 (1): 149–61. doi : 10.1353 / pbm.2014.0006 . hdl : 11858 / 00-001M-0000-0024-3416-1 . PMID 25345708 . S2CID 29552265 .
- ^ Grassé PP (1977) Evolución de los organismos vivos: evidencia de una nueva teoría de la transformación Academic Press
- ^ Barrell BG, Air GM, Hutchison CA (noviembre de 1976). "Superposición de genes en el bacteriófago phiX174". Naturaleza . 264 (5581): 34–41. Código Bibliográfico : 1976Natur.264 ... 34B . doi : 10.1038 / 264034a0 . PMID 1004533 . S2CID 4264796 .
- ^ Shaw DC, Walker JE, Northrop FD, Barrell BG, Godson GN, Fiddes JC (abril de 1978). "Gene K, un nuevo gen superpuesto en el bacteriófago G4". Naturaleza . 272 (5653): 510–5. Código Bibliográfico : 1978Natur.272..510S . doi : 10.1038 / 272510a0 . PMID 692656 . S2CID 4218777 .
- ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. (Febrero de 1977). "Secuencia de nucleótidos del ADN del bacteriófago phi X174". Naturaleza . 265 (5596): 687–95. Código Bibliográfico : 1977Natur.265..687S . doi : 10.1038 / 265687a0 . PMID 870828 . S2CID 4206886 .
- ^ Keese PK, Gibbs A (octubre de 1992). "Orígenes de los genes: ¿" big bang "o creación continua?" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 89 (20): 9489–93. Código Bibliográfico : 1992PNAS ... 89.9489K . doi : 10.1073 / pnas.89.20.9489 . PMC 50157 . PMID 1329098 .
- ^ Ohno S (abril de 1984). "Nacimiento de una enzima única a partir de un marco de lectura alternativo de la secuencia de codificación repetitiva internamente preexistente" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 81 (8): 2421–5. Código Bib : 1984PNAS ... 81.2421O . doi : 10.1073 / pnas.81.8.2421 . PMC 345072 . PMID 6585807 .
- ^ Sabath N, Wagner A, Karlin D (diciembre de 2012). "La evolución de las proteínas virales se originó de novo por sobreimpresión" . Biología Molecular y Evolución . 29 (12): 3767–80. doi : 10.1093 / molbev / mss179 . PMC 3494269 . PMID 22821011 .
- ^ Makałowska I, Lin CF, Hernandez K (octubre de 2007). "Nacimiento y muerte de superposiciones de genes en vertebrados" . Biología Evolutiva BMC . 7 : 193. doi : 10.1186 / 1471-2148-7-193 . PMC 2151771 . PMID 17939861 .
- ^ Samandi S, Roy AV, Delcourt V, Lucier JF, Gagnon J, Beaudoin MC, et al. (Octubre de 2017). "La anotación profunda del transcriptoma permite el descubrimiento y la caracterización funcional de pequeñas proteínas crípticas" . eLife . 6 . doi : 10.7554 / eLife.27860 . PMC 5703645 . PMID 29083303 .
- ^ a b Khan, YA; Jungreis, yo; Wright, JC; Mudge, JM; Choudhary, JS; Firth, AE; Kellis, M (6 de marzo de 2020). "Evidencia de una nueva secuencia de codificación superpuesta en POLG iniciada en un codón de inicio CUG" . BMC Genetics . 21 (1): 25. doi : 10.1186 / s12863-020-0828-7 . PMC 7059407 . PMID 32138667 .
- ^ Makałowski W, Mitchell GA, Labuda D (junio de 1994). "Secuencias de Alu en las regiones codificantes de ARNm: una fuente de variabilidad proteica". Tendencias en Genética . 10 (6): 188–93. doi : 10.1016 / 0168-9525 (94) 90254-2 . PMID 8073532 .
- ^ Sorek R (octubre de 2007). "El nacimiento de nuevos exones: mecanismos y consecuencias evolutivas" . ARN . 13 (10): 1603–8. doi : 10.1261 / rna.682507 . PMC 1986822 . PMID 17709368 .
- ^ a b Dorit RL, Gilbert W (diciembre de 1991). "El universo limitado de los exones". Opinión Actual en Genética y Desarrollo . 1 (4): 464–9. doi : 10.1016 / S0959-437X (05) 80193-5 . PMID 1822278 .
- ^ Chothia C (junio de 1992). "Proteínas. Mil familias para el biólogo molecular" . Naturaleza . 357 (6379): 543–4. Código Bibliográfico : 1992Natur.357..543C . doi : 10.1038 / 357543a0 . PMID 1608464 . S2CID 4355476 .
- ^ Oliver SG, van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, et al. (Mayo de 1992). "La secuencia de ADN completa del cromosoma III de levadura". Naturaleza . 357 (6373): 38–46. Código Bibliográfico : 1992Natur.357 ... 38O . doi : 10.1038 / 357038a0 . PMID 1574125 . S2CID 4271784 .
- ^ a b Dujon B (julio de 1996). "El proyecto del genoma de la levadura: ¿qué aprendimos?". Tendencias en Genética . 12 (7): 263–70. doi : 10.1016 / 0168-9525 (96) 10027-5 . PMID 8763498 .
- ^ a b c Comenzó DJ, Lindfors HA, Kern AD, Jones CD (junio de 2007). "Evidencia de la evolución de novo de genes expresados en testículo en el clado Drosophila yakuba / Drosophila erecta " . Genética . 176 (2): 1131–7. doi : 10.1534 / genetics.106.069245 . PMC 1894579 . PMID 17435230 .
- ^ a b c Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ (junio de 2006). "Los nuevos genes derivados de ADN no codificante en Drosophila melanogaster están frecuentemente ligados al cromosoma X y exhiben una expresión sesgada en los testículos" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (26): 9935–9. Código Bib : 2006PNAS..103.9935L . doi : 10.1073 / pnas.0509809103 . PMC 1502557 . PMID 16777968 .
- ^ a b c d Comenzó a DJ, Lindfors HA, Thompson ME, Holloway AK (marzo de 2006). "Genes recientemente evolucionados identificados de Drosophila yakuba y D. erecta glandula accesoria expresaron etiquetas de secuencia" . Genética . 172 (3): 1675–81. doi : 10.1534 / genetics.105.050336 . PMC 1456303 . PMID 16361246 .
- ^ a b McLysaght A, Guerzoni D (septiembre de 2015). "Nuevos genes de secuencia no codificante: el papel de genes codificadores de proteínas de novo en la innovación evolutiva eucariota" . Transacciones filosóficas de la Royal Society de Londres. Serie B, Ciencias Biológicas . 370 (1678): 20140332. doi : 10.1098 / rstb.2014.0332 . PMC 4571571 . PMID 26323763 .
- ^ a b Cai J, Zhao R, Jiang H, Wang W (mayo de 2008). "Origen de novo de un nuevo gen codificador de proteínas en Saccharomyces cerevisiae" . Genética . 179 (1): 487–96. doi : 10.1534 / genetics.107.084491 . PMC 2390625 . PMID 18493065 .
- ^ a b Bungard D, Copple JS, Yan J, Chhun JJ, Kumirov VK, Foy SG, et al. (Noviembre de 2017). "Plegabilidad de una proteína natural evolucionada de Novo" . Estructura . 25 (11): 1687–1696.e4. doi : 10.1016 / j.str.2017.09.006 . PMC 5677532 . PMID 29033289 .
- ^ a b Li L, Foster CM, Gan Q, Nettleton D, James MG, Myers AM, et al. (Mayo de 2009). "Identificación de la nueva proteína QQS como componente de la red metabólica del almidón en hojas de Arabidopsis" . The Plant Journal . 58 (3): 485–98. doi : 10.1111 / j.1365-313X.2009.03793.x . PMID 19154206 .
- ^ a b Heinen TJ, Staubach F, Häming D, Tautz D (septiembre de 2009). "Aparición de un nuevo gen de una región intergénica". Biología actual . 19 (18): 1527–31. doi : 10.1016 / j.cub.2009.07.049 . PMID 19733073 . S2CID 12446879 .
- ^ a b c d e f g h Toll-Riera M, Bosch N, Bellora N, Castelo R, Armengol L, Estivill X, et al. (Marzo de 2009). "Origen de genes huérfanos de primates: un enfoque de genómica comparativa" . Biología Molecular y Evolución . 26 (3): 603–12. doi : 10.1093 / molbev / msn281 . PMID 19064677 .
- ^ a b c d Knowles DG, McLysaght A (octubre de 2009). "Origen de novo reciente de genes codificadores de proteínas humanas" . Investigación del genoma . 19 (10): 1752–9. doi : 10.1101 / gr.095026.109 . PMC 2765279 . PMID 19726446 .
- ^ a b Domazet-Loso T, Brajković J, Tautz D (noviembre de 2007). "Un enfoque de filoestratigrafía para descubrir la historia genómica de las principales adaptaciones en los linajes de metazoos". Tendencias en Genética . 23 (11): 533–9. doi : 10.1016 / j.tig.2007.08.014 . PMID 18029048 .
- ^ a b c Gehrmann T, Reinders MJ (noviembre de 2015). "Proteny: descubrir y visualizar agrupaciones sinténicas estadísticamente significativas a nivel de proteoma" . Bioinformática . 31 (21): 3437–44. doi : 10.1093 / bioinformatics / btv389 . PMC 4612220 . PMID 26116928 .
- ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (octubre de 1990). "Herramienta básica de búsqueda de alineación local". Revista de Biología Molecular . 215 (3): 403–10. doi : 10.1016 / S0022-2836 (05) 80360-2 . PMID 2231712 .
- ^ a b c d e f McLysaght A, Hurst LD (septiembre de 2016). "Preguntas abiertas en el estudio de genes de novo: qué, cómo y por qué" . Nature Reviews Genética . 17 (9): 567–78. doi : 10.1038 / nrg.2016.78 . PMID 27452112 . S2CID 6033249 .
- ^ Elhaik E, Sabath N, Graur D (enero de 2006). "La" relación inversa entre la tasa de evolución y la edad de los genes de los mamíferos "es un artefacto de una mayor distancia genética con la tasa de evolución y el tiempo de divergencia" . Biología Molecular y Evolución . 23 (1): 1-3. doi : 10.1093 / molbev / msj006 . PMID 16151190 .
- ^ Albà MM, Castresana J (abril de 2007). "Sobre las búsquedas de homología por proteína Blast y la caracterización de la edad de los genes" . Biología Evolutiva BMC . 7 : 53. doi : 10.1186 / 1471-2148-7-53 . PMC 1855329 . PMID 17408474 .
- ^ Moyers BA, Zhang J (mayo de 2016). "Evaluación de la evidencia filoestratigráfica para el nacimiento de gen de novo generalizado en la evolución del genoma" . Biología Molecular y Evolución . 33 (5): 1245–56. doi : 10.1093 / molbev / msw008 . PMC 5010002 . PMID 26758516 .
- ^ Moyers BA, Zhang J (enero de 2015). "El sesgo filoestratigráfico crea patrones espurios de evolución del genoma" . Biología Molecular y Evolución . 32 (1): 258–67. doi : 10.1093 / molbev / msu286 . PMC 4271527 . PMID 25312911 .
- ^ a b Domazet-Lošo T, Carvunis AR, Albà MM, Šestak MS, Bakaric R, Neme R, et al. (Abril de 2017). "No hay evidencia de sesgo filoestratigráfico que afecte las inferencias sobre los patrones de aparición y evolución de genes" . Biología Molecular y Evolución . 34 (4): 843–856. doi : 10.1093 / molbev / msw284 . PMC 5400388 . PMID 28087778 .
- ^ Ghiurcuta CG, Moret BM (junio de 2014). "Evaluación de synteny para estudios comparativos mejorados" . Bioinformática . 30 (12): i9-18. doi : 10.1093 / bioinformatics / btu259 . PMC 4058928 . PMID 24932010 .
- ^ Jean G, Nikolski M (2011). "SyDiG: descubriendo Synteny en genomas distantes" (PDF) . Revista Internacional de Investigación y Aplicaciones de Bioinformática . 7 (1): 43–62. doi : 10.1504 / IJBRA.2011.039169 . PMID 21441096 .
- ^ Liu D, Hunt M, Tsai IJ (enero de 2018). "Inferir sintenia entre ensamblajes del genoma: una evaluación sistemática" . BMC Bioinformática . 19 (1): 26. doi : 10.1186 / s12859-018-2026-4 . PMC 5791376 . PMID 29382321 .
- ^ Ranz JM, Casals F, Ruiz A (febrero de 2001). "¿Qué tan maleable es el genoma eucariota? Tasa extrema de reordenamiento cromosómico en el género Drosophila" . Investigación del genoma . 11 (2): 230–9. doi : 10.1101 / gr.162901 . PMC 311025 . PMID 11157786 .
- ^ a b Lu TC, Leu JY, Lin WC (noviembre de 2017). "Un análisis completo de genes De Novo respaldados por transcripción en levaduras Saccharomyces sensu stricto" . Biología Molecular y Evolución . 34 (11): 2823–2838. doi : 10.1093 / molbev / msx210 . PMC 5850716 . PMID 28981695 .
- ^ a b c d Li ZW, Chen X, Wu Q, Hagmann J, Han TS, Zou YP, Ge S, Guo YL (agosto de 2016). "Sobre el origen de genes de novo en poblaciones de Arabidopsis thaliana" . Biología y evolución del genoma . 8 (7): 2190–202. doi : 10.1093 / gbe / evw164 . PMC 4987118 . PMID 27401176 .
- ^ a b c d e f g h Chen S, Zhang YE, Long M (diciembre de 2010). "Nuevos genes en Drosophila rápidamente se vuelven esenciales" . Ciencia . 330 (6011): 1682–5. Código Bibliográfico : 2010Sci ... 330.1682C . doi : 10.1126 / science.1196380 . PMC 7211344 . PMID 21164016 . S2CID 7899890 .
- ^ a b c d e f g Zhao L, Saelao P, Jones CD, Begun DJ (febrero de 2014). "Origen y propagación de genes de novo en poblaciones de Drosophila melanogaster" . Ciencia . 343 (6172): 769–72. Código bibliográfico : 2014Sci ... 343..769Z . doi : 10.1126 / science.1248286 . PMC 4391638 . PMID 24457212 .
- ^ a b c d Zhou Q, Zhang G, Zhang Y, Xu S, Zhao R, Zhan Z, et al. (Septiembre de 2008). "Sobre el origen de nuevos genes en Drosophila" . Investigación del genoma . 18 (9): 1446–55. doi : 10.1101 / gr.076588.108 . PMC 2527705 . PMID 18550802 .
- ^ a b c d e f g Wu DD, Irwin DM, Zhang YP (noviembre de 2011). "Origen de novo de genes codificadores de proteínas humanas" . PLOS Genetics . 7 (11): e1002379. doi : 10.1371 / journal.pgen.1002379 . PMC 3213175 . PMID 22102831 .
- ^ Vakirlis N, McLysaght A (2019). "Predicción computacional de genes codificadores de proteínas surgidos de Novo". Métodos computacionales en la evolución de proteínas . Métodos en Biología Molecular. 1851 . págs. 63–81. doi : 10.1007 / 978-1-4939-8736-8_4 . ISBN 978-1-4939-8735-1. PMID 30298392 .
- ^ a b c d e f g h yo j k l Carvunis AR, Rolland T, Wapinski I, Calderwood MA, Yildirim MA, Simonis N, et al. (Julio de 2012). "Protogenes y nacimiento de genes de novo" . Naturaleza . 487 (7407): 370–4. Código Bib : 2012Natur.487..370C . doi : 10.1038 / nature11184 . PMC 3401362 . PMID 22722833 .
- ^ Doolittle WF, Brunet TD, Linquist S, Gregory TR (mayo de 2014). "Distinguir entre" función "y" efecto "en biología del genoma" . Biología y evolución del genoma . 6 (5): 1234–7. doi : 10.1093 / gbe / evu098 . PMC 4041003 . PMID 24814287 .
- ^ a b Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, et al. (Abril de 2014). "Definición de elementos funcionales del ADN en el genoma humano" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (17): 6131–8. Código bibliográfico : 2014PNAS..111.6131K . doi : 10.1073 / pnas.1318948111 . PMC 4035993 . PMID 24753594 .
- ^ a b c Keeling, DM; Garza, P; Nartey, CM; Carvunis, AR (1 de noviembre de 2019). "Los significados de 'función' en biología y el caso problemático de la aparición de genes de novo" . eLife . 8 . doi : 10.7554 / eLife.47014 . PMC 6824840 . PMID 31674305 .
- ^ Andersson DI, Jerlström-Hultqvist J, Näsvall J (junio de 2015). "Evolución de nuevas funciones de novo y de genes preexistentes" . Perspectivas de Cold Spring Harbor en biología . 7 (6): a017996. doi : 10.1101 / cshperspect.a017996 . PMC 4448608 . PMID 26032716 .
- ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (Enero de 2019). "El estudio de los albores de la aparición de genes de novo en ratones revela una rápida integración de nuevos genes en redes funcionales" . bioRxiv . bioRxiv 10.1101 / 510214 . doi : 10.1101 / 510214 .
- ^ Ruiz-Orera J, Hernandez-Rodriguez J, Chiva C, Sabidó E, Kondova I, Bontrop R, et al. (Diciembre de 2015). "Orígenes de los genes De Novo en humanos y chimpancés" . PLOS Genetics . 11 (12): e1005721. arXiv : 1507.07744 . Código bibliográfico : 2015arXiv150707744R . doi : 10.1371 / journal.pgen.1005721 . PMC 4697840 . PMID 26720152 .
- ^ a b c Durand, É; Gagnon-Arsenault, yo; Hallin, J; Hatin, yo; Dubé, AK; Nielly-Thibault, L; Namy, O; Landry, CR (junio de 2019). "La rotación de transcripciones asociadas a ribosomas de ORF de novo produce características similares a genes disponibles para la aparición de genes de novo en poblaciones de levaduras silvestres" . Investigación del genoma . 29 (6): 932–943. doi : 10.1101 / gr.239822.118 . PMC 6581059 . PMID 31152050 .
- ^ a b Neme R, Tautz D (febrero de 2013). "Los patrones filogenéticos de aparición de nuevos genes apoyan un modelo de evolución frecuente de novo" . BMC Genomics . 14 : 117. doi : 10.1186 / 1471-2164-14-117 . PMC 3616865 . PMID 23433480 .
- ^ a b Schmitz JF, Ullrich KK, Bornberg-Bauer E (octubre de 2018). "Los genes de novo incipientes pueden evolucionar a partir de accidentes congelados que escaparon al rápido cambio de transcripción". Ecología y evolución de la naturaleza . 2 (10): 1626–1632. doi : 10.1038 / s41559-018-0639-7 . PMID 30201962 . S2CID 52181376 .
- ^ a b Vakirlis, N; Carvunis, AR; McLysaght, A (18 de febrero de 2020). "Los análisis basados en Synteny indican que la divergencia de secuencias no es la principal fuente de genes huérfanos" . eLife . 9 . doi : 10.7554 / eLife.53500 . PMC 7028367 . PMID 32066524 .
- ^ a b c Palmieri N, Kosiol C, Schlötterer C (febrero de 2014). "El ciclo de vida de los genes huérfanos de Drosophila" . eLife . 3 : e01311. arXiv : 1401.4956 . Código bibliográfico : 2014arXiv1401.4956P . doi : 10.7554 / eLife.01311 . PMC 3927632 . PMID 24554240 .
- ^ a b Prabh N, Roeseler W, Witte H, Eberhardt G, Sommer RJ, Rödelsperger C (noviembre de 2018). "Nematodos Pristionchus" . Investigación del genoma . 28 (11): 1664-1674. doi : 10.1101 / gr.234971.118 . PMC 6211646 . PMID 30232197 .
- ^ a b Wissler L, Gadau J, Simola DF, Helmkampf M, Bornberg-Bauer E (2013). "Mecanismos y dinámica de la aparición de genes huérfanos en genomas de insectos" . Biología y evolución del genoma . 5 (2): 439–55. doi : 10.1093 / gbe / evt009 . PMC 3590893 . PMID 23348040 .
- ^ Neme R, Tautz D (febrero de 2016). "La rápida renovación de la transcripción del genoma a lo largo del tiempo evolutivo expone todo el ADN no codificante a la aparición de genes de novo" . eLife . 5 : e09977. doi : 10.7554 / eLife.09977 . PMC 4829534 . PMID 26836309 .
- ^ Kutter C, Watt S, Stefflova K, Wilson MD, Goncalves A, Ponting CP, Odom DT, Marques AC (2012). "Recambio rápido de ARN no codificantes largos y la evolución de la expresión génica" . PLOS Genetics . 8 (7): e1002841. doi : 10.1371 / journal.pgen.1002841 . PMC 3406015 . PMID 22844254 .
- ^ a b c d e Reinhardt JA, Wanjiru BM, Brant AT, Saelao P, Begun DJ, Jones CD (2013). "Los ORF de novo en Drosophila son importantes para la aptitud del organismo y evolucionaron rápidamente a partir de secuencias previamente no codificantes" . PLOS Genetics . 9 (10): e1003860. doi : 10.1371 / journal.pgen.1003860 . PMC 3798262 . PMID 24146629 .
- ^ a b Zhuang X, Yang C, Murphy KR, Cheng CC (febrero de 2019). "Mecanismo molecular e historia del sin sentido para detectar la evolución del gen de la glicoproteína anticongelante en los gadids del norte" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 116 (10): 4400–4405. doi : 10.1073 / pnas.1817138116 . PMC 6410882 . PMID 30765531 .
- ^ Baalsrud, Helle Tessand; Tørresen, Ole Kristian; Solbakken, Monica Hongrø; Salzburger, Walter; Hanel, Reinhold; Jakobsen, Kjetill S .; Jentoft, Sissel (1 de marzo de 2018). "Evolución de genes de Novo de glicoproteínas anticongelantes en bacalaos revelada por datos de secuencia del genoma completo" . Biología Molecular y Evolución . 35 (3): 593–606. doi : 10.1093 / molbev / msx311 . ISSN 1537-1719 . PMC 5850335 . PMID 29216381 .
- ^ Xie, Chen; Bekpen, Cemalettin; Künzel, Sven; Keshavarz, Maryam; Krebs-Wheaton, Rebecca; Skrabar, Neva; Ullrich, Kristian Karsten; Tautz, Diethard (2019). "Un gen evolucionado de novo en el ratón doméstico regula los ciclos de embarazo de las hembras" . eLife . 8 . doi : 10.7554 / eLife.44392 . ISSN 2050-084X . PMC 6760900 . PMID 31436535 .
- ^ Li D, Dong Y, Jiang Y, Jiang H, Cai J, Wang W (abril de 2010). "Un gen originado de novo deprime la vía de apareamiento de la levadura en ciernes y es reprimido por la proteína codificada por su hebra antisentido" . Investigación celular . 20 (4): 408–20. doi : 10.1038 / cr.2010.31 . PMID 20195295 .
- ^ Li D, Yan Z, Lu L, Jiang H, Wang W (diciembre de 2014). "Pleiotropía del gen MDF1 originado de novo" . Informes científicos . 4 : 7280. Código Bibliográfico : 2014NatSR ... 4E7280L . doi : 10.1038 / srep07280 . PMC 4250933 . PMID 25452167 .
- ^ a b c Ekman D, Elofsson A (febrero de 2010). "Identificación y cuantificación de secuencias de proteínas huérfanas en hongos" . Revista de Biología Molecular . 396 (2): 396–405. doi : 10.1016 / j.jmb.2009.11.053 . PMID 19944701 .
- ^ Domazet-Loso T, Tautz D (octubre de 2003). "Un análisis evolutivo de genes huérfanos en Drosophila" . Investigación del genoma . 13 (10): 2213–9. doi : 10.1101 / gr.1311003 . PMC 403679 . PMID 14525923 .
- ^ Guo WJ, Li P, Ling J, Ye SP (2007). "Características comparativas significativas entre genes huérfanos y no huérfanos en el genoma del arroz (Oryza sativa L.)" . Genómica comparativa y funcional . 2007 : 21676. doi : 10.1155 / 2007/21676 . PMC 2216055 . PMID 18273382 .
- ^ Wolf YI, Novichkov PS, Karev GP, Koonin EV, Lipman DJ (mayo de 2009). "La distribución universal de las tasas evolutivas de los genes y las distintas características de los genes eucariotas de diferentes edades aparentes" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (18): 7273–80. doi : 10.1073 / pnas.0901808106 . PMC 2666616 . PMID 19351897 .
- ^ a b Sun W, Zhao XW, Zhang Z (septiembre de 2015). "Identificación y evolución de los genes huérfanos en el gusano de seda doméstico, Bombyx mori" . Cartas FEBS . 589 (19 Pt B): 2731–8. doi : 10.1016 / j.febslet.2015.08.008 . PMID 26296317 .
- ^ a b c Donoghue MT, Keshavaiah C, Swamidatta SH, Spillane C (febrero de 2011). "Orígenes evolutivos de genes específicos de Brassicaceae en Arabidopsis thaliana" . Biología Evolutiva BMC . 11 : 47. doi : 10.1186 / 1471-2148-11-47 . PMC 3049755 . PMID 21332978 .
- ^ a b c d Werner MS, Sieriebriennikov B, Prabh N, Loschko T, Lanz C, Sommer RJ (noviembre de 2018). "Los genes jóvenes tienen una estructura genética, perfiles epigenéticos y regulación transcripcional distintos" . Investigación del genoma . 28 (11): 1675-1687. doi : 10.1101 / gr.234872.118 . PMC 6211652 . PMID 30232198 .
- ^ a b c d e Vakirlis N, Hebert AS, Opulente DA, Achaz G, Hittinger CT, Fischer G, Coon JJ, Lafontaine I (marzo de 2018). "Un retrato molecular de genes de novo en levaduras" . Biología Molecular y Evolución . 35 (3): 631–645. doi : 10.1093 / molbev / msx315 . PMC 5850487 . PMID 29220506 .
- ^ a b c d e f g h yo Wilson BA, Foy SG, Neme R, Masel J (junio de 2017). "Los genes jóvenes están muy desordenados, como predice la hipótesis de preadaptación del nacimiento de un gen de novo " . Ecología y evolución de la naturaleza . 1 (6): 0146–146. doi : 10.1038 / s41559-017-0146 . PMC 5476217 . PMID 28642936 .
- ^ Foy SG, Wilson BA, Bertram J, Cordes MH, Masel J (abril de 2019). "Un cambio en la estrategia de evitación de la agregación marca una dirección a largo plazo para la evolución de las proteínas" . Genética . 211 (4): 1345-1355. doi : 10.1534 / genetics.118.301719 . PMC 6456324 . PMID 30692195 .
- ^ a b Zhang, JY; Zhou, Q (1 de enero de 2019). "Sobre la evolución reguladora de nuevos genes a lo largo de su historia de vida" . Biología Molecular y Evolución . 36 (1): 15-27. doi : 10.1093 / molbev / msy206 . PMID 30395322 . S2CID 53216993 .
- ^ Wu B, Knudson A (julio de 2018). "Origen de novo de genes codificadores de proteínas en levadura" . mBio . 9 (4). doi : 10.1128 / mBio.01024-18 . PMC 6069113 . PMID 30065088 .
- ^ a b Bekpen C, Xie C, Tautz D (agosto de 2018). "Tratar con el sistema inmunológico adaptativo durante la evolución de novo de genes a partir de secuencias intergénicas" . Biología Evolutiva BMC . 18 (1): 121. doi : 10.1186 / s12862-018-1232-z . PMC 6091031 . PMID 30075701 .
- ^ Pertea M, Shumate A, Pertea G, Varabyou A, Chang YC, Madugundu A, et al. (2018). "Miles de experimentos de secuenciación de ARN a gran escala producen una nueva lista completa de genes humanos y revelan un ruido transcripcional extenso" . bioRxiv . bioRxiv 10.1101 / 332825 . doi : 10.1101 / 332825 .
- ^ Nielly-Thibault, Lou; Landry, Christian R. (2019). "Las diferencias entre la materia prima y los productos del nacimiento de genes de novo pueden resultar de sesgos mutacionales" . Genética . 212 (4): 1353-1366. doi : 10.1534 / genetics.119.302187 . ISSN 1943-2631 . PMC 6707459 . PMID 31227545 .
- ^ Vakirlis, Nikolaos; Acar, Omer; Hsu, Brian; Castilho Coelho, Nelson; Van Oss, S. Branden; Wacholder, Aaron; Medetgul-Ernar, Kate; Bowman, Ray W .; Hines, Cameron P .; Iannotta, John; Parikh, Saurin Bipin (2020). "Emergencia de novo de proteínas de membrana adaptativas de secuencias genómicas ricas en timina" . Comunicaciones de la naturaleza . 11 (1): 781. Bibcode : 2020NatCo..11..781V . doi : 10.1038 / s41467-020-14500-z . ISSN 2041-1723 . PMC 7005711 . PMID 32034123 .
- ^ a b c Basile W, Sachenkova O, Light S, Elofsson A (marzo de 2017). "El alto contenido de GC hace que las proteínas huérfanas estén intrínsecamente desordenadas" . PLOS Biología Computacional . 13 (3): e1005375. Código bibliográfico : 2017PLSCB..13E5375B . doi : 10.1371 / journal.pcbi.1005375 . PMC 5389847 . PMID 28355220 .
- ^ Bitard-Feildel T, Heberlein M, Bornberg-Bauer E, Callebaut I (diciembre de 2015). "Detección de dominios huérfanos en Drosophila mediante" análisis de agrupamiento hidrofóbico " ". Biochimie . 119 : 244–53. doi : 10.1016 / j.biochi.2015.02.019 . PMID 25736992 .
- ^ Mukherjee S, Panda A, Ghosh TC (junio de 2015). "Elucidar las características evolutivas y las implicaciones funcionales de los genes huérfanos en Leishmania major". Infección, Genética y Evolución . 32 : 330–7. doi : 10.1016 / j.meegid.2015.03.031 . PMID 25843649 .
- ^ Jeon J, Choi J, Lee GW, Park SY, Huh A, Dean RA, et al. (Febrero de 2015). "El perfil de todo el genoma de la metilación del ADN proporciona información sobre la regulación epigenética del desarrollo de hongos en un hongo patógeno de plantas, Magnaporthe oryzae" . Informes científicos . 5 : 8567. Código Bibliográfico : 2015NatSR ... 5E8567J . doi : 10.1038 / srep08567 . PMC 4338423 . PMID 25708804 .
- ^ David L, Huber W, Granovskaia M, Toedling J, Palm CJ, Bofkin L, Jones T, Davis RW, Steinmetz LM (abril de 2006). "Un mapa de transcripción de alta resolución en el genoma de la levadura" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 103 (14): 5320–5. Código Bibliográfico : 2006PNAS..103.5320D . doi : 10.1073 / pnas.0601091103 . PMC 1414796 . PMID 16569694 .
- ^ Tisseur M, Kwapisz M, Morillon A (noviembre de 2011). "Transcripción generalizada - lecciones de la levadura". Biochimie . 93 (11): 1889–96. doi : 10.1016 / j.biochi.2011.07.001 . PMID 21771634 .
- ^ Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (junio de 2008). "El paisaje transcripcional del genoma de la levadura definido por secuenciación de ARN" . Ciencia . 320 (5881): 1344–9. Código Bibliográfico : 2008Sci ... 320.1344N . doi : 10.1126 / science.1158441 . PMC 2951732 . PMID 18451266 .
- ^ Clark MB, Amaral PP, Schlesinger FJ, Dinger ME, Taft RJ, Rinn JL, Ponting CP, Stadler PF, Morris KV, Morillon A, Rozowsky JS, Gerstein MB, Wahlestedt C, Hayashizaki Y, Carninci P, Gingeras TR, Mattick JS (Julio de 2011). "La realidad de la transcripción generalizada" . PLOS Biología . 9 (7): e1000625, discusión e1001102. doi : 10.1371 / journal.pbio.1000625 . PMC 3134446 . PMID 21765801 .
- ^ a b Ingolia NT, Brar GA, Stern-Ginossar N, Harris MS, Talhouarne GJ, Jackson SE, et al. (Septiembre de 2014). "El perfil del ribosoma revela una traducción generalizada fuera de los genes codificadores de proteínas anotados" . Informes de celda . 8 (5): 1365–79. doi : 10.1016 / j.celrep.2014.07.045 . PMC 4216110 . PMID 25159147 .
- ^ Ruiz-Orera J, Verdaguer-Grau P, Villanueva-Cañas JL, Messeguer X, Albà MM (mayo de 2018). "La traducción de péptidos de evolución neutra proporciona una base para la evolución de genes de novo". Ecología y evolución de la naturaleza . 2 (5): 890–896. doi : 10.1038 / s41559-018-0506-6 . hdl : 10230/36048 . PMID 29556078 . S2CID 4959952 .
- ^ Ruiz-Orera J, Messeguer X, Subirana JA, Alba MM (septiembre de 2014). "ARN largos no codificantes como fuente de nuevos péptidos" . eLife . 3 : e03523. arXiv : 1405.4174 . Código bibliográfico : 2014arXiv1405.4174R . doi : 10.7554 / eLife.03523 . PMC 4359382 . PMID 25233276 .
- ^ a b c Wilson BA, Masel J (2011). "Las transcripciones supuestamente no codificantes muestran una amplia asociación con los ribosomas" . Biología y evolución del genoma . 3 : 1245–52. doi : 10.1093 / gbe / evr099 . PMC 3209793 . PMID 21948395 .
- ^ Chen, J; Brunner, AD; Cogan, JZ; Nuñez, JK; Fields, AP; Adamson, B; Itzhak, DN; Li, JY; Mann, M; Leonetti, MD; Weissman, JS (6 de marzo de 2020). "Traducción funcional generalizada de marcos de lectura abiertos humanos no canónicos" . Ciencia . 367 (6482): 1140-1146. Código Bibliográfico : 2020Sci ... 367.1140C . doi : 10.1126 / science.aay0262 . PMC 7289059 . PMID 32139545 .
- ^ a b Silveira AB, Trontin C, Cortijo S, Barau J, Del Bem LE, Loudet O, et al. (Abril 2013). "Amplia variación epigenética natural en un gen originado de novo" . PLOS Genetics . 9 (4): e1003437. doi : 10.1371 / journal.pgen.1003437 . PMC 3623765 . PMID 23593031 .
- ^ Kimmins S, Sassone-Corsi P (marzo de 2005). "Remodelación de cromatina y características epigenéticas de las células germinales". Naturaleza . 434 (7033): 583–9. Código Bibliográfico : 2005Natur.434..583K . doi : 10.1038 / nature03368 . PMID 15800613 . S2CID 4373304 .
- ^ Dinger ME, Pang KC, Mercer TR, Mattick JS (noviembre de 2008). "Diferenciación de ARN codificante y no codificante de proteínas: desafíos y ambigüedades" . PLOS Biología Computacional . 4 (11): e1000176. Código Bibliográfico : 2008PLSCB ... 4E0176D . doi : 10.1371 / journal.pcbi.1000176 . PMC 2518207 . PMID 19043537 .
- ^ Stewart, Nicholas B .; Rogers, Rebekah L .; Malik, Harmit S. (23 de septiembre de 2019). "Reordenamientos cromosómicos como fuente de formación de nuevos genes en Drosophila yakuba" . PLOS Genetics . 15 (9): e1008314. doi : 10.1371 / journal.pgen.1008314 . PMC 6776367 . PMID 31545792 .
- ^ Swanson WJ, Vacquier VD (febrero de 2002). "La rápida evolución de las proteínas reproductivas". Nature Reviews Genética . 3 (2): 137–44. doi : 10.1038 / nrg733 . PMID 11836507 . S2CID 25696990 .
- ^ Bustamante CD, Fledel-Alon A, Williamson S, Nielsen R, Hubisz MT, Glanowski S, Tanenbaum DM, White TJ, Sninsky JJ, Hernandez RD, Civello D, Adams MD, Cargill M, Clark AG (octubre de 2005). "Selección natural de genes codificadores de proteínas en el genoma humano". Naturaleza . 437 (7062): 1153–7. Código Bibliográfico : 2005Natur.437.1153B . doi : 10.1038 / nature04240 . PMID 16237444 . S2CID 4423768 .
- ^ Clark NL, Aagaard JE, Swanson WJ (enero de 2006). "Evolución de proteínas reproductivas de animales y plantas" . Reproducción . 131 (1): 11-22. doi : 10.1530 / rep.1.00357 . PMID 16388004 .
- ^ Gubala AM, Schmitz JF, Kearns MJ, Vinh TT, Bornberg-Bauer E, Wolfner MF, Findlay GD (mayo de 2017). "Los genes de Goddard y Saturno son esenciales para la fertilidad masculina de Drosophila y pueden haber surgido de Novo" . Biología Molecular y Evolución . 34 (5): 1066–1082. doi : 10.1093 / molbev / msx057 . PMC 5400382 . PMID 28104747 .
- ^ a b c Luis Villanueva-Cañas J, Ruiz-Orera J, Agea MI, Gallo M, Andreu D, Albà MM (julio de 2017). "Nuevos genes e innovación funcional en mamíferos" . Biología y evolución del genoma . 9 (7): 1886-1900. doi : 10.1093 / gbe / evx136 . PMC 5554394 . PMID 28854603 .
- ^ Schmidt EE (julio de 1996). "Promiscuidad transcripcional en testículos". Biología actual . 6 (7): 768–9. doi : 10.1016 / S0960-9822 (02) 00589-4 . PMID 8805310 . S2CID 14318566 .
- ^ White-Cooper H, Davidson I (julio de 2011). "Aspectos únicos de la regulación de la transcripción en células germinales masculinas" . Perspectivas de Cold Spring Harbor en biología . 3 (7): a002626. doi : 10.1101 / cshperspect.a002626 . PMC 3119912 . PMID 21555408 .
- ^ Kleene KC (agosto de 2001). "Una posible función meiótica de los patrones peculiares de expresión génica en células espermatogénicas de mamíferos". Mecanismos de desarrollo . 106 (1–2): 3–23. doi : 10.1016 / S0925-4773 (01) 00413-0 . PMID 11472831 . S2CID 949694 .
- ^ a b c d Rajon E, Masel J (enero de 2011). "Evolución de las tasas de error molecular y las consecuencias para la capacidad de evolución" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (3): 1082–7. Código bibliográfico : 2011PNAS..108.1082R . doi : 10.1073 / pnas.1012918108 . PMC 3024668 . PMID 21199946 .
- ^ Masel, Joanna (marzo de 2006). "La variación genética críptica se enriquece para posibles adaptaciones" . Genética . 172 (3): 1985–1991. doi : 10.1534 / genetics.105.051649 . PMC 1456269 . PMID 16387877 .
- ^ Casola C (2018). "De novo a" de nono ": la mayoría de los genes codificadores de proteínas nuevos identificados con la filoestratigrafía representan genes antiguos o duplicados recientes" . bioRxiv . bioRxiv 10.1101 / 287193 . doi : 10.1101 / 287193 .
- ^ Willis S, Masel J (septiembre de 2018). "El nacimiento de genes contribuye al trastorno estructural codificado por genes superpuestos" . Genética . 210 (1): 303–313. doi : 10.1534 / genetics.118.301249 . PMC 6116962 . PMID 30026186 .
- ^ Abrusán G (diciembre de 2013). "Integración de nuevos genes en redes celulares y su maduración estructural" . Genética . 195 (4): 1407–17. doi : 10.1534 / genetics.113.152256 . PMC 3832282 . PMID 24056411 .
- ^ a b Vakirlis, Nikolaos; Acar, Omer; Hsu, Brian; Castilho Coelho, Nelson; Van Oss, S. Branden; Wacholder, Aaron; Medetgul-Ernar, Kate; Bowman, Ray W .; Hines, Cameron P .; Iannotta, John; Parikh, Saurin Bipin (7 de febrero de 2020). "Emergencia de novo de proteínas de membrana adaptativas de secuencias genómicas ricas en timina" . Comunicaciones de la naturaleza . 11 (1): 781. Bibcode : 2020NatCo..11..781V . doi : 10.1038 / s41467-020-14500-z . ISSN 2041-1723 . PMC 7005711 . PMID 32034123 .
- ^ Giacomelli, Michael G .; Hancock, Adam S .; Masel, Joanna (febrero de 2007). "La conversión de 3 ′ UTR en regiones de codificación" . Biología Molecular y Evolución . 24 (2): 457–464. doi : 10.1093 / molbev / msl172 . PMC 1808353 . PMID 17099057 .
- ^ a b c Bornberg-Bauer E, Schmitz J, Heberlein M (octubre de 2015). "Emergencia de proteínas de novo de 'materia genómica oscura' por 'crecer lento y mudar ' ". Transacciones de la sociedad bioquímica . 43 (5): 867–73. doi : 10.1042 / BST20150089 . PMID 26517896 .
- ^ Wilder, Jason A .; Hewett, Elizabeth K .; Gansner, Meredith E. (diciembre de 2009). "Evolución molecular de GYPC: evidencia de innovación estructural reciente y selección positiva en humanos" . Biología Molecular y Evolución . 26 (12): 2679–2687. doi : 10.1093 / molbev / msp183 . PMC 2775107 . PMID 19679754 .
- ^ Vakhrusheva, Anna A .; Kazanov, Marat D .; Mironov, Andrey A .; Bazykin, Georgii A. (17 de noviembre de 2010). "Evolución de genes procarióticos por desplazamiento de codones de parada". Revista de evolución molecular . 72 (2): 138-146. doi : 10.1007 / s00239-010-9408-1 . PMID 21082168 . S2CID 812377 .
- ^ Andreatta, Matthew E .; Levine, Joshua A .; Foy, Scott G .; Guzmán, Lynette D .; Kosinski, Luke J .; Cordes, Matthew HJ; Masel, Joanna (junio de 2015). "El reciente origen de novo de la proteína C-Termini" . Biología y evolución del genoma . 7 (6): 1686-1701. doi : 10.1093 / gbe / evv098 . PMC 4494051 . PMID 26002864 .
- ^ Kleppe AS, Bornberg-Bauer E (noviembre de 2018). "Robustez por terminación C intrínsecamente desordenada y lectura traslacional" . Investigación de ácidos nucleicos . 46 (19): 10184–10194. doi : 10.1093 / nar / gky778 . PMC 6365619 . PMID 30247639 .
- ^ Klasberg S, Bitard-Feildel T, Callebaut I, Bornberg-Bauer E (julio de 2018). "Orígenes y propiedades estructurales de dominios proteicos nuevos y de novo durante la evolución de los insectos" . La revista FEBS . 285 (14): 2605–2625. doi : 10.1111 / febs.14504 . PMID 29802682 .
- ^ Chen S, Krinsky BH, Long M (septiembre de 2013). "Nuevos genes como impulsores de la evolución fenotípica" . Nature Reviews Genética . 14 (9): 645–60. doi : 10.1038 / nrg3521 . PMC 4236023 . PMID 23949544 .
- ^ Suenaga Y, Islam SM, Alagu J, Kaneko Y, Kato M, Tanaka Y, et al. (Enero 2014). "NCYM, un gen Cis-antisentido de MYCN, codifica una proteína evolucionada de novo que inhibe GSK3β dando como resultado la estabilización de MYCN en neuroblastomas humanos" . PLOS Genetics . 10 (1): e1003996. doi : 10.1371 / journal.pgen.1003996 . PMC 3879166 . PMID 24391509 .
- ^ Lin B, White JT, Ferguson C, Bumgarner R, Friedman C, Trask B, et al. (Febrero de 2000). "PARTE-1: un nuevo gen regulado por andrógenos, específico de la próstata humana que se asigna al cromosoma 5q12". Investigación del cáncer . 60 (4): 858–63. PMID 10706094 .
- ^ Kang M, Ren M, Li Y, Fu Y, Deng M, Li C (julio de 2018). "La transferencia mediada por exosomas de lncRNA PART1 induce la resistencia a gefitinib en el carcinoma de células escamosas de esófago mediante su funcionamiento como un ARN endógeno competitivo" . Revista de investigación clínica y experimental del cáncer . 37 (1): 171. doi : 10.1186 / s13046-018-0845-9 . PMC 6063009 . PMID 30049286 .
- ^ Samusik N, Krukovskaya L, Meln I, Shilov E, Kozlov AP (2013). "PBOV1 es un gen humano de novo con expresión específica de tumor que se asocia con un resultado clínico positivo del cáncer" . PLOS ONE . 8 (2): e56162. Código Bibliográfico : 2013PLoSO ... 856162S . doi : 10.1371 / journal.pone.0056162 . PMC 3572036 . PMID 23418531 .
- ^ Guerzoni D, McLysaght A (abril de 2016). "Los genes de novo surgen a un ritmo lento pero constante a lo largo del linaje de los primates y han estado sujetos a una clasificación de linaje incompleta" . Biología y evolución del genoma . 8 (4): 1222–32. doi : 10.1093 / gbe / evw074 . PMC 4860702 . PMID 27056411 .
- ^ Pekarsky Y, Rynditch A, Wieser R, Fonatsch C, Gardiner K (septiembre de 1997). "Activación de un gen novedoso en 3q21 e identificación de transcripciones de fusión intergénicas con sitio de inserción viral ecotrópica I en leucemia". Investigación del cáncer . 57 (18): 3914–9. PMID 9307271 .
- ^ Papamichos SI, Margaritis D, Kotsianidis I (2015). "La evolución adaptativa junto con la exaptación de retrotransposón permite la generación de un gen codificador específico de proteínas humanas que promueve la proliferación de células cancerosas y metástasis en neoplasias hematológicas y tumores sólidos: el caso extraordinario del gen MYEOV" . Scientifica . 2015 : 984706. doi : 10.1155 / 2015/984706 . PMC 4629056 . PMID 26568894 .
- ^ a b Kozlov AP (2016). "Expresión de genes evolutivamente novedosos en tumores" . Agentes infecciosos y cáncer . 11 : 34. doi : 10.1186 / s13027-016-0077-6 . PMC 4949931 . PMID 27437030 .
- ^ Li CY, Zhang Y, Wang Z, Zhang Y, Cao C, Zhang PW, et al. (Marzo de 2010). "Un gen codificador de proteínas de novo específico para humanos asociado con las funciones del cerebro humano" . PLOS Biología Computacional . 6 (3): e1000734. Código Bibliográfico : 2010PLSCB ... 6E0734L . doi : 10.1371 / journal.pcbi.1000734 . PMC 2845654 . PMID 20376170 .
- ^ a b Zhang YE, Landback P, Vibranovski MD, Long M (octubre de 2011). "Reclutamiento acelerado de nuevos genes de desarrollo cerebral en el genoma humano" . PLOS Biología . 9 (10): e1001179. doi : 10.1371 / journal.pbio.1001179 . PMC 3196496 . PMID 22028629 .
- ^ Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A, et al. (Diciembre de 2014). "La transcripción dirigida por retrovirus endógenos específicos de primates define las células madre de tipo ingenuo" (PDF) . Naturaleza . 516 (7531): 405–9. Código bibliográfico : 2014Natur.516..405W . doi : 10.1038 / nature13804 . PMID 25317556 . S2CID 205240839 .
- ^ Dolstra H, Fredrix H, Maas F, Coulie PG, Brasseur F, Mensink E, et al. (Enero de 1999). "Un antígeno de histocompatibilidad menor humano específico para la leucemia linfoblástica aguda de células B" . La Revista de Medicina Experimental . 189 (2): 301–8. doi : 10.1084 / jem.189.2.301 . PMC 2192993 . PMID 9892612 .
- ^ Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D, et al. (Enero de 2009). "InterPro: la base de datos de firmas de proteínas integradoras" . Investigación de ácidos nucleicos . 37 (Problema de la base de datos): D211-5. doi : 10.1093 / nar / gkn785 . PMC 2686546 . PMID 18940856 .
- ^ Murphy DN, McLysaght A (2012). "Origen de novo de genes codificadores de proteínas en roedores murinos" . PLOS ONE . 7 (11): e48650. Código Bibliográfico : 2012PLoSO ... 748650M . doi : 10.1371 / journal.pone.0048650 . PMC 3504067 . PMID 23185269 .
- ^ Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR, et al. (Abril de 2019). "Rápida evolución de la diversidad proteica por origen de novo en Oryza". Ecología y evolución de la naturaleza . 3 (4): 679–690. doi : 10.1038 / s41559-019-0822-5 . PMID 30858588 . S2CID 73728579 .
- ^ Prabh, Neel; Rödelsperger, Christian (julio de 2019). "La divergencia y el origen mixto contribuyen a la aparición de genes huérfanos en nematodos" . G3: Genes, Genomas, Genética . 9 (7): 2277–2286. doi : 10.1534 / g3.119.400326 . PMC 6643871 . PMID 31088903 .