ADN no codificante secuencias son componentes de de un organismo de ADN que no codifican proteínas secuencias. Parte del ADN no codificante se transcribe en moléculas de ARN no codificantes funcionales (por ejemplo , ARN de transferencia , ARN ribosómico y ARN reguladores ). Otras funciones del ADN no codificante incluyen la regulación transcripcional y traduccional de secuencias codificantes de proteínas, regiones de unión al andamio , orígenes de la replicación del ADN , centrómeros y telómeros . Su ARNla contraparte es el ARN no codificante .
La cantidad de ADN no codificante varía mucho entre especies. A menudo, solo un pequeño porcentaje del genoma es responsable de codificar proteínas, pero se ha demostrado que un porcentaje cada vez mayor tiene funciones reguladoras. Cuando hay mucho ADN no codificante, una gran proporción parece no tener ninguna función biológica, como se predijo en la década de 1960. Desde entonces, esta porción no funcional se ha llamado de manera controvertida "ADN basura". [1]
El proyecto internacional Encyclopedia of DNA Elements ( ENCODE ) descubrió, mediante enfoques bioquímicos directos, que al menos el 80% del ADN genómico humano tiene actividad bioquímica, que definieron como transcrita, una definición que no comparte con la mayoría de los otros biólogos. [2] Aunque esto no fue necesariamente inesperado debido a décadas anteriores de investigación que descubrieron muchas regiones funcionales no codificantes, [3] [4] algunos científicos criticaron la conclusión por combinar la actividad bioquímica con la función biológica . [5] [6] [7] [8] [9] Las estimaciones de la fracción biológicamente funcional del genoma humano basadas en la genómica comparativa oscilan entre el 8 y el 15%. [10] [11] [12] Sin embargo, otros han argumentado en contra de depender únicamente de estimaciones de genómica comparativa debido a su alcance limitado. [ cita requerida ] Se ha descubierto que el ADN no codificante está involucrado en la actividad epigenética y en redes complejas de interacciones genéticas y se está explorando en la biología del desarrollo evolutivo . [4] [11] [13] [14]
Fracción de ADN genómico no codificante
La cantidad de ADN genómico total varía ampliamente entre organismos, y la proporción de ADN codificante y no codificante dentro de estos genomas también varía mucho. Por ejemplo, originalmente se sugirió que más del 98% del genoma humano no codifica secuencias de proteínas, incluidas la mayoría de las secuencias dentro de los intrones y la mayoría del ADN intergénico , [16] mientras que el 20% de un genoma procariota típico no es codificante. [3]
En eucariotas, genoma tamaño , y por extensión la cantidad de ADN no codificante, no está correlacionada con la complejidad organismo, una observación conocido como el C-valor enigma . [17] Por ejemplo, se ha informado que el genoma del unicelular Polychaos dubium (anteriormente conocido como Amoeba dubia ) contiene más de 200 veces la cantidad de ADN en los seres humanos. [18] El genoma del pez globo Takifugu rubripes tiene sólo una octava parte del tamaño del genoma humano, pero parece tener un número comparable de genes; aproximadamente el 90% del genoma de Takifugu es ADN no codificante. [16] Por lo tanto, la mayor parte de la diferencia en el tamaño del genoma no se debe a la variación en la cantidad de ADN codificante, sino a una diferencia en la cantidad de ADN no codificante. [19]
En 2013, se descubrió un nuevo "récord" para el genoma eucariota más eficiente con Utricularia gibba , una planta de bladderwort que tiene solo un 3% de ADN no codificante y un 97% de ADN codificante. La planta estaba eliminando partes del ADN no codificante y esto sugirió que el ADN no codificante puede no ser tan crítico para las plantas, aunque el ADN no codificante es útil para los seres humanos. [15] Otros estudios en plantas han descubierto funciones cruciales en porciones de ADN no codificante que antes se pensaba que eran insignificantes y han agregado una nueva capa a la comprensión de la regulación genética. [20]
Tipos de secuencias de ADN no codificantes
Elementos cis y transreguladores
Los elementos reguladores cis son secuencias que controlan la transcripción de un gen cercano. Muchos de estos elementos intervienen en la evolución y el control del desarrollo . [21] Los elementos cis pueden estar ubicados en regiones no traducidas 5 ' o 3' o dentro de intrones . Los elementos transreguladores controlan la transcripción de un gen distante.
Los promotores facilitan la transcripción de un gen particular y típicamente están aguas arriba de la región codificante. Las secuencias potenciadoras también pueden ejercer efectos muy distantes sobre los niveles de transcripción de genes. [22]
Intrones
Los intrones son secciones no codificantes de un gen, transcritas en la secuencia de ARNm precursora , pero finalmente eliminadas por empalme de ARN durante el procesamiento para obtener ARN mensajero maduro . Muchos intrones parecen ser elementos genéticos móviles . [23]
Los estudios de intrones del grupo I de protozoos de Tetrahymena indican que algunos intrones parecen ser elementos genéticos egoístas, neutrales para el huésped porque se eliminan de los exones flanqueantes durante el procesamiento del ARN y no producen un sesgo de expresión entre los alelos con y sin el intrón. [23] Algunos intrones parecen tener una función biológica significativa, posiblemente a través de la funcionalidad ribozima que puede regular la actividad del ARNt y el ARNr , así como la expresión de genes codificadores de proteínas, evidente en huéspedes que se han vuelto dependientes de tales intrones durante largos períodos de tiempo; por ejemplo, el intrón trnL se encuentra en todas las plantas verdes y parece haber sido heredado verticalmente durante varios miles de millones de años, incluidos más de mil millones de años dentro de los cloroplastos y entre dos y tres mil millones de años antes en los ancestros cianobacterianos de los cloroplastos. [23]
Pseudogenes
Los pseudogenes son secuencias de ADN, relacionadas con genes conocidos , que han perdido su capacidad de codificación de proteínas o ya no se expresan en la célula. Los pseudogenes surgen de la retrotransposición o la duplicación genómica de genes funcionales y se convierten en "fósiles genómicos" que no son funcionales debido a mutaciones que impiden la transcripción del gen, como dentro de la región promotora del gen, o alteran fatalmente la traducción del gen, como prematura codones de terminación o desplazamientos del marco . [24] Los pseudogenes resultantes de la retrotransposición de un intermedio de ARN se conocen como pseudogenes procesados; Los pseudogenes que surgen de los restos genómicos de genes duplicados o residuos de genes inactivados son pseudogenes no procesados. [24] Las transposiciones de genes mitocondriales que alguna vez fueron funcionales desde el citoplasma al núcleo, también conocidos como NUMT , también califican como un tipo de pseudogén común. [25] Los números se encuentran en muchos taxones eucariotas.
Si bien la ley de Dollo sugiere que la pérdida de función en los pseudogenes es probablemente permanente, los genes silenciados pueden conservar su función durante varios millones de años y pueden "reactivarse" en secuencias codificantes de proteínas [26] y un número sustancial de pseudogenes se transcriben activamente. [24] [27] Debido a que se presume que los pseudogenes cambian sin restricciones evolutivas, pueden servir como un modelo útil del tipo y frecuencias de varias mutaciones genéticas espontáneas . [28]
Repetir secuencias, transposones y elementos virales.
Los transposones y retrotransposones son elementos genéticos móviles . Las secuencias repetidas de retrotransposón , que incluyen elementos nucleares intercalados largos (LINE) y elementos nucleares intercalados cortos (SINE), representan una gran proporción de las secuencias genómicas en muchas especies. Las secuencias Alu , clasificadas como un elemento nuclear corto intercalado, son los elementos móviles más abundantes en el genoma humano. Se han encontrado algunos ejemplos de SINE que ejercen un control transcripcional de algunos genes que codifican proteínas. [29] [30] [31]
Las secuencias de retrovirus endógenas son el producto de la transcripción inversa de genomas de retrovirus en los genomas de células germinales . La mutación dentro de estas secuencias retro-transcritas puede inactivar el genoma viral. [32]
Más del 8% del genoma humano está formado por secuencias de retrovirus endógenas (en su mayoría decaídas), como parte de la fracción de más del 42% que se deriva de manera reconocible de retrotransposones, mientras que otro 3% puede identificarse como restos de transposones de ADN . Se espera que gran parte de la mitad restante del genoma que actualmente no tiene un origen explicado haya encontrado su origen en elementos transponibles que estuvieron activos hace tanto tiempo (> 200 millones de años) que mutaciones aleatorias los han vuelto irreconocibles. [33] La variación del tamaño del genoma en al menos dos tipos de plantas es principalmente el resultado de secuencias de retrotransposones. [34] [35]
Telómeros
Los telómeros son regiones de ADN repetitivo al final de un cromosoma , que brindan protección contra el deterioro cromosómico durante la replicación del ADN . Estudios recientes han demostrado que los telómeros funcionan para ayudar en su propia estabilidad. El ARN que contiene repeticiones teloméricas (TERRA) son transcripciones derivadas de los telómeros. Se ha demostrado que TERRA mantiene la actividad de la telomerasa y alarga los extremos de los cromosomas. [36]
ADN basura
El término "ADN basura" se hizo popular en la década de 1960. [37] [38] Según T. Ryan Gregory , la naturaleza del ADN basura fue discutida explícitamente por primera vez en 1972 por un biólogo genómico, David Comings, quien aplicó el término a todo el ADN no codificante. [39] El término fue formalizado ese mismo año por Susumu Ohno , [19] quien señaló que la carga mutacional de mutaciones deletéreas colocaba un límite superior en el número de loci funcionales que se podían esperar dada una tasa de mutación típica. Ohno planteó la hipótesis de que los genomas de los mamíferos no podrían tener más de 30.000 loci bajo selección antes de que el "coste" de la carga mutacional provocara una ineludible disminución de la aptitud y, finalmente, la extinción. Esta predicción sigue siendo sólida, con el genoma humano que contiene aproximadamente 20.000 genes (que codifican proteínas). Otra fuente de la teoría de Ohno fue la observación de que incluso especies estrechamente relacionadas pueden tener tamaños genómicos muy diferentes (órdenes de magnitud), lo que se denominó la paradoja del valor C en 1971. [6]
El término "ADN basura" ha sido cuestionado sobre la base de que provoca una fuerte suposición a priori de no funcionalidad total y algunos han recomendado utilizar en su lugar terminología más neutra, como "ADN no codificante". [39] Sin embargo, el "ADN basura" sigue siendo una etiqueta para las porciones de una secuencia del genoma para las que no se ha identificado una función discernible y que a través del análisis de genómica comparativa no aparece ninguna restricción funcional, lo que sugiere que la secuencia en sí no ha proporcionado ninguna ventaja adaptativa .
Desde finales de los años 70 se ha hecho evidente que la mayoría del ADN no codificante en genomas grandes tiene su origen en la amplificación egoísta de elementos transponibles , de los cuales W. Ford Doolittle y Carmen Sapienza en 1980 escribieron en la revista Nature : "Cuando un dado ADN, o clase de ADN, de función fenotípica no probada puede demostrarse que ha desarrollado una estrategia (como la transposición) que asegura su supervivencia genómica, entonces no es necesaria otra explicación de su existencia ". [40] Se puede esperar que la cantidad de ADN basura dependa de la velocidad de amplificación de estos elementos y la velocidad a la que se pierde el ADN no funcional. [41] En el mismo número de Nature , Leslie Orgel y Francis Crick escribieron que el ADN basura tiene "poca especificidad y transmite poca o ninguna ventaja selectiva al organismo". [42] El término aparece principalmente en la ciencia popular y de manera coloquial en las publicaciones científicas, y se ha sugerido que sus connotaciones pueden haber retrasado el interés por las funciones biológicas del ADN no codificante. [43]
Alguna evidencia indica que algunas secuencias de "ADN basura" son fuentes de actividad funcional (futura) en la evolución a través de la exaptación de ADN originalmente egoísta o no funcional. [44]
Proyecto ENCODE
En 2012, el proyecto ENCODE , un programa de investigación apoyado por el Instituto Nacional de Investigación del Genoma Humano , informó que el 76% de las secuencias de ADN no codificantes del genoma humano se transcribieron y que casi la mitad del genoma era de alguna manera accesible para las proteínas reguladoras genéticas. como los factores de transcripción . [1] Sin embargo, la sugerencia de ENCODE de que más del 80% del genoma humano es bioquímicamente funcional ha sido criticada por otros científicos, [5] quienes argumentan que ni la accesibilidad de los segmentos del genoma a los factores de transcripción ni su transcripción garantiza que esos segmentos tienen función bioquímica y que su transcripción es selectivamente ventajosa . Después de todo, las secciones no funcionales del genoma se pueden transcribir, dado que los factores de transcripción generalmente se unen a secuencias cortas que se encuentran (al azar) en todo el genoma. [45]
Además, las estimaciones mucho más bajas de funcionalidad antes de ENCODE se basaron en estimaciones de conservación genómica a través de linajes de mamíferos. [6] [7] [8] [9] La transcripción generalizada y el empalme en el genoma humano se ha discutido como otro indicador de la función genética además de la conservación genómica que puede pasar por alto secuencias funcionales mal conservadas. [11] Además, gran parte del aparente ADN basura está involucrado en la regulación epigenética y parece ser necesario para el desarrollo de organismos complejos. [4] [13] [14] Los enfoques genéticos pueden pasar por alto elementos funcionales que no se manifiestan físicamente en el organismo, los enfoques evolutivos tienen dificultades para usar alineamientos precisos de secuencias de múltiples especies, ya que los genomas de especies incluso estrechamente relacionadas varían considerablemente, y con enfoques bioquímicos , aunque tienen alta reproducibilidad, las firmas bioquímicas no siempre significan automáticamente una función. [11] Kellis y col. señaló que el 70% de la cobertura de la transcripción era menos de 1 transcripción por célula (y por lo tanto puede basarse en una transcripción de fondo falsa). Por otro lado, argumentaron que la fracción del 12-15% del ADN humano puede estar bajo restricción funcional y aún puede ser una subestimación cuando se incluyen restricciones específicas de linaje. En última instancia, los enfoques genéticos, evolutivos y bioquímicos pueden utilizarse de forma complementaria para identificar regiones que pueden ser funcionales en la biología y la enfermedad humanas. [11] Algunos críticos han argumentado que la funcionalidad solo puede evaluarse en referencia a una hipótesis nula apropiada . En este caso, la hipótesis nula sería que estas partes del genoma no son funcionales y tienen propiedades, ya sea sobre la base de la conservación o la actividad bioquímica, que se esperarían de tales regiones según nuestro conocimiento general de la evolución molecular y bioquímica . Según estos críticos, hasta que se demuestre que una región en cuestión tiene características adicionales, más allá de lo que se espera de la hipótesis nula, debería etiquetarse provisionalmente como no funcional. [46]
Evidencia de funcionalidad
Algunas secuencias de ADN no codificantes deben tener alguna función biológica importante. Esto está indicado por estudios de genómica comparativa que informan sobre regiones altamente conservadas de ADN no codificante , a veces en escalas de tiempo de cientos de millones de años. Esto implica que estas regiones no codificantes están bajo una fuerte presión evolutiva y una selección positiva . [47] Por ejemplo, en los genomas de humanos y ratones , que divergieron de un ancestro común hace 65 a 75 millones de años, las secuencias de ADN que codifican proteínas representan solo alrededor del 20% del ADN conservado, y el 80% restante del ADN conservado. representado en regiones no codificantes. [48] El mapeo de ligamiento a menudo identifica regiones cromosómicas asociadas con una enfermedad sin evidencia de variantes codificantes funcionales de genes dentro de la región, lo que sugiere que las variantes genéticas que causan enfermedades se encuentran en el ADN no codificante. [48] En abril de 2013 se exploró la importancia de las mutaciones no codificantes del ADN en el cáncer. [49]
Los polimorfismos genéticos no codificantes juegan un papel en la susceptibilidad a enfermedades infecciosas, como la hepatitis C. [50] Además, los polimorfismos genéticos no codificantes contribuyen a la susceptibilidad al sarcoma de Ewing , un cáncer de hueso pediátrico agresivo. [51]
Algunas secuencias específicas de ADN no codificante pueden ser características esenciales para la estructura cromosómica, la función del centrómero y el reconocimiento de cromosomas homólogos durante la meiosis . [52]
Según un estudio comparativo de más de 300 genomas procariotas y más de 30 eucariotas , [53] los eucariotas parecen requerir una cantidad mínima de ADN no codificante. La cantidad se puede predecir utilizando un modelo de crecimiento para redes genéticas reguladoras, lo que implica que es necesario para fines regulatorios. En los seres humanos, el mínimo previsto es aproximadamente el 5% del genoma total.
Más del 10% de los 32 genomas de mamíferos pueden funcionar mediante la formación de estructuras secundarias específicas de ARN . [54] El estudio utilizó genómica comparativa para identificar mutaciones compensatorias del ADN que mantienen los pares de bases del ARN, una característica distintiva de las moléculas de ARN . Más del 80% de las regiones genómicas que presentan evidencia evolutiva de la conservación de la estructura del ARN no presentan una fuerte conservación de la secuencia del ADN.
El ADN no codificante quizás sirva para disminuir la probabilidad de alteración genética durante el cruce cromosómico . [55]
Evidencia de puntajes poligénicos y GWAS
Los estudios de asociación de todo el genoma (GWAS) y el análisis de aprendizaje automático de grandes conjuntos de datos genómicos han llevado a la construcción de predictores poligénicos para rasgos humanos como la altura, la densidad ósea y muchos riesgos de enfermedades. Existen predictores similares para especies de plantas y animales y se utilizan en la cría agrícola. [57] Se ha analizado la arquitectura genética detallada de los predictores humanos y los efectos significativos utilizados en la predicción están asociados con regiones de ADN muy alejadas de las regiones de codificación. La fracción de varianza explicada (es decir, la fracción del poder predictivo capturado por el predictor) en regiones codificantes frente a no codificantes varía ampliamente para diferentes rasgos complejos. Por ejemplo, la fibrilación auricular y el riesgo de enfermedad de las arterias coronarias se controlan principalmente mediante variantes en regiones no codificantes (fracción de varianza no codificante superior al 70%), mientras que la diabetes y el colesterol alto muestran el patrón opuesto (varianza no codificante de aproximadamente 20-30%). ). [56] Las diferencias individuales entre humanos se ven claramente afectadas de manera significativa por loci genéticos no codificantes, lo cual es una fuerte evidencia de efectos funcionales. Los genotipos del exoma completo (es decir, que contienen información restringida a las regiones codificantes solamente) no contienen suficiente información para construir o incluso evaluar predictores poligénicos para muchos rasgos complejos y riesgos de enfermedades bien estudiados.
En 2013, se estimó que, en general, hasta el 85% de los loci GWAS tienen variantes no codificantes como probable asociación causal. Las variantes a menudo son comunes en las poblaciones y se predijo que afectarían los riesgos de enfermedad a través de pequeños efectos fenotípicos, en contraposición a los grandes efectos de las variantes mendelianas . [58]
Regulación de la expresión génica
Algunas secuencias de ADN no codificantes determinan los niveles de expresión de varios genes, tanto los que se transcriben a proteínas como los que ellos mismos están involucrados en la regulación de genes. [59] [60] [61]
Factores de transcripción
Algunas secuencias de ADN no codificantes determinan dónde se unen los factores de transcripción. [59] Un factor de transcripción es una proteína que se une a secuencias específicas de ADN no codificantes, controlando así el flujo (o transcripción) de información genética desde el ADN al ARNm. [62] [63]
Operadores
Un operador es un segmento de ADN al que se une un represor . Un represor es una proteína de unión al ADN que regula la expresión de uno o más genes uniéndose al operador y bloqueando la unión de la ARN polimerasa al promotor, evitando así la transcripción de los genes. Este bloqueo de la expresión se llama represión. [64]
Potenciadores
Un potenciador es una región corta de ADN que se puede unir a proteínas ( factores que actúan en trans ), al igual que un conjunto de factores de transcripción, para mejorar los niveles de transcripción de genes en un grupo de genes. [sesenta y cinco]
Silenciadores
Un silenciador es una región del ADN que inactiva la expresión génica cuando se une a una proteína reguladora. Funciona de una manera muy similar a los potenciadores, solo difiriendo en la inactivación de genes. [66]
Promotores
Un promotor es una región de ADN que facilita la transcripción de un gen en particular cuando un factor de transcripción se une a él. Los promotores suelen estar ubicados cerca de los genes que regulan y corriente arriba de ellos. [67]
Aislantes
Un aislante genético es un elemento límite que desempeña dos funciones distintas en la expresión génica, ya sea como un código de bloqueo del potenciador o, raramente, como una barrera contra la cromatina condensada. Un aislante en una secuencia de ADN es comparable a un divisor de palabras lingüísticas , como una coma en una oración, porque el aislante indica dónde termina una secuencia mejorada o reprimida. [68]
Usos
Evolución
Las secuencias compartidas de ADN aparentemente no funcional son una línea importante de evidencia de ascendencia común . [69]
Las secuencias de pseudogenes parecen acumular mutaciones más rápidamente que las secuencias codificantes debido a una pérdida de presión selectiva. [28] Esto permite la creación de alelos mutantes que incorporan nuevas funciones que pueden ser favorecidas por la selección natural; así, los pseudogenes pueden servir como materia prima para la evolución y pueden considerarse "protogenes". [70]
Un estudio publicado en 2019 muestra que se pueden crear nuevos genes (denominados nacimiento de genes de novo ) a partir de regiones no codificantes. [71] Algunos estudios sugieren que al menos una décima parte de los genes podrían producirse de esta manera. [71]
Correlaciones de largo alcance
Se ha encontrado una distinción estadística entre secuencias de ADN codificantes y no codificantes. Se ha observado que los nucleótidos en secuencias de ADN no codificantes muestran correlaciones de leyes de potencia de largo alcance, mientras que las secuencias codificantes no lo hacen. [72] [73] [74]
Antropología Forense
La policía a veces recopila ADN como prueba para fines de identificación forense . Como se describe en Maryland v. King , una decisión de la Corte Suprema de los Estados Unidos de 2013: [75]
El estándar actual para las pruebas forenses de ADN se basa en un análisis de los cromosomas ubicados dentro del núcleo de todas las células humanas. 'El material de ADN en los cromosomas se compone de regiones "codificantes" y "no codificantes". Las regiones codificantes se conocen como genes y contienen la información necesaria para que una célula produzca proteínas. . . . Regiones no codificantes de proteínas. . . no están relacionados directamente con la producción de proteínas, [y] se les ha denominado ADN "basura". El adjetivo "basura" puede engañar al profano, porque de hecho esta es la región del ADN que se usa con casi certeza para identificar a una persona. [75]
Ver también
- Secuencia no codificante conservada
- Estructura fina del cromosoma eucariota
- Visión de la evolución centrada en los genes
- Red reguladora de genes
- Región intergénica
- Conflicto intragenómico
- Huella filogenética
- Transcriptoma
- ARN no codificante
- Desierto genético
- La prueba de la cebolla
Referencias
- ^ a b Pennisi E (septiembre de 2012). "Genómica. Proyecto ENCODE escribe elogio para el ADN basura". Ciencia . 337 (6099): 1159-1161. doi : 10.1126 / science.337.6099.1159 . PMID 22955811 .
- ^ Consorcio del Proyecto ENCODE (septiembre de 2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano" . Naturaleza . 489 (7414): 57–74. Código Bibliográfico : 2012Natur.489 ... 57T . doi : 10.1038 / nature11247 . PMC 3439153 . PMID 22955616 ..
- ^ a b Costa F (2012). "7 ARN no codificantes, epigenómica y complejidad en células humanas". En Morris KV (ed.). ARN no codificantes y regulación epigenética de la expresión génica: impulsores de la selección natural . Prensa Académica Caister . ISBN 978-1904455943.
- ^ a b c Carey M. (2015). ADN basura: un viaje a través de la materia oscura del genoma . Prensa de la Universidad de Columbia. ISBN 9780231170840.
- ^ a b McKie R (24 de febrero de 2013). "Los científicos atacados por afirmar que el 'ADN basura' es vital para la vida" . El observador .
- ^ a b c Eddy SR (noviembre de 2012). "La paradoja del valor C, ADN basura y ENCODE" . Biología actual . 22 (21): R898–9. doi : 10.1016 / j.cub.2012.10.002 . PMID 23137679 . S2CID 28289437 .
- ^ a b Doolittle WF (abril de 2013). "¿Es el ADN basura una tontería? Una crítica de ENCODE" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (14): 5294–300. Código bibliográfico : 2013PNAS..110.5294D . doi : 10.1073 / pnas.1221376110 . PMC 3619371 . PMID 23479647 .
- ^ a b Palazzo AF, Gregory TR (mayo de 2014). "El caso del ADN basura" . PLOS Genetics . 10 (5): e1004351. doi : 10.1371 / journal.pgen.1004351 . PMC 4014423 . PMID 24809441 .
- ^ a b Graur D, Zheng Y, Price N, Azevedo RB, Zufall RA, Elhaik E (2013). "Sobre la inmortalidad de los televisores:" función "en el genoma humano según el evangelio libre de evolución de ENCODE" . Biología y evolución del genoma . 5 (3): 578–90. doi : 10.1093 / gbe / evt028 . PMC 3622293 . PMID 23431001 .
- ^ Ponting CP, Hardison RC (noviembre de 2011). "¿Qué fracción del genoma humano es funcional?" . Investigación del genoma . 21 (11): 1769–76. doi : 10.1101 / gr.116814.110 . PMC 3205562 . PMID 21875934 .
- ^ a b c d e Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, et al. (Abril de 2014). "Definición de elementos funcionales del ADN en el genoma humano" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 111 (17): 6131–8. Código bibliográfico : 2014PNAS..111.6131K . doi : 10.1073 / pnas.1318948111 . PMC 4035993 . PMID 24753594 .
- ^ Rands CM, Meader S, Ponting CP, Lunter G (julio de 2014). "El 8,2% del genoma humano está restringido: variación en las tasas de rotación entre clases de elementos funcionales en el linaje humano" . PLOS Genetics . 10 (7): e1004525. doi : 10.1371 / journal.pgen.1004525 . PMC 4109858 . PMID 25057982 .
- ^ a b Mattick JS (2013). "El alcance de la funcionalidad en el genoma humano" . El diario HUGO . 7 (1): 2. doi : 10.1186 / 1877-6566-7-2 . PMC 4685169 .
- ^ a b Morris K, ed. (2012). ARN no codificantes y regulación epigenética de la expresión génica: impulsores de la selección natural . Norfolk, Reino Unido: Caister Academic Press. ISBN 978-1904455943.
- ^ a b "Planta récord mundial: elimina su ADN" basura "no codificante" . Diseño y tendencia . 12 de mayo de 2013 . Consultado el 4 de junio de 2013 .
- ^ a b Elgar G, Vavouri T (julio de 2008). "Sintonización de las señales: conservación de secuencias no codificantes en genomas de vertebrados". Tendencias en Genética . 24 (7): 344–52. doi : 10.1016 / j.tig.2008.04.005 . PMID 18514361 .
- ^ Thomas CA (1971). "La organización genética de los cromosomas". Revisión anual de genética . 5 : 237–56. doi : 10.1146 / annurev.ge.05.120171.001321 . PMID 16097657 .
- ^ Gregory TR, Hebert PD (abril de 1999). "La modulación del contenido de ADN: causas próximas y consecuencias últimas". Investigación del genoma . 9 (4): 317–24. doi : 10.1101 / gr.9.4.317 (inactivo 2021-01-16). PMID 10207154 .Mantenimiento de CS1: DOI inactivo a partir de enero de 2021 ( enlace )
- ^ a b Ohno S (1972). Smith HH (ed.). "Tanto ADN" basura "en nuestro genoma" . Simposios de Brookhaven en Biología . Gordon and Breach, Nueva York. 23 : 366–70. PMID 5065367 . Consultado el 15 de mayo de 2013 .
- ^ Waterhouse PM, Hellens RP (abril de 2015). "Biología vegetal: codificación en ARN no codificantes" . Naturaleza . 520 (7545): 41–2. Código Bib : 2015Natur.520 ... 41W . doi : 10.1038 / nature14378 . PMID 25807488 . S2CID 205243381 .
- ^ Carroll SB (julio de 2008). "Evo-devo y una síntesis evolutiva en expansión: una teoría genética de la evolución morfológica". Celular . 134 (1): 25–36. doi : 10.1016 / j.cell.2008.06.030 . PMID 18614008 . S2CID 2513041 .
- ^ Visel A, Rubin EM, Pennacchio LA (septiembre de 2009). "Vistas genómicas de potenciadores de acción a distancia" . Naturaleza . 461 (7261): 199–205. Código Bibliográfico : 2009Natur.461..199V . doi : 10.1038 / nature08451 . PMC 2923221 . PMID 19741700 .
- ^ a b c Nielsen H, Johansen SD (2009). "Intrones del grupo I: moviéndose en nuevas direcciones" . Biología del ARN . 6 (4): 375–83. doi : 10.4161 / rna.6.4.9334 . PMID 19667762 . S2CID 30342385 .
- ^ a b c Zheng D, Frankish A, Baertsch R, Kapranov P, Reymond A, Choo SW, Lu Y, Denoeud F, Antonarakis SE, Snyder M, Ruan Y, Wei CL, Gingeras TR, Guigó R, Harrow J, Gerstein MB (junio de 2007 ). "Pseudogenes en las regiones ENCODE: anotación de consenso, análisis de transcripción y evolución" . Investigación del genoma . 17 (6): 839–51. doi : 10.1101 / gr.5586307 . PMC 1891343 . PMID 17568002 .
- ^ López JV, Yuhki N, Masuda R, Modi W, O'Brien SJ (1994). " Numt , una reciente transferencia y amplificación en tándem de ADN mitocondrial al genoma nuclear del gato doméstico" . Revista de evolución molecular . 39 (2): 174-190. doi : 10.1007 / bf00163806 (inactivo 2021-01-16). PMID 7932781 .Mantenimiento de CS1: DOI inactivo a partir de enero de 2021 ( enlace )
- ^ Marshall CR, Raff EC, Raff RA (diciembre de 1994). "Ley de Dollo y muerte y resurrección de genes" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 91 (25): 12283–7. Código bibliográfico : 1994PNAS ... 9112283M . doi : 10.1073 / pnas.91.25.12283 . PMC 45421 . PMID 7991619 .
- ^ Tutar Y (2012). "Pseudogenes" . Genómica comparativa y funcional . 2012 : 1–4. doi : 10.1155 / 2012/424526 . PMC 3352212 . PMID 22611337 .
- ^ a b Petrov DA, Hartl DL (2000). "Evolución de pseudogenes y selección natural para un genoma compacto" . El diario de la herencia . 91 (3): 221–7. doi : 10.1093 / jhered / 91.3.221 . PMID 10833048 .
- ^ Ponicsan SL, Kugel JF, Goodrich JA (abril de 2010). "Gemas genómicas: SINE RNAs regulan la producción de mRNA" . Opinión Actual en Genética y Desarrollo . 20 (2): 149–55. doi : 10.1016 / j.gde.2010.01.004 . PMC 2859989 . PMID 20176473 .
- ^ Häsler J, Samuelsson T, Strub K (julio de 2007). "Útil 'basura': Alu ARN en el transcriptoma humano" . Ciencias de la vida celular y molecular (manuscrito enviado). 64 (14): 1793–800. doi : 10.1007 / s00018-007-7084-0 . PMID 17514354 . S2CID 5938630 .
- ^ Walters RD, Kugel JF, Goodrich JA (agosto de 2009). "Basura invAluable: el impacto celular y la función de los ARN Alu y B2" . IUBMB Life . 61 (8): 831–7. doi : 10.1002 / iub.227 . PMC 4049031 . PMID 19621349 .
- ^ Nelson PN, Hooley P, Roden D, Davari Ejtehadi H, Rylance P, Warren P, Martin J, Murray PG (octubre de 2004). "Retrovirus endógenos humanos: ¿elementos transponibles con potencial?" . Inmunología clínica y experimental . 138 (1): 1–9. doi : 10.1111 / j.1365-2249.2004.02592.x . PMC 1809191 . PMID 15373898 .
- ^ Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, et al. (Febrero de 2001). "Secuenciación inicial y análisis del genoma humano" . Naturaleza . 409 (6822): 860–921. Código Bib : 2001Natur.409..860L . doi : 10.1038 / 35057062 . PMID 11237011 .
- ^ Piegu B, Guyot R, Picault N, Roulin A, Sanyal A, Saniyal A, Kim H, Collura K, Brar DS, Jackson S, Wing RA, Panaud O (octubre de 2006). "Duplicar el tamaño del genoma sin poliploidización: dinámica de expansiones genómicas impulsadas por retrotransposición en Oryza australiensis, un pariente silvestre del arroz" . Investigación del genoma . 16 (10): 1262–9. doi : 10.1101 / gr.5290206 . PMC 1581435 . PMID 16963705 .
- ^ Hawkins JS, Kim H, Nason JD, Wing RA, Wendel JF (octubre de 2006). "La amplificación diferencial específica de linaje de elementos transponibles es responsable de la variación del tamaño del genoma en Gossypium" . Investigación del genoma . 16 (10): 1252–61. doi : 10.1101 / gr.5282906 . PMC 1581434 . PMID 16954538 .
- ^ Cusanelli E, Chartrand P (mayo de 2014). "ARN telomérico no codificante: ARN que contiene repetición telomérica en biología de telómeros". Revisiones interdisciplinarias de Wiley: ARN . 5 (3): 407-19. doi : 10.1002 / wrna.1220 . PMID 24523222 . S2CID 36918311 .
- ^ Ehret CF, De Haller G (octubre de 1963). "Origen, desarrollo y maduración de orgánulos y sistemas de orgánulos de la superficie celular en Paramecium". Revista de investigación de ultraestructura . 23 : SUPPL6: 1–42. doi : 10.1016 / S0022-5320 (63) 80088-X . PMID 14073743 .
- ^ Dan Graur, El origen del ADN basura: una novela histórica
- ^ a b TR, ed. (2005). La evolución del genoma . Elsevier. págs. 29–31. ISBN 978-0123014634.
Comings (1972), por otro lado, dio lo que debe considerarse la primera discusión explícita de la naturaleza del "ADN basura", y fue el primero en aplicar el término a todo el ADN no codificante ";" Por esta razón, Es poco probable que una sola función del ADN no codificante pueda explicar su gran masa o su distribución desigual entre los taxones. Sin embargo, descartarlo como nada más que "basura" en el sentido peyorativo de "inútil" o "derrochador" hace poco para avanzar en la comprensión de la evolución del genoma. Por esta razón, el término "ADN no codificante", mucho menos cargado, se utiliza a lo largo de este capítulo y se recomienda en lugar de "ADN basura" para futuros tratamientos del tema ".
- ^ Doolittle WF, Sapienza C (abril de 1980). "Genes egoístas, el paradigma del fenotipo y la evolución del genoma". Naturaleza . 284 (5757): 601–3. Código Bibliográfico : 1980Natur.284..601D . doi : 10.1038 / 284601a0 . PMID 6245369 . S2CID 4311366 .
- ^ Otra fuente es la duplicación del genoma seguida de una pérdida de función debido a la redundancia.
- ^ Orgel LE, Crick FH (abril de 1980). "ADN egoísta: el último parásito". Naturaleza . 284 (5757): 604–7. Código Bibliográfico : 1980Natur.284..604O . doi : 10.1038 / 284604a0 . PMID 7366731 . S2CID 4233826 .
- ^ Khajavinia A, Makalowski W (mayo de 2007). "¿Qué es el ADN" basura "y cuánto vale?". Scientific American . 296 (5): 104. Código Bibliográfico : 2007SciAm.296c.104. . doi : 10.1038 / scientificamerican0307-104 . PMID 17503549 .
El término "ADN basura" repelió a los principales investigadores de estudiar material genético no codificante durante muchos años.
- ^ Biémont C, Vieira C (octubre de 2006). "Genética: ADN basura como fuerza evolutiva". Naturaleza . 443 (7111): 521–4. Código Bibliográfico : 2006Natur.443..521B . doi : 10.1038 / 443521a . PMID 17024082 . S2CID 205033991 .
- ^ Lambert SA, Jolma A, Campitelli LF, Das PK, Yin Y, Albu M, et al. (Febrero de 2018). "Los factores de transcripción humana" . Celular . 172 (4): 650–665. doi : 10.1016 / j.cell.2018.01.029 . PMID 29425488 . S2CID 3599827 .
- ^ Palazzo AF, Lee ES (2015). "ARN no codificante: ¿qué es funcional y qué es basura?" . Fronteras en genética . 6 : 2. doi : 10.3389 / fgene.2015.00002 . PMC 4306305 . PMID 25674102 .
- ^ Ludwig MZ (diciembre de 2002). "Evolución funcional del ADN no codificante". Opinión Actual en Genética y Desarrollo . 12 (6): 634–9. doi : 10.1016 / S0959-437X (02) 00355-6 . PMID 12433575 .
- ^ a b Cobb J, Büsst C, Petrou S, Harrap S, Ellis J (abril de 2008). "Búsqueda de variantes genéticas funcionales en ADN no codificante". Farmacología y fisiología clínica y experimental . 35 (4): 372–5. doi : 10.1111 / j.1440-1681.2008.04880.x . PMID 18307723 . S2CID 2000913 .
- ^ Khurana E, Fu Y, Colonna V, Mu XJ, Kang HM, Lappalainen T, et al. (Octubre 2013). "Anotación integradora de variantes de 1092 humanos: aplicación a la genómica del cáncer" . Ciencia . 342 (6154): 1235587. doi : 10.1126 / science.1235587 . hdl : 11858 / 00-001M-0000-0019-02F5-1 . PMC 3947637 . PMID 24092746 .
- ^ Lu YF, Mauger DM, Goldstein DB, Urban TJ, Weeks KM, Bradrick SS (noviembre de 2015). "La estructura del ARNm de IFNL3 está remodelada por un polimorfismo funcional no codificante asociado con la eliminación del virus de la hepatitis C" . Informes científicos . 5 : 16037. Código Bibliográfico : 2015NatSR ... 516037L . doi : 10.1038 / srep16037 . PMC 4631997 . PMID 26531896 .
- ^ Grünewald TG, Bernard V, Gilardi-Hebenstreit P, Raynal V, Surdez D, Aynaud MM, et al. (Septiembre de 2015). "EWSR1-FLI1 quimérico regula el gen de susceptibilidad al sarcoma de Ewing EGR2 a través de un microsatélite GGAA" . Genética de la naturaleza . 47 (9): 1073–8. doi : 10.1038 / ng.3363 . PMC 4591073 . PMID 26214589 .
- ^ Subirana JA, Messeguer X (marzo de 2010). "Las secuencias cortas más frecuentes en ADN no codificante" . Investigación de ácidos nucleicos . 38 (4): 1172–81. doi : 10.1093 / nar / gkp1094 . PMC 2831315 . PMID 19966278 .
- ^ Ahnert SE, Fink TM , Zinovyev A (junio de 2008). "¿Cuánto ADN no codificante requieren los eucariotas?". Revista de Biología Teórica . 252 (4): 587–92. arXiv : q-bio / 0611047 . doi : 10.1016 / j.jtbi.2008.02.005 . PMID 18384817 . S2CID 1717725 .
- ^ Smith MA, Gesell T, Stadler PF, Mattick JS (septiembre de 2013). "Selección purificadora generalizada sobre la estructura del ARN en mamíferos" . Investigación de ácidos nucleicos . 41 (17): 8220–36. doi : 10.1093 / nar / gkt596 . PMC 3783177 . PMID 23847102 .
- ^ Dileep V (2009). "El lugar y la función del ADN no codificante en la evolución de la variabilidad". Hipótesis . 7 (1): e7.
- ^ a b Yong SY, Raben TG, Lello L, Hsu SD (21 de julio de 2020). "Arquitectura genética de rasgos complejos y predictores de riesgo de enfermedad" . Informes científicos (10). doi : 10.1038 / s41598-020-68881-8 . PMC 7374622 . PMID 32694572 .
- ^ Wray NR, Kemper KE, Hayes BJ, Goddard ME, Visscher PM (abril de 2019). "Predicción de rasgos complejos a partir de datos del genoma: contrastar EBV en ganado con PRS en humanos: predicción genómica" . Genética . 211 (4): 1131-1141. doi : 10.1534 / genetics.119.301859 . PMC 6456317 . PMID 30967442 .
- ^ Pennachio LA, Bickmore W, Dean A, Nobrega MA, Bejerano G (18 de marzo de 2013). "Potenciadores: cinco preguntas esenciales" . Nature Review Genetics (14): 288–295. doi : 10.1038 / nrg3458 . PMC 4445073 . PMID 23503198 .
- ^ a b Callaway, Ewen (March 2010). "Junk DNA gets credit for making us who we are". New Scientist.
- ^ Carroll SB, Prud'homme B, Gompel N (May 2008). "Regulating evolution". Scientific American. 298 (5): 60–7. Bibcode:2008SciAm.298e..60C. doi:10.1038/scientificamerican0508-60. PMID 18444326.
- ^ Stojic L, Niemczyk M, Orjalo A, Ito Y, Ruijter AE, Uribe-Lewis S, Joseph N, Weston S, Menon S, Odom DT, Rinn J, Gergely F, Murrell A (February 2016). "Transcriptional silencing of long noncoding RNA GNG12-AS1 uncouples its transcriptional and product-related functions". Nature Communications. 7: 10406. Bibcode:2016NatCo...710406S. doi:10.1038/ncomms10406. PMC 4740813. PMID 26832224.
- ^ Latchman DS (December 1997). "Transcription factors: an overview". The International Journal of Biochemistry & Cell Biology. 29 (12): 1305–12. doi:10.1016/S1357-2725(97)00085-X. PMC 2002184. PMID 9570129.
- ^ Karin M (February 1990). "Too many transcription factors: positive and negative interactions". The New Biologist. 2 (2): 126–31. PMID 2128034.
- ^ Lewin B (1990). Genes IV (4th ed.). Oxford: Oxford University Press. pp. 243–58. ISBN 978-0-19-854267-4.
- ^ Blackwood EM, Kadonaga JT (July 1998). "Going the distance: a current view of enhancer action". Science. 281 (5373): 60–3. Bibcode:1998Sci...281...60.. doi:10.1126/science.281.5373.60. PMID 9679020. S2CID 11666739.
- ^ Maston GA, Evans SK, Green MR (2006). "Transcriptional regulatory elements in the human genome". Annual Review of Genomics and Human Genetics. 7: 29–59. doi:10.1146/annurev.genom.7.080505.115623. PMID 16719718. S2CID 12346247.
- ^ "Analysis of Biological Networks: Transcriptional Networks – Promoter Sequence Analysis" (PDF). Tel Aviv University. Retrieved 30 December 2012.
- ^ Burgess-Beusse B, Farrell C, Gaszner M, Litt M, Mutskov V, Recillas-Targa F, Simpson M, West A, Felsenfeld G (December 2002). "The insulation of genes from external enhancers and silencing chromatin". Proceedings of the National Academy of Sciences of the United States of America. 99 Suppl 4: 16433–7. Bibcode:2002PNAS...9916433B. doi:10.1073/pnas.162342499. PMC 139905. PMID 12154228.
- ^ "Plagiarized Errors and Molecular Genetics", talkorigins, by Edward E. Max, M.D., Ph.D.
- ^ Balakirev ES, Ayala FJ (2003). "Pseudogenes: are they "junk" or functional DNA?". Annual Review of Genetics. 37: 123–51. doi:10.1146/annurev.genet.37.040103.103949. PMID 14616058. S2CID 24683075.
- ^ a b Levy A (16 October 2019). "How evolution builds genes from scratch - Scientists long assumed that new genes appear when evolution tinkers with old ones. It turns out that natural selection is much more creative". Nature. 574 (7778): 314–316. doi:10.1038/d41586-019-03061-x. PMID 31619796. S2CID 204707405.
- ^ Peng CK, Buldyrev SV, Goldberger AL, Havlin S, Sciortino F, Simons M, Stanley HE (March 1992). "Long-range correlations in nucleotide sequences". Nature. 356 (6365): 168–70. Bibcode:1992Natur.356..168P. doi:10.1038/356168a0. PMID 1301010. S2CID 4334674.
- ^ Li W, Kaneko K (1992). "Long-Range Correlation and Partial 1/falpha Spectrum in a Non-Coding DNA Sequence" (PDF). Europhys. Lett. 17 (7): 655–660. Bibcode:1992EL.....17..655L. CiteSeerX 10.1.1.590.5920. doi:10.1209/0295-5075/17/7/014.
- ^ Buldyrev SV, Goldberger AL, Havlin S, Mantegna RN, Matsa ME, Peng CK, Simons M, Stanley HE (May 1995). "Long-range correlation properties of coding and noncoding DNA sequences: GenBank analysis". Physical Review E. 51 (5): 5084–91. Bibcode:1995PhRvE..51.5084B. doi:10.1103/PhysRevE.51.5084. PMID 9963221.
- ^ a b Slip opinion for Maryland v. King from the U.S. Supreme Court. Retrieved 2013-06-04.
Otras lecturas
- Bennett MD, Leitch IJ (2005). "Genome size evolution in plants". In Gregory RT (ed.). The Evolution of the Genome. San Diego: Elsevier. pp. 89–162. ISBN 978-0-08-047052-8.
- Gregory TR (2005). "Genome size evolution in animals". In T.R. Gregory (ed.). The Evolution of the Genome. San Diego: Elsevier. ISBN 978-0-12-301463-4.
- Shabalina SA, Spiridonov NA (2004). "The mammalian transcriptome and the function of non-coding DNA sequences". Genome Biology. 5 (4): 105. doi:10.1186/gb-2004-5-4-105. PMC 395773. PMID 15059247.
- Castillo-Davis CI (October 2005). "The evolution of noncoding DNA: how much junk, how much func?". Trends in Genetics. 21 (10): 533–6. doi:10.1016/j.tig.2005.08.001. PMID 16098630.
enlaces externos
- Plant DNA C-values Database at Royal Botanic Gardens, Kew
- Fungal Genome Size Database at Estonian Institute of Zoology and Botany
- ENCODE: The human encyclopaedia at Nature ENCODE