ARN largo no codificante


Los ARN largos no codificantes ( ncRNA largos , lncRNA ) son un tipo de ARN , generalmente definido como transcripciones de más de 200 nucleótidos que no se traducen en proteínas. [2] Este límite arbitrario distingue los ARNc largos de los ARN pequeños no codificantes , como los microARN (miARN), los ARN de interferencia pequeños (ARNip), los ARN que interactúan con Piwi (piARN), los ARN nucleolares pequeños (ARNs) y otros ARN cortos. [3] Los ARN no codificantes intergénicos / intergénicos largos (lincRNA) son secuencias de lncRNA que no se superponen con genes que codifican proteínas.[4]

Los ARN largos no codificantes incluyen lincRNA intergénicos, ncRNA intrónicos y lncRNA sentido y antisentido, cada tipo muestra diferentes posiciones genómicas en relación con genes y exones . [1] [5]

En 2007, un estudio encontró que solo una quinta parte de la transcripción en el genoma humano está asociada con genes que codifican proteínas, [6] lo que indica al menos cuatro veces más secuencias de ARN no codificantes que codificantes. Los proyectos de secuenciación de ADN complementario (ADNc) a gran escala , como FANTOM, revelan la complejidad de esta transcripción. [7] El proyecto FANTOM3 identificó aproximadamente 35.000 transcripciones no codificantes que llevan muchas firmas de ARN mensajeros , incluido el taponamiento 5 ' , el empalme y la poliadenilación , pero tienen poco o ningún marco de lectura abierto (ORF). [7]Este número representa una estimación más baja conservadora, ya que omitió muchas transcripciones singleton y transcripciones no poliadeniladas (los datos de la matriz en mosaico muestran que más del 40% de las transcripciones no son poliadeniladas). [8] La identificación de ncRNA dentro de estas bibliotecas de cDNA es un desafío, ya que puede ser difícil distinguir las transcripciones que codifican proteínas de las no codificantes. Se ha sugerido a través de múltiples estudios que testículo , [9] y tejidos neurales expresan la mayor cantidad de largos ARNs no codificantes de cualquier tejido tipo. [10] Usando FANTOM5, se han identificado 27,919 ncRNAs largos en varias fuentes humanas. [11]

Cuantitativamente, los lncRNA demuestran una abundancia 10 veces menor que los mRNA , [12] [13] lo que se explica por una mayor variación de célula a célula de los niveles de expresión de los genes lncRNA en las células individuales, en comparación con los genes que codifican proteínas. [14] En general, la mayoría (~ 78%) de los lncRNA se caracterizan por ser específicos de tejido , en contraposición a sólo ~ 19% de los mRNA. [12] Además de una mayor especificidad tisular, los lncRNA se caracterizan por una mayor especificidad en la etapa de desarrollo , [15] y una mayor especificidad por el subtipo celular en tejidos como el neocórtex humano . [dieciséis]En 2018, una integración completa de lncRNA de bases de datos existentes, literatura publicada y ensamblajes de ARN novedosos basados ​​en el análisis de datos de RNA-seq , reveló que hay 270,044 transcripciones de lncRNA en humanos. [17]

En comparación con los mamíferos, relativamente pocos estudios se han centrado en la prevalencia de lncRNA en plantas . Sin embargo, un estudio extenso que consideró 37 especies de plantas superiores y seis algas identificó ~ 200.000 transcripciones no codificantes utilizando un enfoque in-silico , [18] que también estableció la base de datos Green Non-Coding Database ( GreeNC ) asociada , un depósito de lncRNA de plantas.

En 2005, el paisaje del genoma de los mamíferos se describió como numerosos 'focos' de transcripción que están separados por largos tramos de espacio intergénico . [7] Si bien algunos ncRNA largos se encuentran dentro de los tramos intergénicos, la mayoría son transcripciones superpuestas de sentido y antisentido que a menudo incluyen genes que codifican proteínas, [6] dando lugar a una jerarquía compleja de isoformas superpuestas. [19] Las secuencias genómicas dentro de estos focos transcripcionales a menudo se comparten dentro de una serie de transcripciones codificantes y no codificantes en las direcciones sentido y antisentido [20] Por ejemplo, 3012 de 8961 ADNc previamente anotados como secuencias codificantes truncadas dentro de FANTOM2posteriormente fueron designados como variantes genuinas de ARNc de ADNc que codifican proteínas. [7] Si bien la abundancia y conservación de estos arreglos sugieren que tienen relevancia biológica, la complejidad de estos focos frustra la fácil evaluación.


Diferentes tipos de ARN largos no codificantes. [1]