FANTOM (Functional Annotation of the Mouse / Mammalian Genome) es un consorcio de investigación internacional establecido por primera vez en 2000 como parte del instituto de investigación RIKEN en Japón . [1] La reunión original reunió a científicos internacionales de diversos orígenes para ayudar a anotar la función de los clones de ADNc de ratón generados por el grupo Hayashizaki. [2] Desde el esfuerzo inicial de FANTOM1, el consorcio ha lanzado múltiples proyectos que buscan comprender los mecanismos que gobiernan la regulación de los genomas de mamíferos . [1] Su trabajo ha generado una gran colección de datos compartidos y ha ayudado a promover la bioquímicay metodologías bioinformáticas en la investigación genómica .
Fundación
En 1995, los investigadores del instituto RIKEN comenzaron a crear una enciclopedia de ADNc completos para el genoma del ratón . El objetivo de este 'Proyecto de enciclopedia del ratón' era proporcionar una anotación funcional del transcriptoma del ratón . Este mapeo proporcionaría un recurso valioso para el descubrimiento de genes , la comprensión de los genes que causan enfermedades y la homología entre especies . Esto prometía ser una tarea formidable desde el principio. Las metodologías actuales eran insuficientes para generar clones de ADNc de longitud completa a escala, y para ser útiles como recurso, las anotaciones tendrían que ser acordadas por expertos de diferentes disciplinas. [1] [2]
El primer objetivo fue desarrollar métodos que permitieran la generación de bibliotecas de ADNc de longitud completa. Los protocolos de transcriptasa inversa en ese momento tenían dificultades con la estructura secundaria del ARNm , lo que conducía a ADNc abreviados que eran difíciles de alinear e invitaban a complicaciones adicionales en el análisis posterior. Para superar esta limitación, se desarrolló un método que utiliza trehalosa para permitir que la transcriptasa inversa funcione a una temperatura más alta, relajando las estructuras secundarias. [3] Además, se desarrollaron otros métodos para ayudar en la construcción de bibliotecas de ADNc clonal. Estos incluyen un sistema de captura basado en biotina para seleccionar ADNc de longitud completa, un nuevo vector de fago lambda que minimiza los sesgos al administrar ADNc en un plásmido y una estrategia iterativa para enriquecer el ADNc que aún no se había secuenciado . [1] [2] [4] [5] [6]
La secuenciación comenzó en 1998 y progresó rápidamente, produciendo 246 bibliotecas de ADNc que abarcaban 21.076 clones de ADNc en una amplia gama de células y tejidos de ratón . Si bien esta etapa tuvo un gran éxito, se encontraron más limitaciones a nivel bioinformático. Los ADNc secuenciados se anotaron de una manera semiautomática que utilizó bases de datos disponibles (como homología de especies y motivos de proteínas conocidos ) para asignar genes dentro de un marco de Ontología de genes (GO). Sin embargo, muchas secuencias nuevas no tenían coincidencias significativas cuando BLAST contra bases de datos de genes. [1] [2]
Después de consultar a Gerry Rubin , el organizador del primer esfuerzo de anotación del genoma para Drosophila melanogaster , se hizo evidente que se requería un sistema robusto para la anotación que incorporara predicción computacional y curación manual para las nuevas secuencias. Deseando recibir aportaciones de expertos en bioinformática, genética y otros campos científicos, el grupo RIKEN organizó la primera reunión FANTOM.
FANTOM1
Para facilitar la anotación de los clones de ADNc de ratón, el grupo de investigación RIKEN desarrolló un servicio basado en la web llamado FANTOM + antes de la primera reunión. Los usuarios pueden buscar motivos , ver puntuaciones de similitud de secuencia precalculadas, así como consultar otras bases de datos públicas e integrar anotaciones relevantes en la base de datos FANTOM. La asignación y anotación funcional de los genes requirió múltiples herramientas y bases de datos bioinformáticas. Las herramientas predominantes incluyeron BLASTN / BLASTX, FASTA / FASTY, DECODER, EST-WISE y HMMER , mientras que se utilizaron bases de datos de ácidos nucleicos y proteínas como SwissProt , UniGene y NCBI-nr. Al mismo tiempo, una colaboración con el grupo Mouse Genome Informatics (MGI) permitió a los investigadores de RIKEN establecer un conjunto validado de clones que eran idénticos entre las dos bases de datos. [1] [2]
Armado con metodologías computacionales y más de 20.000 secuencias de ADNc, el grupo RIKEN organizó la primera reunión FANTOM en la ciudad de Tsukuba del 28 de agosto al 8 de septiembre de 2000. Se reclutó a un grupo diverso de científicos internacionales para discutir estrategias y ejecutar la anotación de los clones RIKEN. Los procedimientos computacionales ensamblados permitieron la comparación de secuencias y el análisis de dominio para asignar funciones putativas usando términos GO. La redundancia de los clones de cDNA presentó un desafío, requiriendo estrategias de agrupamiento y remisión al conjunto de validación de MGI para identificar clones únicos. El conjunto de clones de RIKEN finalmente se redujo a 15.295 genes, aunque esto se consideró cautelosamente una sobreestimación. [1] [2]
Un elemento central de los esfuerzos de curaduría fue la creación de la definición de RIKEN. Esto proporcionó un medio jerárquico y sistemático para asignar funciones a los clones basándose en genes conocidos, dando prioridad al conocimiento previamente establecido o bien curado. La naturaleza jerárquica de la clasificación permitió la coherencia cuando una secuencia era muy similar a varios genes diferentes. Es importante destacar que, si no se encontró ninguna similitud de secuencia, la definición asignó una función putativa basada en las firmas de motivos de proteínas predichas, el potencial de codificación y las coincidencias con las bases de datos de etiquetas de secuencia expresadas (EST). Solo en ausencia de cualquier similitud predicha o representativa, un clon se consideraría "inclasificable". [1] [2]
Los esfuerzos recopilados de RIKEN / FANTOM dieron como resultado una publicación de Nature en 2001. [7] Los resultados incluyeron la asignación de 21.076 clones de ADNc a 4.012 términos GO, la identificación de nuevos genes de ratón y motivos proteicos, la detección de posibles formas de empalme alternativas y el descubrimiento de genes de ratón ortólogos de genes de enfermedades humanas. Además, el primer genoma humano secuenciado se publicó una semana después e incorporó los resultados de FANTOM para predecir el número de genes humanos. [1] [2] [8]
FANTOM2
Habiendo establecido y mejorado los protocolos para la generación de bibliotecas de ADNc de longitud completa, el grupo RIKEN continuó agregando a la colección FANTOM. Las modificaciones a sus métodos permitieron una mayor selección de transcripciones largas y raras, lo que permitió la identificación de ADNc de más de 4 kb de longitud. La segunda reunión de FANTOM tuvo lugar en mayo de 2002; para entonces, el número de clones de ADNc había aumentado en 39.694 hasta un total de 60.770. [1] [9]
Una idea obtenida de FANTOM1 fue que la poliadenilación alternativa era común en el transcriptoma de ratón, lo que significa que la agrupación del extremo 3 ' condujo a una redundancia extensa. Para abordar esto, se realizó una secuenciación adicional del extremo 5 'para identificar clones únicos. La publicación de FANTOM2 contribuyó con una adición sustancial de nuevas transcripciones codificantes de proteínas. Podría decirse que el resultado más notable de FANTOM2 fue que los esfuerzos para seleccionar transcripciones largas y raras habían revelado una cantidad significativa de ARN no codificante de proteínas . [1] [9]
Una vez más, la colección FANTOM demostró ser un recurso fructífero. El ARN no codificante se identificó como ARN antisentido y ARN largo no codificante (lncRNA), clases poco conocidas de ARN regulador. [10] [11] La primera secuencia publicada del genoma del ratón utilizó las anotaciones establecidas por FANTOM. [10] Otros esfuerzos fueron capaces de describir familias de proteínas enteras, tales como los receptores acoplados a proteína G . [1] [12] [13]
FANTOM3
Un objetivo final de FANTOM es establecer redes de genes que capturen las interacciones reguladoras de la transcripción y diferenciar estas interacciones por tipo de célula o estado. Hasta este punto, se comprendió que la naturaleza polimórfica del extremo 5 'de las secuencias requeriría un mapeo extenso. La caracterización de los sitios de inicio de la transcripción (TSS) permitiría la identificación de los promotores y la diferenciación de su uso entre los tipos de células. Esto también significó que se necesitaban más desarrollos en los métodos de secuenciación. Si bien se continuaron generando ADNc de ratón de longitud completa, los investigadores dirigidos por RIKEN establecieron el Análisis Cap de Expresión Genética (CAGE), una técnica que impulsaría gran parte de su trabajo futuro. [1]
Desarrollo de CAGE
CAGE fue una continuación de los conceptos desarrollados para FANTOM1, y se usó ampliamente en los siguientes proyectos, para capturar tapas de ARNm de 5 ' . A diferencia de los esfuerzos anteriores para generar ADNc de longitud completa, CAGE examina fragmentos o etiquetas que tienen una longitud de 20 a 27. Esto proporcionó un medio económico y de alto rendimiento para mapear los TSS, incluida la estructura y la actividad del promotor. [1]
Los pasos generales son los siguientes: el cDNA se transcribe de forma inversa a partir del mRNA utilizando cebadores aleatorios u oligo dT . A continuación, se emplea el método cap trapper para asegurar la selección del cDNA de longitud completa. Esto implica la adición de biotina a la tapa 5 'y la posterior captura con perlas de estreptavidina después de una etapa de digestión con ARNasa para eliminar el ARN monocatenario que no se ha hibridado con el ADNc. Después de la captura de la tapa, el ADNc se separa del híbrido ARN-ADNc. Un enlazador CAGE de doble hebra que también está biotinilado se liga al extremo 5 'del cDNA y se sintetiza la segunda hebra del cDNA. Este ADN de doble hebra resultante se digiere con la endonucleasa Mme1 , cortando el enlazador CAGE y produciendo una etiqueta CAGE de 20-27 pb. Se agrega un segundo enlazador al extremo 3 'y la etiqueta se amplifica mediante PCR . Finalmente, las etiquetas CAGE se liberan de los enlazadores 5 'y 3'. A continuación, las etiquetas se pueden secuenciar, concatenar o clonar. [4] [14] [15] [16] En ese momento, CAGE se llevó a cabo utilizando el secuenciador capilar RISA 384 que había sido establecido previamente por RIKEN. [1]
Descubrimientos
El desarrollo de CAGE dio lugar a una serie de hallazgos importantes. Es importante destacar que se descubrió que el ARN era mucho más abundante en el transcriptoma de los mamíferos de lo que se pensaba anteriormente, acompañado de la constatación de que el genoma estaba transcrito de forma generalizada. [1] Combinando los métodos de CAGE, firmas de identificación de genes y clonación de firmas de genes, se cartografió el "paisaje transcripcional" del genoma de los mamíferos, caracterizando el patrón de las señales de control de la transcripción y las transcripciones que generan. [17] Se descubrió que hay muchas más transcripciones que los 22.000 genes estimados en el genoma del ratón, y que muchas de estas unidades transcripcionales tienen promotores alternativos y sitios de poliadenilación .
Además, se descubrió que los 'bosques transcripcionales', grupos de transcripciones que comparten regiones de expresión y eventos reguladores comunes, están separados por 'desiertos de transcripción' y constituyen ~ 63% del genoma. [17] Una publicación publicada conjuntamente encontró que muchas de las transcripciones en estos bosques muestran transcripción antisentido , y que la mayoría de los pares sentido / antisentido muestran una regulación concordante. [18] Otro resultado notable mostró que muchos ARN no codificantes se expresan dinámicamente, muchos de los cuales se inician en regiones 3 ' no traducidas , y que se conservan posicionalmente en todas las especies. [17]
El tercer artículo importante que surgió de FANTOM3 investigó la arquitectura y la evolución de los promotores de mamíferos. [19] Estableció dos clases de promotores de mamíferos. Los primeros son promotores enriquecidos con caja TATA , con sitios de inicio de la transcripción bien definidos. Estos promotores se conservan evolutivamente y se asocian más comúnmente con genes específicos de tejido. La segunda y más común clase de promotores, los promotores amplios ricos en CpG, son plásticos, evolucionables y se expresan en una amplia gama de células y tejidos. Este estudio también demostró que los promotores ricos en CpG pueden ser bidireccionales (producir pares sentido-antisentido) y son altamente susceptibles al control epigenético y, por lo tanto, son un componente potencial de la evolución adaptativa .
La reunión de FANTOM3 tuvo lugar en septiembre de 2004. En PLoS Genetics se publicó una colección de publicaciones satelitales que surgieron de FANTOM3 . Incluyen trabajos adicionales sobre las propiedades del promotor, la longitud del exón y el ARN pseudo-mensajero. [20] [21]
FANTOM4
El aumento de la secuenciación de próxima generación fue significativamente beneficioso para el avance de la tecnología CAGE. Usando el secuenciador Roche-454 , el grupo FANTOM desarrolló deepCAGE, aumentando el rendimiento de CAGE a más de un millón de etiquetas por muestra. [22] A estas profundidades, los investigadores ahora podrían comenzar a construir redes de interacciones reguladoras de genes . La reunión de FANTOM4 tuvo lugar en diciembre de 2006.
Si bien los proyectos FANTOM anteriores examinaron una variedad de tipos de células, el propósito de FANTOM4 era interrogar profundamente la dinámica que impulsa la diferenciación celular . El análisis se limitó a una línea celular THP-1 humana , proporcionando datos de evolución temporal de un monoblastos convirtiéndose en monocitos . DeepCage resolvió los TSS con una resolución de un solo nucleótido, señalando dónde se unen los factores de transcripción (TF). Mediante el seguimiento de los cambios de expresión génica dependientes del tiempo a medida que las células se diferencian, se proporcionó una inferencia de qué motivos reguladores son predictivos de cambios de expresión, dependencia del tiempo de la actividad de TF y genes diana de TF. [23] Estos esfuerzos dieron como resultado una red reguladora transcripcional, lo que demuestra que el proceso de diferenciación es muy complejo y está impulsado por una gran magnitud de TF que promulgan interacciones reguladoras tanto positivas como negativas.
FANTOM4 también aumentó nuestra comprensión de la transcripción de retrotransposones y los ARN de iniciación de la transcripción (tiRNA). Los retrotransposones contribuyen a los elementos repetitivos en los genomas de mamíferos y pueden afectar múltiples procesos biológicos, como la evolución genómica, así como estructuras, como promotores y exones alternativos. [24] [25] Se demostró que los retrotransposones se expresan de una manera específica de células y tejidos, y se identificaron aproximadamente 250.000 TSS impulsados por retrotransposones previamente desconocidos. [26]
Se descubrió que los retrotransposones pueden influir en la transcripción de mamíferos y la regulación transcripcional de ARN codificantes y no codificantes en varios tejidos. [26] Otros esfuerzos encontraron una nueva clase de ARN generalizada genómica y evolutivamente, denominada ARN de iniciación de la transcripción (tiRNA). [27] Esta especie de ARN es relativamente pequeña (~ 18 nucleótidos de longitud) y se encuentra típicamente aguas abajo de los TSS de los promotores ricos en CpG. Los tiRNA son escasos en abundancia y están asociados con genes altamente expresados, así como con la unión de la RNA polimerasa II y los TSS. Un trabajo más reciente ha demostrado que los tiRN pueden modular los estados epigenéticos y la arquitectura de la cromatina local . [28] Sin embargo, es posible que estos tiRNA no tengan una función reguladora y sean simplemente un subproducto de la transcripción. [1] [27]
Tras estos hallazgos iniciales, los investigadores de RIKEN publicaron un atlas de regulación transcripcional combinatoria en ratones y humanos. [29] Este trabajo demostró que los complejos transcripcionales pueden interactuar dentro de una red para controlar la identidad del tejido / estado celular, y que estas redes a menudo están dominadas por factores de transcripción "facilitadores" que se expresan ampliamente en tejidos / células. Se encontró que aproximadamente la mitad de las interacciones reguladoras medidas se conservaban entre el ratón y el ser humano. FANTOM4 dio lugar a numerosos artículos satelitales, que investigaban temas como la arquitectura del promotor, la regulación de miARN y los bloques reguladores genómicos. [30] [31] [32]
FANTOM5
La quinta ronda de FANTOM tenía como objetivo proporcionar información sobre el panorama regulatorio del transcriptoma en tantos estados celulares como fuera posible. [1] Sigue siendo un recurso relevante de datos compartidos. El proyecto constaba de dos fases: la primera se centró en las celdas de estado estacionario, mientras que la segunda se centró en los datos temporales. Los avances en la secuenciación de próxima generación se aprovecharon para lograr la gran amplitud de FANTOM5, con secuenciación de una sola molécula que permite la resolución de un solo par de bases de la actividad de TSS desde tan solo 100 ng de ARN. [33] Se recolectaron muestras de todos los órganos humanos, así como de más de 200 líneas de cáncer , 30 ciclos de diferenciación celular, ciclos de desarrollo de ratones y más de 200 tipos de células primarias. En total, se perfilaron 1.816 muestras de humanos y 1.1016 de ratones en ambas fases. [33] [34]
Si bien es similar al proyecto ENCODE , FANTOM5 se diferencia en dos aspectos clave. En primer lugar, ENCODE utilizó líneas celulares inmortalizadas , mientras que FANTOM5 se centró en células y tejidos primarios, que reflejan más los procesos biológicos reales responsables de mantener la identidad del tipo celular. En segundo lugar, ENCODE utilizó múltiples ensayos genómicos para capturar el transcriptoma y el epigenoma . FANTOM5 se centró únicamente en el transcriptoma, basándose en otros trabajos publicados para inferir características como el tipo de célula según lo definido por el estado de la cromatina. [1] La reunión FANTOM5 tuvo lugar en octubre de 2011.
Fase 1
La primera fase de FANTOM5 implicó la toma de "instantáneas" de una amplia gama de tipos de células en estado estable utilizando perfiles CAGE en 975 muestras de humanos y 399 de ratones. Este esfuerzo inicial dio como resultado dos artículos de Nature: uno que describe el paisaje de promotores de mamíferos y el otro que describe los potenciadores activos . [35] [36] Juntos, proporcionan un atlas de promotores, potenciadores y TSS a través de diversos tipos de células, actuando como una "línea de base" para estudiar el complejo panorama de la regulación de la transcripción. Específicamente, se generaron perfiles CAGE de molécula única utilizando un secuenciador HeliScope en 573 muestras de células primarias humanas, 128 muestras de células primarias de ratón, 250 líneas de células cancerosas, 152 tejidos post mortem humanos y 271 muestras de tejido de desarrollo de ratón. [33] [37]
Se desarrolló un nuevo método para identificar los picos CAGE, llamado análisis de picos de descomposición. Las etiquetas CAGE se agrupan por proximidad, seguidas de un análisis de componentes independientes para descomponer los picos en regiones que no se superponen. Se aplica un paso de enriquecimiento para garantizar que los picos corresponden a los TSS, y se utilizan datos externos de EST, marcas de trimetilación de la histona H3 lisina 4 y sitios de hipersensibilidad a la DNasa para respaldar que los picos son TSS genuinos. [33]
Un hallazgo clave mostró que el promotor típico de los mamíferos contiene múltiples TSS con diferentes patrones de expresión en las muestras. [1] [35] Esto implicaba que estos TSS se regulan por separado, a pesar de estar muy próximos. Los promotores expresados de manera ubicua tenían la mayor conservación en sus secuencias, mientras que los promotores específicos de células estaban menos conservados. Otro resultado destacado sugirió que el ARN derivado del potenciador (eRNA) se transcribe de una manera específica de célula / tejido, lo que refleja la actividad de ese potenciador. [37]
Fase 2
Mientras que la primera fase se centró en una representación de estado estable de los estados de la celda, la segunda fase buscó explorar el proceso dinámico de transición de los estados de la celda a través del uso de datos del curso del tiempo. Una vez más, se empleó CAGE, esta vez durante 19 ciclos de tiempo en humanos y 14 en ratones que cubrieron una variedad de tipos de células y estímulos biológicos que representaron 408 puntos de tiempo distintos. Esto incluyó la diferenciación de células madre o células progenitoras comprometidas hacia sus destinos terminales, así como células completamente diferenciadas que responden a factores de crecimiento o patógenos . [1] [33] [38]
Se realizó un agrupamiento no supervisado para identificar un conjunto de clases de respuesta distintas, examinando patrones en los cambios de pliegues de expresión en comparación con el tiempo 0. De esta manera, la expresión de potenciadores, promotores TF y promotores no TF se generalizó en una escala temporal de los primeros 6 horas del curso de tiempo. Generalmente, la respuesta más temprana de las células ocurrió en los potenciadores, con concentraciones máximas de eRNA tan pronto como 15 minutos después del tiempo 0. Incluso en las clases que representan respuestas "posteriores", los potenciadores tendieron a activarse antes que los promotores proximales. Se observó variabilidad en la persistencia de esta activación: algunos potenciadores volvieron rápidamente a la línea de base después del estallido a los 15 minutos, mientras que otros persistieron después de la activación del promotor. En conjunto, esto sugiere que el eRNA puede tener funciones diferenciales en la regulación de la actividad genética. [38]
Trabajo adicional
Además del típico intercambio de datos en la base de datos FANTOM, FANTOM5 también introdujo dos herramientas bioinformáticas para la exploración de datos. ZENBU es un navegador de genoma con funcionalidad adicional: los usuarios pueden cargar archivos BAM de experimentos CAGE, short-RNA y ChIP-seq y realizar control de calidad, normalización, búsqueda de picos y anotaciones entre comparaciones visuales. [39] SSTAR (catálogo semántico de muestras, iniciaciones de transcripción y regulaciones) mientras tanto permite la exploración y búsqueda de las muestras de FANTOM5 y sus características genómicas. [40]
La abundancia de datos producidos por FANTOM5 continúa proporcionando un recurso para los investigadores que buscan explicar los mecanismos reguladores que dan forma a procesos como el desarrollo. A menudo, los datos de CAGE en un tipo específico de célula / tejido se utilizan junto con ensayos epigenómicos adicionales; uno de esos ejemplos describe la interacción de la metilación del ADN y las secuencias reguladoras definidas por CAGE durante la diferenciación de un granulocito . [41]
Tres años después de la introducción de los atlas de potenciadores y promotores, el grupo FANTOM lanzó atlas para lncRNA y microRNA (miRNA), incorporando datos de FANTOM5. [42] [43] Un objetivo general fue proporcionar una mayor comprensión de la observación anterior de la transcripción generalizada del genoma de los mamíferos. El trabajo de lncRNA caracterizó 27.919 genes de lncRNA humanos en 1.829 muestras para estimular la investigación sobre la relevancia funcional de esta clase de ARN poco conocida. Los resultados sugirieron que el 69% del lncRNA identificado tenía una funcionalidad potencial, aunque se requiere más evidencia para comentar si el 31% restante es simplemente "ruido" transcripcional del inicio de la transcripción espurio. El atlas de miARN identificó 1357 promotores de miARN humanos y 804 de ratón y demostró una fuerte conservación de la secuencia entre las dos especies. También se demostró que la expresión de miARN primario podría usarse como un sustituto de los niveles de miARN maduros.
FANTOM6
Actualmente en curso, FANTOM6 tiene como objetivo caracterizar sistemáticamente el papel del lncRNA en el genoma humano. La función biológica de estos ARN grandes (más de 200 nucleótidos) y sin traducir se desconoce en gran medida. Sobre la base de los pocos trabajos que han examinado lncRNA, se cree que están involucrados en la regulación de la transcripción, traducción , modificaciones postraduccionales y marcas epigenéticas. Sin embargo, el conocimiento actual de la extensión y el alcance de estas supuestas interacciones regulatorias es rudimentario. [1] [44]
Hay numerosos desafíos que abordar para esta próxima versión de FANTOM. En particular, los lncRNA están mal definidos: carecen de conservación y varían mucho en tamaño, desde 200 hasta más de un millón de nucleótidos de longitud. A diferencia de las transcripciones codificantes, que se encuentran en el citosol para la traducción, los lncRNA se encuentran principalmente en el núcleo , un panorama de ARN mucho más complejo. En general, el lncRNA tiene niveles de expresión más bajos que los transcritos codificantes, pero existe una gran variabilidad en esta expresión que puede oscurecerse por el tipo de célula o la localización dentro del núcleo. Además, la clasificación funcional de los lncRNA sigue siendo objeto de acalorados debates; se desconoce si los lncRNA se pueden agrupar en función de una función / mecanismos de acción comunes o por dominios activos. [1]
FANTOM ha establecido una estrategia experimental de tres frentes para explorar estas incógnitas. Se construirá un transcriptoma de referencia y un perfil de epigenoma de diferentes tipos de células como línea base para cada tipo de célula. A continuación, utilizando lncRNA identificados en publicaciones anteriores, datos de FANTOM5 y más perfiles de CAGE, se llevarán a cabo experimentos de perturbación para evaluar los cambios en el fenotipo molecular celular . Por último, se utilizará tecnología complementaria para anotar / clasificar funcionalmente un subconjunto seleccionado de lncRNA. [44] Estas técnicas estarán destinadas a dilucidar la estructura secundaria del lncRNA, su asociación con proteínas y cromatina, y mapear las interacciones de largo alcance del lncRNA en todo el genoma. [1]
Referencias
- ^ a b c d e f g h i j k l m n o p q r s t u v w x de Hoon, Michiel; Shin, Jay W .; Carninci, Piero (8 de agosto de 2015). "Cambios de paradigma en genómica a través de los proyectos FANTOM" . Genoma de mamíferos . 26 (9-10): 391-402. doi : 10.1007 / s00335-015-9593-8 . PMC 4602071 . PMID 26253466 .
- ^ a b c d e f g h "Introducción FANTOM" . fantom.gsc.riken.jp .
- ^ Carninci, Piero; Nishiyama, Yoko; Westover, Arthur; et al. (20 de enero de 1998). "Termoestabilización y termoactivación de enzimas termolábiles por trehalosa y su aplicación para la síntesis de ADNc de longitud completa" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 95 (2): 520–524. doi : 10.1073 / pnas.95.2.520 . ISSN 0027-8424 . PMC 18452 . PMID 9435224 .
- ^ a b Carninci, Piero; Kvam, Catrine; Kitamura, Akiko; et al. (Noviembre de 1996). "Clonación de ADNc de longitud completa de alta eficiencia por captador biotinilado". Genómica . 37 (3): 327–336. doi : 10.1006 / geno.1996.0567 . PMID 8938445 .
- ^ Carninci, Piero; Shibata, Yuko; Hayatsu, Norihito; et al. (Octubre de 2000). "Normalización y resta de ADNc seleccionados por Cap-Trapper para preparar bibliotecas de ADNc de longitud completa para el descubrimiento rápido de nuevos genes" . Investigación del genoma . 10 (10): 1617–1630. doi : 10.1101 / gr.145100 . ISSN 1088-9051 . PMC 310980 . PMID 11042159 .
- ^ Carninci, Piero; Shibata, Yuko; Hayatsu, Norihito; et al. (Septiembre de 2001). "Clonación de tamaño equilibrado y de tamaño largo de ADNc de longitud completa, atrapados en el casquete en vectores de la nueva familia λ-FLC permite una tasa de descubrimiento de genes mejorada y un análisis funcional". Genómica . 77 (1–2): 79–90. doi : 10.1006 / geno.2001.6601 . PMID 11543636 .
- ^ Kawai, J .; Shinagawa, A .; Shibata, K .; et al. (8 de febrero de 2001). "Anotación funcional de una colección de ADNc de ratón de longitud completa" . Naturaleza . 409 (6821): 685–690. doi : 10.1038 / 35055500 . PMID 11217851 .
- ^ Lander, Eric S .; Linton, Lauren M .; Birren, Bruce; Nusbaum, Chad; Zody, Michael C .; et al. (15 de febrero de 2001). "Secuenciación inicial y análisis del genoma humano" . Naturaleza . 409 (6822): 860–921. doi : 10.1038 / 35057062 . PMID 11237011 .
- ^ a b Okazaki, Y .; Furuno, M .; Kasukawa, T .; Adachi, J .; Bono, H .; et al. (5 de diciembre de 2002). "Análisis del transcriptoma de ratón basado en la anotación funcional de 60.770 ADNc de longitud completa" . Naturaleza . 420 (6915): 563–573. doi : 10.1038 / nature01266 . PMID 12466851 .
- ^ a b Numata, K. (2 de junio de 2003). "Identificación de ARN no codificantes putativos entre la colección de ADNc de longitud completa de ratón RIKEN" . Investigación del genoma . 13 (6): 1301–1306. doi : 10.1101 / gr.1011603 . PMC 403720 . PMID 12819127 .
- ^ Kiyosawa, H. (2 de junio de 2003). "Transcripciones antisentido con conjunto de clones FANTOM2 y sus implicaciones para la regulación genética" . Investigación del genoma . 13 (6): 1324-1334. doi : 10.1101 / gr.982903 . PMC 403655 . PMID 12819130 .
- ^ Okazaki, Y. (2 de junio de 2003). "Una guía para el genoma de los mamíferos" . Investigación del genoma . 13 (6): 1267-1272. doi : 10.1101 / gr.1445603 .
- ^ Kawasawa, Y. (2 de junio de 2003). "Genes de receptores acoplados a proteínas G en la base de datos FANTOM2" . Investigación del genoma . 13 (6): 1466–1477. doi : 10.1101 / gr.1087603 . PMC 403690 . PMID 12819145 .
- ^ "Tecnología RIKEN CAGE" . www.osc.riken.jp (en japonés). Archivado desde el original el 9 de octubre de 2017 . Consultado el 27 de febrero de 2018 .
- ^ Shiraki, T .; Kondo, S .; Katayama, S .; Waki, K .; Kasukawa, T .; Kawaji, H .; Kodzius, R .; Watahiki, A .; Nakamura, M .; Arakawa, T .; Fukuda, S .; Sasaki, D .; Podhajska, A .; Harbers, M .; Kawai, J .; Carninci, P .; Hayashizaki, Y. (8 de diciembre de 2003). "Cap análisis de expresión génica para el análisis de alto rendimiento del punto de partida transcripcional y la identificación del uso del promotor" . Actas de la Academia Nacional de Ciencias . 100 (26): 15776–15781. doi : 10.1073 / pnas.2136655100 . PMC 307644 . PMID 14663149 .
- ^ Kodzius, Rimantas; Kojima, Miki; Nishiyori, Hiromi; Nakamura, Mari; Fukuda, Shiro; Tagami, Michihira; Sasaki, Daisuke; Imamura, Kengo; Kai, Chikatoshi; Harbers, Matthias; Hayashizaki, Yoshihide; Carninci, Piero (marzo de 2006). "CAGE: análisis de la tapa de la expresión genética". Métodos de la naturaleza . 3 (3): 211-222. doi : 10.1038 / nmeth0306-211 . PMID 16489339 .
- ^ a b c Carninci, P .; Kasukawa, T .; Katayama, S .; Gough, J .; Frith, MC; Maeda, N .; Oyama, R .; Ravasi, T .; Lenhard, B .; Wells, C .; Kodzius, R .; Shimokawa, K .; Bajic, VB; Brenner, SE; Batalov, S .; Forrest, AR; Zavolan, M .; Davis, MJ; Wilming, LG; Aidinis, V .; Allen, JE; Ambesi-Impiombato, A .; Apweiler, R .; Aturaliya, RN; Bailey, TL; Bansal, M .; Baxter, L .; Beisel, KW; Bersano, T .; et al. (2 de septiembre de 2005). "El paisaje transcripcional del genoma de los mamíferos". Ciencia . 309 (5740): 1559-1563. doi : 10.1126 / science.1112014 . PMID 16141072 .
- ^ Katayama, S; Tomaru, Y; Kasukawa, T; et al. (2 de septiembre de 2005). "Transcripción antisentido en el transcriptoma de mamíferos". Ciencia . 309 (5740): 1564-1566. doi : 10.1126 / science.1112009 . PMID 16141073 .
- ^ Carninci, Piero; Sandelin, Albin; Lenhard, Boris; Katayama, Shintaro; Shimokawa, Kazuro; et al. (2006). "Análisis de todo el genoma de la arquitectura y la evolución del promotor de mamíferos". Genética de la naturaleza . 38 (6): 626–635. doi : 10.1038 / ng1789 . ISSN 1546-1718 . PMID 16645617 .
- ^ "FANTOM3 - Papeles" . fantom.gsc.riken.jp .
- ^ "PLOS Genetics: Resultados de búsqueda FANTOM3" . journalnals.plos.org .
- ^ de Hoon, Michiel; Hayashizaki, Yoshihide (abril de 2008). "Expresión de genes de análisis de capa profunda (CAGE): identificación de promotores de todo el genoma, cuantificación de su expresión e inferencia de red" . BioTechniques . 44 Suplemento (4): 627–632. doi : 10.2144 / 000112802 . PMID 18474037 .
- ^ Suzuki, Harukazu; Consorcio, The FANTOM; Forrest, Alistair RR; et al. (2009). "La red transcripcional que controla la detención del crecimiento y la diferenciación en una línea celular de leucemia mieloide humana" . Genética de la naturaleza . 41 (5): 553–562. doi : 10.1038 / ng.375 . ISSN 1546-1718 . PMC 6711855 . PMID 19377474 .
- ^ Kazazian, HH (12 de marzo de 2004). "Elementos móviles: impulsores de la evolución del genoma". Ciencia . 303 (5664): 1626–1632. doi : 10.1126 / science.1089670 . PMID 15016989 .
- ^ Finnegan, David J. (junio de 2012). "Retrotransposones" . Biología actual . 22 (11): R432 – R437. doi : 10.1016 / j.cub.2012.04.025 . PMID 22677280 .
- ^ a b Faulkner, Geoffrey J; Kimura, Yasumasa; Daub, Carsten O; et al. (19 de abril de 2009). "El transcriptoma de retrotransposón regulado de células de mamífero". Genética de la naturaleza . 41 (5): 563–571. doi : 10.1038 / ng.368 . PMID 19377475 .
- ^ a b Taft, Ryan J; Glazov, Evgeny A; Cloonan, Nicole; et al. (19 de abril de 2009). "Pequeños ARN asociados con sitios de inicio de transcripción en animales". Genética de la naturaleza . 41 (5): 572–578. doi : 10.1038 / ng.312 . PMID 19377478 .
- ^ Taft, Ryan J; Hawkins, Peter G; Mattick, John S; Morris, Kevin V (2011). "La relación entre los ARN de iniciación de la transcripción y la localización del factor de unión a CCCTC (CTCF)" . Epigenética y cromatina . 4 (1): 13. doi : 10.1186 / 1756-8935-4-13 . PMC 3170176 . PMID 21813016 .
- ^ Ravasi, Timothy; Suzuki, Harukazu; Cannistraci, Carlo Vittorio; et al. (Marzo de 2010). "Un Atlas de regulación transcripcional combinatoria en ratón y hombre" . Celular . 140 (5): 744–752. doi : 10.1016 / j.cell.2010.01.044 . PMC 2836267 . PMID 20211142 .
- ^ Kratz, Anton; Arner, Erik; Saito, Rintaro; Kubosaki, Atsutaka; Kawai, Jun; Suzuki, Harukazu; Carninci, Piero; Arakawa, Takahiro; Tomita, Masaru; Hayashizaki, Yoshihide; Daub, Carsten O (2010). "La estructura del promotor central y el contexto genómico reflejan patrones de acetilación de histona 3 lisina 9" . BMC Genomics . 11 (1): 257. doi : 10.1186 / 1471-2164-11-257 . PMC 2867832 . PMID 20409305 .
- ^ Akalin, Altuna; Fredman, David; Arner, Erik; Dong, Xianjun; Bryne, Jan; Suzuki, Harukazu; Daub, Carsten O; Hayashizaki, Yoshihide; Lenhard, Boris (2009). "Características transcripcionales de bloques reguladores genómicos" . Biología del genoma . 10 (4): R38. doi : 10.1186 / gb-2009-10-4-r38 . PMC 2688929 . PMID 19374772 .
- ^ "Publicaciones FANTOM 4" . fantom.gsc.riken.jp .
- ^ a b c d e Noguchi, Shuhei; Arakawa, Takahiro; Fukuda, Shiro; et al. (29 de agosto de 2017). "Perfiles FANTOM5 CAGE de muestras humanas y de ratón" . Datos científicos . 4 : 170112. doi : 10.1038 / sdata.2017.112 . PMC 5574368 . PMID 28850106 .
- ^ Lizio, Marina; Harshbarger, Jayson; Shimoji, Hisashi; et al. (2015). "Puertas de entrada al atlas de expresión de mamíferos a nivel del promotor FANTOM5" . Biología del genoma . 16 (1): 22. doi : 10.1186 / s13059-014-0560-6 . PMC 4310165 . PMID 25723102 .
- ^ a b El Consorcio FANTOM RIKEN PMI CLST (DGT); Forrest, AR; Kawaji, H .; Rehli, M .; Baillie, JK; De Hoon, MJ; Haberle, V .; Lassmann, T .; Kulakovskiy, IV; Lizio, M .; Itoh, M .; Andersson, R .; Mungall, CJ; Meehan, TF; Schmeier, S .; Bertin, N .; Jørgensen, M .; Dimont, E .; Arner, E .; Schmidl, C .; Schaefer, U .; Medvedeva, YA; Plessy, C .; Vitezic, M .; Severin, J .; Semple, C .; Ishizu, Y .; Young, RS; Francescatto, M .; et al. (27 de marzo de 2014). "Un atlas de expresión de mamíferos a nivel de promotor" . Naturaleza . 507 (7493): 462–470. doi : 10.1038 / nature13182 . PMC 4529748 . PMID 24670764 .
- ^ Andersson, Robin; Gebhard, Claudia; Miguel-Escalada, Irene; et al. (27 de marzo de 2014). "Un atlas de potenciadores activos en tejidos y tipos de células humanas" . Naturaleza . 507 (7493): 455–461. doi : 10.1038 / nature12787 . PMC 5215096 . PMID 24670763 .
- ^ a b Kanamori-Katayama, M .; Itoh, M .; Kawaji, H .; et al. (19 de mayo de 2011). "Análisis de la tapa no amplificada de la expresión génica en un secuenciador de una sola molécula" . Investigación del genoma . 21 (7): 1150-1159. doi : 10.1101 / gr.115469.110 . PMC 3129257 . PMID 21596820 .
- ^ a b Arner, E .; Daub, CO; Vitting-Seerup, K .; et al. (12 de febrero de 2015). "Los potenciadores transcritos generan ondas de transcripción coordinada en células de mamíferos en transición" . Ciencia . 347 (6225): 1010–1014. doi : 10.1126 / science.1259418 . PMC 4681433 . PMID 25678556 .
- ^ Severin, Jessica; Lizio, Marina; Harshbarger, Jayson; et al. (1 de marzo de 2014). "Visualización interactiva y análisis de conjuntos de datos de secuenciación a gran escala utilizando ZENBU". Biotecnología de la naturaleza . 32 (3): 217–219. doi : 10.1038 / nbt.2840 . PMID 24727769 .
- ^ "FANTOM5_SSTAR" . fantom.gsc.riken.jp .
- ^ Ronnerblad, M .; Andersson, R .; Olofsson, T .; et al. (26 de marzo de 2014). "El análisis del metiloma y el transcriptoma del ADN en la granulopoyesis revela cambios cronometrados y metilación del potenciador dinámico" . Sangre . 123 (17): e79 – e89. doi : 10.1182 / blood-2013-02-482893 . PMID 24671952 .
- ^ Hon, Chung-Chau; Ramilowski, Jordan A .; Harshbarger, Jayson; et al. (1 de marzo de 2017). "Un atlas de ARN largos no codificantes humanos con extremos 5 ′ precisos" . Naturaleza . 543 (7644): 199–204. doi : 10.1038 / nature21374 . PMC 6857182 . PMID 28241135 .
- ^ de Rie, Derek; Abugessaisa, Imad; Alam, Tanvir; et al. (21 de agosto de 2017). "Un atlas de expresión integrada de miARN y sus promotores en humanos y ratones" . Biotecnología de la naturaleza . 35 (9): 872–878. doi : 10.1038 / nbt.3947 . PMC 5767576 . PMID 28829439 .
- ^ a b "FANTOM - FANTOM6" . fantom.gsc.riken.jp .