FAIRE-Seq ( F ormaldehyde- A sisted I solation of R egulatory E lements ) es un método en biología molecular utilizado para determinar las secuencias de regiones de ADN en el genoma asociadas con la actividad reguladora. [1] La técnica fue desarrollada en el laboratorio de Jason D. Lieb en la Universidad de Carolina del Norte , Chapel Hill. En contraste con DNase-Seq, el protocolo FAIRE-Seq no requiere la permeabilización de células ni el aislamiento de núcleos y puede analizar cualquier tipo de célula. En un estudio de siete diferentes tipos de células humanas, DNase-seq y FAIRE-seq produjeron una fuerte validación cruzada, con cada tipo de célula teniendo 1-2% del genoma humano como cromatina abierta .
Flujo de trabajo
El protocolo se basa en el hecho de que la reticulación de formaldehído es más eficiente en el ADN unido a nucleosomas que en las regiones del genoma empobrecidas en nucleosomas. Este método luego segrega el ADN no reticulado que generalmente se encuentra en la cromatina abierta, que luego se secuencia. El protocolo consiste en la reticulación, extracción con fenol y secuenciación del ADN en fase acuosa.
FAIRE
FAIRE utiliza las propiedades bioquímicas del ADN unido a proteínas para separar regiones del genoma empobrecidas en nucleosomas. Las células se someterán a entrecruzamiento, asegurando que la interacción entre los nucleosomas y el ADN sea fija. Después de la sonicación, el ADN fragmentado y fijado se separa mediante extracción con fenol-cloroformo. Este método crea dos fases, una orgánica y una acuosa. Debido a sus propiedades bioquímicas, los fragmentos de ADN reticulados con nucleosomas se asentarán preferentemente en la fase orgánica. Por otro lado, en la fase acuosa se encontrarán regiones empobrecidas o "abiertas" en nucleosomas. Extrayendo específicamente la fase acuosa, solo se purificarán y enriquecerán las regiones empobrecidas en nucleosomas. [1]
Secuenciación
Los fragmentos de ADN extraídos de FAIRE se pueden analizar de una manera de alto rendimiento utilizando técnicas de secuenciación de próxima generación . En general, las bibliotecas se elaboran ligando adaptadores específicos a los fragmentos de ADN que les permiten agruparse en una plataforma y amplificarse, lo que da como resultado la lectura / determinación de las secuencias de ADN, y esto en paralelo para millones de fragmentos de ADN.
Dependiendo del tamaño del genoma en el que se realice FAIRE-seq, se requiere un mínimo de lecturas para crear una cobertura adecuada de los datos, lo que garantiza que se pueda determinar una señal adecuada. [2] [3] Además, un genoma de referencia o de entrada, que no ha sido reticulado, a menudo se secuencia junto para determinar el nivel de ruido de fondo.
Tenga en cuenta que los fragmentos de FAIRE extraídos se pueden cuantificar en un método alternativo utilizando PCR cuantitativa . Sin embargo, este método no permite una cuantificación de alto rendimiento / amplio del genoma de los fragmentos extraídos.
Sensibilidad
Hay varios aspectos de FAIRE-seq que requieren atención al analizar e interpretar los datos. Por un lado, se ha establecido que FAIRE-seq tendrá una mayor cobertura en las regiones potenciadoras que en las regiones promotoras. [4] Esto contrasta con el método alternativo de DNase-seq, que se sabe que muestra una mayor sensibilidad hacia las regiones promotoras. Además, se ha establecido que FAIRE-seq muestra preferencias por intrones y exones internos. [5] En general, también se cree que los datos de FAIRE-seq muestran un nivel de fondo más alto, lo que lo convierte en un método menos sensible. [6]
Análisis computacional
En un primer paso, los datos de FAIRE-seq se asignan al genoma de referencia del organismo modelo utilizado.
A continuación, la identificación de regiones genómicas con cromatina abierta se realiza mediante el uso de un algoritmo de llamada a picos. Diferentes herramientas ofrecen paquetes para hacer esto (por ejemplo, ChIPOTle [7] ZINBA [8] y MACS2 [9] ). ChIPOTle utiliza una ventana deslizante de 300 pb para identificar señales estadísticamente significativas. Por el contrario, MACS2 identifica la señal enriquecida combinando el parámetro callpeak con otras opciones como 'amplio', 'corte amplio', 'sin modelo' o 'cambio'. ZINBA es un algoritmo genérico para la detección de enriquecimiento en un conjunto de datos de lectura corta. [10] Por lo tanto, ayuda en la detección precisa de la señal en conjuntos de datos complejos que tienen una baja relación señal / ruido.
BedTools [11] se utiliza para fusionar las regiones enriquecidas que residen cerca unas de otras para formar COREs (Cluster de elementos reguladores abiertos). Esto ayuda en la identificación de regiones accesibles a la cromatina y patrones de regulación génica que habrían sido indetectables de otra manera, considerando la resolución más baja que FAIRE-seq a menudo trae consigo.
Los datos se visualizan normalmente como pistas (por ejemplo, bigWig) y se pueden cargar en el navegador del genoma UCSC. [12]
La principal limitación de este método, es decir, la baja relación señal / ruido en comparación con otros ensayos de accesibilidad a la cromatina, hace que la interpretación computacional de estos datos sea muy difícil. [13]
Metodos alternativos
Hay varios métodos que se pueden utilizar como alternativa a FAIRE-seq. DNase-seq utiliza la capacidad de la enzima DNasa I para escindir el ADN libre / abierto / accesible para identificar y secuenciar la cromatina abierta. [14] [15] El ATAC-seq desarrollado posteriormente emplea la transposasa Tn5, que inserta fragmentos o transposones específicos en regiones accesibles del genoma para identificar y secuenciar la cromatina abierta. [dieciséis]
Referencias
- ^ a b Giresi, PG; Kim, J; McDaniell, RM; Iyer, VR; Lieb, JD (junio de 2007). "FAIRE (Aislamiento de elementos reguladores asistido por formaldehído) aísla elementos reguladores activos de la cromatina humana" . Investigación del genoma . 17 (6): 877–85. doi : 10.1101 / gr.5533506 . PMC 1891346 . PMID 17179217 .
- ^ Landt, Stephen G .; Marinov, Georgi K .; Kundaje, Anshul; Kheradpour, Pouya; Pauli, Florencia; Batzoglou, Serafim; Bernstein, Bradley E .; Bickel, Peter; Brown, James B. (1 de septiembre de 2012). "Directrices y prácticas de ChIP-seq de los consorcios ENCODE y modENCODE" . Investigación del genoma . 22 (9): 1813–1831. doi : 10.1101 / gr.136184.111 . ISSN 1549-5469 . PMC 3431496 . PMID 22955991 .
- ^ Sims, David; Sudbery, Ian; Ilott, Nicholas E .; Heger, Andreas; Ponting, Chris P. (2014). "Secuenciación de profundidad y cobertura: consideraciones clave en análisis genómicos". Nature Reviews Genética . 15 (2): 121-132. doi : 10.1038 / nrg3642 . PMID 24434847 .
- ^ Kumar, Vibhor; Muratani, Masafumi; Rayan, Nirmala Arul; Kraus, Petra; Lufkin, Thomas; Ng, Huck Hui; Prabhakar, Shyam (1 de julio de 2013). "Procesamiento de señal uniforme y óptimo de datos de secuenciación profunda mapeados" . Biotecnología de la naturaleza . 31 (7): 615–622. doi : 10.1038 / nbt.2596 . ISSN 1546-1696 . PMID 23770639 .
- ^ Song, Lingyun; Zhang, Zhancheng; Grasfeder, Linda L .; Boyle, Alan P .; Giresi, Paul G .; Lee, Bum-Kyu; Sheffield, Nathan C .; Gräf, Stefan; Huss, Mikael (1 de octubre de 2011). "La cromatina abierta definida por DNaseI y FAIRE identifica elementos reguladores que dan forma a la identidad de tipo celular" . Investigación del genoma . 21 (10): 1757-1767. doi : 10.1101 / gr.121541.111 . ISSN 1088-9051 . PMC 3202292 . PMID 21750106 .
- ^ Tsompana, Maria; Buck, Michael J (20 de noviembre de 2014). "Accesibilidad de la cromatina: una ventana al genoma" . Epigenética y cromatina . 7 (1): 33. doi : 10.1186 / 1756-8935-7-33 . PMC 4253006 . PMID 25473421 .
- ^ Buck, Michael J; Nobel, Andrew B; Lieb, Jason D (1 de enero de 2005). "ChIPOTle: una herramienta fácil de usar para el análisis de datos de chips ChIP" . Biología del genoma . 6 (11): R97. doi : 10.1186 / gb-2005-6-11-r97 . ISSN 1465-6906 . PMC 1297653 . PMID 16277752 .
- ^ Rashid, Naim U .; Giresi, Paul G .; Ibrahim, Joseph G .; Sun, Wei; Lieb, Jason D. (1 de enero de 2011). "ZINBA integra covariables locales con datos de DNA-seq para identificar regiones amplias y estrechas de enriquecimiento, incluso dentro de regiones genómicas amplificadas" . Biología del genoma . 12 (7): R67. doi : 10.1186 / gb-2011-12-7-r67 . ISSN 1474-760X . PMC 3218829 . PMID 21787385 .
- ^ Zhang, Yong; Liu, Tao; Meyer, Clifford A .; Eeckhoute, Jérôme; Johnson, David S .; Bernstein, Bradley E .; Nusbaum, Chad; Myers, Richard M .; Brown, Myles (1 de enero de 2008). "Análisis basado en modelos de ChIP-Seq (MACS)" . Biología del genoma . 9 (9): R137. doi : 10.1186 / gb-2008-9-9-r137 . ISSN 1474-760X . PMC 2592715 . PMID 18798982 .
- ^ Koohy, Hashem; Abajo, Thomas A .; Spivakov, Mikhail; Hubbard, Tim (2014). "Una comparación de los picos de llamadas utilizados para los datos de DNase-Seq" . PLoS ONE . 9 (5): e96303. doi : 10.1371 / journal.pone.0096303 . PMC 4014496 . PMID 24810143 .
- ^ Quinlan, Aaron R .; Hall, Ira M. (15 de marzo de 2010). "BEDTools: un conjunto flexible de utilidades para comparar características genómicas" . Bioinformática . 26 (6): 841–842. doi : 10.1093 / bioinformatics / btq033 . ISSN 1367-4803 . PMC 2832824 . PMID 20110278 .
- ^ Hinrichs, AS; Karolchik, D .; Baertsch, R .; Barbero, médico de cabecera; Bejerano, G .; Clawson, H .; Diekhans, M .; Furey, TS; Harte, RA (1 de enero de 2006). "La base de datos del navegador UCSC Genome: actualización de 2006" . Investigación de ácidos nucleicos . 34 (supl. 1): D590 – D598. doi : 10.1093 / nar / gkj144 . ISSN 0305-1048 . PMC 1347506 . PMID 16381938 .
- ^ Tsompana, M; Buck, MJ (20 de noviembre de 2014). "Accesibilidad de la cromatina: una ventana al genoma" . Epigenética y cromatina . 7 (1): 33. doi : 10.1186 / 1756-8935-7-33 . PMC 4253006 . PMID 25473421 .
- ^ Boyle, Alan P .; Davis, Sean; Shulha, Hennady P .; Meltzer, Paul; Margulies, Elliott H .; Weng, Zhiping; Furey, Terrence S .; Crawford, Gregory E. (25 de enero de 2008). "Mapeo de alta resolución y caracterización de cromatina abierta en todo el genoma" . Celular . 132 (2): 311–322. doi : 10.1016 / j.cell.2007.12.014 . ISSN 1097-4172 . PMC 2669738 . PMID 18243105 .
- ^ Crawford, Gregory E .; Holt, Ingeborg E .; Whittle, James; Webb, Bryn D .; Tai, Denise; Davis, Sean; Margulies, Elliott H .; Chen, YiDong; Bernat, John A. (1 de enero de 2006). "Mapeo de todo el genoma de sitios hipersensibles a DNasa utilizando secuenciación de firmas masivamente paralelas (MPSS)" . Investigación del genoma . 16 (1): 123-131. doi : 10.1101 / gr.4074106 . ISSN 1088-9051 . PMC 1356136 . PMID 16344561 .
- ^ Buenrostro, Jason D .; Giresi, Paul G .; Zaba, Lisa C .; Chang, Howard Y .; Greenleaf, William J. (1 de diciembre de 2013). "Transposición de la cromatina nativa para el perfil epigenómico rápido y sensible de la cromatina abierta, las proteínas de unión al ADN y la posición del nucleosoma" . Métodos de la naturaleza . 10 (12): 1213-1218. doi : 10.1038 / nmeth.2688 . ISSN 1548-7105 . PMC 3959825 . PMID 24097267 .