Etiqueta de extremo emparejado

Las etiquetas de extremos emparejados (PET) (a veces "diTags de extremos emparejados", o simplemente "ditags") son las secuencias cortas en los extremos 5 'y 3' de un fragmento de ADN que son lo suficientemente únicas como para que (teóricamente) solo existan juntas una vez en un genoma , por lo que la secuencia del ADN entre ellos está disponible en la búsqueda (si se dispone de datos de la secuencia del genoma completo) o en la secuenciación adicional (dado que los sitios de marcación son lo suficientemente únicos como para servir como sitios de hibridación de cebadores ). Las etiquetas de extremo emparejado (PET) existen en las bibliotecas de PET con el ADN intermedio ausente, es decir, un PET "representa" un fragmento más grande de ADN genómico o ADNcal consistir en una secuencia de engarce 5 'corta, una etiqueta de secuencia 5' corta, una etiqueta de secuencia 3 'corta y una secuencia de engarce 3' corta. Se demostró conceptualmente que 13 pares de bases son suficientes para mapear etiquetas de forma única. ^[1] Sin embargo, las secuencias más largas son más prácticas para mapear lecturas de forma única. Las endonucleasas (discutidas a continuación) que se utilizan para producir PET dan etiquetas más largas (18/20 pares de bases y 25/27 pares de bases) pero las secuencias de 50-100 pares de bases serían óptimas tanto para el mapeo como para la rentabilidad. ^[1] Después de extraer los PET de muchos fragmentos de ADN, se unen (concatenan) para lograr una secuenciación eficiente. En promedio, se pueden secuenciar de 20 a 30 etiquetas con el método Sanger , que tiene una longitud de lectura más larga. ^[1]Dado que las secuencias de etiquetas son cortas, los PET individuales son muy adecuados para la secuenciación de próxima generación que tiene longitudes de lectura cortas y mayor rendimiento. Las principales ventajas de la secuenciación de PET son su costo reducido al secuenciar solo fragmentos cortos, la detección de variantes estructurales en el genoma y una mayor especificidad cuando se vuelve a alinear con el genoma en comparación con las etiquetas individuales, que involucra solo un extremo del fragmento de ADN.

Construyendo la biblioteca de PET

Flujo de trabajo de clonación y construcción de bibliotecas PET basadas en clonación.

Las bibliotecas de PET se preparan típicamente mediante dos métodos generales: basado en clonación y basado en libre de clonación.

Basado en clonación

El ADN genómico fragmentado o el ADN complementario (ADNc) de interés se clona en vectores plasmídicos . Los sitios de clonación están flanqueados por secuencias adaptadoras que contienen sitios de restricción para endonucleasas (discutido a continuación). Los insertos se ligan a los vectores plasmídicos y los vectores individuales se transforman luego en E. coli haciendo la biblioteca de PET. Las secuencias de PET se obtienen purificando el plásmido y digiriéndolo con endonucleasa específica dejando dos secuencias cortas en los extremos de los vectores. En condiciones intramoleculares (diluidas), los vectores se vuelven a circularizar y se ligan, dejando solo los ditags en el vector. Las secuencias únicas del clon ahora están emparejadas. Dependiendo de la técnica de secuenciación de próxima generación , las secuencias de PET pueden dejarse en singular, dimerizarse o concatenarse en cadenas largas. ^[1]

Basada en clonación libre

En lugar de clonar, los adaptadores que contienen la secuencia de endonucleasa se ligan a los extremos del ADN genómico o ADNc fragmentado. Luego, las moléculas se auto-circularizan y digieren con endonucleasa, liberando el PET. ^[1] Antes de la secuenciación, estos PET se ligan a adaptadores a los que se hibridan los cebadores de PCR para su amplificación. La ventaja de la construcción de la biblioteca basada en la clonación es que mantiene intactos los fragmentos o ADNc para uso futuro. Sin embargo, el proceso de construcción es mucho más largo que el método sin clonación. Las empresas de secuenciación de próxima generación han producido variaciones en la construcción de bibliotecas para adaptarse a sus respectivas tecnologías. ^[1]

Endonucleasas

A diferencia de otras endonucleasas, la MmeI (de tipo IIS) y EcoP15I (tipo III) endonucleasas de restricción cortan aguas abajo de su objetivo sitios de unión. MmeI corta 18/20 pares de bases corriente abajo ^[2] y EcoP15I corta 25/27 pares de bases corriente abajo. ^[3] A medida que estas enzimas de restricción se unen a sus secuencias diana ubicadas en los adaptadores, cortan y liberan vectores que contienen secuencias cortas del fragmento o ADNc ligado a ellos, produciendo PET.

Aplicaciones de PET

Ejemplo de detección PET de deleciones e inserciones.

Ejemplo de estructuras de transcripción alternativas detectadas por RNA-PET.

ADN-PET : debido a que el PET representa la conectividad entre las etiquetas, el uso de PET en la nueva secuenciación del genoma tiene ventajas sobre el uso de lecturas únicas . Esta aplicación se llama secuenciación final por pares , conocida coloquialmente como secuenciación de escopeta de doble cañón . Anclar una mitad del par de forma única a una única ubicación en el genoma permite mapear la otra mitad que es ambigua. Las lecturas ambiguas son aquellas que se asignan a más de una ubicación. Esta mayor eficacia reduce el coste de la secuenciación, ya que estas secuencias ambiguas, o lecturas, normalmente se descartarían. La conectividad de las secuencias de PET también permite la detección de variaciones estructurales: inserciones , deleciones , duplicaciones , inversiones , translocaciones . ^[1]^[4] Durante la construcción de la biblioteca de PET, los fragmentos se pueden seleccionar para que todos sean de cierto tamaño. Después del mapeo, se espera que las secuencias de PET estén consistentemente a una distancia particular entre sí. Una discrepancia de esta distancia indica una variación estructural entre las secuencias de PET. Por ejemplo (Figura de la derecha): una deleción en el genoma secuenciado tendrá lecturas de ese mapa más alejadas de lo esperado en el genoma de referencia, ya que el genoma de referencia tendrá un segmento de ADN que no está presente en el genoma secuenciado.
ChIP-PET : el uso combinado de inmunoprecipitación de cromatina ( ChIP ) y PET se utiliza para detectar regiones de ADN unidas por una proteína de interés. ChIP-PET tiene la ventaja sobre la secuenciación de lectura única al reducir la ambigüedad de las lecturas generadas. La ventaja sobre la hibridación de chips ( ChIP-Chip ) es que las matrices de mosaico de hibridación no tienen la sensibilidad estadística que tienen las lecturas de secuencia. Sin embargo, ChIP-PET, ChIP-Seq ^[5]^[6]^[7] y ChIP-chip^[8] han tenido un gran éxito. ^[1]
ChIA-PET : la aplicación de la secuenciación de PET en el análisis de interacción de cromatina. Es una estrategia de todo el genoma para encontrarinteracciones de novo de largo alcance entre elementos de ADN unidos por factores proteicos. ^[9] El primer ChIA-PET fue desarrollado por Fullwood et al. . (2009)^[9] para generar un mapa de las interacciones entre la cromatina unida por el receptor de estrógeno α (ER-α) encélulas de adenocarcinoma de mama humano tratadas con estrógeno. ^[9] ChIA-PET es una forma imparcial de analizar interacciones y estructuras de cromatina de orden superior porque puede detectar interacciones entre elementos desconocidos del ADN. Por el contrario, losmétodos 3C y 4C se utilizan para detectar interacciones que involucran una región objetivo específica en el genoma. ChIA-PET es similar a encontrar genes de fusión a través de RNA-PET en el sentido de que las etiquetas emparejadas se asignan a diferentes regiones del genoma. ^[1] Sin embargo, ChIA-PET implica ligaciones artificiales entre diferentes fragmentos de ADN ubicados en diferentes regiones genómicas, en lugar de la fusión natural entre dos regiones genómicas como en RNA-PET.
RNA-PET : esta aplicación se utiliza para estudiar el transcriptoma : transcripciones, estructuras de genes y expresiones de genes. ^[1]^[10] La biblioteca de PET se genera utilizando ADNc de longitud completa, por lo que los ditags representan las firmas de cola de poliA con tapa 5 'y 3' de transcripciones individuales. Por tanto, el RNA-PET es especialmente útil para delimitar los límites de las unidades de transcripción. Esto ayudará a identificar sitios alternativos de inicio de la transcripción y sitios de poliadenilación de genes. ^{[1] El} RNA-PET también podría usarse para detectar genes de fusión y empalme trans , pero se necesitan más experimentos para distinguirlos. ^[11] Otros métodos para encontrar los límites de las transcripciones incluyen las estrategias de etiqueta única CAGE , SAGE y el SuperSAGE más reciente , con CAGE y 5 'SAGE definiendo los sitios de inicio de la transcripción y 3' SAGE definiendo los sitios de poliadenilación . ^[1] Las ventajas de la secuenciación de PET sobre estos métodos son que la PET identifica ambos extremos de las transcripciones y, al mismo tiempo, proporciona más especificidad al mapear el genoma. La secuenciación de los cDNA puede revelar las estructuras de las transcripciones con gran detalle, pero este enfoque es mucho más caro que la secuenciación de RNA-PET, especialmente para caracterizar el transcriptoma completo . ^[10] La principal limitación de RNA-PET es la falta de información sobre la organización de los exones internos de las transcripciones. Por tanto, el RNA-PET no es adecuado para detectar empalmes alternativos . Además, si se utiliza el procedimiento de clonación , construir la biblioteca de ADNc antes de generar los PET, los ADNc que son difíciles de clonar (como resultado de transcripciones largas) tendrían una cobertura menor. ^[10] De manera similar, las transcripciones (o isoformas de transcripción) con niveles de expresión bajos probablemente también estarían subrepresentadas.

Referencias

^ a b c d e f g h i j k l Fullwood MJ, Wei CL, Liu ET, Ruan Y. 2009. Secuenciación de ADN de próxima generación de etiquetas de extremos emparejados (PET) para análisis de transcriptoma y genoma. Investigación del genoma. 19: 521–532. PMID 19339662
^ Morgan RD, Bhatia TK, Lovasco L, Davis TB. 2008. MmeI: Un sistema mínimo de modificación de restricción de Tipo II que solo modifica una hebra de ADN para la protección del hospedador. Ácidos nucleicos Res. 36: 6558–6570.
^ Matsumura H, Reich S, Ito A, Saitoh H, Kamoun S, Winter P, Kahl G, Reuter M, Kruger DH, Terauchi R. 2003. Análisis de la expresión génica de las interacciones planta huésped-patógeno por SuperSAGE. Proc. Natl. Acad. Sci. 100: 15718-15723.
^ McKernan y col. 2009. Secuencia y variación estructural en un genoma humano descubierto por secuenciación de ligadura masivamente paralela de lectura corta utilizando codificación de dos bases. Investigación del genoma. 19: 1527-1541.
^ Barski A, Cuddapa S, Cui K, Roh TY, Schones DE, Wang Z, Wei G, Chepelev I, Zhao K. 2007. Perfiles de alta resolución de metilaciones de histonas en el genoma humano. Célula. 129: 823–837.
^ Johnson DS, Mortazavi A, Myers RM, Wold B. 2007. Mapeo genómico de interacciones proteína-ADN in vivo. Ciencias. 316: 1497–1502.
^ Chen X y col. 2008. Integración de vías de señalización externa con la red transcripcional central en células madre embrionarias. Cell 133: 1106-1117.
^ Wu J, Smith LT, Plass C, Huang TH. 2006. ChIP-chip alcanza la mayoría de edad para el análisis funcional de todo el genoma. Cancer Res. 66 (14): 6899–902
^ a b c Fullwood MJ, Liu MH, Pan YF y col. 2009. Un interactoma de la cromatina humana unida al receptor alfa de estrógeno. Naturaleza. 462: 58-64.
^ a b c Ng P, Wei CL, Sung WK et al. 2005. Análisis de firma de identificación de genes (GIS) para la caracterización del transcriptoma y la anotación del genoma. Nat. Métodos. 2: 105-111.
^ Ruan Y, Ooi HS, Choo SW et al. 2007. Transcripciones de fusión y loci retrotranspuestos transcritos descubiertos a través de un análisis de transcriptoma completo utilizando diTags Paired-End (PET). Genome Res. 17: 828–838.

[fullwood-1] ^ a b c d e f g h i j k l Fullwood MJ, Wei CL, Liu ET, Ruan Y. 2009. Secuenciación de ADN de próxima generación de etiquetas de extremos emparejados (PET) para análisis de transcriptoma y genoma. Investigación del genoma. 19: 521–532. PMID 19339662

[2] Morgan RD, Bhatia TK, Lovasco L, Davis TB. 2008. MmeI: Un sistema mínimo de modificación de restricción de Tipo II que solo modifica una hebra de ADN para la protección del hospedador. Ácidos nucleicos Res. 36: 6558–6570.

[3] Matsumura H, Reich S, Ito A, Saitoh H, Kamoun S, Winter P, Kahl G, Reuter M, Kruger DH, Terauchi R. 2003. Análisis de la expresión génica de las interacciones planta huésped-patógeno por SuperSAGE. Proc. Natl. Acad. Sci. 100: 15718-15723.

[4] McKernan y col. 2009. Secuencia y variación estructural en un genoma humano descubierto por secuenciación de ligadura masivamente paralela de lectura corta utilizando codificación de dos bases. Investigación del genoma. 19: 1527-1541.

[5] Barski A, Cuddapa S, Cui K, Roh TY, Schones DE, Wang Z, Wei G, Chepelev I, Zhao K. 2007. Perfiles de alta resolución de metilaciones de histonas en el genoma humano. Célula. 129: 823–837.

[6] Johnson DS, Mortazavi A, Myers RM, Wold B. 2007. Mapeo genómico de interacciones proteína-ADN in vivo. Ciencias. 316: 1497–1502.

[7] Chen X y col. 2008. Integración de vías de señalización externa con la red transcripcional central en células madre embrionarias. Cell 133: 1106-1117.

[8] Wu J, Smith LT, Plass C, Huang TH. 2006. ChIP-chip alcanza la mayoría de edad para el análisis funcional de todo el genoma. Cancer Res. 66 (14): 6899–902

[fullwood2-9] Fullwood MJ, Liu MH, Pan YF y col. 2009. Un interactoma de la cromatina humana unida al receptor alfa de estrógeno. Naturaleza. 462: 58-64.

[NG-10] Ng P, Wei CL, Sung WK et al. 2005. Análisis de firma de identificación de genes (GIS) para la caracterización del transcriptoma y la anotación del genoma. Nat. Métodos. 2: 105-111.

[11] Ruan Y, Ooi HS, Choo SW et al. 2007. Transcripciones de fusión y loci retrotranspuestos transcritos descubiertos a través de un análisis de transcriptoma completo utilizando diTags Paired-End (PET). Genome Res. 17: 828–838.

[1]