La secuenciación con bisulfito [1] (también conocida como secuenciación con bisulfito ) es el uso del tratamiento con bisulfito del ADN antes de la secuenciación de rutina para determinar el patrón de metilación . La metilación del ADN fue la primera marca epigenética descubierta y sigue siendo la más estudiada. En los animales, implica predominantemente la adición de un grupo metilo a la posición del carbono 5 de los residuos de citosina del dinucleótido CpG y está implicado en la represión de la actividad transcripcional .
El tratamiento del ADN con bisulfito convierte los residuos de citosina en uracilo , pero no afecta a los residuos de 5-metilcitosina . Por lo tanto, el ADN que ha sido tratado con bisulfito retiene solo citosinas metiladas. Por lo tanto, el tratamiento con bisulfito introduce cambios específicos en la secuencia de ADN que dependen del estado de metilación de los residuos de citosina individuales, proporcionando información de resolución de un solo nucleótido sobre el estado de metilación de un segmento de ADN. Se pueden realizar varios análisis en la secuencia alterada para recuperar esta información. Por tanto, el objetivo de este análisis se reduce a diferenciar entre polimorfismos de un solo nucleótido (citosinas y timidina) resultante de la conversión de bisulfito (Figura 1).
La secuenciación de bisulfito aplica métodos de secuenciación de rutina en el ADN genómico tratado con bisulfito para determinar el estado de metilación en los dinucleótidos CpG. También se emplean otras estrategias de no secuenciación para interrogar la metilación en loci específicos o en un nivel de todo el genoma . Todas las estrategias asumen que la conversión inducida por bisulfito de citosinas no metiladas en uracilo es completa, y esto sirve como base para todas las técnicas posteriores. Idealmente, el método utilizado determinaría el estado de metilación por separado para cada alelo . Los métodos alternativos a la secuenciación de bisulfito incluyen el análisis de restricción de bisulfito combinado y la inmunoprecipitación de ADN metilado (MeDIP).
Se están desarrollando continuamente metodologías para analizar el ADN tratado con bisulfito. Para resumir estas metodologías en rápida evolución, se han escrito numerosos artículos de revisión. [2] [3] [4] [5]
Las metodologías se pueden dividir generalmente en estrategias basadas en PCR específica de metilación (MSP) (Figura 4) y estrategias que emplean la reacción en cadena de la polimerasa (PCR) realizada en condiciones no específicas de metilación (Figura 3). Los métodos basados en microarrays también utilizan PCR basada en condiciones no específicas de metilación.
El primer método informado de análisis de metilación que utiliza ADN tratado con bisulfito utilizó PCR y secuenciación de ADN de didesoxinucleótido estándar para determinar directamente los nucleótidos resistentes a la conversión de bisulfito. [6] Los cebadores están diseñados para ser específicos de cadena y de bisulfito (es decir, cebadores que contienen citosinas no CpG de manera que no son complementarios del ADN no tratado con bisulfito), flanqueando (pero sin involucrar) el sitio de metilación de interés. Por lo tanto, amplificará tanto las secuencias metiladas como las no metiladas, en contraste con la PCR específica de metilación. Todos los sitios de citosinas no metiladas se muestran como timinas en la secuencia amplificada resultante de la hebra sentido, y como adeninas en la cadena amplificada.hebra antisentido . Al incorporar adaptadores de secuenciación de alto rendimiento en los cebadores de PCR, los productos de PCR se pueden secuenciar con secuenciación masivamente paralela. Alternativamente, y laboriosamente, el producto de PCR se puede clonar y secuenciar. Se pueden utilizar métodos de PCR anidados para mejorar el producto para la secuenciación .
Todas las técnicas de análisis de metilación de ADN posteriores que utilizan ADN tratado con bisulfito se basan en este informe de Frommer et al. (Figura 2). [6] Aunque la mayoría de las otras modalidades no son verdaderas técnicas basadas en secuenciación, el término "secuenciación de bisulfito" se utiliza a menudo para describir las técnicas de análisis de metilación del ADN por conversión de bisulfito en general.
La pirosecuenciación también se ha utilizado para analizar ADN tratado con bisulfito sin utilizar PCR específica de metilación. [7] [8] Después de la amplificación por PCR de la región de interés, la pirosecuenciación se utiliza para determinar la secuencia convertida con bisulfito de sitios CpG específicos en la región. La relación de C a T en sitios individuales se puede determinar cuantitativamente basándose en la cantidad de incorporación de C y T durante la extensión de la secuencia. La principal limitación de este método es el costo de la tecnología. Sin embargo, la pirosecuenciación permite la extensión a métodos de cribado de alto rendimiento .
Una mejora adicional de esta técnica fue descrita recientemente por Wong et al., Que utiliza cebadores específicos de alelo que incorporan polimorfismos de un solo nucleótido en la secuencia del cebador de secuenciación, lo que permite un análisis separado de los alelos maternos y paternos . [9] Esta técnica es de particular utilidad para el análisis de la impronta genómica .
Este método se basa en el método de análisis de polimorfismo de conformación monocatenario (SSCA) desarrollado para el análisis de polimorfismo de nucleótido único (SNP). [10] SSCA diferencia entre fragmentos de ADN monocatenario de tamaño idéntico pero secuencia distinta basándose en la migración diferencial en la electroforesis no desnaturalizante . En MS-SSCA, esto se usa para distinguir entre regiones amplificadas por PCR tratadas con bisulfito que contienen los sitios CpG de interés. Aunque SSCA carece de sensibilidad cuando solo un nucleótidoSi hay una diferencia, el tratamiento con bisulfito con frecuencia realiza una serie de conversiones de C a T en la mayoría de las regiones de interés, y la sensibilidad resultante se acerca al 100%. MS-SSCA también proporciona un análisis semicuantitativo del grado de metilación del ADN en función de la proporción de intensidades de banda. Sin embargo, este método está diseñado para evaluar todos los sitios CpG como un todo en la región de interés en lugar de los sitios de metilación individuales.
Un método adicional para diferenciar el ADN convertido del tratado con bisulfito no convertido es el análisis de fusión de alta resolución (HRM), una técnica cuantitativa basada en PCR inicialmente diseñada para distinguir los SNP. [11] Los amplicones de PCR se analizan directamente mediante aumento de temperatura y la liberación resultante de un colorante fluorescente intercalado durante la fusión. El grado de metilación, representado por el contenido de C a T en el amplicón , determina la rapidez de fusión y la consiguiente liberación del tinte. Este método permite la cuantificación directa en un ensayo de un solo tubo, pero evalúa la metilación en la región amplificada como un todo en lugar de en sitios CpG específicos .
MS-SnuPE emplea el método de extensión de cebadores diseñado inicialmente para analizar polimorfismos de un solo nucleótido . [12] El ADN se convierte con bisulfito y los cebadores específicos de bisulfito se hibridan con la secuencia hasta el par de bases inmediatamente antes del CpG de interés. Se permite que el cebador se extienda un par de bases en la C (o T) usando didesoxinucleótidos que terminan en la ADN polimerasa , y la relación de C a T se determina cuantitativamente.
Se pueden utilizar varios métodos para determinar esta relación C: T. Al principio, MS-SnuPE se basó en ddNTP radiactivos como informador de la extensión del cebador. También se pueden utilizar métodos basados en fluorescencia o pirosecuenciación . [13] Sin embargo, el análisis de espectrometría de masas de ionización por desorción láser asistida por matriz / tiempo de vuelo ( MALDI-TOF ) para diferenciar entre los dos productos de extensión de cebadores polimórficos se puede utilizar, en esencia, basado en el ensayo GOOD diseñado para genotipado de SNP . La cromatografía líquida de alto rendimiento de fase inversa de pares iónicos (IP-RP- HPLC ) también se ha utilizado para distinguir los productos de extensión de cebadores. [14]
Un método descrito recientemente por Ehrich et al. aprovecha además las conversiones de bisulfito al agregar un paso de escisión específico de base para mejorar la información obtenida de los cambios de nucleótidos. [15] Al usar primero la transcripción in vitro de la región de interés en ARN (agregando un sitio promotor de ARN polimerasa al cebador de PCR en la amplificación inicial), la ARNasa A puede usarse para escindir la transcripción de ARN en sitios específicos de bases. Como la RNasa A escinde el ARN específicamente en los ribonucleótidos de citosina y uracilo , la especificidad de base se logra agregando incorporadores resistentes a la escisión dTTP cuando se desea una escisión específica de citosina (específica de C) e incorporación de dCTP cuando se desea una escisión específica de uracilo (específica de U). A continuación, los fragmentos escindidos pueden analizarse mediante MALDI-TOF . El tratamiento con bisulfito da como resultado la introducción / eliminación de sitios de escisión mediante conversiones de C a U o un cambio en la masa del fragmento mediante conversiones de G a A en la hebra inversa amplificada. La escisión específica de C cortará específicamente en todos los sitios CpG metilados . Al analizar los tamaños de los fragmentos resultantes, es posible determinar el patrón específico de metilación del ADN de los sitios CpG dentro de la región, en lugar de determinar el grado de metilación de la región en su conjunto. Este método demostró eficacia para el cribado de alto rendimiento., lo que permite el interrogatorio de numerosos sitios CpG en múltiples tejidos de una manera rentable.
Este método alternativo de análisis de metilación también utiliza ADN tratado con bisulfito pero evita la necesidad de secuenciar el área de interés. [16] En cambio, los pares de cebadores están diseñados para ser "metilados específicos" al incluir secuencias que complementan solo 5-metilcitosinas no convertidas o, por el contrario, "no metiladas específicas", que complementan timinas convertidas a partir de citosinas no metiladas. La metilación está determinada por la capacidad del cebador específico para lograr la amplificación. Este método es particularmente útil para interrogar islas CpGcon una densidad de metilación posiblemente alta, ya que un mayor número de pares de CpG en el cebador aumenta la especificidad del ensayo. La colocación del par CpG en el extremo 3 'del cebador también mejora la sensibilidad. El informe inicial que utilizó MSP describió una sensibilidad suficiente para detectar la metilación del 0,1% de los alelos . En general, se considera que la MSP y sus protocolos relacionados son los más sensibles al interrogar el estado de metilación en un locus específico .
El método MethyLight se basa en MSP, pero proporciona un análisis cuantitativo mediante PCR cuantitativa . [17] Se utilizan cebadores específicos metilados, y también se utiliza una sonda indicadora de fluorescencia específica metilada que se hibrida con la región amplificada. De forma alternativa, los cebadores o la sonda pueden diseñarse sin especificidad de metilación si se necesita discriminación entre los pares de CpG dentro de las secuencias implicadas. La cuantificación se realiza con referencia a un ADN de referencia metilado. Una modificación de este protocolo para aumentar la especificidad de la PCR para el ADN convertido con bisulfito con éxito (ConLight-MSP) utiliza una sonda adicional para el ADN sin convertir con bisulfito para cuantificar esta amplificación no específica. [18]
La metodología adicional que utiliza ADN amplificado con MSP analiza los productos mediante el análisis de la curva de fusión (Mc-MSP). [19] Este método amplifica el ADN convertido con bisulfito con cebadores específicos metilados y no metilados, y determina la proporción cuantitativa de los dos productos comparando los picos diferenciales generados en un análisis de curva de fusión. Se ha introducido un método de análisis de fusión de alta resolución que utiliza tanto la PCR cuantitativa como el análisis de fusión, en particular, para la detección sensible de metilación de bajo nivel [20].
Los métodos basados en micromatrices son una extensión lógica de las tecnologías disponibles para analizar el ADN tratado con bisulfito para permitir el análisis de metilación en todo el genoma. [21] Las micromatrices de oligonucleótidos se diseñan utilizando pares de sondas de hibridación de oligonucleótidos que se dirigen a los sitios CpG de interés. Una es complementaria a la secuencia metilada inalterada y la otra es complementaria a la secuencia no metilada convertida de C a U. Las sondas también son específicas de bisulfito para evitar la unión al ADN convertido de forma incompleta por bisulfito. El ensayo de metilación de Illumina es uno de esos ensayos que aplica la tecnología de secuenciación de bisulfito a nivel de microarrays para generar datos de metilación de todo el genoma.
La secuenciación de bisulfito se usa ampliamente en genomas de mamíferos, sin embargo, han surgido complicaciones con el descubrimiento de una nueva modificación del ADN de mamífero, la 5-hidroximetilcitosina . [22] [23] La 5-hidroximetilcitosina se convierte en citosina-5-metilsulfonato tras el tratamiento con bisulfito, que luego se lee como una C cuando se secuencia. [24] Por lo tanto, la secuenciación de bisulfito no puede discriminar entre 5-metilcitosina y 5-hidroximetilcitosina. Esto significa que el resultado de la secuenciación de bisulfito ya no se puede definir como únicamente metilación del ADN, ya que es el compuesto de 5-metilcitosina y 5-hidroximetilcitosina. El desarrollo de la secuenciación oxidativa de bisulfito asistida por Tet por Chuan Heen la Universidad de Chicago ahora puede distinguir entre las dos modificaciones con una resolución de base única. [25]
La secuenciación de bisulfito se basa en la conversión de cada residuo de citosina no metilado en uracilo. Si la conversión es incompleta, el análisis posterior interpretará incorrectamente las citosinas no metiladas no convertidas como citosinas metiladas, lo que dará lugar a resultados falsos positivos para la metilación. Solo las citosinas en el ADN monocatenario son susceptibles de ser atacadas por bisulfito, por lo tanto, la desnaturalización del ADN sometido a análisis es crítica. [2] Es importante asegurarse de que los parámetros de reacción, como la temperatura y la concentración de sal, sean adecuados para mantener el ADN en una conformación monocatenaria y permitir la conversión completa. Incrustar el ADN en agarosaSe ha informado que el gel mejora la tasa de conversión al mantener las hebras de ADN físicamente separadas. [26]
Un desafío importante en la secuenciación de bisulfito es la degradación del ADN que tiene lugar al mismo tiempo que la conversión. Las condiciones necesarias para la conversión completa, tales como tiempos de incubación prolongados, temperatura elevada y alta concentración de bisulfito, pueden conducir a la degradación de aproximadamente el 90% del ADN incubado. [27] Dado que la cantidad inicial de ADN a menudo es limitada, una degradación tan extensa puede ser problemática. La degradación ocurre como depurinaciones que resultan en roturas aleatorias de la hebra. [28] Por lo tanto, cuanto más largo sea el amplicón de PCR deseado, es probable que sea más limitado el número de moléculas molde intactas. Esto podría provocar el fallo de la amplificación por PCR o la pérdida de información cuantitativamente precisa sobre los niveles de metilación como resultado del muestreo limitado de moléculas molde. Por tanto, es importante evaluar la cantidad de degradación del ADN resultante de las condiciones de reacción empleadas y considerar cómo afectará esto al amplicón deseado . También se pueden utilizar técnicas para minimizar la degradación del ADN, como el ciclo de la temperatura de incubación. [28]
En 2020, New England Biolabs desarrolló NEBNext Enzymatic Methyl-seq, un enfoque enzimático alternativo para minimizar el daño al ADN. [29]
Un problema potencialmente significativo que sigue al tratamiento con bisulfito es la desulfonación incompleta de los residuos de pirimidina debido a una alcalinización inadecuada de la solución. Esto puede inhibir algunas ADN polimerasas , dificultando la posterior PCR. Sin embargo, esta situación se puede evitar controlando el pH de la solución para asegurar que la desulfonación sea completa. [2]
Una última preocupación es que el tratamiento con bisulfito reduce en gran medida el nivel de complejidad de la muestra, lo que puede resultar problemático si se van a realizar múltiples reacciones de PCR (2006). [5] El diseño del cebador es más difícil y la hibridación cruzada inapropiada es más frecuente.
Los avances en la secuenciación de bisulfitos han llevado a la posibilidad de aplicarlos a una escala de todo el genoma , donde, anteriormente, la medición global de la metilación del ADN solo era factible utilizando otras técnicas, como el escaneo genómico de referencia de restricción . Muchos científicos consideran que el mapeo del epigenoma humano es el seguimiento lógico de la finalización del Proyecto Genoma Humano . [30] [31] Esta información epigenómica será importante para comprender cómo se implementa y regula la función de la secuencia genética. Dado que el epigenoma es menos estable que el genoma, se cree que es importante en las interacciones gen-ambiente . [32]
Sin embargo, el mapeo epigenómico es intrínsecamente más complejo que la secuenciación del genoma , ya que el epigenoma es mucho más variable que el genoma . El epigenoma de uno varía con la edad, difiere entre tejidos, se ve alterado por factores ambientales y muestra aberraciones en las enfermedades. Sin embargo, un mapeo epigenómico tan rico, que representa diferentes edades, tipos de tejidos y estados de enfermedad, proporcionaría información valiosa sobre la función normal de las marcas epigenéticas , así como los mecanismos que conducen al envejecimiento y la enfermedad.
Los beneficios directos del mapeo epigenómico incluyen probables avances en la tecnología de clonación . Se cree que los fallos en la producción de animales clonados con viabilidad y esperanza de vida normales son el resultado de patrones inapropiados de marcas epigenéticas. Además, los patrones de metilación aberrantes están bien caracterizados en muchos cánceres . La hipometilación global da como resultado una disminución de la estabilidad genómica, mientras que la hipermetilación local de los promotores de genes supresores de tumores a menudo explica su pérdida de función . Los patrones específicos de metilación son indicativos de tipos específicos de cáncer, tienen valor pronóstico y pueden ayudar a guiar el mejor curso de tratamiento. [31]
Se están realizando esfuerzos de mapeo del epigenoma a gran escala en todo el mundo y se han organizado en el marco del Proyecto Epigenoma Humano . [32] Esto se basa en una estrategia de varios niveles, mediante la cual se utiliza la secuenciación de bisulfito para obtener perfiles de metilación de alta resolución para un número limitado de epigenomas de referencia, mientras que se realiza un análisis menos exhaustivo en un espectro más amplio de muestras. Este enfoque tiene como objetivo maximizar la información obtenida de una cantidad determinada de recursos, ya que el mapeo de todo el genoma de alta resolución sigue siendo una empresa costosa.
Se ha demostrado que el análisis de conjuntos de genes (por ejemplo, utilizando herramientas como DAVID y GoSeq) está muy sesgado cuando se aplica a datos de metilación de alto rendimiento (por ejemplo, secuenciación de bisulfito en todo el genoma); Se ha sugerido que esto puede corregirse usando permutaciones de etiquetas de muestra o usando un modelo estadístico para controlar las diferencias en los números de sondas CpG / sitios CpG que se dirigen a cada gen. [33]
Tanto la 5-metilcitosina como la 5-hidroximetilcitosina se leen como una C en la secuenciación de bisulfito. [24] La secuenciación de bisulfito oxidativo es un método para discriminar entre 5-metilcitosina y 5-hidroximetilcitosina en una resolución de base única. El método emplea una oxidación química específica (asistida por Tet) de 5-hidroximetilcitosina a 5-formilcitosina, que posteriormente se convierte en uracilo durante el tratamiento con bisulfito. [34] La única base que luego se lee como C es la 5-metilcitosina, lo que da un mapa del verdadero estado de metilación en la muestra de ADN. Los niveles de 5-hidroximetilcitosina también se pueden cuantificar midiendo la diferencia entre el bisulfito y la secuenciación oxidativa del bisulfito.