La plataforma Helicos Genetic Analysis System fue la primera implementación comercial de NGS (Next Generation Sequencing) en utilizar el principio de secuenciación fluorescente de una sola molécula , un método para identificar la secuencia exacta de un fragmento de ADN . Fue comercializado por la ahora desaparecida Helicos Biosciences .
Los fragmentos de moléculas de ADN primero se hibridan en su lugar en celdas de flujo de vidrio desechables. A continuación, se agregan los nucleótidos fluorescentes uno por uno, y se usa un nucleótido de terminación para pausar el proceso hasta que se haya capturado una imagen. A partir de la imagen, se puede determinar un nucleótido de cada secuencia de ADN. A continuación, se corta la molécula fluorescente y se repite el proceso hasta que los fragmentos se hayan secuenciado por completo. [1]
Este método y equipo de secuenciación se utilizaron para secuenciar el genoma del bacteriófago M13 . [2]
Preparando el ADN
Fragmentar el ADN
El sistema de análisis genético Helicos es capaz de secuenciar ácidos nucleicos, desde varios nucleótidos hasta varios miles de nucleótidos. Sin embargo, el rendimiento de secuencias por unidad de masa depende del número de grupos hidroxilo del extremo 3 ' y, por tanto, tener moldes relativamente cortos para la secuenciación es más eficaz que tener moldes largos. Helicos recomienda una longitud menor a 1000 nt (nucleótidos), óptimamente alrededor de 100-200 nt. Los fragmentos largos se pueden escindir cortando el ADN (método recomendado) o enzimas de restricción. Se eliminan los fragmentos cortos para mejorar el rendimiento. [3]
Colas
Las muestras de ADN se hibridan con un cebador inmovilizado en una celda de flujo para secuenciar, por lo que generalmente es necesario generar un ácido nucleico con un extremo compatible para la hibridación con esas superficies. La secuencia diana unida a la superficie de la celda de flujo podría, en teoría, ser cualquier secuencia que pueda sintetizarse, pero, en la práctica, la celda de flujo estándar disponible comercialmente es oligo (dT) 50. Para ser compatible con el cebador oligo (dT) 50 en la superficie de la celda de flujo, es necesario generar una cola de poli (dA) de al menos 50 nt en el extremo 3 'de la molécula que se va a secuenciar. Debido a que el paso de llenado y bloqueo llenará el exceso de A pero no el exceso de T, es deseable que la cola A sea al menos tan larga como el oligo (dT) en la superficie. La generación de una cola de poli (dA) 3 'se puede lograr con una variedad de ligasas o polimerasas diferentes . Si hay suficiente ADN para medir tanto la masa como la longitud promedio, es posible determinar la cantidad adecuada de dATP que se agregará para generar colas de poli (dA) de 90 a 200 nucleótidos de longitud. Para generar colas de esta longitud, primero es necesario estimar cuántos extremos 3 'hay en la muestra y luego usar la proporción correcta de ADN, dATP y transferasa terminal para obtener el rango de tamaño óptimo de las colas. [4]
Bloqueo
Si el ADN de la cola objetivo para la secuenciación se hibrida con la celda de flujo directamente después de la cola, tendría un hidroxilo 3 'libre que podría extenderse en la reacción de secuenciación al igual que el cebador de superficie y potencialmente confundir la determinación de la secuencia. Por tanto, antes de la secuenciación, también es necesario bloquear los extremos 3 'de las moléculas a secuenciar. Puede usarse cualquier tratamiento del extremo 3 'que haga que la molécula no sea adecuada para la extensión. Normalmente, las moléculas con cola se bloquean usando transferasa terminal y un didesoxinucleótido, pero cualquier tratamiento que deje un fosfato 3 'u otra modificación que evite la extensión puede ser igualmente eficaz. [5]
secuencia ADN
Carga de muestra
La secuenciación fluorescente de una sola molécula se lleva a cabo en una celda de flujo de vidrio con 25 canales para la misma o diferentes muestras. El sistema se puede ejecutar con una o dos celdas de flujo a la vez. En la configuración estándar, cada canal es equivalente y contiene aproximadamente 8 μl. Las muestras generalmente se cargan con un volumen mayor (generalmente 20 μl o más) para garantizar una hibridación uniforme a lo largo de la celda de flujo. Las muestras se insertan en la celda de flujo a través del cargador de muestras incluido con el sistema general. Cada canal es direccionable individualmente y la muestra se aplica con vacío. La hibridación a la celda de flujo se lleva a cabo típicamente a 55 ° C durante 1 hora. [6]
Llenado y bloqueo
Generalmente, las muestras para secuenciación se preparan de tal manera que la cola de poli (A) sea más larga que el oligo (dT) 50 en la superficie de la celda de flujo. Para evitar la secuenciación de los residuos A no apareados, se necesita un tratamiento de llenado y bloqueo. Después de la hibridación, la temperatura se reduce a 37 ° C, y luego se agregan los nucleótidos d TTP y Virtual Terminator [7] correspondientes a dATP, dCTP y dGTP junto con la ADN polimerasa . Los nucleótidos terminadores virtuales se incorporan en oposición a la base complementaria y evitan una mayor incorporación debido a la estructura química adjunta al nucleótido. Por tanto, todos los dAs no apareados presentes en la cola de poli (A) se rellenan con TTP . La molécula hibridada se bloquea en su lugar cuando la polimerasa encuentra el primer residuo no A e inserta el nucleótido terminador virtual apropiado. Debido a que cada molécula de ADN debería tener ahora un tinte adherido, una imagen incluirá todas las moléculas capaces de incorporar nucleótidos. Además, debido a que la etiqueta podría corresponder a cualquier base, no se obtiene información de secuencia en esta etapa. Por tanto, para la mayoría de las moléculas, la secuenciación comienza con la segunda base de la molécula original. [8]
Secuenciación
- Ciclo de quimica
Para secuenciar los ADN hibridados, primero es necesario escindir el tinte fluorescente y las fracciones terminadoras presentes en los nucleótidos terminadores virtuales. La generación actual de nucleótidos se sintetiza con un enlace disulfuro que se puede escindir rápida y completamente. Después de la escisión, los tintes fluorescentes ahora separados se lavan y luego se agregan nueva polimerasa y un solo nucleótido fluorescente . Después de la excitación del resto fluorescente por el láser del sistema, se toma otra imagen y, en una secuencia estándar, este proceso cíclico se repite 120 veces. El número de ciclos de secuenciación es ajustable por el usuario y puede modificarse según las necesidades del usuario para el tiempo de ejecución y la duración de la lectura. Durante una ejecución estándar, se utilizan dos celdas de flujo de 25 canales, y cada celda de flujo alterna entre el ciclo químico y el ciclo de imágenes. [9]
- Ciclo de imágenes
Durante el proceso de obtención de imágenes, cuatro láseres iluminan 1100 campos de visión (FOV) por canal con imágenes tomadas por cuatro cámaras CCD ( dispositivo de carga acoplada ) a través de un microscopio confocal . Aunque se visualizan moléculas individuales, se registran múltiples emisiones de fotones para cada molécula, y el tiempo empleado en cada campo de visión depende del brillo del tinte en el nucleótido particular, así como de la velocidad de la cámara y la eficiencia de detección. En la actualidad, el proceso de generación de imágenes es el paso que determina la velocidad, y el tiempo de ejecución podría reducirse a expensas del rendimiento al reducir el número de FOV por canal. [10]
Rendimiento
En condiciones óptimas, para un ciclo estándar de 120 ciclos, 1100 campos de visión, se deben esperar de 12,000,000 a 20,000,000 lecturas de 25 nucleótidos o más y alineadas con el genoma de referencia de cada canal, para un total de hasta 1,000,000,000 de lecturas alineadas y 35 Gb de secuencia de cada ejecución. Una ejecución completa tarda hasta 8 días en completarse. [ cita requerida ]
Ventajas y desventajas
- La estrategia de secuenciación de una sola molécula simplifica el proceso de preparación de la muestra de ADN, evita sesgos y errores inducidos por la PCR , simplifica el análisis de datos y tolera muestras degradadas
- Debido a que el proceso se detiene entre cada paso de extensión, el tiempo para secuenciar un solo nucleótido es alto y las longitudes de lectura obtenidas son de 32 nucleótidos.
- La tasa de error es alta debido al ruido. Esto se puede superar con una secuenciación repetitiva, pero aumenta el costo por base para una tasa de precisión determinada, compensando algunas de las ganancias de los costos de reactivos más bajos. Las tasas de error de lectura sin procesar son generalmente del 5%, aunque la naturaleza altamente paralela de esta tecnología puede ofrecer una gran cobertura y una precisión de lectura consensuada o final del 99%. [11]
Ver también
Referencias
- ^ Thompson JF, Steinmann KE. 2010 Secuenciación de una sola molécula con un sistema de análisis genético HeliScope. Curr Protoc Mol Biol. Capítulo 7: Unidad 7.10.
- ^ Harris TD, Buzby PR, Babcock H, Beer E, Bowers J, Braslavsky I, Causey M, Colonell J, Dimeo J, Efcavitch JW, Giladi E, Gill J, Healy J, Jarosz M, Lapen D, Moulton K, Quake SR, Steinmann K, Thayer E, Tyurina A, Ward R, Weiss H, Xie Z (4 de abril de 2008). "Secuenciación de ADN de una sola molécula de un genoma viral". Ciencia . 320 (5872): 106–9. Código bibliográfico : 2008Sci ... 320..106H . doi : 10.1126 / science.1150427 . PMID 18388294 .
- ^ Morozova, Olena; et al. (2008). "Aplicaciones de las tecnologías de secuenciación de última generación en genómica funcional". Genómica . 92 (5): 255-264. doi : 10.1016 / j.ygeno.2008.07.001 . PMID 18703132 .
- ^ Bowers, Jayson; et al. (2009). "Nucleótidos terminadores virtuales para secuenciación de ADN de próxima generación" . Métodos de la naturaleza . 6 (8): 593–595. doi : 10.1038 / nmeth.1354 . PMC 2719685 . PMID 19620973 .
- ^ Mamanova, Lira; et al. (2010). "Estrategias de enriquecimiento de objetivos para la secuenciación de próxima generación". Métodos Nat . 7 (2): 111-118. doi : 10.1038 / nmeth.1419 . PMID 20111037 .
- ^ Brady, J; et al. (2011). "Condiciones óptimas de hibridación celular en secuenciación de próxima generación basada en Helicos". Revista de tecnología biomolecular . 24 (5): 211–230.
- ^ Bowers, J .; Mitchell, J .; Cerveza, E .; Buzby, PR; Causey, M .; Efcavitch, JW; Jarosz, M .; Krzymanska-Olejnik, E .; Kung, L .; Lipson, D .; Lowman, GM; Marappan, S .; McInerney, P .; Platt, A .; Roy, A .; Siddiqi, SM; Steinmann, K .; Thompson, JF (2009). "Nucleótidos terminadores virtuales para secuenciación de ADN de próxima generación" . Nat. Métodos . 6 (8): 593–595. doi : 10.1038 / nmeth.1354 . PMC 2719685 . PMID 19620973 .
- ^ Glenn, T (2011). "Guía de campo para secuenciadores de ADN de próxima generación". Recursos de ecología molecular . 11 (5): 759–769. doi : 10.1111 / j.1755-0998.2011.03024.x . PMID 21592312 .
- ^ Buermans, Dunnen (2014). "Tecnología de secuenciación de última generación: avances y aplicaciones" . Biochimica et Biophysica Acta (BBA) - Bases moleculares de la enfermedad . 1842 (10): 1932–1941. doi : 10.1016 / j.bbadis.2014.06.015 . PMID 24995601 .
- ^ Buermans, Dunnen (2014). "Tecnología de secuenciación de última generación: avances y aplicaciones" . Biochimica et Biophysica Acta (BBA) - Bases moleculares de la enfermedad . 1842 (10): 1932–1941. doi : 10.1016 / j.bbadis.2014.06.015 . PMID 24995601 .
- ^ Crosetto; et al. (2013). "Mapeo de rotura de doble hebra de ADN de resolución de nucleótidos por secuenciación de próxima generación" . Métodos de la naturaleza . 10 (4): 361–5. doi : 10.1038 / nmeth.2408 . PMC 3651036 . PMID 23503052 .
enlaces externos
- Helicosbio.com
- Wikinvest.com
- Technologyreview.com
- Scs.stanford.edu
- Seqll.com