Secuenciación paralela masiva


De Wikipedia, la enciclopedia libre
  (Redirigido desde secuenciación masivamente paralela )
Saltar a navegación Saltar a búsqueda

La secuenciación masiva en paralelo o la secuenciación masiva en paralelo es cualquiera de los varios enfoques de alto rendimiento para la secuenciación de ADN que utilizan el concepto de procesamiento masivamente paralelo; también se denomina secuenciación de próxima generación ( NGS ) o secuenciación de segunda generación . Algunas de estas tecnologías surgieron entre 1994 y 1998 [1] [2] [3] [4] y están disponibles comercialmente desde 2005. Estas tecnologías utilizan plataformas miniaturizadas y paralelizadas para secuenciar de 1 millón a 43 mil millones de lecturas cortas (50 a 400 bases cada uno) por ejecución del instrumento.

Muchas plataformas NGS difieren en configuraciones de ingeniería y química de secuenciación. Comparten el paradigma técnico de la secuenciación paralela masiva a través de moldes de ADN amplificados clonalmente separados espacialmente o moléculas de ADN individuales en una celda de flujo . Este diseño es muy diferente al de la secuenciación de Sanger, también conocida como secuenciación capilar o secuenciación de primera generación, que se basa en la separación electroforética de productos de terminación de cadena producidos en reacciones de secuenciación individuales. [5]

Plataformas NGS

La secuenciación de ADN con plataformas NGS disponibles comercialmente se realiza generalmente con los siguientes pasos. En primer lugar, las bibliotecas de secuenciación de ADN se generan mediante amplificación clonal mediante PCR in vitro . En segundo lugar, el ADN se secuencia por síntesis , de modo que la secuencia de ADN se determina mediante la adición de nucleótidos a la hebra complementaria en lugar de mediante la química de terminación de la cadena. En tercer lugar, las plantillas de ADN amplificadas y segregadas espacialmente se secuencian simultáneamente de una manera masivamente paralela sin el requisito de una etapa de separación física. Si bien estos pasos se siguen en la mayoría de las plataformas NGS, cada una utiliza una estrategia diferente. [6]

La paralelización de NGS de las reacciones de secuenciación genera cientos de megabases a gigabases de lecturas de secuencias de nucleótidos en una sola ejecución de instrumento. Esto ha permitido un aumento drástico en los datos de secuencia disponibles y ha cambiado fundamentalmente los enfoques de secuenciación del genoma en las ciencias biomédicas. [7] Las tecnologías e instrumentos de NGS recientemente emergentes han contribuido aún más a una disminución significativa en el costo de secuenciación acercándose a la marca de $ 1000 por secuenciación del genoma . [8] [9]

A partir de 2014, las plataformas de secuenciación masivamente paralelas disponibles comercialmente y sus características se resumen en la tabla. A medida que el ritmo de las tecnologías NGS avanza rápidamente, las especificaciones técnicas y los precios cambian.

Una máquina de secuenciación Illumina HiSeq 2000


Se anotan los tiempos de ejecución y la salida de gigabase (Gb) por ejecución para la secuenciación de un solo extremo. Los tiempos de ejecución y las salidas se duplican aproximadamente cuando se realiza una secuenciación de extremo emparejado. ‡ Longitudes de lectura promedio para las plataformas Roche 454 y Helicos Biosciences. [21]

Métodos de preparación de plantillas para NGS

Se utilizan dos métodos para preparar moldes para reacciones NGS: moldes amplificados que se originan a partir de moléculas de ADN individuales y moldes de moléculas de ADN individuales. Para los sistemas de formación de imágenes que no pueden detectar eventos de fluorescencia únicos, se requiere la amplificación de las plantillas de ADN. Los tres métodos de amplificación más comunes son la PCR en emulsión (emPCR), el círculo rodante y la amplificación en fase sólida. La distribución final de las plantillas puede ser espacialmente aleatoria o en una cuadrícula.

PCR en emulsión

En los métodos de PCR en emulsión , primero se genera una biblioteca de ADN mediante la fragmentación aleatoria del ADN genómico. Los fragmentos de ADN monocatenario (plantillas) se unen a la superficie de las perlas con adaptadores o enlazadores, y una perla se une a un solo fragmento de ADN de la biblioteca de ADN. La superficie de las perlas contiene sondas de oligonucleótidos con secuencias complementarias a los adaptadores que se unen a los fragmentos de ADN. A continuación, las perlas se compartimentan en gotitas de emulsión de agua y aceite. En la emulsión acuosa de agua y aceite, cada una de las gotitas que capturan una perla es un microrreactor de PCR que produce copias amplificadas de la única plantilla de ADN. [22] [23] [24]

Nanobolas circulares cuadriculadas

La amplificación de una población de moléculas de ADN individuales mediante la amplificación en círculo rodante en solución va seguida de la captura en una cuadrícula de puntos de tamaño más pequeño que los ADN que se van a inmovilizar. [25] [26] [27] [28]

Generación de colonias de ADN (amplificación de puente)

Los cebadores de avance y retroceso se unen covalentemente a alta densidad al portaobjetos en una celda de flujo. La relación de los cebadores a la plantilla en el soporte define la densidad de superficie de los grupos amplificados. La celda de flujo se expone a reactivos para la extensión basada en polimerasa , y el cebado se produce cuando el extremo libre / distal de un fragmento ligado "forma puentes" con un oligo complementario en la superficie. La desnaturalización y extensión repetidas dan como resultado la amplificación localizada de fragmentos de ADN en millones de ubicaciones separadas a lo largo de la superficie de la celda de flujo. La amplificación en fase sólida produce de 100 a 200 millones de grupos de plantillas separados espacialmente, lo que proporciona extremos libres a los que luego se hibrida un cebador de secuenciación universal para iniciar la reacción de secuenciación. [22][23] Esta tecnología fue presentada para una patente en 1997 del Instituto de Investigación Biomédica de Glaxo-Welcome (GBRI), por Pascal Mayer  [ fr ] , Eric Kawashima y Laurent Farinelli, [3] [4] y fue presentada públicamente para el por primera vez en 1998. [29] En 1994 Chris Adams y Steve Kron presentaron una patente sobre un método de amplificación de superficie similar, pero no clonal, llamado “amplificación de puente” [2] adaptado para amplificación clonal en 1997 por Church y Mitra. [25] [26]

Plantillas de una sola molécula

Los protocolos que requieren amplificación de ADN suelen ser engorrosos de implementar y pueden introducir errores de secuenciación. La preparación de moldes de una sola molécula es más sencilla y no requiere PCR, que puede introducir errores en los moldes amplificados. Las secuencias diana ricas en AT y GC a menudo muestran un sesgo de amplificación, lo que da como resultado su subrepresentación en las alineaciones y ensamblajes del genoma. Las plantillas de una sola molécula se inmovilizan normalmente sobre soportes sólidos utilizando uno de al menos tres enfoques diferentes. En el primer enfoque, las moléculas de cebador individuales distribuidas espacialmente se unen covalentemente al soporte sólido. La plantilla, que se prepara fragmentando aleatoriamente el material de partida en tamaños pequeños (por ejemplo, ~ 200-250 pb) y agregando adaptadores comunes a los extremos del fragmento, se hibrida luego con el cebador inmovilizado.En el segundo enfoque, los moldes de una sola molécula distribuidos espacialmente se unen covalentemente al soporte sólido cebando y extendiendo moldes de una sola molécula de hebra única a partir de cebadores inmovilizados. A continuación, se hibrida un cebador común con la plantilla. En cualquier enfoque, la ADN polimerasa puede unirse a la configuración de la plantilla cebada inmovilizada para iniciar la reacción NGS. Helicos BioSciences utiliza ambos enfoques anteriores. En un tercer enfoque, se unen moléculas de polimerasa individuales distribuidas espacialmente al soporte sólido, al que se une una molécula plantilla cebada. Este enfoque es utilizado por Pacific Biosciences. Se pueden usar moléculas de ADN más grandes (hasta decenas de miles de pares de bases) con esta técnica y, a diferencia de los dos primeros enfoques, el tercer enfoque se puede usar con métodos en tiempo real.resultando en longitudes de lectura potencialmente más largas.

Enfoques de secuenciación

Pirosecuenciación

En 1996, Pål Nyrén y su alumno Mostafa Ronaghi del Real Instituto de Tecnología de Estocolmo publicaron su método de pirosecuenciación . [1] La pirosecuenciación es un método de bioluminiscencia no electroforético que mide la liberación de pirofosfato inorgánico convirtiéndolo proporcionalmente en luz visible mediante una serie de reacciones enzimáticas. A diferencia de otros enfoques de secuenciación que utilizan nucleótidos modificados para terminar la síntesis de ADN, el método de pirosecuenciación manipula la ADN polimerasa mediante la adición única de un dNTP.en cantidades limitadas. Tras la incorporación del dNTP complementario, la ADN polimerasa extiende el cebador y hace una pausa. La síntesis de ADN se reinicia tras la adición del siguiente dNTP complementario en el ciclo de dispensación. El orden y la intensidad de los picos de luz se registran como diagramas de flujo, que revelan la secuencia de ADN subyacente.[30]

Secuenciación por química terminador reversible

Este enfoque utiliza dNTP reversibles unidos al terminador en un método cíclico que comprende la incorporación de nucleótidos, la formación de imágenes por fluorescencia y la escisión. Se crea una imagen de un terminador marcado con fluorescencia a medida que se agrega cada dNTP y luego se escinde para permitir la incorporación de la siguiente base. Estos nucleótidos se bloquean químicamente de manera que cada incorporación es un evento único. Un paso de formación de imágenes sigue a cada paso de incorporación de base, luego el grupo bloqueado se elimina químicamente para preparar cada hebra para la siguiente incorporación mediante ADN polimerasa. Esta serie de pasos continúa durante un número específico de ciclos, según lo determinado por la configuración del instrumento definida por el usuario. Los grupos de bloqueo 3 'se concibieron originalmente como reversión enzimática [31] o química [12] [13].El método químico ha sido la base de las máquinas Solexa e Illumina. La secuenciación mediante la química del terminador reversible puede ser un ciclo de cuatro colores como el utilizado por Illumina / Solexa, o un ciclo de un color como el utilizado por Helicos BioSciences. Helicos BioSciences utilizó “terminadores virtuales”, que son terminadores desbloqueados con un segundo análogo de nucleósido que actúa como inhibidor. Estos terminadores tienen las modificaciones apropiadas para terminar o inhibir grupos de modo que la síntesis de ADN finalice después de la adición de una sola base. [23] [32] [33]

Secuenciación por ligadura mediada por enzimas ligasa

En este enfoque, la reacción de extensión de la secuencia no se lleva a cabo mediante polimerasas sino más bien mediante ADN ligasa y sondas codificadas por una base o sondas codificadas por dos bases. En su forma más simple, una sonda marcada con fluorescencia se hibrida con su secuencia complementaria adyacente a la plantilla cebada. Luego se agrega ADN ligasa para unir la sonda marcada con colorante al cebador. Las sondas no ligadas se eliminan por lavado, seguido de formación de imágenes de fluorescencia para determinar la identidad de la sonda ligada. El ciclo se puede repetir utilizando sondas escindibles para eliminar el tinte fluorescente y regenerar un grupo 5′-PO4 para los ciclos de ligación posteriores (ligadura encadenada [14] [34] ) o eliminando e hibridando un nuevo cebador con la plantilla (desencadenado ligadura[16] [17] ).

Nucleótidos fluorescentes fosfolinados o secuenciación en tiempo real

Pacific Biosciences lidera actualmente este método. El método de secuenciación en tiempo real implica la obtención de imágenes del continua incorporación de nucleótidos marcados con colorante durante la síntesis de ADN: moléculas de polimerasa de ADN solo están unidos a la superficie inferior de los detectores individuales en modo cero de guía de ondas (detectores ZMW) que pueden obtener información de la secuencia mientras phospholinked nucleótidos se están incorporando en la cadena de imprimación en crecimiento. Pacific Biosciences utiliza una ADN polimerasa única que incorpora mejor nucleótidos fosfoliados y permite la resecuenciación de moldes circulares cerrados. Si bien la precisión de lectura única es del 87%, se ha demostrado una precisión de consenso del 99,999% con longitudes de lectura de varias kilobase. [35] [36]En 2015, Pacific Biosciences lanzó un nuevo instrumento de secuenciación llamado Sequel System, que aumenta la capacidad aproximadamente 6,5 veces. [37] [38]

Ver también

  • Secuenciación clínica metagenómica

Referencias

  1. ^ a b M. Ronaghi; S. Karamohamed; B. Pettersson; M. Uhlen y P. Nyren (1996). "Secuenciación de ADN en tiempo real mediante detección de liberación de pirofosfato". Bioquímica analítica . 242 (1): 84–9. doi : 10.1006 / abio.1996.0432 . PMID  8923969 .
  2. ^ a b Patente de EE.UU. 5.641.658 Método para realizar la amplificación de ácido nucleico con dos cebadores unidos a un único soporte sólido. Inventores: Christopher P. Adams, Stephen Joseph Kron
  3. ^ a b solicitud WO1998044151A1 , Laurent Farinelli, Eric Kawashima, Pascal Mayer  [ fr ] , "Método de amplificación de ácidos nucleicos", publicado el 8 de octubre de 1998 
  4. ^ a b solicitud WO1998044152A1 , Laurent Farinelli, Eric Kawashima, Pascal Mayer  [ fr ] , "Método de secuenciación de ácidos nucleicos", publicado el 8 de octubre de 1998 
  5. ^ Karl V. Voelkerding; Shale A. Dames y Jacob D. Durtschi (2009). "Secuenciación de próxima generación: de la investigación básica al diagnóstico" . Química clínica . 55 (4): 641–658. doi : 10.1373 / clinchem.2008.112789 . PMID 19246620 . 
  6. ^ Matthew W. Anderson; Iris Schrijver (2010). "Secuenciación de ADN de próxima generación y el futuro de la medicina genómica" . Genes . 1 (1): 38–69. doi : 10.3390 / genes1010038 . PMC 3960862 . PMID 24710010 .  
  7. ^ Tracy Tucker; Marco Marra y Jan M. Friedman (agosto de 2009). "Secuenciación masivamente paralela la próxima gran novedad en la medicina genética" . Soy J Hum Genet . 85 (2): 142–54. doi : 10.1016 / j.ajhg.2009.06.022 . PMC 2725244 . PMID 19679224 .  
  8. ^ Andreas Von Bubnoff (2008). "Secuenciación de última generación: la carrera está en marcha" . Celular . 132 (5): 721–723. doi : 10.1016 / j.cell.2008.02.028 . PMID 18329356 . S2CID 8413828 .  
  9. ^ "Lanzamiento de 2008: NHGRI busca tecnologías de secuenciación de ADN aptas para uso médico y de laboratorio de rutina" . Genome.gov . Consultado el 5 de agosto de 2012 .
  10. ^ "Copia archivada" . Archivado desde el original el 6 de diciembre de 2014 . Consultado el 6 de noviembre de 2014 .CS1 maint: copia archivada como título ( enlace )
  11. ^ "Copia archivada" . Archivado desde el original el 6 de noviembre de 2014 . Consultado el 6 de noviembre de 2014 .CS1 maint: copia archivada como título ( enlace )
  12. ^ a b patente US7790869B2 , Jingyue Ju, Zengmin Li, John Robert Edwards, Yasuhiro Itagaki, "Método paralelo masivo para decodificar ADN y ARN", publicado el 07 de septiembre de 2010 
  13. ^ a b Bentley DR, et al. (6 de noviembre de 2008). "Secuenciación precisa del genoma humano completo utilizando química terminador reversible" . Naturaleza . 456 (7218): 53–9. Código Bibliográfico : 2008Natur.456 ... 53B . doi : 10.1038 / nature07517 . PMC 2581791 . PMID 18987734 .  
  14. ^ a b McKernan KJ, et al. (Septiembre de 2009). "Secuencia y variación estructural en un genoma humano descubierto por secuenciación de ligación masivamente paralela de lectura corta utilizando codificación de dos bases" . Genome Res . 19 (9): 1527–41. doi : 10.1101 / gr.091868.109 . PMC 2752135 . PMID 19546169 .  
  15. ^ "Ion Torrent" . Archivado desde el original el 30 de diciembre de 2013 . Consultado el 1 de enero de 2014 .
  16. ^ a b Drmanac R, et al. (2010). "Secuenciación del genoma humano utilizando lecturas de bases desencadenadas en nanoarrays de ADN de autoensamblaje". Ciencia . 327 (5961): 78–81. Código Bibliográfico : 2010Sci ... 327 ... 78D . doi : 10.1126 / science.1181498 . PMID 19892942 . S2CID 17309571 .  
  17. ^ a b Shendure J, Porreca GJ, Reppas NB, Lin X, McCutcheon JP, Rosenbaum AM, Wang MD, Zhang K, Mitra RD, Church GM (2005). "Secuenciación precisa multiplex de polony de un genoma bacteriano evolucionado" . Ciencia . 309 (5741): 1728–32. Código Bibliográfico : 2005Sci ... 309.1728S . doi : 10.1126 / science.1117389 . PMID 16081699 . S2CID 11405973 .  
  18. ^ Peters BA, et al. (2012). "Secuenciación precisa del genoma completo y haplotipado de 10-20 células humanas" . Naturaleza . 487 (7406): 190-195. Código Bibliográfico : 2012Natur.487..190P . doi : 10.1038 / nature11236 . PMC 3397394 . PMID 22785314 .  
  19. ^ Pacific Biosciences presenta una nueva química con longitudes de lectura más largas para detectar características novedosas en la secuencia de ADN y estudios avanzados del genoma de organismos grandes
  20. Lex Nederbragt (5 de julio de 2013). "Ensamblaje de genoma bacteriano de novo: ¿un problema resuelto?" .
  21. ^ Karl V. Voelkerding; Shale Dames y Jacob D. Durtschi (septiembre de 2010). "Secuenciación de diagnóstico de próxima generación" . J Mol Diagn . 12 (5): 539–51. doi : 10.2353 / jmoldx.2010.100043 . PMC 2928417 . PMID 20805560 .  
  22. ↑ a b Chee-Seng, Ku; En Yun, Loy; Yudi, Pawitan; y Kee-Seng, Chia. Tecnologías de secuenciación de próxima generación y sus aplicaciones. En: Enciclopedia de Ciencias de la Vida (ELS). John Wiley & Sons, Ltd: Chichester, abril de 2010
  23. ^ a b c Metzker ML (enero de 2010). "Tecnologías de secuenciación - la próxima generación". Nat Rev Genet . 11 (1): 31–46. doi : 10.1038 / nrg2626 . PMID 19997069 . S2CID 205484500 .  
  24. ^ Dressman D, Yan H, Traverso G, Kinzler KW, Vogelstein B (22 de julio de 2003). "Transformación de moléculas de ADN individuales en partículas magnéticas fluorescentes para la detección y enumeración de variaciones genéticas" . Proc Natl Acad Sci USA . 100 (15): 8817–22. Código Bibliográfico : 2003PNAS..100.8817D . doi : 10.1073 / pnas.1133470100 . PMC 166396 . PMID 12857956 .  
  25. ^ a b patente US6485944B1 , George M. Church, Rob Mitra, "Réplica de amplificación de matrices de ácidos nucleicos", publicada el 26 de noviembre de 2002 
  26. ^ a b Mitra R, Church GM (diciembre de 1999). "Amplificación localizada in situ y replicación por contacto de muchas moléculas de ADN individuales" . Ácidos nucleicos Res . 27 (24): e34, 1–6. doi : 10.1093 / nar / 27.24.e34 . PMC 148757 . PMID 10572186 .  
  27. ^ solicitud WO2007120208A3 , George M Church, Gregory J Porreca, Abraham Rosenbaum, Jay Shendure, "Secuenciación del ADN del círculo rodante de nanogrid", publicado el 28 de agosto de 2008 
  28. ^ patente US8445194B2 , Radoje Drmanac, Matthew J. Callow, Snezana Drmanac, Brian K. Hauser, George Yeung, "Matrices de una sola molécula para análisis genético y químico", publicado el 21 de mayo de 2013 
  29. ^ P. Mayer et al., Presentado en la Quinta Conferencia Internacional de Automatización en Cartografía y Secuenciación de ADN, St. Louis, MO, EE.UU. (7 al 10 de octubre de 1998). Secuenciación masiva paralela de colonias de ADN presentación ams98 "Un método de secuenciación de ADN a muy gran escala, alto rendimiento y bajo costo basado en un nuevo proceso de creación automática de patrones de ADN bidimensional" Verificar el valor ( ayuda ) .|url=CS1 maint: varios nombres: lista de autores ( enlace )
  30. ^ Secuenciación de ADN de alto rendimiento: conceptos y limitaciones, Martin Kircher y Janet Kelso, Bioensayos 32: 524–536, 2010 WILEY Periodicals Inc.
  31. ^ solicitud WO2001023610A2 , Shankar Balasubramanian, "Secuenciación de polinucleótidos", publicada 2001-04-05 
  32. ^ "Tecnología de ensayo" . Illumina. Archivado desde el original el 26 de agosto de 2012 . Consultado el 5 de agosto de 2012 .
  33. ^ "Secuenciación de una sola molécula verdadera (tSMS ™): Helicos BioSciences" . Helicosbio.com. Archivado desde el original el 11 de marzo de 2012 . Consultado el 5 de agosto de 2012 .
  34. ^ "Fundamentos de codificación base 2 y espacio de color" . Appliedbiosystems.cnpg.com . Consultado el 5 de agosto de 2012 .
  35. ^ Chin CS, Alexander DH, Marks P, Klammer AA, Drake J, Heiner C, Clum A, Copeland A, Huddleston J, Eichler EE, Turner SW, Korlach J (junio de 2013). "Ensambles de genoma microbiano no híbridos, terminados a partir de datos de secuenciación SMRT de lectura larga". Métodos Nat . 10 (6): 563–9. doi : 10.1038 / nmeth.2474 . PMID 23644548 . S2CID 205421576 .  
  36. ^ Monica Heger (5 de marzo de 2013). "Los usuarios de PacBio informan el progreso en lecturas largas para el ensamblaje del genoma de la planta, regiones difíciles del genoma humano" .
  37. ^ "PacBio lanza un sistema de secuenciación de una sola molécula de mayor rendimiento y menor costo" . Octubre de 2015.
  38. ^ http://www.bio-itworld.com/2015/9/30/pacbio-announces-sequel-sequencing-system.aspx

Según el estudio de investigación , el número creciente de pacientes con cáncer y la investigación y el desarrollo crecientes en este campo son los factores importantes que están impulsando el crecimiento del mercado global de secuenciación de próxima generación.

Obtenido de " https://en.wikipedia.org/w/index.php?title=Massive_parallel_sequencing&oldid=1056605357 "