Secuenciación de sólidos ABI

SOLiD (Secuenciación por Ligación y Detección de Oligonucleótidos) es una tecnología de secuenciación de ADN de próxima generación desarrollada por Life Technologies y ha estado disponible comercialmente desde 2006. Esta tecnología de próxima generación genera 10 ⁸ - 10 ⁹ lecturas de secuencia pequeña a la vez. Utiliza codificación de 2 bases para decodificar los datos brutos generados por la plataforma de secuenciación en datos de secuencia.

Preparación de la biblioteca para la plataforma SOLiD

Esquema de codificación de dos bases. En la codificación de dos bases, a cada par único de bases en el extremo 3 'de la sonda se le asigna uno de los cuatro colores posibles. Por ejemplo, "AA" se asigna al azul, "AC" se asigna al verde, y así sucesivamente para los 16 pares únicos. Durante la secuenciación, cada base de la plantilla se secuencia dos veces y los datos resultantes se decodifican de acuerdo con este esquema.

Este método no debe confundirse con la "secuenciación por síntesis", un principio utilizado por la pirosecuenciación Roche-454 (introducida en 2005, que generó millones de lecturas de 200-400 pb en 2009), y el sistema Solexa (ahora propiedad de Illumina) (introducido en 2006, generando cientos de millones de lecturas de 50-100 pb en 2009)

Estos métodos han reducido el costo de $ 0.01 / base en 2004 a casi $ 0.0001 / base en 2006 y han aumentado la capacidad de secuenciación de 1,000,000 bases / máquina / día en 2004 a más de 5,000,000,000 bases / máquina / día en 2009. Existen más de 30 publicaciones que describen su uso primero para el posicionamiento de nucleosomas de Valouev et al., ^[1] perfil transcripcional o RNA-Seq sensible a hebras con Cloonan et al., ^[2] perfil transcripcional de células individuales con Tang et al. ^[3] y finalmente resecuenciación humana con McKernan et al. ^[4]

Se ha informado que el método utilizado por esta máquina (secuenciación por ligación) tiene algunos problemas para secuenciar secuencias palindrómicas. ^[5]

Química

Se prepara una biblioteca de fragmentos de ADN a partir de la muestra que se va a secuenciar y se utiliza para preparar poblaciones de perlas clonales. Es decir, solo una especie de fragmento estará presente en la superficie de cada perla magnética. Los fragmentos unidos a las perlas magnéticas tendrán una secuencia adaptadora P1 universal adjunta de modo que la secuencia inicial de cada fragmento sea conocida e idéntica. La PCR en emulsión se lleva a cabo en microrreactores que contienen todos los reactivos necesarios para la PCR. Las perlas con los productos de PCR resultantes se depositan en un portaobjetos de vidrio.

Los cebadores se hibridan con la secuencia del adaptador P1 dentro de la plantilla de la biblioteca. Un conjunto de cuatro sondas di-base marcadas con fluorescencia compiten por la ligación al cebador de secuenciación. La especificidad de la sonda de di-base se logra interrogando cada 1ª y 2ª base en cada reacción de ligación. Se realizan múltiples ciclos de ligación, detección y escisión, determinando el número de ciclos la longitud de lectura eventual. Después de una serie de ciclos de ligadura, se elimina el producto de extensión y se restablece la plantilla con un cebador complementario a la posición n-1 para una segunda ronda de ciclos de ligadura.

Se completan cinco rondas de reinicio del cebador para cada etiqueta de secuencia. A través del proceso de reinicio del cebador, cada base es interrogada en dos reacciones de ligación independientes por dos cebadores diferentes. Por ejemplo, la base en la posición de lectura 5 se analiza con el cebador número 2 en el ciclo de ligación 2 y con el cebador número 3 en el ciclo de ligación 1.

Rendimiento y precisión

Según ABI, la plataforma SOLiD 3plus produce 60 gigabases de datos de ADN utilizables por ejecución. Debido al sistema de codificación de dos bases, una verificación de precisión inherente está integrada en la tecnología y ofrece una precisión del 99,94%. La química de los sistemas también significa que no se ve obstaculizada por homopolímeros a diferencia del sistema Roche 454 FLX y que las regiones de repetición de homopolímeros tan grandes y difíciles ya no son un problema para secuenciar.

Aplicaciones

Naturalmente, la tecnología se utilizará para secuenciar el ADN, pero debido a la naturaleza altamente paralela de todas las tecnologías de próxima generación, también tienen aplicaciones en transcriptómica y epigenómica .

Los microarrays fueron una vez el pilar de la transcriptómica durante los últimos diez años y la tecnología basada en arreglos se ha diversificado posteriormente a otras áreas. Sin embargo, están limitados porque solo se puede obtener información para las sondas que están en el chip. Solo se puede obtener información para organismos para los que se dispone de chips, y estos vienen con todos los problemas de hibridar un gran número de moléculas (diferentes temperaturas de hibridación). La transcriptómica RNA-Seq por secuenciación de próxima generación significará que estas barreras ya no son válidas. El transcriptoma completo de cualquier organismo podría secuenciarse potencialmente en una ejecución (para genomas bacterianos muy pequeños) y no solo estaría disponible la identificación de cada transcripción, sino que también es posible el perfil de expresión, ya que también se pueden lograr lecturas cuantitativas.

La inmunoprecipitación de cromatina (ChIP) es un método para determinar los sitios de unión del factor de transcripción y las interacciones ADN-proteína. En el pasado, se ha combinado con tecnología de matriz (chip-chip) con cierto éxito. La secuenciación de próxima generación también se puede aplicar en esta área. La inmunoprecipitación de metilación (MeDIP) también se puede realizar y también en matrices.

La capacidad de aprender más sobre la metilación y los sitios de unión de TF a una escala amplia del genoma es un recurso valioso y podría enseñarnos mucho sobre las enfermedades y la biología molecular en general.

Ver también

Referencias

^ Valouev A, Ichikawa J, Tonthat T, et al. (Julio de 2008). "Un mapa de posición del nucleosoma de alta resolución de C. elegans revela una falta de posicionamiento universal dictado por la secuencia" . Investigación del genoma . 18 (7): 1051–63. doi : 10.1101 / gr.076463.108 . PMC 2493394 . PMID 18477713 .
^ Cloonan N, Forrest AR, Kolle G, et al. (Julio de 2008). "Perfilado del transcriptoma de células madre mediante secuenciación de ARNm a gran escala". Métodos de la naturaleza . 5 (7): 613–9. doi : 10.1038 / nmeth.1223 . PMID 18516046 . S2CID 19790151 .
^ Tang F, Barbacioru C, Wang Y, et al. (Mayo de 2009). "Análisis de transcriptoma completo de mRNA-Seq de una sola célula". Métodos de la naturaleza . 6 (5): 377–82. doi : 10.1038 / nmeth.1315 . PMID 19349980 . S2CID 16570747 .
^ McKernan KJ, Peckham HE, Costa GL, et al. (Septiembre de 2009). "Secuencia y variación estructural en un genoma humano descubierto por secuenciación de ligación masivamente paralela de lectura corta utilizando codificación de dos bases" . Investigación del genoma . 19 (9): 1527–41. doi : 10.1101 / gr.091868.109 . PMC 2752135 . PMID 19546169 .
^ Yu-Feng Huang ; Sheng-Chung Chen ; Yih-Shien Chiang y Tzu-Han Chen (2012). "La secuencia palindrómica impide el mecanismo de secuenciación por ligación" . Biología de sistemas BMC . 6 Suppl 2: S10. doi : 10.1186 / 1752-0509-6-S2-S10 . PMC 3521181 . PMID 23281822 .

Otras lecturas

Mardis ER (2008). "Métodos de secuenciación de ADN de próxima generación". Revisión anual de genómica y genética humana . 9 : 387–402. doi : 10.1146 / annurev.genom.9.081307.164359 . PMID 18576944 .
Mardis ER (2009). "Nuevas estrategias y tecnologías emergentes para la secuenciación masivamente paralela: aplicaciones en la investigación médica" . Medicina del genoma . 1 (4): 40. doi : 10.1186 / gm40 . PMC 2684661 . PMID 19435481 .

[1] Valouev A, Ichikawa J, Tonthat T, et al. (Julio de 2008). "Un mapa de posición del nucleosoma de alta resolución de C. elegans revela una falta de posicionamiento universal dictado por la secuencia" . Investigación del genoma . 18 (7): 1051–63. doi : 10.1101 / gr.076463.108 . PMC 2493394 . PMID 18477713 .

[2] Cloonan N, Forrest AR, Kolle G, et al. (Julio de 2008). "Perfilado del transcriptoma de células madre mediante secuenciación de ARNm a gran escala". Métodos de la naturaleza . 5 (7): 613–9. doi : 10.1038 / nmeth.1223 . PMID 18516046 . S2CID 19790151 .

[3] Tang F, Barbacioru C, Wang Y, et al. (Mayo de 2009). "Análisis de transcriptoma completo de mRNA-Seq de una sola célula". Métodos de la naturaleza . 6 (5): 377–82. doi : 10.1038 / nmeth.1315 . PMID 19349980 . S2CID 16570747 .

[4] McKernan KJ, Peckham HE, Costa GL, et al. (Septiembre de 2009). "Secuencia y variación estructural en un genoma humano descubierto por secuenciación de ligación masivamente paralela de lectura corta utilizando codificación de dos bases" . Investigación del genoma . 19 (9): 1527–41. doi : 10.1101 / gr.091868.109 . PMC 2752135 . PMID 19546169 .

[5] Yu-Feng Huang ; Sheng-Chung Chen ; Yih-Shien Chiang y Tzu-Han Chen (2012). "La secuencia palindrómica impide el mecanismo de secuenciación por ligación" . Biología de sistemas BMC . 6 Suppl 2: S10. doi : 10.1186 / 1752-0509-6-S2-S10 . PMC 3521181 . PMID 23281822 .

[1]