En la secuenciación de ADN , una lectura es una secuencia inferida de pares de bases (o probabilidades de pares de bases) correspondientes a todo o parte de un solo fragmento de ADN. Un experimento de secuenciación típico implica la fragmentación del genoma en millones de moléculas, que se seleccionan por tamaño y se ligan a adaptadores . El conjunto de fragmentos se denomina biblioteca de secuenciación, que se secuencia para producir un conjunto de lecturas. [1]
Longitud de lectura
Las tecnologías de secuenciación varían en la duración de las lecturas producidas. Las lecturas de 20 a 40 pares de bases (pb) de longitud se denominan ultracortas. [2] Los secuenciadores típicos producen longitudes de lectura en el rango de 100 a 500 pb. [3] Sin embargo, las plataformas de Pacific Biosciences producen longitudes de lectura de aproximadamente 1500 pb. [4] La longitud de la lectura es un factor que puede afectar los resultados de los estudios biológicos. [5] Por ejemplo, las longitudes de lectura más largas mejoran la resolución del ensamblaje del genoma de novo y la detección de variantes estructurales. Se estima que se requerirán longitudes de lectura superiores a 100 kilobases (kb) para el ensamblaje rutinario de novo del genoma humano. [6] Las tuberías bioinformáticas para analizar los datos de secuenciación suelen tener en cuenta las longitudes de lectura. [7]
Referencias
- ^ "Biblioteca de secuenciación: ¿qué es?" . Breda Genetics . 2016-08-12 . Consultado el 23 de julio de 2017 .
- ^ Chaisson, Mark J. (2009). "Ensamblaje de fragmentos de novo con lecturas cortas emparejadas: ¿Importa la longitud de la lectura?" . Investigación del genoma . 19 (2): 336–346. doi : 10.1101 / gr.079053.108 . PMC 2652199 . PMID 19056694 . Consultado el 23 de julio de 2017 .
- ^ Junemann, Sebastián (2013). "Actualización de comparación de rendimiento de secuenciación de banco de pruebas" . Biotecnología de la naturaleza . 31 (4): 294-296. doi : 10.1038 / nbt.2522 . PMID 23563421 .
- ^ Codorniz, Michael A. (2012). "Una historia de tres plataformas de secuenciación de próxima generación: comparación de secuenciadores Ion Torrent, Pacific Biosciences e Illumina MiSeq" . BMC Genomics . 13 (1): 341. doi : 10.1186 / 1471-2164-13-341 . PMC 3431227 . PMID 22827831 .
- ^ Chhangawala, Sagar; Rudy, Gabe; Mason, Christopher E .; Rosenfeld, Jeffrey A. (23 de junio de 2015). "El impacto de la longitud de lectura en la cuantificación de genes expresados diferencialmente y detección de unión de empalme" . Biología del genoma . 16 (1): 131. doi : 10.1186 / s13059-015-0697-y . PMC 4531809 . PMID 26100517 .
- ^ Chaisson, Mark JP (2015). "Variación genética y ensamblaje de novo de genomas humanos" . Nature Reviews Genética . 16 (11): 627–640. doi : 10.1038 / nrg3933 . PMC 4745987 . PMID 26442640 .
- ^ Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gómez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J .; Elo, Laura L .; Zhang, Xuegong; Mortazavi, Ali (26 de enero de 2016). "Una encuesta de las mejores prácticas para el análisis de datos RNA-seq" . Biología del genoma . 17 (1): 13. doi : 10.1186 / s13059-016-0881-8 . PMC 4728800 . PMID 26813401 .