La transcriptómica unicelular examina el nivel de expresión génica de células individuales en una población determinada midiendo simultáneamente la concentración de ARN mensajero (ARNm) de cientos a miles de genes. [1] El desenmarañamiento de poblaciones celulares heterogéneas , la reconstrucción de las trayectorias de desarrollo celular y el modelado de la dinámica transcripcional, todo previamente enmascarado en las mediciones masivas del transcriptoma , son posibles gracias al análisis de estos datos transcriptómicos. [2]
Fondo
El análisis de la expresión génica se ha convertido en una rutina a través del desarrollo de secuenciación de ARN de alto rendimiento (RNA-seq) y microarrays . El análisis de ARN que anteriormente se limitaba a rastrear transcripciones individuales mediante transferencias Northern o PCR cuantitativa ahora se usa con frecuencia para caracterizar los perfiles de expresión de poblaciones de miles de células. Los datos producidos a partir de los ensayos a granel han llevado a la identificación de genes que se expresan diferencialmente en distintas poblaciones de células y al descubrimiento de biomarcadores . [3]
Estos estudios genómicos son limitados ya que proporcionan medidas para tejidos completos y, como resultado, muestran un perfil de expresión promedio para todas las células constituyentes. En organismos multicelulares, diferentes tipos de células dentro de la misma población pueden tener roles distintos y formar subpoblaciones con diferentes perfiles transcripcionales. Las correlaciones en la expresión génica de las subpoblaciones a menudo pueden pasarse por alto debido a la falta de identificación de subpoblaciones. [4] Además, los ensayos a granel no logran identificar si un cambio en el perfil de expresión se debe a un cambio en la regulación o composición, en el que un tipo de célula surge para dominar la población. Por último, al examinar la progresión celular a través de la diferenciación , los perfiles de expresión promedio solo pueden ordenar las células por tiempo en lugar de su etapa de desarrollo y, en consecuencia, no pueden mostrar tendencias en los niveles de expresión génica específicos de ciertas etapas. [5]
Los recientes avances en biotecnología permiten medir la expresión génica en cientos o miles de células individuales simultáneamente. Si bien estos avances en las tecnologías de transcriptómica han permitido la generación de datos transcriptómicos unicelulares, los datos producidos presentan nuevos desafíos computacionales y analíticos. Las técnicas utilizadas para analizar datos de secuencia de ARN de poblaciones de células en masa se pueden utilizar para datos de una sola célula, pero se han diseñado muchos enfoques computacionales nuevos para este tipo de datos para facilitar un estudio completo y detallado de los perfiles de expresión de una sola célula. [6]
Pasos experimentales
Actualmente no existe una técnica estandarizada para generar datos unicelulares, todos los métodos deben incluir el aislamiento celular de la población, la formación de lisados , la amplificación mediante transcripción inversa y la cuantificación de los niveles de expresión. Las técnicas comunes para medir la expresión son PCR cuantitativa o RNA-seq. [7]
Aislar células individuales
Hay varios métodos disponibles para aislar y amplificar células para el análisis de una sola célula. Las técnicas de bajo rendimiento pueden aislar cientos de células, son lentas y permiten la selección. Estos métodos incluyen:
Los métodos de alto rendimiento pueden aislar rápidamente de cientos a decenas de miles de células. [8] Las técnicas comunes incluyen:
- Clasificación de células activadas por fluorescencia (FACS)
- Dispositivos de microfluidos
PCR cuantitativa (qPCR)
Para medir el nivel de expresión de cada transcripción, se puede aplicar qPCR. Los cebadores específicos de genes se utilizan para amplificar el gen correspondiente como con la PCR normal y, como resultado, los datos generalmente solo se obtienen para tamaños de muestra de menos de 100 genes. La inclusión de genes de mantenimiento , cuya expresión debería ser constante en las condiciones, se utiliza para la normalización. Los genes domésticos más comúnmente usados incluyen GAPDH y α- actina , aunque la confiabilidad de la normalización a través de este proceso es cuestionable ya que hay evidencia de que el nivel de expresión puede variar significativamente. [9] Los tintes fluorescentes se utilizan como moléculas indicadoras para detectar el producto de la PCR y controlar el progreso de la amplificación; el aumento de la intensidad de la fluorescencia es proporcional a la concentración del amplicón . Se hace un gráfico de fluorescencia frente al número de ciclos y se usa un nivel de fluorescencia umbral para encontrar el número de ciclo en el que el gráfico alcanza este valor. El número de ciclo en este punto se conoce como ciclo umbral (C t ) y se mide para cada gen. [10]
RNA-seq de una sola célula
La sola célula de RNA-seq técnica convierte una población de ARN a una biblioteca de ADNc de fragmentos. Estos fragmentos se secuencian mediante técnicas de secuenciación de próxima generación de alto rendimiento y las lecturas se asignan al genoma de referencia, lo que proporciona un recuento del número de lecturas asociadas con cada gen. [11]
La normalización de los datos de secuencia de ARN explica la variación de célula a célula en las eficiencias de la formación y secuenciación de la biblioteca de ADNc. Un método se basa en el uso de picos de ARN extrínsecos (secuencias de ARN de secuencia y cantidad conocidas) que se agregan en cantidades iguales a cada lisado celular y se utilizan para normalizar el recuento de lecturas por el número de lecturas mapeadas en el ARNm de picos . [12]
Otro control utiliza identificadores moleculares únicos (UMI): secuencias de ADN cortas (6–10 nt) que se agregan a cada ADNc antes de la amplificación y actúan como un código de barras para cada molécula de ADNc. La normalización se logra utilizando el número de recuento de UMI únicos asociados con cada gen para tener en cuenta las diferencias en la eficiencia de amplificación. [13]
Se ha combinado una combinación de picos, UMI y otros enfoques para una normalización más precisa.
Consideraciones
Un problema asociado con los datos de una sola célula ocurre en forma de distribuciones de expresión génica infladas cero, conocidas como abandonos técnicos, que son comunes debido a las bajas concentraciones de ARNm de genes menos expresados que no se capturan en el proceso de transcripción inversa. El porcentaje de moléculas de ARNm en el lisado celular que se detecta a menudo es solo del 10 al 20%. [14]
Cuando se utilizan picos de ARN para la normalización, se asume que las eficiencias de amplificación y secuenciación para el ARN endógeno y con picos son las mismas. La evidencia sugiere que este no es el caso dadas las diferencias fundamentales en tamaño y características, como la falta de una cola poliadenilada en los picos y, por lo tanto, una longitud más corta. [15] Además, la normalización mediante UMI supone que la biblioteca de cDNA está secuenciada hasta la saturación, lo que no siempre es el caso. [13]
Análisis de los datos
Los conocimientos basados en el análisis de datos unicelulares asumen que la entrada es una matriz de recuentos de expresión génica normalizados, generada por los enfoques descritos anteriormente, y puede brindar oportunidades que no se pueden obtener de forma masiva.
Se proporcionaron tres ideas principales: [6]
- Identificación y caracterización de tipos de células y su organización espacial en el tiempo.
- Inferencia de redes reguladoras de genes y su fuerza en células individuales
- Clasificación del componente estocástico de la transcripción.
Las técnicas descritas se han diseñado para ayudar a visualizar y explorar patrones en los datos para facilitar la revelación de estas tres características.
Agrupación
La agrupación permite la formación de subgrupos en la población celular. Las células se pueden agrupar por su perfil transcriptómico para analizar la estructura de la subpoblación e identificar tipos o subtipos de células raros. Alternativamente, los genes pueden agruparse por sus estados de expresión para identificar genes covariantes. Se ha utilizado una combinación de ambos enfoques de agrupamiento, conocido como biclustering , para agrupar simultáneamente por genes y células para encontrar genes que se comporten de manera similar dentro de los grupos de células. [dieciséis]
Los métodos de agrupación aplicados pueden ser agrupación de K-medias , formando grupos disjuntos o agrupación jerárquica , formando particiones anidadas.
Biclustering
La agrupación en clústeres ofrece varias ventajas al mejorar la resolución de la agrupación en clústeres. Los genes que solo son informativos para un subconjunto de células y, por lo tanto, solo se expresan allí pueden identificarse mediante biclustering. Además, los genes que se comportan de manera similar que diferencian un grupo de células de otro pueden identificarse usando este método. [17]
Reducción de dimensionalidad
Los algoritmos de reducción de dimensionalidad , como el análisis de componentes principales (PCA) y t-SNE, se pueden utilizar para simplificar los datos para la visualización y la detección de patrones transformando las celdas de un espacio dimensional superior a uno inferior . El resultado de este método produce gráficos con cada celda como un punto en un espacio 2-D o 3-D. La reducción de la dimensionalidad se usa con frecuencia antes de la agrupación, ya que las celdas en dimensiones altas pueden parecer incorrectamente cercanas debido a que las métricas de distancia se comportan de manera no intuitiva. [18]
Análisis de componentes principales
La técnica utilizada con más frecuencia es PCA, que identifica las direcciones de los componentes principales de la varianza más grande y transforma los datos de modo que el primer componente principal tenga la varianza más grande posible, y los componentes principales sucesivos, a su vez, tengan cada uno la varianza más alta posible mientras permanecen ortogonales a la varianza. componentes precedentes. La contribución que cada gen hace a cada componente se usa para inferir qué genes están contribuyendo más a la variación en la población y están involucrados en la diferenciación de diferentes subpoblaciones. [19]
Expresión diferencial
La detección de diferencias en el nivel de expresión génica entre dos poblaciones se utiliza tanto en datos transcriptómicos unicelulares como en masa. Se han diseñado métodos especializados para datos de una sola celda que consideran las características de una sola celda, como los abandonos técnicos y la forma de la distribución, por ejemplo, bimodal frente a unimodal . [20]
Enriquecimiento de ontología genética
Los términos de ontología genética describen las funciones de los genes y las relaciones entre esas funciones en tres clases:
- Función molecular
- Componente celular
- Proceso biológico
El enriquecimiento de términos de Ontología genética (GO) es una técnica que se utiliza para identificar qué términos de GO están sobrerrepresentados o subrepresentados en un conjunto dado de genes. En el análisis de una sola célula, la lista de entrada de genes de interés puede seleccionarse basándose en genes expresados diferencialmente o grupos de genes generados a partir de biclustering. El número de genes anotados en un término GO en la lista de entrada se normaliza frente al número de genes anotados en un término GO en el conjunto de antecedentes de todos los genes del genoma para determinar la significación estadística. [21]
Orden pseudotemporal
El ordenamiento pseudo-temporal (o inferencia de trayectoria) es una técnica que tiene como objetivo inferir la dinámica de expresión génica a partir de datos instantáneos unicelulares. El método intenta ordenar las celdas de tal manera que las celdas similares estén ubicadas cerca una de la otra. Esta trayectoria de celdas puede ser lineal, pero también puede bifurcar o seguir estructuras gráficas más complejas. Por tanto, la trayectoria permite la inferencia de la dinámica de expresión génica y el ordenamiento de las células por su progresión a través de la diferenciación o respuesta a estímulos externos. El método se basa en la suposición de que las células siguen el mismo camino a través del proceso de interés y que su estado transcripcional se correlaciona con su progresión. El algoritmo se puede aplicar tanto a poblaciones mixtas como a muestras temporales.
Se han desarrollado más de 50 métodos para la ordenación pseudotemporal, y cada uno tiene sus propios requisitos para la información previa (como las celdas de inicio o los datos del curso del tiempo), topologías detectables y metodología. [22] Un ejemplo de algoritmo es el algoritmo Monocle [23] que lleva a cabo la reducción de dimensionalidad de los datos, construye un árbol de expansión mínimo utilizando los datos transformados, ordena las celdas en pseudo-tiempo siguiendo la ruta conectada más larga del árbol y, en consecuencia, etiqueta células por tipo. Otro ejemplo es DPT, [ aclaración necesaria ] [21] que utiliza un mapa de difusión y un proceso de difusión.
Inferencia de red
La inferencia de la red reguladora de genes es una técnica que tiene como objetivo construir una red, mostrada como un gráfico, en la que los nodos representan los genes y los bordes indican interacciones correguladoras. El método se basa en la suposición de que una fuerte relación estadística entre la expresión de genes es una indicación de una posible relación funcional. [24] El método más utilizado para medir la fuerza de una relación estadística es la correlación . Sin embargo, la correlación no identifica relaciones no lineales y la información mutua se utiliza como alternativa. Los grupos de genes enlazados en una red significan genes que experimentan cambios coordinados en la expresión. [25]
Integración
Los conjuntos de datos de transcriptómica unicelulares generados utilizando diferentes protocolos experimentales y bajo diferentes condiciones experimentales a menudo difieren en la presencia o fuerza de los efectos técnicos y los tipos de células observadas, entre otros factores. Esto da como resultado fuertes efectos de lote que pueden sesgar los resultados de los métodos estadísticos aplicados a través de lotes, particularmente en presencia de factores de confusión . [26] Como resultado de las propiedades mencionadas anteriormente de los datos transcriptómicos unicelulares, se observó que los métodos de corrección por lotes desarrollados para datos de secuenciación masiva tenían un desempeño deficiente. Esto resultó en el desarrollo de métodos estadísticos para corregir los efectos por lotes que son robustos a las propiedades de los datos transcriptómicos unicelulares, con el fin de integrar datos de diferentes fuentes o lotes experimentales. El trabajo fundamental a este respecto fue realizado por Laleh Haghverdi al formular el uso de vecinos más cercanos mutuos entre cada lote para definir vectores de corrección de lote. [27] Estos vectores se pueden utilizar para fusionar conjuntos de datos que incluyan al menos un tipo de celda compartida. Un enfoque ortogonal implica la proyección de cada conjunto de datos en un espacio compartido de baja dimensión mediante el análisis de correlación canónica . [28] Los vecinos más cercanos mutuos y el análisis de correlación canónica también se han combinado para definir "anclajes" de integración que comprenden celdas de referencia en un conjunto de datos, a las cuales se normalizan las celdas de consulta en otro conjunto de datos. [29]
Ver también
- RNA-Seq
- Análisis unicelular
- Secuenciación unicelular
- Transcriptoma
- Transcriptómica
Referencias
- ^ Kanter, Itamar; Kalisky, Tomer (1 de enero de 2015). "Transcriptómica unicelular: métodos y aplicaciones" . Fronteras en Oncología . 5 : 53. doi : 10.3389 / fonc.2015.00053 . ISSN 2234-943X . PMC 4354386 . PMID 25806353 .
- ^ Liu, Serena; Trapnell, Cole (17 de febrero de 2016). "Secuenciación del transcriptoma unicelular: avances recientes y desafíos pendientes" . F1000Research . 5 : F1000 Faculty Rev – 182. doi : 10.12688 / f1000research.7223.1 . ISSN 2046-1402 . PMC 4758375 . PMID 26949524 .
- ^ Szabo, David T. (10 de marzo de 2014). "Capítulo 62 - Biomarcadores transcriptómicos en la seguridad y evaluación de riesgos de productos químicos". Biomarcadores en Toxicología . Prensa académica. págs. 1033–1038. ISBN 9780124046306.
- ^ Kanter, Itamar; Kalisky, Tomer (10 de marzo de 2015). "Transcriptómica unicelular: métodos y aplicaciones" . Fronteras en Oncología . 5 : 53. doi : 10.3389 / fonc.2015.00053 . ISSN 2234-943X . PMC 4354386 . PMID 25806353 .
- ^ Trapnell, Cole (1 de octubre de 2015). "Definición de tipos y estados celulares con genómica unicelular" . Investigación del genoma . 25 (10): 1491–1498. doi : 10.1101 / gr.190595.115 . ISSN 1088-9051 . PMC 4579334 . PMID 26430159 .
- ^ a b Stegle, Oliver; Teichmann, Sarah A .; Marioni, John C. (1 de marzo de 2015). "Desafíos analíticos y computacionales en la transcriptómica unicelular". Nature Reviews Genética . 16 (3): 133-145. doi : 10.1038 / nrg3833 . ISSN 1471-0056 . PMID 25628217 . S2CID 205486032 .
- ^ Kolodziejczyk, Aleksandra A .; Kim, Jong Kyoung; Svensson, Valentine; Marioni, John C .; Teichmann, Sarah A. (mayo de 2015). "La tecnología y la biología de la secuenciación de ARN unicelular" . Célula molecular . 58 (4): 610–620. doi : 10.1016 / j.molcel.2015.04.005 . PMID 26000846 .
- ^ Poulin, Jean-Francois; Tasic, Bosiljka; Hjerling-Leffler, Jens; Trimarchi, Jeffrey M .; Awatramani, Rajeshwar (1 de septiembre de 2016). "Desenredar la diversidad de células neuronales mediante transcriptómica unicelular". Neurociencia de la naturaleza . 19 (9): 1131-1141. doi : 10.1038 / nn.4366 . ISSN 1097-6256 . PMID 27571192 . S2CID 14461377 .
- ^ Radonić, Aleksandar; Thulke, Stefanie; Mackay, Ian M .; Landt, Olfert; Siegert, Wolfgang; Nitsche, Andreas (23 de enero de 2004). "Directriz para la selección de genes de referencia para PCR cuantitativa en tiempo real". Comunicaciones de investigación bioquímica y biofísica . 313 (4): 856–862. doi : 10.1016 / j.bbrc.2003.11.177 . ISSN 0006-291X . PMID 14706621 .
- ^ Wildsmith, SE; Archer, GE; Winkley, AJ; Lane, PW; Bugelski, PJ (1 de enero de 2001). "Maximización de la señal derivada de microarrays de cDNA" . BioTechniques . 30 (1): 202-206, 208. doi : 10.2144 / 01301dd04 . ISSN 0736-6205 . PMID 11196312 .
- ^ Wang, Zhong; Gerstein, Mark; Snyder, Michael (23 de marzo de 2017). "RNA-Seq: una herramienta revolucionaria para la transcriptómica" . Reseñas de la naturaleza. Genética . 10 (1): 57–63. doi : 10.1038 / nrg2484 . ISSN 1471-0056 . PMC 2949280 . PMID 19015660 .
- ^ Jiang, Lichun; Schlesinger, Felix; Davis, Carrie A .; Zhang, Yu; Li, Renhua; Salit, Marc; Gingeras, Thomas R .; Oliver, Brian (23 de marzo de 2017). "Estándares de spike-in sintéticos para experimentos de RNA-seq" . Investigación del genoma . 21 (9): 1543-1551. doi : 10.1101 / gr.121095.111 . ISSN 1088-9051 . PMC 3166838 . PMID 21816910 .
- ^ a b Islam, Saiful; Zeisel, Amit; Joost, Simon; La Manno, Gioele; Zajac, Pawel; Kasper, Maria; Lönnerberg, Peter; Linnarsson, Sten (1 de febrero de 2014). "RNA-seq cuantitativa unicelular con identificadores moleculares únicos". Métodos de la naturaleza . 11 (2): 163-166. doi : 10.1038 / nmeth.2772 . ISSN 1548-7091 . PMID 24363023 . S2CID 6765530 .
- ^ Kharchenko, Peter V .; Silberstein, Lev; Scadden, David T. (1 de julio de 2014). "Enfoque bayesiano para el análisis de expresión diferencial unicelular" . Métodos de la naturaleza . 11 (7): 740–742. doi : 10.1038 / nmeth.2967 . ISSN 1548-7091 . PMC 4112276 . PMID 24836921 .
- ^ Svensson, Valentine; Natarajan, Kedar Nath; Ly, Lam-Ha; Miragaia, Ricardo J .; Labalette, Charlotte; Macaulay, Iain C .; Cvejic, Ana; Teichmann, Sarah A. (6 de marzo de 2017). "Análisis de potencia de experimentos de secuenciación de ARN unicelulares" . Métodos de la naturaleza . publicación avanzada en línea (4): 381–387. doi : 10.1038 / nmeth.4220 . ISSN 1548-7105 . PMC 5376499 . PMID 28263961 .
- ^ Buettner, Florian; Natarajan, Kedar N .; Casale, F. Paolo; Proserpio, Valentina; Scialdone, Antonio; Theis, Fabian J .; Teichmann, Sarah A .; Marioni, John C .; Stegle, Oliver (1 de febrero de 2015). "El análisis computacional de la heterogeneidad de célula a célula en datos de secuenciación de ARN de una sola célula revela subpoblaciones ocultas de células" . Biotecnología de la naturaleza . 33 (2): 155–160. doi : 10.1038 / nbt.3102 . ISSN 1087-0156 . PMID 25599176 .
- ^ Ntranos, Vasilis; Kamath, Govinda M .; Zhang, Jesse M .; Pachter, Lior; Tse, David N. (26 de mayo de 2016). "Análisis rápido y preciso de RNA-seq de una sola célula por agrupación de recuentos de compatibilidad de transcripciones" . Biología del genoma . 17 (1): 112. doi : 10.1186 / s13059-016-0970-8 . ISSN 1474-7596 . PMC 4881296 . PMID 27230763 .
- ^ Pierson, Emma; Yau, Christopher (1 de enero de 2015). "ZIFA: reducción de dimensionalidad para análisis de expresión génica unicelular sin inflado" . Biología del genoma . 16 : 241. doi : 10.1186 / s13059-015-0805-z . ISSN 1474-760X . PMC 4630968 . PMID 26527291 .
- ^ Treutlein, Barbara; Brownfield, Doug G .; Wu, Angela R .; Neff, Norma F .; Mantalas, Gary L .; Espinoza, F. Hernan; Desai, Tushar J .; Krasnow, Mark A .; Quake, Stephen R. (15 de mayo de 2014). "Reconstrucción de jerarquías de linaje del epitelio pulmonar distal utilizando RNA-seq de una sola célula" . Naturaleza . 509 (7500): 371–375. Código Bibliográfico : 2014Natur.509..371T . doi : 10.1038 / nature13173 . PMC 4145853 . PMID 24739965 .
- ^ Korthauer, Keegan D .; Chu, Li-Fang; Newton, Michael A .; Li, Yuan; Thomson, James; Stewart, Ron; Kendziorski, Christina (1 de enero de 2016). "Un enfoque estadístico para identificar distribuciones diferenciales en experimentos de RNA-seq de una sola célula" . Biología del genoma . 17 (1): 222. doi : 10.1186 / s13059-016-1077-y . ISSN 1474-760X . PMC 5080738 . PMID 27782827 .
- ^ a b Haghverdi, Laleh; Büttner, Maren; Wolf, F. Alexander; Buettner, Florian; Theis, Fabian J. (1 de octubre de 2016). "El pseudotiempo de difusión reconstruye de manera robusta la ramificación del linaje" (PDF) . Métodos de la naturaleza . 13 (10): 845–848. doi : 10.1038 / nmeth.3971 . ISSN 1548-7091 . PMID 27571553 . S2CID 3594049 .
- ^ Saelens, Wouter; Cannoodt, Robrecht; Todorov, Helena; Saeys, Yvan (5 de marzo de 2018). "Una comparación de métodos de inferencia de trayectoria unicelular: hacia herramientas más precisas y robustas" . bioRxiv : 276907. doi : 10.1101 / 276907 . Consultado el 12 de marzo de 2018 . CS1 maint: parámetro desalentado ( enlace )
- ^ Trapnell, Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J .; Livak, Kenneth J .; Mikkelsen, Tarjei S .; Rinn, John L. (23 de marzo de 2017). "El orden pseudo-temporal de las células individuales revela la dinámica y los reguladores de las decisiones del destino celular" . Biotecnología de la naturaleza . 32 (4): 381–386. doi : 10.1038 / nbt.2859 . ISSN 1087-0156 . PMC 4122333 . PMID 24658644 .
- ^ Wei, J .; Hu, X .; Zou, X .; Tian, T. (1 de diciembre de 2016). "Inferencia de red reguladora genética para células madre utilizando datos de expresión de células individuales". Conferencia Internacional IEEE 2016 sobre Bioinformática y Biomedicina (BIBM) : 217–222. doi : 10.1109 / BIBM.2016.7822521 . ISBN 978-1-5090-1611-2. S2CID 27737735 .
- ^ Moignard, Victoria; Macaulay, Iain C .; Swiers, Gemma; Buettner, Florian; Schütte, Judith; Calero-Nieto, Fernando J .; Kinston, Sarah; Joshi, Anagha; Hannah, Rebecca; Theis, Fabian J .; Jacobsen, Sten Eirik; de Bruijn, Marella F .; Göttgens, Berthold (1 de abril de 2013). "Caracterización de redes transcripcionales en células madre y progenitoras sanguíneas mediante análisis de expresión génica unicelular de alto rendimiento" . Biología celular de la naturaleza . 15 (4): 363–372. doi : 10.1038 / ncb2709 . ISSN 1465-7392 . PMC 3796878 . PMID 23524953 .
- ^ Hicks, Stephanie C; Townes, William F; Teng, Mingxiang; Irizarry, Rafael A (6 de noviembre de 2017). "Datos faltantes y variabilidad técnica en experimentos de secuenciación de ARN unicelulares" . Bioestadística . 19 (4): 562–578. doi : 10.1093 / bioestadística / kxx053 . PMC 6215955 . PMID 29121214 .
- ^ Haghverdi, Laleh; Lun, Aaron TL; Morgan, Michael D; Marioni, John C (2 de abril de 2018). "Los efectos por lotes en los datos de secuenciación de ARN de una sola célula se corrigen haciendo coincidir los vecinos más cercanos mutuos" . Biotecnología de la naturaleza . 36 (5): 421–427. doi : 10.1038 / nbt.4091 . PMC 6152897 . PMID 29608177 .
- ^ Mayordomo, Andrew; Hoffman, Paul; Smibert, Peter; Papalexi, Efthymia; Satija, Rahul (2 de abril de 2018). "Integración de datos transcriptómicos unicelulares en diferentes condiciones, tecnologías y especies" . Biotecnología de la naturaleza . 36 (5): 421–427. doi : 10.1038 / nbt.4096 . PMC 6700744 . PMID 29608179 .
- ^ Stuart, Tim; Mayordomo, Andrew; Hoffman, Paul; Hafemeister, Christoph; Papalexia, Efthymia; Mauck, William M III; Hao, Yuhan; Marlon, Stoeckius; Smibert, Peter; Satija, Rahul (6 de junio de 2019). "Integración completa de datos unicelulares" . Celular . 177 (7): 1888-1902. doi : 10.1016 / j.cell.2019.05.031 . PMC 6687398 . PMID 31178118 .
enlaces externos
- Disección de la heterogeneidad tumoral con transcriptómica unicelular