Tecnologías transcriptómicas


Las tecnologías de transcriptómica son las técnicas utilizadas para estudiar el transcriptoma de un organismo , la suma de todas sus transcripciones de ARN . El contenido de información de un organismo se registra en el ADN de su genoma y se expresa a través de la transcripción . Aquí, el ARNm sirve como una molécula intermediaria transitoria en la red de información, mientras que los ARN no codificantes realizan diversas funciones adicionales. Un transcriptoma captura una instantánea en el tiempo de las transcripciones totales presentes en una célula. Las tecnologías transcriptómicas proporcionan una descripción amplia de qué procesos celulares están activos y cuáles están inactivos. Un gran desafío en biología molecular radica en comprender cómo un mismo genoma puede dar lugar a diferentes tipos de células y cómo se regula la expresión génica.

Los primeros intentos de estudiar transcriptomas completos comenzaron a principios de la década de 1990. Los avances tecnológicos posteriores desde finales de la década de 1990 han transformado repetidamente el campo y han hecho de la transcriptómica una disciplina generalizada en las ciencias biológicas. Hay dos técnicas contemporáneas clave en el campo: micromatrices , que cuantifican un conjunto de secuencias predeterminadas, y RNA-Seq , que utiliza secuenciación de alto rendimiento.para registrar todas las transcripciones. A medida que mejoraba la tecnología, aumentaba el volumen de datos producidos por cada experimento transcriptómico. Como resultado, los métodos de análisis de datos se han ido adaptando constantemente para analizar con mayor precisión y eficiencia volúmenes de datos cada vez más grandes. Las bases de datos de transcriptomas han crecido y aumentado su utilidad a medida que los investigadores recopilan y comparten más transcriptomas. Sería casi imposible interpretar la información contenida en un transcriptoma sin el contexto de experimentos previos.

Medir la expresión de los genes de un organismo en diferentes tejidos o condiciones , o en diferentes momentos, brinda información sobre cómo se regulan los genes y revela detalles de la biología de un organismo. También se puede utilizar para inferir las funciones de genes previamente no anotados . El análisis del transcriptoma ha permitido el estudio de cómo cambia la expresión génica en diferentes organismos y ha sido fundamental en la comprensión de las enfermedades humanas . Un análisis de la expresión génica en su totalidad permite la detección de amplias tendencias coordinadas que no pueden discernirse mediante ensayos más específicos .

La transcriptómica se ha caracterizado por el desarrollo de nuevas técnicas que han redefinido lo que es posible cada década y han dejado obsoletas las tecnologías anteriores. El primer intento de capturar un transcriptoma humano parcial se publicó en 1991 y reportó 609 secuencias de ARNm del cerebro humano . [2] En 2008, se publicaron dos transcriptomas humanos, compuestos por millones de secuencias derivadas de transcripciones que cubren 16 000 genes, [3] [4] y para 2015 se habían publicado transcriptomas para cientos de individuos. [5] [6] Transcriptomas de diferentes estados patológicos , tejidos o incluso células individualesahora se generan de forma rutinaria. [6] [7] [8] Esta explosión en transcriptómica ha sido impulsada por el rápido desarrollo de nuevas tecnologías con mayor sensibilidad y economía. [9] [10] [11] [12]


Uso del método transcriptómico a lo largo del tiempo. Artículos publicados que se refieren a RNA-Seq (negro), micromatriz de RNA (rojo), etiqueta de secuencia expresada (azul), pantalla diferencial digital (verde) y análisis serial/cap de la expresión génica (amarillo) desde 1990. [1]
Resumen de SAGE . Dentro de los organismos, los genes se transcriben y empalman (en eucariotas ) para producir transcritos de ARNm maduros (rojo). El ARNm se extrae del organismo y se usa transcriptasa inversa para copiar el ARNm en ADNc de doble cadena estable ( ds - cDNA ; azul). En SAGE, el ds-cDNA es digerido por enzimas de restricción (en la ubicación 'X' y 'X'+11) para producir fragmentos de "etiqueta" de 11 nucleótidos. Estas etiquetas se concatenan y secuencian utilizando la secuenciación de Sanger de lectura larga (diferentes tonos de azul indican etiquetas de diferentes genes). Las secuencias sondesconvolucionado para encontrar la frecuencia de cada etiqueta. La frecuencia de la etiqueta se puede usar para informar sobre la transcripción del gen del que proviene la etiqueta. [51]
Resumen de microarreglos de ADN . Dentro de los organismos, los genes se transcriben y empalman (en eucariotas) para producir transcritos de ARNm maduros (rojo). El ARNm se extrae del organismo y se usa transcriptasa inversa para copiar el ARNm en ds-cDNA estable (azul). En los microarrays, el ds-cDNA está fragmentado y marcado con fluorescencia (naranja). Los fragmentos marcados se unen a una matriz ordenada de oligonucleótidos complementarios, y la medición de la intensidad fluorescente en la matriz indica la abundancia de un conjunto predeterminado de secuencias. Estas secuencias generalmente se eligen específicamente para informar sobre genes de interés dentro del genoma del organismo. [51]
Resumen de RNA-Seq . Dentro de los organismos, los genes se transcriben y empalman (en eucariotas) para producir transcritos de ARNm maduros (rojo). El mRNA se extrae del organismo, se fragmenta y se copia en ds-cDNA estable (azul). El ds-cDNA se secuencia utilizando métodos de secuenciación de lectura corta y alto rendimiento . Luego, estas secuencias se pueden alinear con una secuencia genómica de referencia para reconstruir qué regiones genómicas se estaban transcribiendo. Estos datos se pueden usar para anotar dónde están los genes expresados, sus niveles de expresión relativos y cualquier variante de empalme alternativa. [51]
Microarray y celda de flujo de secuenciación . Los microarreglos y RNA-seq se basan en el análisis de imágenes de diferentes maneras. En un chip de micromatriz, cada punto de un chip es una sonda de oligonucleótido definida, y la intensidad de la fluorescencia detecta directamente la abundancia de una secuencia específica (Affymetrix). En una celda de flujo de secuenciación de alto rendimiento, los puntos se secuencian un nucleótido a la vez, y el color en cada ronda indica el siguiente nucleótido en la secuencia (Illumina Hiseq). Otras variaciones de estas técnicas utilizan más o menos canales de color. [51] [100]
Identificación de mapas de calor de patrones de coexpresión de genes en diferentes muestras. Cada columna contiene las medidas del cambio de expresión génica para una sola muestra. La expresión génica relativa se indica mediante el color: alta expresión (rojo), mediana expresión (blanco) y baja expresión (azul). Los genes y las muestras con perfiles de expresión similares se pueden agrupar automáticamente (árboles izquierdo y superior). Las muestras pueden ser de diferentes individuos, tejidos, entornos o condiciones de salud. En este ejemplo, la expresión del conjunto de genes 1 es alta y la expresión del conjunto de genes 2 es baja en las muestras 1, 2 y 3. [51] [128]