Las matrices de mosaico son un subtipo de chips de microarrays . Como microarrays tradicionales, funcionan por hibridación marcadas de DNA o RNA moléculas diana a las sondas fijas sobre una superficie sólida.
Las matrices de mosaico se diferencian de las micromatrices tradicionales en la naturaleza de las sondas. En lugar de sondear secuencias de genes conocidos o predichos que pueden estar dispersos por todo el genoma , las matrices en mosaico sondean intensamente las secuencias que se sabe que existen en una región contigua. Esto es útil para caracterizar regiones que están secuenciadas, pero cuyas funciones locales son en gran parte desconocidas. Los arreglos en mosaico ayudan en el mapeo del transcriptoma , así como en el descubrimiento de sitios de interacción ADN / proteína ( chip-chip , DamID ), de metilación del ADN (chip-MeDIP) y de sensibilidad a DNasa (chip de ADNasa) y matriz CGH. [1]Además de detectar genes y secuencias reguladoras no identificados previamente, es posible una cuantificación mejorada de los productos de transcripción. Las sondas específicas están presentes en millones de copias (a diferencia de solo varias en las matrices tradicionales) dentro de una unidad de matriz llamada característica, con entre 10.000 y más de 6.000.000 de características diferentes por matriz. [2] Se pueden obtener resoluciones de mapeo variables ajustando la cantidad de superposición de secuencia entre sondas, o la cantidad de pares de bases conocidos entre secuencias de sonda, así como la longitud de la sonda. Para genomas más pequeños como Arabidopsis , se pueden examinar genomas completos. [3] Las matrices de mosaico son una herramienta útil en los estudios de asociación de todo el genoma .
Síntesis y fabricantes
Las dos formas principales de sintetizar matrices de mosaicos son la fabricación fotolitográfica y la impresión o manchado mecánico.
El primer método implica la síntesis in situ en la que se construyen sondas, de aproximadamente 25 pb, en la superficie del chip. Estas matrices pueden contener hasta 6 millones de características discretas, cada una de las cuales contiene millones de copias de una sonda.
La otra forma de sintetizar chips de matriz de mosaico es mediante la impresión mecánica de sondas en el chip. Esto se hace mediante el uso de máquinas automatizadas con clavijas que colocan las sondas previamente sintetizadas en la superficie. Debido a la restricción de tamaño de los pines, estos chips pueden contener hasta casi 400.000 funciones. [4] Tres fabricantes de matrices en mosaico son Affymetrix , NimbleGen y Agilent . Sus productos varían en la longitud y el espaciado de las sondas. ArrayExplorer.com es un servidor web gratuito para comparar matrices de ordenamiento en teselas.
Aplicaciones y tipos
Chip-chip
ChIP-chip es uno de los usos más populares de las matrices de mosaico. La inmunoprecipitación de cromatina permite identificar los sitios de unión de proteínas . Una variación de todo el genoma de esto se conoce como ChIP-on-chip. Las proteínas que se unen a la cromatina se entrecruzan in vivo , normalmente mediante fijación con formaldehído . Luego, la cromatina se fragmenta y se expone a anticuerpos específicos de la proteína de interés. A continuación, estos complejos se precipitan. Luego, el ADN se aísla y se purifica. Con los microarrays de ADN tradicionales, el ADN inmunoprecipitado se hibrida con el chip, que contiene sondas diseñadas para cubrir regiones representativas del genoma. Se pueden utilizar sondas superpuestas o sondas muy próximas. Esto da un análisis imparcial con alta resolución. Además de estas ventajas, las matrices en mosaico muestran una alta reproducibilidad y con sondas superpuestas que abarcan grandes segmentos del genoma, las matrices en mosaico pueden interrogar los sitios de unión de proteínas, que albergan repeticiones. Los experimentos de chip-chip han podido identificar sitios de unión de factores de transcripción a través del genoma en levaduras, drosophila y algunas especies de mamíferos. [5]
Mapeo de transcriptomas
Otro uso popular de las matrices en mosaico es la búsqueda de genes expresados. Los métodos tradicionales de predicción de genes para la anotación de secuencias genómicas han tenido problemas cuando se utilizan para mapear el transcriptoma, como no producir una estructura precisa de los genes y también faltar por completo las transcripciones. El método de secuenciación de ADNc para encontrar genes transcritos también presenta problemas, como no detectar moléculas de ARN raras o muy cortas, y por lo tanto no detecta genes que están activos solo en respuesta a señales o específicos de un marco de tiempo. Los arreglos en mosaico pueden resolver estos problemas. Debido a la alta resolución y sensibilidad, se pueden detectar incluso moléculas pequeñas y raras. La naturaleza superpuesta de las sondas también permite la detección de ARN no poliadenilado y puede producir una imagen más precisa de la estructura del gen. [6] Estudios anteriores sobre los cromosomas 21 y 22 mostraron el poder de las matrices en mosaico para identificar unidades de transcripción. [7] [8] [9] Los autores utilizaron sondas de 25 meros con una separación de 35 pb, que abarcan todos los cromosomas. Los objetivos marcados se hicieron a partir de ARN poliadenilado. Encontraron muchas más transcripciones de las previstas y el 90% estaban fuera de los exones anotados . Otro estudio con Arabidopsis utilizó matrices de oligonucleótidos de alta densidad que cubren todo el genoma. Se encontraron más de 10 veces más transcripciones de las predichas por tecnologías ecológicamente racionales [ aclaración necesaria ] y otras herramientas de predicción. [3] [10] También se encontraron transcripciones novedosas en las regiones centroméricas donde se pensaba que ningún gen se expresaba activamente. Se han identificado muchos ARN no codificantes y antisentido naturales utilizando matrices en mosaico. [9]
MeDIP-chip
La inmunoprecipitación de metil-ADN seguida de una matriz de mosaico permite el mapeo y la medición de la metilación del ADN en todo el genoma. El ADN está metilado en citosina en di-nucleótidos CG en muchos lugares del genoma. Esta modificación es uno de los cambios epigenéticos heredados mejor comprendidos y se ha demostrado que afecta la expresión génica. La cartografía de estos sitios puede contribuir al conocimiento de los genes expresados y también a la regulación epigenética a nivel de todo el genoma. Los estudios en mosaico han generado mapas de metilación de alta resolución para el genoma de Arabidopsis para generar el primer "metiloma".
Chip de ADNasa
El chip de ADNasa es una aplicación de matrices en mosaico para identificar sitios hipersensibles, segmentos de cromatina abierta que la DNasaI escinde más fácilmente. La escisión de DNasaI produce fragmentos más grandes de alrededor de 1,2 kb de tamaño. Se ha demostrado que estos sitios hipersensibles predicen con precisión elementos reguladores como regiones promotoras, potenciadores y silenciadores. [11] Históricamente, el método utiliza la transferencia Southern para encontrar fragmentos digeridos. Las matrices de mosaico han permitido a los investigadores aplicar la técnica a una escala de todo el genoma.
Hibridación genómica comparativa (CGH)
La CGH basada en matrices es una técnica que se utiliza a menudo en el diagnóstico para comparar las diferencias entre los tipos de ADN, como las células normales y las cancerosas. Se utilizan comúnmente dos tipos de matrices de mosaico para matrices CGH, genoma completo y mosaico fino. El enfoque del genoma completo sería útil para identificar variaciones en el número de copias con alta resolución. Por otro lado, CGH de matriz de mosaico fino produciría una resolución ultra alta para encontrar otras anomalías, como puntos de interrupción. [12]
Procedimiento
Existen varios métodos diferentes para ordenar en mosaico una matriz. Un protocolo para analizar la expresión génica implica primero aislar el ARN total. Esto luego se purifica de moléculas de ARNr. El ARN se copia en ADN bicatenario, que posteriormente se amplifica y se transcribe in vitro a ARNc. El producto se divide en triplicados para producir dsDNA, que luego se fragmenta y se etiqueta. Finalmente, las muestras se hibridan con el chip de matriz de mosaico. Las señales del chip son escaneadas e interpretadas por computadoras.
Hay varios programas y algoritmos disponibles para el análisis de datos y los beneficios varían según el fabricante del chip. Para los chips Affymetrix, el análisis basado en modelos de la matriz en mosaico (MAT) o el análisis hipergeométrico de las matrices en mosaico (HAT [13] ) son algoritmos efectivos de búsqueda de picos. Para chips NimbleGen, TAMAL es más adecuado para localizar sitios de unión. Los algoritmos alternativos incluyen MA2C y TileScope, que son menos complicados de operar. El algoritmo de deconvolución de unión conjunta se usa comúnmente para chips Agilent. Si se requiere el análisis de secuencia del sitio de unión o la anotación del genoma, se utilizan programas como MEME, Gibbs Motif Sampler, sistema de anotación de elementos reguladores Cis y Galaxy . [4]
Ventajas y desventajas
Las matrices de mosaico proporcionan una herramienta imparcial para investigar la unión de proteínas, la expresión génica y la estructura de los genes en un ámbito de todo el genoma. Permiten un nuevo nivel de conocimiento en el estudio del transcriptoma y el metiloma.
Los inconvenientes incluyen el costo de los kits de arreglos en mosaico. Aunque los precios han bajado en los últimos años, el precio hace que no sea práctico usar matrices de mosaico de todo el genoma para mamíferos y otros genomas grandes. Otro problema es el "ruido transcripcional" producido por su capacidad de detección ultrasensible. [2] Además, el enfoque no proporciona un inicio o una parada claramente definidos para las regiones de interés identificadas por la matriz. Por último, las matrices suelen proporcionar solo números de cromosomas y de posición, por lo que a menudo se requiere la secuenciación como un paso separado (aunque algunas matrices modernas proporcionan información de secuencia [14] ).
Referencias
- ^ Yazaki, J; Gregory, BD; Ecker, JR (octubre de 2007). "Mapeo del paisaje del genoma utilizando tecnología de matriz de mosaico" . Opinión actual en biología vegetal . 10 (5): 534–42. doi : 10.1016 / j.pbi.2007.07.006 . PMC 2665186 . PMID 17703988 .
- ^ a b Mockler, TC; Chan, S; Sundaresan, A; Chen, H; Jacobsen, SE; Ecker, JR (enero de 2005). "Aplicaciones de matrices de mosaico de ADN para el análisis de genoma completo". Genómica . 85 (1): 1-15. doi : 10.1016 / j.ygeno.2004.10.005 . PMID 15607417 .
- ^ a b Yamada, K; Lim, J; Dale, JM; Chen, H; Shinn, P; Palm, CJ; Southwick, AM; Wu, HC; Kim, C; Nguyen, M; Pham, P; Cheuk, R; et al. (31 de octubre de 2003). "Análisis empírico de la actividad transcripcional en el genoma de Arabidopsis". Ciencia . 302 (5646): 842–6. Código bibliográfico : 2003Sci ... 302..842Y . doi : 10.1126 / science.1088305 . PMID 14593172 . S2CID 7076927 .
- ^ a b Liu, XS (octubre de 2007). "Introducción al análisis de microarrays de mosaico" . PLOS Biología Computacional . 3 (10): 1842–4. Código bibliográfico : 2007PLSCB ... 3..183L . doi : 10.1371 / journal.pcbi.0030183 . PMC 2041964 . PMID 17967045 .
- ^ O'Geen, H; Squazzo, SL; Iyengar, S; Blahnik, K; Rinn, JL; Chang, HY; Verde, R; Farnham, PJ (junio de 2007). "El análisis de todo el genoma de la unión de KAP1 sugiere la autorregulación de KRAB-ZNF" . PLOS Genetics . 3 (6): e89. doi : 10.1371 / journal.pgen.0030089 . PMC 1885280 . PMID 17542650 .
- ^ Bertone, P; Gerstein, M; Snyder, M (2005). "Aplicaciones de las matrices de mosaico de ADN para la anotación experimental del genoma y el descubrimiento de vías reguladoras". Investigación de cromosomas . 13 (3): 259–74. doi : 10.1007 / s10577-005-2165-0 . PMID 15868420 . S2CID 24058431 .
- ^ Cawley, S; Bekiranov, S; Ng, HH; Kapranov, P; Sekinger, EA; Kampa, D; Piccolboni, A; Sementchenko, V; Cheng, J; Williams, AJ; Wheeler, R; Wong, B; Drenkow, J; Yamanaka, M; Patel, S; Brubaker, S; Tammana, H; Helt, G; Struhl, K; Gingeras, TR (20 de febrero de 2004). "El mapeo imparcial de los sitios de unión del factor de transcripción a lo largo de los cromosomas humanos 21 y 22 apunta a una regulación generalizada de los ARN no codificantes". Celular . 116 (4): 499–509. doi : 10.1016 / S0092-8674 (04) 00127-8 . PMID 14980218 . S2CID 7793221 .
- ^ Kapranov, P; Cawley, SE; Drenkow, J; Bekiranov, S; Strausberg, RL; Fodor, SP; Gingeras, TR (3 de mayo de 2002). "Actividad transcripcional a gran escala en los cromosomas 21 y 22". Ciencia . 296 (5569): 916–9. Código Bibliográfico : 2002Sci ... 296..916K . doi : 10.1126 / science.1068597 . PMID 11988577 . S2CID 18336536 .
- ^ a b Kampa, D; Cheng, J; Kapranov, P; Yamanaka, M; Brubaker, S; Cawley, S; Drenkow, J; Piccolboni, A; Bekiranov, S; Helt, G; Tammana, H; Gingeras, TR (marzo de 2004). "Nuevos ARN identificados a partir de un análisis en profundidad del transcriptoma de los cromosomas humanos 21 y 22" . Investigación del genoma . 14 (3): 331–42. doi : 10.1101 / gr.2094104 . PMC 353210 . PMID 14993201 .
- ^ Stolc, V; Samanta, diputado; Tongprasit, W; Sethi, H; Liang, S; Nelson, DC; Hegeman, A; Nelson, C; Rancor, D; Bednarek, S; Ulrich, EL; Zhao, Q; Wrobel, RL; Newman, CS; Fox, BG; Phillips, GN Jr; Markley, JL; Sussman, MR (22 de marzo de 2005). "Identificación de secuencias transcritas en Arabidopsis thaliana mediante el uso de matrices de mosaico de genoma de alta resolución" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 102 (12): 4453–8. Código bibliográfico : 2005PNAS..102.4453S . doi : 10.1073 / pnas.0408203102 . PMC 555476 . PMID 15755812 .
- ^ Crawford, Gregory E; Davis, Sean; Scacheri, Peter C; Renaud, Gabriel; Halawi, Mohamad J; Erdos, Michael R; Green, Roland; Meltzer, Paul S; Wolfsberg, Tyra G; Collins, Francis S (21 de junio de 2006). "DNase-chip: un método de alta resolución para identificar sitios hipersensibles a DNasa I utilizando microarrays en mosaico" . Métodos de la naturaleza . 3 (7): 503–9. doi : 10.1038 / nmeth888 . PMC 2698431 . PMID 16791207 .
- ^ Heidenblad, M; Lindgren, D; Jonson, T; Liedberg, F; Veerla, S; Chebil, G; Gudjonsson, S; Borg, A; Månsson, W; Höglund, M (31 de enero de 2008). "Mosaico de resolución de matriz CGH y perfiles de expresión de alta densidad de carcinomas uroteliales delinean amplicones genómicos y genes diana candidatos específicos para tumores avanzados" . BMC Medical Genomics . 1 : 3. doi : 10.1186 / 1755-8794-1-3 . PMC 2227947 . PMID 18237450 .
- ^ Taskesen, Erdogan; Beekman, Renee; de Ridder, Jeroen; Wouters, Bas J; Peeters, Justine K; Touw, Ivo P; Reinders, Marcel JT; Delwel, Ruud (2010). "HAT: Análisis hipergeométrico de Tiling-arrays con aplicación a datos promotor-GeneChip" . BMC Bioinformática . 11 (1): 275. doi : 10.1186 / 1471-2105-11-275 . PMC 2892465 . PMID 20492700 .
- ^ Mockler, Todd C .; Ecker, Joseph R. (enero de 2005). "Aplicaciones de matrices de mosaico de ADN para el análisis de genoma completo". Genómica . 85 (1): 1-15. doi : 10.1016 / j.ygeno.2004.10.005 . PMID 15607417 .