De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Los sitios de unión al ADN son un tipo de sitio de unión que se encuentra en el ADN donde se pueden unir otras moléculas. Los sitios de unión al ADN son distintos de otros sitios de unión en que (1) son parte de una secuencia de ADN (por ejemplo, un genoma) y (2) están unidos por proteínas de unión al ADN . Los sitios de unión al ADN a menudo se asocian con proteínas especializadas conocidas como factores de transcripción y, por lo tanto, están vinculados a la regulación transcripcional . La suma de los sitios de unión al ADN de un factor de transcripción específico se denomina cistroma . Los sitios de unión al ADN también abarcan los objetivos de otras proteínas, como las enzimas de restricción , las recombinasas específicas del sitio (verrecombinación específica de sitio ) y metiltransferasas . [1]

Por tanto, los sitios de unión al ADN pueden definirse como secuencias de ADN cortas (típicamente de 4 a 30 pares de bases de largo, pero hasta 200 pb para los sitios de recombinación) que están unidas específicamente por una o más proteínas de unión al ADN o complejos proteicos. Se ha informado de que algunos sitios de unión tienen el potencial de sufrir un cambio evolutivo rápido. [2]

Tipos de sitios de unión al ADN [ editar ]

Los sitios de unión al ADN se pueden clasificar según su función biológica. Por tanto, podemos distinguir entre sitios de unión a factores de transcripción, sitios de restricción y sitios de recombinación. Algunos autores han propuesto que los sitios de unión también podrían clasificarse según su modo de representación más conveniente. [3] Por un lado, los sitios de restricción generalmente se pueden representar mediante secuencias consenso. Esto se debe a que se dirigen principalmente a secuencias idénticas y la eficiencia de restricción disminuye abruptamente para secuencias menos similares. Por otro lado, los sitios de unión al ADN para un factor de transcripción dado suelen ser todos diferentes, con diversos grados de afinidad del factor de transcripción por los diferentes sitios de unión. Esto hace que sea difícil representar con precisión los sitios de unión del factor de transcripción utilizandosecuencias de consenso , y normalmente se representan utilizando matrices de frecuencia específicas de posición (PSFM), que a menudo se representan gráficamente utilizando logotipos de secuencia . Este argumento, sin embargo, es en parte arbitrario. Las enzimas de restricción, como los factores de transcripción, producen un rango gradual, aunque nítido, de afinidades por diferentes sitios [4] y, por lo tanto, también están mejor representadas por PSFM. Asimismo, las recombinasas específicas de sitio también muestran un rango variado de afinidades por diferentes sitios diana. [5] [6]

Historia y principales técnicas experimentales [ editar ]

La existencia de algo similar a los sitios de unión al ADN se sospechó a partir de los experimentos sobre la biología del bacteriófago lambda [7] y la regulación del operón lac de Escherichia coli . [8] Los sitios de unión al ADN finalmente se confirmaron en ambos sistemas [9] [10] [11] con el advenimiento de las técnicas de secuenciación del ADN . A partir de entonces, se han descubierto sitios de unión al ADN para muchos factores de transcripción, enzimas de restricción y recombinasas específicas de sitio utilizando una profusión de métodos experimentales. Históricamente, las técnicas experimentales de elección para descubrir y analizar los sitios de unión del ADN han sido el ensayo de huella de ADNasa y elEnsayo de cambio de movilidad electroforético (EMSA). Sin embargo, el desarrollo de microarrays de ADN y técnicas de secuenciación rápida ha llevado a nuevos métodos masivamente paralelos para la identificación in vivo de sitios de unión, como ChIP-chip y ChIP-Seq . [12] Para cuantificar la afinidad de unión [13] de proteínas y otras moléculas a sitios de unión de ADN específicos, se utiliza el método biofísico Termoforesis a microescala [14] .

Bases de datos [ editar ]

Debido a la naturaleza diversa de las técnicas experimentales utilizadas para determinar los sitios de unión y a la cobertura irregular de la mayoría de los organismos y factores de transcripción, no existe una base de datos central (similar a GenBank en el Centro Nacional de Información Biotecnológica ) para los sitios de unión del ADN. Aunque NCBI contempla la anotación del sitio de unión al ADN en sus secuencias de referencia ( RefSeq ), la mayoría de las presentaciones omiten esta información. Además, debido al éxito limitado de la bioinformática en la producción de herramientas de predicción de sitios de unión de ADN eficientes ( las tasas de falsos positivos grandes a menudo se asocian con métodos de búsqueda de sitios / descubrimiento de motivos in-silico), no ha habido un esfuerzo sistemático para anotar computacionalmente estas características en secuencia genomas.

Sin embargo, existen varias bases de datos públicas y privadas dedicadas a la compilación de sitios de unión informados experimentalmente y, a veces, pronosticados computacionalmente, para diferentes factores de transcripción en diferentes organismos. A continuación se muestra una tabla no exhaustiva de bases de datos disponibles:

Representación de sitios de unión al ADN [ editar ]

Una colección de sitios de unión de ADN, normalmente denominada motivo de unión de ADN, puede representarse mediante una secuencia consenso . Esta representación tiene la ventaja de ser compacta, pero a costa de descartar una cantidad sustancial de información. [15] Una forma más precisa de representar los sitios de unión es a través de Matrices de frecuencia específicas de posición (PSFM). Estas matrices dan información sobre la frecuencia de cada base en cada posición del motivo de unión al ADN. [3] Los PSFM generalmente se conciben con la suposición implícita de independencia posicional (diferentes posiciones en el sitio de unión al ADN contribuyen de forma independiente a la función del sitio), aunque esta suposición ha sido cuestionada para algunos sitios de unión al ADN. [dieciséis]Información de frecuencia en un PSFM se puede interpretar formalmente en el marco de la Teoría de la Información , [17] que lleva a su representación gráfica como una secuencia logo .

PSFM para el represor transcripcional LexA derivado de 56 sitios de unión a LexA almacenados en Prodoric. Las frecuencias relativas se obtienen dividiendo los recuentos de cada celda por el recuento total (56)

Búsqueda y descubrimiento computacional de sitios vinculantes [ editar ]

En bioinformática , se pueden distinguir dos problemas separados con respecto a los sitios de unión al ADN: buscar miembros adicionales de un motivo de unión al ADN conocido (el problema de búsqueda del sitio) y descubrir nuevos motivos de unión al ADN en colecciones de secuencias funcionalmente relacionadas (el problema del descubrimiento del motivo de la secuencia ). . [18] Se han propuesto muchos métodos diferentes para buscar sitios de unión. La mayoría de ellos se basan en los principios de la teoría de la información y disponen de servidores web (Yellaboina) (Munch), mientras que otros autores han recurrido a métodos de aprendizaje automático , como las redes neuronales artificiales . [3] [19] [20] También hay una gran cantidad de algoritmos disponibles paradescubrimiento de motivos de secuencia . Estos métodos se basan en la hipótesis de que un conjunto de secuencias comparten un motivo de unión por razones funcionales. Los métodos de descubrimiento de motivos de unión se pueden dividir a grandes rasgos en enumerativos, deterministas y estocásticos. [21] MEME [22] y Consensus [23] son ejemplos clásicos de optimización determinista, mientras que el muestreador de Gibbs [24] es la implementación convencional de un método puramente estocástico para el descubrimiento de motivos de unión al ADN. Otro ejemplo de esta clase de métodos es SeSiMCMC [25] que se centra en sitios TFBS débiles con simetría. Mientras que los métodos enumerativos a menudo recurren a expresiones regularesLa representación de sitios de unión, PSFM y su tratamiento formal bajo los métodos de la Teoría de la Información son la representación de elección tanto para métodos deterministas como estocásticos. Los métodos híbridos, por ejemplo, ChIPMunk [26], que combina optimización codiciosa con submuestreo, también utilizan PSFM. Los avances recientes en la secuenciación han llevado a la introducción de enfoques genómicos comparativos para el descubrimiento de motivos de unión al ADN, como lo ejemplifica PhyloGibbs. [27] [28]

Los métodos más complejos para la búsqueda de sitios de unión y el descubrimiento de motivos se basan en el apilamiento de bases y otras interacciones entre las bases de ADN, pero debido a los pequeños tamaños de muestra típicamente disponibles para los sitios de unión en el ADN, su eficiencia aún no se aprovecha por completo. Un ejemplo de tal herramienta es la ULPB [29].

Ver también [ editar ]

  • Proteína de unión al ADN
  • Sitio de unión
  • Regulación transcripcional

Referencias [ editar ]

  1. ^ Halford ES; Marko JF (2004). "¿Cómo encuentran sus objetivos las proteínas de unión al ADN específicas del sitio?" . Investigación de ácidos nucleicos . 32 (10): 3040–3052. doi : 10.1093 / nar / gkh624 . PMC  434431 . PMID  15178741 .
  2. ^ Borneman, AR; Gianoulis, TA; Zhang, ZD; Yu, H .; Rozowsky, J .; Seringhaus, MR; Wang, LY; Gerstein, M. y Snyder, M. (2007). "Divergencia de los sitios de unión del factor de transcripción a través de especies de levadura relacionadas". Ciencia . 317 (5839): 815–819. Código Bibliográfico : 2007Sci ... 317..815B . doi : 10.1126 / science.1140748 . PMID 17690298 . S2CID 21535866 .  
  3. ↑ a b c Stormo GD (2000). "Sitios de unión al ADN: representación y descubrimiento" . Bioinformática . 16 (1): 16-23. doi : 10.1093 / bioinformatics / 16.1.16 . PMID 10812473 . 
  4. ^ Pingoud A, Jeltsch A (1997). "Reconocimiento y escisión de ADN por endonucleasas de restricción de tipo II" . Revista europea de bioquímica . 246 (1): 1–22. doi : 10.1111 / j.1432-1033.1997.t01-6-00001.x . PMID 9210460 . 
  5. ^ Gyohda A, Komano T (2000). "Purificación y caracterización de la recombinasa específica de shufflon R64" . Revista de bacteriología . 182 (10): 2787–2792. doi : 10.1128 / JB.182.10.2787-2792.2000 . PMC 101987 . PMID 10781547 .  
  6. ^ Birge, EA (2006). "15: Recombinación específica del sitio". Genética bacteriana y bacteriófaga (5ª ed.). Saltador. págs. 463–478. ISBN 978-0-387-23919-4.
  7. ^ Campbell A (1963). "Genética de estructura fina y su relación con la función". Revisión anual de microbiología . 17 (1): 2787–2792. doi : 10.1146 / annurev.mi.17.100163.000405 . PMID 14145311 . 
  8. ^ Jacob F, Monod J (1961). "Mecanismos de regulación genética en la síntesis de proteínas". Revista de Biología Molecular . 3 (3): 318–356. doi : 10.1016 / S0022-2836 (61) 80072-7 . PMID 13718526 . 
  9. ^ Gilbert W, Maxam A (1973). "La secuencia de nucleótidos del operador lac" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 70 (12): 3581–3584. Código bibliográfico : 1973PNAS ... 70.3581G . doi : 10.1073 / pnas.70.12.3581 . PMC 427284 . PMID 4587255 .  
  10. ^ Maniatis T, Ptashne M, Barrell BG, Donelson J (1974). "Secuencia de un sitio de unión a represor en el ADN del bacteriófago lambda". Naturaleza . 250 (465): 394–397. Código Bib : 1974Natur.250..394M . doi : 10.1038 / 250394a0 . PMID 4854243 . S2CID 4204720 .  
  11. ^ Nash HA (1975). "Recombinación integrativa del ADN del bacteriófago lambda in vitro" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 72 (3): 1072–1076. Código Bibliográfico : 1975PNAS ... 72.1072N . doi : 10.1073 / pnas.72.3.1072 . PMC 432468 . PMID 1055366 .  
  12. ^ Elnitski L, Jin VX, Farnham PJ, Jones SJ (2006). "Localización de sitios de unión del factor de transcripción de mamíferos: un estudio de técnicas experimentales y computacionales" . Investigación del genoma . 16 (12): 1455-1464. doi : 10.1101 / gr.4140006 . PMID 17053094 . 
  13. ^ Baaske P, Wienken CJ, Reineck P, Duhr S, Braun D (febrero de 2010). "La termoforesis óptica cuantifica la dependencia del tampón de la unión de aptámeros". Angew. Chem. En t. Ed . 49 (12): 2238–41. doi : 10.1002 / anie.200903998 . PMID 20186894 . S2CID 42489892 . Resumen de Lay - Phsyorg.com .  
  14. ^ Wienken CJ; et al. (2010). "Ensayos de unión a proteínas en líquidos biológicos mediante termoforesis a microescala" . Comunicaciones de la naturaleza . 1 (7): 100. Código Bibliográfico : 2010NatCo ... 1..100W . doi : 10.1038 / ncomms1093 . PMID 20981028 . 
  15. ^ Schneider TD (2002). "Secuencia de consenso Zen" . Bioinformática aplicada . 1 (3): 111-119. PMC 1852464 . PMID 15130839 .  
  16. ^ Bulyk ML; Johnson PL; Iglesia GM (2002). "Los nucleótidos de los sitios de unión del factor de transcripción ejercen efectos interdependientes sobre las afinidades de unión de los factores de transcripción" . Investigación de ácidos nucleicos . 30 (5): 1255-1261. doi : 10.1093 / nar / 30.5.1255 . PMC 101241 . PMID 11861919 .  
  17. ^ Schneider TD, Stormo GD, Gold L, Ehrenfeucht A (1986). "Contenido de información de sitios de unión en secuencias de nucleótidos". Revista de Biología Molecular . 188 (3): 415–431X. doi : 10.1016 / 0022-2836 (86) 90165-8 . PMID 3525846 . 
  18. ^ Erill I; O'Neill MC (2009). "Un nuevo examen de los métodos basados ​​en la teoría de la información para la identificación del sitio de unión al ADN" . BMC Bioinformática . 10 (1): 57. doi : 10.1186 / 1471-2105-10-57 . PMC 2680408 . PMID 19210776 .  
  19. ^ Bisant D, Maizel J (1995). "Identificación de sitios de unión de ribosomas en Escherichia coli utilizando modelos de redes neuronales" . Investigación de ácidos nucleicos . 23 (9): 1632–1639. doi : 10.1093 / nar / 23.9.1632 . PMC 306908 . PMID 7784221 .  
  20. ^ O'Neill MC (1991). "Entrenamiento de redes neuronales de retropropagación para definir y detectar sitios de unión al ADN" . Investigación de ácidos nucleicos . 19 (2): 133–318. doi : 10.1093 / nar / 19.2.313 . PMC 333596 . PMID 2014171 .  
  21. ^ Bailey TL (2008). "Descubriendo motivos de secuencia". Bioinformática (PDF) . Métodos en Biología Molecular . Métodos en Biología Molecular ™. 452 . págs. 231-251. doi : 10.1007 / 978-1-60327-159-2_12 . ISBN  978-1-58829-707-5. PMID  18566768 .
  22. ^ Bailey TL (2002). "Descubriendo nuevos motivos de secuencia con MEME". Protocolos actuales en bioinformática . 2 (4): 2.4.1–2.4.35. doi : 10.1002 / 0471250953.bi0204s00 . PMID 18792935 . S2CID 205157795 .  
  23. Stormo GD, Hartzell GW 3rd (1989). "Identificación de sitios de unión a proteínas a partir de fragmentos de ADN no alineados" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 86 (4): 1183-1187. Código Bibliográfico : 1989PNAS ... 86.1183S . doi : 10.1073 / pnas.86.4.1183 . PMC 286650 . PMID 2919167 .  
  24. ^ Lawrence CE, Altschul SF, Boguski MS, Liu JS, Neuwald AF, Wootton JC (1993). "Detección de señales de secuencia sutiles: una estrategia de muestreo de Gibbs para alineación múltiple". Ciencia . 262 (5131): 208–214. Código Bibliográfico : 1993Sci ... 262..208L . doi : 10.1126 / science.8211139 . PMID 8211139 . S2CID 3040614 .  
  25. ^ Favorov, AV; MS Gelfand; AV Gerasimova; DA Ravcheev; AA Mironov; VJ Makeev (15 de mayo de 2005). "Un muestreador de Gibbs para la identificación de motivos de ADN espaciados y estructurados simétricamente con una estimación mejorada de la longitud de la señal" . Bioinformática . 21 (10): 2240–2245. doi : 10.1093 / bioinformatics / bti336 . ISSN 1367-4803 . PMID 15728117 .  
  26. Kulakovskiy, IV; VA Boeva; AV Favorov; VJ Makeev (24 de agosto de 2010). "Excavación profunda y amplia para la unión de motivos en datos ChIP-Seq" . Bioinformática . 26 (20): 2622–3. doi : 10.1093 / bioinformatics / btq488 . ISSN 1367-4811 . PMID 20736340 .  
  27. ^ Das MK, Dai HK (2007). "Una encuesta de algoritmos de búsqueda de motivos de ADN" . BMC Bioinformática . 8 (Supl. 7): S21. doi : 10.1186 / 1471-2105-8-S7-S21 . PMC 2099490 . PMID 18047721 .  
  28. ^ Siddharthan R, Siggia ED, van Nimwegen E (2005). "PhyloGibbs: un buscador de motivos de muestreo de Gibbs que incorpora filogenia" . PLOS Comput Biol . 1 (7): e67. Código Bibliográfico : 2005PLSCB ... 1 ... 67S . doi : 10.1371 / journal.pcbi.0010067 . PMC 1309704 . PMID 16477324 .  
  29. ^ Salama RA, Stekel DJ (2010). "La inclusión de interdependencias de bases vecinas mejora sustancialmente la predicción del sitio de unión del factor de transcripción procariótico en todo el genoma" . Investigación de ácidos nucleicos . 38 (12): e135. doi : 10.1093 / nar / gkq274 . PMC 2896541 . PMID 20439311 .  

Enlaces externos [ editar ]

  • ENCODE hilos Explorer motivos de factores de transcripción en la naturaleza
  • Motivos de unión TF seleccionados manualmente para 157 especies de plantas