Un dominio de unión a ADN ( DBD ) es un dominio de proteína plegado de forma independiente que contiene al menos un motivo estructural que reconoce el ADN monocatenario o bicatenario . Un DBD puede reconocer una secuencia de ADN específica (una secuencia de reconocimiento ) o tener una afinidad general por el ADN. [1] Algunos dominios de unión al ADN también pueden incluir ácidos nucleicos en su estructura plegada.
Función
Uno o más dominios de unión al ADN a menudo forman parte de una proteína más grande que consta de dominios proteicos adicionales con funciones diferentes. Los dominios adicionales a menudo regulan la actividad del dominio de unión al ADN. La función de la unión al ADN es estructural o implica la regulación de la transcripción , y las dos funciones a veces se superponen.
Los dominios de unión al ADN con funciones que involucran la estructura del ADN tienen roles biológicos en la replicación , reparación , almacenamiento y modificación del ADN , como la metilación .
Muchas proteínas implicadas en la regulación de la expresión génica contienen dominios de unión al ADN. Por ejemplo, las proteínas que regulan la transcripción al unirse al ADN se denominan factores de transcripción . El resultado final de la mayoría de las cascadas de señalización celular es la regulación genética.
El DBD interactúa con los nucleótidos del ADN de una manera específica de secuencia de ADN o no específica de secuencia, pero incluso el reconocimiento no específico de secuencia implica algún tipo de complementariedad molecular entre proteína y ADN. El reconocimiento del ADN por el DBD puede ocurrir en el surco mayor o menor del ADN, o en la columna vertebral del ADN de azúcar-fosfato (ver la estructura del ADN ). Cada tipo específico de reconocimiento de ADN se adapta a la función de la proteína. Por ejemplo, la enzima de corte de ADN ADNsa I corta el ADN casi al azar y, por lo tanto, debe unirse al ADN de una manera no específica de secuencia. Pero, aun así, la ADNasa I reconoce una cierta estructura de ADN en 3-D , lo que produce un patrón de escisión de ADN algo específico que puede ser útil para estudiar el reconocimiento de ADN mediante una técnica llamada huella de ADN .
Muchos dominios de unión al ADN deben reconocer secuencias de ADN específicas, como los DBD de factores de transcripción que activan genes específicos o los de enzimas que modifican el ADN en sitios específicos, como las enzimas de restricción y la telomerasa . El patrón de enlace de hidrógeno en el surco principal del ADN es menos degenerado que el del surco menor del ADN, lo que proporciona un sitio más atractivo para el reconocimiento del ADN específico de la secuencia .
La especificidad de las proteínas de unión al ADN puede ser estudiada usando muchas técnicas bioquímicas y biofísicas, tales como electroforesis en gel , ultracentrifugación analítica , calorimetría , DNA mutación , estructura de la proteína de mutación o modificación, de resonancia magnética nuclear , cristalografía de rayos x , resonancia de plasmón superficial , de electrones Resonancia paramagnética , reticulación y termoforesis a microescala (MST).
Proteína de unión al ADN en genomas
Una gran fracción de genes en cada genoma codifica proteínas de unión al ADN (ver Tabla). Sin embargo, solo un número bastante pequeño de familias de proteínas se unen al ADN. Por ejemplo, más de 2000 de las ~ 20.000 proteínas humanas se "unen al ADN", incluidas unas 750 proteínas con dedos de zinc. [3]
Especies | Proteínas de unión al ADN [4] | Familias de unión al ADN [4] |
---|---|---|
Arabidopsis thaliana (berro thale) | 4471 | 300 |
Saccharomyces cerevisiae (levadura) | 720 | 243 |
Caenorhabditis elegans (gusano) | 2028 | 271 |
Drosophila melanogaster (mosca de la fruta) | 2620 | 283 |
Tipos
Hélice-vuelta-hélice
Originalmente descubierto en bacterias, el motivo hélice-vuelta-hélice se encuentra comúnmente en proteínas represoras y tiene aproximadamente 20 aminoácidos de longitud. En eucariotas, el homeodominio comprende 2 hélices, una de las cuales reconoce el ADN (también conocida como hélice de reconocimiento). Son comunes en proteínas que regulan los procesos de desarrollo ( PROSITE HTH ).
Dedo de zinc
El dominio del dedo de zinc se encuentra principalmente en eucariotas, pero se han encontrado algunos ejemplos en bacterias. [5] El dominio de dedos de zinc generalmente tiene entre 23 y 28 aminoácidos de longitud y se estabiliza mediante la coordinación de iones de zinc con residuos de coordinación de zinc espaciados regularmente (histidinas o cisteínas). La clase más común de dedo de zinc (Cys2His2) coordina un solo ión de zinc y consta de una hélice de reconocimiento y una hoja beta de 2 hebras. [6] En los factores de transcripción, estos dominios se encuentran a menudo en matrices (generalmente separados por secuencias de enlace cortas) y los dedos adyacentes están espaciados en intervalos de 3 pares de bases cuando se unen al ADN.
Cremallera de leucina
El dominio de cremallera de leucina básica ( bZIP ) se encuentra principalmente en eucariotas y, en un grado limitado, en bacterias. El dominio bZIP contiene una hélice alfa con una leucina en cada séptimo aminoácido. Si dos de estas hélices se encuentran, las leucinas pueden interactuar como los dientes en una cremallera, lo que permite la dimerización de dos proteínas. Cuando se unen al ADN, los residuos de aminoácidos básicos se unen al esqueleto de azúcar-fosfato mientras que las hélices se asientan en los surcos principales. Regula la expresión genética.
Hélice alada
El dominio de hélice alada (WH), que consta de aproximadamente 110 aminoácidos, tiene cuatro hélices y una hoja beta de dos hebras.
Hélice-vuelta-hélice alada
El dominio de hélice-vuelta-hélice alada (wHTH) SCOP 46785 tiene típicamente 85-90 aminoácidos de longitud. Está formado por un haz de 3 hélices y una hoja beta de 4 hilos (ala).
Hélice-bucle-hélice
El dominio básico de hélice-bucle-hélice (bHLH) se encuentra en algunos factores de transcripción y se caracteriza por dos hélices alfa (α-hélices) conectadas por un bucle. Una hélice es típicamente más pequeña y, debido a la flexibilidad del bucle, permite la dimerización al plegarse y compactarse contra otra hélice. La hélice más grande contiene típicamente las regiones de unión al ADN.
Caja HMG
Los dominios de HMG-box se encuentran en proteínas de grupo de alta movilidad que están involucradas en una variedad de procesos dependientes del ADN como la replicación y la transcripción. También alteran la flexibilidad del ADN al inducir curvaturas. [7] [8] El dominio consta de tres hélices alfa separadas por bucles.
Dominio Wor3
Los dominios Wor3, llamados así por el regulador 3 blanco-opaco (Wor3) en Candida albicans, surgieron más recientemente en el tiempo evolutivo que la mayoría de los dominios de unión al ADN descritos anteriormente y están restringidos a un pequeño número de hongos. [9]
Dominio de pliegue OB
El OB-pliegue es un pequeño motivo estructural originalmente llamado por sus o ligonucleotide / o ligosaccharide b propiedades ncontrar. Los dominios de pliegues OB varían entre 70 y 150 aminoácidos de longitud. [10] Los pliegues OB se unen al ADN monocatenario y, por tanto, son proteínas de unión monocatenarias . [10]
Las proteínas del pliegue OB se han identificado como críticas para la replicación del ADN , la recombinación del ADN , la reparación del ADN , la transcripción , la traducción , la respuesta al choque frío y el mantenimiento de los telómeros . [11]
Raro
Pliegue de inmunoglobulina
El dominio de inmunoglobulina ( InterPro : IPR013783 ) consiste en una estructura de hoja beta con grandes bucles de conexión, que sirven para reconocer los surcos principales del ADN o los antígenos. Por lo general, se encuentran en las proteínas de inmunoglobulina, pero también están presentes en las proteínas Stat de la vía de las citocinas. Esto se debe probablemente a que la vía de las citocinas evolucionó relativamente recientemente y ha hecho uso de sistemas que ya eran funcionales, en lugar de crear los suyos propios.
Dominio B3
El B3 DBD ( InterPro : IPR003340 , SCOP 117343 ) se encuentra exclusivamente en factores de transcripción de plantas superiores y endonucleasas de restricción EcoRII y BfiI y típicamente consta de 100-120 residuos. Incluye siete hojas beta y dos hélices alfa , que forman un pliegue de proteína pseudobarrel de unión al ADN .
Efector TAL
Los efectores de TAL se encuentran en patógenos de plantas bacterianas del género Xanthomonas y participan en la regulación de los genes de la planta huésped para facilitar la virulencia, proliferación y diseminación bacteriana. [12] Contienen una región central de repeticiones en tándem de 33-35 residuos y cada región de repetición codifica una única base de ADN en el sitio de unión del TALE. [13] [14] Dentro de la repetición, es el residuo 13 solo el que contacta directamente con la base del ADN, lo que determina la especificidad de la secuencia, mientras que otras posiciones hacen contacto con la columna vertebral del ADN, estabilizando la interacción de unión al ADN. [15] Cada repetición dentro de la matriz toma la forma de hélices alfa emparejadas, mientras que la matriz de repetición completa forma una superhélice derecha, envolviendo la doble hélice de ADN. Se ha demostrado que las matrices de repeticiones efectoras TAL se contraen al unirse al ADN y se ha propuesto un mecanismo de búsqueda de dos estados mediante el cual el TALE alargado comienza a contraerse alrededor del ADN comenzando con un reconocimiento exitoso de timina a partir de una unidad de repetición única N-terminal del núcleo TAL -matriz de repetición de efectos. [16] Se encuentran proteínas relacionadas en el patógeno vegetal bacteriano Ralstonia solanacearum , [17] el endosimbionte fúngico Burkholderia rhizoxinica [18] y dos microorganismos marinos aún no identificados. [19] El código de unión al ADN y la estructura de la matriz de repetición se conservan entre estos grupos, denominados colectivamente como TALE .
Guiado por ARN
El sistema CRISPR / Cas de Streptococcus pyogenes se puede programar para dirigir tanto la activación [20] como la represión a promotores eucariotas naturales y artificiales mediante la ingeniería simple de ARN guía con complementariedad de apareamiento de bases con los sitios de ADN diana. [21] Cas9 se puede utilizar como una plataforma de unión de ADN guiada por ARN personalizable. El dominio Cas9 se puede funcionalizar con dominios reguladores de interés (por ejemplo, activación, represión o efector epigenético) o con dominio de endonucleasa como una herramienta versátil para la biología de ingeniería del genoma. [22] [23] y luego dirigirse a múltiples loci utilizando diferentes ARN guía.
Ver también
- Proteína de unión al ADN
- Comparación de software de simulación de ácidos nucleicos
Referencias
- ^ Lilley DM (1995). ADN-proteína: interacciones estructurales . Oxford: IRL Press en Oxford University Press. ISBN 0-19-963453-X.
- ^ Swint-Kruse L, Matthews KS (abril de 2009). "Allostery en la familia LacI / GalR: variaciones sobre un tema" . Opinión actual en microbiología . 12 (2): 129–37. doi : 10.1016 / j.mib.2009.01.009 . PMC 2688824 . PMID 19269243 .
- ^ "revisado: sí Y organismo:" Homo sapiens (humano) [9606] "Y proteoma: up000005640 en UniProtKB" . www.uniprot.org . Consultado el 25 de octubre de 2017 .
- ^ a b Malhotra S, Sowdhamini R (agosto de 2013). "Encuesta de todo el genoma de proteínas de unión al ADN en Arabidopsis thaliana: análisis de distribución y funciones" . Investigación de ácidos nucleicos . 41 (15): 7212–9. doi : 10.1093 / nar / gkt505 . PMC 3753632 . PMID 23775796 .
- ^ Malgieri G, Palmieri M, Russo L, Fattorusso R, Pedone PV, Isernia C (diciembre de 2015). "El dedo de zinc procariota: estructura, función y comparación con la contraparte eucariota" . La revista FEBS . 282 (23): 4480–96. doi : 10.1111 / febs.13503 . PMID 26365095 .
- ^ Pabo CO, Peisach E, Grant RA (2001). "Diseño y selección de nuevas proteínas de dedos de zinc Cys2His2". Revisión anual de bioquímica . 70 : 313–40. doi : 10.1146 / annurev.biochem.70.1.313 . PMID 11395410 .
- ^ Murugesapillai D, et al. (2014). "La formación de puentes y bucles de ADN por HMO1 proporciona un mecanismo para estabilizar la cromatina libre de nucleosomas" . Ácidos nucleicos Res . 42 (14): 8996–9004. doi : 10.1093 / nar / gku635 . PMC 4132745 . PMID 25063301 .
- ^ Murugesapillai D, McCauley MJ, Maher LJ 3rd, Williams MC (2017). "Estudios de molécula única de proteínas de flexión del ADN arquitectónico del grupo B de alta movilidad" . Biophys Rev . 9 (1): 17–40. doi : 10.1007 / s12551-016-0236-4 . PMC 5331113 . PMID 28303166 .
- ^ Lohse MB, Hernday AD, Fordyce PM, Noiman L, Sorrells TR, Hanson-Smith V, Nobile CJ, DeRisi JL, Johnson AD (mayo de 2013). "Identificación y caracterización de una familia no descrita previamente de dominios de unión a ADN específicos de secuencia" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 110 (19): 7660–5. Código Bibliográfico : 2013PNAS..110.7660L . doi : 10.1073 / pnas.1221734110 . PMC 3651432 . PMID 23610392 .
- ^ a b Flynn RL, Zou L (agosto de 2010). "Proteínas de pliegue de unión de oligonucleótidos / oligosacáridos: una creciente familia de guardianes del genoma" . Revisiones críticas en bioquímica y biología molecular . 45 (4): 266–75. doi : 10.3109 / 10409238.2010.488216 . PMC 2906097 . PMID 20515430 .
- ^ Theobald DL, Mitton-Fry RM, Wuttke DS (2003). "Reconocimiento de ácidos nucleicos por proteínas de pliegue OB" . Revisión anual de biofísica y estructura biomolecular . 32 : 115–33. doi : 10.1146 / annurev.biophys.32.110601.142506 . PMC 1564333 . PMID 12598368 .
- ^ Boch J, Bonas U (2010). "Efectores de tipo III de la familia Xanthomonas AvrBs3: descubrimiento y función". Revisión anual de fitopatología . 48 : 419–36. doi : 10.1146 / annurev-phyto-080508-081936 . PMID 19400638 .
- ^ Moscou MJ, Bogdanove AJ (diciembre de 2009). "Un cifrado simple gobierna el reconocimiento de ADN por efectores TAL". Ciencia . 326 (5959): 1501. Bibcode : 2009Sci ... 326.1501M . doi : 10.1126 / science.1178817 . PMID 19933106 . S2CID 6648530 .
- ^ Boch J, Scholze H, Schornack S, Landgraf A, Hahn S, Kay S, Lahaye T, Nickstadt A, Bonas U (diciembre de 2009). "Rompiendo el código de especificidad de unión al ADN de los efectores TAL-tipo III". Ciencia . 326 (5959): 1509–12. Código Bibliográfico : 2009Sci ... 326.1509B . doi : 10.1126 / science.1178811 . PMID 19933107 . S2CID 206522347 .
- ^ Mak AN, Bradley P, Cernadas RA, Bogdanove AJ, Stoddard BL (febrero de 2012). "La estructura cristalina del efector TAL PthXo1 unido a su objetivo de ADN" . Ciencia . 335 (6069): 716–9. Código bibliográfico : 2012Sci ... 335..716M . doi : 10.1126 / science.1216211 . PMC 3427646 . PMID 22223736 .
- ^ Cuculis L, Abil Z, Zhao H, Schroeder CM (junio de 2015). "La observación directa de la dinámica de la proteína TALE revela un mecanismo de búsqueda de dos estados" . Comunicaciones de la naturaleza . 6 : 7277. Bibcode : 2015NatCo ... 6.7277C . doi : 10.1038 / ncomms8277 . PMC 4458887 . PMID 26027871 .
- ^ de Lange O, Schreiber T, Schandry N, Radeck J, Braun KH, Koszinowski J, Heuer H, Strauß A, Lahaye T (agosto de 2013). "Romper el código de unión al ADN de los efectores TAL de Ralstonia solanacearum ofrece nuevas posibilidades para generar genes de resistencia de las plantas contra la enfermedad del marchitamiento bacteriano" . El nuevo fitólogo . 199 (3): 773–86. doi : 10.1111 / nph.12324 . PMID 23692030 .
- ^ Juillerat A, Bertonati C, Dubois G, Guyot V, Thomas S, Valton J, Beurdeley M, Silva GH, Daboussi F, Duchateau P (enero de 2014). "BurrH: una nueva proteína de unión de ADN modular para la ingeniería del genoma" . Informes científicos . 4 : 3831. Código Bibliográfico : 2014NatSR ... 4E3831J . doi : 10.1038 / srep03831 . PMC 5379180 . PMID 24452192 .
- ^ de Lange O, Wolf C, Thiel P, Krüger J, Kleusch C, Kohlbacher O, Lahaye T (noviembre de 2015). "Las proteínas de unión al ADN de las bacterias marinas amplían la diversidad de secuencias conocida de las repeticiones de tipo TALE" . Investigación de ácidos nucleicos . 43 (20): 10065–80. doi : 10.1093 / nar / gkv1053 . PMC 4787788 . PMID 26481363 .
- ^ Perez-Pinera P, Kocak DD, Vockley CM, Adler AF, Kabadi AM, Polstein LR, Thakore PI, Glass KA, Ousterout DG, Leong KW, Guilak F, Crawford GE, Reddy TE, Gersbach CA (octubre de 2013). "Activación de genes guiada por ARN por factores de transcripción basados en CRISPR-Cas9" . Métodos de la naturaleza . 10 (10): 973–6. doi : 10.1038 / nmeth.2600 . PMC 3911785 . PMID 23892895 .
- ^ Farzadfard F, Perli SD, Lu TK (octubre de 2013). "Factores de transcripción eucariotas sintonizables y multifuncionales basados en CRISPR / Cas" . Biología sintética ACS . 2 (10): 604-13. doi : 10.1021 / sb400081r . PMC 3805333 . PMID 23977949 .
- ^ Cho SW, Kim S, Kim JM, Kim JS (marzo de 2013). "Ingeniería del genoma dirigido en células humanas con la endonucleasa guiada por ARN Cas9". Biotecnología de la naturaleza . 31 (3): 230-2. doi : 10.1038 / nbt.2507 . PMID 23360966 . S2CID 10165663 .
- ^ Mali P, Esvelt KM, Church GM (octubre de 2013). "Cas9 como herramienta versátil para la ingeniería biológica" . Métodos de la naturaleza . 10 (10): 957–63. doi : 10.1038 / nmeth.2649 . PMC 4051438 . PMID 24076990 .
enlaces externos
- Base de datos DBD de factores de transcripción predichosKummerfeld SK, Teichmann SA (enero de 2006). "DBD: una base de datos de predicción de factores de transcripción" . Investigación de ácidos nucleicos . 34 (Problema de la base de datos): D74-81. doi : 10.1093 / nar / gkj131 . PMC 1347493 . PMID 16381970 . Utiliza un conjunto curado de dominios de unión al ADN para predecir los factores de transcripción en todos los genomas completamente secuenciados.
- Tabla de motivos de unión al ADN
- DNA + Footprinting en los encabezados de temas médicos (MeSH) de la Biblioteca Nacional de Medicina de EE. UU .
- Unión de ADN + proteínas en los encabezados de temas médicos (MeSH) de la Biblioteca Nacional de Medicina de EE. UU .
- Dominios de unión al ADN en PROSITE