Un dominio de función desconocida (DUF) es un dominio de proteína que no tiene una función caracterizada. Estas familias se han recopilado juntas en la base de datos de Pfam utilizando el prefijo DUF seguido de un número, siendo los ejemplos DUF2992 y DUF1220 . A partir de 2019, hay casi 4,000 familias DUF dentro de la base de datos de Pfam que representan más del 22% de las familias conocidas. Algunos DUF no se nombran utilizando la nomenclatura debido al uso popular, pero no obstante son DUF. [1]
La designación DUF es provisional, y estas familias tienden a cambiar de nombre a un nombre más específico (o fusionarse con un dominio existente) después de que se identifica una función. [2] [3]
Historia
Chris Ponting introdujo el esquema de nombres DUF mediante la adición de DUF1 y DUF2 a la base de datos SMART . [4] Se encontró que estos dos dominios están ampliamente distribuidos en proteínas de señalización bacterianas. Posteriormente, se identificaron las funciones de estos dominios y desde entonces se han renombrado como dominio GGDEF y dominio EAL, respectivamente. [2]
Caracterización
Los programas de genómica estructural han intentado comprender la función de los DUF a través de la determinación de la estructura. Se han resuelto las estructuras de más de 250 familias DUF. Este trabajo (2009) mostró que aproximadamente dos tercios de las familias DUF tenían una estructura similar a una previamente resuelta y, por lo tanto, probablemente fueran miembros divergentes de las superfamilias de proteínas existentes, mientras que aproximadamente un tercio poseía un nuevo pliegue proteico. [5]
Algunas familias de DUF comparten homología de secuencia remota con dominios que han caracterizado la función. El trabajo computacional se puede utilizar para vincular estas relaciones. Un trabajo de 2015 pudo asignar el 20% de los DUF a superfamilias estructurales caracterizadas. [6] Pfam también realiza continuamente la asignación (verificada manualmente) en las entradas de la superfamilia del "clan". [1]
Frecuencia y conservación
Más del 20% de todos los dominios de proteínas se anotaron como DUF en 2013. Se encuentran aproximadamente 2.700 DUF en bacterias en comparación con poco más de 1.500 en eucariotas. Más de 800 DUF se comparten entre bacterias y eucariotas, y alrededor de 300 de estos también están presentes en las arqueas. Un total de 2.786 dominios Pfam bacterianos se producen incluso en animales, incluidos 320 DUF. [7]
Papel en biología
Muchos DUF están muy conservados, lo que indica un papel importante en biología. Sin embargo, muchos de estos DUF no son esenciales, por lo que a menudo se desconoce su función biológica. Por ejemplo, DUF143 está presente en la mayoría de las bacterias y genomas eucariotas . [8] Sin embargo, cuando se eliminó en Escherichia coli no se detectó ningún fenotipo obvio . Posteriormente se demostró que las proteínas que contienen DUF143, son factores de silenciamiento ribosómico que bloquean el ensamblaje de las dos subunidades ribosómicas. [8] Si bien esta función no es esencial, ayuda a las células a adaptarse a las condiciones de bajos nutrientes al detener la biosíntesis de proteínas. Como resultado, estas proteínas y el DUF solo se vuelven relevantes cuando las células mueren de hambre. [8] Por tanto, se cree que muchos DUF (o proteínas de función desconocida, PUF) solo se requieren en determinadas condiciones.
DUF esenciales
Goodacre y col. identificó 238 DUF en 355 proteínas esenciales (en 16 especies bacterianas modelo), la mayoría de las cuales representan proteínas de dominio único, estableciendo claramente la esencialidad biológica de las DUF. Estos DUF se denominan "DUF esenciales" o eDUF. [7]
enlaces externos
Referencias
- ^ a b El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC, Qureshi M, Richardson LJ, Salazar GA, Smart A, Sonnhammer EL, Hirsh L, Paladin L, Piovesan D, Tosatto SC, Finn RD (enero de 2019). "La base de datos de familias de proteínas Pfam en 2019" . Investigación de ácidos nucleicos . 47 (D1): D427 – D432. doi : 10.1093 / nar / gky995 . PMC 6324024 . PMID 30357350 .
- ^ a b Bateman A, Coggill P, Finn RD (octubre de 2010). "DUFs: familias en busca de función" . Acta Crystallographica. Sección F, Comunicaciones de Biología Estructural y Cristalización . 66 (Pt 10): 1148–52. doi : 10.1107 / S1744309110001685 . PMC 2954198 . PMID 20944204 .
- ^ Punta M, Coggill PC, Eberhardt RY, Mistry J, Tate J, Boursnell C, Pang N, Forslund K, Ceric G, Clements J, Heger A, Holm L, Sonnhammer EL, Eddy SR, Bateman A, Finn RD (enero de 2012 ). "La base de datos de familias de proteínas Pfam" . Investigación de ácidos nucleicos . 40 (Problema de la base de datos): D290-301. doi : 10.1093 / nar / gkr1065 . PMC 3245129 . PMID 22127870 .
- ^ Schultz J, Milpetz F, Bork P, Ponting CP (mayo de 1998). "SMART, una sencilla herramienta de investigación de arquitectura modular: identificación de dominios de señalización" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 95 (11): 5857–64. Código Bibliográfico : 1998PNAS ... 95.5857S . doi : 10.1073 / pnas.95.11.5857 . PMC 34487 . PMID 9600884 .
- ^ Jaroszewski L, Li Z, Krishna SS, Bakolitsa C, Wooley J, Deacon AM, Wilson IA, Godzik A (septiembre de 2009). "Exploración de regiones inexploradas del universo de proteínas" . PLOS Biología . 7 (9): e1000205. doi : 10.1371 / journal.pbio.1000205 . PMC 2744874 . PMID 19787035 .
- ^ Mudgal R, Sandhya S, Chandra N, Srinivasan N (julio de 2015). "Des-DUFing los DUF: descifrar relaciones evolutivas distantes de dominios de función desconocida utilizando métodos sensibles de detección de homología" . Biology Direct . 10 (1): 38. doi : 10.1186 / s13062-015-0069-2 . PMC 4520260 . PMID 26228684 .
- ^ a b c Goodacre NF, Gerloff DL, Uetz P (diciembre de 2013). "Los dominios proteicos de función desconocida son esenciales en las bacterias" . mBio . 5 (1): e00744-13. doi : 10.1128 / mBio.00744-13 . PMC 3884060 . PMID 24381303 .
- ^ a b c Häuser R, Pech M, Kijek J, Yamamoto H, Titz B, Naeve F, Tovchigrechko A, Yamamoto K, Szaflarski W, Takeuchi N, Stellberger T, Diefenbacher ME, Nierhaus KH, Uetz P (2012). Hughes D (ed.). "Las proteínas RsfA (YbeB) son factores de silenciamiento ribosómico conservados" . PLOS Genetics . 8 (7): e1002815. doi : 10.1371 / journal.pgen.1002815 . PMC 3400551 . PMID 22829778 .