De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La base de datos de dominio conservado ( CDD ) es una base de datos de modelos de alineación de secuencias múltiples bien anotados y modelos de búsqueda de bases de datos derivadas, para dominios antiguos y proteínas de longitud completa. [1]

Filosofía [ editar ]

Los dominios pueden considerarse como unidades funcionales y / o estructurales distintas de una proteína. Estas dos clasificaciones coinciden con bastante frecuencia, de hecho, y lo que se encuentra como una unidad de plegamiento independiente de una cadena polipeptídica también tiene una función específica. Los dominios a menudo se identifican como unidades recurrentes (secuencia o estructura), que pueden existir en varios contextos. En la evolución molecular, dichos dominios pueden haberse utilizado como bloques de construcción y pueden haberse recombinado en diferentes disposiciones para modular la función de la proteína. La CDD define los dominios conservados como unidades recurrentes en la evolución molecular, cuya extensión puede determinarse mediante análisis de secuencia y estructura.

El objetivo del proyecto de conservación de dominios conservados del NCBI es proporcionar a los usuarios de la base de datos información sobre cómo los patrones de conservación de residuos y divergencia en una familia se relacionan con las propiedades funcionales, y proporcionar enlaces útiles a información más detallada que pueda ayudar a comprender esa secuencia / estructura. / relaciones de función. Para hacer esto, los Curadores de CDD incluyen los siguientes tipos de información con el fin de complementar y enriquecer las alineaciones de secuencias múltiples tradicionales que forman la base de los modelos de dominio: estructuras tridimensionales y motivos centrales conservados, características / sitios conservados, organización filogenética, enlaces a recursos de literatura electrónica.

Contenido [ editar ]

El contenido de CDD incluye modelos de dominio seleccionados manualmente por NCBI y modelos de dominio importados de varias bases de datos de origen externo ( Pfam , SMART, COG, PRK, TIGRFAM ). Lo que es único acerca de los dominios curados por NCBI es que utilizan información de estructura 3D para definir explícitamente los límites del dominio, alinear bloques, modificar los detalles de alineación y proporcionar información sobre las relaciones secuencia / estructura / función. Los modelos seleccionados manualmente se organizan jerárquicamente si describen familias de dominio que están claramente relacionadas por descendencia común. Para proporcionar una vista no redundante de los datos, CDD agrupa modelos de dominio similares de varias fuentes en superfamilias.

Buscando en la base de datos [ editar ]

La colección también es parte del sistema de consulta y recuperación Entrez de NCBI, vinculado a numerosos otros recursos. CDD proporciona anotación de huellas de dominio y sitios funcionales conservados en secuencias de proteínas. La anotación de dominio precalculada se puede recuperar para secuencias de proteínas rastreadas en el sistema Entrez de NCBI, y la colección de modelos de CDD se puede consultar con secuencias de proteínas novedosas a través del "servicio de búsqueda de CD" . Centro Nacional de Información Biotecnológica de los Estados Unidos., o en * "Batch CD-Search" . Centro Nacional de Información Biotecnológica de los Estados Unidos., que permite el cálculo y la descarga de anotaciones para grandes conjuntos de consultas de proteínas.

Referencias [ editar ]

  1. a b Marchler-Bauer, A .; Zheng, C .; Chitsaz, F .; Derbyshire, MK; Geer, LY; Geer, RC; Gonzales, NR; Gwadz, M .; Hurwitz, DI; Lanczycki, CJ; Lu, F .; Lu, S .; Marchler, GH; Song, JS; Thanki, N .; Yamashita, RA; Zhang, D .; Bryant, SH (2012). "CDD: dominios conservados y estructura tridimensional de proteínas" . Investigación de ácidos nucleicos . 41 (Problema de la base de datos): D348 – D352. doi : 10.1093 / nar / gks1243 . PMC 3531192 . PMID 23197659 .  

Enlaces externos [ editar ]