De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

El Protein Data Bank ( PDB ) [1] es una base de datos para los datos estructurales tridimensionales de grandes moléculas biológicas, como proteínas y ácidos nucleicos . Los datos, normalmente obtenidos por cristalografía de rayos X , espectroscopia de RMN o, cada vez más, microscopía crioelectrónica , y enviados por biólogos y bioquímicos de todo el mundo, son de libre acceso en Internet a través de los sitios web de sus organizaciones miembros (PDBe, [2] PDBj, [3] RCSB, [4] y BMRB [5]). El PDB está supervisado por una organización llamada Worldwide Protein Data Bank , wwPDB.

El PDB es clave en áreas de biología estructural , como la genómica estructural . La mayoría de las revistas científicas importantes y algunas agencias de financiación ahora requieren que los científicos envíen sus datos de estructura al PDB. Muchas otras bases de datos utilizan estructuras de proteínas depositadas en el AP. Por ejemplo, SCOP y CATH clasifican las estructuras de proteínas, mientras que PDBsum proporciona una descripción gráfica de las entradas de PDB utilizando información de otras fuentes, como la ontología genética . [6] [7]

Historia [ editar ]

Dos fuerzas convergieron para iniciar el AP: una colección pequeña pero creciente de conjuntos de datos de estructura de proteínas determinados por difracción de rayos X; y la pantalla de gráficos moleculares recientemente disponible (1968), Brookhaven RAster Display (BRAD), para visualizar estas estructuras de proteínas en 3-D. En 1969, con el patrocinio de Walter Hamilton en el Laboratorio Nacional de Brookhaven , Edgar Meyer ( Texas A&M University ) comenzó a escribir software para almacenar archivos de coordenadas atómicas en un formato común para que estén disponibles para evaluación geométrica y gráfica. En 1971, uno de los programas de Meyer, SEARCH, permitió a los investigadores acceder de forma remota a la información de la base de datos para estudiar las estructuras de proteínas sin conexión. [8] SEARCH fue fundamental para permitir la creación de redes, lo que marcó el comienzo funcional de la AP.

El Protein Data Bank se anunció en octubre de 1971 en Nature New Biology [9] como una empresa conjunta entre el Cambridge Crystallographic Data Center , Reino Unido y el Laboratorio Nacional Brookhaven, EE. UU.

Tras la muerte de Hamilton en 1973, Tom Koeztle asumió la dirección de la AP durante los siguientes 20 años. En enero de 1994, Joel Sussman, del Instituto de Ciencias Weizmann de Israel, fue nombrado director del AP. En octubre de 1998, [10] el AP se transfirió al Laboratorio de Investigación en Bioinformática Estructural (RCSB); [11] la transferencia se completó en junio de 1999. La nueva directora fue Helen M. Berman de la Universidad de Rutgers (una de las instituciones administradoras de la RCSB, la otra es el San Diego Supercomputer Center en UC San Diego ). [12]En 2003, con la formación de la wwPDB, la AP se convirtió en una organización internacional. Los miembros fundadores son PDBe (Europa), [2] RCSB (EE.UU.) y PDBj (Japón). [3] El BMRB [5] se incorporó en 2006. Cada uno de los cuatro miembros de wwPDB puede actuar como centro de depósito, procesamiento de datos y distribución de datos PDB. El procesamiento de datos se refiere al hecho de que el personal de wwPDB revisa y anota cada entrada enviada. [13] A continuación, se comprueba automáticamente la plausibilidad de los datos (el código fuente [14] de este software de validación se ha puesto a disposición del público de forma gratuita).

Contenido [ editar ]

Ejemplos de estructuras de proteínas del PDB (creadas con UCSF Chimera)
Tasa de determinación de la estructura proteica por método y año. MX = cristalografía macromolecular , 3DEM = microscopía electrónica 3D . [15]

La base de datos de la AP se actualiza semanalmente ( UTC +0 miércoles), junto con su lista de existencias. [16] A 1 de abril de 2020 , el AP estaba compuesto por:

134,146 estructuras en el PDB tienen un archivo de factor de estructura .
10,289 estructuras tienen un archivo de restricción de RMN.
4.814 estructuras en el PDB tienen un archivo de cambios químicos .
4.718 estructuras en el PDB tienen un archivo de mapa 3DEM depositado en EM Data Bank

La mayoría de las estructuras se determinan mediante difracción de rayos X, pero aproximadamente el 10% de las estructuras se determinan mediante RMN de proteínas . Cuando se usa la difracción de rayos X, se obtienen aproximaciones de las coordenadas de los átomos de la proteína, mientras que con la RMN se estima la distancia entre pares de átomos de la proteína. La conformación final de la proteína se obtiene a partir de RMN resolviendo un problema de geometría de distancia . Después de 2013, se determina un número creciente de proteínas mediante microscopía crioelectrónica . Al hacer clic en los números de la tabla externa vinculada, se muestran ejemplos de estructuras determinadas por ese método.

Para las estructuras PDB determinadas por difracción de rayos X que tienen un archivo de factor de estructura, se puede ver su mapa de densidad de electrones. Los datos de tales estructuras se almacenan en el "servidor de densidad de electrones". [17] [18]

Históricamente, el número de estructuras en el AP ha crecido a un ritmo aproximadamente exponencial, con 100 estructuras registradas en 1982, 1000 estructuras en 1993, 10.000 en 1999 y 100.000 en 2014. [19] [20]

Formato de archivo [ editar ]

El formato de archivo utilizado inicialmente por la PDB se denominó formato de archivo PDB. El formato original estaba restringido por el ancho de las tarjetas perforadas de computadora a 80 caracteres por línea. Alrededor de 1996, se introdujo gradualmente el formato de "archivo de información cristalográfica macromolecular", mmCIF, que es una extensión del formato CIF . MmCIF se convirtió en el formato estándar para el archivo PDB en 2014. [21] En 2019, la wwPDB anunció que las deposiciones de Los métodos cristalográficos solo se aceptarán en formato mmCIF. [22]

En 2005 se describió una versión XML de PDB, denominada PDBML. [23] Los archivos de estructura se pueden descargar en cualquiera de estos tres formatos, aunque un número cada vez mayor de estructuras no se ajusta al formato PDB heredado. Los archivos individuales se descargan fácilmente en paquetes de gráficos desde las URL de Internet :

  • Para archivos en formato PDB, utilice, por ejemplo, http://www.pdb.org/pdb/files/4hhb.pdb.gzohttp://pdbe.org/download/4hhb
  • Para archivos PDBML (XML), utilice, por ejemplo, http://www.pdb.org/pdb/files/4hhb.xml.gzohttp://pdbe.org/pdbml/4hhb

El " 4hhb" es el identificador de PDB. Cada estructura publicada en PDB recibe un identificador alfanumérico de cuatro caracteres, su ID de PDB. (Este no es un identificador único para biomoléculas, porque varias estructuras para la misma molécula, en diferentes entornos o conformaciones, pueden estar contenidas en PDB con diferentes ID de PDB).

Ver los datos [ editar ]

Los archivos de estructura se pueden ver utilizando uno de varios programas de computadora gratuitos y de código abierto , incluidos Jmol , Pymol , VMD y Rasmol . Otros programas shareware no gratuitos incluyen ICM-Browser, [24] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [25] StarBiochem [26] (un visor molecular interactivo basado en Java con búsqueda integrada de banco de datos de proteínas), Sirius y VisProt3DS [27] (una herramienta para la visualización de proteínas en vista estereoscópica 3D en anaglit y otros modos), y Discovery Studio. El sitio web de RCSB PDB contiene una lista extensa de programas de visualización de moléculas y complementos de navegador web, tanto gratuitos como comerciales.

Ver también [ editar ]

  • Base de datos cristalográfica
  • Estructura proteica
  • Predicción de la estructura de proteínas
  • Base de datos de estructura de proteínas
  • PDBREPORT enumera todas las anomalías (también errores) en las estructuras de PDB
  • PDBsum: extrae datos de otras bases de datos sobre estructuras de PDB
  • Proteopedia: una enciclopedia colaborativa en 3D de proteínas y otras moléculas

Referencias [ editar ]

  1. ^ wwPDB, Consorcio (2019). "Protein Data Bank: el archivo global único para datos de estructura macromolecular 3D" . Ácidos nucleicos Res . 47 (D1): 520–528. doi : 10.1093 / nar / gky949 . PMC 6324056 . PMID 30357364 .  
  2. ^ a b "PDBe hogar <Nodo <EMBL-EBI" . pdbe.org .
  3. ^ a b "Banco de datos de proteínas Japón - PDB Japón - PDBj" . pdbj.org .
  4. ^ Banco, datos de proteínas RCSB. "RCSB PDB: Página de inicio" . rcsb.org .
  5. ^ a b "Banco de resonancia magnética biológica" . bmrb.wisc.edu .
  6. ^ Berman, HM (enero de 2008). "El banco de datos de proteínas: una perspectiva histórica" (PDF) . Acta Crystallographica Sección A . A64 (1): 88–95. doi : 10.1107 / S0108767307035623 . PMID 18156675 .  
  7. ^ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (diciembre de 1997). "PDBsum: una base de datos basada en web de resúmenes y análisis de todas las estructuras de PDB". Trends Biochem. Sci . 22 (12): 488–90. doi : 10.1016 / S0968-0004 (97) 01140-7 . PMID 9433130 . 
  8. ^ Meyer EF (1997). "Los primeros años del Protein Data Bank" . Ciencia de las proteínas . Prensa de la Universidad de Cambridge. 6 (7): 1591-1597. doi : 10.1002 / pro.5560060724 . PMC 2143743 . PMID 9232661 .  
  9. ^ "Banco de datos de proteínas". Nature New Biology . 1971. doi : 10.1038 / newbio233223b0 .
  10. ^ Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (enero de 2000). "El banco de datos de proteínas" . Ácidos nucleicos Res . 28 (1): 235–242. doi : 10.1093 / nar / 28.1.235 . PMC 102472 . PMID 10592235 .  
  11. ^ "Colaborador de investigación para la bioinformática estructural" . RCSB.org . Colaborador de Investigación en Bioinformática Estructural. Archivado desde el original el 5 de febrero de 2007.
  12. ^ "Archivo de boletines de RCSB PDB" . Banco de datos de proteínas RCSB.
  13. ^ Curry E, Freitas A, O'Riáin S (2010). "El papel de la conservación de datos impulsada por la comunidad para las empresas" . En D. Wood (ed.). Vinculación de datos empresariales . Boston: Springer EE. UU. págs. 25–47. ISBN 978-1-441-97664-2.
  14. ^ "Suite de validación de PDB" . sw-tools.pdb.org .
  15. ^ Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD, et al. (consorcio wwPDB) (enero de 2019). "Protein Data Bank: el archivo global único para datos de estructura macromolecular 3D" . Investigación de ácidos nucleicos . 47 (D1): D520 – D528. doi : 10.1093 / nar / gky949 . PMC 6324056 . PMID 30357364 .  
  16. ^ "Desglose de las tenencias actuales de PDB" . RCSB.
  17. ^ "El servidor de densidad de electrones de Uppsala" . Universidad de Uppsala . Consultado el 6 de abril de 2013 .
  18. ^ Kleywegt GJ, Harris MR, Zou JY, Taylor TC, Wählby A, Jones TA (diciembre de 2004). "El servidor de densidad electrónica de Uppsala" . Acta Crystallogr D . 60 (Pt 12 Pt 1): 2240–2249. doi : 10.1107 / S0907444904013253 . PMID 15572777 . 
  19. ^ Anon (2014). "Datos duros: no ha sido poca cosa para el Protein Data Bank seguir siendo relevante para 100.000 estructuras" . Naturaleza . 509 (7500): 260. doi : 10.1038 / 509260a . PMID 24834514 . 
  20. ^ "Informe de crecimiento de contenido" . RCSB PDB. Archivado desde el original el 28 de abril de 2007 . Consultado el 6 de abril de 2013 .
  21. ^ "wwPDB: formatos de archivo y PDB" . wwpdb.org . Consultado el 1 de abril de 2020 .
  22. ^ wwPDB.org. "wwPDB: Noticias de 2019" . wwpdb.org .
  23. ^ Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (abril de 2005). "PDBML: la representación de datos de estructura macromolecular de archivo en XML" . Bioinformática . 21 (7): 988–992. doi : 10.1093 / bioinformatics / bti082 . PMID 15509603 . 
  24. ^ "Navegador ICM" . Molsoft LLC . Consultado el 6 de abril de 2013 .
  25. ^ "Visor de PDB suizo" . Instituto Suizo de Bioinformática . Consultado el 6 de abril de 2013 .
  26. ^ "ESTRELLA: Bioquímica - Inicio" . web.mit.edu .
  27. ^ "VisProt3DS" . Molecular Systems Ltd . Consultado el 6 de abril de 2013 .

Enlaces externos [ editar ]

  • Banco mundial de datos de proteínas (wwPDB) : sitio principal para hosts regionales (a continuación)
    • Banco de datos de proteínas RCSB (EE. UU.)
    • PDBe (Europa)
    • PDBj (Japón)
    • BMRB, Banco de datos de resonancia magnética biológica (EE. UU.)
  • wwPDB Documentation: documentación en los formatos de archivo PDB y PDBML
  • Observando las estructuras: la introducción de la RCSB a la cristalografía
  • Página de inicio de PDBsum: extrae datos de otras bases de datos sobre estructuras de PDB.
  • Base de datos de ácidos nucleicos, NDB: un espejo de PDB especialmente para buscar ácidos nucleicos
  • Tutorial introductorio de PDB patrocinado por PDB
  • PDBe: recorrido rápido en tren EBI en línea