El formato de archivo del Protein Data Bank (pdb) es un formato de archivo textual que describe las estructuras tridimensionales de las moléculas contenidas en el Protein Data Bank . Por consiguiente, el formato pdb proporciona la descripción y la anotación de las estructuras de proteínas y ácidos nucleicos, incluidas las coordenadas atómicas, las asignaciones de estructuras secundarias, así como la conectividad atómica. Además, se almacenan metadatos experimentales. El formato PDB es el formato de archivo heredado del Protein Data Bank que ahora mantiene datos sobre macromoléculas biológicas en el formato de archivo mmCIF más nuevo .
Extensión de nombre de archivo | .pdb , .ent , .brk |
---|---|
Tipo de medio de Internet | químico / x-pdb |
Tipo de formato | formato de archivo químico |
Historia
El formato de archivo PDB se inventó en 1976 como un archivo legible por humanos que permitiría a los investigadores intercambiar coordenadas de proteínas a través de un sistema de base de datos. Su formato de ancho de columna fijo está limitado a 80 columnas, que se basó en el ancho de las tarjetas perforadas de computadora que se usaban anteriormente para intercambiar las coordenadas. [1] A lo largo de los años, el formato de archivo ha sufrido muchos cambios y revisiones. Al 13 de julio de 2011[actualizar], la revisión más reciente es 3.30. [2]
Ejemplo
Un archivo PDB típico que describe una proteína consta de cientos o miles de líneas como las siguientes (tomadas de un archivo que describe la estructura de un péptido sintético similar al colágeno ):
ENCABEZADO MATRIZ EXTRACELULAR 22-ENE-98 1A3ITÍTULO DETERMINACIÓN CRISTALOGRÁFICA POR RAYOS X DE UN COLÁGENOTÍTULO 2 PÉPTIDO CON LA SECUENCIA REPETIDA (PRO-PRO-GLY)...DIFRACCIÓN DE RAYOS X EXPDTAAUTOR RZKRAMER, L.VITAGLIANO, J.BELLA, R.BERISIO, L.MAZZARELLA,AUTOR 2 B.BRODSKY, A.ZAGARI, HMBERMAN...OBSERVACIÓN 350 BIOMOLÉCULA: 1OBSERVACIÓN 350 APLICAR LO SIGUIENTE A LAS CADENAS: A, B, COBSERVACIÓN 350 BIOMT1 1 1.000000 0.000000 0.000000 0.00000OBSERVACIÓN 350 BIOMT2 1 0.000000 1.000000 0.000000 0.00000...SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLYSEQRES 1 B 6 PRO PRO GLY PRO PRO GLYSEQRES 1 C 6 PRO GLY PRO PRO GLY...ATOM 1 N PRO A 1 8.316 21.206 21.530 1.00 17.44 NATOM 2 CA PRO A 1 7.608 20.729 20.336 1.00 17.44 CATOM 3 C PRO A 1 8.487 20.707 19.092 1.00 17.44 CATOM 4 O PRO A 1 9.466 21.457 19.005 1.00 17.44 OATOM 5 CB PRO A 1 6.460 21.723 20.211 1.00 22.26 C...HETATM 130 C ACY 401 3.682 22.541 11.236 1.00 21.19 CHETATM 131 O ACY 401 2.807 23.097 10.553 1.00 21.19 OHETATM 132 OXT ACY 401 4.306 23.101 12.291 1.00 21.19 O...
- Registros HEADER, TITLE y AUTHOR
- proporcionar información sobre los investigadores que definieron la estructura; Hay muchos otros tipos de registros disponibles para proporcionar otros tipos de información.
- Registros de OBSERVACIONES
- pueden contener anotaciones de forma libre, pero también contienen información estandarizada; por ejemplo, los
REMARK 350 BIOMT
registros describen cómo calcular las coordenadas del multímero observado experimentalmente a partir de las de los especificados explícitamente de una sola unidad repetida. - Registros SEQRES
- proporcione las secuencias de las tres cadenas de péptidos (denominadas A, B y C), que en este ejemplo son muy cortas pero que suelen abarcar varias líneas.
- Registros ATOM
- describir las coordenadas de los átomos que forman parte de la proteína. Por ejemplo, la primera línea de ATOM anterior describe el átomo alfa-N del primer residuo de la cadena peptídica A, que es un residuo de prolina; los primeros tres números de coma flotante son sus coordenadas x, y, z y están en unidades de Ångströms . [3] Las siguientes tres columnas son la ocupación, el factor de temperatura y el nombre del elemento, respectivamente.
- Registros HETATM
- describen coordenadas de heteroátomos, es decir, aquellos átomos que no forman parte de la molécula de proteína.
Software de visualización molecular capaz de mostrar archivos PDB
Ver también
- Formato de archivo químico
- ScientificPython : proporciona una interfaz para Python
- Software para modelado de mecánica molecular
Referencias
- ^ Berman, Helen M. "El banco de datos de proteínas: una perspectiva histórica". Acta Crystallographica Sección A 64.1 (2007): 88-95.
- ^ "Formato de entrada de coordenadas atómicas versión 3.3" . wwPDB. Julio de 2011.
- ^ "Formato wwPDB versión 3.3: Sección de coordenadas" . Archivado desde el original el 28 de febrero de 2012 . Consultado el 23 de marzo de 2012 .
enlaces externos
- Guía de formato PDB Esta es la versión actual (3.3) de la especificación de formato PDB.
- PDBML Un formato de archivo alternativo más reciente basado en XML para coordenadas moleculares.
- El banco de datos de proteínas RCSB
- Banco de datos de proteínas en Europa
- La base de datos de modelado molecular (MMDB) de NCBI
- El proyecto de remediación de wwPDB de wwPDB
- MakeMultimer Una herramienta en línea para expandir registros BIOMT en archivos pdb
- Aplicación Molecules para iPad / iPhone para mostrar archivos PDB
- Biblioteca macromolecular de Python (mmLib) : una biblioteca de Python capaz de leer y escribir formatos de archivo PDB