En biología , una base de datos de estructura de proteínas es una base de datos que se modela en torno a las diversas estructuras de proteínas determinadas experimentalmente . El objetivo de la mayoría de las bases de datos de estructura de proteínas es organizar y anotar las estructuras de proteínas, proporcionando a la comunidad biológica acceso a los datos experimentales de una manera útil. Los datos incluidos en las bases de datos de estructuras de proteínas a menudo incluyen coordenadas tridimensionales, así como información experimental, como las dimensiones de las celdas unitarias y los ángulos para la cristalografía de rayos Xestructuras determinadas. Aunque la mayoría de los casos, en este caso las proteínas o las determinaciones de una estructura específica de una proteína, también contienen información de secuencia y algunas bases de datos incluso proporcionan medios para realizar consultas basadas en secuencias, el atributo principal de una base de datos de estructura es la información estructural, mientras que las bases de datos de secuencia se centran en secuencia de información y no contienen información estructural para la mayoría de las entradas. Las bases de datos de estructura de proteínas son fundamentales para muchos esfuerzos en biología computacional , como el diseño de fármacos basado en la estructura , tanto para desarrollar los métodos computacionales utilizados como para proporcionar un gran conjunto de datos experimentales utilizados por algunos métodos para proporcionar información sobre la función de una proteína. [1]
El banco de datos de proteínas
El Protein Data Bank (PDB) se estableció en 1971 como el archivo central de todos los datos de estructura de proteínas determinados experimentalmente. Hoy en día, el PDB es mantenido por un consorcio internacional conocido colectivamente como el Banco Mundial de Datos de Proteínas (wwPDB). La misión de wwPDB es mantener un archivo único de datos estructurales macromoleculares que esté disponible de forma gratuita y pública para la comunidad global. [2] [3]
Lista de otras bases de datos de estructura de proteínas
Debido a que la PDB libera datos al dominio público , los datos se han utilizado en varias otras bases de datos de estructura de proteínas.
Los ejemplos de bases de datos de estructura de proteínas incluyen (en orden alfabético);
- Base de datos de movimientos macromoleculares
- describe los movimientos que ocurren en proteínas y otras macromoléculas, particularmente usando películas
- Dynameomics
- un almacén de datos de simulaciones de dinámica molecular y análisis de proteínas que representan todas las familias de pliegues de proteínas conocidas
- JenaLib
- la Biblioteca de Macromoléculas Biológicas de Jena tiene como objetivo una mejor difusión de la información sobre estructuras de biopolímeros tridimensionales con énfasis en la visualización y el análisis.
- ModBase
- una base de datos de modelos de proteínas tridimensionales calculados mediante modelos comparativos
- OCA
- una base de datos de navegador para la estructura / función de las proteínas: el OCA integra información de KEGG , OMIM , PDBselect , Pfam , PubMed , SCOP , SwissProt y otros.
- OPM
- proporciona posiciones espaciales de estructuras tridimensionales de proteínas con respecto a la bicapa lipídica .
- PDB Lite
- derivado de OCA, PDB Lite se proporcionó para que sea lo más fácil posible encontrar y ver una macromolécula dentro del PDB
- PDBsum
- proporciona una descripción general de las estructuras macromoleculares en el PDB, proporcionando diagramas esquemáticos de las moléculas en cada estructura y de las interacciones entre ellas
- PDBTM
- el Protein Data Bank of Transmembrane Proteins - una selección del PDB.
- PDBWiki
- una base de conocimientos anotada por la comunidad sobre estructuras moleculares biológicas [1]
- ProtCID
- La base de datos de interfaz común de proteínas ( ProtCID ) es una base de datos de interfaces proteína-proteína similares en estructuras cristalinas de proteínas homólogas.
- Proteína
- la base de datos de proteínas de los NIH , una colección de secuencias de varias fuentes, incluidas las traducciones de las regiones de codificación anotadas en GenBank , RefSeq y Third Party Annotation , así como registros de SwissProt , PIR , PRF y PDB
- Proteopedia
- la enciclopedia colaborativa en 3D de proteínas y otras moléculas. Una wiki que contiene una página para cada entrada en el PDB (> 100.000 páginas), con una vista de Jmol que destaca los sitios y ligandos funcionales. Ofrece una herramienta de creación de escenas fácil de usar para que no tenga que aprender el lenguaje de escritura Jmol para crear escenas moleculares personalizadas. Las escenas personalizadas se adjuntan fácilmente a "enlaces verdes" en texto descriptivo que muestran esas escenas en Jmol.
- ProteínaSalón
- una base de datos de proteínas que incluye imágenes de la estructura de las proteínas. Además, incluye rutas de proteínas y secuencias de genes, incluidas otras herramientas.
- SCOP
- la clasificación estructural de proteínas [2] una descripción detallada y completa de las relaciones estructurales y evolutivas entre todas las proteínas cuya estructura se conoce.
- Repositorio SWISS-MODEL
- una base de datos de modelos de proteínas anotadas calculadas mediante modelos de homología
- TOPSAN
- Open Protein Structure Annotation Network: una wiki diseñada para recopilar, compartir y distribuir información sobre estructuras tridimensionales de proteínas.
Referencias
- ^ Laskowski, RA (2011). "Bases de datos de estructura de proteínas". Mol Biotechnol . 48 (2): 183–98. doi : 10.1007 / s12033-010-9372-4 . PMID 21225378 . S2CID 45184564 .
- ^ Berman, HM (enero de 2008). "El banco de datos de proteínas: una perspectiva histórica" (PDF) . Acta Crystallographica Sección A . A64 (1): 88–95. doi : 10.1107 / S0108767307035623 . PMID 18156675 .
- ^ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (diciembre de 1997). "PDBsum: una base de datos basada en web de resúmenes y análisis de todas las estructuras de PDB". Trends Biochem. Sci . 22 (12): 488–90. doi : 10.1016 / S0968-0004 (97) 01140-7 . PMID 9433130 .