Banco de datos de red de objetos biomoleculares


El banco de datos Biomolecular Object Network es un banco de datos bioinformático que contiene información sobre estructuras e interacciones de moléculas pequeñas . El banco de datos integra una serie de bases de datos existentes para proporcionar una descripción general completa de la información actualmente disponible para una molécula determinada.

La Iniciativa Blueprint comenzó como un programa de investigación en el laboratorio del Dr. Christopher Hogue en el Instituto de Investigación Samuel Lunenfeld en el Hospital Mount Sinai en Toronto . El 14 de diciembre de 2005, Unleashed Informatics Limited adquirió los derechos comerciales de la propiedad intelectual de The Blueprint Initiative . Esto incluía derechos sobre la base de datos de interacción de proteínas BIND, la base de datos de interacción de moléculas pequeñas SMID, así como el almacén de datos SeqHound. Unleashed Informatics es un proveedor de servicios de gestión de datos y supervisa la gestión y conservación de The Blueprint Initiative bajo la dirección del Dr. Hogue. [1]

BOND integra las bases de datos originales de Blueprint Initiative, así como otras bases de datos, como Genbank , combinadas con muchas herramientas necesarias para analizar estos datos. También se encuentran disponibles enlaces de anotación para secuencias, incluidos identificadores de taxón, secuencias redundantes, descripciones de ontología genética , identificadores de herencia mendeliana en línea en el hombre , dominios conservados , referencias cruzadas de bases de datos, identificadores LocusLink y genomas completos. BOND facilita las consultas entre bases de datos y es un recurso de acceso abierto que integra interacción y secuencia de datos. [2]

La base de datos de interacciones de moléculas pequeñas es una base de datos que contiene interacciones entre dominios de proteínas y moléculas pequeñas. Utiliza un enfoque basado en dominios para identificar familias de dominios, que se encuentran en la base de datos de dominios conservados (CDD), que interactúan con una pequeña molécula de consulta. El CDD de NCBI amalgama datos de varias fuentes diferentes; Protein FAMilies (PFAM), Herramienta de investigación de arquitectura modular simple (SMART), Grupo de genes ortólogos(COG) y las secuencias seleccionadas por el propio NCBI. Los datos en SMID se derivan del Protein Data Bank (PDB), una base de datos de estructuras cristalinas de proteínas conocidas. Se puede consultar SMID ingresando una proteína GI, identificador de dominio, ID de PDB o ID de SMID. Los resultados de una búsqueda proporcionan información sobre moléculas pequeñas, proteínas y dominios para cada interacción identificada en la base de datos. Las interacciones con contactos no biológicos normalmente se eliminan de forma predeterminada.

SMID-BLAST es una herramienta desarrollada para anotar sitios de unión conocidos de moléculas pequeñas, así como para predecir sitios de unión en proteínas cuyas estructuras cristalinasaún no se han determinado. La predicción se basa en la extrapolación de interacciones conocidas, que se encuentran en el PDB, a interacciones entre una proteína no cristalizada con una pequeña molécula de interés. SMID-BLAST se validó frente a un conjunto de pruebas de interacciones de moléculas pequeñas conocidas del PDB. Se demostró que es un predictor preciso de las interacciones proteína-molécula pequeña; El 60% de las interacciones predichas coincidían de forma idéntica con el sitio de unión anotado de PDB, y de estas, el 73% tenía más del 80% de los residuos de unión de la proteína correctamente identificados. Hogue, C y col. estimó que el 45% de las predicciones que no se observaron en los datos de la AP representan de hecho verdaderos positivos. [3]


Figura 1: Captura de pantalla de los resultados de la secuencia obtenidos con BOND