PubChem


PubChem es una base de datos de moléculas químicas y sus actividades frente a ensayos biológicos . El sistema es mantenido por el Centro Nacional de Información Biotecnológica (NCBI), un componente de la Biblioteca Nacional de Medicina , que forma parte de los Institutos Nacionales de Salud de los Estados Unidos (NIH). Se puede acceder a PubChem de forma gratuita a través de una interfaz de usuario web . Millones de estructuras compuestas y conjuntos de datos descriptivos se pueden descargar gratuitamente a través de FTP. PubChem contiene múltiples descripciones de sustancias y moléculas pequeñas con menos de 100 átomos y 1000 enlaces. Más de 80 proveedores de bases de datos contribuyen a la creciente base de datos de PubChem. [2]

PubChem se lanzó en 2004 como componente del Programa de Bibliotecas Moleculares (MLP) del NIH. En noviembre de 2015, PubChem contiene más de 150 millones de descripciones de sustancias proporcionadas por los depositantes, 60 millones de estructuras químicas únicas y 225 millones de resultados de pruebas de actividad biológica (de más de 1 millón de experimentos de ensayo realizados en más de 2 millones de moléculas pequeñas que cubren casi 10.000 especies únicas). secuencias de proteínas diana que corresponden a más de 5.000 genes). También contiene ensayos de detección de interferencia de ARN (ARNi) que se dirigen a más de 15.000 genes. [3]

En agosto de 2018, PubChem contiene 247,3 millones de descripciones de sustancias y 96,5 millones de estructuras químicas únicas, aportadas por 629 fuentes de datos de 40 países. También contiene 237 millones de resultados de pruebas de bioactividad de 1,25 millones de ensayos biológicos, que cubren más de 10.000 secuencias de proteínas diana. [4]

A partir de 2020, con la integración de datos de más de 100 fuentes nuevas, PubChem contiene más de 293 millones de descripciones de sustancias proporcionadas por los depositantes, 111 millones de estructuras químicas únicas y 271 millones de puntos de datos de bioactividad de 1,2 millones de experimentos de ensayos biológicos. [5]

PubChem consta de tres bases de datos primarias que crecen dinámicamente. A partir del 5 de noviembre de 2020 (el número de bioensayos no ha cambiado):

Es posible buscar en las bases de datos una amplia gama de propiedades, incluida la estructura química, los fragmentos de nombres, la fórmula química , el peso molecular , XLogP y el recuento de donantes y aceptoresde enlaces de hidrógeno .