Colección de base de datos BioCyc


La colección de la base de datos BioCyc es una variedad de bases de datos de vías / genomas (PGDB) específicas de organismos que brindan referencia a la información del genoma y las vías metabólicas de miles de organismos. [1] En junio de 2021, había más de 17.800 bases de datos dentro de BioCyc. SRI International , [2] con sede en Menlo Park, California, mantiene la familia de bases de datos BioCyc.

Nivel 1: Bases de datos que han recibido al menos un año de curación manual basada en literatura. Actualmente hay siete bases de datos en el Nivel 1. De las siete, MetaCyc es una base de datos importante que contiene casi 2500 vías metabólicas de muchos organismos. [1] [3] La otra base de datos importante de Nivel 1 es HumanCyc, que contiene alrededor de 300 vías metabólicas que se encuentran en los seres humanos. [4] Las cinco bases de datos restantes incluyen EcoCyc ( E. coli ), [5] AraCyc ( Arabidopsis thaliana ), YeastCyc ( Saccharomyces cerevisiae ), LeishCyc ( Leishmania major Friedlin ) y TrypanoCyc ( Trypanosoma brucei ).

Nivel 2: Bases de datos que se predijeron computacionalmente pero que recibieron una curación manual moderada (la mayoría con una curación de 1 a 4 meses). Las bases de datos de nivel 2 están disponibles para su curación manual por parte de científicos interesados ​​en cualquier organismo en particular. Las bases de datos de nivel 2 contienen actualmente 43 bases de datos de organismos diferentes.

Nivel 3: Bases de datos que fueron pronosticadas computacionalmente por PathoLogic y no recibieron curación manual. Al igual que con el Nivel 2, las bases de datos del Nivel 3 también están disponibles para que los científicos interesados ​​las conserven.

El sitio web de BioCyc contiene una variedad de herramientas de software para buscar, visualizar, comparar y analizar información sobre el genoma y la vía. Incluye un navegador de genoma y navegadores para redes metabólicas y reguladoras . El sitio web también incluye herramientas para pintar conjuntos de datos a gran escala ("ómicos") en redes metabólicas y reguladoras, y en el genoma.

Dado que la familia de bases de datos BioCyc comprende una larga lista de bases de datos específicas de organismos y también datos en diferentes niveles de sistemas en un sistema vivo, el uso en la investigación se ha realizado en una amplia variedad de contextos. Aquí, se destacan dos estudios que muestran dos variedades diferentes de usos, uno en una escala de genoma y otro en la identificación de SNP específicos ( polimorfismos de nucleótido único ) dentro de un genoma.