combrex


COMBREX es un proyecto multifacético que incluye una base de datos de anotaciones genéticas, predicciones funcionales y recomendaciones basadas en principios de Aprendizaje Activo asociados con millones de genes en genomas procarióticos . [1]

COMBREX es un proyecto multifacético que tiene como objetivo reunir a las comunidades computacionales y experimentales de biólogos con el interés de mejorar nuestra comprensión de la función de los genes microbianos y acelerar la anotación de la función de los genes microbianos. El proyecto COMBREX fue cofundado por Simon Kasif, Richard Roberts y Martin Steffen como un consorcio internacional con sede en la Universidad de Boston y más de 100 colaboradores experimentales y computacionales. El proyecto se inspiró en un llamado a la acción comunitaria publicado en PLoS Biology por Richard J. Roberts.

Esta base de datos en evolución consta de funciones determinadas experimentalmente y predichas computacionalmente para más de tres millones de genes microbianos. La búsqueda de un gen o genes de interés puede ser un fin en sí mismo, o puede ser un primer paso para contribuir con información o solicitar una subvención de COMBREX. Actualmente, la base de datos consta de genes de más de 1.000 genomas de bacterias y arqueas completamente secuenciados, complementados con una serie de genes individuales cuya función bioquímica se ha determinado experimentalmente. Los genes están organizados en grupos de secuencia similar y probablemente isofuncionales determinados por el NCBI, denominados grupos de proteínas.

Se utiliza un sistema de codificación de colores para identificar qué genes tienen funciones determinadas experimentalmente, cuáles tienen funciones predichas computacionalmente y cuáles no tienen ninguna función conocida o predicha (información) . Por necesidad, las "funciones previstas" pueden abarcar una amplia gama de especificidad, y uno de nuestros objetivos a más largo plazo es cuantificar esta especificidad. (Por ejemplo, la función predicha "valina descarboxilasa" es significativamente más específica y más fácilmente verificable que la "liasa" o incluso la "carboxilasa").

La identificación de genes cuyos productos han sido verificados experimentalmente tampoco es una tarea trivial, por lo que nos hemos embarcado en un proyecto para crear un conjunto completo y seleccionado manualmente de todos esos genes, al que nos referimos como Gold Standard Gene Database . Este conjunto seleccionado es actualmente exclusivo de la base de datos COMBREX y los genes que le pertenecen están codificados por colores con un símbolo dorado.

La base de datos COMMBREX sirve como lugar para que los biólogos computacionales publiquen sus predicciones de funciones genéticas más informativas. Un esfuerzo importante dentro del campo de la bioinformática ha sido la predicción computacional de la función genética. Ha habido avances significativos en este campo durante la última década, pero muchos de estos esfuerzos no han aprovechado todo su potencial para avanzar en el conocimiento biológico debido al hecho de que las predicciones rara vez se prueban experimentalmente y las funciones predichas para genes individuales se realizan mediante competencia. Los métodos rara vez se comparan directamente.