La base de datos del genoma de Saccharomyces ( SGD ) es una base de datos científica de la biología molecular y la genética de la levadura Saccharomyces cerevisiae , que se conoce comúnmente como levadura de panadería o en ciernes. [1]
Desarrollador (es) | J Michael Cherry , Gail Binkley , Stacia Engel , Rob Nash , Stuart Miyasato , Edith Wong , Shuai Weng |
---|---|
Sistema operativo | Unix , Mac , MS-Windows |
Tipo | Herramienta de bioinformática, base de datos de organismos modelo |
Licencia | Libre |
Sitio web | http://www.yeastgenome.org |
Base de datos del genoma de Saccharomyces
El SGD proporciona acceso a Internet a la secuencia completa de ADN genómico de Saccharomyces cerevisiae , sus genes y sus productos, los fenotipos de sus mutantes y la literatura que respalda estos datos. En el informe de la literatura revisada por pares, los resultados del experimento sobre la función y la interacción de los genes de levadura se extraen mediante una curación manual de alta calidad y se integran en una base de datos bien desarrollada. Los datos se combinan con resultados de calidad de alto rendimiento y se publican en las páginas de resumen de locus, que es un potente motor de consulta y un rico navegador de genoma. En función de la complejidad de la recopilación de información, se utilizan múltiples herramientas bioinformáticas para integrar información y permitir el descubrimiento productivo de nuevos detalles biológicos. [2] El recurso de SGD proporciona el estándar de oro para la descripción funcional de la levadura en ciernes. El recurso SGD también proporciona una plataforma desde la cual investigar genes y vías relacionados en organismos superiores. La cantidad de información y el número de características proporcionadas por SGD han aumentado enormemente tras la liberación de la secuencia genómica de S. cerevisiae . SGD ayuda a los investigadores al proporcionar no solo información básica, sino también herramientas como la búsqueda de similitudes de secuencias que conducen a información detallada sobre las características del genoma y las relaciones entre los genes. SGD presenta información utilizando una variedad de pantallas gráficas creadas dinámicamente y fáciles de usar que ilustran mapas de características físicas, genéticas y de secuencia. Todos los datos en SGD son de libre acceso para investigadores y educadores de todo el mundo a través de páginas web diseñadas para una facilidad de uso óptima. [2]
Recopilación de información
Biocurador incluye la revisión de la literatura publicada o conjuntos de datos, lo que lleva a la identificación y abstracción de resultados clave. Luego, el resultado se incorpora a la base de datos y se utilizan vocabularios controlados para asociarlos con genes o regiones cromosómicas apropiadas. A medida que se registran más datos, la biocuración se vuelve más importante para la investigación biomédica.
SGD mantiene la secuencia del genoma de referencia para la levadura en ciernes S. cerevisiae . Los SGD son la fuente de la secuencia del genoma del fondo de la cepa S. cerevisiae S288C, incluye el catálogo de genes y la característica cromosómica del genoma.
Una de las funciones importantes de SGD es la biocuración de la literatura sobre levaduras. Los biocuradores de SGD buscan toda la literatura científica que sea relevante para S. cerevisiae , leen los artículos y capturan sus principales hallazgos en varios campos definidos de la base de datos. [2]
Los biocuradores de SGD tienen como objetivo anotar cada gen mediante la identificación de funciones de la literatura primaria y la vinculación a términos utilizando la representación del conocimiento estructurado en la ontología genética . [3] Además, las funciones identificadas a partir de experimentos de alto rendimiento, así como las anotaciones de funciones predichas computacionalmente, se incluyen en el proyecto GO Annotation. [4]
Las vías bioquímicas son seleccionadas manualmente por SGD y proporcionadas mediante el navegador Pathway Tools versión 15.0 (13). El conjunto de datos de vías bioquímicas SGD para S. cerevisiae, uno de los conjuntos de datos más cuidadosamente seleccionados entre todos los conjuntos de datos de Pathway Tools disponibles, es el estándar de oro para la levadura en gemación; SGD apoya un esfuerzo continuo para actualizar y mejorar estos datos. La interfaz Pathway Tools proporciona una descripción completa de cada ruta, con estructuras moleculares, números de CE y una lista de referencias completa. El navegador de rutas actualizado proporciona varias características mejoradas, incluida la descarga de una lista de genes encontrados en una ruta para su análisis adicional con otras herramientas disponibles en SGD. El navegador de rutas tiene un hipervínculo a través de la sección 'Rutas' de la página Resumen de locus. La pantalla Pathway está disponible en http://pathway.yeastgenome.org . [2]
Nomenclatura
SGD continúa manteniendo la nomenclatura genómica de S. cerevisiae . El trabajo consiste en promover los estándares de nomenclatura definidos por la comunidad y garantizar que se sigan las pautas acordadas para nombrar nuevos genes o asignar nuevos nombres a genes previamente identificados. Las pautas comunitarias establecen que el primer nombre publicado para un gen se convierte en el nombre estándar. Sin embargo, antes de la publicación, el nombre de un gen puede registrarse y mostrarse en SGD para notificar a la comunidad sobre su uso previsto. Si hay desacuerdos o conflictos de nombres, nos comunicamos con los investigadores relevantes dentro de la comunidad y negociamos un acuerdo siempre que sea posible. La mayoría de los que trabajan en el gen en cuestión deben aceptar cualquier cambio de nomenclatura antes de que se implemente en SGD. Además de mantener los nombres genéticos, SGD garantiza que los nombres de los ORF, los elementos ARS, los ARNt y otras características cromosómicas también se ajusten a los formatos acordados. En los últimos dos años se han asignado 154 nuevos nombres de genes y se han procesado 21 cambios de nombre iniciados por la comunidad. [2]
Métodos de análisis
Hay varias herramientas de análisis diferentes proporcionadas por SGD.
BLAST , B ASIC L ocal A lignment S earch T ool, el programa está diseñado para encontrar regiones similares entre las secuencias biológicas. SGD permite a los usuarios ejecutar búsquedas BLAST de conjuntos de datos de secuencias de S. cerevisiae .
Fungal BLAST permite búsquedas entre múltiples secuencias de hongos
El Buscador de términos de Ontología genética (GO) busca términos GO compartidos importantes o sus padres, y se utiliza para describir los genes consultados para ayudar a los usuarios a descubrir qué tienen en común el gen.
GO Slim Mapper mapea las anotaciones de un grupo de genes en términos más generales y / o las agrupa en categorías amplias.
Pattern Matching es un recurso que permite a los usuarios buscar secuencias cortas de nucleótidos o péptidos de menos de 20 residuos, o patrones ambiguos / degenerados.
El análisis de restricción permite a los usuarios realizar un análisis de restricción ingresando un nombre de secuencia o una secuencia de ADN arbitraria [5]
Referencias
- ^ Cherry JM; Bola C; Weng S; Juvik G; Schmidt R; Adler C; Dunn B; Dwight S; Riles L; Mortimer RK; Botstein D (mayo de 1997). "Mapas genéticos y físicos de Saccharomyces cerevisiae" . Naturaleza . 387 (6632 Suppl): 67–73. doi : 10.1038 / 387s067 . PMC 3057085 . PMID 9169866 .
- ^ a b c d e Cherry, Michael; Hong, Eurie; amundsen, Craig; balakrishnan, rama; binkley, gail; chan, esther; christie, karen; costanzo, maria; dwight, selina; engel, stacia; fisk, dianna; hirschman, jodi; hitz, benjamin; karra, kalpana; krieger, cynthia; miyasato, stuart; nash, robar; parque, julie; skrzypek, marek; simison, mate; weng, shuai; wong, edith (2011). "Base de datos del genoma de Saccharomyces: el recurso genómico de la levadura en ciernes" . Investigación de ácidos nucleicos . 40 (2012): D700 – D705. doi : 10.1093 / nar / gkr1029 . PMC 3245034 . PMID 22110037 .
- ^ Dwight SS, Harris MA, Dolinski K y col. (Enero de 2002). "La base de datos del genoma de Saccharomyces (SGD) proporciona una anotación de genes secundarios utilizando la Ontología de genes (GO)" . Ácidos nucleicos Res . 30 (1): 69–72. doi : 10.1093 / nar / 30.1.69 . PMC 99086 . PMID 11752257 .
- ^ Hong EL, Balakrishnan R, Dong Q, et al. (Enero de 2008). "Anotaciones de Ontología Genética en SGD: nuevas fuentes de datos y métodos de anotación" . Ácidos nucleicos Res . 36 (Problema de la base de datos): D577–81. doi : 10.1093 / nar / gkm909 . PMC 2238894 . PMID 17982175 .
- ^ "Base de datos del genoma de Saccharomyces" . Base de datos del genoma de Saccharomyces . Universidad de Stanford . Consultado el 26 de abril de 2018 .
enlaces externos
- Base de datos del genoma de Saccharomyces