De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La ontología de genes ( GO ) es una de las principales bioinformática iniciativa para unificar la representación de los genes y productos de genes atributos en todas las especies . [1] Más específicamente, el proyecto tiene como objetivo: 1) mantener y desarrollar su vocabulario controlado de genes y atributos de productos genéticos; 2) anotar genes y productos génicos y asimilar y difundir datos de anotaciones; y 3) proporcionar herramientas para acceder fácilmente a todos los aspectos de los datos proporcionados por el proyecto y permitir la interpretación funcional de los datos experimentales utilizando el GO, por ejemplo, mediante análisis de enriquecimiento. [2] [3]GO es parte de un esfuerzo de clasificación más grande, Open Biomedical Ontologies , siendo uno de los miembros candidatos iniciales de OBO Foundry . [4]

Mientras que la nomenclatura de genes se centra en genes y productos de genes, la Ontología de genes se centra en la función de los genes y los productos de genes. El GO también amplía el esfuerzo mediante el uso de lenguaje de marcado para hacer que los datos (no solo de los genes y sus productos, sino también de los atributos seleccionados) sean legibles por máquina , y hacerlo de una manera unificada en todas las especies (mientras que las convenciones de nomenclatura de genes varían según el taxón biológico ).

Términos y ontología [ editar ]

Desde un punto de vista práctico, una ontología es una representación de algo que conocemos. Las "ontologías" consisten en representaciones de cosas que son detectables o directamente observables, y las relaciones entre esas cosas. No existe una terminología estándar universal en biología y dominios relacionados, y los usos de los términos pueden ser específicos de una especie, área de investigación o incluso un grupo de investigación en particular. Esto dificulta la comunicación y el intercambio de datos. El proyecto Gene Ontology proporciona una ontología de términos definidos que representan las propiedades del producto genético . La ontología cubre tres dominios:

Cada término de GO dentro de la ontología tiene un nombre de término, que puede ser una palabra o una cadena de palabras; un identificador alfanumérico único; una definición con las fuentes citadas; y una ontología que indica el dominio al que pertenece. Los términos también pueden tener sinónimos, que se clasifican como exactamente equivalentes al término nombre, más amplio, más restringido o relacionado; referencias a conceptos equivalentes en otras bases de datos; y comentarios sobre el significado o uso del término. La ontología GO está estructurada como un gráfico acíclico dirigido , y cada término tiene relaciones definidas con uno o más términos en el mismo dominio y, a veces, con otros dominios. El vocabulario GO está diseñado para ser neutral en cuanto a especies e incluye términos aplicables a procariotas y eucariotas ,individuales y organismos multicelulares .

GO no es estático, y las adiciones, correcciones y alteraciones son sugeridas y solicitadas por miembros de las comunidades de investigación y anotación, así como por aquellos directamente involucrados en el proyecto GO. [5] Por ejemplo, un anotador puede solicitar un término específico para representar una vía metabólica, o se puede revisar una sección de la ontología con la ayuda de expertos de la comunidad (por ejemplo, [6] ). Los editores de ontología revisan las ediciones sugeridas y las implementan cuando corresponde.

Los archivos de anotación y ontología de GO están disponibles gratuitamente en el sitio web de GO [7] en varios formatos, o se puede acceder a ellos en línea utilizando el navegador de GO AmiGO . El proyecto Gene Ontology también proporciona asignaciones descargables de sus términos a otros sistemas de clasificación.

Término de ejemplo [ editar ]

id: GO: 0000016
nombre: actividad de la lactasa
ontología: función_molecular
def: "Catálisis de la reacción: lactosa + H2O = D-glucosa + D-galactosa". [CE: 3.2.1.108]
sinónimo: "actividad lactasa-florizina hidrolasa" AMPLIA [EC: 3.2.1.108]
sinónimo: "actividad lactosa galactohidrolasa" EXACTO [CE: 3.2.1.108]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! actividad hidrolasa, hidrolizando compuestos de O-glicosilo

Fuente de datos: [8]

Anotación [ editar ]

La anotación del genoma abarca la práctica de capturar datos sobre un producto genético, y las anotaciones de GO utilizan términos de GO para hacerlo. Las anotaciones de los curadores de GO se integran y difunden en el sitio web de GO, donde se pueden descargar directamente o ver en línea usando AmiGO. [9] Además del identificador del producto genético y el término GO relevante, las anotaciones GO tienen al menos los siguientes datos: La referencia utilizada para hacer la anotación (por ejemplo, un artículo de revista); Un código de evidencia que denota el tipo de evidencia en la que se basa la anotación; La fecha y el creador de la anotación.


La información de apoyo, según el término GO y la evidencia utilizada, y la información complementaria, como las condiciones en las que se observa la función, también se puede incluir en una anotación GO.

El código de evidencia proviene de un vocabulario controlado de códigos, la Ontología del Código de Evidencia, que cubre métodos de anotación tanto manuales como automatizados. [10] Por ejemplo, Declaración de autor rastreable (TAS) significa que un curador ha leído un artículo científico publicado y los metadatos de esa anotación llevan una cita a ese artículo; Inferido de Sequence Similarity (ISS) significa que un curador humano ha revisado el resultado de una búsqueda de similitud de secuencia y verificado que es biológicamente significativo. Las anotaciones de procesos automatizados (por ejemplo, reasignación de anotaciones creadas con otro vocabulario de anotaciones) reciben el código Inferido de Anotación electrónica(IEA). En 2010, más del 98% de todas las anotaciones GO se infirieron computacionalmente, no por los curadores, pero al 2 de julio de 2019, solo alrededor del 30% de todas las anotaciones GO se infirieron computacionalmente. [11] [12] Como estas anotaciones no son verificadas por un humano, el Consorcio GO las considera marginalmente menos confiables y comúnmente se encuentran en términos de mayor nivel y menos detallados. Los conjuntos de datos de anotaciones completos se pueden descargar del sitio web de GO. Para apoyar el desarrollo de la anotación, el Consorcio GO ofrece talleres y orienta a nuevos grupos de curadores y desarrolladores.

Se han diseñado e implementado muchos algoritmos de aprendizaje automático para predecir anotaciones de Ontología genética. [13] [14]

Ejemplo de anotación [ editar ]

Producto genético: Actina, músculo cardíaco alfa 1, UniProtKB: P68032
Término GO: contracción del corazón; GO: 0060047 (proceso biológico)
Código de evidencia: inferido de fenotipo mutante (IMP)
Referencia PMID  17611253
Asignado por: UniProtKB, 6 de junio de 2008

Fuente de datos: [15]

Herramientas [ editar ]

Hay una gran cantidad de herramientas disponibles [16] tanto en línea como para descargar que utilizan los datos proporcionados por el proyecto GO. La gran mayoría de estos provienen de terceros; el Consorcio GO desarrolla y da soporte a dos herramientas, AmiGO y OBO-Edit .

AmiGO [17] [9] es una aplicación basada en web que permite a los usuarios consultar, explorar y visualizar ontologías y datos de anotación de productos genéticos. También tiene una herramienta BLAST , [18] herramientas que permiten el análisis de conjuntos de datos más grandes, [19] [20] y una interfaz para consultar la base de datos GO directamente. [21]

AmiGO se puede utilizar en línea en el sitio web de GO para acceder a los datos proporcionados por el Consorcio GO, o se puede descargar e instalar para uso local en cualquier base de datos que emplee el esquema de base de datos GO (por ejemplo, [22] ). Es un software gratuito de código abierto y está disponible como parte de la distribución del software go-dev. [23]

OBO-Edit [24] es un editor de ontología de código abierto, independiente de la plataforma, desarrollado y mantenido por Gene Ontology Consortium. Está implementado en Java y utiliza un enfoque orientado a gráficos para mostrar y editar ontologías. OBO-Edit incluye una completa interfaz de búsqueda y filtro, con la opción de representar subconjuntos de términos para hacerlos visualmente distintos; la interfaz de usuario también se puede personalizar de acuerdo con las preferencias del usuario. OBO-Edit también tiene un razonador que puede inferir enlaces que no se han declarado explícitamente, en función de las relaciones existentes y sus propiedades. Aunque fue desarrollado para ontologías biomédicas, OBO-Edit se puede utilizar para ver, buscar y editar cualquier ontología. Está disponible para descargar gratuitamente. [23]

Consorcio [ editar ]

El Consorcio de Ontología Genética es el conjunto de bases de datos biológicas y grupos de investigación que participan activamente en el proyecto de ontología genética. [12] Esto incluye una serie de bases de datos de organismos modelo y bases de datos de proteínas de múltiples especies , grupos de desarrollo de software y una oficina editorial dedicada.

Historia [ editar ]

La Gene Ontology fue construida originalmente en 1998 por un consorcio de investigadores que estudiaban los genomas de tres organismos modelo : Drosophila melanogaster (mosca de la fruta), Mus musculus (ratón) y Saccharomyces cerevisiae ( levadura de cerveza o de panadería). [25] Muchas otras bases de datos de organismos modelo se han unido al Consorcio de Ontologías Genéticas, contribuyendo no solo con datos de anotación, sino también contribuyendo al desarrollo de ontologías y herramientas para ver y aplicar los datos. Muchas bases de datos importantes de plantas, animales y microorganismos contribuyen a este proyecto. [7]A julio de 2019, el GO contiene 44,945 términos; hay 6.408.283 anotaciones a 4.467 organismos biológicos diferentes. [7] Existe una gran cantidad de literatura sobre el desarrollo y uso de la GO, y se ha convertido en una herramienta estándar en el arsenal de bioinformática . Sus objetivos tienen tres aspectos: construir ontología genética, asignar ontología a genes / productos genéticos y desarrollar software y bases de datos para los dos primeros objetos.

También están empezando a aparecer varios análisis de la ontología genética que utilizan propiedades formales de clases independientes del dominio (las metapropiedades). Por ejemplo, un análisis ontológico de ontologías biológicas ver. [26]

Ver también [ editar ]

  • Blast2GO [27]
  • Base de datos comparativa de toxicogenómica
  • Bioinformática DAVID
  • Interferoma
  • Centro Nacional de Ontología Biomédica

Referencias [ editar ]

  1. ^ The Gene Ontology Consortium (enero de 2008). "El proyecto Gene Ontology en 2008" . Investigación de ácidos nucleicos . 36 (Problema de la base de datos): D440–4. doi : 10.1093 / nar / gkm883 . PMC 2238979 . PMID 17984083 .  
  2. ^ Dessimoz, Christophe ; Škunca, Nives, eds. (2017). El manual de ontología genética . Métodos en Biología Molecular. 1446 . doi : 10.1007 / 978-1-4939-3743-1 . ISBN 9781493937431. ISSN  1064-3745 . S2CID  3708801 .
  3. ^ Gaudet, Pascale; Škunca, Nives; Hu, James C .; Dessimoz, Christophe (2017). "Introducción a la ontología genética". El manual de ontología genética . Métodos en Biología Molecular. 1446 . págs. 25–37. doi : 10.1007 / 978-1-4939-3743-1_3 . ISBN 978-1-4939-3741-7. ISSN  1064-3745 . PMC  6377150 . PMID  27812933 .
  4. ^ Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Ireland A, Mungall CJ, Leontis N, Rocca-Serra P, Ruttenberg A, Sansone SA, Scheuermann RH, Shah N , Whetzel PL, Lewis S (noviembre de 2007). "The OBO Foundry: evolución coordinada de ontologías para apoyar la integración de datos biomédicos" . Biotecnología de la naturaleza . 25 (11): 1251–5. doi : 10.1038 / nbt1346 . PMC 2814061 . PMID 17989687 .  
  5. ^ Amante, Ruth C. (2017). "¿Cómo contribuye la comunidad científica a la ontología genética?". En Dessimoz, C; Skunca, N (eds.). El manual de ontología genética . Métodos en Biología Molecular. 1446 . Springer (Nueva York). págs. 85–93. doi : 10.1007 / 978-1-4939-3743-1_7 . ISBN 978-1-4939-3741-7. ISSN  1064-3745 . PMID  27812937 .
  6. ^ Diehl AD, Lee JA, Scheuermann RH, Blake JA (abril de 2007). "Desarrollo de ontología para sistemas biológicos: inmunología" . Bioinformática . 23 (7): 913-5. doi : 10.1093 / bioinformatics / btm029 . PMID 17267433 . 
  7. ^ a b c "El recurso de ontología genética" . Consorcio de Ontología Genética.
  8. ^ Sjcarbon, Wiki del consorcio de ontología genética (10 de julio de 2013). "AmiGO_2_Manual: term_Page" (html) .
  9. ^ a b AmiGO : el conjunto de herramientas oficial actual basado en la web para buscar y navegar en la base de datos de Ontología de genes
  10. ^ "Ontología del código de evidencia" . Ontología del código de evidencia.
  11. du Plessis L, Skunca N, Dessimoz C (noviembre de 2011). "El qué, dónde, cómo y por qué de la ontología genética - una introducción a los bioinformáticos" . Briefings en Bioinformática . 12 (6): 723–35. doi : 10.1093 / bib / bbr002 . PMC 3220872 . PMID 21330331 .  
  12. ^ a b "El consorcio GO" . Consultado el 16 de marzo de 2009 .
  13. ^ Pinoli P, Chicco D, Masseroli M (junio de 2013). "Algoritmos computacionales para predecir la anotación de ontología genética" . BMC Bioinformática . 16 (6): S4. doi : 10.1186 / 1471-2105-16-S6-S4 . PMC 4416163 . PMID 25916950 .  
  14. ^ Cozzetto, Domenico; Jones, David T. (2017). "Métodos computacionales para transferencias de anotaciones de secuencia". En Dessimoz, C; Skunca, N (eds.). El manual de ontología genética . Métodos en Biología Molecular. 1446 . Springer (Nueva York). págs. 55–67. doi : 10.1007 / 978-1-4939-3743-1_5 . ISBN 978-1-4939-3741-7. ISSN  1064-3745 . PMID  27812935 .
  15. The GO Consortium (16 de marzo de 2009). "AmiGO: Asociaciones P68032" .
  16. ^ Mosquera JL, Sánchez-Pla A (julio de 2008). "SerbGO: buscando la mejor herramienta GO" . Investigación de ácidos nucleicos . 36 (Problema del servidor web): W368–71. doi : 10.1093 / nar / gkn256 . PMC 2447766 . PMID 18480123 .  
  17. ^ Carbon S, Irlanda A, Mungall CJ, Shu S, Marshall B, Lewis S (enero de 2009). AmiGO Hub; Grupo de Trabajo de Presencia Web. "AmiGO: acceso en línea a datos de ontología y anotación" . Bioinformática . 25 (2): 288–9. doi : 10.1093 / bioinformatics / btn615 . PMC 2639003 . PMID 19033274 .  
  18. ^ "Herramienta AmiGO BLAST" . Archivado desde el original el 20 de agosto de 2011 . Consultado el 13 de marzo de 2009 .
  19. ^ Herramienta de enriquecimiento de términos de AmiGO Archivado el 7 de abril de 2008 en la Wayback Machine ; encuentra términos GO compartidos significativos en un conjunto de anotaciones
  20. ^ AmiGO Slimmer Archivado el 29 de septiembre de 2011 en la Wayback Machine ; mapea anotaciones granulares hasta términos de alto nivel
  21. ^ GOOSE , GO Entorno SQL en línea; permite la consulta SQL directa de la base de datos GO
  22. The Plant Ontology Consortium (16 de marzo de 2009). "Consorcio de Ontología Vegetal" . Consultado el 16 de marzo de 2009 .
  23. ^ a b "Descargas de gene ontología en SourceForge" . Consultado el 16 de marzo de 2009 .
  24. ^ Day-Richter J, Harris MA, Haendel M, Lewis S (agosto de 2007). "OBO-Edit - un editor de ontología para biólogos" . Bioinformática . 23 (16): 2198–200. doi : 10.1093 / bioinformática / btm112 . PMID 17545183 . 
  25. ^ Ashburner M, Ball CA, Blake JA , Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC , Richardson JE, Ringwald M, Rubin GM, Sherlock G (mayo de 2000). "Ontología genética: herramienta para la unificación de la biología. El Consorcio de Ontología Genética" . Genética de la naturaleza . 25 (1): 25–9. doi : 10.1038 / 75556 . PMC 3037419 . PMID 10802651 .  
  26. ^ Deb, B. (2012). "Un análisis ontológico de algunas ontologías biológicas" . Fronteras en genética . 3 : 269. doi : 10.3389 / fgene.2012.00269 . PMC 3509948 . PMID 23226158 .  
  27. ^ Götz S, García-Gómez JM, Terol J, Williams TD, Nagaraj SH, Nueda MJ, Robles M, Talón M, Dopazo J, Conesa A (junio de 2008). "Anotación funcional de alto rendimiento y minería de datos con la suite Blast2GO" . Investigación de ácidos nucleicos . 36 (10): 3420–35. doi : 10.1093 / nar / gkn176 . PMC 2425479 . PMID 18445632 .  

Enlaces externos [ editar ]

  • AmiGO : el actual conjunto oficial de herramientas basadas en la web para buscar y explorar la base de datos de Ontología Genética
  • Consorcio de Ontología Genética - sitio oficial
  • PlantRegMap: anotación GO para 165 especies de plantas y análisis de enriquecimiento GO
  • SimCT : herramienta basada en web para mostrar relaciones entre objetos biológicos anotados en una ontología, en forma de árbol de agrupamiento.
  • SerbGO : una herramienta de GO para comparar las capacidades de diferentes programas para mostrar sus características comunes y sus diferencias y para encontrar qué herramientas, si las hay, tienen algunas capacidades específicas requeridas por el usuario para el análisis de GO.
  • Ontología genética centrada en el dominio : base de datos de ontologías centradas en el dominio sobre funciones, fenotipos, enfermedades y más.