La biocuración es el campo de la investigación en ciencias de la vida dedicado a traducir e integrar el conocimiento biomédico de artículos científicos a bases de datos interoperables. [1] [2] La biocuración del conocimiento biomédico es posible gracias al trabajo cooperativo de biocuradores, desarrolladores de software y bioinformáticos . [1]
La biocuración como profesión
Un biocurador es un científico profesional que cura , recopila, anota y valida la información que se difunde mediante bases de datos biológicas y de organismos modelo . [3] [4] Es una profesión nueva, cuyas primeras menciones en la literatura científica datan de 2006 en el contexto del trabajo en bases de datos como Immune Epitope Database and Analysis Resource . [5] [6] Los biocuradores suelen tener un nivel de doctorado con una combinación de experiencias en el laboratorio húmedo y representaciones computacionales del conocimiento (por ejemplo, mediante ontologías ). [7]
El papel de un biocurador abarca el control de calidad de los datos de investigación biológica primaria destinados a la publicación, la extracción y organización de datos de la literatura científica original y la descripción de los datos con protocolos de anotación y vocabularios estándar que permiten consultas potentes e interoperabilidad de bases de datos biológicas . Los biocuradores se comunican con los investigadores para garantizar la precisión de la información seleccionada y fomentar el intercambio de datos con los laboratorios de investigación. [6]
Los biocuradores están presentes en diversos entornos de investigación, pero es posible que no se identifiquen a sí mismos como biocuradores. Proyectos como ELIXIR (la infraestructura europea de ciencias de la vida para la información biológica) y GOBLET (Organización mundial para el aprendizaje, la educación y la formación en bioinformática) [8] promueven la formación y apoyan la biocuración como trayectoria profesional. [9]
En 2011, la biocuración ya estaba reconocida como una profesión, pero no había cursos formales de grado para preparar a los curadores de datos biológicos de manera específica. [10] Con el crecimiento del campo, la Universidad de Cambrigdge y el EMBL-EBI comenzaron a ofrecer conjuntamente un Certificado de Posgrado en Biocuración, [11] considerado como un paso hacia el reconocimiento de la biocuración como una disciplina en sí misma. [12] Existe un aumento percibido en la demanda de biocuración y una necesidad de capacitación adicional en biocuración por parte de los programas de posgrado . [13]
Las organizaciones que emplean biocuradores, como Clinical Genome Resource (ClinGen), a menudo proporcionan materiales especializados y capacitación para la biocuración. [14]
Bases de conocimientos biológicos
El papel de los biocuradores es más conocido en el campo de las bases de conocimientos biológicos . Tales bases de datos, como UniProt [15] y PDB [16], dependen de biocuradores profesionales para organizar la información. Entre otras cosas, los biocuradores trabajan para mejorar la calidad de los datos, por ejemplo, fusionando entradas duplicadas. [17]
Una parte importante de esas bases de conocimientos son las bases de datos de organismos modelo , que se basan en biocuradores para conservar información sobre organismos de tipos particulares. Algunos ejemplos notables de databes de organismos modelo son FlyBase , [18] PomBase , [19] y ZFIN , [20] dedicados a curar información sobre Drosophila , Schizosaccharomyces pombe y pez cebra, respectivamente.
Curación y anotación
La biocuración es la integración de información biológica en bases de datos en línea de una manera semánticamente estandarizada, utilizando identificadores trazables únicos adecuados y proporcionando los metadatos necesarios, incluida la fuente y la procedencia.
Ontologías, vocabularios controlados y nombres estándar
Los biocuradores comúnmente emplean y participan en la creación y desarrollo de ontologías biomédicas compartidas : vocabularios estructurados y controlados que abarcan muchos dominios del conocimiento biológico y médico, como las Ontologías Biomédicas Abiertas . Estos dominios incluyen la genómica y la proteómica , la anatomía , animal y vegetal desarrollo , bioquímica , rutas metabólicas , clasificación taxonómica , y mutantes fenotipos . Dada la variedad de ontologías existentes, existen pautas que orientan a los investigadores sobre cómo elegir una adecuada. [21]
El Unified Medical Language System es uno de esos sistemas que integra y distribuye millones de términos utilizados en el ámbito de las ciencias de la vida. [22]
Los biocuradores hacen cumplir el uso constante de las pautas de nomenclatura genética y participan en los comités de nomenclatura genética de varios organismos modelo , a menudo en colaboración con el Comité de nomenclatura genética de HUGO ( HGNC ). También hacen cumplir otras pautas de nomenclatura como las proporcionadas por el Comité de Nomenclatura de la Unión Internacional de Bioquímica y Biología Molecular (IUBMB), un ejemplo de las cuales es el número CE de la Comisión de Enzimas .
De manera más general, la comunidad elogia el uso de identificadores persistentes para mejorar la claridad y facilitar el conocimiento [23]
Anotación de ADN
En la anotación del genoma, por ejemplo, los identificadores definidos por los ontólogos y los consorcios se utilizan para describir partes del genoma. Por ejemplo, la ontología genética (GO) selecciona términos para procesos biológicos, que se utilizan para describir lo que sabemos sobre genes específicos .
Anotación de texto
A partir de 2021, la comunicación de las ciencias de la vida todavía se realiza principalmente a través de lenguajes naturales libres, como el inglés o el alemán , que tienen un grado de ambigüedad y dificultan la conexión de conocimientos. Entonces, además de anotar secuencias biológicas, los biocuradores también anotan textos, vinculando palabras a identificadores únicos. Esto ayuda a la desambiguación, aclarando el significado pretendido y haciendo que los textos sean procesables por computadoras. Una aplicación de la anotación de texto es especificar el gen exacto al que se refiere un científico. [24]
Las anotaciones de texto disponibles al público permiten a los biólogos aprovechar aún más el texto biomédico. El PMC de Europa tiene una interfaz de programación de aplicaciones que centraliza las anotaciones de texto de una variedad de fuentes y las pone a disposición en una interfaz gráfica de usuario llamada SciLite. [25] PubTator Central también proporciona anotaciones, pero está completamente basado en minería de texto computarizada y no proporciona una interfaz de usuario. [26] También existen programas que permiten a los usuarios anotar manualmente los textos biomédicos que les interesan, como el sistema ezTag. [27]
Sociedad Internacional de Biocuración (ISB)
La Sociedad Internacional de Biocuración (ISB) es una organización sin fines de lucro que "promueve el campo de la biocuración y proporciona un foro para el intercambio de información a través de reuniones y talleres". Ha surgido de las Conferencias Internacionales de Biocuración y se fundó a principios de 2009. [4]
La ISB ofrece el Premio a la Carrera de Biocuración a los biocuradores de la comunidad: el Premio a la Carrera de Biocurador (otorgado anualmente) y el Premio ISB por Contribuciones Excepcionales a la Biocuración (otorgado semestralmente).
La revista oficial de la ISB, Database , es un espacio especializado en artículos sobre bases de datos y biocuración. [28]
Curaduría comunitaria
Tradicionalmente, la biocuración ha sido realizada por expertos dedicados, que integran datos en bases de datos. La curación comunitaria ha surgido como un enfoque prometedor para mejorar la difusión del conocimiento a partir de los datos publicados y proporcionar una forma rentable de mejorar la escalabilidad de la biocuración. En algunos casos, la ayuda de la comunidad se aprovecha en jamborees que introducen a los expertos en el dominio a las tareas de conservación, realizadas durante el evento, [29] mientras que otros se basan en contribuciones asincrónicas de expertos y no expertos. [30]
Bases de datos biológicas
Varias bases de datos biológicas incluyen contribuciones de autores en su estrategia de curación funcional hasta cierto punto, que puede variar desde la asociación de identificadores de genes con publicaciones o texto libre, hasta una anotación más estructurada y detallada de secuencias y datos funcionales, produciendo curaciones con los mismos estándares que los biocuradores profesionales. . La mayor parte de la curación comunitaria en las bases de datos de organismos modelo implica la anotación por parte de los autores originales de la investigación publicada (anotación de primer paso) para obtener identificadores precisos de los objetos que se van a curar o identificar tipos de datos para una curación detallada. Por ejemplo:
- WormBase solicita con éxito la anotación de primer paso de los usuarios y ha integrado la curación del autor con el proceso de micropublicación. [32] WormBase también integra la minería de texto en su plataforma, proporcionando sugerencias a los curadores de la comunidad. [31]
- FlyBase envía solicitudes por correo electrónico a los autores de nuevas publicaciones, [33] invitándolos a enumerar los genes y tipos de datos descritos a través de una herramienta en línea y también ha movilizado a la comunidad para escribir párrafos de resumen de genes. [34]
Otras bases de datos, como PomBase , dependen de los autores de las publicaciones para enviar anotaciones altamente detalladas basadas en ontologías para sus publicaciones y metadatos asociados con conjuntos de datos de todo el genoma que utilizan vocabularios controlados. Canto, una herramienta basada en la web ; [35] se desarrolló para facilitar las presentaciones de la comunidad. Dado que Canto está disponible gratuitamente, es genérico y altamente configurable, ha sido adoptado por otros proyectos. [36] La curación está sujeta a revisión por curadores profesionales, lo que da como resultado una curación en profundidad de alta calidad de todos los tipos de datos moleculares. [37]
La base de conocimiento UniProt, ampliamente utilizada, también tiene un mecanismo de curación comunitaria que permite a los investigadores agregar información sobre las proteínas. [38]
Recursos de estilo wiki
Los bio-wikis confían en sus comunidades para proporcionar contenido y una serie de recursos de estilo wiki están disponibles para la biocuración. [39] [40] AuthorReward , [41] por ejemplo, es una extensión de MediaWiki que cuantifica las contribuciones de los investigadores a los biowikis. RiceWiki fue un ejemplo de una base de datos basada en wiki para la curación comunitaria de genes de arroz equipada con AuthorReward . [42] [43] CAZypedia es otro wiki de este tipo para la biocuración comunitaria de información sobre enzimas activas en carbohidratos (CAZys). [44]
Los WikiProteins / WikiProfessional era un proyecto para organizar semánticamente datos biológicos dirigidos por Barend Mons . [45] [46] El proyecto de 2007 tuvo contribuciones directas de Jimmy Wales , cofundador de Wikipedia, y tomó Wikidata como inspiración. [45] Un proyecto actualmente activo que se ejecuta en una adaptación del software mediawiki es WikiPathways , que recopila información sobre vías biológicas . [47]
Wikipedia
Existe cierta superposición entre el trabajo de los biocuradores y Wikipedia , y los límites entre las bases de datos científicas y Wikipedia se vuelven cada vez más difusos. [48] [40] [49] Bases de datos como Rfam [50] [51] y el Protein Data Bank [52], por ejemplo, hacen un uso intensivo de Wikipedia y sus editores para conservar la información. [53] [54] Sin embargo, la mayoría de las bases de datos ofrecen datos altamente estructurados que se pueden buscar en combinaciones complejas, lo que generalmente no es posible en Wikipedia, aunque Wikidata tiene como objetivo resolver este problema hasta cierto punto.
El proyecto Gene Wiki utilizó Wikipedia para la curación colaborativa de miles de genes y productos genéticos, como la titina y la insulina . [55] Varios proyectos también emplean Wikipedia como plataforma para la conservación de información médica. [30]
Otra forma en que se utiliza Wikipedia para la biocuración es a través de sus artículos de lista . Por ejemplo, la base de datos completa de resistencia a los antibióticos integra su evaluación de las bases de datos sobre la resistencia a los antibióticos en una lista de Wikipedia en particular . [56]
Wikidata
La comunidad de biocuración utiliza cada vez más la base de conocimientos de Wikimedia, Wikidata , como un repositorio integrador de las ciencias de la vida. [57] Wikidata está siendo visto por algunos como una alternativa con mejores perspectivas de mantenimiento e interoperabilidad que las bases de conocimiento biológico independientes más pequeñas. [58]
Wikidata se ha utilizado para curar información sobre el SARS-CoV-2 y la pandemia COVID-19 [59] [60] y por el proyecto Gene Wiki para curar información sobre genes . [61] Los datos de biocuración en Wikidata se reutilizan en recursos externos a través de consultas SPARQL . [62] Algunos proyectos utilizan la curaduría a través de Wikidata como un camino para mejorar la información sobre ciencias de la vida en Wikipedia. [63]
Recursos gamificados
Un enfoque para involucrar a la multitud en la biocuración es a través de plataformas gamificadas que utilizan principios de diseño de juegos para impulsar el compromiso. Algunos ejemplos son:
- Mark2Cure, una plataforma ludificada para la curación comunitaria de resúmenes biomédicos [64] [65] [66]
- Cochrane Crowd, [67] una plataforma de Cochrane para la curación de ensayos clínicos y para categorizar y resumir la literatura biomédica. [68]
- CIViC, un portal para la anotación de variantes genómicas relacionadas con el cáncer [69] que rastrea las puntuaciones y mantiene tablas de clasificación. [70]
La gamificación también se ha aplicado en el contexto de la curación profesional para mejorar la cuantificación y el reconocimiento de las contribuciones. [71]
Minería de texto computacional para curación
Las tecnologías de procesamiento de lenguaje natural y minería de textos pueden ayudar a los biocuradores a extraer información para la curación manual. [73] La minería de texto puede escalar los esfuerzos de curación, apoyando la identificación de nombres de genes, por ejemplo, así como para inferir parcialmente ontologías . [74] [75] La conversión de afirmaciones no estructuradas en información estructurada utiliza técnicas como el reconocimiento de entidades con nombre y el análisis de dependencias. [76] La minería de textos de conceptos biomédicos enfrenta desafíos con respecto a variaciones en los informes, y la comunidad está trabajando para aumentar la legibilidad de los artículos por máquina. [77]
Durante la pandemia de COVID-19 , la minería de textos biomédicos se utilizó mucho para hacer frente a la gran cantidad de investigaciones científicas publicadas sobre el tema (más de 50.000 artículos). [78]
El popular paquete de Python NLP SpaCy tiene una modificación para textos biomédicos, SciSpaCy, que es mantenido por el Allen Institute for AI . [79]
Entre los desafíos de la minería de textos aplicada a la biocuración está la dificultad de acceder a los textos completos de los artículos biomédicos debido al muro de pago, vinculando los desafíos de la biocuración con los del movimiento de acceso abierto . [80]
Un enfoque complementario de la biocuración a través de la minería de texto implica la aplicación de reconocimiento óptico de caracteres a figuras biomédicas, junto con algoritmos de anotación automática. Esto se ha utilizado para extraer información genética a partir de figuras de vías , por ejemplo. [81]
Las sugerencias para mejorar el texto escrito para facilitar las anotaciones van desde el uso de lenguajes naturales controlados [82] hasta proporcionar una asociación clara de conceptos (como genes y proteínas ) con la especie particular de interés. [83]
Si bien persisten los desafíos, la minería de textos ya es una parte integral del flujo de trabajo de la biocuración en varias bases de conocimientos biológicos . [84]
Desafíos biocreativos
La interfaz entre la minería de textos y la biocuración ha sido impulsada por los desafíos BioCreAtIvE (Evaluación crítica de sistemas de extracción de información en biología), una serie de competencias de minería de textos que se llevaron a cabo por primera vez en 2004. [85]
Ver también
- Sociedad Internacional de Biocuración
- Base de datos biológica
- Base de datos de organismos modelo
- Curación digital
- Fundición OBO
Referencias
- ^ a b "¿Qué es la biocuración? | Sociedad internacional de biocuración" . www.biocuration.org . Consultado el 6 de septiembre de 2020 .
- ^ Howe D, Costanzo M, Fey P, Gojobori T, Hannick L, Hide W, et al. (Septiembre de 2008). "Big data: El futuro de la biocuración" . Naturaleza . 455 (7209): 47–50. Código Bibliográfico : 2008Natur.455 ... 47H . doi : 10.1038 / 455047a . PMC 2819144 . PMID 18769432 .
- ^ Burge S, Attwood TK, Bateman A, Berardini TZ, Cherry M, O'Donovan C, et al. (20 de marzo de 2012). "Biocuradores y biocuración: relevamiento de los desafíos del siglo XXI" . Base de datos . 2012 : barra059. doi : 10.1093 / base de datos / bar059 . PMC 3308150 . PMID 22434828 .
- ^ a b Bateman A (abril de 2010). "Curadores del mundo se unen: la Sociedad Internacional de Biocuración" . Bioinformática . 26 (8): 991. doi : 10.1093 / bioinformatics / btq101 . PMID 20305270 .
- ^ Bourne PE, McEntyre J (octubre de 2006). "Biocuradores: contribuyentes al mundo de la ciencia" . PLOS Biología Computacional . 2 (10): e142. Código Bibliográfico : 2006PLSCB ... 2..142B . doi : 10.1371 / journal.pcbi.0020142 . PMC 1626157 . PMID 17411327 .
- ^ a b Salimi N, Vita R (octubre de 2006). "El biocurador: conectando y potenciando los datos científicos" . PLOS Biología Computacional . 2 (10): e125. Código bibliográfico : 2006PLSCB ... 2..125S . doi : 10.1371 / journal.pcbi.0020125 . PMC 1626147 . PMID 17069454 .
- ^ Biocuración, Sociedad Internacional para (2018-04-16). "Biocuración: destilar datos en conocimiento" . PLOS Biología . 16 (4): e2002846. doi : 10.1371 / JOURNAL.PBIO.2002846 . PMC 5919672 . PMID 29659566 .
- ^ "GOBLET | La organización mundial para el aprendizaje, la educación y la formación en bioinformática" . Consultado el 19 de diciembre de 2020 .
- ^ Alexandra Holinski; Melissa Burke; Sarah L Morgan; Peter McQuilton; Patricia M. Palagi (4 de septiembre de 2020). "Biocuración - mapeo de recursos y necesidades" . F1000Research . 9 : 1094. doi : 10.12688 / F1000RESEARCH.25413.1 . ISSN 2046-1402 . PMC 7590901 . PMID 33145007 . Wikidata Q101217428 .
- ^ Sanderson, Katharine (febrero de 2011). "Bioinformática: generación de curaciones" . Naturaleza . 470 (7333): 295–296. doi : 10.1038 / nj7333-295a . ISSN 1476-4687 . PMID 21348148 .
- ^ Anónimo (30/10/2019). "Certificado de Postgrado en Biocuración" . www.ice.cam.ac.uk . Consultado el 6 de octubre de 2020 .
- ^ Tang YA, Pichler K, Füllgrabe A, Lomax J, Malone J, Munoz-Torres MC, et al. (Mayo de 2019). "Diez consejos rápidos para la biocuración" . PLOS Biología Computacional . 15 (5): e1006906. Código bibliográfico : 2019PLSCB..15E6906T . doi : 10.1371 / journal.pcbi.1006906 . PMC 6497217 . PMID 31048830 .
- ^ Harper, Lisa; Campbell, Jacqueline D .; Cañón, Ethalinda KS; Jung, Sook; Poelchau, Monica F .; Paredes, Ramona L .; Andorf, Carson M .; Arnaud, Elizabeth; Berardini, Tanya Z .; Birkett, Clayton; Cannon, Steve (1 de enero de 2018). "Recomendaciones del consorcio AgBioData para bases de datos genómicas y genéticas sostenibles para la agricultura" . Base de datos . 2018 : 1–32. doi : 10.1093 / BASE DE DATOS / BAY088 .
- ^ "Biocurador - ClinGen | Recurso del genoma clínico" . www.clinicalgenome.org . Consultado el 26 de mayo de 2021 .
- ^ "UniProt: la base de conocimientos de proteínas universal" . Investigación de ácidos nucleicos . 45 (D1): D158 – D169. 2016-11-29. doi : 10.1093 / nar / gkw1099 . ISSN 0305-1048 . PMC 5210571 . PMID 27899622 .
- ^ Berman, Helen M .; Westbrook, J .; Feng, Z .; Gilliland, G .; Bhat, TN; Weissig, H .; Shindyalov, Ilya; Bourne, Philip (1 de enero de 2000). "El banco de datos de proteínas" . Investigación de ácidos nucleicos . 28 (1): 235–242. doi : 10.1093 / NAR / 28.1.235 . PMC 102472 . PMID 10592235 .
- ^ Chen, Qingyu; Britto, Ramona; Erill, Ivan; Jeffery, Constance J .; Liberzon, Arthur; Magrane, Michele; Onami, Jun-Ichi; Robinson-Rechavi, Marc; Sponarova, Jana; Zobel, Justin; Verspoor, Karin (8 de julio de 2020). "Asuntos de calidad: expertos en biocuración sobre el impacto de la duplicación y otros problemas de calidad de datos en bases de datos biológicas" . Genómica Proteómica y Bioinformática . 18 (2): 91–103. doi : 10.1016 / J.GPB.2018.11.006 . PMID 32652120 .
- ^ "FlyBase: una base de datos de Drosophila. Flybase Consortium" . Investigación de ácidos nucleicos . 26 (1): 85–88. 1998-01-01. doi : 10.1093 / nar / 26.1.85 . ISSN 1362-4962 . PMC 147222 . PMID 9399806 .
- ^ Lock, Antonia; Rutherford, Kim; Harris, Midori A; Hayles, Jacqueline; Oliver, Stephen G; Bähler, Jürg; Wood, Valerie (13 de octubre de 2018). "PomBase 2018: la reimplementación impulsada por el usuario de la base de datos de levadura de fisión proporciona un acceso rápido e intuitivo a información diversa e interconectada" . Investigación de ácidos nucleicos . 47 (D1): D821 – D827. doi : 10.1093 / nar / gky961 . ISSN 0305-1048 . PMID 30321395 .
- ^ Ruzicka, Leyla; Howe, Douglas G .; Ramachandran, Sridhar; Toro, Sabrina; Slyke, Ceri E. Van; Bradford, Yvonne M .; Eagle, Anne; Fashena, David; Frazer, Ken; Kalita, Patrick; Mani, Prita (1 de enero de 2019). "La red de información del pez cebra: nuevo soporte para genes no codificantes, anotaciones de Ontología de genes más ricas y la Alianza de recursos del genoma" . Investigación de ácidos nucleicos . 47 (D1): D867 – D873. doi : 10.1093 / NAR / GKY1090 .
- ^ Malone J, Stevens R, Jupp S, Hancocks T, Parkinson H, Brooksbank C (febrero de 2016). "Diez reglas simples para seleccionar una bio-ontología" . PLOS Biología Computacional . 12 (2): e1004743. Código bibliográfico : 2016PLSCB..12E4743M . doi : 10.1371 / journal.pcbi.1004743 . PMC 4750991 . PMID 26867217 .
- ^ Bodenreider O (enero de 2004). "El Sistema Unificado de Lenguaje Médico (UMLS): integrando terminología biomédica" . Investigación de ácidos nucleicos . 32 (Problema de la base de datos): D267-70. doi : 10.1093 / nar / gkh061 . PMC 308795 . PMID 14681409 .
- ^ McMurry JA, Juty N, Blomberg N, Burdett T, Conlin T, Conte N, et al. (Junio de 2017). "Identificadores para el siglo XXI: cómo diseñar, proporcionar y reutilizar identificadores persistentes para maximizar la utilidad y el impacto de los datos de las ciencias de la vida" . PLOS Biología . 15 (6): e2001414. doi : 10.1371 / journal.pbio.2001414 . PMC 5490878 . PMID 28662064 .
- ^ Mons B (junio de 2005). "¿A qué gen te refieres?" . BMC Bioinformática . 6 (1): 142. doi : 10.1186 / 1471-2105-6-142 . PMC 1173089 . PMID 15941477 .
- ^ Venkatesan A, Kim JH, Talo F, Ide-Smith M, Gobeill J, Carter J, et al. (12/12/2016). "SciLite: una plataforma para mostrar anotaciones extraídas de texto como un medio para vincular artículos de investigación con datos biológicos" . Bienvenidos Investigación Abierta . 1 : 25. doi : 10.12688 / wellcomeopenres.10210.1 . PMC 5527546 . PMID 28948232 .
- ^ Wei CH, Allot A, Leaman R, Lu Z (julio de 2019). "PubTator central: anotación de concepto automatizada para artículos biomédicos de texto completo" . Investigación de ácidos nucleicos . 47 (W1): W587 – W593. doi : 10.1093 / nar / gkz389 . PMC 6602571 . PMID 31114887 .
- ^ Kwon D, Kim S, Wei CH, Leaman R, Lu Z (julio de 2018). "ezTag: etiquetado de conceptos biomédicos a través del aprendizaje interactivo" . Investigación de ácidos nucleicos . 46 (W1): W523 – W529. doi : 10.1093 / nar / gky428 . PMC 6030907 . PMID 29788413 .
- ^ Landsman, D .; Caballero, R .; Kelso, J .; Francis Ouellette, BF (5 de enero de 2010). "BASE DE DATOS: Un nuevo foro de curación y bases de datos biológicos" . Base de datos . 2009 : bap002. doi : 10.1093 / base de datos / bap002 . ISSN 1758-0463 . PMC 2790300 . PMID 20157475 .
- ^ Naithani, Sushma; Gupta, Parul; Preece, Justin; Garg, Priyanka; Fraser, Valerie; Padgitt-Cobb, Lillian K; Martin, Matthew; Vining, Kelly; Jaiswal, Pankaj (1 de enero de 2019). "Involucrar a la comunidad en genes y curación de vías" . Base de datos . 2019 . doi : 10.1093 / database / bay146 . ISSN 1758-0463 . PMID 30649295 .
- ^ a b Denise A. Smith (18 de febrero de 2020). Stefano Triberti (ed.). "Situar a Wikipedia como un recurso de información de salud en varios contextos: una revisión del alcance" . PLOS ONE . 15 (2): e0228786. doi : 10.1371 / JOURNAL.PONE.0228786 . ISSN 1932-6203 . PMC 7028268 . PMID 32069322 . Wikidata Q85632863 .
- ^ a b Arnaboldi V, Raciti D, Van Auken K, Chan JN, Müller HM, Sternberg PW (enero de 2020). "La minería de texto se encuentra con la curación comunitaria: una plataforma de curación de nuevo diseño para mejorar la experiencia del autor y la participación en WormBase" . Base de datos . 2020 . doi : 10.1093 / base de datos / baaa006 . PMC 7078066 . PMID 32185395 . S2CID 212750405 .
- ^ Lee RY, Howe KL, Harris TW, Arnaboldi V, Cain S, Chan J, et al. (Enero de 2018). "WormBase 2017: muda a una nueva etapa" . Investigación de ácidos nucleicos . 46 (D1): D869 – D874. doi : 10.1093 / nar / gkx998 . PMC 5753391 . PMID 29069413 .
- ^ Bunt SM, Grumbling GB, Field HI, Marygold SJ, Brown NH, Millburn GH (2012). "Enviar directamente por correo electrónico a los autores de artículos recientemente publicados fomenta la curación de la comunidad" . Base de datos . 2012 : bas024. doi : 10.1093 / base de datos / bas024 . PMC 3342516 . PMID 22554788 .
- ^ Antonazzo G, Urbano JM, Marygold SJ, Millburn GH, Brown NH (enero de 2020). "Construyendo una tubería para solicitar conocimiento experto de la comunidad para ayudar a la curación del resumen de genes" . Base de datos . 2020 . doi : 10.1093 / base de datos / baz152 . PMC 6971343 . PMID 31960022 .
- ^ Rutherford KM, Harris MA, Lock A, Oliver SG, Wood V (junio de 2014). "Canto: una herramienta en línea para la curación de literatura comunitaria" . Bioinformática . 30 (12): 1791–2. doi : 10.1093 / bioinformatics / btu103 . PMC 4058955 . PMID 24574118 .
- ^ "pombase / canto" . PomBase. 25 de septiembre de 2020.
- ^ Lock A, Harris MA, Rutherford K, Hayles J, Wood V (enero de 2020). "Curación comunitaria en PomBase: permitiendo a los expertos en levadura de fisión proporcionar anotaciones detalladas, estandarizadas y compartibles de publicaciones de investigación" . Base de datos . 2020 . doi : 10.1093 / base de datos / baaa028 . PMC 7192550 . PMID 32353878 .
- ^ "UniProt: la base de conocimientos de proteínas universal" . Investigación de ácidos nucleicos . 45 (D1): D158 – D169. 2016-11-29. doi : 10.1093 / nar / gkw1099 . ISSN 0305-1048 . PMC 5210571 . PMID 27899622 .
- ^ Khare, Ritu; Bien, Benjamin M .; Leaman, Robert; Su, Andrew I .; Lu, Zhiyong (1 de enero de 2016). "Crowdsourcing en biomedicina: retos y oportunidades" . Sesiones informativas en bioinformática . 17 (1): 23–32. doi : 10.1093 / BIB / BBV021 . PMC 4719068 . PMID 25888696 .
- ^ a b Finn RD, Gardner PP, Bateman A (enero de 2012). "Hacer que su base de datos esté disponible a través de Wikipedia: los pros y los contras" . Investigación de ácidos nucleicos . 40 (Problema de la base de datos): D9-12. doi : 10.1093 / nar / gkr1195 . PMC 3245093 . PMID 22144683 .
- ^ Dai L, Tian M, Wu J, Xiao J, Wang X, Townsend JP, Zhang Z (julio de 2013). "AuthorReward: aumento de la curación de la comunidad en wikis de conocimiento biológico a través de la cuantificación automatizada de la autoría" . Bioinformática . 29 (14): 1837–9. doi : 10.1093 / bioinformatics / btt284 . PMC 3702255 . PMID 23732274 .
- ^ Zhang Z, Sang J, Ma L, Wu G, Wu H, Huang D, et al. (Enero 2014). "RiceWiki: una base de datos basada en wiki para la curación comunitaria de genes de arroz" . Investigación de ácidos nucleicos . 42 (Problema de la base de datos): D1222-8. doi : 10.1093 / nar / gkt926 . PMC 3964990 . PMID 24136999 .
- ^ "Os01g0883800 - RiceWiki" . 2017-10-20. Archivado desde el original el 20 de octubre de 2017 . Consultado el 6 de septiembre de 2020 .
- ^ Consorcio, CAZypedia (11 de octubre de 2017). "Diez años de CAZypedia: una enciclopedia viva de enzimas activas en carbohidratos" . Glicobiología . 28 (1): 3–8. doi : 10.1093 / GLYCOB / CWX089 . PMID 29040563 .
- ^ a b Mons B, Ashburner M, Chichester C, van Mulligen E, Weeber M, den Dunnen J, et al. (28 de mayo de 2008). "Llamando a un millón de mentes para la anotación de la comunidad en WikiProteins" . Biología del genoma . 9 (5): R89. doi : 10.1186 / gb-2008-9-5-r89 . PMC 2441475 . PMID 18507872 .
- ^ Giles J (febrero de 2007). "Las bases de datos clave de biología se vuelven wiki" . Naturaleza . 445 (7129): 691. Bibcode : 2007Natur.445..691G . doi : 10.1038 / 445691a . PMID 17301755 . S2CID 4410783 .
- ^ "WikiPathways - WikiPathways" . www.wikipathways.org . Consultado el 14 de octubre de 2020 .
- ^ Wodak SJ, Mietchen D, Collings AM, Russell RB, Bourne PE (2012). "Páginas temáticas: PLOS Computational Biology se encuentra con Wikipedia" . PLOS Biología Computacional . 8 (3): e1002446. Código bibliográfico : 2012PLSCB ... 8E2446W . doi : 10.1371 / journal.pcbi.1002446 . PMC 3315447 . PMID 22479174 .
- ^ Página RD (marzo de 2011). "Vincular NCBI a Wikipedia: un enfoque basado en wiki" . PLOS Corrientes . 3 : RRN1228. doi : 10.1371 / corrientes.RRN1228 . PMC 3080707 . PMID 21516242 .
- ^ Gardner PP, Daub J, Tate J, Moore BL, Osuch IH, Griffiths-Jones S, et al. (Enero de 2011). "Rfam: Wikipedia, clanes y la liberación" decimal " . Investigación de ácidos nucleicos . 39 (Problema de la base de datos): D141-5. doi : 10.1093 / nar / gkq1129 . PMC 3013711 . PMID 21062808 .
- ^ Daub J, Gardner PP, Tate J, Ramsköld D, Manske M , Scott WG, et al. (Diciembre de 2008). "El WikiProject de ARN: anotación de la comunidad de familias de ARN" . ARN . 14 (12): 2462–4. doi : 10.1261 / rna.1200508 . PMC 2590952 . PMID 18945806 .
- ^ Burkhardt K, Schneider B, Ory J (octubre de 2006). "Una perspectiva de biocurador: anotación en el laboratorio de investigación para el banco de datos de proteínas de bioinformática estructural" . PLOS Biología Computacional . 2 (10): e99. Código Bibliográfico : 2006PLSCB ... 2 ... 99B . doi : 10.1371 / journal.pcbi.0020099 . PMC 1626146 . PMID 17069453 .
- ^ Logan DW, Sandal M, Gardner PP, Manske M , Bateman A (septiembre de 2010). "Diez reglas simples para editar Wikipedia" . PLOS Biología Computacional . 6 (9): e1000941. Código Bibliográfico : 2010PLSCB ... 6E0941L . doi : 10.1371 / journal.pcbi.1000941 . PMC 2947980 . PMID 20941386 .
- ^ Mayordomo D (2008). "Publicar en Wikipedia o perecer: Revista para exigir a los autores que publiquen en la enciclopedia en línea gratuita". Naturaleza . doi : 10.1038 / news.2008.1312 .
- ^ Huss JW, Lindenbaum P, Martone M, Roberts D, Pizarro A, Valafar F, et al. (Enero de 2010). "The Gene Wiki: inteligencia comunitaria aplicada a la anotación de genes humanos" . Investigación de ácidos nucleicos . 38 (Problema de la base de datos): D633-9. doi : 10.1093 / nar / gkp760 . PMC 2808918 . PMID 19755503 .
- ^ Alcock, Brian P .; Raphenya, Amogelang R .; Lau, Tammy TY; Tsang, Kara K .; Bouchard, Mégane; Edalatmand, Arman; Huynh, William; Nguyen, Anna-Lisa V .; Cheng, Annie A .; Liu, Sihan; Min, Sally Y. (1 de enero de 2020). "CARD 2020: vigilancia del resistoma de antibióticos con la base de datos completa de resistencia a los antibióticos" . Investigación de ácidos nucleicos . 48 (D1): D517 – D525. doi : 10.1093 / NAR / GKZ935 . PMC 7145624 . PMID 31665441 .
- ^ Waagmeester A, Stupp G, Burgstaller-Muehlbacher S, Good BM, Griffith M, Griffith OL, et al. (Marzo de 2020). Rodgers P, Mungall C (eds.). "Wikidata como gráfico de conocimiento para las ciencias de la vida" . eLife . 9 : e52614. doi : 10.7554 / eLife.52614 . PMC 7077981 . PMID 32180547 . S2CID 212739087 .
- ^ Rutz, Adriano; Sorokina, Maria; Galgonek, Jakub; Mietchen, Daniel; Willighagen, Egon; Graham, James; Stephan, Ralf; Page, Roderic; Vondrášek, Jiří (1 de marzo de 2021). "Investigación abierta de productos naturales: curación y difusión de ocurrencias biológicas de estructuras químicas a través de Wikidata" . dx.doi.org . doi : 10.1101 / 2021.02.28.433265 . Consultado el 14 de abril de 2021 .
- ^ Turki, Houcemeddine; Taieb, Mohamed Ali Hadj; Shafee, Thomas; Lubiana, Tiago; Jemielniak, Dariusz; Aouicha, Mohamed Ben; Gayo, José Emilio Labra; Youngstrom, Eric; Banat, Mossab; Das, Diptanshu; Mietchen, Daniel (18 de febrero de 2021). Haller, Armin (ed.). "Representar la información de COVID-19 en grafos de conocimiento colaborativos: el caso de Wikidata" . Cite journal requiere
|journal=
( ayuda ) - ^ Waagmeester, Andra; Willighagen, Egon L .; Su, Andrew I .; Kutmon, Martina; Gayo, José Emilio Labra; Fernández-Álvarez, Daniel; Novio, Quentin; Schaap, Peter J .; Verhagen, Lisa M .; Koehorst, Jasper J. (22 de enero de 2021). "Un protocolo para agregar conocimiento a Wikidata: alineando recursos sobre coronavirus humanos" . Biología BMC . 19 (1): 12. doi : 10.1186 / s12915-020-00940-y . ISSN 1741-7007 . PMC 7820539 . PMID 33482803 .
- ^ Burgstaller-Muehlbacher S, Waagmeester A, Mitraka E, Turner J, Putman T, Leong J, et al. (2016). "Wikidata como marco semántico para la iniciativa Gene Wiki" . Base de datos . 2016 : baw015. doi : 10.1093 / base de datos / baw015 . PMC 4795929 . PMID 26989148 .
- ^ Willighagen, Egon; Martens, Marvin; Yasunori; Lubiana, Tiago; Nunogit; Mietchen, Daniel; Addshore (2020-08-09), egonw / SARS-CoV-2-Queries: Edition 1 , doi : 10.5281 / zenodo.3977414 , recuperado 2021-04-14
- ^ Alexander Pfundner; Tobias Schönberg; John Horn; Richard D Boyce; Matthias Samwald (5 de mayo de 2015). "Utilización del sistema Wikidata para mejorar la calidad del contenido médico en Wikipedia en diversos idiomas: un estudio piloto" . Revista de investigación médica en Internet . 17 (5): e110. doi : 10.2196 / JMIR.4163 . ISSN 1438-8871 . PMC 4468594 . PMID 25944105 . Wikidata Q21503276 .
- ^ Tsueng G, Nanis SM, Fouquier J, Good BM, Su AI (31/12/2016). "Ciencia ciudadana para la minería de la literatura biomédica" . Ciencia ciudadana . 1 (2): 14. doi : 10.5334 / cstp.56 . PMC 6226017 . PMID 30416754 .
- ^ Tsueng G, Nanis M, Fouquier JT, Mayers M, Good BM, Su AI (febrero de 2020). "Aplicación de la ciencia ciudadana a la extracción de relaciones entre genes, fármacos y enfermedades a partir de resúmenes biomédicos" . Bioinformática . 36 (4): 1226-1233. doi : 10.1093 / bioinformatics / btz678 . PMC 8104067 . PMID 31504205 .
- ^ "Juega Mark2Cure, ayuda a identificar términos clave en resúmenes de investigación biomédica" . Juegos de ciencia ciudadana . Consultado el 6 de septiembre de 2020 .
- ^ "Multitud Cochrane" . multitud.cochrane.org . Consultado el 25 de septiembre de 2020 .
- ^ Gartlehner G, Affengruber L, Titscher V, Noel-Storr A, Dooley G, Ballarini N, König F (mayo de 2020). "La selección de resúmenes de un solo revisor perdió el 13 por ciento de los estudios relevantes: un ensayo controlado aleatorio basado en la multitud" . Revista de epidemiología clínica . 121 : 20-28. doi : 10.1016 / j.jclinepi.2020.01.005 . PMID 31972274 .
- ^ Griffith, Malaquías; Espías, Nicholas C; Krysiak, Kilannin; McMichael, Joshua F; Coffman, Adam C; Danos, Arpad M; Ainscough, Benjamin J; Ramírez, Cody A; Rieke, Damian T; Kujan, Lynzey; Barnell, Erica K (31 de enero de 2017). "CIViC es una base de conocimientos de la comunidad para la interpretación clínica de variantes en el cáncer de crowdsourcing de expertos" . Genética de la naturaleza . 49 (2): 170-174. doi : 10.1038 / ng.3774 . ISSN 1061-4036 . PMC 5367263 . PMID 28138153 .
- ^ "CIViC - interpretación clínica de variantes en cáncer" . civicdb.org . Consultado el 14 de abril de 2021 .
- ^ Hatos, Andras; Quaglia, Federica; Piovesan, Damiano; Tosatto, Silvio (3 de febrero de 2021). "APICURON: una base de datos para acreditar y reconocer el trabajo de los biocuradores" . doi : 10.1101 / 2021.02.03.429425 . PMID 33882120 . Cite journal requiere
|journal=
( ayuda ) - ^ Percha, Betania; Altman, Russ B. (1 de agosto de 2018). "Una red global de relaciones biomédicas derivadas del texto" . Bioinformática . 34 (15): 2614–2624. doi : 10.1093 / bioinformatics / bty114 . ISSN 1367-4803 . PMC 6061699 . PMID 29490008 .
- ^ Hirschman L, Burns GA, Krallinger M, Arighi C, Cohen KB, Valencia A, et al. (2012). "Minería de texto para el flujo de trabajo de biocuración" . Base de datos . 2012 : bas020. doi : 10.1093 / base de datos / bas020 . PMC 3328793 . PMID 22513129 .
- ^ Ananiadou, Sophia; Kell, Douglas B .; Tsujii, Jun-ichi (diciembre de 2006). "Text mining y sus posibles aplicaciones en biología de sistemas" . Tendencias en biotecnología . 24 (12): 571–579. doi : 10.1016 / j.tibtech.2006.10.002 . ISSN 0167-7799 . PMID 17045684 .
- ^ Winnenburg, R .; Wachter, T .; Plake, C .; Doms, A .; Schroeder, M. (11 de julio de 2008). "Hechos a partir del texto: ¿puede la minería de texto ayudar a ampliar la curación manual de alta calidad de productos genéticos con ontologías?" . Sesiones informativas en bioinformática . 9 (6): 466–478. doi : 10.1093 / bib / bbn043 . ISSN 1467-5463 . PMID 19060303 .
- ^ Percha, Betania; Altman, Russ (27 de febrero de 2018). "Una red global de relaciones biomédicas derivadas del texto" . Bioinformática . 34 (15): 2614–2624. doi : 10.1093 / BIOINFORMÁTICA / BTY114 .
- ^ Robert Leaman; Chih-Hsuan Wei; Alexis Allot; Zhiyong (1 de junio de 2020). "Diez consejos para un artículo listo para la minería de texto: cómo mejorar la capacidad de descubrimiento e interpretación automatizadas". PLOS Biología . 18 (6): e3000716. doi : 10.1371 / JOURNAL.PBIO.3000716 . ISSN 1544-9173 . PMID 32479517 . Wikidata Q96032351 .
- ^ Wang, Lucy Lu; Lo, Kyle (7 de diciembre de 2020). "Enfoques de minería de texto para tratar con la literatura en rápida expansión sobre COVID-19" . Sesiones informativas en bioinformática . 22 (2): 781–799. doi : 10.1093 / BIB / BBAA296 .
- ^ Neumann M, King D, Beltagy I, Ammar W (2019). "ScispaCy: modelos rápidos y robustos para el procesamiento biomédico del lenguaje natural" . Actas del 18º Taller y Tarea Compartida de BioNLP . Florencia, Italia: Asociación de Lingüística Computacional: 319–327. arXiv : 1902.07669 . doi : 10.18653 / v1 / W19-5034 . S2CID 67788603 .
- ^ Altman RB, Bergman CM, Blake J, Blaschke C, Cohen A, Gannon F, et al. (2008). "Minería de textos para la biología - el camino a seguir: opiniones de los principales científicos" . Biología del genoma . 9 Suppl 2 (Suppl 2): S7. doi : 10.1186 / gb-2008-9-s2-s7 . PMC 2559991 . PMID 18834498 .
- ^ Hanspers, Kristina; Riutta, Anders; Summer-Kutmon, Martina; Pico, Alexander R. (9 de noviembre de 2020). "Información de la vía extraída de 25 años de cifras de la vía" . Biología del genoma . 21 (1): 273. doi : 10.1186 / S13059-020-02181-2 . PMC 7649569 . PMID 33168034 .
- ^ Kuhn, Tobías; Royer, Loïc; Fuchs, Norbert E .; Schröder, Michael (1 de enero de 2006). "Mejora de la minería de textos con lenguaje natural controlado: un estudio de caso de interacciones entre proteínas" . Apuntes de conferencias en informática . 4075 : 66–81. doi : 10.1007 / 11799511_7 . ISBN 978-3-540-36593-8.
- ^ Kuhn, Tobías; Royer, Loïc; Fuchs, Norbert E .; Schröder, Michael (1 de enero de 2006). "Mejora de la minería de textos con lenguaje natural controlado: un estudio de caso de interacciones entre proteínas" . Apuntes de conferencias en informática . 4075 : 66–81. doi : 10.1007 / 11799511_7 . ISBN 978-3-540-36593-8.
- ^ Singhal, Ayush; Leaman, Robert; Catlett, Natalie; Lemberger, Thomas; McEntyre, Johanna; Polson, Shawn; Xenarios, Ioannis; Arighi, Cecilia; Lu, Zhiyong (2016). "Necesidades urgentes de la minería de textos biomédicos en biocuración y más allá: oportunidades y desafíos" . Base de datos . 2016 : baw161. doi : 10.1093 / base de datos / baw161 . ISSN 1758-0463 . PMC 5199160 . PMID 28025348 .
- ^ Hirschman L, Yeh A, Blaschke C, Valencia A (2005). "Resumen de BioCreAtIvE: evaluación crítica de la extracción de información para la biología" . BMC Bioinformática . 6 Suppl 1 (Suppl 1): S1. doi : 10.1186 / 1471-2105-6-s1-s1 . PMC 1869002 . PMID 15960821 . S2CID 5119495 .
enlaces externos
- Sociedad Internacional de Biocuración
- Biocreativo