Un GeneRIF o Gene Reference Into Function es una declaración corta (255 caracteres o menos) sobre la función de un gen. Los GeneRIF proporcionan un mecanismo simple que permite a los científicos agregar a la anotación funcional de genes descritos en la base de datos de Entrez Gene . En la práctica, la funciónestá construido de manera bastante amplia. Por ejemplo, hay GeneRIF que discuten el papel de un gen en una enfermedad, GeneRIF que apunta al espectador hacia un artículo de revisión sobre el gen y GeneRIF que discute la estructura de un gen. Sin embargo, la intención declarada es que los GeneRIF se relacionen con la función genética. Actualmente, se han creado más de medio millón de geneRIF para genes de casi 1000 especies diferentes. [1]
Los GeneRIF siempre están asociados con entradas específicas en la base de datos de Entrez Gene. Cada GeneRIF tiene un puntero al PubMed ID (un tipo de identificador de documento) de una publicación científica que proporciona evidencia de la declaración hecha por GeneRIF. Los GeneRIF a menudo se extraen directamente del documento identificado por PubMed ID, con mucha frecuencia de su título o de su oración final.
Los GeneRIF generalmente son producidos por indexadores del NCBI , pero cualquiera puede enviar un GeneRIF. Para ser procesado, debe existir una ID de gen válida para el gen específico, o el personal de Gene debe haber asignado una ID de gen general a la especie . El último caso se implementa a través de registros en Gene con el símbolo NEWENTRY. Una vez que se identifica el ID del gen, solo se requieren tres tipos de información para completar un envío :
- una frase concisa que describa una función o funciones (menos de 255 caracteres de longitud, preferiblemente más que una repetición del título del artículo);
- un artículo publicado que describe esa función, implementado proporcionando el ID de PubMed de una cita en PubMed;
- una dirección de correo electrónico válida (que seguirá siendo confidencial).
Ejemplo
Aquí hay algunos GeneRIF tomados de Entrez Gene para GeneID 7157, el gen humano TP53 . Los identificadores de documentos de PubMed se han omitido de los ejemplos. Tenga en cuenta la amplia variabilidad con respecto a la presencia o ausencia de puntuación y de las letras mayúsculas iniciales de las oraciones.
- p53 y c-erbB-2 pueden tener un papel independiente en la carcinogénesis del cáncer de vesícula biliar
- La degradación de HIPK2 endógena depende de la presencia de una proteína p53 funcional.
- Los alelos del codón 72 de p53 influyen en la respuesta a los medicamentos contra el cáncer en las células de las personas mayores mediante la regulación del inhibidor del ciclo celular p21WAF1
- El análisis de regresión logística mostró p53 y COX-2 como predictores dependientes en la carcinogénesis pancreática y una relación recíproca con la progresión neoplásica entre p53 y COX-2.
Los GeneRIF son un tipo inusual de género textual y recientemente han sido objeto de varios artículos de la comunidad de procesamiento del lenguaje natural.
enlaces externos
- Página web del NCBI que describe GeneRIF
- Mitchell JA, Aronson AR, Mork JG, Folk LC, Humphrey SM, Ward JM (2003). "Indexación de genes: caracterización y análisis de GeneRIFs de NLM" . AMIA Annu Symp Proc : 460–4. PMC 1480312 . PMID 14728215 .
Referencias
- William Hersh, Ravi Teja Bhupatiraju (2003). Descripción general de TREC Genomics Track (PDF) . Archivado desde el original (PDF) el 12 de mayo de 2005.Documento que describe una "tarea compartida" de la Conferencia de Recuperación de Texto que involucra la predicción automática de GeneRIF.
- Lu, Zhiyong; K. Bretonnel Cohen; Lawrence Hunter (2006). Encontrar GeneRIF a través de anotaciones de Ontología genética (PDF) . Proc. Simposio del Pacífico sobre biocomputación 2006. págs. 52–63. Archivado desde el original (PDF) el 13 de febrero de 2006. El artículo de Lu et al. Que describe un sistema que sugiere automáticamente GeneRIF.