Información hipervinculada sobre proteínas


Information Hyperlinked over Proteins (o iHOP ) es un servicio de minería de texto en línea que proporciona una red guiada por genes para acceder a los resúmenes de PubMed . El servicio fue establecido por Robert Hoffmann y Alfonso Valencia en 2004. [1] [2]

El concepto subyacente a iHOP es que al usar genes y proteínas como hipervínculos entre oraciones y resúmenes, la información en PubMed se puede convertir en un recurso navegable. Navegar a través de oraciones interrelacionadas dentro de esta red en lugar del uso de búsquedas de palabras clave convencionales permite la adquisición de información paso a paso y de forma controlada. Además, esta red de literatura se puede superponer a los datos de interacción experimental para facilitar el análisis simultáneo de conocimientos nuevos y existentes. En septiembre de 2014, la red presentada en iHOP contiene 28,4 millones de frases y 110.000 genes de más de 2.700 organismos, incluidos los organismos modelo Homo sapiens , Mus musculus ,Drosophila melanogaster , Caenorhabditis elegans , Danio rerio , Arabidopsis thaliana , Saccharomyces cerevisiae y Escherichia coli .

El sistema iHOP ha demostrado que al navegar de un gen a otro, los conceptos médicos y biológicos distantes pueden estar conectados por sólo un pequeño número de genes; Se ha demostrado que el camino más corto entre dos genes implica una media de cuatro genes intermediarios. [1]

La arquitectura del sistema iHOP consta de dos partes independientes: la 'fábrica iHOP' y la aplicación web. La fábrica iHOP administra los datos de origen de PubMed (datos de texto y genéticos) y los organiza dentro de una base de datos relacional PostgreSQL . La fábrica iHOP también produce la salida XML relevante para que la muestre la aplicación web. [2]


logotipo de iHOP