De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

El Centro Nacional de Información Biotecnológica ( NCBI ) [1] [2] es parte de la Biblioteca Nacional de Medicina de los Estados Unidos (NLM), una rama de los Institutos Nacionales de Salud (NIH). Está aprobado y financiado por el gobierno de los Estados Unidos . El NCBI está ubicado en Bethesda, Maryland y fue fundado en 1988 a través de una legislación patrocinada por el Senador Claude Pepper .

El NCBI alberga una serie de bases de datos relevantes para la biotecnología y la biomedicina y es un recurso importante para herramientas y servicios bioinformáticos. Las principales bases de datos incluyen GenBank para secuencias de ADN y PubMed , una base de datos bibliográfica para literatura biomédica. Otras bases de datos incluyen la base de datos NCBI Epigenomics . Todas estas bases de datos están disponibles en línea a través del motor de búsqueda Entrez . El NCBI fue dirigido por David Lipman , [2] uno de los autores originales del programa de alineación de secuencias BLAST [3] y una figura muy respetada en bioinformática.. También dirigió un programa de investigación intramuros, que incluía grupos dirigidos por Stephen Altschul (otro coautor de BLAST ), David Landsman, Eugene Koonin , John Wilbur, Teresa Przytycka y Zhiyong Lu. David Lipman se retiró de su cargo en mayo de 2017 [4].

GenBank [ editar ]

El NCBI tenía la responsabilidad de poner a disposición la base de datos de secuencias de ADN GenBank desde 1992. [5] GenBank coordina con laboratorios individuales y otras bases de datos de secuencias como las del Laboratorio Europeo de Biología Molecular (EMBL) y el Banco de Datos de ADN de Japón (DDBJ). [5]

Desde 1992, NCBI ha crecido para proporcionar otras bases de datos además de GenBank. NCBI proporciona genes , herencia mendeliana en línea en el hombre , la base de datos de modelado molecular (estructuras de proteínas 3D), dbSNP (una base de datos de polimorfismos de un solo nucleótido ), la colección de secuencias de referencia, un mapa del genoma humano y un navegador de taxonomía , y coordenadas. con el Instituto Nacional del Cáncer para proporcionar el Proyecto de Anatomía del Genoma del Cáncer. El NCBI asigna un identificador único (número de identificación de taxonomía) a cada especie de organismo. [6]

El NCBI tiene herramientas de software que están disponibles a través de navegadores de Internet o por FTP. Por ejemplo, BLAST es un programa de búsqueda de similitudes de secuencia. BLAST puede realizar comparaciones de secuencias con la base de datos de ADN de GenBank en menos de 15 segundos.

Estantería NCBI [ editar ]

NCBI Bookshelf [7] es una colección de versiones en línea, de libre acceso y descargables, de libros biomédicos seleccionados. La biblioteca cubre una amplia gama de temas que incluyen biología molecular , bioquímica , biología celular , genética , microbiología , estados patológicos desde un punto de vista molecular y celular, métodos de investigación y virología . Algunos de los libros son versiones en línea de libros publicados anteriormente, mientras que otros, como Coffee Break , están escritos y editados por personal de NCBI. Bookshelf es un complemento del repositorio Entrez PubMed de publicaciones revisadas por pares.Los resúmenes en los que los contenidos de Bookshelf brindan perspectivas establecidas sobre áreas de estudio en evolución y un contexto en el que se pueden organizar muchas piezas individuales dispares de investigación informada. [ cita requerida ]

Herramienta básica de búsqueda de alineación local (BLAST) [ editar ]

BLAST es un algoritmo utilizado para calcular la similitud de secuencia entre secuencias biológicas como secuencias de nucleótidos de ADN y secuencias de aminoácidos de proteínas. [8]BLAST es una herramienta poderosa para encontrar secuencias similares a la secuencia de consulta dentro del mismo organismo o en diferentes organismos. Busca la secuencia de consulta en las bases de datos y servidores de NCBI y envía los resultados al navegador de la persona en el formato elegido. Las secuencias de entrada al BLAST están principalmente en formato FASTA o Genbank, mientras que la salida se puede entregar en una variedad de formatos como HTML, formato XML y texto sin formato. HTML es el formato de salida predeterminado para la página web de NCBI. Los resultados de NCBI-BLAST se presentan en formato gráfico con todos los aciertos encontrados, una tabla con identificadores de secuencia para los aciertos que tienen datos relacionados con la puntuación, junto con las alineaciones para la secuencia de interés y los aciertos recibidos con puntuaciones BLAST análogas para estos [9 ]

Entrez [ editar ]

El sistema de búsqueda cruzada de bases de datos de Entrez Global Query se utiliza en NCBI para todas las bases de datos principales, como secuencias de nucleótidos y proteínas, estructuras de proteínas, PubMed, taxonomía, genomas completos, OMIM y muchas otras. [10] Entrez es un sistema de indexación y recuperación que tiene datos de varias fuentes para la investigación biomédica. NCBI distribuyó la primera versión de Entrez en 1991, compuesta por secuencias de nucleótidos de PDB y GenBank., secuencias de proteínas de SWISS-PROT, GenBank, PIR, PRF, PDB traducidos y resúmenes y citas asociados de PubMed. Entrez está especialmente diseñado para integrar los datos de varias fuentes, bases de datos y formatos diferentes en un modelo de información uniforme y un sistema de recuperación que puede recuperar de manera eficiente las referencias, secuencias y estructuras relevantes. [11]

Gene [ editar ]

El gen se ha implementado en NCBI para caracterizar y organizar la información sobre genes. Sirve como un nodo principal en el nexo del mapa genómico, expresión, secuencia, función de la proteína, estructura y datos de homología. Se asigna un GeneID único a cada registro genético que se puede seguir a través de ciclos de revisión. Los registros de genes para genes conocidos o predichos se establecen aquí y están demarcados por posiciones de mapa o secuencias de nucleótidos. Gene tiene varias ventajas sobre su predecesor, LocusLink, que incluyen una mejor integración con otras bases de datos en NCBI, un alcance taxonómico más amplio y opciones mejoradas de consulta y recuperación proporcionadas por el sistema Entrez. [12]

Proteína [ editar ]

La base de datos de proteínas mantiene el registro de texto para las secuencias de proteínas individuales, derivadas de muchos recursos diferentes, como el proyecto de secuencia de referencia NCBI (RefSeq), GenBank, PDB y UniProtKB / SWISS-Prot. Los registros de proteínas están presentes en diferentes formatos, incluidos FASTA y XML, y están vinculados a otros recursos del NCBI. La proteína proporciona los datos relevantes para los usuarios, como genes, secuencias de ADN / ARN, vías biológicas, datos de expresión y variación, y literatura. También proporciona los conjuntos predeterminados de proteínas similares e idénticas para cada secuencia calculada por BLAST. La base de datos de estructuras de NCBI contiene conjuntos de coordenadas 3D para estructuras determinadas experimentalmente en PDB que son importadas por NCBI. La base de datos del dominio conservado ( CDD) de proteína contiene perfiles de secuencia que caracterizan dominios altamente conservados dentro de secuencias de proteínas. También tiene registros de recursos externos como SMART y Pfam . Existe otra base de datos en una proteína conocida como base de datos Protein Clusters que contiene conjuntos de secuencias de proteínas que se agrupan de acuerdo con las alineaciones máximas entre las secuencias individuales calculadas por BLAST. [13]

Base de datos Pubchem [ editar ]

La base de datos PubChem de NCBI es un recurso público para moléculas y sus actividades contra ensayos biológicos. PubChem se puede buscar y se puede acceder a él mediante el sistema de recuperación de información de Entrez . [14]

Ver también [ editar ]

  • Banco de datos de ADN de Japón (DDBJ)
  • Instituto Europeo de Bioinformática (EBI)

Referencias [ editar ]

  1. ^ "El proyecto del genoma humano" . The New York Times .
  2. ^ a b "Instituto de investigación publica datos genéticos en Internet" . The New York Times . 26 de junio de 1997.
  3. ^ "Sentido de secuencias: Stephen F. Altschul en Bettering BLAST" . 2000. Archivado desde el original el 7 de octubre de 2007.
  4. ^ "Biblioteca Nacional de Medicina anuncia la salida del director del NCBI, Dr. David Lipman" . www.nlm.nih.gov . Consultado el 6 de mayo de 2017 .
  5. ↑ a b Mizrachi, Ilene (22 de agosto de 2007). GenBank: la base de datos de secuencias de nucleótidos . Centro Nacional de Información Biotecnológica (EE. UU.): A través de www.ncbi.nlm.nih.gov.
  6. ^ "Inicio - Taxonomía - NCBI" . www.ncbi.nlm.nih.gov .
  7. Estados Unidos (6 de mayo de 2019). "Inicio - Libros - NCBI" . Ncbi.nlm.nih.gov . Consultado el 12 de junio de 2019 .
  8. ^ Altschul Stephen; Gish Warren; Miller Webb; Myers Eugene; Lipman David (1990). "Herramienta básica de búsqueda de alineación local". Revista de Biología Molecular . 215 (3): 403–410. doi : 10.1016 / s0022-2836 (05) 80360-2 . PMID 2231712 . 
  9. ^ Madden T. (2002). The NCBI Handbook, 2nd edition, Chapter 16, The BLAST Sequence Analysis Tool
  10. ^ Coordinadores de recursos de NCBI (2012). "Base de datos de recursos del Centro Nacional de Información Biotecnológica". Investigación de ácidos nucleicos 41 (edición de la base de datos): D8 – D20.
  11. ^ Ostell J. (2002). The NCBI Handbook, 2nd edition, Chapter 15, The Entrez Search and Retrieval System (El sistema de búsqueda y recuperación de Entrez)
  12. ^ Maglott D. Pruitt K. y Tatusova T. (2005). The NCBI Handbook, 2nd edition, Chapter 19, Gene: A Directory of Genes
  13. ^ Sayers E. (2013). The NCBI Handbook, 2da edición, NCBI Protein Resources
  14. ^ Wang Y. y Bryant S H. (2014). The NCBI Handbook, 2nd edition, NCBI PubChem BioAssay Database

Enlaces externos [ editar ]

  • Página web oficial
  • Biblioteca Nacional de Medicina
  • Institutos Nacionales de Salud