La base de datos de secuencias de referencia ( RefSeq ) [1] es una colección de acceso abierto , anotada y seleccionada de secuencias de nucleótidos (ADN, ARN) disponibles públicamente y sus productos proteicos . Esta base de datos está construida por el Centro Nacional de Información Biotecnológica (NCBI) y, a diferencia de GenBank , proporciona solo un registro para cada molécula biológica natural (es decir, ADN, ARN o proteína) para los principales organismos que van desde virus hasta bacterias y eucariotas.
Contenido | |
---|---|
Descripción | base de datos de secuencia no redundante curada de genomas. |
Contacto | |
Centro de Investigación | Centro Nacional de Información Biotecnológica |
Cita primaria | Pruitt KD & al. (2005) [1] |
Acceso | |
Sitio web | https://www.ncbi.nlm.nih.gov/RefSeq |
Para cada organismo modelo , RefSeq tiene como objetivo proporcionar registros separados y vinculados para el ADN genómico, las transcripciones de genes y las proteínas que surgen de esas transcripciones. RefSeq se limita a los organismos principales para los que se dispone de datos suficientes (más de 66.000 organismos "nombrados" distintos a septiembre de 2011), [2] mientras que GenBank incluye secuencias para cualquier organismo enviado (aproximadamente 250.000 organismos con nombres diferentes).
Categorías de RefSeq
Categoría | Descripción |
---|---|
CAROLINA DEL NORTE | Moléculas genómicas completas |
NG | Región genómica incompleta |
Nuevo Méjico | ARNm |
NR | ncRNA |
notario público | Proteína |
XM | modelo de ARNm previsto |
XR | modelo predicho de ncRNA |
XP | modelo de proteína predicha (secuencias eucariotas) |
WP | modelo de proteína predicha (secuencias procariotas) |
Para obtener más detalles y más categorías, consulte la Tabla 1 en el Capítulo 18 del libro La base de datos de la secuencia de referencia (RefSeq) .
Ver también
Referencias
- ↑ a b Pruitt KD , Tatusova T, Maglott DR (2005). "Secuencia de referencia NCBI (RefSeq): una base de datos de secuencia no redundante curada de genomas, transcripciones y proteínas" . Ácidos nucleicos Res . 33 (Problema de la base de datos): D501-4. doi : 10.1093 / nar / gki025 . PMC 539979 . PMID 15608248 .
- ^ Estadísticas de la versión 80 de RefSeq (informe). Biblioteca Nacional de Medicina . 2017 . Consultado el 13 de enero de 2017 .
Fuentes
- Este artículo incorpora material de dominio público del documento del Centro Nacional de Información Biotecnológica : "Manual del NCBI" .
enlaces externos
- RefSeq
- GenBank, RefSeq, TPA y UniProt: ¿Qué hay en un nombre?