Anotación de ADN


La anotación de ADN o anotación del genoma es el proceso de identificar las ubicaciones de los genes y todas las regiones codificantes de un genoma y determinar qué hacen esos genes. Una anotación (independientemente del contexto) es una nota añadida a modo de explicación o comentario. Una vez que se secuencia un genoma, es necesario anotarlo para que tenga sentido. [1] Los genes en el genoma eucariota se pueden anotar usando FINDER. [2]

Para la anotación de ADN, una representación de secuencia de material genético previamente desconocida se enriquece con información que relaciona la posición genómica con los límites intrón - exón , secuencias reguladoras , repeticiones , nombres de genes y productos proteicos . Esta anotación se almacena en bases de datos genómicas como Mouse Genome Informatics , FlyBase y WormBase . Los materiales educativos sobre algunos aspectos de la anotación biológica del campo de anotación de Gene Ontology 2006 y eventos similares están disponibles en el sitio web de Gene Ontology. [3]

El Centro Nacional de Ontología Biomédica (www.bioontology.org) desarrolla herramientas para la anotación automatizada [4] de registros de bases de datos basándose en las descripciones textuales de esos registros.

Como método general, dcGO [5] tiene un procedimiento automatizado para inferir estadísticamente asociaciones entre términos de ontología y dominios de proteínas o combinaciones de dominios de las anotaciones existentes a nivel de gen / proteína.

Las herramientas de anotación automática intentan realizar estos pasos a través del análisis informático, en contraposición a la anotación manual (también conocida como curación) que implica la experiencia humana. Idealmente, estos enfoques coexisten y se complementan entre sí en la misma canalización de anotaciones .

Un método simple de anotación de genes se basa en herramientas de búsqueda basadas en homología, como BLAST , para buscar genes homólogos en bases de datos específicas, la información resultante se usa luego para anotar genes y genomas. [7] Sin embargo, a medida que se agrega información a la plataforma de anotación, los anotadores manuales se vuelven capaces de deconvoluntar las discrepancias entre genes que reciben la misma anotación. Algunas bases de datos utilizan información del contexto del genoma, puntuaciones de similitud, datos experimentales e integraciones de otros recursos para proporcionar anotaciones del genoma a través de su enfoque de subsistemas. Otras bases de datos (por ejemplo, Ensembl ) se basan en fuentes de datos seleccionadas, así como en una variedad de herramientas de software diferentes en su canal de anotación automatizada del genoma. [8]