HomoloGene , una herramienta del Centro Nacional de Información Biotecnológica de los Estados Unidos (NCBI), es un sistema para la detección automatizada de homólogos (similitud atribuible a la descendencia de un ancestro común) entre los genes anotados de varios genomas eucariotas completamente secuenciados. [1]
El procesamiento de HomoloGene consiste en el análisis de proteínas de los organismos de entrada. Las secuencias se comparan usando blastp, luego se emparejan y se colocan en grupos, usando un árbol taxonómico construido a partir de la similitud de secuencia, donde los organismos relacionados más cercanos se emparejan primero y luego se agregan más organismos al árbol. Las alineaciones de proteínas se mapean de nuevo a sus correspondientes secuencias de ADN, y luego se pueden calcular las métricas de distancia como distancias moleculares Jukes y Cantor (1969) , la relación Ka / Ks .
Las secuencias se emparejan mediante el uso de un algoritmo heurístico para maximizar la puntuación globalmente, en lugar de localmente, en una coincidencia bipartita (consulte el gráfico bipartito completo ). Y luego calcula la significancia estadística de cada partido. Los cortes se hacen por posición y los valores de Ks se establecen para evitar que se agrupen "ortólogos" falsos . Los "parálogos" se identifican al encontrar secuencias que están más cercanas dentro de las especies que otras especies.
Organismos de entrada
Metazoos
Vertebrados
Homo sapiens , Pan troglodytes , Mus musculus , Rattus norvegicus , Canis lupus familiaris , Bos taurus , Gallus gallus , Xenopus tropicalis , Danio rerio "
Invertebrados
" Drosophila melanogaster , Anopheles gambiae , Caenorhabditis elegans "
Hongos
" Saccharomyces cerevisiae , Schizosaccharomyces pombe , Kluyveromyces lactis , Eremothecium gossypii , Magnaporthe grisea , Neurospora crassa "
Plantas
Dicotiledóneas
Monocotiledóneas
" Oryza sativa "
Protista
Interfaz
El HomoloGene está vinculado a todas las bases de datos de Entrez y se basa en la información de homología y fenotipo de estos vínculos:
- Informática del genoma del ratón (MGI),
- Red de información del pez cebra (ZFIN),
- Base de datos del genoma de Saccharomyces (SGD),
- Clústeres de grupos ortólogos (COG),
- FlyBase ,
- Herencia mendeliana en línea en el hombre (OMIM)
Como resultado, HomoloGene muestra información sobre genes, proteínas, fenotipos y dominios conservados.
Referencias
- ^ "Inicio - HomoloGene - NCBI" . www.ncbi.nlm.nih.gov . Centro Nacional de Información Biotecnológica . Consultado el 16 de octubre de 2020 .
enlaces externos
- HomoloGene en el Centro Nacional de Información Biotecnológica
- Cosechador bioinformático [ enlace muerto permanente ] - Cosechador bioinformático , un meta motor de búsqueda que utiliza Homologene
- OMIM
- ZFIN
- SGD
- DIENTE
- FlyBase
- MGI
- Base de datos del genoma de ratas