Genómica comparativa


La genómica comparativa es un campo de la investigación biológica en el que se comparan las características genómicas de diferentes organismos . [2] [3] Las características genómicas pueden incluir la secuencia de ADN , los genes , el orden de los genes , las secuencias reguladoras y otros hitos estructurales genómicos. [3] En esta rama de la genómica , la totalidad o gran parte de los genomas resultantes de los proyectos genómicos se comparan para estudiar las similitudes y diferencias biológicas básicas, así como las relaciones evolutivas entre organismos. [2][4] [5] El principio principal de la genómica comparativa es que las características comunes de dos organismos a menudo se codificarán dentro del ADN que se conserva evolutivamenteentre ellos. [6] Por lo tanto, los enfoques genómicos comparativos comienzan con algún tipo de alineación de las secuencias del genoma y buscan secuencias ortólogas (secuencias que comparten un ancestro común ) en los genomas alineados y verifican en qué medida se conservan esas secuencias. En base a esto, se infiere la evolución genómica y molecular y esto, a su vez, se puede poner en el contexto de, por ejemplo,evolución fenotípica ogenética de poblaciones . [7]

Prácticamente comenzó tan pronto como estuvieron disponibles los genomas completos de dos organismos (es decir, los genomas de las bacterias Haemophilus influenzae y Mycoplasma genitalium ) en 1995, la genómica comparativa es ahora un componente estándar del análisis de cada nueva secuencia genómica. [2] [8] Con la explosión en la cantidad de proyectos de genoma debido a los avances en las tecnologías de secuenciación de ADN , particularmente los métodos de secuenciación de próxima generación a fines de la década de 2000, este campo se ha vuelto más sofisticado, lo que hace posible tratar con muchos genomas. en un solo estudio. [9]La genómica comparativa ha revelado altos niveles de similitud entre organismos estrechamente relacionados, como los humanos y los chimpancés , y, lo que es más sorprendente, similitud entre organismos aparentemente relacionados de manera lejana, como los humanos y la levadura Saccharomyces cerevisiae . [4] También ha mostrado la extrema diversidad de la composición de genes en diferentes linajes evolutivos. [8]

La genómica comparativa tiene su origen en la comparación de genomas de virus a principios de la década de 1980. [8] Por ejemplo, se compararon pequeños virus de ARN que infectan animales ( picornavirus ) y aquellos que infectan plantas ( virus del mosaico del caupí ) y resultó que comparten una similitud de secuencia significativa y, en parte, el orden de sus genes. [10] En 1986, se publicó el primer estudio genómico comparativo a mayor escala, comparando los genomas del virus varicela-zoster y el virus Epstein-Barr que contenían más de 100 genes cada uno. [11]

La primera secuencia completa del genoma de un organismo celular, la de Haemophilus influenzae Rd, se publicó en 1995. [12] El segundo artículo de secuenciación del genoma fue el de la pequeña bacteria parasitaria Mycoplasma genitalium publicado en el mismo año. [13] A partir de este artículo, los informes sobre nuevos genomas inevitablemente se convirtieron en estudios de genómica comparativa. [8]

Genomas microbianos. El primer sistema de comparación de genoma completo de alta resolución de genomas microbianos de 10-15 kbp fue desarrollado en 1998 por Art Delcher, Simon Kasif y Steven Salzberg y aplicado a la comparación de organismos microbianos completos altamente relacionados con sus colaboradores en el Instituto de Investigación Genómica (Institute for Genomic Research). TIGR). El sistema se llama MUMMERy se describió en una publicación en Nucleic Acids Research en 1999. El sistema ayuda a los investigadores a identificar grandes reordenamientos, mutaciones de una sola base, reversiones, expansiones repetidas en tándem y otros polimorfismos. En bacterias, MUMMER permite la identificación de polimorfismos que son responsables de la virulencia, la patogenicidad y la resistencia a los antibióticos. El sistema también se aplicó al Minimal Organism Project en TIGR y posteriormente a muchos otros proyectos de genómica comparativa.


La alineación del genoma completo es un método típico en genómica comparativa. Esta alineación de ocho genomas de bacterias Yersinia revela 78 bloques localmente colineales conservados entre los ocho taxones . Cada cromosoma se ha dispuesto horizontalmente y los bloques homólogos en cada genoma se muestran como regiones del mismo color unidas entre genomas. Las regiones que están invertidas en relación con Y. pestis KIM se desplazan por debajo del eje central del genoma. [1]
El gen FOXP2 humano y la conservación evolutiva se muestran en una alineación múltiple (en la parte inferior de la figura) en esta imagen del UCSC Genome Browser . Tenga en cuenta que la conservación tiende a agruparse en torno a las regiones de codificación (exones).
Árbol filogenético de especies descendientes y ancestros reconstruidos. El color de la rama representa las tasas de punto de corte en RACF (puntos de corte por millón de años). Las ramas negras representan tasas de punto de quiebre no determinadas. Los colores de las puntas representan la contigüidad del ensamblaje: negro, ensamblaje del genoma a nivel de andamio; verde, ensamblaje del genoma a nivel de cromosoma; amarillo, ensamblaje del genoma a nivel de andamio a escala cromosómica. Los números junto a los nombres de las especies indican el número de cromosomas diploides (si se conocen). [25]
Ejemplo de un árbol filogenético creado a partir de una alineación de 250 secuencias únicas de proteínas de punta de la familia Betacoronavirus.
Ejemplo de bloqueo y ruptura synteny. Los genes ubicados en los cromosomas de dos especies se indican con letras. Cada gen está asociado con un número que representa la especie a la que pertenece (especie 1 o 2). Los genes ortólogos están conectados por líneas discontinuas y los genes sin una relación ortóloga se tratan como lagunas en los programas de sintenia. [29]
Imagen del estudio Evolución del cariotipo ancestral de mamíferos y regiones sinténicas. Es una visualización de la historia evolutiva de los cromosomas de mamíferos reconstruidos basados ​​en el linaje humano. [31]
Se comparan los loci TCR de humanos (H, arriba) y ratones (M, abajo), con elementos TCR en rojo, genes que no son TCR en púrpura y segmentos V en naranja, otros elementos TCR en rojo. M6A, una metiltransferasa putativa ; ZNF, una proteína con dedos de zinc ; OR, genes de receptores olfativos ; DAD1, defensor contra la muerte celular ; Los sitios de pseudogenes procesados ​​específicos de especie se muestran mediante triángulos grises. Consulte también los números de acceso de GenBank AE000658-62. Modificado después de Glusman et al. 2001. [44]
[Figura 2] Estructura génica de los segmentos génicos V, D, J y C humanos (arriba) y de ratón (abajo). Las flechas representan la dirección transcripcional de cada gen TCR. Los cuadrados y círculos representan ir en dirección directa e inversa. Modificado después de Glusman et al. 2001. [44]