Variación del número de copias


La variación del número de copias ( CNV ) es un fenómeno en el que se repiten secciones del genoma y el número de repeticiones en el genoma varía entre individuos. [1] La variación del número de copias es un tipo de variación estructural : específicamente, es un tipo de evento de duplicación o eliminación que afecta a un número considerable de pares de bases. [2] Aproximadamente dos tercios de todo el genoma humano puede estar compuesto por repeticiones [3] y entre el 4,8 y el 9,5% del genoma humano puede clasificarse como variaciones en el número de copias. [4] En mamíferos, las variaciones en el número de copias juegan un papel importante en la generación de la variación necesaria en la población, así como en el fenotipo de la enfermedad. [1]

Las variaciones del número de copias se pueden clasificar generalmente en dos grupos principales: repeticiones cortas y repeticiones largas. Sin embargo, no hay límites claros entre los dos grupos y la clasificación depende de la naturaleza de los loci de interés. Las repeticiones cortas incluyen principalmente repeticiones de dinucleótidos (dos nucleótidos repetidos, por ejemplo, ACACAC ...) y repeticiones de trinucleótidos. Las repeticiones largas incluyen repeticiones de genes completos. Esta clasificación basada en el tamaño de la repetición es el tipo de clasificación más obvio, ya que el tamaño es un factor importante para examinar los tipos de mecanismos que probablemente dieron lugar a las repeticiones, [5] de ahí los efectos probables de estas repeticiones en el fenotipo.

Uno de los ejemplos más conocidos de una variación corta del número de copias es la repetición de trinucleótidos de los pares de bases CAG en el gen de la huntingtina responsable del trastorno neurológico enfermedad de Huntington . [6] Para este caso particular, una vez que el trinucleótido CAG se repite más de 36 veces en una expansión de repetición de trinucleótidos , la enfermedad de Huntington probablemente se desarrollará en el individuo y probablemente será heredada por su descendencia. [6] El número de repeticiones del trinucleótido CAG se correlaciona con la edad de aparición de la enfermedad de Huntington. [7] A menudo se cree que estos tipos de repeticiones cortas se deben a errores en la polimerasaactividad durante la replicación, incluido el deslizamiento de la polimerasa, el cambio de plantilla y el cambio de bifurcación, que se analizarán en detalle más adelante. El tamaño de repetición corto de estas variaciones del número de copias se presta a errores en la polimerasa, ya que estas regiones repetidas son propensas al reconocimiento erróneo por parte de la polimerasa y las regiones replicadas pueden replicarse nuevamente, lo que conduce a copias adicionales de la repetición. [8] Además, si estas repeticiones de trinucleótidos están en el mismo marco de lectura en la porción codificante de un gen, puede conducir a una cadena larga del mismo aminoácido , posiblemente creando agregados de proteínas en la célula, [7]y si estas repeticiones cortas caen en la porción no codificante del gen, pueden afectar la expresión y regulación del gen . Por otro lado, un número variable de repeticiones de genes completos se identifica con menos frecuencia en el genoma. Un ejemplo de repetición de un gen completo es el gen de la alfa-amilasa 1 (AMY1) que codifica la alfa-amilasa, que tiene una variación significativa en el número de copias entre diferentes poblaciones con diferentes dietas. [9] Aunque el mecanismo específico que permite que el gen AMY1 aumente o disminuya su número de copias sigue siendo un tema de debate, algunas hipótesis sugieren que la unión de extremos no homólogos o la unión de extremos mediada por microhomología es probablemente responsable de todo este gen. repite.[9] Las repeticiones de genes completos tienen efectos inmediatos sobre la expresión de ese gen en particular, y el hecho de que la variación del número de copias del gen AMY1 se haya relacionado con la dieta es un ejemplo notable de la adaptación evolutiva humana reciente. [9] Aunque estos son los grupos generales en los que se agrupan las variaciones del número de copias, el número exacto de pares de bases que afectan las variaciones del número de copias depende de los loci específicos de interés. Actualmente, utilizando datos de todas las variaciones del número de copias informadas, el tamaño medio de la variante del número de copias es de alrededor de 118 kb, y la mediana es de alrededor de 18 kb. [10]


Esta duplicación de genes ha creado una variación en el número de copias. El cromosoma ahora tiene dos copias de esta sección de ADN, en lugar de una.
Representación esquemática de recombinación homóloga no alélica. Aquí, el Gene X representa el gen de interés y la línea negra representa el cromosoma. Cuando los dos cromosomas homólogos están desalineados y ocurre la recombinación, puede resultar en una duplicación del gen.
Cronología del cambio en la dieta de los homínidos a lo largo de los períodos Paleolítico tardío, Mesolítico y Neolítico. Como se ve, los tubérculos ricos en almidón se consumieron hace unos 20.000 años cuando se estimó que aumentaría el número del gen diploide AMY1.
Árbol filogenético simplificado del linaje de los grandes simios y el número de gen AMY1 diploide que tiene cada especie. Se ha demostrado que el número del gen AMY1 aumenta después de la división con el linaje de los chimpancés.
Posible mecanismo de cómo múltiples copias de un gen pueden conducir a una familia de proteínas durante años con selección natural. Aquí, el gen X es el gen de interés que está duplicado y el gen X1 y el gen X2 son genes que adquirieron mutaciones y se volvieron funcionalmente diferentes al gen X.