La variación del número de copias ( CNV ) es un fenómeno en el que se repiten secciones del genoma y el número de repeticiones en el genoma varía entre individuos. [1] La variación del número de copias es un tipo de variación estructural : específicamente, es un tipo de evento de duplicación o eliminación que afecta a un número considerable de pares de bases. [2] Aproximadamente dos tercios de todo el genoma humano puede estar compuesto por repeticiones [3] y entre el 4,8 y el 9,5% del genoma humano puede clasificarse como variaciones en el número de copias. [4] En mamíferos, las variaciones en el número de copias juegan un papel importante en la generación de la variación necesaria en la población, así como en el fenotipo de la enfermedad. [1]
Las variaciones del número de copias se pueden clasificar generalmente en dos grupos principales: repeticiones cortas y repeticiones largas. Sin embargo, no hay límites claros entre los dos grupos y la clasificación depende de la naturaleza de los loci de interés. Las repeticiones cortas incluyen principalmente repeticiones de dinucleótidos (dos nucleótidos repetidos, por ejemplo, ACACAC ...) y repeticiones de trinucleótidos. Las repeticiones largas incluyen repeticiones de genes completos. Esta clasificación basada en el tamaño de la repetición es el tipo de clasificación más obvio, ya que el tamaño es un factor importante para examinar los tipos de mecanismos que probablemente dieron lugar a las repeticiones, [5] de ahí los efectos probables de estas repeticiones en el fenotipo.
Uno de los ejemplos más conocidos de una variación corta del número de copias es la repetición de trinucleótidos de los pares de bases CAG en el gen de la huntingtina responsable del trastorno neurológico enfermedad de Huntington . [6] Para este caso particular, una vez que el trinucleótido CAG se repite más de 36 veces en una expansión de repetición de trinucleótidos , la enfermedad de Huntington probablemente se desarrollará en el individuo y probablemente será heredada por su descendencia. [6] El número de repeticiones del trinucleótido CAG se correlaciona con la edad de aparición de la enfermedad de Huntington. [7] A menudo se cree que estos tipos de repeticiones cortas se deben a errores en la polimerasaactividad durante la replicación, incluido el deslizamiento de la polimerasa, el cambio de plantilla y el cambio de bifurcación, que se analizarán en detalle más adelante. El tamaño de repetición corto de estas variaciones del número de copias se presta a errores en la polimerasa, ya que estas regiones repetidas son propensas al reconocimiento erróneo por parte de la polimerasa y las regiones replicadas pueden replicarse nuevamente, lo que conduce a copias adicionales de la repetición. [8] Además, si estas repeticiones de trinucleótidos están en el mismo marco de lectura en la porción codificante de un gen, puede conducir a una cadena larga del mismo aminoácido , posiblemente creando agregados de proteínas en la célula, [7]y si estas repeticiones cortas caen en la porción no codificante del gen, pueden afectar la expresión y regulación del gen . Por otro lado, un número variable de repeticiones de genes completos se identifica con menos frecuencia en el genoma. Un ejemplo de repetición de un gen completo es el gen de la alfa-amilasa 1 (AMY1) que codifica la alfa-amilasa, que tiene una variación significativa en el número de copias entre diferentes poblaciones con diferentes dietas. [9] Aunque el mecanismo específico que permite que el gen AMY1 aumente o disminuya su número de copias sigue siendo un tema de debate, algunas hipótesis sugieren que la unión de extremos no homólogos o la unión de extremos mediada por microhomología es probablemente responsable de todo este gen. repite.[9] Las repeticiones de genes completos tienen efectos inmediatos sobre la expresión de ese gen en particular, y el hecho de que la variación del número de copias del gen AMY1 se haya relacionado con la dieta es un ejemplo notable de la adaptación evolutiva humana reciente. [9] Aunque estos son los grupos generales en los que se agrupan las variaciones del número de copias, el número exacto de pares de bases que afectan las variaciones del número de copias depende de los loci específicos de interés. Actualmente, utilizando datos de todas las variaciones del número de copias informadas, el tamaño medio de la variante del número de copias es de alrededor de 118 kb, y la mediana es de alrededor de 18 kb. [10]