Genoma humano


El genoma humano es un conjunto completo de secuencias de ácido nucleico para humanos , codificado como ADN dentro de los 23 pares de cromosomas en los núcleos celulares y en una pequeña molécula de ADN que se encuentra dentro de las mitocondrias individuales . Éstos se tratan generalmente por separado como el genoma nuclear y el genoma mitocondrial . [2] Los genomas humanos incluyen secuencias de ADN que codifican proteínas y varios tipos de ADN que no codifican proteínas . Esta última es una categoría diversa que incluye ADN que codifica para ARN no traducido, como el del ARN ribosómico ,ARN de transferencia , ribozimas , ARN nuclear pequeño y varios tipos de ARN reguladores . También incluye promotores y sus elementos reguladores de genes asociados , ADN que desempeña funciones estructurales y de replicación, como regiones de andamiaje , telómeros , centrómeros y orígenes de replicación , además de un gran número de elementos transponibles , ADN viral insertado , pseudogenes no funcionales y simples , secuencias altamente repetitivas . Los intrones constituyen un gran porcentaje del ADN no codificante.. Parte de este ADN no codificante es ADN basura no funcional , como los pseudogenes, pero no existe un consenso firme sobre la cantidad total de ADN basura.

Los genomas humanos haploides , que están contenidos en las células germinales (el óvulo y el espermatozoide creados en la fase de meiosis de la reproducción sexual antes de la fertilización ) consisten en 3.054.815.472 pares de bases de ADN (si se usa el cromosoma X), [3] mientras que los genomas diploides femeninos ( que se encuentran en las células somáticas ) tienen el doble de contenido de ADN.

Si bien existen diferencias significativas entre los genomas de los individuos humanos (del orden del 0,1 % debido a las variantes de un solo nucleótido [4] y del 0,6 % al considerar los indeles ), [5] estas son considerablemente menores que las diferencias entre los humanos y sus seres más cercanos. parientes vivos, los bonobos y los chimpancés (~1,1 % de variantes fijas de un solo nucleótido [6] y 4 % cuando se incluyen indeles). [7] El tamaño en pares de bases también puede variar; la longitud de los telómeros disminuye después de cada ronda de replicación del ADN .

Aunque la secuencia del genoma humano se determinó por completo mediante la secuenciación del ADN en 2022 (incluida la metilación ), [3] aún no se comprende por completo. La mayoría de los genes , pero no todos, han sido identificados mediante una combinación de enfoques bioinformáticos y experimentales de alto rendimiento ; sin embargo, aún queda mucho trabajo por hacer para dilucidar aún más las funciones biológicas de sus productos de proteínas y ARN (en particular, la anotación del CHM13v2 completo). La secuencia .0 todavía está en curso [8] ). Y, sin embargo, los genes superpuestos son bastante comunes, lo que en algunos casos permite que dos genes que codifican proteínas de cada hebra reutilicen los pares de bases dos veces (por ejemplo, los genes DCDC2 y KAAG1).[9] Resultados recientes sugieren que la mayoría de las grandes cantidades de ADN no codificante dentro del genoma tienen actividades bioquímicas asociadas, incluida la regulación de la expresión génica , la organización de la arquitectura cromosómica y las señales que controlan la herencia epigenética . [ cita requerida ] También hay un número significativo de retrovirus en el ADN humano , al menos 3 de los cuales han demostrado poseer una función importante (es decir,HERV-K, HERV-W y HERV-FRD similares al VIH juegan un papel en la formación de la placenta al inducir la fusión célula-célula).

En 2003, los científicos informaron de la secuenciación del 85 % del genoma humano completo, pero a partir de 2020 aún faltaba al menos el 8 %. [10]

En 2021, los científicos informaron sobre la secuenciación del genoma femenino completo (es decir, sin el cromosoma Y). Esta secuencia identificó 19.969 secuencias codificantes de proteínas , que representan aproximadamente el 1,5% del genoma, y ​​63.494 genes en total, la mayoría de ellos genes de ARN no codificantes . El genoma consta de secuencias de ADN reguladoras , LINE , SINE , intrones y secuencias para las que aún no se ha determinado su función . El cromosoma Y humano , que consta de 62 460 029 pares de bases de una línea celular diferente y se encuentra en todos los hombres, se secuenció por completo [11] en enero de 2022. [3] [12]


Número de genes (naranja) y pares de bases (verde, en millones) en cada cromosoma
Genes humanos categorizados por función de las proteínas transcritas, dados tanto como número de genes codificadores como porcentaje de todos los genes [54]
Distribución de TSC SNP a lo largo del brazo largo del cromosoma 22 (de https://web.archive.org/web/20130903043223/http://snp.cshl.org/ ). Cada columna representa un intervalo de 1 Mb; la posición citogenética aproximada se da en el eje x. Se pueden ver claros picos y valles de densidad de SNP, posiblemente reflejando diferentes tasas de mutación, recombinación y selección.
Las poblaciones con un alto nivel de parentesco parental dan como resultado un mayor número de knockouts de genes homocigóticos en comparación con las poblaciones exogámicas. [125]
Un árbol genealógico que muestra un apareamiento de primos hermanos (los dos portadores llevan apareamiento de genes knockout heterocigotos marcados por una línea doble) que conduce a una descendencia que posee un gen homocigoto knockout